Computer Use Preview:让AI学会使用计算机的预览工具

你是否曾经希望AI助手能够像人类一样操作计算机,自动完成网页浏览、表单填写等任务?Google的Computer Use Preview项目正是为此而生。它是一个基于Python开发的AI浏览器自动化工具,通过Gemini模型让AI能够理解和执行自然语言指令来控制浏览器。本文将带你全面了解这个潜力新星。

截至收录:
Computer Use Preview项目stars数:477
Computer Use Preview项目forks数:64

Computer Use Preview项目目录截图

Computer Use Preview项目核心亮点

🤖 智能浏览器控制:通过Gemini大语言模型理解自然语言指令,实现智能化的浏览器操作。
🌐 多环境支持:支持本地Playwright和云端Browserbase两种浏览器环境,满足不同部署需求。
🔧 开箱即用:提供完整的安装脚本和配置指南,快速搭建AI浏览器自动化环境。
📝 灵活配置:支持Gemini Developer API和Vertex AI两种后端服务,适应不同用户需求。

Computer Use Preview项目快速开始

只需几步,你就能让AI助手帮你操作浏览器:

  1. 安装环境
    git clone https://github.com/google/computer-use-preview.git
    cd computer-use-preview
    python3 -m venv .venv
    source .venv/bin/activate
    pip install -r requirements.txt
    playwright install-deps chrome
    playwright install chrome
  2. 配置API密钥
    export GEMINI_API_KEY="YOUR_GEMINI_API_KEY"
  3. 运行第一个AI浏览器任务
    python main.py --query "Go to Google and type  Hello World  into the search bar" --env="playwright"

Computer Use Preview项目应用场景

场景一:自动化网页操作:开发者可以使用自然语言指令让AI自动完成网页浏览、表单填写、数据抓取等重复性任务。
场景二:网站测试自动化:QA工程师可以编写自然语言测试用例,让AI自动执行功能测试和回归测试。
场景三:业务流程自动化:企业可以使用AI助手自动完成日常的网页操作流程,提高工作效率。
用户案例:作为Google的预览项目,它展示了AI操作计算机的最新能力,为未来的AI助手应用奠定了基础。

Computer Use Preview项目链接

google / computer-use-preview项目地址:https://github.com/google/computer-use-preview

本文地址:https://www.tgoos.com/17282

声明:本站资源均整理自互联网,版权归原作者所有,仅供学习交流使用,请勿直接商用,若需商用请购买正版授权。因违规使用产生的版权及法律责任由使用者自负。部分资源可能包含水印或引流信息,请自行甄别。若链接失效可联系站长尝试补链。若侵犯您的权益,请邮件(将 # 替换为 @)至 feedback#tgoos.com,我们将及时处理删除。转载请保留原文链接,感谢支持原创。