Agent-S:让AI像人类一样操作计算机的开源智能体框架

你是否曾经希望有一个AI助手能够帮你完成日常的计算机操作任务?Agent-S的出现,旨在彻底解决这个问题。它是一个基于Python开发的开源智能体框架,可以帮助开发者构建能够自主操作计算机界面的AI助手。本文将带你全面了解这个潜力新星。

截至收录:
Agent-S项目stars数:6543
Agent-S项目forks数:714

Agent-S项目目录截图

Agent-S项目核心亮点

🌟 人类级操作能力:Agent S3在OSWorld基准测试中达到69.9%的成功率,接近人类72%的表现水平,超越了Claude Sonnet 4.5等商业模型。
🎯 多平台支持:完美支持Linux、Mac和Windows三大操作系统,提供统一的开发体验。
🔒 安全可控:提供本地代码执行环境的安全警告机制,确保用户在使用过程中的数据安全。
🧩 灵活扩展:支持Azure OpenAI、Anthropic、Gemini、Open Router和vLLM等多种推理后端,满足不同场景需求。

Agent-S项目快速开始

只需几步,你就能在本地运行起Agent-S

  1. 安装
    pip install gui-agents
  2. 配置API密钥
    export OPENAI_API_KEY=<YOUR_API_KEY>
    export ANTHROPIC_API_KEY=<YOUR_ANTHROPIC_API_KEY>
    export HF_TOKEN=<YOUR_HF_TOKEN>
  3. 运行第一个任务
    agent_s \
    --provider openai \
    --model gpt-5-2025-08-07 \
    --ground_provider huggingface \
    --ground_url http://localhost:8080 \
    --ground_model ui-tars-1.5-7b \
    --grounding_width 1920 \
    --grounding_height 1080

Agent-S项目应用场景

场景一:自动化办公:Agent-S可以自动完成打开应用、编辑文档、发送邮件等日常办公任务,大幅提升工作效率。
场景二:系统管理:通过本地代码执行环境,Agent-S能够执行系统配置、文件管理和批量处理等系统管理任务。
场景三:软件开发辅助:在开发环境中,Agent-S可以帮助开发者完成代码编辑、项目构建和测试运行等重复性工作。
用户案例:该项目已在多个学术基准测试中取得领先成绩,包括OSWorld、WindowsAgentArena和AndroidWorld等平台。

Agent-S项目链接

simular-ai / Agent-S项目地址:https://github.com/simular-ai/Agent-S

本文地址:https://www.tgoos.com/15978

声明:本站资源均整理自互联网,版权归原作者所有,仅供学习交流使用,请勿直接商用,若需商用请购买正版授权。因违规使用产生的版权及法律责任由使用者自负。部分资源可能包含水印或引流信息,请自行甄别。若链接失效可联系站长尝试补链。若侵犯您的权益,请邮件(将 # 替换为 @)至 feedback#tgoos.com,我们将及时处理删除。转载请保留原文链接,感谢支持原创。