Agent-S:让AI像人类一样操作计算机的开源智能体框架
你是否曾经希望有一个AI助手能够帮你完成日常的计算机操作任务?Agent-S的出现,旨在彻底解决这个问题。它是一个基于Python开发的开源智能体框架,可以帮助开发者构建能够自主操作计算机界面的AI助手。本文将带你全面了解这个潜力新星。
截至收录:
Agent-S项目stars数:6543
Agent-S项目forks数:714
Agent-S项目目录截图
Agent-S项目核心亮点
🌟 人类级操作能力:Agent S3在OSWorld基准测试中达到69.9%的成功率,接近人类72%的表现水平,超越了Claude Sonnet 4.5等商业模型。
🎯 多平台支持:完美支持Linux、Mac和Windows三大操作系统,提供统一的开发体验。
🔒 安全可控:提供本地代码执行环境的安全警告机制,确保用户在使用过程中的数据安全。
🧩 灵活扩展:支持Azure OpenAI、Anthropic、Gemini、Open Router和vLLM等多种推理后端,满足不同场景需求。
Agent-S项目快速开始
只需几步,你就能在本地运行起Agent-S
:
- 安装:
pip install gui-agents
- 配置API密钥:
export OPENAI_API_KEY=<YOUR_API_KEY> export ANTHROPIC_API_KEY=<YOUR_ANTHROPIC_API_KEY> export HF_TOKEN=<YOUR_HF_TOKEN>
- 运行第一个任务:
agent_s \ --provider openai \ --model gpt-5-2025-08-07 \ --ground_provider huggingface \ --ground_url http://localhost:8080 \ --ground_model ui-tars-1.5-7b \ --grounding_width 1920 \ --grounding_height 1080
Agent-S项目应用场景
场景一:自动化办公:Agent-S可以自动完成打开应用、编辑文档、发送邮件等日常办公任务,大幅提升工作效率。
场景二:系统管理:通过本地代码执行环境,Agent-S能够执行系统配置、文件管理和批量处理等系统管理任务。
场景三:软件开发辅助:在开发环境中,Agent-S可以帮助开发者完成代码编辑、项目构建和测试运行等重复性工作。
用户案例:该项目已在多个学术基准测试中取得领先成绩,包括OSWorld、WindowsAgentArena和AndroidWorld等平台。
Agent-S项目链接
simular-ai / Agent-S项目地址:https://github.com/simular-ai/Agent-S
本文地址:https://www.tgoos.com/15978