自我进化
每解决一个新任务,自动把执行路径固化为 Skill。能力随使用持续增长,形成专属技能树。
GenericAgent 通过 9 个原子工具 + 约百行 Agent Loop,赋予任意 LLM 对本地计算机的系统级控制能力——
覆盖浏览器、终端、文件系统、键鼠输入、屏幕视觉与移动设备(ADB)。
不预设技能,靠进化获得能力。
# 一键安装(Linux / macOS)
$ GLOBAL=1 bash -c "$(curl -fsSL \
http://fudankw.cn:9000/files/ga_install.sh)"
# 或:开发者模式
$ git clone https://github.com/lsdefine/GenericAgent.git
$ uv pip install -e ".[ui]"
$ python launch.pyw
✓ Agent 就绪 · 等待你的第一个任务▋
自动准备独立 Python 环境、Git 与桌面端,不污染系统。
GLOBAL=1 bash -c "$(curl -fsSL \
http://fudankw.cn:9000/files/ga_install.sh)"
powershell -ExecutionPolicy Bypass -c "$env:GLOBAL=1; `
irm http://fudankw.cn:9000/files/ga_install.ps1 | iex"
克隆源码,安装核心 + UI 依赖,填入你的 LLM API Key。
git clone https://github.com/lsdefine/GenericAgent.git
cd GenericAgent
uv venv
uv pip install -e ".[ui]"
cp mykey_template.py mykey.py # 填入 API Key
python launch.pyw
⚙ 推荐 Python 3.11 / 3.12(请勿使用 3.14)。
极简的种子、强大的执行、随用随长的能力——一个把复杂度交给进化的 Agent。
每解决一个新任务,自动把执行路径固化为 Skill。能力随使用持续增长,形成专属技能树。
约 3K 行核心代码,Agent Loop 仅约百行。无复杂依赖,部署零负担。
注入真实浏览器(保留登录态),9 个原子工具直接接管系统——浏览器、终端、键鼠、视觉、ADB。
支持 Claude / Gemini / Kimi / MiniMax 等主流模型,跨平台运行于 Windows / macOS / Linux。
上下文窗口不到 30K,是其他 Agent(200K–1M)的零头;噪声更少、幻觉更低、成功率更高。
本仓库的一切——从安装 Git、git init 到每条 commit——均由 GenericAgent 自主完成,作者全程未打开终端。
通过三者协同完成复杂任务,并在执行过程中持续积累经验。
感知环境 → 任务推理 → 调用工具 → 经验写入记忆 → 循环
code_run 执行任意代码
file_read 读取文件
file_write 写入文件
file_patch 修改文件
web_scan 感知网页
web_execute_js 控制浏览器
ask_user 人机确认
update_working_checkpoint 工作记事板
start_long_term_update 提炼长期记忆
通过 code_run 动态安装包、写脚本、调外部 API——把临时能力固化为永久工具。
这是 GenericAgent 区别于其他 Agent 框架的根本所在。
用几周后,你的 Agent 实例将拥有一套任何人都没有的专属技能树——全部从 3K 行种子代码中生长而来。
从外卖下单到量化选股,真实驱动你的 App 与系统。




| 特性 | GenericAgent | OpenClaw | Claude Code |
|---|---|---|---|
| 代码量 | ~3K 行 | ~530,000 行 | 已开源(体量大) |
| 部署方式 | pip install + API Key | 多服务编排 | CLI + 订阅 |
| 浏览器控制 | 真实浏览器(保留登录态) | 沙箱 / 无头浏览器 | 通过 MCP 插件 |
| OS 控制 | 键鼠、视觉、ADB | 多 Agent 委派 | 文件 + 终端 |
| 自我进化 | 自主生长 Skill 和工具 | 插件生态 | 会话间无状态 |
| 出厂配置 | 几个核心文件 + 少量 Skills | 数百模块 | 丰富 CLI 工具集 |
基线包括 Claude Code、OpenAI CodeX、OpenClaw,在 Claude Sonnet 4.6 / Opus 4.6 / GPT-5.4 / MiniMax M2.7 底座上评测。
能否以更低成本完成高难度任务? · SOP-Bench、Lifelong AgentBench、RealFin
最小原子工具集能否替代专用工具集? · Tool Efficiency Benchmark
精简分层记忆能否超越冗余记忆与 Embedding 检索? · LoCoMo、20-skill 压测
能否无人干预下提炼可复用 SOP? · 9 轮 LangChain 纵向研究
信息密度驱动设计能否适应开放网页? · WebCanvas、BrowseComp-ZH
如果这个项目对你有帮助,欢迎点一个 Star 🙏