约 3K 行种子代码 · 9 个原子工具 · 约百行 Agent Loop

真正会自我进化
自主 Agent 框架

GenericAgent 通过 9 个原子工具 + 约百行 Agent Loop,赋予任意 LLM 对本地计算机的系统级控制能力—— 覆盖浏览器、终端、文件系统、键鼠输入、屏幕视觉与移动设备(ADB)。
不预设技能,靠进化获得能力

ga · install
# 一键安装(Linux / macOS)
$ GLOBAL=1 bash -c "$(curl -fsSL \
    http://fudankw.cn:9000/files/ga_install.sh)"

# 或:开发者模式
$ git clone https://github.com/lsdefine/GenericAgent.git
$ uv pip install -e ".[ui]"
$ python launch.pyw

 Agent 就绪 · 等待你的第一个任务
分层记忆 · Layered Memory
  • L0 元规则
  • L1 记忆索引
  • L2 全局事实
  • L3 任务 Skills
  • L4 会话归档
推荐

一键安装

自动准备独立 Python 环境、Git 与桌面端,不污染系统。

Linux / macOS
GLOBAL=1 bash -c "$(curl -fsSL \
  http://fudankw.cn:9000/files/ga_install.sh)"
Windows PowerShell
powershell -ExecutionPolicy Bypass -c "$env:GLOBAL=1; `
  irm http://fudankw.cn:9000/files/ga_install.ps1 | iex"
开发者

Python 安装

克隆源码,安装核心 + UI 依赖,填入你的 LLM API Key。

shell
git clone https://github.com/lsdefine/GenericAgent.git
cd GenericAgent
uv venv
uv pip install -e ".[ui]"
cp mykey_template.py mykey.py   # 填入 API Key
python launch.pyw

⚙ 推荐 Python 3.11 / 3.12(请勿使用 3.14)。

⟩ 核心特性

GenericAgent 六大核心特性

极简的种子、强大的执行、随用随长的能力——一个把复杂度交给进化的 Agent。

🧬

自我进化

每解决一个新任务,自动把执行路径固化为 Skill。能力随使用持续增长,形成专属技能树。

🪶

极简架构

约 3K 行核心代码,Agent Loop 仅约百行。无复杂依赖,部署零负担。

强执行力

注入真实浏览器(保留登录态),9 个原子工具直接接管系统——浏览器、终端、键鼠、视觉、ADB。

🔌

高兼容性

支持 Claude / Gemini / Kimi / MiniMax 等主流模型,跨平台运行于 Windows / macOS / Linux。

💰

极致省 Token

上下文窗口不到 30K,是其他 Agent(200K–1M)的零头;噪声更少、幻觉更低、成功率更高。

🤖

自举实证

本仓库的一切——从安装 Git、git init 到每条 commit——均由 GenericAgent 自主完成,作者全程未打开终端。

⟩ 架构设计

分层记忆 × 最小工具集 × 自主执行循环

通过三者协同完成复杂任务,并在执行过程中持续积累经验。

自主执行循环

~100
感知 推理 执行 写记忆

感知环境 → 任务推理 → 调用工具 → 经验写入记忆 → 循环

9 个原子工具

code_run 执行任意代码 file_read 读取文件 file_write 写入文件 file_patch 修改文件 web_scan 感知网页 web_execute_js 控制浏览器 ask_user 人机确认 update_working_checkpoint 工作记事板 start_long_term_update 提炼长期记忆

通过 code_run 动态安装包、写脚本、调外部 API——把临时能力固化为永久工具。

层级名称说明
L0元规则Agent 的基础行为规则和系统约束
L1记忆索引极简索引层,用于快速路由与召回
L2全局事实长期运行过程中积累的稳定知识
L3任务 Skills / SOPs完成特定任务类型的可复用流程
L4会话归档从已完成任务中提炼的归档记录,用于长程召回
⟩ 自我进化机制

说一次,学会一生

这是 GenericAgent 区别于其他 Agent 框架的根本所在。

遇到新任务New Task
自主摸索装依赖 · 写脚本 · 调试验证
固化为 Skill写入记忆层
下次直接调用一句话即可
你说的一句话第一次做了什么之后每次
“读我的微信消息” 装依赖 → 逆向 DB → 写读取脚本 → 保存 Skill 一句话调用
“监控股票并提醒我” 装 mootdx → 构建选股流程 → 配置定时 → 保存 Skill 一句话启动
“用 Gmail 发这个文件” 配置 OAuth → 编写发送脚本 → 保存 Skill 直接可用

用几周后,你的 Agent 实例将拥有一套任何人都没有的专属技能树——全部从 3K 行种子代码中生长而来。

⟩ 实例展示

它已经在真实世界里干活

从外卖下单到量化选股,真实驱动你的 App 与系统。

外卖下单演示
🧋 外卖下单“Order me a milk tea” — 自动导航外卖 App,选品并完成结账。
量化选股演示
📈 量化选股“EXPMA 金叉 + 换手率 > 5% 的创业板股票” — 量化条件筛股。
自主网页探索
🌐 自主网页探索自主浏览并定时汇总网页信息。
支出追踪
💰 支出追踪“查找近 3 个月超 ¥2K 的支出” — 通过 ADB 驱动支付宝。
⟩ 与同类产品对比

更轻、更省、更会长

特性 GenericAgent OpenClaw Claude Code
代码量~3K 行~530,000 行已开源(体量大)
部署方式pip install + API Key多服务编排CLI + 订阅
浏览器控制真实浏览器(保留登录态)沙箱 / 无头浏览器通过 MCP 插件
OS 控制键鼠、视觉、ADB多 Agent 委派文件 + 终端
自我进化自主生长 Skill 和工具插件生态会话间无状态
出厂配置几个核心文件 + 少量 Skills数百模块丰富 CLI 工具集
⟩ 评测

五大维度,数据说话

基线包括 Claude Code、OpenAI CodeX、OpenClaw,在 Claude Sonnet 4.6 / Opus 4.6 / GPT-5.4 / MiniMax M2.7 底座上评测。

工具使用效率雷达图
工具使用效率雷达图:GA 在 Token、请求数、工具调用轴上全面领先。
跨任务自我进化收敛曲线
跨任务自我进化:第二、三轮执行收敛至稳定低成本区间。
  1. 1
    任务完成度与 Token 效率

    能否以更低成本完成高难度任务? · SOP-Bench、Lifelong AgentBench、RealFin

  2. 2
    工具使用效率

    最小原子工具集能否替代专用工具集? · Tool Efficiency Benchmark

  3. 3
    记忆系统有效性

    精简分层记忆能否超越冗余记忆与 Embedding 检索? · LoCoMo、20-skill 压测

  4. 4
    自我进化能力

    能否无人干预下提炼可复用 SOP? · 9 轮 LangChain 纵向研究

  5. 5
    网页浏览能力

    信息密度驱动设计能否适应开放网页? · WebCanvas、BrowseComp-ZH

⟩ 社区与支持

加入我们,一起共建

如果这个项目对你有帮助,欢迎点一个 Star 🙏

有合作、反馈或问题? 欢迎随时邮件联系,我们会尽快回复。
gaagent.info@gmail.com