约 3K 行种子代码 · 9 个原子工具 · 约百行 Agent Loop

真正会自我进化的
自主 Agent 框架

GenericAgent 通过 9 个原子工具 + 约百行 Agent Loop，赋予任意 LLM 对本地计算机的系统级控制能力—— 覆盖浏览器、终端、文件系统、键鼠输入、屏幕视觉与移动设备（ADB）。
不预设技能，靠进化获得能力。

快速开始查看源码

📄 arXiv 技术报告 📘 Datawhale 教程 🧩 Skill Hub

ga · install

# 一键安装（Linux / macOS）
$ GLOBAL=1 bash -c "$(curl -fsSL \
    http://fudankw.cn:9000/files/ga_install.sh)"

# 或：开发者模式
$ git clone https://github.com/lsdefine/GenericAgent.git
$ uv pip install -e ".[ui]"
$ python launch.pyw

✓ Agent 就绪 · 等待你的第一个任务▋

分层记忆 · Layered Memory

L0 元规则
L1 记忆索引
L2 全局事实
L3 任务 Skills
L4 会话归档

一键安装

自动准备独立 Python 环境、Git 与桌面端，不污染系统。

Linux / macOS

GLOBAL=1 bash -c "$(curl -fsSL \
  http://fudankw.cn:9000/files/ga_install.sh)"

Windows PowerShell

powershell -ExecutionPolicy Bypass -c "$env:GLOBAL=1; `
  irm http://fudankw.cn:9000/files/ga_install.ps1 | iex"

开发者

Python 安装

克隆源码，安装核心 + UI 依赖，填入你的 LLM API Key。

shell

git clone https://github.com/lsdefine/GenericAgent.git
cd GenericAgent
uv venv
uv pip install -e ".[ui]"
cp mykey_template.py mykey.py   # 填入 API Key
python launch.pyw

⚙ 推荐 Python 3.11 / 3.12（请勿使用 3.14）。

⟩ 核心特性

GenericAgent 六大核心特性

极简的种子、强大的执行、随用随长的能力——一个把复杂度交给进化的 Agent。

🧬

自我进化

每解决一个新任务，自动把执行路径固化为 Skill。能力随使用持续增长，形成专属技能树。

🪶

极简架构

约 3K 行核心代码，Agent Loop 仅约百行。无复杂依赖，部署零负担。

⚡

强执行力

注入真实浏览器（保留登录态），9 个原子工具直接接管系统——浏览器、终端、键鼠、视觉、ADB。

🔌

高兼容性

支持 Claude / Gemini / Kimi / MiniMax 等主流模型，跨平台运行于 Windows / macOS / Linux。

💰

极致省 Token

上下文窗口不到 30K，是其他 Agent（200K–1M）的零头；噪声更少、幻觉更低、成功率更高。

🤖

自举实证

本仓库的一切——从安装 Git、git init 到每条 commit——均由 GenericAgent 自主完成，作者全程未打开终端。

⟩ 架构设计

分层记忆 × 最小工具集 × 自主执行循环

通过三者协同完成复杂任务，并在执行过程中持续积累经验。

自主执行循环

~100行

感知推理执行写记忆

感知环境 → 任务推理 → 调用工具 → 经验写入记忆 → 循环

9 个原子工具

code_run 执行任意代码 file_read 读取文件 file_write 写入文件 file_patch 修改文件 web_scan 感知网页 web_execute_js 控制浏览器 ask_user 人机确认 update_working_checkpoint 工作记事板 start_long_term_update 提炼长期记忆

通过 code_run 动态安装包、写脚本、调外部 API——把临时能力固化为永久工具。

层级名称说明

L0元规则Agent 的基础行为规则和系统约束

L1记忆索引极简索引层，用于快速路由与召回

L2全局事实长期运行过程中积累的稳定知识

L3任务 Skills / SOPs完成特定任务类型的可复用流程

L4会话归档从已完成任务中提炼的归档记录，用于长程召回

⟩ 自我进化机制

说一次，学会一生

这是 GenericAgent 区别于其他 Agent 框架的根本所在。

①遇到新任务New Task

→

②自主摸索装依赖 · 写脚本 · 调试验证

→

③固化为 Skill写入记忆层

→

④下次直接调用一句话即可

你说的一句话第一次做了什么之后每次

“读我的微信消息” 装依赖 → 逆向 DB → 写读取脚本 → 保存 Skill 一句话调用

“监控股票并提醒我” 装 mootdx → 构建选股流程 → 配置定时 → 保存 Skill 一句话启动

“用 Gmail 发这个文件” 配置 OAuth → 编写发送脚本 → 保存 Skill 直接可用

用几周后，你的 Agent 实例将拥有一套任何人都没有的专属技能树——全部从 3K 行种子代码中生长而来。

⟩ 实例展示

它已经在真实世界里干活

从外卖下单到量化选股，真实驱动你的 App 与系统。

外卖下单演示 — **🧋 外卖下单**“Order me a milk tea” — 自动导航外卖 App，选品并完成结账。

量化选股演示 — **📈 量化选股**“EXPMA 金叉 + 换手率 > 5% 的创业板股票” — 量化条件筛股。

**💰 支出追踪**“查找近 3 个月超 ¥2K 的支出” — 通过 ADB 驱动支付宝。

⟩ 与同类产品对比

更轻、更省、更会长

特性	GenericAgent	OpenClaw	Claude Code
代码量	~3K 行	~530,000 行	已开源（体量大）
部署方式	pip install + API Key	多服务编排	CLI + 订阅
浏览器控制	真实浏览器（保留登录态）	沙箱 / 无头浏览器	通过 MCP 插件
OS 控制	键鼠、视觉、ADB	多 Agent 委派	文件 + 终端
自我进化	自主生长 Skill 和工具	插件生态	会话间无状态
出厂配置	几个核心文件 + 少量 Skills	数百模块	丰富 CLI 工具集