單 Agent 的核心步驟:
一、任務(wù)規(guī)劃 1. 輸入:query + tools 2. 模型:deepseek-r1 / claude-3.7-think / gpt-4o 3. 提示詞:理解用戶輸入,挑選合適工具,返回需要調(diào)用的工具+對應(yīng)參數(shù),輸出 DSL 4. 響應(yīng): [ { type: text: content: how-to-do} { type: tools, content:[ { name: tool1, arguments: {} }, { name: tool2, arguments: {} } ] } ]
二、Agent 執(zhí)行 1. 并行分發(fā)執(zhí)行任務(wù)到 tool1, tool2 對應(yīng)的 sub- agent 2. sub-agent 執(zhí)行 function,返回數(shù)據(jù)給調(diào)度者
三、結(jié)果驗證 1. 拿query + tools 執(zhí)行結(jié)果,驗證當前上下文信息是否足夠回答問題 2. 信息充足,直接回答 3. 信息不足,返回下一步應(yīng)該執(zhí)行的 tools 列表 4. 提示詞工程:上下文信息,tools 功能描述, tools 執(zhí)行結(jié)果、判斷依據(jù)、退出條件
sub-agent 的實現(xiàn)邏輯:
1. 簡單版:調(diào)用 function,返回結(jié)果 2. 完整版:規(guī)劃 -> 執(zhí)行(sub sub agent ) -> 驗證
原子功能 agent:
1. 聯(lián)網(wǎng)搜 2. 執(zhí)行命令 / 創(chuàng)建文件 / 寫入內(nèi)容 3. 生成代碼 4. browser use
由內(nèi)向外的套娃實現(xiàn):
1. 在聯(lián)網(wǎng)搜 agent 上面包一層,實現(xiàn) query rewrite,reranking 等功能,做成一個 ai search agent 2. 在生成代碼 agent 上面包一層,規(guī)劃項目路徑,生成項目文件,做成一個 ai coding agent
由外向內(nèi)的調(diào)度邏輯:
1. 外層 agent:規(guī)劃 -> 調(diào)度 -> 驗證 2. 內(nèi)層 agent:執(zhí)行 -> 重試 -> 返回結(jié)果
重點:
1. 依賴模型的理解能力,能否精準識別并分發(fā)任務(wù)到指定 agent 2. 業(yè)務(wù)抽象能力,越上層的 agent,業(yè)務(wù)功能越復(fù)雜,相當于一個垂直賽道的產(chǎn)品 3. 原子抽象能力,把業(yè)務(wù)無關(guān)的功能,抽成原子 agent,比如搜索,讀寫文件,瀏覽器操作(browser use)
幾種產(chǎn)品形態(tài):
1. 純云端通用 agent,以Manus 為代表,自定義很多原子 agent,上層業(yè)務(wù) agent 占大頭,執(zhí)行任務(wù)慢,token 消耗高 2. 純本地通用 agent,還未有代表產(chǎn)品,以海量的 mcp server 作為原子 agent,制作少量的上層業(yè)務(wù) agent,理論上執(zhí)行任務(wù)更高效,成本問題也更好解決 3. 云端垂類 agent,以 same 為代表,只需要在少量原子 agent 基礎(chǔ)上實現(xiàn)一個上層業(yè)務(wù) agent 即可,實現(xiàn)更簡單,效果更收斂
我個人看好以海量 MCP Server 為原子 agent 的超級 Agent 產(chǎn)品。MCP so 最近也在做 Server Hosting 方面的事情。
關(guān)于用套娃模式實現(xiàn)超級智能體的一些思考
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
chenxiaoyun
半自動人工智障點贊機
瀏覽 2569
贊 2
相關(guān)推薦





暫無評論,快來評論吧!