Agentic 文檔工作流
香草天空
發(fā)布于 云南 2025-06-16 · 6763瀏覽 3贊

一、什么是 Agentic Document Workflows(ADW)?

 

傳統(tǒng)的基于 RAG(檢索增強(qiáng)生成)的問答方式雖然可以讓 LLMs 理解文檔,但遠(yuǎn)遠(yuǎn)無法滿足企業(yè)對(duì)自動(dòng)化處理文檔的需求。ADW 是一種參考架構(gòu),用于構(gòu)建可自動(dòng)執(zhí)行、結(jié)構(gòu)化且可審計(jì)的企業(yè)級(jí)智能文檔工作流。

ADW 主要應(yīng)對(duì)的是企業(yè)中常見的文檔格式(如 PDF、PPT、Excel 等),通過 LLM 的能力,突破了以往“僅供人類閱讀”的自動(dòng)化瓶頸,實(shí)現(xiàn)真正的 智能文檔處理流程。

二、ADW 的四個(gè)核心階段

每個(gè) ADW 系統(tǒng)由以下四個(gè)階段組成,彼此通過“類型化消息(如 Pydantic 模型)”銜接,確保流程清晰、錯(cuò)誤可控,并支持人工審核介入:

階段:Parse(解析)

主要職責(zé):將原始文檔轉(zhuǎn)為結(jié)構(gòu)化對(duì)象,比如文本塊、表格、圖片等。

常見技術(shù):LlamaParse、多模態(tài) OCR、自定義抽取器。

階段:Retrieve(檢索)

主要職責(zé):獲取與當(dāng)前任務(wù)相關(guān)的上下文內(nèi)容,并能追溯信息來源。

常見技術(shù):混合檢索(BM25 + 向量檢索)、元數(shù)據(jù)過濾、遞歸查詢。

階段:Reason(推理)

主要職責(zé):應(yīng)用策略規(guī)則,進(jìn)行多步驟邏輯處理,同時(shí)保持上下文狀態(tài)。

常見技術(shù):ReAct 方法、函數(shù)調(diào)用循環(huán)、聲明式工作流 DSL、保護(hù)機(jī)制(guardrails)。

階段:Act(執(zhí)行)

主要職責(zé):將推理結(jié)果提交到下游系統(tǒng),同時(shí)輸出審計(jì)日志以供追蹤。

常見技術(shù):Webhook 調(diào)用、SQL 數(shù)據(jù)庫(kù)寫入、ERP/CRM 接口集成、消息推送機(jī)器人。

每一步之間的“類型化數(shù)據(jù)傳遞”是 ADW 與傳統(tǒng) RAG/Agent 最大的不同,支持更嚴(yán)謹(jǐn)?shù)腻e(cuò)誤處理、重試機(jī)制與人工介入。

 

三、構(gòu)建 ADW 所需的四大基礎(chǔ)組件

  1. Parsing Engine(解析引擎):能識(shí)別復(fù)雜布局、表格、圖像等內(nèi)容,生成結(jié)構(gòu)化數(shù)據(jù)。

  2. Knowledge Layer(知識(shí)層):支持檢索和索引,讓代理(Agent)具備訪問企業(yè)數(shù)據(jù)的能力。

  3. Agent Orchestration(代理編排):融合確定性邏輯與 LLM 靈活推理的機(jī)制,確保流程受控。

  4. Action Connectors(動(dòng)作連接器):與 ERP、CRM、數(shù)據(jù)庫(kù)等企業(yè)系統(tǒng)集成,實(shí)現(xiàn)任務(wù)自動(dòng)落地。

在整個(gè)體系中,**Human-in-the-Loop(人工審查)**可在關(guān)鍵節(jié)點(diǎn)提供反饋、審核與干預(yù),提升流程可靠性。

 

四、典型應(yīng)用場(chǎng)景示例:合同風(fēng)險(xiǎn)分析

以實(shí)際客戶案例為例:自動(dòng)分析供應(yīng)商合同中的風(fēng)險(xiǎn)條款并推送到 CLM 系統(tǒng)。

階段:解析

行動(dòng):使用 LlamaParse 將 PDF 轉(zhuǎn)換為 Markdown 格式和包含段落信息的 JSON 列表。

輸出數(shù)據(jù):clauses[],包含條款 ID、頁(yè)碼和原文內(nèi)容。

可選人工介入:可以對(duì)每條條款進(jìn)行審查。

階段:檢索

行動(dòng):將每條條款與風(fēng)險(xiǎn)策略庫(kù)中的禁用或可議條款進(jìn)行匹配。

輸出數(shù)據(jù):matches[],對(duì)應(yīng)條款 ID 和匹配到的風(fēng)險(xiǎn)規(guī)則及其評(píng)分。

可選人工介入:對(duì)匹配結(jié)果進(jìn)行校驗(yàn)。

階段:推理

行動(dòng):對(duì)風(fēng)險(xiǎn)等級(jí)、問題條款和建議的替換語(yǔ)言進(jìn)行匯總。

輸出數(shù)據(jù):red_flag_report,以 JSON 結(jié)構(gòu)形式呈現(xiàn)。

可選人工介入:審核匯總報(bào)告。

階段:執(zhí)行

行動(dòng):通知合同生命周期管理(CLM)系統(tǒng),并通過 Slack 推送通知。

輸出數(shù)據(jù):tool_call,包含任務(wù) ID 和輸入信息。

可選人工介入:審核并簽署執(zhí)行任務(wù)。

香草天空
浮生若夢(mèng) 而陽(yáng)春召我以煙景
瀏覽 6763
3
相關(guān)推薦
最新評(píng)論
贊過的人 3
評(píng)論加載中...

暫無評(píng)論,快來評(píng)論吧!