AI Agent、Agentic AI、Agent架構和Agent工作流等概念如今備受關注,但它們究竟是什麼?它們能做什麼?新技術常常伴隨著混亂的術語和炒作。本文將深入解析代理型AI的關鍵概念——代理工作流(Agentic Workflows)。
AI Agent本身並無太多實際用途,只有透過賦予其角色、目標和結構,只有透過工作流,才能真正發揮作用。理解代理工作流(Agentic Workflow),有助於理解 AI Agent的運作方式和邏輯。
本文從AI Agent到Agent工作流,詳細解說代理工作流(Agentic Workflows):
什麼是AI Agent?
什麼是Agent工作流?
Agent工作流組成?
Agent工作流 vs Agent架構
Agent工作流模式
Agent工作流應用場景
Agent工作流優缺點
什麼是 AI Agent?
AI 代理是一種結合了大型語言模型(LLMs)的推理與決策能力,以及現實世界交互工具的系統,使其能夠在有限的人類干預下完成複雜任務。代理被賦予特定的角色,並擁有不同程度的自主性來實現最終目標。它們還具備記憶能力,能夠從過去的經驗中學習,並隨著時間的推移提升性能。
為了更好地理解AI代理在代理工作流中的作用,需要先瞭解它們的核心組成部分。
儘管 AI Agent被設計用於半自主決策,但它們仍然依賴於一套更大的元件框架才能正常運行。這些組件包括:
LLMs(大型語言模型):使代理具備推理能力
工具(Tools):説明代理完成任務
記憶(Memory):讓代理能夠從過去的經驗中學習,並隨著時間優化響應
推理(Reasoning)
AI 代理的強大之處在於其反覆運算推理能力,即在整個問題解決過程中持續「思考」。推理能力主要來自底層 LLM,並發揮兩個核心作用:規劃(Planning)和反思(Reflecting)。
規劃(Planning):代理會分解任務(Task Decomposition),將複雜的問題拆解為更小、更可執行的步驟。這樣可以讓代理系統地執行任務,並根據不同需求選擇不同的工具。此外,代理還能進行查詢分解(Query Decomposition),即將複雜查詢拆解成更簡單的子查詢,以提高 LLM 回應的準確性和可靠性。
反思(Reflecting):代理會回顧自身的行動結果,並基於結果與外部資料進行調整,以優化後續決策。
工具(Tools)
由於 LLM 僅限於其訓練時獲得的知識(靜態的參數化知識),為了擴展其能力,AI 代理可以借助外部工具,如以下幾種工具類型:
當 LLM 選擇合適的工具來完成任務時,它會執行函式呼叫(Function Calling),從而擴展自身能力,超越單純的文本生成,實現對現實世界的交互。
工具的選擇可以由用戶預先定義,也可以由代理動態決定。動態選擇工具有助於解決複雜任務,但對於簡單工作流,預定義工具可能更高效。
記憶(Memory)
AI 代理的記憶能力是代理工作流區別於純 LLM 工作流的重要特徵之一。記憶允許代理在多個使用者交互和會話中存儲上下文和回饋,從而實現更個性化的體驗,並優化長期表現。
AI 代理的記憶可分為兩種:
短期記憶(Short-term Memory):存儲最近的交互資訊,如對話歷史,説明代理決定下一步行動。
長期記憶(Long-term Memory):存儲長時間累積的資訊,跨會話學習,以實現個性化和持續優化。
什麼是Agentic Workflow?
工作流(Workflow)是一系列相互關聯的步驟,旨在完成特定任務或目標。確定性工作流遵循預定義的步驟序列,無法適應新資訊或環境變化。例如,自動化報銷審批工作流可能規定:若費用標籤為「餐飲」且金額低於 $30,則自動批准。
AI 工作流利用大型語言模型(LLMs)或其他機器學習模型增強能力,可分為兩類:
非代理型 AI 工作流:LLM 根據輸入指令生成輸出,僅依賴其文本處理能力,缺乏自主決策或任務執行能力。例如,文本摘要工作流的流程為:接收長文本 → LLM 總結 → 輸出摘要。
代理型 AI 工作流:由一個或多個 AI 代理動態執行步驟以完成任務。代理在授權範圍內具備自主性,能夠收集資料、執行操作並做出決策。憑藉推理能力、工具使用能力和持久記憶,代理型工作流更具適應性、回應性和自我進化能力。例如,代理可根據實時資料調整報銷審批標準,或在軟體開發中動態調試代碼。
代理型工作流通過整合 AI 代理的核心能力,顯著提升傳統工作流的靈活性和效率。
Agentic Workflow的核心組成
代理型工作流(Agentic Workflow)需具備以下三個核心特點,以實現任務的動態執行與優化:
制定計劃(Planning)
AI 代理通過任務分解(Task Decomposition),將複雜任務拆分為更小的子任務,並規劃最佳執行路徑。例如,處理客戶投訴時,代理可能分解為識別問題、查詢相關記錄和生成回應。使用工具執行任務(Tool Use)
代理利用預定義工具(如 API、資料庫、搜尋引擎)執行任務,配合許可權管理以確保安全高效。例如,代理可通過搜尋引擎獲取最新資訊,或調用郵件 API 發送通知。反思與反覆運算(Reflection and Iteration)
代理在每一步評估執行結果,根據需要調整計劃並反覆運算,直至達成目標。例如,調試軟體時,代理可根據錯誤日誌調整修復策略。
這三個特點相輔相成,使代理型工作流具備高度的適應性與自主性,適用於動態且複雜的任務場景。
三種Workflow類型
工作流可分為三種類型,各具不同特點與應用場景:
核心區別
AI 工作流 vs. 傳統工作流
傳統工作流:依賴預定義規則,執行固定步驟,適合簡單、重複性任務,如自動化報銷審批(若金額低於 $50 則批准)。
AI 工作流:利用 LLM 或其他 AI 模型處理複雜輸入,適用於生成文本、摘要等任務,但需視具體類型區分能力。
代理型 vs. 非代理型 AI 工作流
非代理型 AI 工作流:僅依賴 LLM 的靜態生成能力,無自主決策。例如,文本摘要工作流接收長文本並輸出固定摘要。
代理型 AI 工作流:通過 AI 代理實現動態決策與適應性,支持任務分解、工具調用與結果反思。例如,客服代理可根據用戶反饋檢索資料、生成回應並調整策略。
優勢與應用
代理型 AI 工作流因其適應性與自主性,特別適用於動態、複雜場景,如軟體調試(迭代優化代碼)或市場研究(動態調整查詢)。相比之下,非代理型 AI 工作流適合簡單生成任務,傳統工作流則限於高度結構化的流程。
代理架構與代理工作流的區別
隨著 AI 技術的發展,術語「代理架構(Agentic Architecture)」和「代理工作流(Agentic Workflow)」常被混淆,但二者有明顯區別。以下對其定義與焦點進行對比:
核心區別
代理工作流:聚焦於任務執行的動態流程,即「如何做」。它描述代理如何分解複雜任務、使用工具(如 API 或資料庫)、反思結果並迭代優化。例如,處理客戶投訴的工作流可能包括分析投訴、檢索相關資料、生成回應並確認效果。
代理架構:聚焦於系統的靜態設計,即「做什麼的基礎」。它定義了代理的技術框架,包括決策代理的推理模組、工具集的整合方式以及記憶系統的結構。例如,架構可能包含一個 LLM 作為核心代理、向量資料庫作為記憶儲存,以及外部 API 的介面。
關係與應用
代理架構為代理工作流提供基礎設施,類似於硬體與軟體的關係。一個穩健的代理架構(如模組化的工具介面和高效的記憶系統)能支援靈活的工作流設計。反之,特定工作流的需求可能驅動架構的優化。例如,醫療診斷工作流需要高安全性的架構來保護資料,而研究助手工作流則需要強大的檢索模組。
Agentic Workflow模式
代理工作流(Agentic Workflow)是指 AI 代理為達成特定目標所執行的一系列結構化步驟。這些步驟構成代理實現目標的行為模式,體現其任務執行邏輯。
AI 代理的核心元件在代理工作流中發揮關鍵作用:
推理能力(Reasoning):支持規劃模式(Planning Pattern)和反思模式(Reflection Pattern),使代理能夠分解複雜任務並優化決策過程。
工具使用能力(Tool Use):支撐工具使用模式(Tool Use Pattern),使代理能夠與外部系統交互,執行如資料檢索或自動化操作等任務。
通過整合推理與工具使用,代理工作流能夠高效、靈活地應對多樣化的任務需求。
1. 規劃模式(Planning Pattern)
規劃模式使 AI 代理能夠將複雜任務分解為一系列更小、更易管理的子任務,這一過程稱為任務分解。任務分解帶來以下優勢:
降低認知負荷:減少 LLM 的計算壓力,提升處理效率。
增強推理能力:通過分步推理,改善問題解決的準確性。
提高輸出可靠性:減少幻覺(Hallucination)及其他不準確性。
規劃模式在目標路徑不明確或需要靈活適應的場景中尤為有效。例如,修復軟體 bug 時,AI 代理可能執行以下步驟:
分析 bug 報告,定位問題。
檢查相關代碼,生成潛在錯誤原因。
選擇調試策略,運行修復代碼。
根據執行結果調整方案,重複直到問題解決。
然而,規劃模式的靈活性可能導致結果的不確定性高於確定性工作流。因此,它更適合需要多步推理或深入分析的任務,如軟體調試、策略制定或研究型問題解決。
2. 工具使用模式(Tool Use Pattern)
生成式大規模語言模型(LLM)受限於訓練數據,無法即時檢索外部資訊或驗證事實,易導致「幻覺」(生成錯誤資訊)或不可靠的「猜測」回應。檢索增強生成(RAG)通過即時檢索外部資料提升回應準確性,但其功能僅限於被動資料檢索,無法實現動態交互。
工具使用模式(Tool Use)突破了這一限制,使 LLM 能與外部系統動態交互,執行複雜任務,例如:
即時搜索網頁,獲取最新資訊。
從資料庫提取用戶歷史數據。
自動化操作,如發送電子郵件或調用 API。
應用示例:客服代理可通過 API 查詢訂單狀態、調用 Web 瀏覽器搜索產品更新,並自動發送回應郵件,顯著提升效率。
3. 反思模式(Reflection Pattern)
反思模式是一種自我反饋機制,AI 代理在執行最終行動前,通過反覆評估輸出品質或決策,優化推理過程。其優勢包括:
錯誤糾正:減少不準確性,提升可靠性。
持續改進:提高決策品質,適應複雜任務。
個性化適應:根據用戶偏好動態調整回應。
反思模式特別適用於需多次迭代的任務,如代碼生成:
代理生成代碼片段。
在沙箱環境中執行代碼,捕獲錯誤資訊。
將錯誤反饋至 LLM,迭代優化代碼。
重複直到代碼成功執行。
應用示例:在軟體調試中,代理根據錯誤日誌調整代碼,無需人工干預即可生成正確解決方案。反思模式還可將見解存入記憶體,實現跨會話的學習與個性化,例如記錄用戶偏好以優化未來交互。
Agentic Workflow的應用場景
代理型工作流(Agentic Workflow)通過原子設計模式(如規劃、工具使用)與動態工具選擇相結合,適應多樣化任務需求。AI 代理可整合人類反饋,靈活調整策略,並根據任務授予不同程度的自主性,廣泛應用於各行業。以下介紹三個代表性場景:代理 RAG、代理研究助手和代理編碼助手。
1. 代理 RAG(Agentic RAG)
代理 RAG 通過引入 AI 代理,增強檢索增強生成(RAG)框架的智慧性與動態性,使其超越傳統 RAG 的靜態檢索。工作流如下:
規劃階段:代理將複雜查詢分解為子查詢(Query Decomposition),並可主動向用戶請求澄清以精準任務目標。
檢索與評估:代理評估檢索資料的相關性與準確性,若結果不佳,則調整查詢策略或重新規劃。
輸出:生成基於高質量資料的回應,提升資訊可靠性。
特點:動態查詢調整、資料品質控制、用戶交互增強。例如,處理法律研究時,代理可分解問題並篩選權威來源。
2. 代理研究助手(Agentic Research Assistants)
代理研究助手(又稱“深度研究”)基於代理 RAG,專注於生成深入報告與複雜主題洞察,超越傳統 RAG 的單一檢索功能。以下為其與傳統 RAG 的對比:
工作流:
使用專為網頁瀏覽、任務分解和動態規劃微調的 LLM,檢索並分析多源資料。
主動與用戶交互,澄清需求並調整研究方向。
整合資料,生成系統化報告或趨勢分析。
應用:例如,市場研究代理可分析競爭對手動態,生成策略報告,顯著提升研究效率。OpenAI、Perplexity 和 Google 均推出相關產品。
3. 代理編碼助手(Agentic Coding Assistants)
代理編碼助手在代碼生成、重構、調試及團隊協作中實現高度自主性,超越非代理型助手(如早期 GitHub Copilot)的單一代碼生成功能。核心特點包括:
執行與自我改進:生成並執行代碼,根據錯誤反饋迭代優化。例如,調試時自動調整代碼直至通過測試。
代碼庫管理:具備創建提交(Commits)和拉取請求(PR)的許可權,自動化開發流程;執行前可徵求用戶確認,確保人類監督(如 Cursor)。
長期記憶:記錄錯誤與解決方案,持續改進未來表現(如 Anthropic Claude Code)。
應用:在軟體開發中,代理可自動完成從需求分析到代碼提交的流程,減少人工干預並加速迭代。
代理型工作流的實際應用案例
代理型工作流在不同領域展現了靈活性和高效性。以下以 Claygent 和 ServiceNow AI Agents 為例,展示其工作流模式、工具組合及特點。
1. Claygent:資料豐富化與外聯自動化
Claygent 是一款為增長和銷售團隊設計的 AI 研究代理,專注於潛在客戶研究與資料豐富化。以下以豐富 LinkedIn 個人資料並發送個性化消息為例的工作流:
輸入:用戶提供包含姓名和電郵的名單,並指定所需資料欄位(如工作經歷、教育背景)。
執行:代理使用預配置提示範本格式化查詢,通過 LLM 結合網路爬取工具(如 LinkedIn 爬蟲)提取資料,隨後調用另一 LLM 分析資料並生成個性化外聯消息。
輸出:為每位潛在客戶生成定制化的消息,提升外聯效率。
特點:
靈活定制:用戶可自由定義任務,適應多樣化需求。
提示範本:確保代理遵循任務目標,提升輸出一致性。
多代理協作:不同 LLM 分擔資料抓取、分析和消息生成,提升效率。
2. ServiceNow AI Agents:IT 與運營自動化
ServiceNow AI Agents 整合於 ServiceNow 雲平台,專注於自動化 IT、HR 和客戶服務中的重複性任務,強調人機協作。以下以處理技術支援工單為例的工作流:
輸入:用戶提交工單,觸發代理工作流。
執行:代理利用 RAG 技術檢索內部知識庫,分析相關案例並生成問題摘要與解決方案建議,提交給 IT 專家審批。
輸出:提供結構化摘要與行動建議,供專家決策。
特點:
人機協作:代理輔助決策,保留人類最終審批權。
安全可控:嚴格限制代理操作範圍,確保不影響客戶體驗。
結構化流程:遵循預定義規則,減少意外行為。
Agentic Workflow的優勢
代理型工作流(Agentic Workflow)通過賦予 AI 代理規劃、適應和持續改進的能力,超越傳統確定性工作流。相較於遵循固定規則的靜態流程,代理型工作流能動態應對複雜任務,根據反饋優化策略,並擴展以處理更高難度的場景。其適應性使其在需要靈活性、學習和決策的應用中表現出色。
核心優勢
靈活性與可定制性
靜態工作流難以應對環境變化或意外挑戰,而代理型工作流能根據任務需求動態調整,確保解決方案的相關性與高效性。通過整合規劃、工具使用和反思模式,其模組化設計支持反覆運算升級,適應不斷演變的需求。例如,客服代理可根據用戶反饋即時調整回應策略。複雜任務的優異表現
通過任務分解(Task Decomposition)將複雜任務拆分為可管理的子任務,代理型工作流在處理多步推理或高難度問題時,顯著優於確定性或零樣本方法。例如,軟體調試代理可分步定位錯誤、生成修復方案並驗證結果。自我糾正與持續學習
反思模式使代理能評估執行結果,優化策略並從經驗中學習。結合短期與長期記憶,代理型工作流隨時間推移變得更高效且個性化。例如,醫療診斷代理可根據歷史病例改進診斷準確性。操作效率與可擴展性
代理型工作流能精準自動化重複性任務,降低人工干預與運營成本。其模組化架構支持擴展,適應更大規模的工作負載或更複雜的系統。例如,物流優化代理可從單倉庫管理擴展到多區域協調。
Agentic Workflow局限性
儘管具有諸多優勢和創新功能,AI代理也存在一些挑戰和局限性。由於其概率性質,AI代理本質上為工作流增添了複雜性。僅僅因為代理可以用於自動化流程,並不意味著它們應該被使用。以下是Agentic工作流的一些顯著挑戰和局限性:
對於簡單任務的過度複雜性。在用於簡單工作流(如表單輸入或基本資料提取)時,AI代理可能會增加額外的開銷。在確定性、基於規則的自動化足夠的情況下,引入代理可能會導致低效、額外費用,甚至可能降低性能。
隨著自主性增加導致可靠性降低。隨著代理在工作流中獲得更多的決策權,其概率性質可能會引入不可預測性,使得輸出不太可靠且更難控制。實施並持續維護代理的防護措施,並定期審查其授權許可權至關重要。
倫理和實踐考量。並非所有決策都應委託給AI系統。在高風險或敏感領域使用代理時,需要謹慎監督,以確保負責任的部署並防止意外後果。
鑒於這些局限性,建議在使用代理之前,花時間反思其是否在特定工作流中確實必要。以下問題可以幫助您做出判斷:
任務是否足夠複雜,需要適應性決策,還是確定性方法足夠?
簡單的AI輔助工具(如沒有代理的RAG)能否達到相同的效果?
工作流是否涉及不確定性、變化條件或多步推理,代理能更有效地處理這些問題嗎?
給予代理自主性帶來的風險是什麼,能否有效降低這些風險?








