從AI Agent到Agent Workflow

探索 AI 代理的架構與動態工作流設計

May 11, 2025

AI Agent、Agentic AI、Agent架構和Agent工作流等概念如今備受關注，但它們究竟是什麼？它們能做什麼？新技術常常伴隨著混亂的術語和炒作。本文將深入解析代理型AI的關鍵概念——代理工作流（Agentic Workflows）。

AI Agent本身並無太多實際用途，只有透過賦予其角色、目標和結構，只有透過工作流，才能真正發揮作用。理解代理工作流（Agentic Workflow），有助於理解 AI Agent的運作方式和邏輯。

本文從AI Agent到Agent工作流，詳細解說代理工作流（Agentic Workflows）：

什麼是AI Agent?
什麼是Agent工作流？
Agent工作流組成？
Agent工作流 vs Agent架構
Agent工作流模式
Agent工作流應用場景
Agent工作流優缺點

什麼是 AI Agent？

AI 代理是一種結合了大型語言模型（LLMs）的推理與決策能力，以及現實世界交互工具的系統，使其能夠在有限的人類干預下完成複雜任務。代理被賦予特定的角色，並擁有不同程度的自主性來實現最終目標。它們還具備記憶能力，能夠從過去的經驗中學習，並隨著時間的推移提升性能。

為了更好地理解AI代理在代理工作流中的作用，需要先瞭解它們的核心組成部分。

儘管 AI Agent被設計用於半自主決策，但它們仍然依賴於一套更大的元件框架才能正常運行。這些組件包括：

LLMs（大型語言模型）：使代理具備推理能力
工具（Tools）：説明代理完成任務
記憶（Memory）：讓代理能夠從過去的經驗中學習，並隨著時間優化響應

推理（Reasoning）

AI 代理的強大之處在於其反覆運算推理能力，即在整個問題解決過程中持續「思考」。推理能力主要來自底層 LLM，並發揮兩個核心作用：規劃（Planning）和反思（Reflecting）。

規劃（Planning）：代理會分解任務（Task Decomposition），將複雜的問題拆解為更小、更可執行的步驟。這樣可以讓代理系統地執行任務，並根據不同需求選擇不同的工具。此外，代理還能進行查詢分解（Query Decomposition），即將複雜查詢拆解成更簡單的子查詢，以提高 LLM 回應的準確性和可靠性。
反思（Reflecting）：代理會回顧自身的行動結果，並基於結果與外部資料進行調整，以優化後續決策。

工具（Tools）

由於 LLM 僅限於其訓練時獲得的知識（靜態的參數化知識），為了擴展其能力，AI 代理可以借助外部工具，如以下幾種工具類型：

當 LLM 選擇合適的工具來完成任務時，它會執行函式呼叫（Function Calling），從而擴展自身能力，超越單純的文本生成，實現對現實世界的交互。

工具的選擇可以由用戶預先定義，也可以由代理動態決定。動態選擇工具有助於解決複雜任務，但對於簡單工作流，預定義工具可能更高效。

記憶（Memory）

AI 代理的記憶能力是代理工作流區別於純 LLM 工作流的重要特徵之一。記憶允許代理在多個使用者交互和會話中存儲上下文和回饋，從而實現更個性化的體驗，並優化長期表現。

AI 代理的記憶可分為兩種：

短期記憶（Short-term Memory）：存儲最近的交互資訊，如對話歷史，説明代理決定下一步行動。
長期記憶（Long-term Memory）：存儲長時間累積的資訊，跨會話學習，以實現個性化和持續優化。

什麼是Agentic Workflow？

工作流（Workflow）是一系列相互關聯的步驟，旨在完成特定任務或目標。確定性工作流遵循預定義的步驟序列，無法適應新資訊或環境變化。例如，自動化報銷審批工作流可能規定：若費用標籤為「餐飲」且金額低於 $30，則自動批准。

AI 工作流利用大型語言模型（LLMs）或其他機器學習模型增強能力，可分為兩類：

非代理型 AI 工作流：LLM 根據輸入指令生成輸出，僅依賴其文本處理能力，缺乏自主決策或任務執行能力。例如，文本摘要工作流的流程為：接收長文本 → LLM 總結 → 輸出摘要。
代理型 AI 工作流：由一個或多個 AI 代理動態執行步驟以完成任務。代理在授權範圍內具備自主性，能夠收集資料、執行操作並做出決策。憑藉推理能力、工具使用能力和持久記憶，代理型工作流更具適應性、回應性和自我進化能力。例如，代理可根據實時資料調整報銷審批標準，或在軟體開發中動態調試代碼。

代理型工作流通過整合 AI 代理的核心能力，顯著提升傳統工作流的靈活性和效率。

Agentic Workflow的核心組成

代理型工作流（Agentic Workflow）需具備以下三個核心特點，以實現任務的動態執行與優化：

制定計劃（Planning）
AI 代理通過任務分解（Task Decomposition），將複雜任務拆分為更小的子任務，並規劃最佳執行路徑。例如，處理客戶投訴時，代理可能分解為識別問題、查詢相關記錄和生成回應。
使用工具執行任務（Tool Use）
代理利用預定義工具（如 API、資料庫、搜尋引擎）執行任務，配合許可權管理以確保安全高效。例如，代理可通過搜尋引擎獲取最新資訊，或調用郵件 API 發送通知。
反思與反覆運算（Reflection and Iteration）
代理在每一步評估執行結果，根據需要調整計劃並反覆運算，直至達成目標。例如，調試軟體時，代理可根據錯誤日誌調整修復策略。

這三個特點相輔相成，使代理型工作流具備高度的適應性與自主性，適用於動態且複雜的任務場景。

三種Workflow類型

工作流可分為三種類型，各具不同特點與應用場景：

核心區別

AI 工作流 vs. 傳統工作流
- 傳統工作流：依賴預定義規則，執行固定步驟，適合簡單、重複性任務，如自動化報銷審批（若金額低於 $50 則批准）。
- AI 工作流：利用 LLM 或其他 AI 模型處理複雜輸入，適用於生成文本、摘要等任務，但需視具體類型區分能力。
代理型 vs. 非代理型 AI 工作流
- 非代理型 AI 工作流：僅依賴 LLM 的靜態生成能力，無自主決策。例如，文本摘要工作流接收長文本並輸出固定摘要。
- 代理型 AI 工作流：通過 AI 代理實現動態決策與適應性，支持任務分解、工具調用與結果反思。例如，客服代理可根據用戶反饋檢索資料、生成回應並調整策略。

優勢與應用

代理型 AI 工作流因其適應性與自主性，特別適用於動態、複雜場景，如軟體調試（迭代優化代碼）或市場研究（動態調整查詢）。相比之下，非代理型 AI 工作流適合簡單生成任務，傳統工作流則限於高度結構化的流程。

代理架構與代理工作流的區別

隨著 AI 技術的發展，術語「代理架構（Agentic Architecture）」和「代理工作流（Agentic Workflow）」常被混淆，但二者有明顯區別。以下對其定義與焦點進行對比：

核心區別

代理工作流：聚焦於任務執行的動態流程，即「如何做」。它描述代理如何分解複雜任務、使用工具（如 API 或資料庫）、反思結果並迭代優化。例如，處理客戶投訴的工作流可能包括分析投訴、檢索相關資料、生成回應並確認效果。
代理架構：聚焦於系統的靜態設計，即「做什麼的基礎」。它定義了代理的技術框架，包括決策代理的推理模組、工具集的整合方式以及記憶系統的結構。例如，架構可能包含一個 LLM 作為核心代理、向量資料庫作為記憶儲存，以及外部 API 的介面。

關係與應用

代理架構為代理工作流提供基礎設施，類似於硬體與軟體的關係。一個穩健的代理架構（如模組化的工具介面和高效的記憶系統）能支援靈活的工作流設計。反之，特定工作流的需求可能驅動架構的優化。例如，醫療診斷工作流需要高安全性的架構來保護資料，而研究助手工作流則需要強大的檢索模組。

Agentic Workflow模式

代理工作流（Agentic Workflow）是指 AI 代理為達成特定目標所執行的一系列結構化步驟。這些步驟構成代理實現目標的行為模式，體現其任務執行邏輯。

AI 代理的核心元件在代理工作流中發揮關鍵作用：

推理能力（Reasoning）：支持規劃模式（Planning Pattern）和反思模式（Reflection Pattern），使代理能夠分解複雜任務並優化決策過程。
工具使用能力（Tool Use）：支撐工具使用模式（Tool Use Pattern），使代理能夠與外部系統交互，執行如資料檢索或自動化操作等任務。

通過整合推理與工具使用，代理工作流能夠高效、靈活地應對多樣化的任務需求。

1. 規劃模式（Planning Pattern）

規劃模式使 AI 代理能夠將複雜任務分解為一系列更小、更易管理的子任務，這一過程稱為任務分解。任務分解帶來以下優勢：

降低認知負荷：減少 LLM 的計算壓力，提升處理效率。
增強推理能力：通過分步推理，改善問題解決的準確性。
提高輸出可靠性：減少幻覺（Hallucination）及其他不準確性。

AI Agents Crash Course—Part 11 (With Implementation)

規劃模式在目標路徑不明確或需要靈活適應的場景中尤為有效。例如，修復軟體 bug 時，AI 代理可能執行以下步驟：

分析 bug 報告，定位問題。
檢查相關代碼，生成潛在錯誤原因。
選擇調試策略，運行修復代碼。
根據執行結果調整方案，重複直到問題解決。

然而，規劃模式的靈活性可能導致結果的不確定性高於確定性工作流。因此，它更適合需要多步推理或深入分析的任務，如軟體調試、策略制定或研究型問題解決。

2. 工具使用模式（Tool Use Pattern）

生成式大規模語言模型（LLM）受限於訓練數據，無法即時檢索外部資訊或驗證事實，易導致「幻覺」（生成錯誤資訊）或不可靠的「猜測」回應。檢索增強生成（RAG）通過即時檢索外部資料提升回應準確性，但其功能僅限於被動資料檢索，無法實現動態交互。

5 Agentic AI Design Patterns - by Avi Chawla

工具使用模式（Tool Use）突破了這一限制，使 LLM 能與外部系統動態交互，執行複雜任務，例如：

即時搜索網頁，獲取最新資訊。
從資料庫提取用戶歷史數據。
自動化操作，如發送電子郵件或調用 API。

應用示例：客服代理可通過 API 查詢訂單狀態、調用 Web 瀏覽器搜索產品更新，並自動發送回應郵件，顯著提升效率。

3. 反思模式（Reflection Pattern）

反思模式是一種自我反饋機制，AI 代理在執行最終行動前，通過反覆評估輸出品質或決策，優化推理過程。其優勢包括：

錯誤糾正：減少不準確性，提升可靠性。
持續改進：提高決策品質，適應複雜任務。
個性化適應：根據用戶偏好動態調整回應。

反思模式特別適用於需多次迭代的任務，如代碼生成：

代理生成代碼片段。
在沙箱環境中執行代碼，捕獲錯誤資訊。
將錯誤反饋至 LLM，迭代優化代碼。
重複直到代碼成功執行。

應用示例：在軟體調試中，代理根據錯誤日誌調整代碼，無需人工干預即可生成正確解決方案。反思模式還可將見解存入記憶體，實現跨會話的學習與個性化，例如記錄用戶偏好以優化未來交互。

Agentic Workflow的應用場景

代理型工作流（Agentic Workflow）通過原子設計模式（如規劃、工具使用）與動態工具選擇相結合，適應多樣化任務需求。AI 代理可整合人類反饋，靈活調整策略，並根據任務授予不同程度的自主性，廣泛應用於各行業。以下介紹三個代表性場景：代理 RAG、代理研究助手和代理編碼助手。

1. 代理 RAG（Agentic RAG）

代理 RAG 通過引入 AI 代理，增強檢索增強生成（RAG）框架的智慧性與動態性，使其超越傳統 RAG 的靜態檢索。工作流如下：

規劃階段：代理將複雜查詢分解為子查詢（Query Decomposition），並可主動向用戶請求澄清以精準任務目標。
檢索與評估：代理評估檢索資料的相關性與準確性，若結果不佳，則調整查詢策略或重新規劃。
輸出：生成基於高質量資料的回應，提升資訊可靠性。

特點：動態查詢調整、資料品質控制、用戶交互增強。例如，處理法律研究時，代理可分解問題並篩選權威來源。

How I finally got agentic RAG to work right – Vectorize

2. 代理研究助手（Agentic Research Assistants）

代理研究助手（又稱“深度研究”）基於代理 RAG，專注於生成深入報告與複雜主題洞察，超越傳統 RAG 的單一檢索功能。以下為其與傳統 RAG 的對比：

工作流：

使用專為網頁瀏覽、任務分解和動態規劃微調的 LLM，檢索並分析多源資料。
主動與用戶交互，澄清需求並調整研究方向。
整合資料，生成系統化報告或趨勢分析。

應用：例如，市場研究代理可分析競爭對手動態，生成策略報告，顯著提升研究效率。OpenAI、Perplexity 和 Google 均推出相關產品。

3. 代理編碼助手（Agentic Coding Assistants）

代理編碼助手在代碼生成、重構、調試及團隊協作中實現高度自主性，超越非代理型助手（如早期 GitHub Copilot）的單一代碼生成功能。核心特點包括：

執行與自我改進：生成並執行代碼，根據錯誤反饋迭代優化。例如，調試時自動調整代碼直至通過測試。
代碼庫管理：具備創建提交（Commits）和拉取請求（PR）的許可權，自動化開發流程；執行前可徵求用戶確認，確保人類監督（如 Cursor）。
長期記憶：記錄錯誤與解決方案，持續改進未來表現（如 Anthropic Claude Code）。

應用：在軟體開發中，代理可自動完成從需求分析到代碼提交的流程，減少人工干預並加速迭代。

AI Coding Assistants Landscape It is changing literally every day. Latest… | Bilgin Ibryam

代理型工作流的實際應用案例

代理型工作流在不同領域展現了靈活性和高效性。以下以 Claygent 和 ServiceNow AI Agents 為例，展示其工作流模式、工具組合及特點。

1. Claygent：資料豐富化與外聯自動化

Claygent 是一款為增長和銷售團隊設計的 AI 研究代理，專注於潛在客戶研究與資料豐富化。以下以豐富 LinkedIn 個人資料並發送個性化消息為例的工作流：

輸入：用戶提供包含姓名和電郵的名單，並指定所需資料欄位（如工作經歷、教育背景）。
執行：代理使用預配置提示範本格式化查詢，通過 LLM 結合網路爬取工具（如 LinkedIn 爬蟲）提取資料，隨後調用另一 LLM 分析資料並生成個性化外聯消息。
輸出：為每位潛在客戶生成定制化的消息，提升外聯效率。

特點：

靈活定制：用戶可自由定義任務，適應多樣化需求。
提示範本：確保代理遵循任務目標，提升輸出一致性。
多代理協作：不同 LLM 分擔資料抓取、分析和消息生成，提升效率。

2. ServiceNow AI Agents：IT 與運營自動化

ServiceNow AI Agents 整合於 ServiceNow 雲平台，專注於自動化 IT、HR 和客戶服務中的重複性任務，強調人機協作。以下以處理技術支援工單為例的工作流：

輸入：用戶提交工單，觸發代理工作流。
執行：代理利用 RAG 技術檢索內部知識庫，分析相關案例並生成問題摘要與解決方案建議，提交給 IT 專家審批。
輸出：提供結構化摘要與行動建議，供專家決策。

特點：

人機協作：代理輔助決策，保留人類最終審批權。
安全可控：嚴格限制代理操作範圍，確保不影響客戶體驗。
結構化流程：遵循預定義規則，減少意外行為。

Agentic Workflow的優勢

代理型工作流（Agentic Workflow）通過賦予 AI 代理規劃、適應和持續改進的能力，超越傳統確定性工作流。相較於遵循固定規則的靜態流程，代理型工作流能動態應對複雜任務，根據反饋優化策略，並擴展以處理更高難度的場景。其適應性使其在需要靈活性、學習和決策的應用中表現出色。

核心優勢

靈活性與可定制性
靜態工作流難以應對環境變化或意外挑戰，而代理型工作流能根據任務需求動態調整，確保解決方案的相關性與高效性。通過整合規劃、工具使用和反思模式，其模組化設計支持反覆運算升級，適應不斷演變的需求。例如，客服代理可根據用戶反饋即時調整回應策略。
複雜任務的優異表現
通過任務分解（Task Decomposition）將複雜任務拆分為可管理的子任務，代理型工作流在處理多步推理或高難度問題時，顯著優於確定性或零樣本方法。例如，軟體調試代理可分步定位錯誤、生成修復方案並驗證結果。
自我糾正與持續學習
反思模式使代理能評估執行結果，優化策略並從經驗中學習。結合短期與長期記憶，代理型工作流隨時間推移變得更高效且個性化。例如，醫療診斷代理可根據歷史病例改進診斷準確性。
操作效率與可擴展性
代理型工作流能精準自動化重複性任務，降低人工干預與運營成本。其模組化架構支持擴展，適應更大規模的工作負載或更複雜的系統。例如，物流優化代理可從單倉庫管理擴展到多區域協調。

Agentic Workflow局限性

儘管具有諸多優勢和創新功能，AI代理也存在一些挑戰和局限性。由於其概率性質，AI代理本質上為工作流增添了複雜性。僅僅因為代理可以用於自動化流程，並不意味著它們應該被使用。以下是Agentic工作流的一些顯著挑戰和局限性：

對於簡單任務的過度複雜性。在用於簡單工作流（如表單輸入或基本資料提取）時，AI代理可能會增加額外的開銷。在確定性、基於規則的自動化足夠的情況下，引入代理可能會導致低效、額外費用，甚至可能降低性能。
隨著自主性增加導致可靠性降低。隨著代理在工作流中獲得更多的決策權，其概率性質可能會引入不可預測性，使得輸出不太可靠且更難控制。實施並持續維護代理的防護措施，並定期審查其授權許可權至關重要。
倫理和實踐考量。並非所有決策都應委託給AI系統。在高風險或敏感領域使用代理時，需要謹慎監督，以確保負責任的部署並防止意外後果。

鑒於這些局限性，建議在使用代理之前，花時間反思其是否在特定工作流中確實必要。以下問題可以幫助您做出判斷：

任務是否足夠複雜，需要適應性決策，還是確定性方法足夠？
簡單的AI輔助工具（如沒有代理的RAG）能否達到相同的效果？
工作流是否涉及不確定性、變化條件或多步推理，代理能更有效地處理這些問題嗎？
給予代理自主性帶來的風險是什麼，能否有效降低這些風險？

Discussion about this post

Ready for more?