
The AI Agent framework is taking shape! Google open-sources A2A, will "MCP + A2A" become the future standard?

谷歌在 Google Cloud Next 25 大會上開源了 Agent2Agent Protocol(A2A),這是首個標準智能體交互協議,旨在打破系統孤島,提升智能體的能力和執行效率。A2A 支持多家主流企業應用平台,預計將推動智能體生態的快速發展。此外,谷歌還推出了 Agent 開發套件 ADK 和 Agent 市場等工具。
昨晚,谷歌在 Google Cloud Next 25 大會上,開源了首個標準智能體交互協議——Agent2Agent Protocol(簡稱 A2A)。
A2A 將徹底打破系統孤島,對智能體的能力、跨平台、執行效率產生質的改變,支持 Atlassian、Box、Cohere、Intuit、Langchain、MongoDB、PayPal、Salesforce、SAP、ServiceNow、UKG 和 Workday 等主流企業應用平台。
簡單來説,這個 A2A 交互協議有點當年谷歌牽頭 80 多家企業搞安卓系統的味道,因為首批就有 50 多家著名企業加入。隨着加入的企業越來越多,會極大提升 A2A 的商業價值以及推動整個智能體生態的快速發展。
在本次大會上 Agent 成為了重點,除了 A2A 之外,谷歌還效仿 OpenAI 開源了 Agent 開發套件 ADK,內部測試工具 Agent Engine,新的 Agent 市場等。下面「AIGC 開放社區」先為大家解讀 A2A 的重點內容。
什麼是 A2A
A2A 是一種開放協議,為 Agent 提供了一種標準的交互方式,使它們能夠相互協作,無論底層框架或供應商是什麼。
例如,一家大型電商公司使用了多種企業平台和服務。Atlassian 用於團隊項目管理,Box 用於文件存儲和共享,Salesforce 用於客户關係管理,Workday 用於人力資源管理。
以前這些平台上的 Agent 無法自由通信。現在通過 A2A 協議,這些企業平台可以安全、自由地自動化交互數據。
A2A 案例展示
在與合作伙伴設計協議時,谷歌遵循了五個關鍵原則。第一,A2A 專注於使 Agent 能夠在它們自然的、非結構化的模式下進行協作,即使它們不共享內存、工具和上下文。谷歌正在啓用真正的多 Agent 場景,而不是限制 Agent 成為一個工具。
第二,該協議是基於現有的、流行的標準構建的,包括 HTTP、服務器端事件(SSE)、JSON-RPC 等,這意味着它更容易與企業日常已經使用的現有 IT 堆棧進行集成。
例如,一家電商企業日常使用 HTTP 協議來處理網頁數據傳輸,利用 JSON - RPC 在前後端傳遞數據指令。引入 A2A 協議後,企業的訂單管理系統可以通過 HTTP 與 A2A 協議對接,快速獲取相關智能 Agent 提供的物流數據更新,無需大費周章地重新搭建複雜的數據傳輸通道,能輕鬆融入現有的 IT 架構,讓各個系統協同工作更加順暢。
第三,A2A 被設計為支持企業級的認證和授權,在推出時與 OpenAPI 的認證方案具有對等性。這點還是很人性的不排斥 OpenAI,使用 A2A 協議能快速通過身份驗證,安全地獲取數據,保障數據傳輸的安全性和合規性,防止數據泄露風險。
第四,谷歌設計 A2A 使其具有靈活性,能夠支持從快速任務到可能需要數小時甚至數天(當人類參與其中時)的深入研究等各種場景。在整個過程中,A2A 可以向用户提供實時反饋、通知和狀態更新。
以一家科研機構為例,研究人員利用 A2A 協議下的 Agent 進行新藥物研發相關研究。簡單的任務如快速檢索數據庫中已有的藥物分子結構信息,幾秒內就能完成並反饋給研究人員。但對於複雜任務,像模擬新藥物分子在人體環境中的反應,可能需要數天時間。
在這期間,A2A 協議會不斷向研究人員推送模擬進度,比如已經完成了多少步驟、當前遇到的問題等,讓研究人員隨時掌握情況,就像時刻有個助手在彙報工作進展。
第五,Agent 的世界不僅限於文本,所以,A2A 支持各種模態,包括音頻、圖像和視頻流。
A2A 工作原理
A2A 的工作原理是通過促進客户端 Agent 和遠程 Agent 之間的通信來實現的。客户端 Agent 負責制定和傳達任務,而遠程 Agent 則根據這些任務採取行動,以提供正確的信息或執行相應的操作。在這個過程中,A2A 協議有以下幾個關鍵能力。
首先,Agent 可以通過 “Agent 卡” 來宣傳它們的能力。這些 “Agent 卡” 是以 JSON 格式存在的,它們能夠讓客户端 Agent 識別出哪個遠程 Agent 最適合執行特定的任務。
一旦確定了合適的遠程 Agent,客户端 Agent 就可以利用 A2A 協議與之進行通信,將任務分配給它。
然後,任務管理是 A2A 協議中的一個重要環節。客户端和遠程 Agent 之間的通信都是圍繞完成任務展開的。協議定義了一個 “任務” 對象,這個對象具有自己的生命週期。
對於一些簡單的任務,可能可以立即完成;而對於一些複雜的、長期的任務,Agent 們可以相互溝通,以保持對任務完成狀態的同步。當任務完成時,其輸出被稱為 “工件”。
此外,A2A 還支持 Agent 之間的協作。Agent 們可以相互發送消息,這些消息可以包含上下文信息、回覆、工件或者用户指令。通過這種方式,Agent 們能夠更好地協同工作,共同完成複雜的任務。
最後,A2A 還具備用户體驗協商的功能。每條消息都包含 “部分”,這些部分是完整的內容片段,例如,生成的圖像。
每個部分都有指定的內容類型,這使得客户端和遠程 Agent 能夠協商所需的正確格式,並且明確包括用户界面能力的協商,比如 iframe、視頻、網絡表單等。這樣,A2A 就能夠根據用户的需求和設備的能力,提供最佳的用户體驗。
哪些企業加入了 A2A
其實最讓人驚訝的就是,A2A 剛發佈就獲得了大批著名企業的青睞和加入,包括埃森哲、波士頓諮詢集團、凱捷、科尼、Salesforce、德勤、甲骨文、HCL 科技、印孚瑟斯、KPMG、SAP、麥肯錫、普華永道等 50 多家日常大家能經常聽到的企業。
首批加入 A2A 的企業
還有一些技術公司也加入了到了 A2A 協議中。例如,Atlassian 以其強大的團隊協作工具 Jira 和 Confluence 而聞名。通過加入 A2A,Atlassian 能夠使其工具與各種 Agent 無縫協作,從而進一步提升團隊的工作效率和協作能力。
Box 是一家專注於企業級雲存儲和內容管理服務的公司,它提供的解決方案能夠幫助企業安全地存儲、共享和管理文件。通過 A2A 協議,Box 可以使其服務與 Agent 相結合,實現更高效的內容管理和自動化工作流程。
Intuit 知名的財務軟件公司,QuickBooks 和 TurboTax,已經被廣泛應用於財務管理和税務處理。通過 A2A 協議,Intuit 可以使其軟件與 Agent 協作,實現更自動化的財務流程和更高效的税務處理。
MongoDB 是一家提供高性能、開源的 NoSQL 數據庫解決方案的公司,其數據庫廣泛應用於現代應用程序的數據存儲和管理。通過 A2A 協議,MongoDB 可以使其數據庫服務與智能 Agent 相結合,實現更高效的數據管理和自動化數據處理。
其實看到這裏大家應該都清楚了,谷歌就是想統一 Agent 混亂的格局,打造全新的執行、交互標準,這個比前段時間的 MCP 要猛的多啊~
AIGC 開放社區,原文標題:《AI Agent 大變天!谷歌開源 A2A,一夜改變智能體交互》
風險提示及免責條款
市場有風險,投資需謹慎。本文不構成個人投資建議,也未考慮到個別用户特殊的投資目標、財務狀況或需要。用户應考慮本文中的任何意見、觀點或結論是否符合其特定狀況。據此投資,責任自負。