矽谷熱潮背後的冷思考，AI 代理人的期望與現實差距

矽谷對 AI 代理人的樂觀情緒高漲，這些技術被視為能夠解決問題、執行任務並隨著環境學習而變得更智慧的虛擬助理。企業已經開始利用這些代理人來預訂航班、收集數據、總結報告甚至做出決策。然而，這些代理人並不完美，錯誤和幻覺的問題依然普遍，且隨著使用的增加而惡化。

隨著企業開始使用代理人來自動化複雜的多步驟任務，新的工具也隨之出現。例如，Regie AI的「自動駕駛銷售代理人」能自動尋找潛在客戶、撰寫個性化電子郵件並跟進買家；Cognition AI則開發了一個名為Devin的代理人，專門執行複雜的工程任務；而四大專業服務公司PwC則推出了「代理操作系統」，以便於代理人之間的溝通和任務執行。

不過，代理人在完成任務的每一步中，錯誤率的增加將直接影響最終結果。有些代理過程的步驟數量可達100步以上，根據Patronus AI的研究，這些錯誤可能導致顯著的風險和收入損失。該公司在其blog中指出：「任何一步的錯誤都可能使整個任務偏離軌道。涉及的步驟越多，最終出錯的機率就越高。」

此外，ScaleAI的增長負責人Quintin Au提到，實際操作中的錯誤率往往更高，每當AI執行一個動作時，大約有20%的錯誤機率。如果一個代理需要完成5個動作，則每一步都正確的機會僅為32%。DeepMind的首席執行長Demis Hassabis在最近的活動中表示，錯誤率應被視為「複利」，而當代理需要經歷5,000個步驟時，正確的概率可能是隨機的。

因此，AI代理人失敗的可能性使企業面臨更大的客戶流失風險。好消息是，透過設置過濾器、規則和工具等防護措施，可以減少錯誤率。這些小改進能夠顯著降低錯誤的概率。Patronus AI的首席執行長Anand Kannappan指出，防護措施可以是簡單的附加檢查，以確保代理人在操作過程中不會失敗。

總之，隨著AI技術的發展，對其能力的期望和實際表現之間的差距越來越明顯。企業在使用AI代理時，應該謹慎評估其風險與收益，並採取適當的措施來降低錯誤率，以便更有效地利用這項技術。

（首圖來源：pixabay）

文章看完覺得有幫助，何不給我們一個鼓勵

請我們喝杯咖啡