矽谷對 AI 代理人的樂觀情緒高漲,這些技術被視為能夠解決問題、執行任務並隨著環境學習而變得更智慧的虛擬助理。企業已經開始利用這些代理人來預訂航班、收集數據、總結報告甚至做出決策。然而,這些代理人並不完美,錯誤和幻覺的問題依然普遍,且隨著使用的增加而惡化。
隨著企業開始使用代理人來自動化複雜的多步驟任務,新的工具也隨之出現。例如,Regie AI的「自動駕駛銷售代理人」能自動尋找潛在客戶、撰寫個性化電子郵件並跟進買家;Cognition AI則開發了一個名為Devin的代理人,專門執行複雜的工程任務;而四大專業服務公司PwC則推出了「代理操作系統」,以便於代理人之間的溝通和任務執行。
不過,代理人在完成任務的每一步中,錯誤率的增加將直接影響最終結果。有些代理過程的步驟數量可達100步以上,根據Patronus AI的研究,這些錯誤可能導致顯著的風險和收入損失。該公司在其blog中指出:「任何一步的錯誤都可能使整個任務偏離軌道。涉及的步驟越多,最終出錯的機率就越高。」
此外,ScaleAI的增長負責人Quintin Au提到,實際操作中的錯誤率往往更高,每當AI執行一個動作時,大約有20%的錯誤機率。如果一個代理需要完成5個動作,則每一步都正確的機會僅為32%。DeepMind的首席執行長Demis Hassabis在最近的活動中表示,錯誤率應被視為「複利」,而當代理需要經歷5,000個步驟時,正確的概率可能是隨機的。
因此,AI代理人失敗的可能性使企業面臨更大的客戶流失風險。好消息是,透過設置過濾器、規則和工具等防護措施,可以減少錯誤率。這些小改進能夠顯著降低錯誤的概率。Patronus AI的首席執行長Anand Kannappan指出,防護措施可以是簡單的附加檢查,以確保代理人在操作過程中不會失敗。
總之,隨著AI技術的發展,對其能力的期望和實際表現之間的差距越來越明顯。企業在使用AI代理時,應該謹慎評估其風險與收益,並採取適當的措施來降低錯誤率,以便更有效地利用這項技術。
- Don’t get too excited about AI agents yet. They make a lot of mistakes.
- Five Potential Risks Of Autonomous AI Agents Going Rogue
- AI Agents: Hype Vs. Reality – Practical Impact Over Perfect Autonomy
- Not All AI Agents Win: Here’s How To Pick High-ROI Bets
(首圖來源:pixabay)
文章看完覺得有幫助,何不給我們一個鼓勵