AWS針對其AI代理 (AI Agents) 開發與佈署平台Amazon Bedrock AgentCore推出系列重大更新,聚焦解決企業在將AI代理投入生產環境時面臨的信任、品質與學習能力挑戰,新增包含「策略」 (Policy)、「評估」 (Evaluations)與「記憶」 (Memory)三大關鍵功能,讓企業能更有信心地構建、佈署,並且擴展生產就緒 (production-ready) 的AI代理服務。
AWS強調,自從AgentCore預覽版推出5個月以來,下載量已經超過200萬次,並且獲得包含Amazon Devices Operations、Cox Automotive、MongoDB、濤森路透集團 (Thomson Reuters),以及Workday在內業者採用。
「策略」:設定自然語言邊界,防止AI「暴走」
隨著AI代理具備越來越高的自主性,如何限制其行為成為企業首要課題。
新推出的「策略」功能允許團隊使用自然語言設定代理的行為邊界,例如管理者可以簡單輸入:「當退款金額超過1000美元時,阻止所有客戶退款」,AgentCore Gateway便會在毫秒級的時間內,即時檢查、攔截違反政策的行動。這落實了AWS「信任,但需驗證」 (trust, but verify)的運作原則,確保AI代理服務在自主運作的同時,仍受到嚴格的合規監管。
數據安全領導廠商Druva表示,此功能讓開發者能更有信心地創新,無需擔心代理越權存取敏感備份系統或安全日誌。
「評估」:13種預建評估器,即時監控AI品質
評估AI代理的表現往往比傳統軟體更具挑戰性,因此在AgentCore增加的「評估」功能提供13種預建評估器,涵蓋正確性、有用性、工具選擇準確度與安全性等評估維度。而開發者不僅能使用預建指標,還能編寫自定義評估器。系統會持續抽樣即時互動,一旦發現品質下降 (例如客服滿意度在8小時內下跌10%),便會立即觸發警報。
基因檢測公司Natera指出,這對於在醫療合規標準下維持AI代理的一致性至關重要。
「記憶」:導入「情節記憶」,AI越用越聰明
大多數AI代理缺乏長期記憶功能,導致每次互動都像「初次見面」。
AgentCore的「記憶」功能加入全新的「情節」 (episodic)項目,讓AI代理服務能從過去的經驗中進行學習。系統會捕捉過往互動的上下文、推理過程與結果,並且自動分析模式,藉此改進未來的決策結果。
舉例來說,若用戶上次曾因帶小孩而遇到交通問題,AI在下次安排行程時,就會自動記得必須提早2小時預約接送。標普全球市場財至 (S&P Global Market Intelligence)表示,這解決了在分散式組織中協調數百個專用代理時,維持一致上下文的難題。
支援多種框架,PGA巡迴賽內容撰寫速度提升10倍
AgentCore支援包含LangGraph、LlamaIndex,甚至OpenAI Agents SDK等多種框架。實際案例方面,PGA巡迴賽 (PGA TOUR)利用AgentCore構建了多代理內容生成系統,將內容撰寫速度提升了10倍,成本降低95%。
而MongoDB則在8週內就佈署代理應用程式,大幅縮短了過去需耗時數月的基礎設施工作。瑞士電信 (Swisscom)也透過AgentCore建立標準化代理構建流程,在4週內即可推出面向消費者的銷售與支援解決方案。
另一方面,亞馬遜創辦人Jeff Bezos創立的太空技術公司藍色起源 (Blue Origin),在面對複雜的太空技術發展、火箭發射任務等情況下,背後也藉由AWS技術資源建立名為「BlueGPT」的 生成式AI系統,並且透過各類AI代理協助處理各類工作事項。










