隨著人工智能技術進入規模化應用新階段,智能體(AI Agent)作為具備自主感知、決策與執行能力的核心載體,正通過終端設備創新與技術架構升級加速落地。近日,豆包手機(豆包手機助手技術預覽版)的推出,推動具備自主操作能力的AI Agent從技術原型走向先導應用;智譜AI開源AutoGLM1,為開發者低成本復現個性化AI手機助手提供底層技術支撐,進一步激活產業創新生態。然而,行業發展仍面臨基礎模型自主決策精度不足、企業定制化開發成本高企、跨場景數據安全與隱私保護風險凸顯等多重現實挑戰。上期介紹了智能體的基本情況、技術架構以及行業發展現狀,本期將聚焦智能體未來演進趨勢,深度剖析核心瓶頸問題,提出針對性對策建議,為搶占智能體產業發展制高點、推動產業高質量發展提供決策參考。
一、智能體發展趨勢
(一)大模型驅動智能體閉環能力構建與架構演進,邁向群體智能與具身執行
大模型作為智能體的核心思考引擎,其性能優劣直接決定了智能體在復雜任務中的表現水平,預計兩方面能力突破將為智能體能力躍遷提供重要支撐。一是關鍵能力閉環構建,通過任務分解規劃、工具調用及強化學習自主決策,提升“從頭到尾”辦理復雜事項的能力。二是技術架構向多智能體系統演進,通過角色分工協作實現“單體智能”到“群體智能”升級,從“單打獨斗”變成“團隊協作”;同時,端到端大模型與世界模型融合推動具身智能突破,使智能體具備物理世界任務執行能力,如操控設備、處理實物等。
(二)通信協議引領工具調用標準化,重塑決策執行鏈路
智能體要完成復雜任務,離不開調用各種軟件、服務(即“工具”),而“標準化通信協議”就像智能體和工具之間的“通用語言”,讓它們能高效配合。其中,Anthropic推出的MCP2因兼容性強、靈活性高形成先發優勢,成為沿用度最高的協議,受到OpenAI、阿里云等相繼支持以及Cursor、Winsurf等平臺的接連接入。此外,谷歌推出的A2A協議3助力多智能體通信協作,一定程度上與MCP形成“互補”。
(三)行業專用智能體進化為“專業伙伴”,深度嵌入場景業務
智能體正加速擺脫通用化工具屬性,以垂直領域需求為錨點深度嵌入行業場景,從功能輔助者進化為懂業務、能協同、善解決復雜問題的“專業伙伴”。如,智譜AutoGLM?2.0可跨接40余個高頻APP,47秒完成餐飲預訂,效率為人工的5倍;金融行業則依托智能體實現合同審查、投資分析等專業任務的自動化升級,某頭部券商應用后將投研報告生成時間從3天壓縮至4小時。
(四)大廠基于底座模型優勢引領智能體生態,小廠依靠產品創新加速搶占“先發紅利”
國外大型科技公司如Open AI、Anthropic和谷歌正通過構建開放平臺搶占市場先機。國內阿里云等也提出Agent Store相關概念,打造類似APP應用商城的“智能體商城”,提供更高效的AI基礎設施、降低開發門檻,加速智能體在各個領域的落地。相比之下,行業應用型中小型企業等則聚焦于專用智能體的開發,依托產品創新和場景優化,加速搶占細分市場的“先發紅利”。如迪安診斷“微生物檢驗智能體”針對微生物檢驗領域實現了自主理解任務意圖、調用多源數據等功能。
二、現存問題
(一)基礎能力短板掣肘智能體應用突破
當前業界大模型幻覺率較高,領域知識儲備有待提升,多模態融合能力不足,長期記憶機制存在缺陷,致使能力建于其上的智能體難以處理長期規劃、多步驟推理的復雜任務,還需依賴預設提示詞與固定工具路徑(如Manus)。此外,在新知識掌握、內核編程及任務持續執行能力、開放性專業場景的泛化能力上處于薄弱地位。
(二)數據隱私安全與標準化問題凸顯
智能體執行任務時頻繁調用外部數據,存在采集隱私、數據泄露風險,且尚未形成成熟有效的信息安全保護機制。同時,國內智能體開發工具依賴國外且標準化滯后,數據格式與傳輸協議等技術標準體系缺失導致互通性不足。開發環境不成熟拖慢技術更新,主流APP為了保住自己的流量和地位,不愿開放API接口,限制了智能體的功能拓展(如豆包手機助手就面臨超級App的“高墻”)。
(三)商業化落地閉環仍待探索
一方面,國內用戶對智能體的付費意愿普遍較低,企業只能靠免費策略培育市場;B端用戶主要依賴API調用付費,但相關協議不完善,無法形成“技術-應用-數據”的良性閉環,行業盈利難。另一方面,不同于關注通用能力的大語言模型,智能體則需要與場景深度適配,定制化需求強,導致開發成本居高不下。此外,很多智能體只是單點應用(比如只負責預訂或查詢),沒能覆蓋全業務流程,難以體現核心價值,進一步降低了客戶付費動力。
(四)評估體系與測試機制滯后
當前智能體行業缺乏統一、科學的評估標準,形成了“效能黑箱”,即企業不知道該怎么選合適的智能體,使用之后也無法量化實際價值,后續優化方向也難提出,陷入“選型難、驗收難、迭代難”的困境。同時,部分測試機制存在漏洞,其中“無行動得分”現象尤為突出(智能體僅執行與指令任務無關的行動,也能在測試中得分),一定程度上影響了智能體能力評測的公平性。
三、下一步工作建議
一是加大核心技術攻關,突破智能體發展瓶頸。夯實基礎模型的支撐能力,突破感知算法、推理引擎等關鍵技術,為智能體開發提供精準感知、快速決策的輕量支撐。鼓勵以場景智能化為導向開展聯合攻關,支持企業與科研機構圍繞高契合度場景開展以智能體為產出目標的聯合攻關,并設置技術與業務考核指標。支持多模態、多智能體系統研發,探索構建涵蓋視覺認知等能力的組件庫,推動知識蒸餾與經驗遷移,實現跨領域智能融合。
二是構建行業共性平臺,降低開發適配成本。推廣低代碼開發平臺,內置多領域通用模板,通過可視化拖拽組件實現快速配置。針對零售、制造、政務等垂直領域,推出輕量化行業解決方案,精準匹配中小微企業需求,簡化定制環節,僅保留核心功能模塊,降低企業決策風險與初始投入門檻。
三是統一定義與標準,推動行業規范化發展。推動建立智能體定義及技術架構指引,聯合高校院所與領軍企業從系統架構、最小功能集等方面提供技術指導和操作依據。主動布局搶占智能體協議話語權,鼓勵頭部企業聯合智庫、高校院所等成立智能體通信聯盟,加強協議及配套安全規范的制定。推動智能體評測和認證體系建設,構建涵蓋技術性能、場景適配的多維度評測體系,配套多模態評測數據集,打造全周期可信智能體生態。
四是培育產業生態,推動產業可持續發展。構建“價值量化+生態聯動”付費體系,通過效果可視化、按效果付費模式,聯動大平臺與SaaS廠商,搭配政府補貼及標準化協議,探索多樣付費路徑。對接政企轉型需求,以需求為牽引,依靠標桿案例、用戶教育、開放試點等手段,加速市場滲透、培育付費習慣。
注釋及參考文獻
注釋: 1 2024年10月,AutoGLM 發布了全球首個能自動操作手機的 Agent,被視為第一個具備Phone Use 能力的AI Agent 2 Model-Component Protocol,Anthropic推出的模型上下文協議 3 Agent-to-Agent Protocol
參考文獻:
[1] 《智能體技術和應用研究報告》,中國信通院人工智能研究所、華為技術有限公司,2025
[2] 《AI Agent Bible: The ultimate guide to agent disruption》,CB Insights,2025
[3] 《國家人工智能產業綜合標準化體系建設指南(征求意見稿)》,工信部,2024
[4] 《成果|大模型驅動的自主智能體與群體智能》,AIGC最前線,2024
[5] 《AI Agent發展現狀、行業結構與趨勢分析》,天翼智庫,2024
[6] 作者介紹
彭照康
中級經濟師、咨詢工程師(投資)
長期專注研究人工智能領域,深度參與北京市人工智能產業研究和政策規劃,參與完成《新一代信息技術領域發展態勢跟蹤》《智能算力中心組網成本研究》《人工智能對固定資產投資的影響》等多項咨詢工作。
李俊瑩
咨詢師
長期專注研究人工智能領域,深度參與北京市人工智能產業研究和政策規劃,參與完成《智算產業鏈發展研究》《大模型發展情況與形勢研究》《關稅政策對人工智能企業的影響》等多項咨詢工作。
編輯:張 華
審核:蘭國威