通用 Agent(智能體)的火爆,仍在繼續(xù)。
引爆這一領(lǐng)域的明星初創(chuàng)公司 Manus AI,近期被曝出完成了新一輪 7500 萬(wàn)美元融資,估值在短短不到 2 個(gè)月內(nèi),飆升至 5 億美元。
被 Manus 打開(kāi)未來(lái)想象空間的通用 Agent 市場(chǎng),正在吸引一眾科技大廠的入局。最新加入進(jìn)來(lái)的是百度。
近日,百度對(duì)外推出了類(lèi)通用 Agent 產(chǎn)品 " 心響 "。百度之前,字節(jié)搶跑一眾國(guó)內(nèi)科技大廠,率先上線了自家的 Agent 產(chǎn)品 " 扣子空間 "。
相比傳統(tǒng) Agent 產(chǎn)品,通用 Agent 本質(zhì)區(qū)別在于其定位從 " 工具 " 向 " 伙伴 " 的角色轉(zhuǎn)變,能夠處理復(fù)雜、多步驟的任務(wù)場(chǎng)景。
背靠大廠已有的產(chǎn)品生態(tài),字節(jié)和百度共同盯上了同一目標(biāo),即借 AI Agent 尋找自家 AI 產(chǎn)品體系的新增長(zhǎng)點(diǎn):字節(jié)試圖將通用 Agent 概念嵌入工作流,尋找專(zhuān)業(yè)場(chǎng)景的落地應(yīng)用;百度則想要在普通消費(fèi)者中率先破局。
兩者都在嘗試打破各自?xún)?nèi)部的生態(tài)壁壘,構(gòu)建更廣泛的 AI Agent 生態(tài)體系,將通用 Agent 概念徹底打入用戶(hù)的心智。
然而,受限于大模型技術(shù)的成熟度,包括字節(jié)、百度在內(nèi)的所有參與者,都不得不在探索的路上,不斷地捫心自問(wèn):AI Agent 的真正應(yīng)用場(chǎng)景是什么?
一、追逐 AI Agent 的場(chǎng)景答案
在找尋差異化應(yīng)用場(chǎng)景的道路上,字節(jié)與百度在這一問(wèn)題上選擇了不同的路徑。
字節(jié)的扣子空間主要入口為網(wǎng)頁(yè)端,更易于接觸日常辦公場(chǎng)景下的軟件資源;百度的心響主要面向手機(jī)端,目前仍只支持安卓系統(tǒng),意圖將自身產(chǎn)品打入用戶(hù)的日常場(chǎng)景體驗(yàn)之中。
字節(jié)希望用 AI 深度嵌入工作流已成為業(yè)界共識(shí)??圩涌臻g " 和 Agent 一起開(kāi)始你的工作 " 這句宣傳語(yǔ)精準(zhǔn)地貫穿了產(chǎn)品邏輯。
扣子空間的最大目標(biāo):生產(chǎn)力全面提升。其 MCP 擴(kuò)展中,飛書(shū)云文檔、多維表格和電子表格尤為令人關(guān)注。如果能夠與飛書(shū)平臺(tái)進(jìn)行高度整合的話,打通生態(tài)間壁壘,扣子空間將會(huì)成為企業(yè)效率的 " 智能中樞 "。
我們讓扣子空間作為一位藝術(shù)類(lèi)型公眾號(hào)撰稿者,搜集日本藝術(shù)家的文字與圖片信息,制作成一份文字與藝術(shù)作品圖片交叉的稿件。
在實(shí)際測(cè)試中,它對(duì)提示詞的遵循能力優(yōu)異,能夠自動(dòng)檢索網(wǎng)頁(yè)、制作可視化報(bào)告,流程流暢幾乎沒(méi)有卡頓,給出了一份完整的、規(guī)規(guī)矩矩的文字報(bào)告以及作品時(shí)間軸。
字節(jié)希望把 Agent 當(dāng)作辦公過(guò)程中的 "AI 實(shí)習(xí)生 ",主動(dòng)幫助用戶(hù)處理文件檢索、表格制作、報(bào)告生成等任務(wù)。其背后的邏輯是:在企業(yè)私域內(nèi),聰明的 AI 輔助工具才更容易產(chǎn)生價(jià)值。
百度則選擇進(jìn)一步降低使用門(mén)檻,從更廣泛的普通 C 端用戶(hù)切入,其產(chǎn)品心響專(zhuān)為移動(dòng)端設(shè)計(jì),在實(shí)際測(cè)試中的產(chǎn)品邏輯有些不同:" 把難題留給心響,把時(shí)間留給生活。"
從功能模塊的設(shè)計(jì)來(lái)看,心響相對(duì)于字節(jié)的扣子空間一個(gè)最大的區(qū)別是 " 靈感廣場(chǎng) " 模塊。在該模塊內(nèi),百度的產(chǎn)品設(shè)計(jì)者集成了大量的任務(wù)模板:晚安故事集、AI 繪本、AI 相親等等。
不過(guò),百度的 C 端策略既聚焦于用戶(hù)習(xí)慣的培養(yǎng),也有在一定程度上限制了產(chǎn)品的想象空間的嫌疑。技術(shù)上來(lái)看,心響給了外界一個(gè)明顯的感受:主模型的指令遵循能力似乎并不如字節(jié)扣子空間那樣精準(zhǔn),它的思維更加發(fā)散。
相比于扣子空間迅捷的內(nèi)容生成速度,百度的心響在響應(yīng)速度上顯得相對(duì)緩慢的多,生成過(guò)程耗時(shí)更長(zhǎng)。
然而,與扣子空間嚴(yán)格遵循提示詞、輸出規(guī)整的報(bào)告不同,心響在生成結(jié)果時(shí)額外設(shè)計(jì)了交互元素和視覺(jué)優(yōu)化,在輸出中融入更多細(xì)節(jié)和附加價(jià)值。
這樣的產(chǎn)品邏輯,非常適配于日常場(chǎng)景,因?yàn)橛脩?hù)往往被認(rèn)為在與 AI 的交互中,提示詞工程的經(jīng)驗(yàn)較弱,甚至很多時(shí)候自己都不清楚自己想要的是什么。
二、大廠摸著 Manus 過(guò)河
盡管產(chǎn)品體驗(yàn)上仍有不完美之處,令字節(jié)、百度們爭(zhēng)搶推出相應(yīng) Agent 產(chǎn)品的一大原因,則離不開(kāi)其在商業(yè)變現(xiàn)上的天花板足夠高。
要知道,競(jìng)爭(zhēng)打到現(xiàn)在,無(wú)論國(guó)外的 OpenAI,還是國(guó)內(nèi)的字節(jié)、百度,其在大模型上都處于虧錢(qián)投入階段。如何尋找到足夠強(qiáng)的付費(fèi)變現(xiàn)模式,無(wú)疑是一眾大模型廠商的當(dāng)務(wù)之急。
Manus 成功拿下 7500 萬(wàn)美元融資的現(xiàn)身說(shuō)法,讓科技大廠看到了進(jìn)軍 Agent 領(lǐng)域的一絲曙光。最近 OpenAI 的一份預(yù)期收入報(bào)告,則讓這絲曙光變得更明亮了些。
據(jù) The Information 報(bào)道,OpenAI 預(yù)測(cè)至 2029 年,AI Agent 及其他新產(chǎn)品的銷(xiāo)售額將超越 ChatGPT,推高總營(yíng)收至 1250 億美元,2030 年總營(yíng)收有望達(dá)到 1740 億美元。Agent,正被視為繼對(duì)話式大模型產(chǎn)品之后的下一個(gè)大金礦。
而且,對(duì)于字節(jié)和百度這樣生態(tài)龐大的公司而言,在各自的生態(tài)體系下,借助需要外部 MCP 交互的 Agent,還可以達(dá)到盤(pán)活現(xiàn)有產(chǎn)品矩陣的效果。
但是,MCP 本身不足以實(shí)現(xiàn) " 世界的互通互聯(lián) "。其需要大模型在多模態(tài)(尤其是推理能力)以及成本價(jià)格方面,給予支持。這也反過(guò)來(lái)說(shuō)明,為什么是此時(shí)此刻,字節(jié)和百度才有能力推出 " 扣子空間 " 和 " 心響 "。
根據(jù) The Information 報(bào)道,Manus 僅僅在 Claude 大模型的調(diào)用上,兩周內(nèi)就燒掉了超過(guò)百萬(wàn)美元。AI Agent 的基礎(chǔ)工作流中的必要部分——多步推理涉及多次模型調(diào)用,處理復(fù)雜任務(wù)時(shí)需結(jié)合文本、圖像等多模態(tài)數(shù)據(jù),導(dǎo)致計(jì)算量激增,消耗大量 GPU 資源,說(shuō)得直白點(diǎn):AI 智能體需要強(qiáng)算力資源、高多模態(tài)能力、強(qiáng)推理能力、低成本價(jià)格。
進(jìn)入 2025 年,推理模型尤其是視覺(jué)推理領(lǐng)域的進(jìn)步,使得 Agent 在實(shí)際產(chǎn)品中的部署變得技術(shù)上可行且經(jīng)濟(jì)上可持續(xù)。字節(jié)與百度在多模態(tài)大模型領(lǐng)域的早期投入開(kāi)始有了回報(bào),AI Agent 的基礎(chǔ)產(chǎn)品形態(tài)有了現(xiàn)實(shí)支撐。
近期,百度發(fā)布了文心 4.5 Turbo 及 X1 Turbo,強(qiáng)調(diào)推理性能與成本優(yōu)化。代碼智能體文心快碼更是接入 MCP,李彥宏本人直接提出 " 創(chuàng)新的核心在于成本下降 "。
字節(jié)同樣在 4 月中旬更新了豆包 1.5 · 深度思考模型,同樣主打一個(gè)多模態(tài)和性?xún)r(jià)比。據(jù)晚點(diǎn) LatePost 報(bào)道,扣子空間對(duì)比了六款國(guó)內(nèi)大模型,最終還是選用了自家的豆包作為基座模型技術(shù)支撐,原因是后者推理成本較低,大規(guī)模調(diào)用可行性高。
三、大廠尋找新 " 增長(zhǎng)點(diǎn) " 旅途坎坷
AI Agent 概念雖然打得火熱,但其定義正被泛化、濫用。通用 Agent 的資本故事里每一個(gè)字都異常美妙,市場(chǎng)潛力巨大,其仍然面臨多重技術(shù)挑戰(zhàn),包括高任務(wù)失敗率、上下文理解不足、數(shù)據(jù)安全風(fēng)險(xiǎn)及潛在的偏見(jiàn)放大問(wèn)題。例如,無(wú)論是 Manus、還是字節(jié)的扣子空間、百度的心響,這些產(chǎn)品在復(fù)雜任務(wù)中的可靠性仍說(shuō)不上有多高。
從較短的時(shí)間尺度上來(lái)看,AI Agent 在復(fù)雜任務(wù)中的表現(xiàn)仍難以配得上 " 通用 " 二字。但如果將目光放得更長(zhǎng)遠(yuǎn),其作為大廠們 AI 產(chǎn)品體系的新增長(zhǎng)點(diǎn)的潛力無(wú)法被忽視。
沒(méi)有大廠愿意冒著落后的風(fēng)險(xiǎn),而不選擇跟進(jìn)。這一點(diǎn)深刻地體現(xiàn)在了字節(jié)、百度這樣的中國(guó)科技大廠身上。根據(jù)晚點(diǎn) LatePost 報(bào)道,Manus 出圈前后,字節(jié)就搞了至少 5 個(gè)團(tuán)隊(duì)在開(kāi)發(fā)不同 Agent 產(chǎn)品;百度的心響則由一群 95 后組成的團(tuán)隊(duì),在 30 天內(nèi)研發(fā)出來(lái)。
對(duì)大廠而言,技術(shù)優(yōu)化迭代是必由之路,挖掘差異化的應(yīng)用場(chǎng)景才是打開(kāi)這條路的起始。誰(shuí)能率先找到復(fù)雜用戶(hù)場(chǎng)景的解決方案,誰(shuí)就能從這塊蛋糕里分走一部分。
這也意味著,字節(jié)和百度絕不會(huì)是這條賽道里的唯二玩家。國(guó)內(nèi)方面,阿里和騰訊同樣虎視眈眈。國(guó)外,不光是率先確立了 A2A 協(xié)議的 Google,MCP 協(xié)議的 Anthropic,OpenAI 對(duì) Agent 也下了重注。一個(gè)月前,The Information 報(bào)道稱(chēng),OpenAI 已經(jīng)在與投資者商議了三類(lèi)未來(lái)的 Agent 產(chǎn)品的發(fā)布,價(jià)格從每月 2000 美元到 20000 美元不等。
可以想見(jiàn)的是,技術(shù)、資本、場(chǎng)景、標(biāo)準(zhǔn)正在 AI Agent 領(lǐng)域進(jìn)行混合博弈,對(duì)于大廠們而言,這不僅僅是燒錢(qián)的開(kāi)始,也是為產(chǎn)品體系找到全新商業(yè)引擎的起點(diǎn)。
來(lái)源:直面 AI