AI大模型洞察系列之一：百度文心一言，繁花未開冬已至

新經(jīng)濟IPOIPO君2024-01-18 12:15 數(shù)字產(chǎn)業(yè)

2023年，對國產(chǎn)大模型而言，是一個激情澎湃，充滿壯志豪言，但唯獨缺乏現(xiàn)象級產(chǎn)品誕生的年頭；在海外ChatGPT為代表的大模型不斷進化的推動下，國產(chǎn)大模型匆匆沖入了2024年，也就是所謂的“大模型應(yīng)用落地元年”。

在這場代表更高生產(chǎn)力的技術(shù)革命浪潮中，國產(chǎn)大模型將扮演什么角色？從百度到三六零，從科大訊飛到后起之秀百川智能，從字節(jié)跳動的“豆包”到阿里巴巴的“通義千問”，誰會成為最先進技術(shù)與應(yīng)用的破壁者或涅槃?wù)?，誰又是在技術(shù)與資本的喧囂中“趕時髦”的泡沫？

百度大模型成色不足

第一個接受考驗的當(dāng)然是國產(chǎn)大模型排頭兵“文心一言”。

沒人懷疑百度對AI的熱情。早在2016年，李彥宏就曾公開宣布ALL IN AI，并由此吸引了大佬陸奇2017年初加盟；但僅僅一年后（2018年5月），陸奇便掛冠而去；而幾乎就在同時，在地球的另一側(cè)，OpenAI研發(fā)小組靜悄悄地發(fā)布了GPT-1的初始模型。

那時候，李彥宏尚沒意識到，百度錯過了成為AI先驅(qū)的歷史機遇。等到2022年末，ChatGPT爆火出圈后，李彥宏突然回過神，再次掉頭撿起ALL IN AI戰(zhàn)略。

問題是，在戰(zhàn)略問題上搖擺不定的百度，這一次是真的ALL IN大模型還是說說而已？

具體到產(chǎn)品層面，從2023年初緊急推出“文心一言”，到目前已進化至4.0版本，盡管百度聲稱“文心4.0版本綜合水平與GPT相比毫不遜色”，但是否能夠媲美GPT仍然存疑，就連李彥宏自己也承認(rèn)，文心一言也許永遠(yuǎn)也追不上ChatGPT。

讓百度更為膽寒的是，元旦后GPT應(yīng)用商店正式上線，不僅將重塑AI服務(wù)與應(yīng)用格局，也會拉開Agent浪潮的帷幕，有極大概率會誕生李彥宏口中的“殺手級應(yīng)用”。

李彥宏曾多次表示，進入AI時代的標(biāo)志是產(chǎn)生很多的AI原生應(yīng)用，而不是很多的大模型。他質(zhì)疑國內(nèi)大模型太多了，AI原生應(yīng)用卻非常少，國外則正好相反，“僅有幾十個基礎(chǔ)大模型，AI原生應(yīng)用已經(jīng)上千個”，這令人“焦慮且慌張”。

顯然，“文心一言”希望成為能夠誕生“殺手級應(yīng)用”的那個底座，但OpenAI憑借其用戶創(chuàng)建的超300萬個GPTs構(gòu)建了初步的Agent生態(tài)，率先完成了從模型提供商向平臺的轉(zhuǎn)變。而百度大模型，則面臨著繁花未開冬已至的境況。

盡管不斷有國內(nèi)機構(gòu)測評稱，文心一言已超越GPT-4（附加詞“中文語境”），但認(rèn)真講，文心一言遠(yuǎn)未完成從追隨者向引領(lǐng)者的角色轉(zhuǎn)變。

作為首批通過官方“大模型標(biāo)準(zhǔn)符合性測試”的文心一言4.0去年剛上線時，文生圖曾鬧出很多笑話，一度被質(zhì)疑“套殼”國外大模型。不過，在過去一年的快速迭代下，文心一言還是有了一些進步。

例如，去年文心一言畫“胸有成竹的男人”、“起重機”時都曾鬧過笑話。用戶要求畫起重機時，文心一言直接畫了一幅仙鶴圖；用戶要求畫 “土耳其”，文心一言卻畫成了“火雞”。這些錯誤讓很多人質(zhì)疑文心一言文生圖涉嫌套殼國外英文大模型，因為起重機在英文里對應(yīng)的是CRANE，后者也有仙鶴的意思；土耳其和火雞的英文都是turkey。文心一言在作畫時顯然是先把中文指令轉(zhuǎn)化成英文，然后再生成圖像，極可能調(diào)用了國外的英文大模型。

新經(jīng)濟IPO今年元旦后對文心一言圖像生成能力再次進行測試，發(fā)現(xiàn)這次無論是“胸有成竹的男人”還是“起重機”，文心一言已不再犯去年的錯誤。

2023年和2024年初文心一言文生圖實測結(jié)果對比。

此外，新經(jīng)濟IPO基于理解、生成、邏輯、記憶四個維度對文心一言各方面能力進行了測評。

記者分別輸入“畫一袋雞精、畫一個驢肉火燒、畫一張?zhí)撇Ⅻc秋香、夫妻肺片”等關(guān)鍵詞，發(fā)現(xiàn)給出的答案依然一言難盡，魚香肉絲、夫妻肺片等圖像勉強過關(guān)，但“一袋雞精”、“大頭娃娃菜”的畫像有的很詭異，有的看上去不倫不類。

2024年1月初，文心一言文生圖實測結(jié)果。

當(dāng)然，過去這一年，文心一言的跨模態(tài)理解與生成能力的確有了較大提升，并形成了初步的情感分析能力，可以識別文本中的情感傾向和情感表達(dá)，并能夠生成具有情感色彩的繪圖。

此外，文心一言還擁有了更豐富的知識庫，并能夠根據(jù)用戶的問題進行常規(guī)性的回答和解釋。但在邏輯能力上，文心一言依然無法令人滿意。如詢問“秋冬穿搭街拍”，文心一言并沒有生成圖片，而是輸出了一大堆文字；但輸入“春夏穿搭街拍”，生成的就是風(fēng)格迥異的圖片。

這說明，在相同屬性的關(guān)鍵詞下，文心一言的邏輯導(dǎo)向并不一致，仍然有待于優(yōu)化提高。

2024年1月初，文心一言實測結(jié)果。

當(dāng)記者詢問“明天去深圳，應(yīng)該穿什么衣服”時，文心一言并沒有主動搜集天氣信息（不具備互聯(lián)網(wǎng)查詢能力），而是給出了以下模糊信息。從答案看，文心一言在語言理解能力及精準(zhǔn)回復(fù)上還存在較大缺陷，和ChatGPT的語義理解及解答能力相比，文心一言落后的遠(yuǎn)不止李彥宏所說的“兩個月”。

2024年1月初，文心一言實測結(jié)果。

去年11月，百度開始面向C端收費，在國內(nèi)算是第一家，很多應(yīng)用如百度文庫也都基于C端進行了重構(gòu)。但從評測結(jié)果看，文心一言4.0的C端收費用戶數(shù)量可能并不理想。如果文心一言被大量付費用戶高頻使用，擁有自我學(xué)習(xí)能力的大模型會在海量用戶數(shù)據(jù)基礎(chǔ)上，快速彌補之前的缺陷。Chatgpt之所以迭代越來越快，越來越精準(zhǔn)，最重要的原因就是全球數(shù)十億用戶在不斷向其提供免費訓(xùn)練數(shù)據(jù)。

而文心一言在產(chǎn)品尚未成熟時就急匆匆收費，反而阻礙了其獲取更為寶貴的用戶使用數(shù)據(jù)，可以說“因小失大”；李彥宏對文心一言快速商業(yè)化賺錢的急切心態(tài)，可能也會讓文心一言與國外競爭對手的差距越來越大。李彥宏對Office365推出的30美元/月的Copilot套餐羨慕不已，但他忽略了一個至關(guān)重要的細(xì)節(jié)：2019年以來，微軟向OpenAI投資了110億美元。反觀百度和李彥宏在文心一言上又投了多少呢？OpenAI推出大模型花費了數(shù)年時間，但百度文心一言推出不到一年就宣稱趕超ChatGPT，可信度有多少？

對于中文大模型，目前業(yè)內(nèi)有一些比較權(quán)威的評測標(biāo)準(zhǔn)，如SuperCLUE、C-Eval、MMLU等。有業(yè)內(nèi)人士曾從基礎(chǔ)知識、信息搜集能力、總結(jié)歸納能力、創(chuàng)作能力四個方面對包括ChatGPT 4、通義千問、文心一言、豆包、百川等十幾個大模型進行評測，結(jié)果文心一言敗給ChatGPT 4，在全部測評模型中也僅排中上水平。

當(dāng)然這一比較不代表最終結(jié)果，實際上這些也都不重要。核心問題在于，在大模型發(fā)展方向上，百度在目前為止更像是一個追隨者，距離真正的創(chuàng)新還有較遠(yuǎn)的距離？

應(yīng)用生態(tài)落后于人

談到大模型時，李彥宏喜歡強調(diào)“文心大模型一家的API調(diào)用量，比其他200多家大模型的調(diào)用量加起來還要多”，它們即使“上了這個榜單、進了那個排名”，也是在浪費社會資源。

然而，百度大模型未來面臨的最大競爭是海外競爭對手在應(yīng)用層面的降維打擊，這是繼搜索引擎時代后的又一次“全球性”競爭，它并將直接決定百度這些傳統(tǒng)互聯(lián)網(wǎng)巨頭的生死存亡。

在這場競爭中，AI應(yīng)用生態(tài)將成為互聯(lián)網(wǎng)巨頭的爭奪焦點。

李彥宏曾多次提及，“因為大模型本身并不直接產(chǎn)生價值，基于基礎(chǔ)大模型開發(fā)出來的AI原生應(yīng)用才是模型存在的意義”。AI原生應(yīng)用有三個特點：第一，能用自然語言交互；第二，能充分利用理解、生成、推理、記憶等；第三，每個應(yīng)用的交互都不超過兩級菜單。第三個特點，其實就是 Agent的典型技術(shù)特性——能夠跨應(yīng)用程序完成任務(wù)。作為一個AI“新主體”，Agent不僅可以獨立完成工作，也可以去尋找其他 Agent合作，組成新的工作流程，共同完成復(fù)雜工作。

釘釘總裁葉軍曾把這一技術(shù)特性解釋為“一鍵拉起所有AI應(yīng)用”。

百度目前的軟肋在于，文心一言尚停留在寫報告、做計劃、文生圖等文本處理層面，這只是AIGC的第一階段，在這個層面，全球大模型第一梯隊的各家實力差距都不大。

真正拉開差距的是第二階段，譬如圖生文、文生視頻；以及第三階段—大一統(tǒng)模態(tài)（人工智能體），即用一個模型鏈接一切，能夠自由地串聯(lián)表達(dá)。

需要指出的是，雖然目前GPTs還不是完全自動的智能體,但它已經(jīng)向人們展示了一個AI智能體可以觸及的未來—有能力串聯(lián)起任何產(chǎn)品與服務(wù)，因此GPTs被認(rèn)為最有希望引領(lǐng)下一波AI浪潮。

國內(nèi)類似的產(chǎn)品包括釘釘最近發(fā)布的“AI超級助理”以及百度的“文心大模型智能體平臺”。后者于去年9月上線，目前能查到的公開資料顯示，截至2023年12月18日，超2000個智能體上線。而去年11月官宣的GPT商店，由用戶創(chuàng)建的“定制”ChatGPT已經(jīng)超過300萬個。兩者完全不在一個數(shù)量級上。

百度大模型生態(tài)與海外巨頭差距懸殊，背后原因很多，但過于“實用主義”、營銷思維過重?zé)o疑阻礙了百度技術(shù)生態(tài)的成長。

在百度多位AI技術(shù)主管的公開演講或受訪中，付費率、成本、投放效率成為關(guān)鍵詞，幫助某某集團實現(xiàn)轉(zhuǎn)化量提升多少，ROI提升多少的案例也不鮮見，聽上去受訪者不是技術(shù)主管，而是營銷總監(jiān)。

這或許是百度廣告基因決定的，但沿著舊地圖，如何能找到新大陸？更為關(guān)鍵的是，去年12月Pika的出現(xiàn)，代表AIGC邁入了第二階段。在Pika的官方宣傳片中，僅憑一句話，就生成了動畫版的馬斯克，不但神形兼?zhèn)?，背景和動作都合理連貫，面部一致性也驚人得完美。

隨著大模型從單一文本邁向多模態(tài)，視頻就像之前文字、圖像生成一樣，成為大模型身上長出來的一項功能，一旦成為生產(chǎn)力，AI應(yīng)用落地的商業(yè)化困境便迎刃而解。為此，谷歌、阿里、字節(jié)、騰訊都競相下場，多模態(tài)也將成為大模型的標(biāo)配。

更令人激動的是，第二階段的到來，意味著第三階段的Agent也觸手可及，在這場“超級入口”之爭的關(guān)鍵節(jié)點上，百度似乎又沒跟上創(chuàng)新的步伐。

新入口之爭

Agent將是最佳AI應(yīng)用入口已然成為業(yè)界共識，但為何是“超級入口”呢？

在傳統(tǒng)互聯(lián)網(wǎng)時代，搜索引擎幾乎是唯一的壟斷性入口。到了移動互聯(lián)網(wǎng)時代，蘋果借助“iOS+App Store”，重新定義了入口形式，人機交互不再通過搜索引擎進行，取而代之的是以微信、抖音、Uber為代表的眾多獨立App載體，對應(yīng)著如新聞、社交、辦公、網(wǎng)購等不同的內(nèi)容。

在大模型時代，取代它們的則是AI原生應(yīng)用—Agent，并且一個終端可能只需要一個就夠了，因為Agent可以連接一切。

自然語言會成為Agent的使用界面，Agent調(diào)出功能后會攔截SaaS界面，包括很多其他APP也會被攔截掉，只保留交互層，所以Agent才會被稱為“超級入口”。

“新入口之爭”早已展開。Open AI大張旗鼓地公布GPTs，姍姍來遲的Google將Gemini Nano塞進手機，蘋果開發(fā)新版Siri引入Ajax，阿里布局AI助理試圖連接B端所有生態(tài)；為了“新入口”，華為、小米、vivo、OPPO相續(xù)發(fā)布了“端側(cè)大模型”，甚至騰訊開發(fā)的Agent已經(jīng)可以模仿人類在手機上操作APP。

曾經(jīng)錯過移動互聯(lián)網(wǎng)時代的百度似乎還沉浸在昔日的信息流廣告邏輯中，文心一言APP迄今也沒有給出現(xiàn)象級的迭代更新。、

多年來，百度一直在尋找除搜索以外的第二增長曲線，從汽車到電商到直播到教育到外賣，但至今沒有一款產(chǎn)品能扛起大旗，簡直成了“魔咒”。百度也曾試圖追趕自動駕駛的風(fēng)口，但始終沒找到突破點。這一次，百度能乘上大模型的東風(fēng)嗎？從目前的發(fā)展看，前景并不樂觀。

百度打贏應(yīng)用之戰(zhàn)、建設(shè)AI生態(tài)的前提是，“文心一言”自身要足夠強大、足夠創(chuàng)新，而不是亦步亦趨，隨人起舞。只有這樣，才有機會在大模型淘汰賽中贏得一線生機。

本文為派財經(jīng)原創(chuàng)，網(wǎng)頁轉(zhuǎn)載須在文首注明來源派財經(jīng)及作者名字。微信轉(zhuǎn)載可發(fā)郵件至paicaijing314@126.com聯(lián)系授權(quán)，并在文首注明來源派財經(jīng)（微信公眾號ID：paicj314）及作者名字。如不遵守，派財經(jīng)將向其追究法律責(zé)任。免責(zé)聲明：本網(wǎng)站所有文章僅作為資訊傳播使用，既不代表任何觀點導(dǎo)向，也不構(gòu)成任何投資建議。