螞蟻王曉航:大模型落地金融產(chǎn)業(yè)是復(fù)雜的系統(tǒng)工程
螞蟻集團副總裁、螞蟻金融大模型負責人王曉航
11月11日,2023金融街論壇年會“金融科技創(chuàng)新與合規(guī)安全”平行論壇在北京舉辦,螞蟻集團副總裁、螞蟻金融大模型負責人王曉航在發(fā)表 “跨越大模型金融產(chǎn)業(yè)落地鴻溝” 主旨演講時表示,大模型對金融產(chǎn)業(yè)的價值顯著,但通用大模型無法開箱即用,需要彌補許多不足之處,并在可靠性方面進行全周期加固。
1 大模型價值日漸凸顯,將重塑金融產(chǎn)業(yè)全鏈條
王曉航表示,規(guī)模化的產(chǎn)業(yè)技術(shù)變革和價值兌現(xiàn)不會一蹴而就,必然經(jīng)歷階梯式的迭代向上過程。螞蟻作為普惠金融的踐行者,一直走在人工智能和金融結(jié)合的最前沿。
早在2013年,螞蟻推出了余額寶和小微金融等國民產(chǎn)品,為金融AI打開了巨大的價值空間。螞蟻首創(chuàng)的小微金融310模式,成功解決了小微長尾用戶的風(fēng)險識別問題,展現(xiàn)了金融AI的普惠價值。
隨著AI技術(shù)逐漸深入各類金融場景,金融科技在2017年開始出現(xiàn)平臺模式。以“螞蟻財富”、“螞蟻保”和“網(wǎng)商銀行”為代表的數(shù)字金融平臺以開放姿態(tài)連接機構(gòu),通過科技賦能實現(xiàn)更豐富的金融供給和更深入的產(chǎn)業(yè)鏈。在這一階段,AI場景全面爆發(fā),成為營銷、服務(wù)、投研、風(fēng)管和資管各領(lǐng)域降本增效的關(guān)鍵手段。
到了2023年,大模型在金融產(chǎn)業(yè)的落地過程中展現(xiàn)出巨大的潛在價值,并具備以下三個重要特征:(1)能力深度,大模型憑借出色的語言和認知能力,在各種金融場景任務(wù)中不斷刷新前沿技術(shù)水平,并在許多高階任務(wù)中達到甚至超過人類專家水平;(2)迭代速度,大模型統(tǒng)一的算法架構(gòu)降低了AI應(yīng)用的復(fù)雜性,大幅加快了迭代速度;(3)創(chuàng)新寬度,大模型的專業(yè)知識生產(chǎn)和推理能力遠遠越出了上一代深度學(xué)習(xí)AI的擅長領(lǐng)域,推動了各類應(yīng)用創(chuàng)新蓬勃出現(xiàn),顯著提升用戶體驗和生產(chǎn)效率。
綜上所述,大模型已經(jīng)展現(xiàn)出明確的產(chǎn)業(yè)價值:“金融服務(wù)鏈條上的每一個環(huán)節(jié),都值得用大模型重做一次”。
2 不存在開箱即用,大模型落地金融產(chǎn)業(yè)是復(fù)雜系統(tǒng)工程
2.1 大模型落地金融產(chǎn)業(yè)挑戰(zhàn)
金融領(lǐng)域具有高度專業(yè)性、復(fù)雜的決策和極致的合規(guī)和可靠性要求。盡管大模型在能力方面取得了顯著進步,但在金融行業(yè)中無法直接應(yīng)用,仍需克服領(lǐng)域知識、復(fù)雜決策和可靠性等三個方面的挑戰(zhàn)。
(1)首先,領(lǐng)域知識的短板。
通用大模型雖然能夠有效壓縮數(shù)萬億的世界知識,具備較強的通識能力,但金融通識相對薄弱,對金融原理的理解不夠深入,缺乏企業(yè)私域知識,并且無法實時更新和把握市場動態(tài)。例如,當用戶詢問“請推薦一只既能保本又能高收益的理財產(chǎn)品”時,大模型往往無法理解金融資產(chǎn)的“流動性、收益和風(fēng)險”之間的不可能三角關(guān)系,也難以正確引導(dǎo)用戶。
(2)其次,復(fù)雜決策短板
通用大模型是個優(yōu)秀的文科生,理解、溝通、推理能力強大,但是在復(fù)雜的專業(yè)問題上差強人意,無法勝任量化分析、資源運籌優(yōu)化、精細化匹配這幾類問題。
(3)第三,可靠性不足
通用大模型除了眾所周知大模型幻覺與金融嚴謹性的沖突,也亟須有效識別金融業(yè)務(wù)常見的合規(guī)性陷阱,比如 用戶詢問“我怎么買這款信托產(chǎn)品”的背后,蘊藏了一個合格投資者判別問題。此外,大模型亦需要遵循金融企業(yè)的價值主張,如價值投資、風(fēng)險平衡、科學(xué)配置等。
2.2 認知邊界,跨越邊界
在當前可得技術(shù)約束中,為了金融場景落地大模型順利補齊上述短板,除了對通用大模型注入金融通識和私域知識,還需要以系統(tǒng)工程解決方案,通過有效的技術(shù)組合,跨越鴻溝。
(1)“大模型+小模型”協(xié)作
大模型在感知、認知和交互領(lǐng)域具有顯著優(yōu)勢。而各專業(yè)小模型專注于特定問題或任務(wù),在特定領(lǐng)域(運籌、量化、圖算法)表現(xiàn)更為專精。在實際應(yīng)用中,我們可以將大模型作為認知和交互的核心,而小模型則負責專業(yè)判斷和決策。通過大模型向小模型的任務(wù)分發(fā),共同完成復(fù)雜的推理和決策工作。
(2)“大模型隱性知識+圖譜顯性知識”互補
大模型通識覆蓋廣,但不夠嚴謹可靠,容易出現(xiàn)幻覺和答非所問現(xiàn)象。相比之下,圖譜顯性知識專業(yè)性和可靠性強,但生產(chǎn)維護成本較高。鑒于金融領(lǐng)域的頭部問題是收斂的,應(yīng)用中可用圖譜覆蓋嚴謹性和價值雙高場景(比如主流保險產(chǎn)品的條款,核保核賠知識),大模型覆蓋低頻和長尾場景,以實現(xiàn)服務(wù)質(zhì)量與服務(wù)成本的平衡。
(3)“Open QA+Closed QA”結(jié)合
需要嚴謹答案的很多問題,可以轉(zhuǎn)化為“檢索增強”問題:系統(tǒng)接到用戶問題,檢索返回專業(yè)內(nèi)容,大模型基于檢索結(jié)果生成問題答案(Closed QA)。這就像讓大模型從專業(yè)書籍尋找答案,適用于財經(jīng)問答、客服和投教問答等場景。而基于大規(guī)模的參數(shù)知識進行問答,能夠回答開放性問題(Open QA),適用于需要理解和推理的復(fù)雜問題。
2.2滿足可靠性,還需要全周期強化
大模型落地金融產(chǎn)業(yè)的主要挑戰(zhàn)是可靠性,涉及內(nèi)容安全性、金融合規(guī)、科技倫理和金融價值觀等領(lǐng)域。雖然上述技術(shù)組合可以有效彌補大模型的不足,但在消費級金融應(yīng)用方面仍有待提高。螞蟻在為數(shù)千萬消費者提供服務(wù)的過程中,積累了豐富的安全和合規(guī)技術(shù),并基于此構(gòu)建了一套全生命周期的可靠性加固技術(shù),以確保大模型的訓(xùn)練和推理過程的可靠性。
(1)離線訓(xùn)練階段
數(shù)據(jù)治理是關(guān)鍵,需要“高大正”( 高質(zhì)量、大規(guī)模、價值觀正確)的數(shù)據(jù)。螞蟻通過模型和人工結(jié)合方式,從近2千億token中篩選出171億token優(yōu)質(zhì)金融語料,在源頭上保障大模型的學(xué)習(xí)質(zhì)量和價值取向。
價值對齊亦至為關(guān)鍵,螞蟻建立了多達60萬以上的合規(guī)和價值對齊指令集,并配備了300多人的安全運營和標注團隊參與對齊工作。
(2)線上推理階段
螞蟻為金融大模型設(shè)立了專用安全圍欄:在請求和生成兩端都進行嚴密的風(fēng)險判別和攔截,這個系統(tǒng)稱為蟻鑒,由數(shù)百個識別模型和數(shù)十萬判別規(guī)則組成。
檢索增強、圖譜增強:涉及到合規(guī)性、專業(yè)性要求高的內(nèi)容,螞蟻金融大模型會優(yōu)先Closed-QA,從可靠內(nèi)容檢索尋找答案。
(3)持續(xù)攻防演練
螞蟻通過模型和人工結(jié)合方式,建立了數(shù)百萬負向樣本,在模型上線前后,持續(xù)自動化攻擊金融大模型可能的可靠性薄弱點,檢測安全能力。
經(jīng)過上述加固,螞蟻金融大模型在可靠性各維度達到99%及以上的可靠性,媲美人工專家,具備了對消費者開放的可靠性要求。
3 螞蟻金融大模型實踐
王曉航在演講中強調(diào)人工智能是螞蟻金融科技的核心,并介紹了螞蟻金融大模型的實踐。
3.1螞蟻1+2技術(shù)布局
螞蟻自主開發(fā)了全棧技術(shù)體系,用于訓(xùn)練金融大模型,并成功打造了代表性的AI原生應(yīng)用 —— “支小寶”智能顧問(2C)和“支小助”智能業(yè)務(wù)助手(2B)。
金融大模型:擁有千億量級的金融通識知識、60萬+金融專屬指令集和320+金融專業(yè)工具;基于萬卡規(guī)模的異構(gòu)算力,在金融“認知、生成、知識、決策、安全”維度優(yōu)勢明顯。
支小寶:基于金融大模型,已經(jīng)服務(wù)了超過4000萬用戶。它在金融領(lǐng)域能夠提供個性化的理財和保險服務(wù),用戶意圖識別準確率達到95%。支小寶關(guān)聯(lián)著千萬級別的金融知識圖譜,具備媲美專家的市場研判和熱點解讀的能力。
支小助:作為金融服務(wù)鏈條上的智能業(yè)務(wù)助手,支小助顯著提高了金融顧問、投研、理賠、營銷和風(fēng)控等專家的專業(yè)水平和服務(wù)效率。其中,“支小助顧問版”已經(jīng)幫助理財顧問和保險代理人擴大了70%的服務(wù)半徑;“支小助投研版”助力金融分析師每天能夠提取超過100+篇研報的信息,將市場事件解讀的效率從每周10篇提升到每日超過400篇;“支小助理賠版”實現(xiàn)了醫(yī)療險理賠的全流程自動化,并創(chuàng)造了便捷的“秒賠”理賠體驗。
3.2 開源金融Agent框架
為了更好地服務(wù)行業(yè)生態(tài),助推行業(yè)智能化升級,螞蟻將開源金融大模型應(yīng)用開發(fā)框架—— 金融大模型智能體(Agent)框架。該框架的核心優(yōu)勢在于充分利用螞蟻金融大模型卓越的語言、金融認知和推理能力,提供了豐富的金融知識和專業(yè)工具,及知識增強和工具增強套件。并融入螞蟻對金融大模型落地實踐的經(jīng)驗,通過金融大模型智能體框架,金融企業(yè)能夠更高效構(gòu)建金融智能服務(wù)系統(tǒng),提升用戶提升和生產(chǎn)效率。
猜你喜歡
已有銀行應(yīng)用DeepSeek,業(yè)界:或?qū)⒖s小中小行與大行大模型研發(fā)差距
對哪家銀行的吐槽最能引起你的共鳴?是否和你的體感一致?奇富科技金融AI大模型成果落地,超5500萬小微企業(yè)享受數(shù)字化信貸服務(wù)
奇富科技發(fā)布了AI產(chǎn)品“小奇”,這款產(chǎn)品,是基于大模型技術(shù)的 AI 伴侶可全天候服務(wù),深度理解并預(yù)測用戶的金融需求。中關(guān)村科金喻友平:平臺+應(yīng)用+服務(wù)的“三級引擎戰(zhàn)略”是企業(yè)大模型落地最佳路徑
中關(guān)村科金總裁喻友平正式發(fā)布中關(guān)村科金大模型時代的“三級引擎戰(zhàn)略”,并重磅推出得助大模型平臺 2.0,以及一系列深耕場景的大模型應(yīng)用。螞蟻數(shù)科SOFAStack發(fā)布大模型服務(wù)平臺,助力技術(shù)通用走向行業(yè)可用
螞蟻數(shù)科旗下多云PaaS平臺SOFAStack正式發(fā)布大模型服務(wù)平臺AI Max。