自Chat GPT火爆出圈后,“大模型”掀起了一波接一波的人工智能浪潮,吸引了眾多國家與企業的強烈關注,大家普遍認為大模型將驅動各行各業發生顛覆性影響。在汽車行業中大模型的應用也引發了熱烈討論,眾說紛紜。蓋斯特咨詢研究團隊對大模型做了系統研究,本研報在解析大模型本質的基礎上,研究其社會價值與影響,深入分析了大模型在汽車行業的應用潛力與落地挑戰,并為車企提供布局策略建議。
一、對大模型的本質解析
1.大模型的概念與本質
大模型是一種大規模預訓練AI模型。AI模型從2000年發展至今,歷經了機器學習、深度學習到預訓練模型的三個發展階段。當AI模型訓練的數據量、算法參數量、算力三者持續提升并達到臨界量級(如圖1所示),AI模型的生產力由量變到質變,展現出智能推理和內容生成的能力,由此誕生了大模型。
目前大模型尚無統一的定義。蓋斯特給出的大模型定義是:指具備龐大參數體量(參數量高達千億甚至萬億級),經過海量數據集的通用化訓練,涌現出在多任務下自學習、自推理、自生成能力的大規模預訓練AI模型。
圖1 AI核心要素的發展歷程
大模型與傳統AI模型已有了本質的區別。傳統AI模型不僅需要人工訓練AI怎樣做,還需要人對訓練樣本進行海量的標注,這樣AI模型才能完成特定類型的任務。而AI大模型具有很強的自學習能力,在無規則預設前提下具有低樣本甚至零樣本的推理能力,能夠根據需求直接完成任務;同時具有強泛化性,通常在無標注情況下,大模型可以高效學習訓練集中的通用規律和復雜特征,能夠更好應對自然語言任務;具有高通用性,通過自監督學習和巧妙訓練原生自然語言,從完成單任務拓展至多任務。
也就是說,與傳統AI模型相比,大模型具有強自學習性、強泛化性、高通用性三大核心特征,具備了智能理解、推理、生成的能力,從而推動人工智能從基于規則的“計算智能階段”加速向“認知智能階段”發展。大模型的出現大幅降低了人工在任務流程中的介入需求,開始打破原有人工與AI之間的平衡,將極大地加速AI產業化落地進程。
2.大模型的關鍵要素
大模型的關鍵要素包括數據、算法、算力與平臺,具體來看:
第一,數據是大模型訓練、迭代和優化的關鍵。數據主要來源于各類數據集、用戶數據等,其中人類自然語言信息是大模型的專屬數據特征。高質量數據是稀缺資源,更是在大模型競爭格局中獲勝的核心要素。
第二,算法是大模型的核心技術,決定大模型的能力范疇。算法包括基礎通用化模型算法與專業微調模型算法。目前算法掌握在大模型開發企業手中。
第三,算力是支撐大模型能力實現的基礎。大模型的龐大參數量與數據體量決定其算力需求遠超一般AI模型,所以大模型需要AI芯片(如高性能GPU)、云計算、服務器等企業提供算力支撐。
第四,平臺是連接大模型和應用端的紐帶,也成為新的關鍵要素。通過平臺可將大模型能力有效釋放于應用端,同時借助平臺來吸納數據,又能反哺大模型迭代和優化。平臺包括服務平臺、開發平臺、應用生態平臺和信息平臺等。
綜上所述,算力是大模型的基礎支撐,算法和數據共同驅動大模型持續提升,平臺的部署則是釋放大模型能力的有效途徑。
3.大模型應用所需的能力支撐
大模型落地應用的支撐能力主要來源于技術、資源、安全三個層面。
首先在技術層面,一是大模型的開發難度大,并非參數量大或利用海量數據訓練的模型就是大模型,大模型的關鍵在于其能否涌現出強大的推理和生成能力;二是多模態處理性能要求高,隨著應用場景越來越豐富,自然語言、語音、圖像、視頻等多類數據交織,大模型機器學習處理難度高;三是現有大模型輸出的內容極度不穩定,而且在出現錯誤后難以有效溯源,所以大模型在行為一致性與可解釋性均需有效提升。
其次在資源支撐層面,一是大模型對優質且海量的數據需求高,目前缺少供訓練的中文共性基礎庫,同時各行業內均存在數據壁壘,導致數據獲取難度大;二是算力和內存需求大,以GPT聊天機器人模型為例,僅其訓練的算力門檻便需一萬張高性能GPU芯片,成本約10億元,同時至少需350GB內存來訓練1750億參數;三是大模型對電力等能源消耗極大,且成本高。例如,GPT訓練的年綜合電力成本高達數十億元人民幣。
最后在安全治理層面,當前社會對于大模型落地應用的主要擔憂在數據安全、AI治理與監管效果方面。如果大模型的生成式內容能力被濫用,很可能違反社會價值觀,甚至突破法律底線。同時大模型對社會就業、產業發展、道德倫理的沖擊也會引發一系列的問題。
由此可見,大模型發展面臨的是全方位、多維度的問題,所以需要從技術支撐、基礎設施、社會治理制度等多方面不斷完善,來共同推動大模型的落地應用。
4.大模型的演進階段
大模型的發展路線可分為工程化、通用化、行業化和生態化四個演進階段,具體如圖2所示。當前大模型發展正從通用化向行業化階段轉變,即通用基礎大模型成熟期向垂直應用領域大模型成熟期的發展進程中。這個階段需要打通大模型功能與用戶連接之間的橋梁,以契合行業的特點。合理有效地發揮大模型的能力是目前面臨的關鍵問題。
當前通用大模型領域呈現出百花齊放、激烈競爭的場面。蓋斯特咨詢判斷,將來僅有少數寡頭企業可完全跑通大模型的演進路徑。隨著大模型行業競爭從比參數過渡到比落地應用,將出現越來越多的垂直領域大模型。這類行業大模型擅長特定的專業領域及核心的交互場景。相對來說,輕量化的行業模型及場景模型得益于更聚焦的數據訓練與更少的參數設置,不僅降低部署成本,同時用戶對此的感知程度也將日益加深,因此垂直應用領域大模型將迎來蓬勃發展時期。未來隨著大模型產業主體更加豐富、各模塊專業性提升、產業鏈完善、應用生態繁榮,大模型產業日趨完善的生態格局將有效賦能其實現更大的產業價值。
圖2 大模型演進趨勢
二、大模型的社會價值與應用潛力
1.大模型的社會價值
大模型的出現意味著人工只需指導AI,甚至用AI控制AI來完成任務,極大降低了人在人工智能任務中的參與程度需求,大模型將革命性地解放生產力;進而大模型將變革生產關系,引發社會全方位的資源調整,甚至資源再分配。因此大模型將驅動各行業發生顛覆性變革,并將變革社會方式。
具體而言,大模型將從開發生產、產品服務、企業經營、人才需求等方面驅動各行業變革。
第一,突破開發生產效率。大模型自身高效的數據處理、軟件開發、數據化自動化標注等能力可以解放低效生產力,提升開發生產的自動化程度,降低勞動力成本,實現大幅度的降本增效;
第二,創新產品服務形態。大模型強大的算法優化、數據挖掘、多模交互、內容生成、用戶情感識別等特點,可實現創意激發與體驗優化,同時讓人機交互更加智能;
第三,優化企業經營決策。大模型可提供數據分析、智能制造、智能銷售與服務、成本與決策優化等服務,助力企業做出全面、精準、靈活的判斷,使決策更科學、服務更精準;
第四,引發社會人才需求變化。大模型顯著降低對低效、低創造性人才的需求,對創造性的高價值人才需求將顯著增加,未來可靈活運用AI技能的人才將具備明顯優勢。
未來如何利用大模型有效賦能,形成更低成本及更高效率的開發生產模式、更智能更友好的產品形態、更高價值的用戶體驗,將成為產業智能化發展中的重要課題。
2.大模型產業應用的范式
大模型產業應用是以“通用預訓練+專業精調”的組合模式。如圖3所示,首先通用基礎大模型對海量的多模態知識開展預訓練,然后針對行業及業務場景進行適配化精調開發,形成垂直類場景模型,提供原子化服務。而平臺作為大模型能力與產品應用之間的連接和溝通工具,將場景模型層的原子能力與上層應用打通,為用戶輸出大模型服務。以Chat GPT為例,大語言模型作為基礎支撐,通過對自然語言的預訓練,結合人類對話場景進行微調,實現對話問答的原子能力,再通過服務平臺接口將對話功能引入到網頁、APP、汽車座艙等應用中,供用戶使用。
圖3 大模型產業應用范式
在此應用范式下,新的軟件應用不再需要從最底層開始重復開發,而是基于已有的基礎模型與場景模型便可實現高效的應用開發。因此大模型將重構各行業的軟件體系,不僅有效降低AI模型及軟件應用的開發門檻,提高軟件開發和硬件優化的效率,還將重塑企業經營管理模式,并拓展豐富其產業應用邊界與賦能形態。蓋斯特咨詢認為,未來各行業的所有軟件都可以用大模型重寫一遍,實現軟件價值效率的革命性提升,賦能各行業發展。
3.大模型在不同行業的應用前景預測
對于具體行業而言,其聯網程度、數字化基礎、行業內容特點等決定大模型的應用前景與價值。蓋斯特咨詢按照“影響程度”與“滲透速度”兩個維度,將大模型變革行業的前景分為四類(詳見圖4):
一是突破顛覆型:大模型可滲透到行業核心內容,能夠快速創造價值的行業,典型代表有互聯網、游戲、電商等行業;二是快速影響型:該類行業數字化范圍較大,但AI滲透行業核心內容的邏輯較難,例如汽車、營銷、通信行業;三是潛在發展型:該類行業數字化程度極低,大模型滲透速度慢、影響弱,例如農業、建筑、政務等;四是緩慢賦能型:行業本身數字化程度低,人工智能的潛在價值兌現較慢,例如教育、藝術業等。
圖4 大模型對各行業變革前景分析(注:圓圈大小代表潛在價值大?。?/span>
結合各行業的特點,目前大模型的典型應用案例已有不少。例如,最為廣泛的自然語言(NLP)大模型已被用于服務業中的智能客服、互聯網的搜索推薦、影視業的實時字幕、教育業的語義理解等;計算機視覺(CV)大模型可用于游戲的三維建模、制造業的智能監控、工業中的輔助質檢、醫療中的輔助診斷等;跨模態大模型可支撐多類型生成式人工智能(AIGC)應用,如汽車中的智能交互、營銷圖文物料、服務業中的內容生產等;決策類大模型分析、判斷與優化能力將用于汽車自動駕駛、金融投資研判、智能交通規劃、節能模型等。
三、大模型在汽車行業應用前景分析
1.大模型在汽車行業應用潛力
當前汽車行業已進入數字化與智能化發展階段,AI軟件逐漸成為新汽車時代的重要支撐技術。汽車產業具有主體多、涉及領域多、流程復雜的特點,正是大模型當前及未來應用的重要領域之一。
對于大模型在汽車行業的應用場景和應用價值,我們可從“用戶感知程度”和“AI軟件影響潛力”兩個維度來判斷分析。如圖5所示,應用場景可分為產品與技術、用戶服務運營、企業經營管理三大方面的6個細分領域。其中,產品及技術方面包括智能化體驗、技術研發創新、產品設計,大模型的應用價值將率先體現在智能化產品提升與技術研發創新上,這是行業當前重點關注領域;服務運營是用戶感知程度較強的領域,其中營銷、售后、城市出行等場景均可利用大模型進行賦能;在企業經營管理方面,大模型在生產制造智能化、企業數字化流程變革及組織形態創新等發揮作用,通過彌合數據流斷點、提升自動化程度、優化組織機制等實現企業經營的降本增效。
圖5 大模型在不同汽車領域的應用場景分析
由上可知,大模型可賦能汽車行業多個領域,其能力不僅契合汽車各關鍵領域的發展需求,還可助力解決當前面臨的諸多問題,具有強大的應用潛力。如果汽車企業有效利用了大模型賦能自身各個環節,以突破創新和提質增效,將在市場競爭中對其他同類企業形成降維打擊之勢。
2.大模型在汽車領域應用的挑戰
盡管大模型在汽車行業應用的潛力巨大,但是由于汽車產業非常復雜,同樣面臨著巨大的挑戰。一方面汽車行業的復雜性放大了大模型自有的發展難題,另一方面汽車行業的獨特性又給大模型帶來了新的應用挑戰。
具體來看,大模型在汽車領域應用的挑戰主要集中模型算法、數據及算力支撐三大方面,如圖6所示。
圖6 大模型在汽車行業應用的主要挑戰領域
第一,在算法層面,由于汽車場景多且復雜,包括靜態和動態、用戶和機器、車內和車外、圖片和視頻等等,眾多類型的海量數據交織,顯然僅靠單一模態模型處理無法完成,因此對大模型同時處理不同模態數據的算法能力提出挑戰;同時汽車關乎人類生命安全,車規級安全性要求大模型的算法必須具有高度的可靠性和一致性,另外還需具備可解釋性。而現有大模型生成的內容極度不穩定,若出現錯誤又難以有效溯源,無法滿足車輛需求。蓋斯特咨詢認為,相比于通用基礎大模型而言,汽車AI模型開發應聚焦在細分用車場景和數據輕量化,打造更符合汽車場景的的汽車AI中模型或小模型,或許能夠有效地應對上述問題。
第二,在數據層面,面臨著數據來源少、質量差和數據安全等問題。首先汽車行業缺少大體量、高質量的數據,一方面不同企業的數據具有天然隔閡,另一方面沒有統一的標準,數據難以流通和使用,因此需要構建汽車行業專屬的數據開放平臺,促進數據的流通和共享;其次,單一模態數據已經不能滿足多模算法的訓練需求,未來需要海量的多類型數據;最后,數據安全更是汽車行業需要關注的重要問題。傳感器數據、地圖等信息涉及國家機密,國家對其管控嚴格;用戶數據涉及隱私安全,此類數據確權、開放共享的合法性存在爭議,國家及行業需要進一步明確AI監管與治理規范。
第三,在算力層面,前文談到了大模型自身對算力、能源、成本等需求巨大,高端大算力GPU和電力將成為限制大模型發展的核心因素。若大模型應用到汽車上又有了新的挑戰。例如,GPT僅推理就需近3萬個GPU支持,日耗電量達50萬度。目前車端系統級芯片最高能提供2000 TOPS的算力,與大模型所需的萬級TOPS的算力需求相差甚遠,另外車端的電池也難以支撐大模型的運行能耗,因此大模型的算力應更多地部署到云端和邊緣端,即讓云端和邊緣端承擔大規模計算任務,同時芯片架構開發需考慮與大模型算法適配,以提升算力利用率。另外,車云信息傳輸需求必須是極低時延(車端是10毫秒級),所以網絡通訊能力也需要進一步提升。
由上可見,汽車行業應用大模型所面臨的問題是全方位、多維度的,需要跨主體、跨專業、跨領域的分工合作,以推動其持續應用與發展。需要注意的是,大模型在汽車行業有無應用潛力,與能否取得商業成功是兩回事。目前國內發布大模型的數量早已破百,其背后是大量資源的消耗,但是商業價值回報尚未真正體現出來。汽車企業也在積極參與大模型的發展。蓋斯特認為,如果車企一味地“卷”底層基礎模型則會造成巨大的資源浪費。企業只有以需求為驅動,打造適合汽車不同領域的垂類大模型,并利用大模型促進汽車產品及服務一體化發展才是長遠之計。
3.大模型在汽車應用階段劃分
蓋斯特咨詢預測,大模型在汽車行業的應用將呈現出循序漸進的節奏,前期快速上車、積累場景與數據,之后隨著技術持續演進,中后期將不斷拓展應用范圍,并放大大模型的價值。
如圖7所示,根據大模型賦能汽車各應用場景的滲透時間與應用難度,可將大模型應用劃分為三個階段:
第一階段產品體驗賦能,大模型在智能化產品應用上快速落地,提升汽車產品的用戶體驗;第二階段企業降本增效,隨著核心技術積累,大模型賦能企業經營全方面降本增效;第三階段社會效益創造,由于突破了技術迭代與應用落地的瓶頸,大模型覆蓋汽車行業的深度與廣度顯著提升,進而推動社會移動出行的發展。
圖7 大模型在汽車行業應用的不同階段
未完待續,請繼續關注《蓋斯特研報:大模型的本質及其對汽車行業的影響(下篇)》