行業(yè)主要上市公司:百川智能 ( A04400.SH ) 、昆侖萬(wàn)維 ( 300418.SZ ) 、拓維信息 ( 002261.SZ ) 、浪潮信息 ( 000977.SZ ) 、科大訊飛 ( 002230.SZ ) 等
本文核心數(shù)據(jù):中國(guó)大模型產(chǎn)業(yè)鏈 ; 中國(guó)代表性大模型產(chǎn)品商業(yè)化進(jìn)程 ; 大模型市場(chǎng)規(guī)模及測(cè)算 ; 大模型市場(chǎng)規(guī)模預(yù)測(cè)等
行業(yè)概況
1、定義
大模型是指包含超大規(guī)模參數(shù) ( 通常在十億個(gè)以上 ) 的神經(jīng)網(wǎng)絡(luò)模型。神經(jīng)網(wǎng)絡(luò)模型則是指基于神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)構(gòu)成的數(shù)學(xué)模型,它受到人腦神經(jīng)系統(tǒng)結(jié)構(gòu)的啟發(fā),由人工神經(jīng)元 ( 節(jié)點(diǎn) ) 和它們之間的連接組成。這些連接具有權(quán)重,可以通過(guò)學(xué)習(xí)過(guò)程進(jìn)行調(diào)整,從而使得神經(jīng)網(wǎng)絡(luò)能夠?qū)W習(xí)和適應(yīng)輸入數(shù)據(jù)的模式。
2、大模型特征
大模型以其龐大的參數(shù)規(guī)模 ( 通常超過(guò)十億 ) ,能學(xué)習(xí)和存儲(chǔ)豐富的數(shù)據(jù)模式和復(fù)雜特征,因此在處理大規(guī)模、復(fù)雜數(shù)據(jù)集上展現(xiàn)優(yōu)異性能。它們?cè)谟?xùn)練過(guò)程中同時(shí)學(xué)習(xí)多種 NLP 任務(wù),如機(jī)器翻譯和問(wèn)答系統(tǒng),從而獲得廣泛而泛化的語(yǔ)言理解能力。此外,大模型的強(qiáng)大計(jì)算能力依賴于高端硬件配置 ( 數(shù)百至數(shù)千個(gè) GPU ) ,以及通過(guò)海量數(shù)據(jù)訓(xùn)練確保運(yùn)算的效率和準(zhǔn)確性。
3、產(chǎn)業(yè)鏈剖析
大模型產(chǎn)業(yè)鏈?zhǔn)且粋€(gè)龐大而復(fù)雜的系統(tǒng),涵蓋了從硬件設(shè)施到軟件開發(fā)的各個(gè)環(huán)節(jié),主要包括基礎(chǔ)層、模型層和應(yīng)用層。其中,基礎(chǔ)層主要包括硬件和基礎(chǔ)軟件,模型層主要是通用大模型具體包括單模態(tài)大模型和多模態(tài)大模型,應(yīng)用層則是指大模型結(jié)合行業(yè)的進(jìn)一步升級(jí)應(yīng)用形成的行業(yè)大模型,主要包括生產(chǎn)制造領(lǐng)域、生活消費(fèi)領(lǐng)域和公共服務(wù)領(lǐng)域等。
中國(guó)大模型產(chǎn)業(yè)鏈上游基礎(chǔ)層硬件環(huán)節(jié)參與者有英特爾、英偉達(dá)等,基礎(chǔ)軟件環(huán)節(jié)參與者有華為、騰訊、紫光燈 ; 中游模型層參與者有 OpenAI、阿里、華為、Meta 和 Google 等 ; 下游應(yīng)用層參與企業(yè)有用友網(wǎng)絡(luò)、京東、阿里巴巴、金山辦公和科大訊飛等。
行業(yè)發(fā)展歷程:行業(yè)發(fā)展突飛猛進(jìn)
中國(guó)大模型發(fā)展經(jīng)歷了三個(gè)主要階段。初期探索階段 ( 2000 年代初至 2010 年代初 ) 主要集中在基礎(chǔ) AI 理論和小規(guī)模應(yīng)用的研究,缺乏大規(guī)模數(shù)據(jù)和高性能計(jì)算資源。隨著 2012 年深度學(xué)習(xí)的興起,進(jìn)入了快速發(fā)展階段 ( 2010 年代初至 2020 年初 ) ,期間國(guó)內(nèi)大企業(yè)如阿里巴巴、百度、騰訊和華為開始大力投資 AI 技術(shù),推動(dòng)了大模型技術(shù)的發(fā)展和應(yīng)用。到了成熟與應(yīng)用階段 ( 2020 年初至今 ) ,中國(guó)在自然語(yǔ)言處理和計(jì)算機(jī)視覺(jué)等領(lǐng)域的大模型技術(shù)已達(dá)到國(guó)際先進(jìn)水平,模型廣泛應(yīng)用于商業(yè)、醫(yī)療、法律等多個(gè)行業(yè)。展望未來(lái),預(yù)計(jì)中國(guó)將進(jìn)一步加強(qiáng)跨模態(tài)、多任務(wù)學(xué)習(xí)的應(yīng)用,提升模型的透明度和安全性,鞏固其在全球 AI 競(jìng)爭(zhēng)中的地位。
行業(yè)政策背景:從技術(shù)端給予支持
我國(guó)大力支持大模型的發(fā)展,當(dāng)前,我國(guó)針對(duì)性發(fā)布有關(guān)大模型發(fā)展的政策數(shù)量相對(duì)較少,且主要集中在 2023 年發(fā)布,更多是從人工智能技術(shù)以及算力設(shè)備等角度支持行業(yè)發(fā)展。具體如下表所示:
行業(yè)發(fā)展現(xiàn)狀
1、大模型商業(yè)化探索進(jìn)程
當(dāng)前,中國(guó)的大模型在商業(yè)化進(jìn)程中表現(xiàn)出顯著的活力和創(chuàng)新。百度的文心一言在智能辦公、旅行服務(wù)、電商直播、政務(wù)服務(wù)和金融服務(wù)等多個(gè)領(lǐng)域?qū)崿F(xiàn)應(yīng)用,技術(shù)迭代迅速,用戶規(guī)模龐大 ; 訊飛星火在智能辦公上優(yōu)勢(shì)明顯,2024 年 4 月,公司推出了業(yè)界性能最優(yōu)的 130 億參數(shù)的大模型,在效果損失僅 3% 以內(nèi)的情況下,輸出效率、語(yǔ)義理解準(zhǔn)確率等均得到提升,在訊飛星火大模型的飛速發(fā)展下,訊飛自有的硬件產(chǎn)品也受到消費(fèi)市場(chǎng)的關(guān)注,搭載訊飛星火的訊飛智能辦公本、訊飛聽(tīng)見(jiàn)、訊飛智能錄音筆以及訊飛 AI 學(xué)習(xí)機(jī)等銷量不斷攀升 ; 阿里巴巴的通義千問(wèn)以其開源策略和高性能,在中文大模型領(lǐng)域占據(jù)一席之地,推動(dòng)了低成本、易于部署的商業(yè)化解決方案。整體來(lái)看,中國(guó)的大模型市場(chǎng)正通過(guò)技術(shù)創(chuàng)新、行業(yè)合作和安全合規(guī)等多維度努力,加速推動(dòng) AI 技術(shù)的商業(yè)化落地和產(chǎn)業(yè)智能化轉(zhuǎn)型。
2、大模型領(lǐng)域投融資火熱
根據(jù) IT 桔子數(shù)據(jù),2021-2024 年我國(guó)大模型行業(yè)投融資金額規(guī)模及事件數(shù)量逐年增長(zhǎng)。2023 年我國(guó)大模型行業(yè)共發(fā)生 31 起投資事件,投資金額合計(jì)達(dá) 54.84 億元。2024 年截至 8 月 19 日,我國(guó)大模型行業(yè)已發(fā)生投融資事件 40 起,共計(jì) 147.56 億元。
從融資輪次分布來(lái)看,我國(guó)大模型行業(yè)融資事件主要集中在早期 A+ 輪及以前。
3、大模型應(yīng)用領(lǐng)域廣泛
從應(yīng)用領(lǐng)域滲透率情況來(lái)看,截至 2023 年,金融、政府、影視游戲和教育領(lǐng)域是大模型滲透率最高的四大行業(yè),滲透率均超過(guò) 50%。電信、電子商務(wù)和建筑領(lǐng)域的應(yīng)用成熟度較高。
4、大模型市場(chǎng)規(guī)模測(cè)算
自 2022 年末起,ChatGPT 以其突破性技術(shù)在全球舞臺(tái)掀起了一場(chǎng)人工智能的革命。隨之而來(lái)的,是無(wú)數(shù)大型預(yù)訓(xùn)練模型 ( Large Pre-trained Models, LPTMs ) 的涌現(xiàn),它們?nèi)缤喝绽锏闹窆S般迅速生長(zhǎng),遍布學(xué)術(shù)界與工業(yè)界。這些模型的誕生標(biāo)志著生成式人工智能技術(shù)的蓬勃發(fā)展,開啟了一場(chǎng)被稱為 " 大模型之爭(zhēng) " 的新時(shí)代序幕。截至 2024 年 4 月底,國(guó)內(nèi)共推出了約 305 個(gè)大模型,其中 10 億參數(shù)規(guī)模以上的大模型數(shù)量達(dá)到了 254 家。
根據(jù)我國(guó)工信部數(shù)據(jù),2023 年全年我國(guó)語(yǔ)言大模型市場(chǎng)規(guī)模實(shí)現(xiàn)較快提升,應(yīng)用場(chǎng)景不斷豐富,增長(zhǎng)率突破 100%,初步統(tǒng)計(jì) 2024 年超過(guò) 200 億元規(guī)模。
注:2024 年數(shù)據(jù)為初步測(cè)算,屆時(shí)以官方發(fā)布為準(zhǔn)。
行業(yè)競(jìng)爭(zhēng)格局:參與者眾多,競(jìng)爭(zhēng)激烈
現(xiàn)階段,我國(guó)大模型可以分為四大競(jìng)爭(zhēng)派系,分別為互聯(lián)網(wǎng)公司、AI 公司、學(xué)術(shù)及科研機(jī)構(gòu)以及行業(yè)專家團(tuán)隊(duì)初創(chuàng)公司,其中,互聯(lián)網(wǎng)公司主要是百度、阿里、騰訊、華為等互聯(lián)網(wǎng)大廠,核心競(jìng)爭(zhēng)優(yōu)勢(shì)是匯集了大量高端人才,同時(shí),平臺(tái)技術(shù)發(fā)展相對(duì)全面、快速。AI 公司主要是瀾舟科技、昆侖萬(wàn)維、商湯科技等以 AI 研發(fā)及利用為主的科技公司,其核心優(yōu)勢(shì)是主業(yè)專精于人工智能,相比互聯(lián)網(wǎng)公司,技術(shù)優(yōu)勢(shì)更加明顯。學(xué)術(shù)、科研機(jī)構(gòu)包括清華、北大、復(fù)旦、中科院等國(guó)內(nèi)一流高校以及智源研究院、IDEA 研究院等科研機(jī)構(gòu),主要優(yōu)勢(shì)是學(xué)術(shù)氛圍濃厚,通常行業(yè)第一手技術(shù)發(fā)源于此。行業(yè)專家品牌則是以一些 AI 專家?guī)ьI(lǐng)的團(tuán)隊(duì)所研發(fā)出的產(chǎn)品為核心,通常,一個(gè)團(tuán)隊(duì)在短期內(nèi)主攻一款產(chǎn)品,相比其他競(jìng)爭(zhēng)派系,AI 專家團(tuán)隊(duì)研發(fā)的產(chǎn)品在創(chuàng)新、突破方面做得更好,C 端反饋好評(píng)度較高,盈利目的性就目前來(lái)看,略弱于互聯(lián)網(wǎng)公司產(chǎn)品。
從大模型行業(yè)頭部企業(yè)的專利申請(qǐng)數(shù)量排名來(lái)看,百度是國(guó)內(nèi) AI 大模型行業(yè)專利生申請(qǐng)數(shù)量最多的企業(yè),截止 2023 年 9 月百度申請(qǐng) AI 大模型相關(guān)專利數(shù)量達(dá) 808 件,高于排名第二的騰訊 230 件。
行業(yè)發(fā)展前景及趨勢(shì)預(yù)測(cè)
1、大模型市場(chǎng)規(guī)模預(yù)測(cè)
語(yǔ)言大模型能夠模仿人類的對(duì)話和決策能力,是率先實(shí)現(xiàn)技術(shù)突破和應(yīng)用落地的大模型,也是當(dāng)下人工智能的 " 主賽道 "。目前,語(yǔ)言大模型在金融、醫(yī)療、教育、工業(yè)、游戲、法律等多個(gè)行業(yè)得到了廣泛的應(yīng)用。前瞻初步測(cè)算,到 2030 年,我國(guó)大模型市場(chǎng)規(guī)模將超過(guò) 2200 億元,年復(fù)合增速在 40% 以上。
2、大模型發(fā)展趨勢(shì)分析
大模型技術(shù)發(fā)展仍具有巨大的挖掘潛力,且技術(shù)更新進(jìn)步速度快,行業(yè)技術(shù)能力上限尚未出現(xiàn)。從未來(lái)趨勢(shì)來(lái)看,具備強(qiáng)大預(yù)測(cè)能力的預(yù)測(cè)大模型、強(qiáng)大決策能力的決策大模型和能夠自主學(xué)習(xí)、實(shí)時(shí)交互的具身智能大模型最有可能成為繼自然語(yǔ)言大模型和多模態(tài)大模型后的下一個(gè)大模型行業(yè)風(fēng)口。
來(lái)源:前瞻網(wǎng)