北京海淀跑出一個(gè)未來獨(dú)角獸。2025 年 2 月 19 日,AI 基礎(chǔ)設(shè)施服務(wù)商硅基流動(dòng)(SiliconFlow)宣布已于 2024 年底完成億元人民幣 Pre-A 輪融資。本輪融資由華創(chuàng)資本領(lǐng)投,普華資本跟投,老股東耀途資本繼續(xù)超額跟投。
01
硅基流動(dòng)成立于 2023 年 8 月,致力于打造大模型時(shí)代的 AI 基礎(chǔ)設(shè)施(AI Infra)平臺(tái),通過算法、系統(tǒng)與硬件的協(xié)同創(chuàng)新,降低 AI 應(yīng)用的開發(fā)和使用門檻。其核心產(chǎn)品包括:
1、SiliconCloud:一站式 AI 云計(jì)算平臺(tái),提供從模型訓(xùn)練、微調(diào)到推理部署的全鏈路服務(wù)。
2、SiliconLLM:高性能大語言模型推理引擎,支持主流大模型的高效部署。
3、OneDiff:開源 AI 編譯框架,自動(dòng)優(yōu)化 AI 模型性能,提升計(jì)算效率 25。
通俗地說,硅基流動(dòng)的業(yè)務(wù)是提供 "AI 模型的水電煤 ",幫助企業(yè)和開發(fā)者更高效、低成本地使用 AI 技術(shù)。 其用戶包括大型互聯(lián)網(wǎng)公司、AI 創(chuàng)業(yè)公司、傳統(tǒng)行業(yè)企業(yè)及研究機(jī)構(gòu),解決的核心問題是降低 AI 應(yīng)用的開發(fā)成本和部署門檻。
02
硅基流動(dòng)由袁進(jìn)輝博士于 2023 年 8 月創(chuàng)立。
袁進(jìn)輝是清華大學(xué)計(jì)算機(jī)系博士,曾在微軟亞洲研究院任職,是一位 " 技術(shù)派 " 創(chuàng)業(yè)者。他的創(chuàng)業(yè)起點(diǎn)可以追溯到 2017 年,當(dāng)時(shí)他創(chuàng)辦了一流科技,專注于深度學(xué)習(xí)算法框架 OneFlow。
2023 年 6 月,OneFlow 以 1 億美元估值被光年之外并購,袁進(jìn)輝作為聯(lián)創(chuàng)加入光年之外。兩個(gè)月后,光年之外被美團(tuán)收購,袁進(jìn)輝選擇再次創(chuàng)業(yè),成立硅基流動(dòng),專注于 AI 推理部署領(lǐng)域。
袁進(jìn)輝的初心是解決 AI 推理市場(chǎng)的效率問題。 他認(rèn)為,隨著大模型規(guī)模的擴(kuò)大,推理的計(jì)算需求和算力消耗遠(yuǎn)超訓(xùn)練,而推理市場(chǎng)的優(yōu)化潛力巨大。硅基流動(dòng)的使命是通過自研推理引擎,讓開發(fā)者實(shí)現(xiàn) "Token 自由 ",讓 AI 模型像水電一樣按需使用。
硅基流動(dòng)的大致發(fā)展節(jié)點(diǎn)如下:
2023 年 8 月,硅基流動(dòng)成立,專注于 AI 推理部署領(lǐng)域;2024 年 4 月,SiliconCloud 平臺(tái)上線,提供大模型 API 服務(wù),支持主流模型的訓(xùn)練、微調(diào)和部署;2024 年底完成億元人民幣 Pre-A 輪融資,引入美團(tuán)作為戰(zhàn)略股東;2025 年 2 月上線基于華為云昇騰云的滿血版 DeepSeek-R1 & V3 推理服務(wù),大幅提升國(guó)產(chǎn)芯片的推理效率。
DeepSeek-R1 上線后,讓硅基流動(dòng)的用戶激增,曾導(dǎo)致服務(wù)器癱瘓。目前,SiliconCloud 平臺(tái)總用戶數(shù)超 300 萬,日均調(diào)用上千億 Token。
03
硅基流動(dòng)的盈利模式之一是:API 調(diào)用收費(fèi)。平臺(tái)集成了模型訓(xùn)練、壓縮、部署全流程工具鏈,通過 API 調(diào)用量向開發(fā)者收費(fèi)。對(duì)中小客戶采用 " 階梯定價(jià) ",根據(jù)客戶的使用量劃分不同的價(jià)格區(qū)間,實(shí)現(xiàn)分層收費(fèi);
其次,平臺(tái)按 Token 收費(fèi)。在視頻生成、多模態(tài)交互等高階功能方面,按照使用的 Token 數(shù)量收費(fèi)。用戶使用的功能越復(fù)雜、處理的數(shù)據(jù)量越大,產(chǎn)生的 Token 越多,收費(fèi)越高。
再次,它還依靠彈性算力即服務(wù)賺錢:提供基于昇騰、寒武紀(jì)等國(guó)產(chǎn)芯片的彈性算力資源,支持按需付費(fèi)的靈活模式。
硅基流動(dòng)所在的行業(yè)是 :AI 基礎(chǔ)設(shè)施服務(wù) - 模型推理與加速服務(wù)。從行業(yè)發(fā)展階段來看,處于高速發(fā)展期與成長(zhǎng)期之間的過渡階段。
2016-2022 年,屬于該行業(yè)的 " 埋伏期 ",技術(shù)在不斷積累與驗(yàn)證。2020 年 OpenAI 發(fā)布 GPT-3,讓行業(yè)看到大模型的潛力和計(jì)算成本問題。這期間袁進(jìn)輝帶領(lǐng)團(tuán)隊(duì)推出過如大規(guī)模模型訓(xùn)練開源工具箱 Libai 等產(chǎn)品,做過面向領(lǐng)域的加速方案及 AI 開發(fā)平臺(tái) Onebrain 等,但商業(yè)化步伐緩慢。
2023-2024 年,行業(yè)快速發(fā)展。ChatGPT 橫空出世后," 百模大戰(zhàn) " 打響,硅基流動(dòng)成立。全球 AI 基礎(chǔ)設(shè)施市場(chǎng)規(guī)模龐大,預(yù)計(jì)到 2030 年將超過 1000 億美元(7171 億元)。中國(guó)作為全球最大的 AI 應(yīng)用市場(chǎng),年均增長(zhǎng)率約為 15%。
04
目前,市場(chǎng)形成了五層完整的服務(wù)體系,包括基礎(chǔ)模型 API(如 OpenAI)、專業(yè)推理服務(wù)商(如 Fireworks AI、DeepInfra)、AI 云服務(wù)提供商(如 Coreweave)、超大規(guī)模云服務(wù)商(如阿里云、百度智能云)以及 AI 硬件供應(yīng)商。
其中,硅基流動(dòng)(SiliconFlow)更傾向于專業(yè)推理服務(wù)商這一層。其競(jìng)爭(zhēng)對(duì)手包括潞晨科技、超云、Fireworks AI、DeepInfra、DeepInfra、并行科技等??傮w來說,雖然競(jìng)爭(zhēng)較為激烈,但并未形成絕對(duì)頭部,各家都有一定機(jī)會(huì)。
未來 1-3 年,該賽道的應(yīng)用場(chǎng)景將不斷拓展。
AI 在醫(yī)療、金融、教育、工業(yè)等各個(gè)行業(yè)的滲透將不斷加深,專業(yè)推理服務(wù)商將針對(duì)不同行業(yè)的特定需求,開發(fā)出更多定制化的推理解決方案,拓展市場(chǎng)空間。例如在醫(yī)療領(lǐng)域,提供醫(yī)學(xué)影像診斷、疾病預(yù)測(cè)等推理服務(wù);在金融領(lǐng)域,進(jìn)行風(fēng)險(xiǎn)評(píng)估、欺詐檢測(cè)等。
來源:鉛筆道