虎扑评分区,老熟妇大胆性开放图,中文字幕精品av一区二区五区,波多野42部无码喷潮在线

迷茫中的大模型從業(yè)者:瘋狂的時代正在過去

創(chuàng)投圈
2024
12/05
21:50
分享
評論

 

這是中國互聯(lián)網(wǎng)歷史上人工成本最高的行業(yè):應屆生年薪收入即可高達百萬,入職碩士起步,多數(shù)崗位甚至僅限博士。

這也是中國互聯(lián)網(wǎng)歷史上人工成本最低的行業(yè):頭部公司開始沖擊十萬卡規(guī)模,這意味著數(shù)十億美元的算力投入。

這就是國產(chǎn)大模型創(chuàng)業(yè)公司的研發(fā)人員們正在面臨的終極困境,一方面他們非常重要,一方面他們又不那么重要。

在過去兩年時間里,大模型的熱浪正席卷整個科技圈。從業(yè)者們將其視為推開下一個 20 年科技行業(yè)大門的鑰匙,蘊含著無數(shù)機會,他們期待著在這里生長出下一個 BAT,并將技術(shù)真正變?yōu)樨敻弧?/p>

近日," 新浪蜂鳥 " 對話幾位正在或曾在國產(chǎn)大模型創(chuàng)業(yè)公司工作的員工,嘗試記錄下在這接近兩年時間里,這些彷徨、進擊者們身上正在發(fā)生的故事。

交流過程中,幾乎所有人都重復過這樣一句話," 大模型可能是中國科技公司未來十年內(nèi)遇到的最好機會。"

但每個人對這個機會的理解卻完全不同:

" 短時間內(nèi)看不到(盈利)機會,正在考慮換個賽道。"

" 還是大廠更穩(wěn)定,不如回流。"

" 干成這件事,能青史留名,失敗了也沒有壞處。"

三種不同的回答,或許就是中國大模型創(chuàng)業(yè)公司們能夠最終交出的答案,放棄、被收購以及,一夜成名。

被擠爆的郵箱

2023 年年初,已經(jīng)在某互聯(lián)網(wǎng)大廠里待了接近十年的金陽決定尋找新機會。

在屬下眼里,金陽是超級技術(shù) " 大牛 ",校招進入該公司后僅一年時間內(nèi)就連升三級,打破公司原有的升級 " 潛規(guī)則 ";隨后又獨立拉起一支小團隊,獨當一面,在幾次部門業(yè)務變動中巋然不動。

但在 2022 年年底,金陽卻感到了一絲寒意,他所在的事業(yè)部不斷裁員。

更重要的是,公司抽調(diào)部分技術(shù)人員專攻大模型,金陽做了調(diào)組申請,卻未被批準。

此時,由 ChatGPT 引發(fā)的人工智能風潮剛剛從大洋彼岸刮向國內(nèi),國產(chǎn)大模型行業(yè)忽然爆發(fā),占據(jù)舞臺中央的除了傳統(tǒng)大廠百度、阿里、騰訊、字節(jié)跳動外,諸多創(chuàng)業(yè)公司也開始進場。

這一階段在當時被媒體稱為 " 百模大戰(zhàn) ",不過金陽卻對作者表示,國內(nèi)能夠真正自主訓練基礎大模型的企業(yè)最多時也未超過 30 家," 在這 30 家里,能夠真正完成通用大模型開發(fā)的不足 10 家。"

投資人常兵則對作者表示,在 2022 年年底、2023 年年初美國和中國大模型公司呈現(xiàn)出百花齊放的共同特點,但經(jīng)過兩年優(yōu)勝劣汰,資源正在向頭部玩家不斷聚攏," 目前美國仍在持續(xù)開發(fā)通用大模型的僅剩下五家,OpenAI、Anthropic、Meta、谷歌以及馬斯克旗下的 xAI;中國方面以商湯、曠視、云從與依圖科技為代表的 AI 四小龍退場,取而代之的是以百川智能、零一萬物、智譜 AI、MiniMax、月之暗面與階躍星辰為代表的六家大模型獨角獸企業(yè)。"

內(nèi)部調(diào)崗失敗的 " 大牛 " 金陽很快被大模型創(chuàng)業(yè)公司們盯上,一夜之間他的郵箱里多了很多獵頭發(fā)來的郵件," 以前也有其他互聯(lián)網(wǎng)大廠或者創(chuàng)業(yè)公司發(fā)來邀請,但 2023 年初時這樣密集確實非常少見。"

離開還是留下?金陽很快就做出了決定," 公司還在持續(xù)優(yōu)化,未來難測,大模型才是未來幾年里最好的機會。"

和他一起離開的還有六個人,這也是去年上半年大模型創(chuàng)業(yè)公司搭建隊伍的基本模式,從大廠成建制的帶走相關(guān)開發(fā)團隊," 大模型開發(fā)需要極高的技術(shù)背景,至少在去年上半年,這批人才幾乎都在大廠。"

盡管目前大模型創(chuàng)業(yè)公司均已開始進行校招,但是從大廠接手成熟員工仍然是一個重要的招聘方式," 我手里還有幾個招聘名額,方向還是瞄準大廠,即插即用。"

不過金陽也坦承,現(xiàn)在在大廠挖人可能性逐漸降低,阿里、百度、騰訊、字節(jié)的大模型團隊都在 2022 年年底以及 2023 年上半年重新補簽了一遍競業(yè)協(xié)議。

無疾而終的兩連跳

2024 年年初,凌輝從一家大模型創(chuàng)業(yè)公司跳槽去了大模型六小虎其中一家," 原來那家融資太不順了,感覺可能要出問題。"

他的職業(yè)生涯開始于 2021 年,碩士畢業(yè)后順利進入某大廠實習并最終轉(zhuǎn)正,年薪為 40 萬。當時凌輝還覺得自己是一個幸運兒,因為彼時就業(yè)情況糟糕,大廠頻頻裁員且減少校招名額。

這份幸運感在大模型的狂風吹來后變成了悔意," 當時不應該因為焦慮就業(yè)而沒有繼續(xù)讀博。" 看到自己同門師弟在博士畢業(yè)后拿到接近 80 萬年薪時,凌輝覺得自己也應該換個環(huán)境。

和幾位師兄弟溝通后,凌輝敏銳的發(fā)現(xiàn),在春招以及秋招過程中,大廠往往采用 " 掐尖 " 模式進行招聘," 只有在相關(guān)專業(yè)前 5% 的應屆生才能得到機會,碩士基本上是最低門檻。" 凌輝將這種模式稱為," 只選貴的不選對的。"

大廠光環(huán)以及高工資的確讓大廠在搶奪大模型人才的爭奪戰(zhàn)中身位領先,如百度啟動的 "AIDU 計劃 "、騰訊青云計劃中的 "AI 大模型招聘單獨通道 "、字節(jié)旗下豆包大模型團隊設立的 "top seed" 種子計劃,即便是后起之秀美團也推出了 " 北斗計劃 "。

但對于凌輝這樣有一定技術(shù)經(jīng)驗但又不是頂尖人才的求職者來說,以六小虎為代表的創(chuàng)業(yè)公司或許更為適合," 創(chuàng)業(yè)公司更看重專業(yè)對口,最好有工作經(jīng)驗。"

一位同門師兄曾經(jīng)的經(jīng)歷是凌輝期許的目標,2011 年時這位師兄在一年時間里歷經(jīng)三家團購網(wǎng)站并最終被挖進阿里,年薪上漲四倍有余,目前是阿里某部門的 M4(總監(jiān))。

不過在常兵看來,大模型行業(yè)與中國歷史上幾乎所有的互聯(lián)網(wǎng)行業(yè)都不一樣," 中國互聯(lián)網(wǎng)公司喜歡燒錢挖人,因為行業(yè)最強烈的需求是人,多一個員工就多一個產(chǎn)出;而大模型行業(yè)的核心是在極少量頂尖人才與基礎算力投入,多一個人和少一個人的差別很小。"

據(jù)脈脈相關(guān)數(shù)據(jù)顯示,在 2023 年與 2024 年期間最為受大模型行業(yè)歡迎的人才依然是 NLP 算法工程、深度學習等底層技術(shù)人才,而中低層算法工程師跳槽時薪水幾乎不會有什么變化。

報告顯示在從事模型相關(guān)作后,僅有一半從業(yè)者實現(xiàn)漲薪,其中漲幅 50% 以上占僅為 16%。

值得關(guān)注的是,今年 10 月中旬字節(jié)跳動大模型訓練被實習生 " 投毒 " 事件讓行業(yè)選擇員工時多了一絲謹慎。

據(jù)作者了解,該事件發(fā)生在商業(yè)化團隊,因?qū)嵙暽锬衬硨F隊資源分配不滿,利用 HF 漏洞,通過共享模型注入破壞代碼,導致團隊模型訓練成果受損。

11 月底時,字節(jié)跳動起訴該實習生,訴訟請求為 800 萬侵權(quán)損失加合理支出 2 萬元。

經(jīng)歷此事件后,某大廠負責相關(guān)招聘的人員對作者表示,現(xiàn)在對于大模型相關(guān)的招聘其實已經(jīng)非常謹慎,盡管放出的崗位很多,但如果達不到要求," 寧可空著。"

凌輝最終選擇離開這個行業(yè),目前仍在尋找工作的他對大模型只有一個評價,"(目前)不是一個好機會。"

大廠小創(chuàng)新,小廠大創(chuàng)新

和金陽、凌輝一樣,夏明也來自某家互聯(lián)網(wǎng)大廠,在 2023 年上半年和自己的上級一起跳槽到了大模型六小虎中的一家," xx(原公司)升職通道已經(jīng)基本上關(guān)閉了,大模型才是中國互聯(lián)網(wǎng)公司難得的機會。"

但才加入新公司不久,夏明就感覺到了迷茫," 待遇的確得到提升,但實在太累了,幾乎每天都加班到 10 點甚至更晚。去年年底公司開始大小周,沒有任何人有反對意見。"

在作者與某六小虎公司一位負責招聘的人員對話中,該人員介紹,盡管公司融資情況良好、目前也有業(yè)務收入,但招人的過程依然 " 不順利 "," 在面試過程中,很多求職者依然對大模型的未來抱有疑慮;同時,一些員工也因為工作太累覺得看不到希望而流失。"

最終夏明回到了他原來工作的大廠,接替了原來領導離職時留下的位置," 安穩(wěn)、熟悉,每天大部分時間都用來應付內(nèi)部溝通,反而更自由。"

如同夏明做出同樣選擇的人并不罕見,今年下半年,序智科技創(chuàng)始人秦禹嘉、零一萬物模型預訓練負責人黃文灝先后加入字節(jié)跳動,而零一萬物的聯(lián)合創(chuàng)始人李先剛則被爆出已回到原公司貝殼。

而在海外,一些大模型創(chuàng)業(yè)公司人員也在回流大廠。今年 11 月底,谷歌大模型重要參與者 Yi Tay 在離職創(chuàng)業(yè)一年半后宣布回到谷歌。

值得關(guān)注的是,谷歌在此前還曾以 25 億美元的超高估值帶走了 AI 獨角獸 Character.AI 的核心技術(shù)團隊,其中包括兩位明星創(chuàng)始人 Noam Shazeer 和 Daniel De Freitas。

值得關(guān)注的是,在進入 2024 年后國內(nèi)互聯(lián)網(wǎng)大廠對大模型的態(tài)度變得沒有那么激進。常兵對作者表示," 現(xiàn)在大廠相對比較克制,更傾向于用投資進行資源置換確保不掉隊,自己投入大量資源的動力不足。

比如某大廠最近開放的大模型,核心內(nèi)容是將自己的獨家資源拿出來搜索,這件事的本質(zhì)是開放而不是大模型。"

" 大廠小創(chuàng)新,小廠大創(chuàng)新現(xiàn)在幾乎就是大模型圈里的共識。" 常兵如此對作者表示。

據(jù)作者不完全統(tǒng)計,在國產(chǎn)大模型六小虎中,阿里巴巴已投資了除面壁智能以外的其他五家,騰訊則投資了百川智能、MiniMax、智譜 AI、月之暗面,其中后兩家的投資名單中也有美團出現(xiàn)。

隨著騰訊、阿里多位大模型高管先后離職,目前在大廠中僅存字節(jié)跳動仍對大模型持有激進態(tài)度。脈脈數(shù)據(jù)顯示,2021 年以來,字節(jié)跳動連續(xù)第四年位居新發(fā)布 AI 崗位數(shù)量第,在多個大廠中對大模型人才的招聘指數(shù)最高。

今年開始,字節(jié)豆包的廣告在小紅書、B 站甚至百度上無處不在,夏明對作者介紹,豆包的日活應該已經(jīng)在 " 千萬級別 "," 這個投放量別說大模型六小虎,其他大廠也沒有一個能做到的。"

堅守者仍眾

除了回歸大廠,大模型行業(yè)仍在不斷流失人才。

今年 7 月,阿里大模型元老、通義千問奠基性人物楊紅霞從字節(jié)跳動離職,入職香港理工大學擔任電子計算機系教授;

同樣在下半年,月之暗面多位出海產(chǎn)品負責人離職創(chuàng)業(yè),而在年初時他們還失去了大模型產(chǎn)品負責人王冠;

MiniMax" 星野 " 產(chǎn)品負責人張前川在近日淡出公司一線管理事務,改任產(chǎn)品顧問;11 月下旬,騰訊杰出科學家、混元大模型技術(shù)負責人之一劉威正式從騰訊離職。

但更多的人仍在堅守,2017 年年中何方從某大廠離職,隨后一直活躍在人工智能行業(yè),在先后加入 AI 四小龍中的兩家后,2023 年年初時從某社交平臺跳槽至大模型六小虎中的一家并工作至今。

" 從來沒有這么忙過," 最近一個月何方幾乎每天都加班到 10 點以后," 大模型絕對是現(xiàn)在中國互聯(lián)網(wǎng)企業(yè)里最忙的,xxxx(大模型六小虎另外一家)前一段不知道為什么每天都能正常下班,但最近又恢復了每天加班的常態(tài)。"

脈脈數(shù)據(jù)顯示,超過 65% 的大模型從業(yè)者每周工作超過 50 小時,接近三分之一的從業(yè)者每周甚至工作超過 60 小時。

" 最大的問題是 ChatGPT5.0 還沒有公布,所以大家不知道下一個階段往哪里走,只能在原有的基礎上不斷深化。" 何方的觀點得到了常兵認可," 已經(jīng)有大模型創(chuàng)業(yè)公司開始進入自己擅長的行業(yè),但目前大模型創(chuàng)業(yè)公司還是以訓練通用大模型為主。"

好消息是,盡管大模型六小虎在過去一年里減少了部分員工,但幾乎都集中在運營部門,技術(shù)研發(fā)幾乎沒有人員流失。何方對作者表示," 大模型最燒錢的不是人力成本,而是訓練成本和算力投入。因為大家都還沒跑通模式,所以每家公司都還控制在幾百人這個規(guī)模。如果未來國內(nèi)大模型公司能有一個相對比較成熟的商業(yè)化模式或用戶模式,甚至還有可能繼續(xù)進行大規(guī)模招聘。"

堅守者們更關(guān)心的是行業(yè)的未來,何方所在的研發(fā)團隊經(jīng)常會在加班間隙一起討論三個問題," 能不能賣?賣給誰?怎么賣?"

沒有答案。

這樣的討論場景在此前的 AI 創(chuàng)業(yè)公司里較為罕見," 與 AI 四小龍時代不同,大模型創(chuàng)業(yè)公司在創(chuàng)業(yè)之初很早就開始考慮商業(yè)化以及國際化業(yè)務。" 常兵對作者介紹," 而這個行業(yè)的求職者最為關(guān)注的也不僅僅是大模型技術(shù)的發(fā)展以及公司融資情況,而是會考慮公司的大模型業(yè)務是否有落地場景。"

" 明年年中或許是個分水嶺,大模型或許是個很厲害的產(chǎn)品,但也可能會像人臉識別一樣變成一個通用技術(shù)。" 有過人臉識別從業(yè)經(jīng)驗的何方如此對作者表示。

一場猛烈的價格戰(zhàn)

今年年中,大模型行業(yè)猝然爆發(fā)了一場兇猛的價格戰(zhàn)。

5 月初,私募巨頭幻方量化旗下 AI 公司 DeepSeek 宣布開源第二代 MoE 大模型 DeepSeek-V2,百萬 tokens 只需 1 元;大模型六小虎之一的智譜 AI 隨后跟進,價格直接降至原來五分之一;價格戰(zhàn)的參與者還有幾乎所有大廠,字節(jié)跳動、阿里、百度、騰訊以及科大訊飛也紛紛降價。

這場價格戰(zhàn)被常兵評價為兩個字," 可笑 "," 互聯(lián)網(wǎng)行業(yè)價格戰(zhàn)基本出現(xiàn)在公司跑馬圈地階段,即在大家都很熟悉的領域,通過價格優(yōu)勢來打擊其他對手,獲得規(guī)模效應。但大模型現(xiàn)在根本談不上穩(wěn)定收入,價格戰(zhàn)毫無意義。"

在常兵看來,大模型公司發(fā)起價格戰(zhàn)核心原因無非兩點,為大廠其他業(yè)務求利潤或創(chuàng)業(yè)公司求用戶。

對于大廠來說,價格戰(zhàn)僅僅局限在 token 降價,下游企業(yè)在獲取大模型 API 后需要通過投喂數(shù)據(jù)、模型微調(diào)等方式進行優(yōu)化和部署,這部分成本沒有任何變化。以阿里旗下 Qwen-Turbo 大模型為例,百萬級別 token 僅需要 2 元,但繼續(xù)訓練則至少需要花費 30 元,具體部署時每月費用更是高達 2 萬。

百度云千帆大模型平臺也與之類似,盡管大模型 token 可以免費調(diào)用,但后期相關(guān)環(huán)節(jié)均需要單獨付費且價格不菲。

而在大廠發(fā)起大模型價格戰(zhàn)背后,云計算業(yè)務成為了實際獲利方。百川智能發(fā)布會上,創(chuàng)始人王小川表示,(價格戰(zhàn))根本目標不是為了賣大模型本身,而是帶動整套云服務銷售。獵豹移動董事長兼 CEO 傅盛也在朋友圈發(fā)文稱,這次價格戰(zhàn),降得最兇的都是有云服務的大公司,通過大模型來獲取云客戶,羊毛出在豬身上,降得起。

對于大模型創(chuàng)業(yè)公司來說,發(fā)起價格戰(zhàn)的根本目的也不是跑馬圈地,本質(zhì)上 " 是為了讓客戶體驗模型能力 ",常兵對作者表示,越多人用對大模型公司越有利," 首先是可以讓 B 端客戶體驗模型能力并在本地部署等高凈利業(yè)務完成付費,同時通過 C 端用戶的使用,對大模型進行進一步優(yōu)化。"

價格戰(zhàn)后,行業(yè)的競爭格局產(chǎn)生了細微變化。

下半年時,有消息稱有著大模型六小虎中已有兩家正在放棄預訓練模型,縮減預訓練算法團隊人數(shù),將業(yè)務重心轉(zhuǎn)向 AI 應用。

金陽和何方先后對作者證實了這一消息,金陽所在的大模型公司正是被外界傳聞中放棄預訓練的一家。不過金陽也對作者強調(diào),公司并未完全放棄預訓練模型,只是暫時更多嘗試 AI 應用," 說實話,誰也不知道未來會發(fā)生什么,所有的大模型公司都還在碰。"

這樣的回應并不讓人意外,所有通用大模型核心就是預訓練,是決定模型性能最關(guān)鍵的內(nèi)容,也是所有模型廠商最核心的技術(shù)壁壘。

金陽對作者表示,通用大模型研發(fā)很像九年義務制教育,必須要全面學習基礎知識,才能進入大學選專業(yè)乃至未來就業(yè)環(huán)節(jié)," 如果大模型公司放棄預訓練,轉(zhuǎn)向應用,就意味著在基礎知識還未夯實的情況下進入大學。"

To B or not to B

當通用大模型公司把手放在轉(zhuǎn)向燈的按鈕上準備按下時,心頭浮現(xiàn)的疑問是,轉(zhuǎn)型應用層后,無論 to B 還是 to C,公司還能像過去兩年一樣,持續(xù)獲得融資和人才嗎?

一個殘酷的事實是,大模型公司可能快撐不住了。

數(shù)據(jù)顯示,在過去 3 年時間里大約有 2.6 萬家大模型創(chuàng)業(yè)公司融資超過 3000 億美元;而在中國市場上,六小虎們的融資也是以數(shù)億美元進行計算。但隨著 AI 能力快速進化,訓練成本也呈指數(shù)性膨脹趨勢。

Anthropic 公司聯(lián)合創(chuàng)始人兼首席執(zhí)行官 Dario Amodei 在一場公開討論中透露,Claude 3 模型訓練費用已高達約 1 億美元;正處于研發(fā)階段并預計于 2024 年底或 2025 年初面世的新一代模型,其訓練成本更是逼近 10 億美元。

馬斯克曾估算,ChatGPT5.0 訓練可能需要 3 萬至 5 萬張 H100,僅芯片成本就超過 7 億美元,約等于一家獨角獸企業(yè)的一大半市值。

據(jù) Amodei 預測,到 2025 年或 2026 年,訓練最新大語言模型的成本將達到 50 億至 100 億美元。

僅極少數(shù)財力雄厚的大公司及其合作伙伴有能力構(gòu)建這些基礎模型。

這意味著大模型創(chuàng)業(yè)公司們需要繼續(xù)融資,或至少有一定程度的變現(xiàn)能力。

比如 To B?

在今年 7 月舉辦的一場大模型會議中,與會的大模型創(chuàng)業(yè)企業(yè)幾乎都未提及通用人工智能,而是紛紛討論如何落地。

但至少在最近一兩年,to B 并不是一個成熟的答案,金陽和何方均對作者表示,目前大模型只能在某些數(shù)字化已經(jīng)成熟的行業(yè)進行重點突破," 比如金融、醫(yī)療、互聯(lián)網(wǎng)以及能源,成規(guī)模復制到所有行業(yè)幾乎不可能。"

與美國同行完全不同,美國大模型公司可以輸出相對標準、單一的產(chǎn)品,因為各行業(yè)數(shù)字化程度較高,而在國內(nèi),大模型創(chuàng)業(yè)公司們往往需要面對各行各業(yè)的定制化需求以及數(shù)字化程度完全不一致的窘境。

更麻煩的是,隨著美國大模型企業(yè)不斷開源、國內(nèi)大廠不斷發(fā)動價格戰(zhàn),大模型創(chuàng)業(yè)公司通過 to B 賺錢的方式愈發(fā)艱難," 賣的越多,賠的越多。"

何方對作者表示," 公司現(xiàn)在上線一些業(yè)務,都是悄悄地不做宣傳,甚至 app 都沒有上線各大應用市場。"

那么,Not to B?

六小虎之一的 MiniMax 給出了不錯的答案,在海外市場。" 內(nèi)部開會溝通時顯示 MiniMax 已經(jīng)處于盈利狀態(tài)," 金陽對作者表示," 營收大部分來自聊天機器人社交應用 Talkie。" 根據(jù) MiniMax 公開表示,其計劃在今年實現(xiàn) 7000 萬美元即約 5 億元人民幣的營收。

這也是中國互聯(lián)網(wǎng)公司們的成熟路徑,以社交、支付等日常應用打造一個超級 App,即人工智能時代的微信、抖音或者支付寶。盡管金陽、夏明和何方均對此抱有期待,但是不太看好," 國內(nèi)在短時間內(nèi)不可能產(chǎn)生一個所謂的超級 app,國外用戶有良好的訂閱習慣,但國內(nèi)用戶更習慣免費。"

大模型的瘋狂似乎正在過去,也沒人能真正預測未來,好消息是,在這些仍在堅守的開發(fā)者眼中,國產(chǎn)大模型絕不會成為下一個無疾而終的元宇宙。

" 如果能把這件事做成了," 何方的眼里依然有光," 我們可能就會成為中國科技發(fā)展史上最值得紀念的一批人。"

來源:新浪蜂鳥

THE END
廣告、內(nèi)容合作請點擊這里 尋求合作
免責聲明:本文系轉(zhuǎn)載,版權(quán)歸原作者所有;旨在傳遞信息,不代表砍柴網(wǎng)的觀點和立場。

相關(guān)熱點

相關(guān)推薦

1
3