虎扑评分区,老熟妇大胆性开放图,中文字幕精品av一区二区五区,波多野42部无码喷潮在线

貝索斯領(lǐng)投、OpenAI 連續(xù)跟投,這家機器人公司再融 4 億美金

創(chuàng)投圈
2024
11/06
21:37
分享
評論

貝索斯又給一家 AI 創(chuàng)企 Physical Intelligence 投資了,一頓操作下來,使其估值狂飆至 24 億美元

值得一提的是,這波融資除了貝索斯外,還有風(fēng)險投資公司 Thrive Capital 和 Lux Capital 同時牽頭,OpenAI、Redpoint Ventures、Bond 紛紛跟投。

讓 Robot 疊衣服,一句話的事兒

這個讓一眾大佬紛紛看好的 Physical Intelligence,它的核心產(chǎn)品是一款名為 π 0 ( pi-zero ) 的軟件,這是一個通用的機器人基礎(chǔ)模型,旨在使用戶通過簡單的語言指令控制機器人,類似于與聊天助手互動的方式。

在上周發(fā)布的論文中,Physical Intelligence 還展示了 π 0 如何使機器人能夠折疊衣物、清理桌子、壓平盒子的技術(shù)分析等等。

其中,π 0 機器人控制模型集成了一系列高科技手段,使其能夠靈巧地完成復(fù)雜的任務(wù)。

這個模型首先利用視覺 - 語言模型來理解圖片和文字中的信息,然后通過一個特殊的動作輸出系統(tǒng),以很快的速度告訴機器人該如何動作。這種快速、連續(xù)的動作指令對于需要精細操作的任務(wù)非常關(guān)鍵,比如疊衣服或者裝箱子。

π 0 模型的訓(xùn)練分為兩個階段:預(yù)訓(xùn)練和后訓(xùn)練。

預(yù)訓(xùn)練階段,模型會學(xué)習(xí)大量的數(shù)據(jù),這樣它就能夠掌握廣泛的技能和適應(yīng)不同的場景。后訓(xùn)練階段,模型會針對特定的任務(wù)進行調(diào)整,以提高其在這些任務(wù)上的表現(xiàn)。

此外,π 0 還采用了一種叫做流匹配的技術(shù),這讓它能夠處理連續(xù)的動作,而不是單一的、離散的步驟。這種技術(shù)的應(yīng)用,加上模型的混合專家架構(gòu),使得 π 0 在預(yù)測動作時更加準確。

總的來說,這些技術(shù)的綜合應(yīng)用讓 π 0 在多種機器人平臺上都能夠展現(xiàn)出色的表現(xiàn),無論是在預(yù)訓(xùn)練后立即執(zhí)行任務(wù),還是經(jīng)過特定任務(wù)的微調(diào)后。

網(wǎng)友直呼:我一直相信 AI 機器人的能力,現(xiàn)在它能幫我洗衣服,我就更喜歡它了!

還有網(wǎng)友化身 " 賽博乞丐 ":給我來一個!

不過也有網(wǎng)友覺得演示中的內(nèi)容在特斯拉的機器人面前有點太小兒科了,不過馬上遭到反駁:人家只是初創(chuàng)公司!

而這也和 Physical Intelligence 的想法一致,聯(lián)合創(chuàng)始人 Sergey Levine 就曾經(jīng)表示:" 據(jù)我們所知,我們正在訓(xùn)練的數(shù)據(jù)量比有史以來制作的任何機器人模型都要大。"

但他還補充道:" 它無論如何都不是 ChatGPT,但也許它接近 GPT-1",表達他們的軟件更接近于 OpenAI 為聊天機器人發(fā)布的首個模型 GPT-1,而不是那些更先進的、為 ChatGPT 提供動力的大腦,暗示他們?nèi)蕴幱谠缙陂_發(fā)階段。

野心勃勃,要做機器人行業(yè)中的「OpenAI」

之所以 Physical Intelligence 能夠拿到這么大的融資,可能是因為它和 OpenAI 一樣,都是企圖從模型與數(shù)據(jù)層面顛覆此前的技術(shù)慣性,或許將 Physical Intelligence 的 π 0 與 OpenAI 的 ChatGPT 進行比較,可以更直觀地理解其創(chuàng)新和潛力。

首先,ChatGPT 的精準語義理解能力是其核心優(yōu)勢之一,對于 π 0 而言,這種能力同樣至關(guān)重要。

π 0 必須具備理解物理世界中的交互指令和上下文的能力,這包括但不限于視覺、語言和觸覺等多種感官輸入。

通過接受大規(guī)模互聯(lián)網(wǎng)視覺 - 語言預(yù)訓(xùn)練,并結(jié)合豐富的機器人操作數(shù)據(jù)集,π 0 能夠熟練地執(zhí)行一系列多樣化的任務(wù)。這不僅彰顯了 π 0 在解讀物理世界指令方面的卓越能力,也體現(xiàn)了其在多模態(tài)感知和任務(wù)執(zhí)行上的先進性。

其次,ChatGPT 的卓越之處在于其能夠?qū)⒑暧^問題細化為微觀問題,并巧妙地整合答案。

對于 π 0 而言,這表示它必須將復(fù)雜的物理任務(wù)分解成一系列可操作的步驟,并根據(jù)環(huán)境的實時反饋靈活調(diào)整其行動,以確保達成預(yù)定目標。

π 0 通過在廣泛的機器人操作數(shù)據(jù)集上進行訓(xùn)練,已經(jīng)能夠熟練執(zhí)行從簡單的物體搬運到復(fù)雜的衣物整理等多樣化任務(wù),這充分展現(xiàn)了其在任務(wù)分解和解決方案構(gòu)建方面的強大能力。

關(guān)于這點,Physical Intelligence 的創(chuàng)始人 Karol 也曾說過:" 我們有一個非常通用的方法,它可以利用來自許多不同實施例、許多不同機器人類型的數(shù)據(jù),并且類似于人們訓(xùn)練語言模型的方式。"

最后,ChatGPT 的通用性體現(xiàn)在其能夠?qū)⑷祟愔R遷移至語言交流中。相較之下,Physical Intelligence 的通用性則表現(xiàn)在將互聯(lián)網(wǎng)規(guī)模數(shù)據(jù)中學(xué)習(xí)到的深層語義知識,成功應(yīng)用到物理世界的實際操作中。π 0 繼承了這種從大規(guī)?;ヂ?lián)網(wǎng)預(yù)訓(xùn)練中獲得的豐富語義知識,并將其有效運用于實時的靈巧機器人控制,從而在知識遷移和通用性方面展現(xiàn)了其非凡的能力。

值得一提的是,Physical Intelligence 的一個關(guān)鍵特點是與物理世界的直接交互。與 ChatGPT 主要處理語言和信息不同,Physical Intelligence 需要處理的是物理信號和實際操作,正是這一點可以看出,它的野心是成為機器人行業(yè)中的「OpenAI」。

總的來說,ChatGPT 的里程碑在于其對自然語言的理解和生成能力,而 Physical Intelligence 之所以受到投資人重視,則在于其對物理世界的理解和操作能力。

π 0 所做的,就是將構(gòu)建語言模型的技術(shù)與控制和指導(dǎo)機器的自有方法相結(jié)合,并通過大量的機器人數(shù)據(jù)訓(xùn)練來實現(xiàn)。為了獲得更多數(shù)據(jù),該公司使用了在圖像和文本上訓(xùn)練大腦視覺語言模型和從 AI 圖像生成中借鑒的擴散建模技術(shù)。

人均 " 大咖 " 的初創(chuàng)公司

Physical Intelligence 成立于 2024 年,至今不到一年時間。它是一家專注于將通用人工智能與物理系統(tǒng)相結(jié)合的機器人初創(chuàng)公司,總部位于加利福尼亞州舊金山。公司的目標是開發(fā)一種能夠應(yīng)用于各種機器人的基礎(chǔ)軟件,使其能夠執(zhí)行復(fù)雜的多步驟任務(wù),而不再局限于特定的功能。

公司的聯(lián)合創(chuàng)始人兼首席執(zhí)行官卡羅爾 · 豪斯曼(Karol Hausman)曾在谷歌 DeepMind 擔任機器人科學(xué)家,一直專注于深度學(xué)習(xí)和機器人技術(shù)的應(yīng)用,目前在斯坦福大學(xué)當客座教授。

Karol 在慕尼黑工業(yè)大學(xué)獲得機器人碩士學(xué)位,在南加州大學(xué)獲得計算機科學(xué)博士學(xué)位,研究方向為感知 - 行動循環(huán)的重新思考,通過交互感知和學(xué)習(xí)表征來提升機器人的智能。自 2018 年起,擔任谷歌大腦的員工研究科學(xué)家,領(lǐng)導(dǎo)機器人操作團隊,并負責多個重要項目。2021 年至今,擔任斯坦福大學(xué)計算機科學(xué)系的兼職教授,教授深度強化學(xué)習(xí)等課程。同時也在 NASA 噴氣推進實驗室等多個頂尖研究機構(gòu)擔任過短期訪問研究員。

同時他也在多個國際會議和期刊上發(fā)表了大量論文,涵蓋深度學(xué)習(xí)、機器人操作、交互感知等主題。其論文《Rt-1: Robotics transformer for real-world control at scale》在 2022 年引起廣泛關(guān)注。

值得一提的是,在談及自家機器人在疊衣服方面的表現(xiàn)時,Karol 還強調(diào):對于機器人而言,折疊衣物是一項特別困難的任務(wù),因為它需要對物理世界有更深入的一般性智能,尤其是在處理那些會不斷變化形態(tài)和產(chǎn)生褶皺的柔軟物品時。

他還提到,現(xiàn)有的算法還不夠穩(wěn)定。就像人工智能聊天機器人有時會出現(xiàn)一些 " 人類怪癖 ",例如搖晃 T 恤和短褲,讓它們平整地鋪開。并且這些家庭服務(wù)機器人有時也會突然 " 崩潰 ",然后做出一些令人難以置信的行為:例如它們可能會把雞蛋塞進已經(jīng)裝滿的紙箱,然后強行關(guān)閉紙箱,甚至還有一次,在整理物品時,機器人突然將盒子從桌子上扔了下去 ...

其他聯(lián)合創(chuàng)始人包括加州大學(xué)伯克利分校的教授謝爾蓋 · 萊維寧(Sergey Levine),Sergey 發(fā)表了多篇具有影響力的論文,其中《Model-Agnostic Meta-Learning for Fast Adaptation of Deep Networks》和《Soft Actor-Critic: Off-Policy Maximum Entropy Deep Reinforcement Learning with a Stochastic Actor》是其代表作,分別被引用超過 13738 次和 9441 次。

聯(lián)合創(chuàng)始人切爾西 · 芬(Chelsea Finn),2019 年至今,Chelsea 擔任斯坦福大學(xué)的助理教授,并且享有 "William George and Ida Mary Hoover Faculty Fellow" 的稱號,她在機器人學(xué)和人工智能領(lǐng)域的研究工作得到了認可和尊重。值得一提的是,在加入斯坦福之前,她曾在 Google Brain 擔任研究科學(xué)家,專注于深度學(xué)習(xí)和機器人學(xué)習(xí)算法的開發(fā)。

聯(lián)合創(chuàng)始人 布萊恩 · 伊赫特(Brian Ichter)在斯坦福大學(xué)期間獲得了航空航天與航天工程的碩士以及博士學(xué)位,在攻讀博士學(xué)位期間,他作為研究助理參與了多個項目,開發(fā)了基于 GPU 的算法,用于運動規(guī)劃和不確定性感知。自 2018 年 11 月到 2024 年 3 月,Brian 擔任谷歌大腦的研究科學(xué)家,專注于開發(fā)高效的算法和機器學(xué)習(xí)方法,使機器人能夠在復(fù)雜的現(xiàn)實環(huán)境中進行規(guī)劃和操作。

聯(lián)合創(chuàng)始人拉基 · 格魯姆(Lachy Groom),Lachy 于 2012 年加入 Stripe,成為該公司的第 30 名員工。在 Stripe 工作期間,他參與了多個關(guān)鍵項目,包括支付產(chǎn)品的開發(fā)和全球擴展。最終擔任了 Stripe Issuing 的負責人,領(lǐng)導(dǎo)團隊開發(fā)用于創(chuàng)建、分發(fā)和管理實體及虛擬卡片的平臺。在離開 Stripe 后,Lachy 積極參與天使投資,專注于早期階段的創(chuàng)業(yè)公司。他通過自己的投資基金(LGF)支持多個行業(yè),包括金融科技、氣候科技和消費者互聯(lián)網(wǎng)等。

" 彌補遺憾 " ?OpenAI 跟投兩輪

2024 年 3 月,剛剛成立的 Physical Intelligence 籌集到了 7000 萬美元的種子輪融資,這一輪由 Thrive Capital 領(lǐng)投,參與者還包括 Khosla Ventures、Lux Capital、OpenAI 和 Sequoia Capital。其中領(lǐng)投 Thrive Capital 是一家具有強大影響力的風(fēng)險投資公司,通過其專注于互聯(lián)網(wǎng)和軟件領(lǐng)域的投資策略,為許多初創(chuàng)企業(yè)提供了資金支持與戰(zhàn)略指導(dǎo)。

2024 年 11 月,亞馬遜創(chuàng)始人貝索斯又領(lǐng)投了 4 億美元,至此,短短8 個月的時間,這家 AI 創(chuàng)企的估值已經(jīng)飆升至24 億美元。

值得一提的是,Physical Intelligence 的這兩輪融資中 OpenAI 都有跟投,可見其對這家初創(chuàng)公司寄予厚望,但作為行業(yè)領(lǐng)頭的 OpenAI 為什么不去去自己做機器人,而是轉(zhuǎn)為投資其他公司呢?

這也許是 OpenAI 的一些 " 遺憾 "。

2018 年 OpenAI 推出了 Dactyl,一個類人機械手,通過強化學(xué)習(xí)算法實現(xiàn)了對物理物體的靈巧操控。Dactyl 能夠在沒有特定編程的情況下,自主學(xué)習(xí)完成各種任務(wù)。

2019 年,OpenAI 展示了一款單手解魔方的機器人。這款機器人經(jīng)過 13000 小時的訓(xùn)練,能夠在一定干擾下高效地還原魔方。同年,OpenAI 發(fā)布了 Roboschool,這是一個用于模擬環(huán)境中控制機器人的開源軟件,旨在為研究者提供一個平臺來測試和開發(fā)強化學(xué)習(xí)算法。

但在兩年后,OpenAI 于 2021 年夏天宣布解散其機器人團隊。

對于解散的原因,OpenAI 聯(lián)合創(chuàng)始人 Wojciech Zaremba 解釋說:機器人研究面臨的數(shù)據(jù)稀缺問題使得研發(fā)受阻。相比之下,其他領(lǐng)域(如自然語言處理)能夠獲得更豐富的數(shù)據(jù),從而促進更快的進展。并且隨著 OpenAI 逐漸轉(zhuǎn)向商業(yè)化,其資源和精力更多地集中于大語言模型的開發(fā),而不是高成本的機器人研發(fā)。因此團隊內(nèi)部出現(xiàn)了對公司方向的不滿和分歧,最終團隊解散。

除此之外,一些分析人士指出,相比于機器人技術(shù),研究語言模型被認為具有更高的投資回報率和更低的風(fēng)險,這使得 OpenAI 更傾向于將資源投入到語言模型上。

盡管解散了機器人團隊,OpenAI 并未完全放棄其在機器人領(lǐng)域的夢想,近年來,OpenAI 開始投資與其技術(shù)路線相符的初創(chuàng)公司,如人形機器人公司 Figure 和 1X Technologies,以及剛剛跟投的 Physical Intelligence。

具身智能大模型,還有更多

除了 Physical Intelligence,雷峰網(wǎng)總結(jié)國內(nèi)外還有很多專注于具身智能大模型領(lǐng)域的初創(chuàng)公司。

例如由卡內(nèi)基梅隆大學(xué)的兩位教授 Deepak Pathak 和 Abhinav Gupta 在 2023 年聯(lián)合創(chuàng)立的 Skild AI,其核心競爭力在于其構(gòu)建的 " 可擴展的機器人基礎(chǔ)模型 "。

這一模型采用了基于 Transformer 的自適應(yīng)架構(gòu),通過大規(guī)模數(shù)據(jù)訓(xùn)練,使其能夠適應(yīng)多種機器人形式和任務(wù)。與傳統(tǒng)機器人技術(shù)不同,Skild AI 不再局限于特定任務(wù)的數(shù)據(jù)收集,而是追求一種能夠泛化應(yīng)用于多種場景與任務(wù)的通用智能。

而它也在成立不到一年的時間內(nèi)便獲得了 3 億美元的 A 輪融資,估值迅速攀升至 15 億美元,吸引了包括杰夫 · 貝佐斯、軟銀集團和紅杉資本等知名投資者的關(guān)注。

再例如由 Ivan Poupyrev 在在 2023 年創(chuàng)建的 Archetype AI,在種子輪融資中就籌集了 1300 萬美元,主要投資者包括 Venrock、亞馬遜工業(yè)創(chuàng)新基金和日立風(fēng)險投資等。

Archetype AI 的核心技術(shù)是其創(chuàng)新的物理 AI 模型 Newton,這是一個大行為模型(LBM),能夠捕捉人類難以察覺的復(fù)雜和快速變化的隱藏行為模式。Newton 模型融合了多模態(tài)傳感器數(shù)據(jù)和自然語言,實現(xiàn)了對物理世界的實時感知與推理。其核心技術(shù)能力包括時間序列理解、多模態(tài)輸出、實時描述和多模態(tài)摘要等,這些能力使得 Newton 可以廣泛應(yīng)用于安全、城市管理、工程和零售等領(lǐng)域

除此之外還有由 Brett Adcock 在 2022 年創(chuàng)辦的 Figure AI,這家在 2024 年完成了一輪 6750 萬美元的融資,公司的估值達到了 26 億美元。主要投資者包括 NVIDIA、微軟、亞馬遜創(chuàng)始人杰夫 · 貝索斯的 Explore Investments 基金等。

其核心技術(shù)在于它端到端的神經(jīng)網(wǎng)絡(luò)框架,該框架能夠處理多模態(tài)數(shù)據(jù)并生成語言響應(yīng)和執(zhí)行策略,以及視覺到行動的 Transformer 網(wǎng)絡(luò),它直接將視覺信息轉(zhuǎn)換為動作指令。此外,F(xiàn)igure AI 還專注于解決雙足機器人的平衡與接觸問題,這些技術(shù)的綜合應(yīng)用推動了人形機器人技術(shù)的發(fā)展,使其能夠執(zhí)行復(fù)雜動作,并在商業(yè)領(lǐng)域得到應(yīng)用。

不光是國外,而國內(nèi)也有不少涉足機器人行業(yè)的初創(chuàng)公司。

例如由前 Robotics Learning 研究員王潛與北大計算物理博士王昊于 2023 年 12 月聯(lián)合創(chuàng)建的自變量機器人,已經(jīng)完成 Pre-A 與 Pre-A+ 輪融資,總金額達到億元級。投資方包括德聯(lián)資本、基石資本、啟賦資本、南山戰(zhàn)新投,老股東九合創(chuàng)投持續(xù)加注。

其核心技術(shù)是 " 統(tǒng)一具身智能大模型 ",它通過端到端的完全縱向統(tǒng)一和任務(wù)泛化性,使得機器人能夠直接從原始輸入處理到最終動作輸出,無需中間步驟,并能夠跨任務(wù)學(xué)習(xí)通用架構(gòu),從而實現(xiàn)更廣泛的應(yīng)用和更高的適應(yīng)性。

還有由前珞石機器人聯(lián)合創(chuàng)始人兼 CTO 韓峰濤與清華大學(xué)交叉信息學(xué)院助理教授高陽于 2024 年 2 月聯(lián)合創(chuàng)建的千尋智能(Spirit AI),在成立后的短短幾個月內(nèi)完成了近 2 億元人民幣的種子輪和天使輪融資,主要由弘暉基金領(lǐng)投,其他投資者包括達晨創(chuàng)投、千乘資本、順為資本和綠洲資本等。

千尋智能的技術(shù)核心在于其全棧的具身智能數(shù)據(jù)利用能力,使其能夠高效地從多種數(shù)據(jù)源中學(xué)習(xí)并應(yīng)用到機器人技術(shù)中。團隊還開發(fā)了 EfficientImitate 高性能模仿學(xué)習(xí)算法,大幅提升了模仿學(xué)習(xí)的效率和泛化能力。

此外,千尋智能的 EfficientZero 算法在強化學(xué)習(xí)領(lǐng)域也展現(xiàn)出高樣本效率。在硬件方面,千尋智能擁有強大的機器人運動控制系統(tǒng)和硬件開發(fā)能力,特別是在模型預(yù)測控制、仿生柔順控制、動態(tài)環(huán)境操作等方面積累了深厚的經(jīng)驗。

來源:雷鋒網(wǎng)

THE END
廣告、內(nèi)容合作請點擊這里 尋求合作
免責聲明:本文系轉(zhuǎn)載,版權(quán)歸原作者所有;旨在傳遞信息,不代表砍柴網(wǎng)的觀點和立場。

相關(guān)熱點

相關(guān)推薦

1
3