虎扑评分区,老熟妇大胆性开放图,中文字幕精品av一区二区五区,波多野42部无码喷潮在线

為什么說(shuō)人工智能公司要自建超算?

人工智能
2019
03/24
21:10
AI商業(yè)周刊
分享
評(píng)論

3月19日,英特爾宣布將與高性能廠商Cray在美國(guó)能源部下屬的阿貢國(guó)家實(shí)驗(yàn)室建造第一臺(tái)每秒可進(jìn)行百億億次浮點(diǎn)運(yùn)算(exaflop)的超級(jí)計(jì)算機(jī),專(zhuān)門(mén)為傳統(tǒng)高性能計(jì)算和人工智能(AI)設(shè)計(jì)。

而就在一周前的3月12日,英偉達(dá)宣布69億美元收購(gòu)以色列公司Mellanox,后者是一家以高性能計(jì)算和網(wǎng)絡(luò)技術(shù)而聞名的芯片制造商,英偉達(dá)通過(guò)此次收購(gòu)意在搶占數(shù)據(jù)中心。

不僅英特爾、英偉達(dá)這些科技巨頭在布局超算,人工智能創(chuàng)企也紛紛打造超算。商湯超算平臺(tái)的計(jì)算集群已搭載超過(guò)14000塊GPU,峰值計(jì)算達(dá)16億億次/秒,而國(guó)家“太湖之光”的峰值計(jì)算僅為12.5億億次/秒。

去年曠視宣布完成C輪融資時(shí),創(chuàng)始人印奇也對(duì)媒體表示:曠視已經(jīng)在中國(guó)好幾個(gè)地方建了非常大的超算平臺(tái),未來(lái)的算力還需要更多。算力就像當(dāng)年的存儲(chǔ)一樣,無(wú)論擴(kuò)展得多快,都會(huì)被消耗掉,需要不斷去投入。

其實(shí),這些人工智能公司完全可以采用云服務(wù)的模式,比如租賃阿里云、騰訊云、AWS、中科曙光等共有云平臺(tái)的高性能計(jì)算服務(wù)。那么它們?yōu)楹渭娂娺x擇自建超算呢?

算法迭代快

計(jì)算力和算法是一組最佳CP,如果計(jì)算力和算法均是自己研發(fā)的,就會(huì)產(chǎn)生1+1大于2的“化學(xué)反應(yīng)”。因?yàn)樵瓌?chuàng)算法和算力兩者采用統(tǒng)一的接口時(shí),更易于互相匹配和協(xié)調(diào)。且數(shù)據(jù)的收集、標(biāo)注、模型建立、模型訓(xùn)練到輸出SDK的每一個(gè)環(huán)節(jié),都可以做到標(biāo)準(zhǔn)化和自動(dòng)化,整個(gè)鏈條就會(huì)跑得更快,算法迭代速度更快。而公有云的超算很難滿(mǎn)足每個(gè)企業(yè)算法的匹配。

尤其在面臨新需求下的情況,比如需要1000個(gè)GPU卡聯(lián)合訓(xùn)練,阿里云、騰訊云等這些云平臺(tái)均沒(méi)有此類(lèi)服務(wù),那么新需求就沒(méi)法進(jìn)行下去。從長(zhǎng)遠(yuǎn)來(lái)看,自建超算更利于探索新業(yè)務(wù)。

前不久,央視315爆出AI客服一年打40多億個(gè)騷擾電話(huà),以及犯罪分子通過(guò)免費(fèi)公共WIFI竊取用戶(hù)消費(fèi)信息的現(xiàn)象引起熱議,其背后正是我國(guó)數(shù)據(jù)安全保護(hù)薄弱的影射。如果通過(guò)公有云平臺(tái)做模型訓(xùn)練,理論上云平臺(tái)都可以看到使用方數(shù)據(jù)。一旦數(shù)據(jù)被泄露,對(duì)使用方公司將是不可逆的打擊。

眼下,5G商用逐步臨近,5G 時(shí)代生產(chǎn)方式將發(fā)生革命性的變化,很多終端數(shù)據(jù)處理都可在云端跑。這也是英特爾、英偉達(dá)等巨頭企業(yè)近期極力打造超算平臺(tái)的原因之一,因?yàn)槌闶?G時(shí)代巨頭爭(zhēng)霸不可忽視的一面。

冰凍三尺非一日之寒,構(gòu)建超算不單是將幾千或者幾萬(wàn)個(gè)GPU堆疊起來(lái),還需要一套強(qiáng)大的“管理系統(tǒng)”――就像微軟Windows操作系統(tǒng)。例如阿里耗費(fèi)多年打造出“盤(pán)古分布式系統(tǒng)”,才成為阿里云的Windows。所以,對(duì)于人工智能公司,提前積累超算的經(jīng)驗(yàn)十分必要。

從資本角度來(lái)看,在5G大爆發(fā)的行業(yè)環(huán)境下,超算的價(jià)值愈加凸顯,自建超算有更大的想象空間。在滿(mǎn)足自身計(jì)算需求情況下,還可以租賃出去把服務(wù)賣(mài)給中小企業(yè),或許還能盈利,也是一種商業(yè)模式。

價(jià)格便宜10倍

以阿里云平臺(tái)為例,筆者粗略算了一筆賬:

如果在阿里云平臺(tái)選擇一塊卡,包括8個(gè)Intel Platinum 8163處理器和1個(gè)NVIDIA V100,服務(wù)價(jià)格為每7620元/月,即9.144萬(wàn)元/年。

一個(gè)以上配置的卡成本多少呢?筆者查閱發(fā)現(xiàn),Intel Platinum 8163處理器的價(jià)格為1.5萬(wàn)元/個(gè),NVIDIA V100的價(jià)格為7.88萬(wàn)元/個(gè)。所以1.5W*8+7.88*1=19.88萬(wàn)元,再加上服務(wù)器(包括主板等硬件)0.5萬(wàn)元左右,成本共計(jì)20.38萬(wàn)元。

對(duì)比發(fā)現(xiàn),選擇阿里云包月服務(wù)所需要的錢(qián)大約兩年就可以買(mǎi)一張卡,但一張卡的壽命遠(yuǎn)大于兩年,一般至少5-10年。顯然,自己組裝卡是更省錢(qián)的。

一位MISSION.ORG的作者Jeff Chen也對(duì)比過(guò)自建GPU計(jì)算機(jī)和租賃AWS云服務(wù),竟然便宜10倍!

他組裝一臺(tái)GPU計(jì)算機(jī),花了3千美元,其配置包括一個(gè)1080Ti GPU(你也可以用新的2080Ti來(lái)學(xué)習(xí)機(jī)器,只要再多花500美元),一個(gè)12核CPU,64GB RAM和1TB M.2 SSD。再加三個(gè)GPU,總共四個(gè)GPU。

我們非常保守地假設(shè),因?yàn)镚PU迭代非???,一塊用于深度學(xué)習(xí)的GPU在三年內(nèi)價(jià)值變成0。如下表所示,如果用它超過(guò)1年,把電費(fèi)算在內(nèi)也會(huì)便宜10倍,如果把亞馬遜一次購(gòu)買(mǎi)多年的折扣算在內(nèi),1年大概會(huì)便宜6倍,3年便宜4倍。4個(gè)GPU便宜21倍。

自建計(jì)算機(jī)和從AWS租賃的費(fèi)用比較。1個(gè)GPU版本便宜4-10倍,4個(gè)GPU版本便宜9-21倍,具體取決于利用率。AWS定價(jià)包括全年和3年租賃的折扣(35%,60%)。假設(shè)功耗為0.20美元/kWh,1臺(tái)GPU機(jī)器消耗1千瓦/小時(shí),4臺(tái)GPU機(jī)器消耗2千瓦/小時(shí)。折舊保守估計(jì)為3年內(nèi)的線(xiàn)性損耗。每個(gè)GPU 700美元。

如果你想把2080ti用于你的深度學(xué)習(xí)計(jì)算機(jī),會(huì)多出500美元,而且對(duì)于1 GPU的機(jī)器來(lái)說(shuō),仍然是4-9倍的便宜。

造成這種巨大成本差異的原因是亞馬遜Web服務(wù)EC2(或谷歌云或Microsoft Azure)的GPU價(jià)格為3美元/小時(shí)或約2100美元/月。即使當(dāng)你關(guān)閉你的機(jī)器時(shí),你仍然需要以每月每GB 0.10美元的價(jià)格為機(jī)器支付存儲(chǔ)費(fèi)用。

對(duì)于一臺(tái)3千美元的GPU機(jī)器學(xué)習(xí)計(jì)算機(jī)(1千瓦/小時(shí)),如果你經(jīng)常使用,將在2個(gè)月內(nèi)收支平衡。更不用說(shuō)你的電腦還歸你所有,而且在兩個(gè)月內(nèi)它沒(méi)有貶值多少。同樣,4 GPU版本(2千瓦/小時(shí))的更為有利,因?yàn)槟銓⒃诓坏?個(gè)月內(nèi)實(shí)現(xiàn)收支平衡。(假設(shè)電力成本為0.20美元/kWh)

而且GPU性能與AWS相當(dāng)。與使用下一代Volta技術(shù)的Nvidia v100 GPU相比,你的700美元Nvidia 1080 ti的運(yùn)行速度為其90%。這是因?yàn)榇嬖贗O,所以即使V100理論上速度可能快1.5?C2倍,IO在實(shí)踐中也會(huì)減慢速度。由于您使用的是M.2SSD,IO在您自己的計(jì)算機(jī)上運(yùn)行得很快。

結(jié)語(yǔ)

從1塊卡到幾萬(wàn)卡還需要運(yùn)維費(fèi)用,以及人才成本,但從長(zhǎng)遠(yuǎn)看,自建超算更有發(fā)展?jié)摿Γ彩茿I公司做大的必經(jīng)之路。

當(dāng)然,選擇共有云平臺(tái)還是自建超算也要根據(jù)自身公司體量,畢竟打造超算前期投入較大。

人工智能的核心業(yè)務(wù)壁壘和競(jìng)爭(zhēng)力就是算法中的業(yè)務(wù)邏輯,還有就是數(shù)據(jù)。如果核心業(yè)務(wù)已經(jīng)穩(wěn)健,數(shù)據(jù)和算法需要信息安全保護(hù),則需要從公有云平臺(tái)遷移至自建超算。

如果只是小范圍驗(yàn)證業(yè)務(wù)模式,為了降低成本,可以借助公有云平臺(tái)快速部署和按需租用的優(yōu)勢(shì),如果資金和時(shí)間都充裕,可以直接自建超算。

【來(lái)源:AI商業(yè)周刊】

THE END
廣告、內(nèi)容合作請(qǐng)點(diǎn)擊這里 尋求合作
ai
免責(zé)聲明:本文系轉(zhuǎn)載,版權(quán)歸原作者所有;旨在傳遞信息,不代表砍柴網(wǎng)的觀點(diǎn)和立場(chǎng)。

相關(guān)熱點(diǎn)

視覺(jué)模型表示自己除了在圖像任務(wù)里很好用,非圖像任務(wù)也是一把好手。
人工智能
2019年機(jī)器人技術(shù)的5大趨勢(shì)將會(huì)是:家庭機(jī)器人、送貨機(jī)器人、協(xié)作機(jī)器人、邊緣計(jì)算機(jī)器人,還有統(tǒng)一的業(yè)內(nèi)標(biāo)準(zhǔn)也將出現(xiàn)。
人工智能
3月20日消息,創(chuàng)新工場(chǎng)宣布,前騰訊AI Lab主任張潼博士已加盟創(chuàng)新工場(chǎng),兼任科研合伙人。
業(yè)界
近日,以色列魏茨曼科學(xué)研究學(xué)院計(jì)算機(jī)科學(xué)系教授希蒙·厄爾曼發(fā)文表示,相信神經(jīng)科學(xué)能為人工智能發(fā)展提供進(jìn)一步的助力。那么,人工智能和神經(jīng)科學(xué)究竟有什么關(guān)系?神經(jīng)科學(xué)到底如何進(jìn)一步助力人工智能發(fā)展...
人工智能
近日,以色列魏茨曼科學(xué)研究學(xué)院計(jì)算機(jī)科學(xué)系教授希蒙·厄爾曼發(fā)文表示,相信神經(jīng)科學(xué)能為人工智能發(fā)展提供進(jìn)一步的助力。那么,人工智能和神經(jīng)科學(xué)究竟有什么關(guān)系?神經(jīng)科學(xué)到底如何進(jìn)一步助力人工智能發(fā)...
人工智能

相關(guān)推薦

1
3