谷歌的定制張量處理器(TPU)芯片是去年谷歌云平臺(tái)客戶可以使用的最新一代芯片,專為人工智能推理和培訓(xùn)任務(wù)量身定制,如圖像識(shí)別,自然語(yǔ)言處理和強(qiáng)化學(xué)習(xí)。為了支持開(kāi)發(fā)應(yīng)用程序的開(kāi)發(fā),Mountain View公司擁有穩(wěn)定的開(kāi)源架構(gòu),如BERT(一種語(yǔ)言模型),MorphNet(一種優(yōu)化框架)和UIS-RNN(一種揚(yáng)聲器二值化系統(tǒng)),通常還附帶了數(shù)據(jù)集。延續(xù)這一思路,谷歌今天在其庫(kù)中添加了兩種新的圖像分割模型,并聲稱這兩種模型都實(shí)現(xiàn)了部署在云TPU pod上的最先進(jìn)的性能。
該模型- Mask R-CNN和DeepLab v3+ -自動(dòng)標(biāo)記圖像中的區(qū)域,并支持兩種類型的分割。第一類是實(shí)例分割,它為一個(gè)或多個(gè)對(duì)象類(例如,家庭照片中的人)的每個(gè)實(shí)例提供一個(gè)惟一的標(biāo)簽,而語(yǔ)義分割則根據(jù)圖像所代表的對(duì)象或紋理類對(duì)圖像的每個(gè)像素進(jìn)行注釋。(例如,一個(gè)城市的街景可能被標(biāo)記為“人行道”、“人行道”和“建筑物”。)
正如谷歌所解釋的,Mask R-CNN是一個(gè)兩階段的實(shí)例分割系統(tǒng),可以同時(shí)定位多個(gè)對(duì)象。第一個(gè)階段從輸入照片中提取模式,以識(shí)別潛在的感興趣區(qū)域,而第二個(gè)階段在為每個(gè)輸入照片生成像素級(jí)掩碼之前,對(duì)這些建議進(jìn)行細(xì)化,以預(yù)測(cè)對(duì)象類。
另一方面,DeepLab 3+優(yōu)先考慮分割速度。使用谷歌最新一代TPU硬件(v3)上的TensorFlow機(jī)器學(xué)習(xí)框架,在開(kāi)源PASCAL VOC 2012圖像語(yǔ)料庫(kù)上進(jìn)行培訓(xùn),在不到5小時(shí)的時(shí)間內(nèi)完成培訓(xùn)。
本周起,Google為Mask R-CNN和Deeplab 3+提供的協(xié)作平臺(tái)上的教程和筆記就可以使用了。
TPU是一種特定于應(yīng)用程序的集成電路(asic),它是液態(tài)冷卻的,設(shè)計(jì)用于插入服務(wù)器機(jī)架,內(nèi)部用于支持谷歌照片、谷歌云視覺(jué)API調(diào)用和谷歌搜索結(jié)果等產(chǎn)品。第一代設(shè)計(jì)于5月在谷歌I發(fā)布。最新一代(第三代)于2018年5月發(fā)布。谷歌聲稱它可以提供高達(dá)100千萬(wàn)億次浮點(diǎn)運(yùn)算的性能,大約是其第二代芯片的8倍。
谷歌并不是唯一一家為人工智能優(yōu)化的云托管硬件。今年3月,微軟開(kāi)設(shè)了Brainwave,這是一支用于加速機(jī)器學(xué)習(xí)操作的現(xiàn)場(chǎng)可編程門陣列(FPGA),用于選擇Azure客戶。(微軟表示,這使得其為Bing搜索引擎提供動(dòng)力的模型的性能提高了10倍。)據(jù)報(bào)道,亞馬遜正在開(kāi)發(fā)一種人工智能芯片,該芯片將加速其Alexa語(yǔ)音引擎的模型訓(xùn)練。
https://venturebeat.com/2019/04/24/microsoft-earnings-q3-2019/
來(lái)源:venturebeat