2016年,擊敗圍棋世界冠軍李世石九段的AlphaGo震驚世人,隨之引爆的AI大潮如雨后春筍。近年來,人工智能技術頻頻亮相,已然成為炙手可熱的全球科技新寵。業(yè)內人士評價,如果說以蒸汽技術驅動的第一次工業(yè)革命延伸了人的肢體,拓展了人類的力量,那么,以新一代人工智能技術為驅動的新一輪科技革命和產(chǎn)業(yè)變革將拓展人類的智能,極大提升人類智力所能創(chuàng)造的價值。
“2016-2018年,AI非?;鸨?。” 3 月 27 日的云知聲AI 技術開放日上,云知聲董事長兼CTO梁家恩談及AI技術時表示,但他同時認為,AI大潮正在退卻,原因是有些偽AI公司已經(jīng)消失,而真正的AI公司還在繼續(xù)。“真AI和偽AI公司不僅在技術實力上有明顯差距,他們對產(chǎn)業(yè)問題的態(tài)度也是區(qū)別比較大的。到今天當AI大潮退去,我們可以站出來說,AI真正的時代到來。”
AI技術結合產(chǎn)業(yè)才有未來
關于人工智能,官方解釋為,AI是計算機科學的一個分支,它企圖了解智能的實質,并生產(chǎn)出一種新的能以人類智能相似的方式做出反應的智能機器,該領域的研究包括機器人、語言識別、圖像識別、自然語言處理和專家系統(tǒng)等。梁家恩認為,AI是一種技術,但如果不跟產(chǎn)業(yè)結合,就只是一種純粹的炫技。
追溯AI發(fā)展這起伏變動的60多年,共經(jīng)歷了三次浪潮。1956年的Dartmouth會議后,人們陸續(xù)發(fā)明了第一款的感知神經(jīng)網(wǎng)絡軟件和聊天軟件,證明了數(shù)學定理。彼時,大家都驚呼“人工智能來了,再過十年機器要超越人類了”,然而直到70年代后期,人們發(fā)現(xiàn)過去的理論和模型只能解決一些非常簡單的問題。很快,AI第一次浪潮被拍在沙灘上。
隨著1982年Hopfield神經(jīng)網(wǎng)絡和BT訓練算法的提出,外界又有了“人工智能春天來臨”的呼聲。于是80年代又興起一波人工智能的熱朝,包括語音識別、語音翻譯計劃,以及日本提出的第五代計算機。到了90年代后期,人們再次發(fā)現(xiàn)這種東西離實際生活還很遙遠。即使IBM在90年代時提出了一款名為“IBM Viavoice”的語音聽寫軟件,在演示當中效果不錯,但真正用的時候卻很難使用。2000年左右,第二次人工智能的浪潮又一次破滅。
第三次人工智能浪潮是隨著2006年 Hinton提出的深度學習的技術,以及在圖像、語音識別以及其他領域內取得的一些成功而開啟的。業(yè)界普遍認為經(jīng)過兩次起伏,人工智能開始進入了真正爆發(fā)的前夜。
“AI過去兩次浪潮都沒有跟產(chǎn)業(yè)結合。” 梁家恩稱,而第三次浪潮更大的背景是萬物智聯(lián)的時代,這是一個互聯(lián)網(wǎng)的延伸,從PC互聯(lián)到移動互聯(lián),再到未來萬物互聯(lián)才是真正的主戰(zhàn)場。在這個戰(zhàn)場上,除了AI技術之外,還有IOT、5G等技術的逐漸成熟落地,所有這些技術的結合,會給人們生活帶來天翻地覆的變化。“互聯(lián)網(wǎng)未來從線上沉入到線下,改變我們的消費和整個產(chǎn)業(yè)升級,在這個時代會有很大的機會來臨。”
據(jù)梁家恩介紹,云知聲基于在移動端的三年探索,發(fā)現(xiàn)語音助手在手機上的運用和電視上的運用活躍度相差20倍以上,從而得到啟發(fā):只有AI技術跟硬件以及跟整個物聯(lián)網(wǎng)產(chǎn)業(yè)結合,才有未來。
從AI企業(yè)來看,據(jù)了解,百度AI能力正逐漸被應用于醫(yī)療、零售、農(nóng)業(yè)和金融等各個領域。去年12月份,百度宣布成立“百度AI產(chǎn)業(yè)研究中心”,該中心將與產(chǎn)業(yè)、學術、研究機構攜手,探索各產(chǎn)業(yè)呈現(xiàn)出的新應用、新模式、新業(yè)態(tài)、新價值。騰訊圍繞著計算機視覺、智能語音、機器人控制、NLP自然語言處理等AI技術全面布局。網(wǎng)易也正在通過AI+教育消除城鄉(xiāng)教育鴻溝??梢娦袠I(yè)已經(jīng)普遍意識到,唯有加強人工智能和產(chǎn)業(yè)發(fā)展的融合,培育新增長點、形成新動能,以人工智能技術推動各產(chǎn)業(yè)變革,推動人工智能和商業(yè)場景的深度融合,才能真正實現(xiàn)商業(yè)化落地。
“全棧”、“硬核”兩大挑戰(zhàn)
在當下AI 技術驅動的產(chǎn)業(yè)變革浪潮中,要服務好消費與產(chǎn)業(yè)升級的需求,技術與應用的挑戰(zhàn)是十分艱巨的。從云知聲的AI 技術分享會上,記者獲取到兩個象征行業(yè)挑戰(zhàn)的關鍵要素——“全棧”和“硬核”。
全??梢詮膬蓚€維度解讀,第一個維度是如何構建多模態(tài)生態(tài)擬人化智能系統(tǒng)。以云知聲為例,以語音交互起家的云知聲,其目前為止的技術圖譜已經(jīng)超過了語音能力范圍,包括感知和認知和表達能力,用視覺和聽覺、降噪和語音識別、對話管理系統(tǒng)、行業(yè)智能系統(tǒng)、人臉和語音合成,最終反饋給用戶。據(jù)梁家恩透露,云知聲最終想構建的便是多模態(tài)生態(tài)擬人化智能系統(tǒng)。
要實現(xiàn)這個目的,需要解決兩個問題:落地問題和快速響應問題。“我們有兩塊,一個是智能芯片,另外一個是超算平臺,一個解決我們落地的問題,一個解決快速響應的問題。” 這是梁家恩或者說云知聲對全棧的理解。
第二個維度是如何打通完整的產(chǎn)業(yè)閉環(huán),把感知和表達的技術真正跟認知結合。“我們有一個從0到1、從1到10。從1到10在技術領域已經(jīng)比較完美了,但是對產(chǎn)業(yè)來說,從1到10才是剛開始。”梁家恩表示,能不能從10做到60分,60分意味著什么,這需要解決產(chǎn)業(yè)里面融合性的產(chǎn)品體系,包括整個技術方案能不能達到量產(chǎn)要求等,這主要是功能和產(chǎn)品運維的挑戰(zhàn)。
全棧打通以后,產(chǎn)業(yè)規(guī)模化應用的痛點如何解決?這就需要有足夠強的技術支撐,也即“硬核”。硬核技術涉及四個方面,一是語音技術,語音技術方向非常成熟,但在產(chǎn)業(yè)落地上的挑戰(zhàn)非常大;二是機器智能水平的提升,因為它代表大腦,如果只是鸚鵡學舌,是不能解決產(chǎn)業(yè)問題的;三是AI芯片落地,這需要較長時間的技術積累,云知聲從2014年開始布局AI芯片,2016年動工,到2018年才拿到第一塊芯片,并且還在不斷完善的過程中;四是超算能力,超算能力在延伸圖像翻譯時,能夠得到非??斓难葸M。梁家恩認為超算平臺對于云計算的價值,就相當于高鐵對于中國經(jīng)濟發(fā)展價值,“可以讓我們的運轉體系提高不止一倍以上的效率。”但如何搭建一個真正強大的超算平臺,這同樣是一項挑戰(zhàn)。
基于以上關于“全棧”和“硬核”的兩個關鍵難點,梁家恩的分析中也提到的云知聲的突破:2016年開始挑戰(zhàn)遠場識別,做一些工程和技術方面的打磨。同年開始布局芯片、超算平臺和云計算。2018年拿到芯片,超算平臺開始鋪開,同期把全棧的技術構建起來,為AI技術與產(chǎn)業(yè)的融合發(fā)展奠定了很大的基礎。
“讓機器更好的服務人類”是整個AI行業(yè)以及所有AI企業(yè)都需要去努力的方向與目標。總結而言要解決三個問題:一是多模態(tài)的交互,能不能變成多模態(tài)擬人化的交互能力是重點;二是行業(yè)問題的解決,“我們不是要顛覆這個行業(yè),而是要進入行業(yè)里面去,看這個產(chǎn)業(yè)有什么問題。” 梁家恩稱,有些問題是能夠通過人工智能技術解決的問題,那么就通過去解決行業(yè)問題來推動AI行業(yè)的發(fā)展。三是底層創(chuàng)新能力支撐,只靠當下的技術能力推進并不足以改變整個AI行業(yè),只有包括芯片、超算、機器學習和認知學習等底層創(chuàng)新能力不能提升與突破,才能更好的面對未來的行業(yè)挑戰(zhàn),以及獲得更好的發(fā)展。
2019年之于AI,是最好的時代,也是最壞的時代。“偽AI退卻,真AI前行”是梁家恩給予今年人工智能行業(yè)的預判,“AI的大時代已經(jīng)到來了,但是對于偽AI企業(yè)已經(jīng)消失,只要我們扎扎實實的把行業(yè)問題解決掉,市場就會給予最大的回報。”
【來源:中國家電網(wǎng)】