來源:新浪VR
語言是人類最基本的交際工具,人類社會(huì)的運(yùn)行和發(fā)展離不開語言。我們通過語言來進(jìn)行的人際互動(dòng)、交換信息。說話者發(fā)出“語言信息”,受話者接受信息并在大腦中經(jīng)過處理,最后“反饋信息”。那么,這種能力是否能運(yùn)用于人工智能呢?是否可以讓機(jī)器人也學(xué)會(huì)根據(jù)自己的需要發(fā)出命令指導(dǎo)對方實(shí)踐?
研究員們通過實(shí)踐,在一個(gè)基于文本的冒險(xiǎn)游戲中結(jié)合自然語言處理和強(qiáng)化學(xué)習(xí)技術(shù),向機(jī)器展示如何使用語言作為工具。一個(gè)通過與角色對話完成文本冒險(xiǎn)游戲任務(wù)的人工智能不僅學(xué)會(huì)了如何做事,還學(xué)會(huì)了如何讓別人做事。該系統(tǒng)向機(jī)器使用語言實(shí)現(xiàn)目標(biāo)邁出了一步。
為了構(gòu)建一個(gè)有目的言語的人工智能,來自亞特蘭大佐治亞理工學(xué)院(Georgia Institute of Technology)和Facebook人工智能研究中心(Facebook AI Research)的研究人員結(jié)合了來自自然語言處理(natural-language processing)和強(qiáng)化學(xué)習(xí)(reinforcement learning)的技術(shù)。
為了測試他們的方法,研究人員在一款名為LIGHT的基于文本的多人游戲中訓(xùn)練他們的系統(tǒng)。LIGHT是Facebook去年開發(fā)的,用于研究人類和人工智能玩家之間的交流。游戲設(shè)定在一個(gè)幻想主題的世界里,有成千上萬的眾包對象、角色和地點(diǎn),通過屏幕上的文字進(jìn)行描述和交互。玩家(人或電腦)通過輸入諸如“擁抱向?qū)?rdquo;、“打龍”或“摘掉帽子”等命令來行動(dòng)。他們還可以和聊天機(jī)器人控制的角色交談。
為了給出人工智能做事情的理由,研究人員增加了大約7500個(gè)眾包任務(wù),這并不包括在最初版本的《光》中。最后,他們還創(chuàng)建了一個(gè)知識圖(一個(gè)主題-動(dòng)詞-對象關(guān)系的數(shù)據(jù)庫),為AI提供關(guān)于游戲世界和游戲角色之間聯(lián)系的常識信息,比如商家只有在警衛(wèi)是朋友的情況下才會(huì)信任他們。游戲現(xiàn)在有動(dòng)作(比如“上山”和“吃掉騎士”)來完成任務(wù)(比如“建立龍所能獲得的最大的寶藏”)。
將所有這些結(jié)合在一起,他們訓(xùn)練人工智能僅僅通過語言來完成任務(wù)。要執(zhí)行動(dòng)作,它可以為該動(dòng)作鍵入命令,也可以通過與其他字符對話來達(dá)到相同的目的。例如,如果人工智能需要一把劍,它可以選擇偷一把或說服另一個(gè)角色交出一把。
目前,這個(gè)系統(tǒng)還只是個(gè)玩具。它的態(tài)度可能很直率,但將自然語言處理與強(qiáng)化學(xué)習(xí)相結(jié)合是一個(gè)令人興奮的操作,它不僅可以使聊天機(jī)器人更智能地對話,而且可以幫助我們對“充滿語言的世界是如何運(yùn)作的”這一思考進(jìn)行更豐富且深入地理解。