人工智能會下棋,甚至打敗過世界圍棋冠軍,這已經(jīng)是老生常談。
別看AI這么厲害,它只是借助了深度學(xué)習(xí)的方式,通過無數(shù)次的訓(xùn)練,讓它能夠在面對實(shí)際問題時(shí),從訓(xùn)練數(shù)據(jù)庫中計(jì)算尋得最優(yōu)解,這并不代表機(jī)器人能夠像人一樣進(jìn)行自主思考。
7月11日,Deep Mind公司最新的一項(xiàng)關(guān)于AI的文章有了突破性進(jìn)展,研究者運(yùn)用發(fā)展心理學(xué)領(lǐng)域的知識可以讓AI能像人類嬰兒一樣“學(xué)會思考”。而此前,最先進(jìn)的AI系統(tǒng)仍然難以捕捉到日常人類場景中的“常識性”知識,比如指導(dǎo)預(yù)測、推理和行動。
可以說,Deep Mind的這項(xiàng)研究,大大推進(jìn)了人工智能在直覺感知方面的發(fā)展。此后,人工智能真的更像“人”了。
撰文 | 徐詩露
早在機(jī)器人問世之時(shí),就有許多人想象過:如果機(jī)器人能夠像人一樣思考,世界將會變成什么樣子?(相信你腦海中已經(jīng)浮現(xiàn)出相應(yīng)的電影場景了)
這個問題已經(jīng)塵封多年,但是近期的一項(xiàng)發(fā)表在《自然·人類行為》上的研究顯示,人工智能或許擁有了“像嬰兒一樣思考”的能力:能像嬰兒一樣理解直觀物理學(xué)。值得一提的是,這是知名人工智能公司Deep Mind科研人員發(fā)表的成果。
Luis Piloto和他的同事做了一個能學(xué)習(xí)直觀物理學(xué)的深度學(xué)習(xí)系統(tǒng),名為PLATO。PLATO包含的系統(tǒng)受到了嬰兒學(xué)習(xí)方法相關(guān)研究的啟發(fā)。并且,PLATO遵循認(rèn)為物體在我們周圍物理世界的表示和預(yù)測中扮演核心作用的理論。
具體來說,研究者通過給PLATO觀看許多描繪簡單場景的視頻來訓(xùn)練它,比如球落到地上,球滾到其他物體后面又再次出現(xiàn),很多球之間彈來彈去。訓(xùn)練之后,PLATO在看到?jīng)]有意義的場景(如物體互相穿過卻沒有發(fā)生相互作用)時(shí)表現(xiàn)出了像人類嬰兒那樣“驚訝”。
令人驚訝的是,PLATO只觀看了28小時(shí)的視頻就獲得了以上學(xué)習(xí)效果。
我們不禁發(fā)問,直觀物理學(xué)是什么,嬰兒是如何理解它的?AI又是如何學(xué)到這一點(diǎn)的呢?
嬰兒眼里的直觀物理學(xué)是什么?
首先我們來明確一個概念,直觀物理學(xué)是什么?我們可以簡單地把它理解為“直覺”或者“常識”。
比如我們在桌子上方丟下一串鑰匙,所有人都知道,鑰匙不會漂浮在半空中,也不會穿過桌面掉到地上,而是會掉落在桌面上。
這就是“直觀物理學(xué)”,它是我們了解世界的基礎(chǔ)物理概念,也是思維中“常識”的關(guān)鍵組成部分。
在發(fā)展心理學(xué)領(lǐng)域中,直觀物理學(xué)被分為5個方面的概念:
1. 連續(xù)性:物體不會從一個地方傳送到另一個地方,而是在時(shí)間和空間中有一定的連續(xù)路徑;
2. 對象持久性:物體在看不見時(shí)不會消失;
3. 固體性:物體不會相互滲透;
4. 不變性:對象的屬性(如形狀)不會更改;
5. 定向慣性:物體運(yùn)動的路徑與慣性原理一致。
是不是每一個都很好理解?沒錯,這些都是我們?nèi)菀桌斫夂徒邮艿摹俺WR性”概念。
如果鑰匙的掉落過程違背了我們的常識,比如懸浮在了半空中、或者穿過了桌子、或者是從桌面上duang的一下彈起來老高,甚至是化成了液體,那么事情就會超出我們的預(yù)期,變得詭異起來。
面對這種怪異事件,每個人都會感到驚訝。即使是三個月大的嬰兒也是一樣,他們也會對這樣違背直觀物理學(xué)的現(xiàn)象表現(xiàn)出驚訝,這種驚訝反應(yīng)被稱為違反期望(VoE)效應(yīng)。
至于嬰兒對世界的認(rèn)識是否和成人一樣,這一點(diǎn)存在一個關(guān)于“先天”和“后天”的爭議,許多發(fā)展科學(xué)家認(rèn)為這是“先天”的,也有一些學(xué)者更支持從無到有的“后天”理論。
那我們能否設(shè)計(jì)一個模擬嬰兒思維的程序,通過適當(dāng)?shù)挠?xùn)練,使AI能夠像嬰兒一樣思考呢?
如何把AI訓(xùn)練得像嬰兒一樣思考?
為了探究這個爭論不休的“先天”和“后天”問題,Piloto等人利用PLATO仿真系統(tǒng),來測試深度學(xué)習(xí)系統(tǒng)是否能夠通過學(xué)習(xí)視覺動畫,來獲得對直觀物理學(xué)的理解。
如果“后天”的理論是正確的,那么智力發(fā)展的關(guān)鍵就在于通過處理大量經(jīng)驗(yàn)和大量數(shù)據(jù)來進(jìn)行鍛煉。
PLATO仿真系統(tǒng)由兩個模塊組成:前饋感知模塊(左)和循環(huán)動態(tài)預(yù)測器模塊(右)組成。前饋感知模塊中,通過編碼器將圖像轉(zhuǎn)換為一組對象代碼,通過解碼器模塊將對象代碼解碼成對象的圖像。利用重建和原始圖像之間的差異來訓(xùn)練編碼器和解碼器的參數(shù)。循環(huán)動態(tài)模塊中,動態(tài)模塊通過預(yù)先訓(xùn)練好的解碼器對下一時(shí)刻的對象狀態(tài)進(jìn)行預(yù)測。
而這項(xiàng)研究使用的訓(xùn)練數(shù)據(jù)少到驚人,就讓AI擁有了穩(wěn)定的違反期望效應(yīng)。在面對超出5個直觀物理學(xué)概念的情況時(shí),PLATO仿真系統(tǒng)會顯示出魯棒(即具有穩(wěn)定性)的VoE效應(yīng)。這可以解釋一些直觀物理學(xué)的概念,但是這種效應(yīng)與嬰兒身上看到的現(xiàn)象并不完全一致。
研究發(fā)現(xiàn),雖然視覺動畫的經(jīng)驗(yàn)對智力發(fā)展有很重要的貢獻(xiàn),但不足以解釋我們在嬰兒身上看到的現(xiàn)象。
也就是說,智力發(fā)展并非全部依靠于“后天”的經(jīng)驗(yàn)和數(shù)據(jù)。要形成完整的智力,還需要一些先天的認(rèn)知,這項(xiàng)研究在“先天”派和“后天”派之間建立了一個有趣的中間立場。
當(dāng)視頻在直觀物理學(xué)上變得不可能時(shí),AI表現(xiàn)出的驚訝會顯著增加。
此外,PLATO仿真系統(tǒng)可以將符合直觀物理學(xué)的期望,歸納為一組與訓(xùn)練中不相同的對象和事件。其次,盡管只是接受了相對較少的視覺動畫訓(xùn)練,這個仿真系統(tǒng)也能夠成功地演示學(xué)習(xí),在針對嬰兒研究中也有相似的特征。
可以看到,將仿真建模的工作和發(fā)展心理學(xué)中的關(guān)鍵問題融合起來,研究人員得到了意想不到的效果和結(jié)論。
目前,研究團(tuán)隊(duì)正在將違反期望效應(yīng)的研究擴(kuò)展到神經(jīng)生理學(xué)領(lǐng)域,這可能為后續(xù)的研究開辟新的可能性,也為AI的發(fā)展提供了更多的可能。
參考資料
1. Can a computer think like a baby? Nature News.
2. Intuitive physics learning in a deep-learning model inspired by developmental psychology. https://doi.org/10.1038/s41562-022-01394-8.
來源:返樸 科普中國-創(chuàng)作培育計(jì)劃