內(nèi)容一覽:氣味總是縈繞我們身邊。然而,我們卻很難對(duì)氣味準(zhǔn)確描述。最近,Google Research 的子公司 Osmo 基于圖神經(jīng)網(wǎng)絡(luò),開(kāi)發(fā)了氣味分析AI。它可以根據(jù)化學(xué)分子的結(jié)構(gòu),對(duì)分子的氣味進(jìn)行預(yù)測(cè)?;谶@一 AI,研究人員繪制出了主氣味譜圖,建立了化學(xué)結(jié)構(gòu)與氣味之間的映射,有望為感知覺(jué)研究提供新方法。
神經(jīng)科學(xué)研究的一項(xiàng)基本問(wèn)題,是將外部刺激的物理特性映射到感知覺(jué)中。
視覺(jué)中,顏色是波長(zhǎng)的映射。聽(tīng)覺(jué)中,音調(diào)是頻率的映射。但在嗅覺(jué)中,氣味與物質(zhì)之間的映射卻很難建立。
目前,我們只能提取出一些基本的氣味,繪制出氣味輪 (fragrance wheel),再用這些基本氣味組成更復(fù)雜的氣味。
圖 1:氣味輪示意圖
然而,這種粗略的分類(lèi)很難用于科學(xué)研究。雖然已有氣味傳感器等技術(shù)用于氣味的監(jiān)測(cè),但這些傳感器仍只能識(shí)別特定氣味。現(xiàn)有的氣味鑒定很多時(shí)候仍需要?dú)馕对u(píng)價(jià)員的參與,這一過(guò)程耗時(shí)長(zhǎng),且可重復(fù)性差。
近期,Google Research 的分支 Osmo 公司基于圖神經(jīng)網(wǎng)絡(luò) (GNN) 開(kāi)發(fā)了一種氣味分析 AI。它可以根據(jù)化學(xué)分子的結(jié)構(gòu),對(duì)該分子的氣味進(jìn)行描述。這一模型在 53% 的化學(xué)分子、55% 的氣味描述詞判斷中優(yōu)于人類(lèi)。最終,研究人員利用這一模型繪制出了主氣味譜圖 POM (Principle Odor Map)。這一成果已發(fā)表于《Science》。
相關(guān)研究已發(fā)表于《Science》論文鏈接:https://www.science.org/doi/full/10.1126/science.ade4401
實(shí)驗(yàn)過(guò)程:
一、GNN 模型在多個(gè)架構(gòu)中表現(xiàn)穩(wěn)定
氣味本質(zhì)上是人們對(duì)于空氣中化學(xué)分子的感應(yīng)。因此,化學(xué)分子的結(jié)構(gòu)會(huì)對(duì)氣味產(chǎn)生影響。在 GNN 中,化學(xué)分子的結(jié)構(gòu)被分析整合,形成了一張代表整個(gè)分子的圖表。
分子結(jié)構(gòu)輸入到模型中后,GNN 會(huì)優(yōu)化不同化學(xué)結(jié)構(gòu)在特定氣味中的權(quán)重,最后通過(guò)預(yù)測(cè)層對(duì)分子的氣味進(jìn)行判斷,輸出對(duì)應(yīng)的氣味描述詞。
圖 2:GNN 模型示意圖
結(jié)合 Good Scents 和 Leffingwell & Associates 數(shù)據(jù)庫(kù) (GS-LF 數(shù)據(jù)庫(kù)),研究人員挑選出了 5,000 種分子作為模型的數(shù)據(jù)庫(kù)。每種分子可以由多個(gè)氣味描述,如奶酪味、果香味等。
圖 3:GS-LF 數(shù)據(jù)庫(kù)中的部分分子
隨后,將 GS-LF 數(shù)據(jù)庫(kù)按照 8 : 2 的比例劃分為訓(xùn)練集和測(cè)試集,訓(xùn)練集被進(jìn)一步劃分為五個(gè)交叉驗(yàn)證的子集。
使用貝葉斯優(yōu)化算法對(duì)數(shù)據(jù)進(jìn)行交叉驗(yàn)證,并對(duì) GNN 模型的超參數(shù)進(jìn)行優(yōu)化。優(yōu)化完成后,GNN 模型在多個(gè)架構(gòu)中表現(xiàn)穩(wěn)定,交叉驗(yàn)證集中 AUROC 最高為 0.89。
二、GNN 模型在氣味預(yù)測(cè)中優(yōu)于人類(lèi)
為驗(yàn)證模型對(duì)其他分子的分辨能力,研究人員對(duì) GNN 模型和人類(lèi)組進(jìn)行了氣味測(cè)試。
圖 4:不同模型對(duì)于 2,3-二氫苯并呋喃-5-甲醛氣味的判斷
A:GNN 模型;
B:RF 模型;
C:人類(lèi)組;
D:不同評(píng)價(jià)員對(duì) 2,3-二氫苯并呋喃-5-甲醛氣味的評(píng)價(jià)。
對(duì)于 53% 的分子,GNN 模型的氣味預(yù)測(cè)結(jié)果優(yōu)于人類(lèi)組的中位數(shù)。而目前最先進(jìn)的算法,基于計(jì)數(shù)摩根指紋法 (cFP, count-based fingerprint) 的隨機(jī)森林模型 (RF),僅在 41% 的分子氣味預(yù)測(cè)中優(yōu)于人類(lèi)組。
圖 5:不同模型的預(yù)測(cè)結(jié)果與人類(lèi)組平均值的相關(guān)性
隨后,研究人員將 GNN 模型的預(yù)測(cè)結(jié)果按氣味描述詞分類(lèi)。除麝香外,GNN 模型對(duì)分子氣味的預(yù)測(cè)結(jié)果均在人類(lèi)組的誤差分布中,且在 30 個(gè)氣味描述詞的預(yù)測(cè)結(jié)果中優(yōu)于人類(lèi)組中位數(shù)。
圖 6:GNN 模型、RF 模型和人類(lèi)組對(duì)不同分子的判斷結(jié)果
GNN 模型的預(yù)測(cè)結(jié)果會(huì)受到分子的結(jié)構(gòu)影響,因此對(duì)于含硫基的大蒜味和含胺的魚(yú)腥味,GNN 模型有著較高的預(yù)測(cè)準(zhǔn)確率。而麝香至少包含五種不同的結(jié)構(gòu),大環(huán)、多環(huán)、硝基、甾體和直鏈,因此 GNN 模型的預(yù)測(cè)結(jié)果最差。
而人類(lèi)組的表現(xiàn)則會(huì)受到熟悉度的影響。他們對(duì)堅(jiān)果、大蒜、干酪等常規(guī)的食物香味判斷較為一致,而在麝香和干草味上分歧較大。
同時(shí),描述詞在訓(xùn)練集中的數(shù)量也會(huì)影響 GNN 模型對(duì)某一氣味的預(yù)測(cè)。出現(xiàn)次數(shù)夠多時(shí),GNN 模型可以對(duì)復(fù)雜的結(jié)構(gòu)進(jìn)行較準(zhǔn)確的預(yù)測(cè),如果香、花香和甜味。
圖 7:訓(xùn)練數(shù)據(jù)對(duì) GNN 模型預(yù)測(cè)結(jié)果與人類(lèi)組平均值相關(guān)性的影響
然而,對(duì)于出現(xiàn)次數(shù)較少的味道,GNN 模型的正確率兩極分化。對(duì)于魚(yú)腥味、薄荷和樟腦的預(yù)測(cè)正確率較高,但對(duì)臭氧、醋酸味和發(fā)酵的味道判斷較差。
三、GNN 模型繪制主氣味譜圖
對(duì) GNN 模型的性能進(jìn)行驗(yàn)證后,研究人員進(jìn)一步將其用在了不同嗅覺(jué)任務(wù)中。
首先,他們測(cè)試了模型對(duì)結(jié)構(gòu)相似的分子的判斷能力。模型已知一種分子的氣味后,需要對(duì)結(jié)構(gòu)相似、氣味不同和結(jié)構(gòu)不同、氣味相似分子的氣味進(jìn)行判斷。對(duì)于這種反常的結(jié)構(gòu)-氣味關(guān)系,GNN 模型有 50% 的判斷正確率,而 RF 模型僅有 19%。
圖 8:一組結(jié)構(gòu)或氣味與已知分子接近的「三胞胎」
在獲得了穩(wěn)定的結(jié)構(gòu)-氣味關(guān)系之后,研究人員開(kāi)始嘗試?yán)L制大規(guī)模的氣味譜圖。他們完成了約 500,000 種分子的主氣味譜圖 (POM)。這些分子在科研領(lǐng)域尚不為人知,甚至絕大多數(shù)未被合成出來(lái)。
然而它們?cè)谧V圖中的位置可以直接被 GNN 模型計(jì)算出來(lái),因此可以繪制出很大規(guī)模的氣味譜圖。如果讓一名訓(xùn)練過(guò)的人類(lèi)評(píng)價(jià)員對(duì)這些分子的氣味進(jìn)行評(píng)估,大概需要連續(xù)工作 70 年。
圖 9:主氣味譜圖
圖中,每個(gè)分子氣味的坐標(biāo)由 GNN 模型確定,其顏色的 RGB 值對(duì)應(yīng)其在預(yù)測(cè)氣味矩陣中前三個(gè)維度的坐標(biāo)。
四、普魯斯特效應(yīng):嗅覺(jué)與記憶的聯(lián)動(dòng)
當(dāng)我們聞到特定氣味時(shí),就會(huì)想起曾經(jīng)的記憶,氣味會(huì)使這一記憶更加形象、更富情感。作家馬塞爾·普魯斯特在《追憶似水年華》中提到,敘述者聞到浸在茶水中的瑪?shù)氯R娜蛋糕的味道時(shí),「往事浮上心頭」。因此,這一現(xiàn)象也被稱(chēng)為普魯斯特效應(yīng)。
嗅覺(jué)與記憶在神經(jīng)系統(tǒng)中的聯(lián)系較其他感知覺(jué)更為密切。它是唯一一個(gè)直接與情感腦區(qū)、記憶腦區(qū)直接相連的感覺(jué)系統(tǒng)。嗅覺(jué)細(xì)胞被激活后,神經(jīng)沖動(dòng)會(huì)直接傳遞到梨狀皮層。這一腦區(qū)包括負(fù)責(zé)恐懼和其他情感的杏仁核和負(fù)責(zé)記憶的海馬旁回。
圖 10:嗅覺(jué)環(huán)路的組成
Primary olfactory cortex:初級(jí)嗅皮層;
Amygadala:杏仁核;
Hippocampus:海馬。
正是因?yàn)樾嵊X(jué)與記憶、情感之間有著如此密切的聯(lián)系,香水成了人們外出會(huì)面的必備品。也許對(duì)方再次見(jiàn)到你已經(jīng)叫不出你的名字,但聞到這個(gè)味道,他一定會(huì)想起與你相見(jiàn)的那個(gè)情景。
借助 AI,人們對(duì)于分子結(jié)構(gòu)與氣味之間的聯(lián)系有了更深入的了解。也許有一天,我們真的能調(diào)配出自己最熟悉的味道。打開(kāi)瓶蓋,就能搭乘時(shí)光機(jī)器,讓記憶回到過(guò)去。
參考鏈接:
[1]https://perfumersupplyhouse.com/2014/01/09/fragrance-creation-wheels-for-you/
[2]https://www.slideserve.com/cora-schroeder/functional-neuroanatomy
作者 | 雪菜
編輯 | 三羊
本文首發(fā)于 HyperAI 超神經(jīng)微信公眾平臺(tái)~