版權(quán)歸原作者所有,如有侵權(quán),請(qǐng)聯(lián)系我們

會(huì)“聞味兒”的AI來(lái)了,工作量堪比氣味評(píng)價(jià)員連續(xù)工作70年!

HyperAI超神經(jīng)
原創(chuàng)
人工智能說(shuō)明書(shū),了解 AI 的功效和副作用。
收藏

內(nèi)容一覽:氣味總是縈繞我們身邊。然而,我們卻很難對(duì)氣味準(zhǔn)確描述。最近,Google Research 的子公司 Osmo 基于圖神經(jīng)網(wǎng)絡(luò),開(kāi)發(fā)了氣味分析AI。它可以根據(jù)化學(xué)分子的結(jié)構(gòu),對(duì)分子的氣味進(jìn)行預(yù)測(cè)?;谶@一 AI,研究人員繪制出了主氣味譜圖,建立了化學(xué)結(jié)構(gòu)與氣味之間的映射,有望為感知覺(jué)研究提供新方法。

神經(jīng)科學(xué)研究的一項(xiàng)基本問(wèn)題,是將外部刺激的物理特性映射到感知覺(jué)中。

視覺(jué)中,顏色是波長(zhǎng)的映射。聽(tīng)覺(jué)中,音調(diào)是頻率的映射。但在嗅覺(jué)中,氣味與物質(zhì)之間的映射卻很難建立。

目前,我們只能提取出一些基本的氣味,繪制出氣味輪 (fragrance wheel),再用這些基本氣味組成更復(fù)雜的氣味。


圖 1:氣味輪示意圖

然而,這種粗略的分類(lèi)很難用于科學(xué)研究。雖然已有氣味傳感器等技術(shù)用于氣味的監(jiān)測(cè),但這些傳感器仍只能識(shí)別特定氣味。現(xiàn)有的氣味鑒定很多時(shí)候仍需要?dú)馕对u(píng)價(jià)員的參與,這一過(guò)程耗時(shí)長(zhǎng),且可重復(fù)性差。

近期,Google Research 的分支 Osmo 公司基于圖神經(jīng)網(wǎng)絡(luò) (GNN) 開(kāi)發(fā)了一種氣味分析 AI。它可以根據(jù)化學(xué)分子的結(jié)構(gòu),對(duì)該分子的氣味進(jìn)行描述。這一模型在 53% 的化學(xué)分子、55% 的氣味描述詞判斷中優(yōu)于人類(lèi)。最終,研究人員利用這一模型繪制出了主氣味譜圖 POM (Principle Odor Map)。這一成果已發(fā)表于《Science》。

相關(guān)研究已發(fā)表于《Science》論文鏈接:https://www.science.org/doi/full/10.1126/science.ade4401

實(shí)驗(yàn)過(guò)程:

一、GNN 模型在多個(gè)架構(gòu)中表現(xiàn)穩(wěn)定

氣味本質(zhì)上是人們對(duì)于空氣中化學(xué)分子的感應(yīng)。因此,化學(xué)分子的結(jié)構(gòu)會(huì)對(duì)氣味產(chǎn)生影響。在 GNN 中,化學(xué)分子的結(jié)構(gòu)被分析整合,形成了一張代表整個(gè)分子的圖表。

分子結(jié)構(gòu)輸入到模型中后,GNN 會(huì)優(yōu)化不同化學(xué)結(jié)構(gòu)在特定氣味中的權(quán)重,最后通過(guò)預(yù)測(cè)層對(duì)分子的氣味進(jìn)行判斷,輸出對(duì)應(yīng)的氣味描述詞。

圖 2:GNN 模型示意圖

結(jié)合 Good Scents 和 Leffingwell & Associates 數(shù)據(jù)庫(kù) (GS-LF 數(shù)據(jù)庫(kù)),研究人員挑選出了 5,000 種分子作為模型的數(shù)據(jù)庫(kù)。每種分子可以由多個(gè)氣味描述,如奶酪味、果香味等。

圖 3:GS-LF 數(shù)據(jù)庫(kù)中的部分分子

隨后,將 GS-LF 數(shù)據(jù)庫(kù)按照 8 : 2 的比例劃分為訓(xùn)練集和測(cè)試集,訓(xùn)練集被進(jìn)一步劃分為五個(gè)交叉驗(yàn)證的子集。

使用貝葉斯優(yōu)化算法對(duì)數(shù)據(jù)進(jìn)行交叉驗(yàn)證,并對(duì) GNN 模型的超參數(shù)進(jìn)行優(yōu)化。優(yōu)化完成后,GNN 模型在多個(gè)架構(gòu)中表現(xiàn)穩(wěn)定,交叉驗(yàn)證集中 AUROC 最高為 0.89。

二、GNN 模型在氣味預(yù)測(cè)中優(yōu)于人類(lèi)

為驗(yàn)證模型對(duì)其他分子的分辨能力,研究人員對(duì) GNN 模型和人類(lèi)組進(jìn)行了氣味測(cè)試。

圖 4:不同模型對(duì)于 2,3-二氫苯并呋喃-5-甲醛氣味的判斷

A:GNN 模型;

B:RF 模型;

C:人類(lèi)組;

D:不同評(píng)價(jià)員對(duì) 2,3-二氫苯并呋喃-5-甲醛氣味的評(píng)價(jià)。

對(duì)于 53% 的分子,GNN 模型的氣味預(yù)測(cè)結(jié)果優(yōu)于人類(lèi)組的中位數(shù)。而目前最先進(jìn)的算法,基于計(jì)數(shù)摩根指紋法 (cFP, count-based fingerprint) 的隨機(jī)森林模型 (RF),僅在 41% 的分子氣味預(yù)測(cè)中優(yōu)于人類(lèi)組。

圖 5:不同模型的預(yù)測(cè)結(jié)果與人類(lèi)組平均值的相關(guān)性

隨后,研究人員將 GNN 模型的預(yù)測(cè)結(jié)果按氣味描述詞分類(lèi)。除麝香外,GNN 模型對(duì)分子氣味的預(yù)測(cè)結(jié)果均在人類(lèi)組的誤差分布中,且在 30 個(gè)氣味描述詞的預(yù)測(cè)結(jié)果中優(yōu)于人類(lèi)組中位數(shù)。

圖 6:GNN 模型、RF 模型和人類(lèi)組對(duì)不同分子的判斷結(jié)果

GNN 模型的預(yù)測(cè)結(jié)果會(huì)受到分子的結(jié)構(gòu)影響,因此對(duì)于含硫基的大蒜味和含胺的魚(yú)腥味,GNN 模型有著較高的預(yù)測(cè)準(zhǔn)確率。而麝香至少包含五種不同的結(jié)構(gòu),大環(huán)、多環(huán)、硝基、甾體和直鏈,因此 GNN 模型的預(yù)測(cè)結(jié)果最差。

而人類(lèi)組的表現(xiàn)則會(huì)受到熟悉度的影響。他們對(duì)堅(jiān)果、大蒜、干酪等常規(guī)的食物香味判斷較為一致,而在麝香和干草味上分歧較大。

同時(shí),描述詞在訓(xùn)練集中的數(shù)量也會(huì)影響 GNN 模型對(duì)某一氣味的預(yù)測(cè)。出現(xiàn)次數(shù)夠多時(shí),GNN 模型可以對(duì)復(fù)雜的結(jié)構(gòu)進(jìn)行較準(zhǔn)確的預(yù)測(cè),如果香、花香和甜味。

圖 7:訓(xùn)練數(shù)據(jù)對(duì) GNN 模型預(yù)測(cè)結(jié)果與人類(lèi)組平均值相關(guān)性的影響

然而,對(duì)于出現(xiàn)次數(shù)較少的味道,GNN 模型的正確率兩極分化。對(duì)于魚(yú)腥味、薄荷和樟腦的預(yù)測(cè)正確率較高,但對(duì)臭氧、醋酸味和發(fā)酵的味道判斷較差。

三、GNN 模型繪制主氣味譜圖

對(duì) GNN 模型的性能進(jìn)行驗(yàn)證后,研究人員進(jìn)一步將其用在了不同嗅覺(jué)任務(wù)中。

首先,他們測(cè)試了模型對(duì)結(jié)構(gòu)相似的分子的判斷能力。模型已知一種分子的氣味后,需要對(duì)結(jié)構(gòu)相似、氣味不同和結(jié)構(gòu)不同、氣味相似分子的氣味進(jìn)行判斷。對(duì)于這種反常的結(jié)構(gòu)-氣味關(guān)系,GNN 模型有 50% 的判斷正確率,而 RF 模型僅有 19%。

圖 8:一組結(jié)構(gòu)或氣味與已知分子接近的「三胞胎」

在獲得了穩(wěn)定的結(jié)構(gòu)-氣味關(guān)系之后,研究人員開(kāi)始嘗試?yán)L制大規(guī)模的氣味譜圖。他們完成了約 500,000 種分子的主氣味譜圖 (POM)。這些分子在科研領(lǐng)域尚不為人知,甚至絕大多數(shù)未被合成出來(lái)。

然而它們?cè)谧V圖中的位置可以直接被 GNN 模型計(jì)算出來(lái),因此可以繪制出很大規(guī)模的氣味譜圖。如果讓一名訓(xùn)練過(guò)的人類(lèi)評(píng)價(jià)員對(duì)這些分子的氣味進(jìn)行評(píng)估,大概需要連續(xù)工作 70 年。

圖 9:主氣味譜圖

圖中,每個(gè)分子氣味的坐標(biāo)由 GNN 模型確定,其顏色的 RGB 值對(duì)應(yīng)其在預(yù)測(cè)氣味矩陣中前三個(gè)維度的坐標(biāo)。

四、普魯斯特效應(yīng):嗅覺(jué)與記憶的聯(lián)動(dòng)

當(dāng)我們聞到特定氣味時(shí),就會(huì)想起曾經(jīng)的記憶,氣味會(huì)使這一記憶更加形象、更富情感。作家馬塞爾·普魯斯特在《追憶似水年華》中提到,敘述者聞到浸在茶水中的瑪?shù)氯R娜蛋糕的味道時(shí),「往事浮上心頭」。因此,這一現(xiàn)象也被稱(chēng)為普魯斯特效應(yīng)。

嗅覺(jué)與記憶在神經(jīng)系統(tǒng)中的聯(lián)系較其他感知覺(jué)更為密切。它是唯一一個(gè)直接與情感腦區(qū)、記憶腦區(qū)直接相連的感覺(jué)系統(tǒng)。嗅覺(jué)細(xì)胞被激活后,神經(jīng)沖動(dòng)會(huì)直接傳遞到梨狀皮層。這一腦區(qū)包括負(fù)責(zé)恐懼和其他情感的杏仁核和負(fù)責(zé)記憶的海馬旁回。

圖 10:嗅覺(jué)環(huán)路的組成

Primary olfactory cortex:初級(jí)嗅皮層;

Amygadala:杏仁核;

Hippocampus:海馬。

正是因?yàn)樾嵊X(jué)與記憶、情感之間有著如此密切的聯(lián)系,香水成了人們外出會(huì)面的必備品。也許對(duì)方再次見(jiàn)到你已經(jīng)叫不出你的名字,但聞到這個(gè)味道,他一定會(huì)想起與你相見(jiàn)的那個(gè)情景。

借助 AI,人們對(duì)于分子結(jié)構(gòu)與氣味之間的聯(lián)系有了更深入的了解。也許有一天,我們真的能調(diào)配出自己最熟悉的味道。打開(kāi)瓶蓋,就能搭乘時(shí)光機(jī)器,讓記憶回到過(guò)去。

參考鏈接:

[1]https://perfumersupplyhouse.com/2014/01/09/fragrance-creation-wheels-for-you/

[2]https://www.slideserve.com/cora-schroeder/functional-neuroanatomy

作者 | 雪菜

編輯 | 三羊

本文首發(fā)于 HyperAI 超神經(jīng)微信公眾平臺(tái)~

評(píng)論
愛(ài)科普的張小濤
大學(xué)士級(jí)
AI技術(shù)越來(lái)越發(fā)達(dá),可以聞味的AI出現(xiàn)了,但是技術(shù)還需要繼續(xù)努力,也許未來(lái)的一天,我們真的可以調(diào)配出自己最熟悉的味道,讓我們記憶中的美好可以再現(xiàn)。
2023-09-14
科普62e722ca93cda
進(jìn)士級(jí)
化學(xué)物質(zhì)的氣味與結(jié)構(gòu)之間,存在著特殊的聯(lián)系。這正是人工智能預(yù)測(cè)氣味的“抓手”,也是其可與人類(lèi)調(diào)香師一比高下的訣竅所在。
2023-09-14
內(nèi)蒙愛(ài)較真的科普老漢
少師級(jí)
聞到這個(gè)味道,他一定會(huì)想起與你相見(jiàn)的那個(gè)情景。
2023-09-13