2000 多年前“消失的”古卷文字,如今被 AI 重現(xiàn)了。
近日,一名 21 歲計算機科學(xué)專業(yè)的學(xué)生利用人工智能(AI)技術(shù)在未打開的赫庫蘭尼姆古卷中發(fā)現(xiàn)了第一個單詞。
他就是內(nèi)布拉斯加大學(xué)林肯分校的 Luke Farritor,他開發(fā)了一種機器學(xué)習(xí)算法,可以檢測卷起的紙莎草紙上的希臘字母,其中包括 πορphiυρα?(porphyras),意思是“紫色”。
Luke 通過利用表面紋理的微妙、小范圍差異來訓(xùn)練神經(jīng)網(wǎng)絡(luò)并突出墨水,成功破譯并讀取 4 平方厘米區(qū)域內(nèi)的 10 多個字符,贏得了 4 萬美元的 First Letters 大獎。
圖|Luke Farritor 的第一份提交材料
意大利那不勒斯大學(xué)的紙莎草學(xué)家、審查 Farritor 研究成果的學(xué)術(shù)委員會成員 Federica Nicolardi 表示:“當(dāng)我看到第一張圖像時,我感到震驚,我實際上可以從卷軸的內(nèi)部看到一些東西?!?/strong>
赫庫蘭尼姆古卷是龐貝古城附近一座私人圖書館中收藏的古代卷軸,因公元 79 年維蘇威火山噴發(fā)而被掩埋并碳化。近 2000 年來,這座唯一幸存的古代圖書館一直被埋在地下 20 米厚的火山泥下。18 世紀(jì),它們被挖掘出來,雖然在某種程度上得到了保存,但非常脆弱,如果處理不當(dāng)就會變成灰塵。
如何閱讀無法打開的卷軸?數(shù)百年來,這個問題一直沒有答案。
2019 年,肯塔基大學(xué) EduceLab 的 Brent Seales 教授在粒子加速器中對赫庫蘭尼姆古卷進(jìn)行了成像,生成分辨率高達(dá) 4 μm 的 3D CT 掃描。他的團(tuán)隊還掃描并拍攝了帶有可見墨水的分離卷軸碎片,從而提供了地面真實數(shù)據(jù)集。Seales 教授的研究生 Stephen Parsons 致力于使用機器學(xué)習(xí)模型從 CT 掃描中檢測墨水,并在分離的碎片上取得了成功。
這一成功引起了科技企業(yè)家 Nat Friedman 和 Daniel Gross 的注意,他們發(fā)起了維蘇威火山挑戰(zhàn)賽以加速這一進(jìn)展。他們于 2023 年 3 月發(fā)起了一場公開競賽,除了 70 萬美元的大獎外,還為開源工具和技術(shù)的開發(fā)頒發(fā)了幾個較小的獎項。
后來,一小群研究團(tuán)隊開始使用最初由 EduceLab 構(gòu)建并由社區(qū)改進(jìn)的工具來繪制卷軸的 3D 結(jié)構(gòu)。到今年七月,數(shù)百平方厘米的古卷被分割并被“幾乎壓平”。
八月初,前 JPL 初創(chuàng)公司創(chuàng)始人 Casey Handmer 寫了一篇博客文章,講述自己發(fā)現(xiàn)了一種看起來像墨水的“裂紋圖案”。Casey 是 2000 年來第一個在未打開的卷軸中發(fā)現(xiàn)墨水和一封信的人。
圖|顯示墨水位置的注釋(來源:Casey 的博客文章)
Luke Farritor 是一名大學(xué)生,同時也是 SpaceX 暑期實習(xí)生,他從 Dwarkesh Patel 接受 Nat 的播客采訪中聽說了維蘇威火山挑戰(zhàn)賽。
他看到的 Casey 裂紋模式在 Discord 中被討論,并開始在深夜訓(xùn)練關(guān)于裂紋模式的機器學(xué)習(xí)模型。隨著每一個新裂紋的發(fā)現(xiàn),模型都會得到改進(jìn),在卷軸上就可以顯示出更多的裂紋。
Luke 發(fā)現(xiàn)了幾十個墨跡筆畫以及一些完整的字母,可以將其標(biāo)記并用作訓(xùn)練數(shù)據(jù)。不久之后,卷軸就露出了肉眼看不見的裂紋痕跡。很快,這些痕跡開始形成字母和實際單詞的暗示。
與此同時,另一位參賽者、柏林的埃及生物機器人研究生 Youssef Nader 則采取了不同的方法。受到 Casey 和 Luke 發(fā)現(xiàn)的激勵,他篩選了 Kaggle 上墨水檢測獎的獲獎作品,該獎的重點是改進(jìn) Stephen Parsons 在分離片段中的機器學(xué)習(xí)方法。他使用域轉(zhuǎn)移技術(shù)使這些模型適應(yīng)卷軸:對卷軸數(shù)據(jù)進(jìn)行無監(jiān)督預(yù)訓(xùn)練,然后對片段標(biāo)簽進(jìn)行微調(diào)。
他提交了“墨水檢測后續(xù)獎(Ink Detection Followup Prize)”的想法并獲得了一個小獎。幾周后,Youssef 向第一封信獎提交了自己的作品。他看到了 Luke 在 Twitter 和 Discord上分享的早期結(jié)果,并決定關(guān)注卷軸中的同一區(qū)域。
圖|Youssef Nader 最終提交的材料
盡管完全沒有依賴 Casey 手動尋找裂紋的方法,但是通過 Kaggle 競賽的修改模型,他成功地找到了一些字母。然后,他在標(biāo)簽數(shù)據(jù)中注釋了看起來像字母形狀的內(nèi)容。
分割團(tuán)隊和參賽者不斷取得進(jìn)展,幾天前 Youssef 的模型生成了一張清晰度和尺寸令人震驚的新圖像(如下圖所示)。
威尼斯卡福斯卡里大學(xué)的古希臘和羅馬歷史學(xué)家 Thea Sommerschield 向《自然》雜志解釋說,這一發(fā)現(xiàn)可能“徹底改變我們對古代歷史和文學(xué)的認(rèn)識”。
參考鏈接:
https://www.nature.com/articles/d41586-023-03212-1
https://scrollprize.org/firstletters
https://people.com/21-year-old-wins-usd40k-after-using-ai-to-read-first-word-on-2-000-year-old-papyrus-scroll-8358107
作者:閆一米
編輯:學(xué)術(shù)君