3月10日消息,今日,DeepMind的“AI+科學(xué)”研究,再登國(guó)際學(xué)術(shù)頂刊Nature的封面!
DeepMind的深度神經(jīng)網(wǎng)絡(luò)Ithaca,能從受損文物中破譯古希臘文字,準(zhǔn)確率達(dá)到62%,在識(shí)別其原始位置方面的準(zhǔn)確率達(dá)到71%,還能將古文字年代鎖定在其真實(shí)日期范圍的30年內(nèi)。
據(jù)悉,這是第一個(gè)能夠恢復(fù)受損銘文的缺失文字、識(shí)別其原始位置并幫助確定其書(shū)寫(xiě)日期的深度神經(jīng)網(wǎng)絡(luò)。
研究結(jié)果表明,AI能幫助歷史學(xué)家更好地解讀銘文,以助力對(duì)古代歷史的論證與理解。當(dāng)前, 歷史學(xué)家已經(jīng)使用這個(gè)工具,來(lái)重新評(píng)估希臘歷史上的重要時(shí)期。
為了讓研究人員、教育工作者、博物館工作人員和其他人能夠廣泛使用其研究,DeepMind與谷歌云和谷歌Arts & Culture合作,推出了Ithaca的免費(fèi)互動(dòng)版本,并開(kāi)放了其代碼、預(yù)訓(xùn)練的模型和一個(gè)交互式的協(xié)作實(shí)驗(yàn)室筆記本。
開(kāi)源地址:https://github.com/deepmind/ithaca
互動(dòng)版本:https://ithaca.deepmind.com
01. 古文字遭破壞?AI能修復(fù)這個(gè)bug
文字的誕生標(biāo)志著歷史的開(kāi)端,對(duì)人類理解過(guò)去的文明和今天生活的世界至關(guān)重要。
例如,2500多年前,希臘人開(kāi)始在石頭、陶器和金屬上書(shū)寫(xiě),記錄從租約、法律到日歷和預(yù)言的一切,讓人們對(duì)地中海地區(qū)有了詳細(xì)的了解。不幸的是,這是一個(gè)不完整的記錄。
許多幸存下來(lái)的銘文在幾個(gè)世紀(jì)的時(shí)間里遭到了破壞,或者從原來(lái)的位置被移走了。此外,現(xiàn)代年代測(cè)定技術(shù),如放射性碳年代測(cè)定法,無(wú)法在這些材料上使用,這使得解讀銘文既困難又費(fèi)時(shí)。
為此,DeepMind與威尼斯Ca’Foscari大學(xué)人文系、牛津大學(xué)古典系、雅典經(jīng)濟(jì)與商業(yè)大學(xué)信息學(xué)系合作,一起探索如何用AI幫助歷史學(xué)家更好地解讀這些銘文。
深度神經(jīng)網(wǎng)絡(luò)Ithaca即是他們的最新成果,它以荷馬史詩(shī)《奧德賽》中的希臘島嶼命名,在DeepMind此前專注于文本修復(fù)的系統(tǒng)Pythia基礎(chǔ)上擴(kuò)展而成。
從實(shí)驗(yàn)結(jié)果來(lái)看,這個(gè)新算法展示了AI方法能克服現(xiàn)有恢復(fù)銘文方法的約束,輔助古語(yǔ)言研究,并幫助對(duì)古代歷史有更豐富的理解。
02. 大幅提升修復(fù)受損古文字的準(zhǔn)確率
Ithaca采用了古希臘語(yǔ)言和整個(gè)古代地中海世界的銘文進(jìn)行訓(xùn)練,訓(xùn)練數(shù)據(jù)來(lái)自帕卡德人文學(xué)院提供的最大的希臘銘文數(shù)字?jǐn)?shù)據(jù)集。
這一選擇有兩個(gè)主要原因。首先,希臘銘文記錄的內(nèi)容和背景的變異性使其成為語(yǔ)言處理的巨大挑戰(zhàn);其次是因?yàn)楣畔ED語(yǔ)數(shù)字化語(yǔ)料庫(kù)的可用性,這是訓(xùn)練機(jī)器學(xué)習(xí)模型的基本資源。
自然語(yǔ)言處理(NLP)模型通常用單詞(word)進(jìn)行訓(xùn)練,因?yàn)樗鼈冊(cè)诰渥又谐霈F(xiàn)的順序和它們之間的關(guān)系提供了額外的上下文和含義。然而,許多歷史學(xué)家有興趣讓Ithaca進(jìn)行分析的銘文都已損壞,而且經(jīng)常缺失文本塊。
DeepMind使用單詞和單個(gè)字符作為輸入來(lái)訓(xùn)練模型,以確保Ithaca用這類文本時(shí)能正常工作。模型核心的稀疏自我注意機(jī)制并行地評(píng)估這兩個(gè)輸入,允許Ithaca根據(jù)需要評(píng)估銘文。
▲Ithaca的架構(gòu)(文本的損壞部分用“-”表示)
實(shí)驗(yàn)結(jié)果表明,Ithaca的設(shè)計(jì)決策和可視化輔助使研究人員更容易解釋結(jié)果。
單獨(dú)工作時(shí),Ithaca在修復(fù)受損文字方面達(dá)到了62%的準(zhǔn)確率;與DeepMind合作的歷史學(xué)家在單獨(dú)修復(fù)古代文獻(xiàn)時(shí),準(zhǔn)確率為25%;而當(dāng)歷史學(xué)家與Ithaca合作時(shí),修復(fù)受損文字的準(zhǔn)確率提高至72%。
▲Ithaca的實(shí)驗(yàn)結(jié)果(CER和年份,數(shù)值越低↓越好)
Ithaca還可以確定銘文書(shū)寫(xiě)的原始地理位置,準(zhǔn)確率達(dá)到71%,并能將銘文的書(shū)寫(xiě)年代縮小至與歷史學(xué)家提出的日期相差30年以內(nèi)。
研究人員認(rèn)為,AI和歷史學(xué)家之間的這種合作,可能有助于改變對(duì)古代世界的研究,比如幫助推進(jìn)歷史解釋,建立歷史事件的相對(duì)日期,乃至為當(dāng)前的方法論爭(zhēng)鳴做貢獻(xiàn)。
例如,目前歷史學(xué)家對(duì)雅典頒布的一系列重要法令的日期存在分歧,這些法令是在蘇格拉底和伯里克利等著名人物在世的時(shí)期頒布的。
這些法令一直被認(rèn)為是在公元前446/445年之前寫(xiě)的,盡管有新的證據(jù)表明日期是公元前420年。雖然看起來(lái)差別不大,但這些法令對(duì)于理解古典雅典的政治史至關(guān)重要。
DeepMind采用的訓(xùn)練數(shù)據(jù)集包含公元前446/445年的早期圖像。為了測(cè)試Ithaca的預(yù)測(cè),研究人員在一個(gè)不包含日期銘文的數(shù)據(jù)集上對(duì)它進(jìn)行了重新訓(xùn)練,然后提交這些沒(méi)被包含在數(shù)據(jù)集中的文字進(jìn)行分析。結(jié)果,Ithaca對(duì)這些法令的平均預(yù)測(cè)日期是公元前421年,這與新證據(jù)推測(cè)的日期一致。
由此可見(jiàn),機(jī)器學(xué)習(xí)能幫助圍繞希臘歷史上最重要時(shí)刻之一的辯論提供支撐。
03. 提供可視化輔助工具,直觀呈現(xiàn)AI分析的結(jié)果
為了將Ithaca作為研究工具的價(jià)值最大化,研究團(tuán)隊(duì)還創(chuàng)造了一些可視化輔助工具,來(lái)確保歷史學(xué)家能夠輕松地解釋Ithaca輸出的結(jié)果。
▲Ithaca的輸出
(1)修復(fù)假設(shè):Ithaca為文本修復(fù)任務(wù)生成了幾個(gè)預(yù)測(cè)假設(shè),供歷史學(xué)家利用專業(yè)知識(shí)進(jìn)行選擇。
(2)地理屬性:Ithaca向歷史學(xué)家展示了它的不確定性,它給出了所有可能預(yù)測(cè)的概率分布,而不是單一的輸出。它提供了84個(gè)不同古代地區(qū)的概率,代表其確定性水平,并將這些結(jié)果可視化顯示在地圖上,以闡明古代世界潛在的地理聯(lián)系。
(3)時(shí)間歸屬:當(dāng)確定文本的創(chuàng)作日期時(shí),Ithaca會(huì)產(chǎn)生一個(gè)從公元前800年到公元800年所有幾十年的預(yù)測(cè)日期分布。歷史學(xué)家能看到模型對(duì)特定日期范圍的可信度,這可能提供有價(jià)值的歷史見(jiàn)解。
(4)顯著性圖:為了將結(jié)果傳達(dá)給歷史學(xué)家,Ithaca使用了計(jì)算機(jī)視覺(jué)中常用的一種技術(shù),它可以識(shí)別哪些輸入序列對(duì)預(yù)測(cè)的貢獻(xiàn)最大。該輸出對(duì)影響Ithaca關(guān)于缺失文本、位置和日期預(yù)測(cè)的單詞用不同的顏色加以突出。
▲由顏色標(biāo)注突出顯示了Ithaca聚焦的詞
04. 結(jié)語(yǔ):AI與人文學(xué)科的合作,正釋放出更大潛力
DeepMind研究團(tuán)隊(duì)相信,這只是像Ithaca這樣的AI工具的開(kāi)始。
古希臘只是全球文明圖景的一部分,DeepMind還在研究由其他古代語(yǔ)言訓(xùn)練的Ithaca版本,歷史學(xué)家已經(jīng)可以在當(dāng)前的建筑中使用他們的數(shù)據(jù)集來(lái)研究阿卡德語(yǔ)、希伯來(lái)語(yǔ)、瑪雅語(yǔ)等古代文字體系。
我國(guó)的研究團(tuán)隊(duì)也早已開(kāi)展了用AI識(shí)別古文字的研究。在2021年世界人工智能大會(huì)上,國(guó)內(nèi)智能文字識(shí)別領(lǐng)域頭部企業(yè)合合信息就曾展示一種將古代象形文字甲骨文識(shí)別并翻譯成現(xiàn)代漢字的AI技術(shù),這不僅有助于實(shí)現(xiàn)甲骨文研究資料電子化、數(shù)據(jù)化,也為破解甲骨文謎題提供了新的數(shù)字化手段。
▲合合信息用AI識(shí)別翻譯甲骨文
我們期待看到更多諸如此類的研究,可以釋放AI和人文學(xué)科之間的合作潛力,改變歷史學(xué)家研究和確定人類歷史重要時(shí)期的方式,幫助我們獲得對(duì)古代文明更豐富的認(rèn)知。
來(lái)源:DeepMind,Nature
關(guān)鍵詞: 歷史學(xué)家
- 發(fā)力蛋制品 勁仔食品小蛋圓圓鵪鶉蛋入圍iSEE全球創(chuàng)新品牌百?gòu)?qiáng)榜
- 新捷途X70S顏值與實(shí)力全面升級(jí),將于4月29日發(fā)布預(yù)售
- 奶茶行業(yè)品牌多、競(jìng)爭(zhēng)大 冰雪時(shí)光靠什么贏得掌聲?
- 千千惠生活全國(guó)上線“隨心退”功能,消費(fèi)者可無(wú)條件隨時(shí)退款
- 杭州臨平區(qū):創(chuàng)建市場(chǎng)疫情防控“三色”預(yù)警分類管理機(jī)制 動(dòng)態(tài)防控監(jiān)測(cè)預(yù)警
- 海南開(kāi)展防止一次性不可降解塑料制品入島聯(lián)合執(zhí)法行動(dòng) 對(duì)當(dāng)事人立案調(diào)查
- 河北保定市場(chǎng)監(jiān)管局創(chuàng)新應(yīng)用信用分級(jí)分類監(jiān)管 提升監(jiān)管效能助力營(yíng)商環(huán)境優(yōu)化
- 原料新鮮 用料扎實(shí) 冰雪時(shí)光穩(wěn)扎茶飲下沉市場(chǎng)
- 陜西省市場(chǎng)監(jiān)管局連續(xù)三年榮獲平安陜西建設(shè)先進(jìn)集體 充分發(fā)揮市場(chǎng)監(jiān)管職能優(yōu)勢(shì)
- 浙江杭州:西湖食品安全風(fēng)險(xiǎn)綜合治理中心掛牌成立 健全機(jī)制規(guī)范運(yùn)行為
- 湖北恩施州鶴峰縣市場(chǎng)監(jiān)管局開(kāi)展進(jìn)口水果排查專項(xiàng)行動(dòng) 加強(qiáng)宣傳引導(dǎo)
- 寧夏青銅峽市場(chǎng)監(jiān)管局:擰緊節(jié)日食藥“安全閥” 確保節(jié)日期間市場(chǎng)安全穩(wěn)定
- 北京東城對(duì)轄區(qū)旅游客運(yùn)企業(yè)開(kāi)展專項(xiàng)聯(lián)合檢 營(yíng)造和諧市場(chǎng)環(huán)境
- 安徽開(kāi)展專項(xiàng)執(zhí)法查處濫用行政權(quán)力行為 共同營(yíng)造公平競(jìng)爭(zhēng)良好社會(huì)環(huán)境
- 安徽啟動(dòng)2022年春茶地理標(biāo)志保護(hù)專項(xiàng)行動(dòng) 促進(jìn)茶產(chǎn)業(yè)高質(zhì)量發(fā)展
- 吉林:開(kāi)展知識(shí)產(chǎn)權(quán)代理行業(yè)“藍(lán)天”專項(xiàng)整治行動(dòng) 促進(jìn)知識(shí)產(chǎn)權(quán)服務(wù)業(yè)健康發(fā)展
- 福建福州:宣傳知識(shí)產(chǎn)權(quán)法律知識(shí) 全方位推進(jìn)地方高質(zhì)量發(fā)展超越
- 遼寧撫順?lè)e極建設(shè)知識(shí)產(chǎn)權(quán)強(qiáng)市 建設(shè)知識(shí)產(chǎn)權(quán)強(qiáng)市為目標(biāo)
- 2021年全國(guó)公共服務(wù)質(zhì)量監(jiān)測(cè)情況發(fā)布 南京以總體滿意度?排名第一
- 立案20件!安徽嚴(yán)查哄抬物價(jià)等價(jià)格違法行為 督促經(jīng)營(yíng)者守法經(jīng)營(yíng)
- 杭州臨平區(qū):創(chuàng)建市場(chǎng)疫情防控“三色”預(yù)警分類管理
- 海南開(kāi)展防止一次性不可降解塑料制品入島聯(lián)合執(zhí)法行
- 河北保定市場(chǎng)監(jiān)管局創(chuàng)新應(yīng)用信用分級(jí)分類監(jiān)管 提
- 陜西省市場(chǎng)監(jiān)管局連續(xù)三年榮獲平安陜西建設(shè)先進(jìn)集體
- 浙江杭州:西湖食品安全風(fēng)險(xiǎn)綜合治理中心掛牌成立
- 湖北恩施州鶴峰縣市場(chǎng)監(jiān)管局開(kāi)展進(jìn)口水果排查專項(xiàng)行
- 寧夏青銅峽市場(chǎng)監(jiān)管局:擰緊節(jié)日食藥“安全閥” 確
- 北京東城對(duì)轄區(qū)旅游客運(yùn)企業(yè)開(kāi)展專項(xiàng)聯(lián)合檢 營(yíng)造和
- 安徽開(kāi)展專項(xiàng)執(zhí)法查處濫用行政權(quán)力行為 共同營(yíng)造公
- 安徽啟動(dòng)2022年春茶地理標(biāo)志保護(hù)專項(xiàng)行動(dòng) 促進(jìn)茶產(chǎn)
- 1 發(fā)力蛋制品 勁仔食品小蛋圓圓鵪鶉蛋入圍iSEE全球創(chuàng)
- 2 新捷途X70S顏值與實(shí)力全面升級(jí),將于4月29日發(fā)布預(yù)售
- 3 奶茶行業(yè)品牌多、競(jìng)爭(zhēng)大 冰雪時(shí)光靠什么贏得掌聲?
- 4 千千惠生活全國(guó)上線“隨心退”功能,消費(fèi)者可無(wú)條件
- 5 杭州臨平區(qū):創(chuàng)建市場(chǎng)疫情防控“三色”預(yù)警分類管理
- 6 海南開(kāi)展防止一次性不可降解塑料制品入島聯(lián)合執(zhí)法行
- 7 河北保定市場(chǎng)監(jiān)管局創(chuàng)新應(yīng)用信用分級(jí)分類監(jiān)管 提
- 8 原料新鮮 用料扎實(shí) 冰雪時(shí)光穩(wěn)扎茶飲下沉市場(chǎng)
- 9 陜西省市場(chǎng)監(jiān)管局連續(xù)三年榮獲平安陜西建設(shè)先進(jìn)集體
- 10 浙江杭州:西湖食品安全風(fēng)險(xiǎn)綜合治理中心掛牌成立