DeepMindの新AIモデル、古代の碑文の解読、年代測定、場所特定に役立つ
機械学習は古文書の解読に役立つ新しいツールを提供している。その最新の例が、DeepMindが作成したAIモデルで、古代ギリシャの碑文の復元だけでなく、書かれた時期や地理的起源の可能性について提案するのに役立っている。
機械学習の技術は、考古学者の過去の理解、特に古文書の解読に役立つ新しいツールを提供している。その最新の例が、アルファベットの子会社であるDeepMindが作成したAIモデルで、古代ギリシャの碑文から失われたテキストを復元するだけでなく、テキストが書かれた時期や地理的起源の可能性について提案するのに役立っている。
これらのテキストは古いため、破損していることが多く、修復はやりがいのある仕事だ。また、石や金属などの無機物に刻まれていることが多いため、放射性炭素年代測定のような方法で書かれた年代を調べることができない。
これらの課題を解決するために、エピグラファーは、類似の碑文のテキストおよび文脈上の類似性を探すが、人間が既存の関連データをすべて利用し、基本的なパターンを発見することは本当に困難だ。
そこで、機械学習が役に立つ。「Ithaca」と名付けられたこの新しいソフトウェアは、78,608の古代ギリシャの碑文からなるデータセットで学習される。他の機械学習システムと同様、Ithacaはこの情報のパターンを探し、この情報を複雑な数学モデルに符号化し、これらの推論を用いて文章、日付、起源を示唆する。
『Nature』誌に掲載されたIthacaの論文によると、このモデルを作成した科学者たちは、破損したテキストの文字を復元する際に62%の精度を実現したと述べている。また、碑文の地理的起源を古代世界の84地域のうちの1地域に71パーセントの精度で帰属させることができ、テキストの年代を既知の執筆年から平均30年以内の範囲で特定することができるという。
イタリアのカ・フォスカリ大学ベネチアのテア・ソマーシールドはDeepMind研究科学者のヤニス・アサエルと共にこの研究の共同リーダーを務めた。
ソマーシールドらは伝説の人物オデュッセウスが住んでいたことで有名なギリシャの島にちなんでIthacaと呼ばれる機械学習型AIに、3つのタスクすべてを実行させることに成功した。
Ithacaを訓練するために、研究チームは、すでによく研究され、紀元前700年からAD500年の間に書かれたことが分かっている、地中海沿岸の約6万冊の古代ギリシャ語のテキストを使用した。研究チームは、テキスト中の一部の文字をマスクし、この「欠落」テキストに対するIthacaの予測値と実際の碑文を比較した。
次に研究チームは、すでに十分に研究され理解されている約8.000の碑文のデータセットを使って、Ithacaの性能を単独で、あるいは2人の古代史家と組み合わせてテストしました。その結果、Ithaca単独では62%の精度でテキストを復元できたのに対し、古代史家単独では約25パーセントの精度でテキストを復元することができたとされている。
しかし、最も正確な復元ができたのは、Ithacaと歴史家が一緒に作業した場合だった。あるテキストについてIthacaが示した最も可能性の高い20の復元結果を、歴史学者が自分の研究に役立てた場合、Ithaca単独よりもさらに高い精度でテキストを復元することができた。
Ithacaの提案は、最終的には伝統的な考古学的手法によって収集されたデータに基づいており、作者たちは、完全自動化されたAI歴史学者というよりも、より幅広い科学捜査手法の中の単なる1つのツールとして位置づけている。