DeepMindの新AIモデル、古代の碑文の解読、年代測定、場所特定に役立つ

機械学習は古文書の解読に役立つ新しいツールを提供している。その最新の例が、DeepMindが作成したAIモデルで、古代ギリシャの碑文の復元だけでなく、書かれた時期や地理的起源の可能性について提案するのに役立っている。

DeepMindの新AIモデル、古代の碑文の解読、年代測定、場所特定に役立つ
via DeepMind

機械学習の技術は、考古学者の過去の理解、特に古文書の解読に役立つ新しいツールを提供している。その最新の例が、アルファベットの子会社であるDeepMindが作成したAIモデルで、古代ギリシャの碑文から失われたテキストを復元するだけでなく、テキストが書かれた時期や地理的起源の可能性について提案するのに役立っている。

これらのテキストは古いため、破損していることが多く、修復はやりがいのある仕事だ。また、石や金属などの無機物に刻まれていることが多いため、放射性炭素年代測定のような方法で書かれた年代を調べることができない。

これらの課題を解決するために、エピグラファーは、類似の碑文のテキストおよび文脈上の類似性を探すが、人間が既存の関連データをすべて利用し、基本的なパターンを発見することは本当に困難だ。

そこで、機械学習が役に立つ。「Ithaca」と名付けられたこの新しいソフトウェアは、78,608の古代ギリシャの碑文からなるデータセットで学習される。他の機械学習システムと同様、Ithacaはこの情報のパターンを探し、この情報を複雑な数学モデルに符号化し、これらの推論を用いて文章、日付、起源を示唆する。

『Nature』誌に掲載されたIthacaの論文によると、このモデルを作成した科学者たちは、破損したテキストの文字を復元する際に62%の精度を実現したと述べている。また、碑文の地理的起源を古代世界の84地域のうちの1地域に71パーセントの精度で帰属させることができ、テキストの年代を既知の執筆年から平均30年以内の範囲で特定することができるという。

イタリアのカ・フォスカリ大学ベネチアのテア・ソマーシールドはDeepMind研究科学者のヤニス・アサエルと共にこの研究の共同リーダーを務めた。

ソマーシールドらは伝説の人物オデュッセウスが住んでいたことで有名なギリシャの島にちなんでIthacaと呼ばれる機械学習型AIに、3つのタスクすべてを実行させることに成功した。

Ithacaを訓練するために、研究チームは、すでによく研究され、紀元前700年からAD500年の間に書かれたことが分かっている、地中海沿岸の約6万冊の古代ギリシャ語のテキストを使用した。研究チームは、テキスト中の一部の文字をマスクし、この「欠落」テキストに対するIthacaの予測値と実際の碑文を比較した。

次に研究チームは、すでに十分に研究され理解されている約8.000の碑文のデータセットを使って、Ithacaの性能を単独で、あるいは2人の古代史家と組み合わせてテストしました。その結果、Ithaca単独では62%の精度でテキストを復元できたのに対し、古代史家単独では約25パーセントの精度でテキストを復元することができたとされている。

しかし、最も正確な復元ができたのは、Ithacaと歴史家が一緒に作業した場合だった。あるテキストについてIthacaが示した最も可能性の高い20の復元結果を、歴史学者が自分の研究に役立てた場合、Ithaca単独よりもさらに高い精度でテキストを復元することができた。

Ithacaの提案は、最終的には伝統的な考古学的手法によって収集されたデータに基づいており、作者たちは、完全自動化されたAI歴史学者というよりも、より幅広い科学捜査手法の中の単なる1つのツールとして位置づけている。

Read more

OpenAI、法人向け拡大を企図 日本支社開設を発表

OpenAI、法人向け拡大を企図 日本支社開設を発表

OpenAIは東京オフィスで、日本での採用、法人セールス、カスタマーサポートなどを順次開始する予定。日本企業向けに最適化されたGPT-4カスタムモデルの提供を見込む。日本での拠点設立は、政官の積極的な姿勢や法体系が寄与した可能性がある。OpenAIは法人顧客の獲得に注力しており、世界各地で大手企業向けにイベントを開催するなど営業活動を強化。

By 吉田拓史
アドビ、日本語バリアブルフォント「百千鳥」発表  往年のタイポグラフィー技法をデジタルで再現

アドビ、日本語バリアブルフォント「百千鳥」発表 往年のタイポグラフィー技法をデジタルで再現

アドビは4月10日、日本語のバリアブルフォント「百千鳥」を発表した。レトロ調の手書き風フォントで、太さ(ウェイト)の軸に加えて、字幅(ワイズ)の軸を組み込んだ初の日本語バリアブルフォント。近年のレトロブームを汲み、デザイン現場の様々な要望に応えることが期待されている。

By 吉田拓史