2017.01.31

3000年以上前の歴史を、IT技術で解き明かせるか?

▲歴史ロマンあふれるプロジェクトに挑むメンバー。左から柴田睦月さん、石井康史さん、辻 翼さん、岸 雅大さん

紀元前14世紀から11世紀の記憶を今に伝える「甲骨文字」

はるか3000年以上も昔のこと。殷(いん)の時代の中国では、亀の甲羅や牛の骨などに鋭利なモノで傷をつけることで文字を書いた。これらの文字は「亀甲文字」と呼ばれ、漢字のもとになったと言われている。実はこの亀甲文字が発見されたのは1899年と、比較的最近のことだ。果たして、中国最古の王朝である殷の時代、人々はどのような生活を営み、何を文字に記したのだろうか。3000年以上も閉ざされていた歴史の扉を開こうと、世界中の考古学者が甲骨文字の解読を急いでいる。

▲甲骨文字はこんな感じで拓本されて保存されている。

画像認識技術で「甲骨文字」を自動認識できないか。

現在の甲骨文字の分析は、考古学者の持つ高度な専門知識と豊富な経験を頼りに行っているため、なかなかはかどらない。また、時の経過により資料が劣化していることも、大きな問題となっている。そこで立ち上がったのが、孟先生の研究室チーム。最新の画像認識技術を駆使して、甲骨文字を自動で解読するシステムを構築しようというのだ。プロジェクトは成功するのか。リーダーであり、ITと歴史ミステリーを愛してやまない石井さんに話を伺った。

コンピューターに画像を認識させる方法はいくつかありますが、その中のひとつに「テンプレートマッチング法」というものがあります。あらかじめ見本(テンプレート)となる情報をデータベースに登録しておき、認識対象が見本と同じか、違うかをコンピューターに判断させるというもので、身近なところではカメラの顔検出機能などにも用いられています。僕たちはこの手法をベースにシステムを構築することにしました。

▲甲骨文字認識の流れ

システムの概要は上図のとおり。ポイントになるのは、原画像の処理。テンプレートマッチング法は、とてもシンプルな画像認識技術ですが、一方で、対象となる画像に傾きや歪み、ノイズがあると、同一の画像でも異なっていると認識されないという弱点があります。
経年によって劣化していたり、そもそも書き手のクセで傾いたり歪んでいたりする甲骨文字を、どれだけテンプレートに近づけられるか。そこが一番大変でした。

認識率86%の画像処理がこちら

では実際に、どういう流れで画像処理していくのか。下の画像を使ってご説明しますね。ちなみにこれは漢数字の「五」です。

▲原画像。周囲のノイズがすごいので、コンピューターはまず、これらをきれいにしていきます。

▲ガウシアンフィルタというぼかし処理をしました。

▲次は、二値化と言ってグラデーションをなくす処理。つまり、グレーを黒と白のどちらかに変換します。

▲ラベリング処理。つながっている白色の部分の面積を計算して、一定値より小さいものはノイズとみなして消去します。

原画像に比べると、ずいぶんきれいになりましたね。でも、まだ線がギザギザしていますし、太さもバラツキがあるのでコンピューターは「五」だと認識できません。そこで、次は骨格抽出を行います。

▲細線化。一度、線の幅を1ピクセルにします。

▲ハフ変換といって、近似曲線によって直線を抽出する処理を行います。

▲正規化。文字を15°ずつ回転させ、拡大縮小を行うことで、傾きや歪みをなくします。

この正規化された画像とテンプレートが一致する甲骨文字を、データベース上にある1000種類以上のテンプレートの中から検出します。

▲コンピューターが選んだのがこちら。正解ですね。

「五」の他にも250文字で実験を行なったところ、214文字が正解。認識率は86%とまずまずの結果が出ました。

さらに高精度な画像認識システムをめざして

▲コンピューターが認識しやすいように画像を数字化。

テンプレートマッチングと平行して、特徴量によるマッチングも進めています。これは担当している岸くんに説明をお願いします。
コンピューターは人間と違って、見た目でモノを識別することが苦手です。そのため、コンピューターが識別しやすいように、甲骨文字を点の数や線の本数などの数値情報にしてあげようというものです。
この特徴量の情報をテンプレートに加えることで、コンピューターが自動で、認識対象の文字から候補になるテンプレートを絞り込むことができると考えます。
僕はそのデータベースの構築を担当しました。4ヶ月かけて、ひとまず1000文字のテンプレートを入力。おそらく4人のなかで一番、甲骨文字に触れていると思います。「この時代は、雨がよく降ってるなあ」と、気づけば、ある程度の甲骨文字を読めるようになっていました(笑)
僕は、甲骨文字の線分特徴を用いて、甲骨文字の認識を研究しています。現時点では、この手法の認識率が90%に達成しています。実は、画像処理に興味があってこの研究室に入ったので、最初は歴史について、それほど興味はありませんでした。でも、甲骨文字の解読が進めば、当時の生活はもちろん、政治、経済、気候や自然災害など、今につながる大切な情報がたくさん得られます。そう思うと、なんとしても精度の高いシステムを完成させて、歴史研究に貢献したいですね。
画像処理を使って、甲骨文字を解読する。ノイズの除去から、特徴抽出、認識まで複数の認識手法を提案し、システム的な試みは前例がほとんどないため、彼らは手探りのなか頑張っています。そしてこの研究には、多くの歴史学者から期待が寄せられています。

立命館大学 理工学部

おすすめ記事