カテゴリーで探す
キーワードで探す
  • ISSUE 11:
  • ことば・文字・コミュニケーション

大量のデータから有益な情報を抽出し、インタラクションをデザインする

学習者に適したマンガを推薦し日本語習得効果を高くする。
出典:Quiz 1の画像「プラチナジャングル」©篠原 正美 Manga109より

西原 陽子情報理工学部 准教授

    sdgs04|

世の中にはありとあらゆる情報があふれている。しかしその中から必要な情報を選び出すことができなければ、それらは無価値なままだ。コンピュータの情報処理能力の向上によって大容量の情報を処理・分析できるようになるに伴って、情報活用の可能性は大きく広がっている。大量のデジタルデータを分析することで、それまで気づかなかった有益な情報を見出すことも可能になっている。

西原陽子はテキストマイニングなどの情報抽出技術を使って人にとって有益な情報を抽出、可視化することで情報活用の可能性を広げる研究を行っている。テキストマイニングとは、言語解析によって文章や単語の集まりを単語に分割し、出現頻度や相関関係を分析することで有益な情報を抽出する分析手法だ。この技術を活用した西原の研究成果の一つが、マンガやアニメを使った外国人向けの日本語学習ツールの開発だ。

「研究室で学ぶ外国人留学生の多くが日本のマンガやアニメを通じて日本語を習得していると知り、これを言語教育に活かせないかと考えたのがきっかけでした」。西原は開発の経緯をこう語る。しかし一口にマンガと言っても少女マンガから青少年向けのアクションやファンタジー、成人を主人公にした職業マンガまでジャンルは多岐にわたる。例えば企業で働く外国人なら、少年向けのアクションマンガよりも職業マンガを読む方がより日常で使う日本語を習得できるだろう。そこで西原は、対象者の属性に応じて日本語習得に適切なマンガを自動的に選出するシステムを考えた。

西原は、まず学術研究用に公開されているマンガのデータセット“Manga109”の作品をスキャンしてマンガ内のすべての文字をデータ化した。次に言語処理のソフトウェアでテキストデータを単語に分割し、「日本語能力検定試験」に則って各単語のレベルを推定。それらを統合してマンガごとに日本語の難易度を導き出した。それをもとに、学習者の条件を与えると、その日本語能力に適したレベルのマンガを推定する。

このプログラムの効果を検証するため、西原は中国で日本語を勉強する中国人の大学生を対象に実証実験も行っている。「プログラムで推奨したアニメで日本語を学習したグループと、ランダムに選定されたアニメで日本語を学習したグループで日本語能力試験の結果を比較したところ、前者の方が学習の前後で点数の伸び幅が大きくなることを確認できました」。

もう一つ、西原がマンガ・アニメを活用して開発した日本語学習ツールとしてユニークなものに、日本語の「役割語」を習得する支援プログラムがある。外国人にとって日本語習得の壁の一つが、役割に応じて使って良い言葉が異なることだ。例えば英語で“YOU”を意味する日本語は、話者の役割や属性によって「あなた」「あんた」「お前」「君」「貴様」など多様な表現で使われる。西原は、役割語を入力すると、それが使用されたマンガのコマを自動的に抽出するプログラムを開発。インターネットで無料公開している。「お前」はどのような人がどのような場面で使っているのか。マンガなら一目瞭然で理解でき、使い方を学べるというわけだ。

さらに西原は、カナダで日本語を学んでいる20歳代の若者と日本で日本語を学んでいる中国人の20歳代の若者を対象にこのプログラムの効果を検証した。その結果、プログラムを使って学習したグループの方が、教科書を使って学習したグループに比べて役割語の学習効果が高いことが実証された。

出典:Quiz 1の画像「プラチナジャングル」©篠原 正美 Manga109より Quiz 2の画像「平成爺メン」©やまだ 浩一 Manga109より

西原はまた、情報抽出技術を活用して新たなインタラクションをデザインする方法についても研究している。その成果の一つが、病院の理学療法士との共同研究で開発した患者の「痛み」を記録するインタフェースである。「理学療法士の方々にとっての課題は、問診で患者からうまく症状を聞き出せず、効果的なリハビリに結びつけられない場合があることでした」と西原。理由は、患者の中には自分の痛みを適切な言葉で表現できない、あるいは痛みの程度や経過を正確に説明できない者が少なくないことにあった。

そこで西原らは、「ズキンズキン」「針でチクチク刺されるような」など約20種類の痛みの表現を列挙し、その中から患者が自身の症状を選択することで痛みをより正確に把握するインタフェースを考案した。痛みの表現の他、痛みの部位や強さを入力する機能を備えたプログラムを開発。その結果、問診の精度を高めるとともに問診時間の短縮も可能にした。

とりわけこのインタフェースは、ボキャブラリーが少なく、表現力が発展途上にある子どもや外国人などへの問診に有効だという。「痛みの表現は国際的に使用されている『マクギル疼痛質問票』の項目から抽出しており、多言語化も容易です。外国人観光客が増加する昨今、日本の病院で外国人を治療する際に非常に役立つと考えています」と西原。今後の医療現場での活用に期待がかかる。膨大な情報の中からいかに有益な情報を抽出し、社会に役立つものにできるか。西原の研究の真骨頂はまさにここにある。

西原 陽子NISHIHARA Yoko

情報理工学部 准教授
研究テーマ

インタラクションの分析と設計、創造的活動の支援

専門分野

ヒューマンインターフェース・インタラクション、知能情報学、ウェブ情報学・サービス情報学、図書館情報学・人文社会情報学