2018.11.02

AI と言語習得の話

どうも、嶋村です。遅くなってすみません。金曜日になりましたね。僕はいつも「ネタがない」と嘆いているわけですが、スポーツ健康科学部のブログに載せるような話題がないという非常に限られた狭義の意味での「ネタがない」でして、決して日々何もなく過ごしているわけではありません。なので、毎週何かは書いているわけです。そういうことで、今週も全くスポーツと健康に関係ないことを書きます。


以前研究には基礎と応用があるという話をしたと思います。基礎研究とはその研究が実際社会に役立つかどうかを考慮せず、研究者の興味の赴くままに研究するというもので、応用研究とは基礎研究で得られた知見を使ってその成果を社会に還元させていくような研究のことを言います。なんで、「~先生が、どこそこの会社と新しいサプリメント開発したらしいよ、すご~い!」ってなる場合は、その当該先生は応用研究で成果をあげたことになると思います。そのサプリメントを作る上で、それを構成する化学物質の研究があって然るべきですが、そういうのは基礎研究であることが多いと思います。基礎と応用、どちらが素晴らしいとか重要だとかではなくどちらの研究も必要ですが、バランス良くやることが大切ですね。ただ中には基礎研究の方が崇高だって思っている人が割といるかもしれません、個人的な意見ですが(笑)。


さて、そんな言語学の基礎研究・理論的側面ばかり研究している私ですが、僕がやっていることが世間に全く役立たないかというとそうでもないようです。今日うちの奥さんがたまたま見つけた記事によれば、MIT の研究者たちが、人工知能 (AI) があたかも人間の子供が学ぶように言語を習得する(可能性がある)モデルを開発したそうです。以下のリンクに詳しく書いてあります。


https://www.csail.mit.edu/news/machines-learn-language-more-kids-do


これまでの機械学習は統語と意味を解析するパーサー(解析機)を通してなされてきました。統語とは、大雑把に言って文法のことで、単語と単語がどのように結び付けられて文ができるかを規定する規則の総体を表します。これまでのパーサーは、それが利用する文(データ)にいちいちどのような統語構造を持っているか、そしてどのような意味を持っているかの注釈(アノテーション)を人がつけることによって学習が可能になっていました。ただ、この作業は膨大な時間がかかります。しかも人がつけるアノテーションは必ずしも正確というわけではなく、人によって違うということもあり、人が自然に言語を使う様を正しく反映していないこともあります。


ところが、新しく提案されたパーサーは、上述のようなアノテーション付きの言語データではなく、パーサーに説明付きのビデオを見せて、それを基に映像で流れている事象と説明文を関連させることによって言語を学んでいきます。そして、ある一定の学習期間の後、新しい文を与えられたパーサーはビデオなしで文の意味を正しく予測することになります。人の子供は、生まれた環境を観察することにより言語を学んでいきますから、新しいパーサーはこれに似た手法をとっているということになります。


さて、僕の専門は統語論と意味論で、特に後者は、形式意味論 (formal semantics) といって数学的な概念をたくさん使います。フレーゲ、デイヴィッドソン、タルスキ、クリプキなどの過去の偉大な数学者や哲学者の功績に多くを負っている形式意味論ですが、今お話ししているパーサーがビデオみて学習する際に利用する文は形式意味論的な表示がされているようです。記事によれば、The woman is picking up an apple という文は、λxy. woman x, pick_up x y, apple y と表示されているそうで、ラムダ表記を使って表現されています。ラムダ表記は チャーチという数学者が生み出した数学的道具で、言語学への応用はモンタギューという人によってなされました。まあ数学的には色々特徴があるようですが、数学者ではない僕にはチンプンカンプンです(笑)。重要なことはラムダ表記は数式から関数を簡単に作り出すことができるということです。ここで数式とは文字列でも構いません。例えば、「嶋村先生は(女優の)波瑠が好きだ」という文の意味を考えた時に、我々言語学者は文の意味の値を 1 (真)か 0 (偽)で判断します。例えば「嶋村先生は(女優の)波瑠が好きだ」が真であるのは、現実世界において僕が波瑠が好きな場合のみであり、実際そうなので真になります(笑)。さて、ラムダ表記がエライのはこのような文字列をラムダ抽象化により関数にできるということです。つまり、「λx. 嶋村先生は x が好きだ」という具合に、x の値を求めることになり真偽値を決めることができるのです。簡単に言うと、嶋村先生が好きなモノ(人や物)から命題(真か偽か判断できるもの)へ写像する関数(<e,t> と書きます)を作ることができます。例えば、x の値が「奥さん」なら真になる訳です。なので <e,t> 自体は僕の好きなモノの集合ということになります。


まあ、「今日は、マジでわけわからんぞ」ということになっている人が多いと思いますが(ってそんなに読まれているとは思わないけど)、何が言いたいかというと、形式意味論的な意味が機械学習で利用されているんだなあ~ってことです。形式意味論は非常に数学的ですので、プログラミング言語などとの親和性が高いのですが、このように AI の開発にも利用されているとは知らなかったのでちょっと記事を読んで嬉しくなりました。


ちなみに今日ブログに登場させてしまったうちの奥さんは、先日誕生日でした。僕は彼女が 23 歳の頃から一緒にいますが、そんな彼女も 32 歳です。いろいろ難ありの私ですが、いつも支えてもらっています。僕は一人で生きているわけではないのだと最近つくづく思います。末長く一緒にいられたらなあとも思います。まあ、ちょっとダラダラ書いてしまいましたが、人の叡智の可能性に思いを馳せつつ今日はこの辺で。