立命館土曜講座 開催講座一覧


2019年11月26日 講師:滝沢 直宏

ビッグデータから読み解く言葉「意外な表現」

 言語の研究とコンピュータとは、一見すると、何の関係もないように思われるかもしれません。しかし、昨今の言語研究はコンピュータが大きな役割を果たしています。「コーパス」というのは、巨大な言語資料をコンピュータに載せて、電子的に処理することが可能なものですが、英語に関して言うと、1960年代に初めて登場したコーパスが100万語規模(書籍換算でおよそ10冊分)だったのに対して、現在では140億語の規模をもつコーパスが使われるようになっています。正にビッグデータと呼ぶにふさわしいと言えます。日本語は、ここまでの規模ではありませんが、それでも巨大な規模のコーパスが編まれるようになっています。こうしたデータを、コンピュータで処理することによって、人間の直観で捉えられないような種類の言語的な特徴がわかるようになってきました。それを使った辞書編纂、文法書編纂も、英語では普通に行われていますので、日本語でも類似のことが行われるようになるのは時間の問題でしょう。  
 この講座では、ビッグデータを使うことで母語話者の無意識を暴く試みの一端を、英語・日本語の例を示しつつ、お話しします。

前のページに戻る

このページのトップへ