テキストの計量分析で
隠れた情報を可視化する

#092
産業社会学部 准教授樋口 耕一

 選挙演説で繰り返し使われたキーワードを調べれば、それぞれの立候補者が言おうとしていることを客観的にまとめられます。あるいは新聞記事に何度も出てくる言葉や、言葉同士のつながり方を調べれば、社会の中の共有されている考え方が分かります。このように文章データを統計的にすることで、人が目で読むだけではつかみきれないような情報を、はっきりと可視化(見える化)できるのです。

 こんな分析を誰でも行えるように、分析用ソフト「KH Coder」を開発して、フリーソフトウェアとして公開しています。「KH Coder」の利用はじょじょに広がり,現在では年間400件以上の研究で利用されています。

 例えば、高校生5000人に「東日本大震災について感じること」を自由に答えてもらって図を作ると「生きる」「いのち」「大切」などの言葉同士のつながりがわかりました。さらにの賛否と性別の関連を見ると、男女別の違いも見えてきました。

 現在は,民間の企業様と協力することで「KH Coder」の機能アップを図ったり,「KH Coder」がもっと上手く使われることを目指して研究しています。

ボタンを押していろんな研究を見てみよう