教員紹介
- コーパス
コーパスを使った日本語の表記の研究に取り組んでいます。コーパスとは,実際に使われた言葉を大量に集めて,コンピューターで使えるようにしたデータベースです。コーパスから実例を取り出して分析することで,「ディスプレー」と「ディスプレイ」はどちらが多く使われているか,これらの表記に使い分けがあるのかといった言葉の使われ方に関する問題をより正確に明らかにできます。頭で考えていたのと違う結果や想定していなかった結果が出ることもあります。これがコーパスを使った研究の面白さです。また,このような研究成果は国語辞典の充実や言葉の教育,情報科学などへの貢献につながります。日本語研究は,意外と実用的な研究なのです。
COLUMN
文学と工学が越境する「日本語コーパス」の学び
日本語情報学専攻
小椋 秀樹
もっと見る閉じる
同じことを言うにもたくさんの形式があります。これを社会言語学では「バリエーション」と呼んでいます。例えば「これはここでしか食べられないものだ」と「これはここでしか食べれないものだ」、皆さんどちらを使いますか?両者は、一般的には「正用」・「誤用」で判断されがちですが、学術的には話者の属性や発話場面といった「社会的」要素を反映する興味深い現象です。こうしたことばのバリエーションを観察し、ことばと社会のダイナミックな関係性を研究しています。また、コーパスを用いてバリエーションを量的に分析し、ことばの変化を予測する研究も行っています。
もっと見る閉じる
言語は、意思伝達のための道具という側面をもつと同時に、人間と他の動物を区別する重要な特質でもあります。私の本来の専門は言語研究(特に(主として)英語の文法)ですが、その研究のために、母語話者が書いた・話した資料を大量に集め、コンピュータ上で処理可能にしているデータベース(「コーパス」と呼ばれます)を重要な研究資料の一つとして使っています。私は従来の方法に加え、コーパスを使うことで初めて暴くことのできる無意識の知識の一端の解明に興味をもっています。もとより言語研究は言語教育を行う際の基礎としても不可欠です。教育の現場で使われている文法に関する記述の改善にも関心をもっています。
もっと見る閉じる
ことばの意味を探究しています。私たちは日々のコミュニケーションのなかで確かにことばの意味を理解し、伝えているのに、未だその形さえよくわかりません。そんなことばの意味を形式的に記述し、それを導き出すための枠組みに関する研究をしています。言語学のなかで意味論とよばれます。このような研究は大量の言語資源から有益な情報を見出す、最近ではデータサイエンスとよばれる応用にもつながります。そして、意味への近接には確率のようなものを使うものもあり(しかも、かなり有用です)、とても学際的です。実際、哲学・心理学・医学・情報学など多様な研究者が関わっており、そんな研究の場は学術分野のるつぼで刺激的です。
もっと見る閉じる