立命館土曜講座 開催講座一覧


2008年2月16日 講師:中村 純作

コーパス言語学と英語教育

 言語分析を目的として、系統的に採集された大量のデータで、コンピュータ処理が可能なものをコーパスと呼びます。世界で最初のコーパスは1961年にアメリカで出版された15のジャンルにわたる2000語のテキストを500サンプル集めた、たかだか100万語のブラウンコーパスですが、当時としては画期的なものでした。
 大量の言語データをコンピュータで処理すると様々な事実が浮かび上がってきます。たとえば、100万語の英文テキストには何語位、違った種類の単語が出てくるでしょうか?答えは約42,500語。その中で最も頻度の高い単語は"the"で、約7万回出現しますので、英文14語に付き1語は"the"ということになります。上位100語で100万語の半分がカバーされることも分かりました。
 40年以上経た現在、様々な記憶媒体の開発、コンピュータの小型化、高速化、大容量化に伴い、1億語のコーパスをラップトップパソコンで利用できるようになりました。これほど大きなコーパスになると、頻度情報だけでなく、もっと複雑な言語現象も分かってきます。
 この土曜講座ではコーパスから分かる英語の事実と英語教育との関連についてお話します。  

前のページに戻る

このページのトップへ