日本語文字コード

日本語文字コード

計算機は、日本語の文章を処理する際には、一文字ごとに数字を割り当てて符号化してから扱います。この数字のことを文字コードと呼びます。日本語を符号化する方法としては、以下の三種類が広く使われています。

日本語を含むより国際的な規格としてUnicodeがあり、利用が広がりつつあります。

コード変換プログラム

文字コードを変換するコマンドnkf を利用します。 JISコードに変換

% nkf -j inputfile > outputfile
EUCに変換
% nkf -e inputfile > outputfile
シフト JIS コードに変換
% nkf -s inputfile > outputfile
Unicodeに変換
% nkf -w inputfile > outputfile


TOP / UNIX の基礎 (3)