工具箱
 [05/11/10更新]
その他のツールにunikanji.macを追加

 UTF-8版作成に使用したツール[99/05/24更新]

 論文や資料を作成する際、私は、いわゆるJIS外字については、IBM拡張文字や自分で定義した外字の他に、Christian Wittern氏の「漢字ベース」((C) 1995 International Research Institute for Zen Buddhism,Kyoto、ウルス・アップ編『禅ベースCD1』<花園大学国際禅学研究所>所収)を使ってテキストファイルに印付けを行っています。「漢字ベース」は、四角號碼やピンイン、部首で多角的に目的の漢字を検索でき、キーボードでの操作性にも優れWindows3.1時代から利用している私にとっては、最も手になじんだツールなのです。(蛇足ながら、「今昔文字鏡」は素晴らしいソフトですが、キーボードからほとんど操作できないのが難点だと思います。)
 ですから、以下のツールも、JIS外字には漢字ベースコードが使われていることが前提となります。今時「漢字ベース」を使っている方は少ないかと思いますが、何かの参考になれば幸いです。
Utf8han.lzh  Utf8han.txt
[Utf8han.txt]
今回、Unicode文字にはSGML文字実体参照方式のタグを使用しましたが、その前提として作った表です。Nfty-Serve「外国語フォーラム・本館」(FLM)「FL情報館」に<KHD02301>氏がUPされているCJKXREF.TXTを基にして、各コード表にSGMLタグとJIS漢字、漢字ベースコードを追加したものです。
Script.lzh  下記2点の「SED」用スクリプト
[Kb2SGML.SED]
上記[Utf8han.txt]から作成した、漢字ベースコードをSGMLタグに置換する「SED」用のスクリプト。大きなサイズのスクリプトですので、実際には適当に分割してバッチファイルで置換を行っています。
[Kb2Uni.SED]
上記[Utf8han.txt]から作成した、漢字ベースコードをUNICODE番号に置換する「SED」用のスクリプト。
Macro.lzh  下記3点の「秀丸エディタ」(斉藤秀夫氏作)用マクロ
[ibm2kb.mac]
IBM拡張文字を漢字ベースコードに置換するマクロ。
[T2H.mac]
テキストファイルから、ごく簡単なHTMLファイルを作るためのマクロ。各資料のHTMLファイルはこれで作りました。
[svfile.mac]
今回のUTF-8版とは直接関係ないのですが、秀丸で名前を付けてファイルを保存するとき、フォルダをあちこち変えるのが面倒なのでこれを利用しています。各自の環境に合わせてカスタマイズしないとどうしようもないという、とんでもないマクロです。
 UTF-8版の各資料は、もともとはJIS漢字、IBM拡張文字、外字、漢字ベースコードが混在したテキストでした。これをまず[ibm2kb.mac]でIBM拡張文字を漢字ベースコードにし、また別のマクロで外字を漢字ベースコードに直します。その後、[Kb2SGML.SED]を使って漢字ベースコードをSGMLタグに置換し、なお残っている漢字ベースコードは今昔文字鏡番号[&Mnnnnnn;]に変えます。以上の処理を行ったテキストを、Internet Explorer 4.0(または5.0)で読み込み、UTF-8形式で保存した後、「秀丸」で開いて[T2H.mac]でHTMLファイルを作成すれば、UTF-8版の出来上がりです。


 Word2000マクロ[03/07/29更新]

 MicroSoft Word 2000 用マクロ。
sgmltopm.lzh  SgmltoPm.txt Ver1.1
[SgmltoPm.txt]
SGML文字実体参照方式のタグ[&#nnnnn;]が使用されているテキストをWordで読み込んだ後、このマクロを実行すると、タグをすべて該当するPMingLiUフォントの漢字に変換できます。上に挙げたKb2SGML.SEDで処理した後のテキストや、IEで閲覧したUnicode文書をShift-JISで保存した場合など、これを利用すると便利です。
hextopm.lzh  UnihextoPm.txt Ver1.1
[UnihextoPm.txt]
上のSGML文字実体参照方式タグは10進数ですが、このマクロは16進数のUnicode文字コード番号を対象に同様にすべて該当するPMingLiUフォントの漢字に変換します。自分で書いたテキスト文書で、JISに無い文字をUnicode番号で代替入力している場合など、このマクロを使えばWordで一度に漢字に直すことができます。
Ruby.lzh  Hyousoku2Ruby.txt Ver1.1  Chu2Ruby.txt Ver1.1
[Hyousoku2Ruby.txt]
詞の韻を、テキスト入力時に「今宵酒醒何處、楊柳岸、曉風殘月●」等と記していた場合、このマクロを使うと自動的に「●」を韻字「月」の右横(縦書きの場合)に5ポイントのルビにしてくれます。「●」(仄韻)と「○」(平韻)だけに対応しています。
[Chu2Ruby.txt]
上記マクロの応用ですが、注番号@からSを「・・・である@。」等と記していた場合、@を「る」の右横(縦書きの場合)に5ポイントの下付きルビにします。20以上や他の記号等を使っていらっしゃる方は適宜改変してお使いください。
FontsList.lzh  FontsList.txt Ver1.0
[FontsList.txt]
一文書の中に複数のフォントを使用していると、後で何のフォントを使っていたか分からなくなってしまうことがよくあります。このマクロを使うと、文書中で使われているフォントを一覧表示する(さらにテキストファイルに書き出す)ことができます。


 その他のツール[05/11/10更新]

 以下には、文章作成に役立つかもしれない(?)迷ツールを置きます。
kyocho.lzh  秀丸エディタ」(斉藤秀夫氏作)用の強調表示定義ファイルとそれをロードするマクロ。
[charcode.hilight]
4桁の英数字を強調表示します。文中に漢字の代わりにその文字の文字コードを入れておくことが多いため、それを分かりやすくするために作りました。
[joyo.hilight]
常用漢字1945字を強調表示します。なおこの[joyo.hilight]と後出の[mojikyo.hilight]は、「秀まるおのホームページ」「強調表示定義ファイルライブラリ」にも[hagi]の名前で載せて頂きました。
[notjoyo.hilight]
常用漢字1945字以外の漢字を強調表示します。
[kb.hilight]
漢字ベースコードを強調表示します。
[mojikyo.hilight]
今昔文字鏡番号[&Mnnnnnn;]を強調表示します。
[平仄.hilight]
平声=赤,仄声=青,平声且仄声=紫で強調表示します。平仄のデータは高崎一郎さんの『オンライン廣韻』を利用させて頂きました。
[kyogyo.mac]
上記6点の強調表示と行番号の表示/非表示を切り替える「秀丸」用のマクロです。
ibm_trad.lzh  ibm_trad.mac
[ibm_trad.mac]
JIS漢字を対応するIBM拡張文字内の旧字と双方向に置換する「秀丸」用のマクロ。
mygrep.lzh  「秀丸」の「GREP」機能を少し便利(?)にするマクロ。(その1)
[mygrep.mac]
「秀丸」に装備されている「GREP」を各自の環境にあわせたファイルやフォルダで実行するマクロ。カスタマイズが必要ですが、一度設定すると非常に便利に「GREP」を使えます。「GREP」結果画面では検索語を「特に強調表示2」(デフォルトでは赤色)で強調して表示できます。またファイル名も「強調表示2」(デフォルトでは空色)で強調表示します。
grdg200.lzh  「秀丸」の「GREP」機能を少し便利(?)にするマクロ。(その2)
[grepdlg.mac]
秀丸でGREPのダイアログを表示して通常どおりGREP検索を行い、その結果ファイルにおいて検索語を「特に強調表示2」(デフォルトでは赤色)で強調し、またファイル名も「強調表示2」(デフォルトでは空色)で強調表示するマクロです。このVersionでは、ZWEI さんの御教示により、GREPダイアログでの検索オプションを、強調定義ファイル中で引き継げるようにしました。
[emtgjump.mac]
GREP結果ファイルからタグジャンプして元のファイルを開く際に、元のファイルでも検索語を「特に強調表示2」(デフォルトでは赤色)で強調するマクロです。この「emtgjump.mac」は、ZWEI(CQA13735@nifty.ne.jp) さんが作成して下さったもので、ZWEI さんの御好意により、今回同梱させて頂きました。ZWEIさんに厚く御礼申し上げます。
WenZiShu.lzh  非常に限定された目的の文字数計算マクロ。
[WenZiShu.mac]
詞の体格を知る上で、詞の文字数は重要な情報です。最長の詞牌「鶯啼序」が240字ですから一字一字数えることもできますが、結構面倒で間違いも起こりやすいです。この秀丸用マクロは、詞の本文を一旦他のファイルにコピーし、「●」「○」や句読点などを外して全角文字のみを数えます。詞の本文に漢字ベースコードや文字鏡の番号[&Mnnnnnn;]がある場合でも、一旦全角の「〓」に直してから数えますので一字として数えられます。秀丸のクリップボード呼び出し機能を使っていますので、4Kバイト2047字までしか数えられません(詞体の文字数を知るには十分です)。もっと長い文章の文字数を数えたい場合は、他の方が公開されているマクロをお使いください。
nengo.lzh  年号・西暦・干支とを相互検索する秀丸マクロ。
[kinsechi.mac]
宋・建隆1〜民国までの年号・西暦・干支とを相互検索するマクロです。たとえば「嘉慶2」を選択してこのマクロを実行すると、「1797」と表示し、クリップボードに「1797」を入れます。逆に「960」以上の数字を選択してマクロを実行すれば、「建隆1」などと「年号 + 年」の形でクリップボードに入ります。さらに干支を選択してマクロを実行すると、宋・建隆1〜民国100年まででその干支に当る年を一覧表示し、いずれかを選択するとその「年号 + 年 + (西暦)」(例:萬暦19(1591))をクリップボードに格納します。
[kinsejp.mac]
上記[kinsechi.mac]と同じですが、こちらは慶長1〜平成までの年号・西暦・干支とを相互検索します。
Keyword.lzh  複数キーワードを強調表示する秀丸マクロ。
[Keyword.mac]
秀丸Ver5.00β10以上用です。Google検索のように、強調したい語句を半角または全角のスペースで区切って実行すると、ファイル内にあるそれらの語句をすべて異なる色で強調表示します。
rtfconv.mac  秀丸から、針谷壮一さんの「Rtfconv.dll」を利用するマクロ。
[rtfconv.mac]
針谷壮一さんの「RTFコンバータ」は非常に素晴らしいソフトで、私も以前から愛用させて頂いております。秀丸で開いているテキストを変換するのに、今までは秀丸マクロでコマンドプロンプトを起動し、そこから「rtfconv.com」を利用する、というやり方でマクロを使っていました。ところが最近、秀丸マクロから直接「Rtfconv.dll」を呼び出して変換できることに気づき、その方法に書き換えたのがこの「rtfconv.mac」です。DLLや出力ファイルのパス、変換のパターンなどはすべて私自身用ですので、そのままでは使えないと思います。あくまで「Rtfconv.dll」を秀丸から使うサンプルとして御覧下さい。ちなみに針谷さんの「中国語コンバータ」に同梱されている「Chnconv.dll」も、同様に秀丸マクロから利用できます。
unikanji.mac  SGML文字実体参照方式のタグ[&#nnnnn;]を、漢字に変換するマクロ。秀丸Ver5.10β1以降用。
[unikanji.mac]
シフトJISでは表示できない文字にSGML文字実体参照方式のタグ[&#nnnnn;]が使用されているテキストを、まずUnicodeテキストとして保存した上でタグをすべて漢字に変換します。秀丸Ver5.10β1以降で実装された「unichar関数」を使用します。それ以前のバージョンの秀丸では動作しません。




ホームへ戻る