Palmで広辞苑(完成!)
前回のエントリーで、nowarlさんから「Perlを使えば1行テキスト形式に変換できる」というコメントを頂きました。ところが、私はPerlなるものをさっぱり知りません^^;
というわけで、まずはPerlの調査を。ふむふむ、こちらによると、どうやらCGIを書く代表的な言語のようです(ちなみに私は、CGIが何かもよく知りません^^;)。で、こちらによると、従来はソース形式でしかPerlは配布されてなかったけど、Windows環境ならAcrivePerlとやらをインストールすればよいとのこと。
で、早速配布元のActiveStateへ。ダウンロード出来るのは ActivePerl 5.10.0.1002 と 5.8.8.822 の2つがあるようですが、古い方が安定しているかな、ということで5.8.8.822の方のインストーラ(MSIと書かれているリンク)をクリック。14.9MBのファイルがダウンロードされてきました。で、これを実行すれば、あっさりActivePerlがインストールされました。
ちなみにnowarlさんに教えて頂いた、1行テキスト形式への変換を解説して頂いている幾霜さんのサイトでは、ActivePerl (build522)の他に、JPerlとやらが必要と書いてあるのですが、こちらによると「Jcode.pm が内包され、日本語の処理方法が変わっています」とありますので、このまま日本語が使えるんじゃないか、と言う憶測でそのまま次へ^^
で、次は幾霜さんの書かれているとおりの手順を進めます。(以下、ほとんど丸写し)
- まずkojien4.lzh内のhenkan.txt以外のファイルと出力ファイル(kojien.txt)を同じディレクトリ(フォルダ)に置き、それ ら以外のファイルは置かないようにします。
- そしてkojien.batを実行します。
- すると色々ファイルができますが最終的にkjdic.txtというファイルができます。このうち必要なのはkjdic.txtのみなのでそれ以外は削除して構いません。
ところが、なぜか出来たkjdic.txtのサイズは0kb。どうもうまく動いていないようです。で、kojien.batの中身を見てみると、、、こんな感じのスクリプトが並んでいます。
jperl chusyutu1.pl <kojien.txt >kjtemp.txt
なるほど、これではJPerlを動かそうとしているのでうまく行かないはずです。で、このバッチファイル内の「jperl」という部分を「perl」と言う風に書き換えて、再び実行。すると、見事バッチファイルが進んで行き、ファイルが出来ていきます^^
で、最後に出来たkjdic.txtを見てみると、、、、
あ /// / ◎(1)母音の一。口を広く開き、舌を低く下げ、その先端を下歯の歯ぐきに触れる程度の位置におき、声帯を振動させて発する。〔a〕 \ (2)平仮名「あ」は「安」の草体。片仮名「ア」は「阿」の偏(へん)の略体。
おおお、見事1行テキスト形式に変換されています!
ちなみに幾霜さんのこのPerlスクリプトを使って変換すれば、WDICで辞書を検索するときに、読みだけでなく、漢字でも検索できるという優れものだそうです。ありがたや。
で、こちらの手順に従って、次にこれをPDIC形式の辞書データに変換します。(以下転載&一部修正)
- PDIC for Windowsを起動します。
- 〔Tools〕→〔辞書の変換〕とたどります。
- 〔転送元辞書〕の〔ファイル形式〕は〔一行テキスト形式〕をチェック。上記で作成したPDIC一行テキスト形式の辞書ファイルを指定します
〔転送先辞書〕の〔ファイル形式〕は〔PDIC形式〕をチェック。ファイル名は、kojien.datとしました。
〔同一単語の処理〕は〔改行付きで付け加える〕を選択。
〔詳細〕では〔辞書格納率〕を100%にするとよいそうです。あと、〔一行テキスト形式の区切〕が” /// ”になっているか確認しておきましょう。あと、私の場合は「訳語 / 用例を区別して取り込む」のチェックを外しておいた方が、後で生成した辞書が見やすかったです。
で、〔OK〕。 - 〔辞書の新規作成〕が開いたら、〔辞書の種類〕の〔Hyper辞書形式〕をチェック。〔圧縮対応の辞書にする〕はチェックを外します。
で。〔OK〕。 - まつこと十数分。PDIC形式の広辞苑辞書ファイルの完成です。
私の場合、5.の結果はこんな感じ。
41万語が無事変換されました。(なぜか447語は欠落したようです)
で後は、SDカードのE:\PALM\PROGRAMS\PDICの下にKOJIENというフォルダを作り、その中にできあがったkojien.datファイルを放り込みます。そしてWDICを起動し、KOJIENを選択。
そうするとインデックスが自動的に作成されて、、、
むはははは!!見事広辞苑がTreoで動きました!!!
ちなみに上の画面は一覧画面。一番上の行をタップor 5wayで選択すると、こんな感じで「あ」に関する記述が表示されます。
さらにWDICでは、マルチ辞書の同時検索が出来ます。メニュー/オプションで「全ての辞書」を選択しておくと、導入されている辞書全てについてヒットしてくれます。ちなみに下の画面では、1行目が英辞郎、2行目が広辞苑です。
はっきり言ってこれは、専用機も顔負けです。非常にサクサク動くし、大満足^^
Palm最高!!
| 固定リンク
| コメント (11)
| トラックバック (1)


























最近のコメント