Perl勉強中
話せば長くなりますが。。。
きっかけは、takabowさんのこの記事。
WikipediaをEPWING形式の辞書にしてローカルに持ち出す、というものです。以前MAROONさんもチャレンジしようとして断念されていましたが、こちらにEPWING形式に変換してものが置いてあるとのこと。
おお、これは試さねば、と思いつつ、PalmでEPWING形式のデータを見ようとすると、Buckingham EB playerが必要です。このアプリ、今は公開停止になっていて手を出していなかったのですが、インターネットアーカイバからサルベージしてダウンロードしてみました(著作権的には問題ですが^^;)
WikipediaのEPWING辞書は1GB以上もあるとのことなので、まずはBuckingham EB playerなるアプリがどんな感じかを試してみるために、MAROONさんのこの記事を参考にPDD人名辞典をダウンロードしてみました。
で、使ってみた感じは、WDICに慣れた身としては、できたらWDICで見てみたいなあ、ということ。というのは、一つはBuckingham EB playerの検索方法が「完全一致」しかサポートしていないこと。WDICだと前方一致で検索してくれるので、この方がやっぱり楽です。あと、広辞苑とか英辞郎とかを既にWDICで使っているので、これらの辞書とのマルチ検索もしたいなあ、と感じます。そうすると、どうしてもWDIC上でこのEPWING形式の辞書が動くようにしたくなります。
で、改めて色々調べてみると、こちらのサイトで、PDD人名辞典をPDIC形式に変換するためのPerlスクリプトが公開されていることを発見。早速試してみました。このPerlスクリプトには変換モードが2種類用意されていて、「見出し語がひらがなも漢字にもどちらにも同じ本文をぶら下げる」変換モードと、「漢字の見出しにはひらがなへのリンクのみをぶら下げて、本文はひらがなの見出しにのみぶら下げる」モードとが用意されています。で、容量優先と言うことで、後者の変換モードで変換実施。
結論としてはうまく動作して万々歳だったのですが、ちょっと使い勝手に違和感が。というのは、WDICで使っている広辞苑の方は、「ひらがなの見出しには漢字へのリンクのみをぶら下げて、本文は漢字の見出しにのみぶら下げる」と言う風に、逆の組み合わせになっているからなのです。
ならば、Perlスクリプトをちょっといじって、広辞苑と同じような形式での変換ができないかと思い立った次第。これがうまくいって、Perlに詳しくなれば、以前手に入れた「漢字源」のEPWING辞書もWDICに放り込めるのではないかと思ったり。
と言うわけで、しばらくがんばってみます。
| 固定リンク
この記事へのコメントは終了しました。
コメント