« Visorのイースターエッグ | トップページ | ついにPalm Preで日本語入力に成功! »

2009年10月15日 (木)

Perl勉強中

話せば長くなりますが。。。

きっかけは、takabowさんのこの記事。

ザウルスに Wikipedia導入

WikipediaをEPWING形式の辞書にしてローカルに持ち出す、というものです。以前MAROONさんもチャレンジしようとして断念されていましたが、こちらにEPWING形式に変換してものが置いてあるとのこと。

おお、これは試さねば、と思いつつ、PalmでEPWING形式のデータを見ようとすると、Buckingham EB playerが必要です。このアプリ、今は公開停止になっていて手を出していなかったのですが、インターネットアーカイバからサルベージしてダウンロードしてみました(著作権的には問題ですが^^;)

WikipediaのEPWING辞書は1GB以上もあるとのことなので、まずはBuckingham EB playerなるアプリがどんな感じかを試してみるために、MAROONさんのこの記事を参考にPDD人名辞典をダウンロードしてみました。

で、使ってみた感じは、WDICに慣れた身としては、できたらWDICで見てみたいなあ、ということ。というのは、一つはBuckingham EB playerの検索方法が「完全一致」しかサポートしていないこと。WDICだと前方一致で検索してくれるので、この方がやっぱり楽です。あと、広辞苑とか英辞郎とかを既にWDICで使っているので、これらの辞書とのマルチ検索もしたいなあ、と感じます。そうすると、どうしてもWDIC上でこのEPWING形式の辞書が動くようにしたくなります。

で、改めて色々調べてみると、こちらのサイトで、PDD人名辞典をPDIC形式に変換するためのPerlスクリプトが公開されていることを発見。早速試してみました。このPerlスクリプトには変換モードが2種類用意されていて、「見出し語がひらがなも漢字にもどちらにも同じ本文をぶら下げる」変換モードと、「漢字の見出しにはひらがなへのリンクのみをぶら下げて、本文はひらがなの見出しにのみぶら下げる」モードとが用意されています。で、容量優先と言うことで、後者の変換モードで変換実施。

結論としてはうまく動作して万々歳だったのですが、ちょっと使い勝手に違和感が。というのは、WDICで使っている広辞苑の方は、「ひらがなの見出しには漢字へのリンクのみをぶら下げて、本文は漢字の見出しにのみぶら下げる」と言う風に、逆の組み合わせになっているからなのです。

ならば、Perlスクリプトをちょっといじって、広辞苑と同じような形式での変換ができないかと思い立った次第。これがうまくいって、Perlに詳しくなれば、以前手に入れた「漢字源」のEPWING辞書もWDICに放り込めるのではないかと思ったり。

と言うわけで、しばらくがんばってみます。

|

« Visorのイースターエッグ | トップページ | ついにPalm Preで日本語入力に成功! »

コメント

コメントを書く



(ウェブ上には掲載しません)




トラックバック

この記事のトラックバックURL:
http://app.cocolog-nifty.com/t/trackback/140067/46491025

この記事へのトラックバック一覧です: Perl勉強中:

« Visorのイースターエッグ | トップページ | ついにPalm Preで日本語入力に成功! »