このところ、新入社員の歓迎会やら海外支店の連中との飲み会やらが続いていて、週末はなんだかくたびれて、何もやる気がしない状況が続いている。もうちょっと天気がよければ、自転車でその辺を一回りしてくる気にもなるのだけど。
んなわけで、家でくすぶって2chなぞ眺めてて拾った情報を元に、UTUMIさんの私家版mozc辞書を入れてみた。
- tar ballを~/src/mozc/srcに展開。
- cd mozcdic-ut-20100530
- 人名やら郵便番号やらカタカナ語は必要なさそうなので、meisiだけが入るようにapply-mozdic-ut.shを変更。(自分でコマンド打ってもいいが。)
- ビルド手順に従ってdebパッケージをビルドしてインストール。(gclient sync; debuild -uc -us; sudo dpgk -iだけで良いような気がするんだが、svn coも要るのかな?)
- 念のため、~/.mozcを一回消してから使い始める。
このPCで文章を打つのはこのブログの記事ぐらいだし、最近、更新の頻度も落ちてるしで、追加した辞書の効果はよく分からないが、辞書ファイルを眺めてる限りでは少し期待できそう。mozc自身も最近のアップデートで、辞書ツールなどが整備されてだいぶ使いやすくなった。変換パネルのアイコンが駐車禁止マークになってしまうのは次のようにすれば良い。
- sudo mkdir /usr/share/ibus-mozc
- 上記で作成したディレクトリに、product_icon.pngやunknown.icoを用意する。(product_icon.pngにはネットで拾ったmozcのiconを、unknown.icoは/usr/share/icons/gnome/scalable/categories/preferences-system.svgへのシンボリックリンクとした。)
mozcのコードを読んでみた記事などもチラホラと眺めてみた。(この記事によくまとまっている。)開発者が一生懸命手で書いた規則を用いるのではなく、確率的(統計的)な手法を用いることで、保守性や発展性を高めようという話のようだ。mozcも統計的かな漢字変換だが、Anthyもそうだというのは全然知らなかった。使えればいいやと思ってたし、ubuntuはある程度のレベルをきちんと提供してくれるから、考える必要もなかった。
理論的、数学的に攻めることでしっかり成果が出るんだなあ、と感心するが、中身の理論は数式たっぷりの世界で、全然歯が立たない。
6/5追記:上記のUTUMIさんのページに行ったら、私家版辞書を組み込んだバイナリ配布は避けて欲しいと書いてあった。自分でビルドして試すのは良いのだろうが、私家版辞書で小さく満足してもらうのは本意でないようなことも書いてあったので、とりあえず、辞書は元に戻して使っていくことにした。