老眼palm

老眼だけど、ぢっと掌を見る プロフィール RSS

タグ「Linux」のアーカイブ

老眼鏡の買い替え

昨日、老眼鏡を買い替えた。度が少し進んで見えにくくなったのもあるが、一番大きいのは気分を変えたかったから。考えてみると、失くした、壊した以外の理由で買い替えるのは初めてだ(笑)。

買ったのは、上野駅の明正堂書店の前にあるJINSという安売りメガネの店。5,990円也。視力検査が20分待ちくらいで、レンズを決めてから受け取るまでが40分待ちくらい。フレームを選んだり、店員とやりとりする時間含めても2時間くらいで済んだ。待ち時間は明正堂で本を買ったり、ドトールでコーヒー飲んだりしていた。

遠近両用にしたほうが良いのだろうが、値段が安いので、やっぱり普通の老眼鏡にしてしまった。メガネ屋の店員に「老眼鏡をくれ」というと、「近く用のメガネですね」と言い直すのはなぜなんだろう。

写真は、現在愛用中のpalm deviceであるiphoneの上に老眼鏡をのせて、老眼鏡palmとシャレてみた。そういえば、iOS4への無料アップデートが6/21から始まるらしい。明日から海外出張なので、帰ってきてからやろう。待てよ、OSをアップデートするとubuntuとの相性が悪くなるかな?せっかくubuntu 10.04でiTunesいらずの状況で使えてるんだけどなあ。

Google日本語入力「Mozc」の辞書強化

このところ、新入社員の歓迎会やら海外支店の連中との飲み会やらが続いていて、週末はなんだかくたびれて、何もやる気がしない状況が続いている。もうちょっと天気がよければ、自転車でその辺を一回りしてくる気にもなるのだけど。

んなわけで、家でくすぶって2chなぞ眺めてて拾った情報を元に、UTUMIさんの私家版mozc辞書を入れてみた。

  1. tar ballを~/src/mozc/srcに展開。
  2. cd mozcdic-ut-20100530
  3. 人名やら郵便番号やらカタカナ語は必要なさそうなので、meisiだけが入るようにapply-mozdic-ut.shを変更。(自分でコマンド打ってもいいが。)
  4. ビルド手順に従ってdebパッケージをビルドしてインストール。(gclient sync; debuild -uc -us; sudo dpgk -iだけで良いような気がするんだが、svn coも要るのかな?)
  5. 念のため、~/.mozcを一回消してから使い始める。

このPCで文章を打つのはこのブログの記事ぐらいだし、最近、更新の頻度も落ちてるしで、追加した辞書の効果はよく分からないが、辞書ファイルを眺めてる限りでは少し期待できそう。mozc自身も最近のアップデートで、辞書ツールなどが整備されてだいぶ使いやすくなった。変換パネルのアイコンが駐車禁止マークになってしまうのは次のようにすれば良い。

  1. sudo mkdir /usr/share/ibus-mozc
  2. 上記で作成したディレクトリに、product_icon.pngやunknown.icoを用意する。(product_icon.pngにはネットで拾ったmozcのiconを、unknown.icoは/usr/share/icons/gnome/scalable/categories/preferences-system.svgへのシンボリックリンクとした。)

mozcのコードを読んでみた記事などもチラホラと眺めてみた。(この記事によくまとまっている。)開発者が一生懸命手で書いた規則を用いるのではなく、確率的(統計的)な手法を用いることで、保守性や発展性を高めようという話のようだ。mozcも統計的かな漢字変換だが、Anthyもそうだというのは全然知らなかった。使えればいいやと思ってたし、ubuntuはある程度のレベルをきちんと提供してくれるから、考える必要もなかった。

理論的、数学的に攻めることでしっかり成果が出るんだなあ、と感心するが、中身の理論は数式たっぷりの世界で、全然歯が立たない。

6/5追記:上記のUTUMIさんのページに行ったら、私家版辞書を組み込んだバイナリ配布は避けて欲しいと書いてあった。自分でビルドして試すのは良いのだろうが、私家版辞書で小さく満足してもらうのは本意でないようなことも書いてあったので、とりあえず、辞書は元に戻して使っていくことにした。

ubuntu 10.04でのunzipの文字化け問題

いろいろ紆余曲折した感じなので、メモを残しておく。

ubuntuでWindows環境で作ったzipファイルを展開すると、SJISのファイル名が化ける問題は、Ubuntu Japanese Teamの追加パッケージのunzipを使えば対応できていた

ところが、ubuntu 10.04ではLANGがja_JP.UTF-8ではなくja_JP.utf8になるケースがあって、ja_JP.UTF-8だけを想定している追加パッケージのunzipでも文字化けが発生していた。仕方がないので、~/.xprofileに”export LANG=ja_JP.UTF-8″を仕込んでしのいでいた

調べてみると、~/.dmrcが悪さをしているという記事がみつかり、その記事にしたがってdpkg-reconfigure localesして~/.dmrcを編集して対処した。これで~/.xprofileは不要になってすっきりする。

これで一段落と思ったが、2ch経由で知ったフォーラムの記事によれば、将来LANGは*.utf8形式に収束するらしい。次の対応をとった。

  1. Ubuntu Japanese Teamのリポジトリからunzip_6.0-2~5.52~ja4_i386.debをインストールする。(このバージョンはUTF-8とutf8の両方に対応している。)
  2. sudo dpkg-reconfigure localesする。
  3. ~/.dmrcを編集して、Language=ja_JP.utf8にする。
  4. 再ログインする。LANGはja_JP.utf8になる。

多分これで一件落着だろう。結局、ubuntu 10.04にはUbuntu Japanese Teamのパッケージリポジトリは適用せず、次の対処だけを行っている。

  • 日本語pdf用にpoppler-dataをインストールする
  • Ubuntu Japanese TeamのリポジトリからSJIS対応unzipのdebファイルをダウンロードして、それをインストールする

フォーラムの記事から辿っていくと本家のunzipにもパッチが当たりそうな、当たらなそうな話があるようだ。日本語以外の環境に影響を与えない範囲で、本家に取り込まれて欲しい。

Google日本語入力「Mozc」インストール

Google日本語入力のオープンソース版「Mozc(モズク)」が公開されたというので、なんとなくインストールしてみた。ビルド手順の通りにコマンドを打てば完了。debファイルを公開しているサイトもあるようだ。

そういえば、以前Linuxを熱心に使っていた頃(10年前くらい?)には、日本語入力もCannaに非公開パッチを丁寧に当てて、辞書もいろいろ頑張ったりして使っていたものだった。結局、自分が文章を打つときには、入力ミスも多いし、変な文節の切れ目で変換させる癖があるから、プログラム側で頑張っても大した効果はないようだった。

元々ATOKには馴染めなかったので、会社で使うPCでも永らくWindowsのIMEを使っていた。ところが、しばらく前にIMEが恐ろしく調子が悪くなって、たまたま出たばかりのGoogle日本語入力を使ってみたりしていた。やたらに固有名詞が一発で変換できるが、その売り言葉ほど、大規模語彙データの威力を感じることはなかった。予測変換は指が慣れると使いやすかもなあ、と思いつつ惰性で使い続けていた。

オープンソース版は、大規模語彙データの利用はできないし、単語登録もできない。なんでこんなのが第一候補になるんだろうと思うことも多い。しかし近頃、日本語入力(だけではないけど)には余り多くを要求しないようになってるし、会社のPCと同じく予測変換が使えるから、しばらくubuntuでもGoogle日本語入力を使ってみようと思う。(「とおもう」で「と思う」と変換してくれるので、文節の切れ目の判断は自分の入力の癖に合っているかも。)

ubuntu 10.04 (Lucid Lynx) RCをインストール

VirtualBoxや予備のHD上でubuntu 10.04 betaを試してきていたが、安定して動くように思えたので、RC (Release Candidate)が出た機会に、メイン環境にインストールしてみた。今のところ、特に問題なく動いている模様。

やったこと、気になったことなどは次のとおり。

  • gconftool-2でウィンドウ操作ボタンを右側に移動。(他にも色々やり方があるようだが、これがシンプル。)
  • ubuntu restricted extrasを入れれば、動画や音楽なんかの再生には、ほぼ困らないで済むようになる。(libdvdcssが要る場合は別途インストールする必要あり。)
  • 動画再生はsmplayerがお気に入りだが、それを使うと、インストールされているmplayerのバージョンが古いと文句を言われるものの、とりあえずは使えている。(ubuntu 9.10のsmplayerは、コマ送りすると時々止まったりしたが、それより安定しているかも。)
  • デフォルトのフォントはtakaoというIPAフォントベースのものに変わったらしい。そのせいか分からないが、インストール中の表示はフォントのバランスがいまいちで、Google-chromeの表示も変な感じ。M+FONTのTESTFLIGHT 029を元に自前で用意したフォントに切り替えて使う。
  • Windows環境で作ったzipファイルの文字化けを避けるために、Ubuntu Japanese Teamのリポジトリから、unzipを落としてきて使う。なぜだか分からないが、インストール時に作成したアカウントでは、LANGがja_JP.utf8に設定されて、このunzipの文字化け対応がうまく動かないので、~/.xprofileに次を仕込む必要あり。

    export GDM_LANG=ja_JP.UTF-8

  • その他は、いつものインストールと同じ。(日本語pdf用にpoppler-dataをインストールする、/etc/rc2.d/S99ondemandをK99ondemandにrenameする、など)

また今年もGWを待てずに春のバージョンアップをやってしまった。例によって、アップグレードすると、前のバージョンよりサクサク動くと感じてしまうのだが、気のせいでも得した気分だ。iPhoneの画像や音楽は普通に読み出しできているが、書き込みは試していない。

4/25追記:ちょっと試してみたら、画像はnautilusでDCIMフォルダにドラッグ&ドロップすれば書き込みできる模様。音楽もRhythmboxでライブラリからデバイスのiPhoneにD&Dすれば書き込めるようだ。ますます便利になってきた。