[Tips] ChaSenのインストール for MacOSX
泣きそうだった・・.つらかった.
まとめます.
早く言ってよ.
ChaSenには,Packageが用意されていた!!!
早速ダウンロードして,インストールする.
http://www.apple.com/jp/downloads/macosx/utilities/chasen.html
辞書を用意する前に.
MacはUTF-8なので,辞書もUTF-8にする必要がある.
そこで,変換ツールのnkfをインストールする.
http://www.ie.u-ryukyu.ac.jp/~kono/nkf/
こいつをダウンロードし,makeし,できたnkfを/usr/local/binにインストールする.
次にファイルを一括変換できるようにシェルスクリプトを用意する.
#!/bin/sh for file in $* do if [ -f $file ]; then nkf --utf8 $file > tmpfile mv tmpfile $file fi done exit
nkf_fileとでもして,保存.改行コード,文字コードに注意./usr/local/binにインストールする.
辞書の作成
次にipdicをダウンロードする.
http://chasen.aist-nara.ac.jp/chasen/distribution.html.ja
ダウンロードしたパッケージを解凍し,configure,makeする.
そして,辞書ファイル,*.dicをすべて,/usr/local/lib/chasen/dic/ipadicにインストールする.
sudo cp *.dic /usr/local/lib/chasen/dic/ipadic
そうすると,/usr/local/lib/chasen/dic/ipadicのパスに*.chaと*.dicが集まる.
ここで,
cd /usr/local/lib/chasen/dic/ipadic nkf_file *.cha nkf_file *.dic
として,UTF-8に文字コードを変換する.
ついでに,/usr/local/etcパスにあるchasenrcもUTF-8に変換する.
cd /usr/local/etc nkf_file chasenrc
ここで,お膳立ては終わり.
cd /usr/local/lib/chasen/dic/ipadic sudo `chasen-config --mkchadic`/makemat -i w sudo `chasen-config --mkchadic`/makeda -i w chadic *.dic
これで,辞書ファイルの作成は終了.お疲れッス.
確認
>echo 'OpenGLプログラミングを勉強する' | chasen -i w O オー O 記号-アルファベット p ピー p 記号-アルファベット e イー e 記号-アルファベット n エヌ n 記号-アルファベット G ジー G 記号-アルファベット L エル L 記号-アルファベット プログラミング プログラミング プログラミング 名詞-サ変接続 を ヲ を 助詞-格助詞-一般 勉強 ベンキョウ 勉強 名詞-サ変接続 する スル する 動詞-自立 サ変・スル 基本形 EOS
ソースから
ハマったところ.
とりあえず,ハマったところから.dartsの最新版は,0.3(2006/03/10現在)であるが,0.2と比較して,若干の手直しがなされている.
2005-12-24: darts 0.3 ・Double Array の作成時に不正特殊をアクセスする可能性があるバグを修正 ・メッソド名の一部変更 (setArray を set_array になど) ・rpm パッケージ配布の停止 ※サイトより抜粋
ハァ?つーことは・・・・.Chasenのビルドエラーは・・・・.こいつじゃねぇえか!!まさに.
そう,dartsは最新版を使ってはいけないのだ!
ビルヂング
・[[darts version 0.2>http://chasen.naist.jp/hiki/ChaSen/]]
・[[chasen version 2.3.3>http://chasen.org/~taku/software/darts/src/darts-0.2.tar.gz]]
dartsをビルド,インストールする.
>cd darts-0.2 >./configure >make >sudo make install
終了・・・・.
chaseをビルド,インストールする.
>cd chasen-2.3.3 >./configure >make >sudo make install
終了・・・・・・・・・・・・・・・・.
完成です.