■ canna に関して □ cannaの単語登録 ◆ 選択範囲の単語の登録 登録したい単語をクリップボード(?)に保存し, (C-k や C-Space,M-w などで行う) 「M-x canna-touroku-region」と 入力する. その後, 「読み」, 「単語の品詞」を聞かれるので適宜入力する. なお, 入力を間違った場合は「C-g」で一つ手前に戻る. ◆ 直接単語を入力して登録 「M-x canna-touroku」と 入力する. その後, 「単語」, 「読み」, 「単語の品詞」を聞かれるので適宜入力する. なお, 入力を間違った場合は「C-g」で一つ手前に戻る. □ canna変換頻度学習ファイル canna で「へんかん」という文字を変換しようとすると, 1. 変換 2. 返還 3. 辺間 4. ヘンカン 5. へんかん というように変換候補が表示されるとする. ここで例えば『返還』という文字 を多用したいとしても, デフォルトだと何度『返還』を選んでも返還項目の 1番目には必ず『変換』が登場してしまう. こういったユーザの変換の頻度を学習する, 「ユーザ変換頻度学習」ファイル を作成することができる. 作成するには以下のように mkdic に -fq オプションをつけて最後に目的の 辞書を指定すると良い. $ mkdic -fq iroha すると /var/lib/canna/dic/user/<ユーザアカウント>/ 以下に frq*.cld というファイルが作成される. これが頻度学習ファイルである. 各辞書毎に作成することが可能である. 複数の辞書の頻度学習ファイルを作成すると, frq1.cld, frq2.cld といった ファイルが作成されていく. どの頻度学習ファイルがどの辞書に対応するかは /var/lib/canna/dic/user/<ユーザアカウント>/dics.dir の中に記述してある. 現在使用している辞書全てに変換頻度学習ファイルを作成しようと思ったら, 以下のコマンドを使用すると良い. $ mkdic -fq `lsdic -i` lsdic とは現在ユーザが使用している辞書ファイルの一覧を表示する コマンドである. なお, 既に頻度学習ファイルが作成されている辞書ファイルの頻度学習ファイル を再度作成しようとすると, 上書きするかどうか質問される. 上書きしてしまうと今まで学習した内容が全て消えてしまうため注意すること. ◆ 参考資料 かんな指南 http://www.db.is.kyushu-u.ac.jp/~moriki/Canna.html □ cannaの他人の単語登録内容を喰らう 上記の単語登録で登録された内容は /var/lib/canna/dic/user/*****/usr1.ctd (***** はユーザ名) に登録されている. 基本的にこのファイルは他人にも見え, 且つテキストファイルになっている ので読み込んで自分の usr1.ctd を強化することが可能である (外道) 1. まずは人の usr1.ctd をコピーして来る (このファイル名を other_usr1.ctd としておく) 2. kinput を停止しておく. (とりあえず) 3. これを自分の usr1.ctd にリダイレクトする # cat other_usr1.ctd >> /var/lib/canna/dic/*****/usr1.ctd 4. そしてすぐに canna を再起動しておく # /etc/init.d/canna restart 5. 実際に今回新たに加わった単語が変換できるかチェックする. 6. 登録内容を'あいうえお'順に並べる. 基本的に, usr1.ctd には単語が 'あいうえお' 順に並んでいるが, 今回のようにすると順番がばらばらになってしまう. しかし, usr1.ctd を強化した後, 新たに何らかの単語登録をすると ちゃんと 'あいうえお' 順に並び替えてくれる. □ 地球物理用の canna 辞書を利用する 本来の canna についている辞書では地球物理に関係する専門用語の変換 には足りないので, 地球物理用の辞書を利用する. ソースのダウンロード, インストール, 詳細な解説など, 以下のURLに大抵必要なことは載っているので, まずはここを参照する. 地球物理辞書 (CHIBUTSU CLUB) http://www.chibutsu.org/jisho/index.html ◆ インストール手順 1. 辞書ファイルのダウンロード 上記のページの「ダウンロード」のリンクから移動し, 「品質管理版」の方の「UN*XでCanna(chibutsu-canna.tar.gz)」 をダウンロード. ちなみにこのファイルのURLは http://www.chibutsu.org/jisho/chibutsu-canna.tar.gz 2. インストール方法の選択 インストール方法は http://www.chibutsu.org/jisho/canna/index.html に載っており, ここにはユーザ用テキスト辞書としてインストール する場合と, システム用バイナリ辞書としてインストールする 方法他載っているが, 自PCなのでシステム用バイナリ辞書 としてインストールする. 3. バイナリ辞書ファイルの生成 まずは tar.gz ファイルを解凍する. $ tar xvfz chibutsu-canna.tar.gz すると, chibutsu ディレクトリが作成されるので そこに移動し, バイナリ辞書ファイルを生成する. $ cd chibutsu $ mkbindic -m chibutsu.t すると, バイナリ辞書ファイルである chibutsu.cbd , chibutsu.cld が生成される. 4. システム辞書ディレクトリに格納 Debian 2.2 では, /var/lib/canna/dic/canna が システム辞書ディレクトリである. ここに先程生成された辞書ファイルを格納する. # cp chibutsu.cbd chibutsu.cld /var/lib/canna/dic/canna/ この2つのファイルの所有者を root (もしくは bin) に 変更する. # cd /var/lib/canna/dic/canna/ # chown root:root chibutsu.cbd chibutsu.cld 5. システム辞書の管理用ファイルに chibutsu 辞書を追記 Debian 2.2 のシステム辞書の管理用ファイルは /var/lib/canna/dic/canna/dics.dir である. ※ Debian 3.0 woody に関して woody でのシステムファイルも potato(Debian 2.2)の 場合と同様だが, woody では /etc/canna/dics.dir.d/00canna.dics.dir を書き換えた後に # update-canna-dics_dir コマンドで上記のシステムファイルに設定を反映させるように なった. このファイルに, 以下の記述を追記する. chibutsu.cbd(chibutsu.mwd) -chibutsu--- chibutsu.cld(chibutsu.mwd) -chibutsu--- 6. 個人用 canna 設定ファイルに chibutsu 辞書を追記 canna の設定ファイルは ~/.canna であり, これが無いユーザは自動的に /var/lib/canna/default.canna (Debian 2.2 -potato-) , または /etc/canna/default.canna (Debian 3.0 -woody-) を設定ファイルとして読み込む. よって, .canna を持っているユーザは .canna を そうでないユーザの場合は /var/lib/canna/default.canna (Debian 2.2 -potato-) , または /etc/canna/default.canna (Debian 3.0 -woody-) に以下の記述を追記する必要がある. (use-dictionary "iroha" "fuzokugo" "hojomwd" "hojoswd" "keishiki" "chibutsu" <- この部分を追記 :bushu "bushu" :user "user" ) 7. cannaserver の再起動 以下のコマンドで canna を再起動する. kinput などが動いている場合にはとりあえず停止しておくこと. # /etc/init.d/canna restart 8. 確認 いんすうぶんかい → 因数分解 かこうせんりょくがん → 花崗閃緑岩 ぎしつじゅんだんねつげんりつ → 擬湿潤断熱減率 けいあつふあんていはどう → 傾圧不安定波動 ちょうせきは → 潮汐波 わくせいべーたこうか → 惑星β効果 などなど, 普通「ありえないだろ」というような 変換が行われているか確認する. □ canna 辞書 (cannadic) を利用する. 一般的に利用される用語を登録した canna の辞書(cannadic)を 利用する. 今回組み込んだのは cannadic-0.94b で収録単語数は 80000 を超える. 例のごとく丁寧な解説の載っているページがあるのでそれを参考にする. かんな辞書 http://cannadic.oucrc.org/ ◆ インストール手順 1. ソースのダウンロード http://cannadic.oucrc.org/ から かんなの辞書のソースファイルである cannadic-0.94b.tar.gz をダウンロードしてくる. サイズは 1.0MB 弱である. 2. ソースの展開 $ tar xvfz cannadic-0.94b.tar.gz $ cd cannadic-0.94b 3. cld, cbd ファイルの生成 始めはテキストファイルの gcanna.t があるだけなので, 以下のコマンドで gcanna.cld, gcanna.cbd を生成する. $ make maindic 4. かんなサーバ, kinput を停止 かんなサーバとkinputを停止する. kinput は ps コマンドでプロセスIDを調べ, kill すればよい. $ ps aux|grep kinput morikawa 953 0.1 1.8 … 0:01 kinput2 ^^^ $ kill 953 かんなサーバはルートになって init.d 以下の canna コマンドを 使用すれば良い # /etc/init.d/canna stop 5. 辞書ファイルをかんな辞書ディレクトリに移動 Debian GNU/Linux でのかんな辞書のディレクトリは /var/lib/canna/dic/canna/ である. 以下のコマンドを使用して cannadic の辞書ファイルを このディレクトリの下に移動する. # install -o bin -g bin -m 0664 gcanna.cld /var/lib/canna/dic/canna/ # install -o bin -g bin -m 0664 gcanna.cbd /var/lib/canna/dic/canna/ # install -o bin -g bin -m 0664 gcannaf.t /var/lib/canna/dic/canna/ 6. 辞書登録ファイルに今回追加したファイル名を書き込む 辞書登録ファイルは /var/lib/canna/dic/canna/dics.dir である. (woody の場合は少し作法が変わるため, 上記のchibutsu辞書の インストールを参照する事) ここに今回追加した辞書の情報を書き込む. 具体的には以下の記述を書き足せば良い. gcanna.cbd(gcanna.mwd) -gcanna--- gcanna.cld(gcanna.mwd) -gcanna--- gcannaf.t(.swd) -gcannaf--- 7. かんなの設定ファイルに gcanna 辞書に関する情報を追記 ~/.canna か, /var/lib/canna/default.canna (Debian 2.2 -potato-) , または /etc/canna/default.canna (Debian 3.0 -woody-) に以下の情報を追記する. "gcanna" ; ←自立語辞書はこの行を追加 "gcannaf" ; ←付属語辞書はこの行を追加 ;;"iroha" ; ←上位互換なのでこの行はコメントアウトしてもかまいません 8. かんなサーバ, kinput2 の起動 # /etc/init.d/canna start $ kinput2 & 9. ユーザの頻度辞書の作成 以下のコマンドで, どの単語をどれだけ変換したかという 情報が書き込まれるユーザ頻度辞書を作成する. $ mkdic -fq gcanna 以前に作成されている場合には上書きされるか聞かれるので, yes を選択すること. なお, このコマンドによって /var/lib/canna/dic/user/****/ いかに frq1.cld ファイルが作成され, dics.dir にこのファイルの情報が追加される. 以上で cannadic が使用できるようになったはずである. 『かいざん』が『改竄』に変換できるかなどチェックしてみよう. □ GUI で cannaの単語登録 世の中は便利になったもので GUI で canna の単語登録をできる ツールも存在する. モノの名は cannatool というものである. これについては以下のページを参照のこと ・ 山賊版プログラム http://mof.ath.cx/sitoken/sanzokuban/index.html - Canna 辞書管理ツール http://mof.ath.cx/sitoken/sanzokuban/canna/index.html