MeCabのWindows版をインストールしてみる

今構想中のアプリの開発に形態素解析が必要なので、
とりあえずインストールしてみる。

形態素解析にはYahooAPIという選択肢もあったのだけど、
1日の利用制限が50000回で1リクエスト100キロバイト以下という制限が、
今回のアプリには厳しそうだったのでMeCabを選択した。

公式サイト
http://mecab.sourceforge.net/


今回インストールするバージョンは「0.98」

手順
------------------------------
1. ダウンロード
2. インストール
3. 動作確認

1. ダウンロード
以下のサイトからWindows版のexeファイル「mecab-0.98.exe」をダウンロードする。
http://sourceforge.net/projects/mecab/files/


2. インストール
ダウンロードしたexeファイルをダブルクリックする。

A. 辞書の文字コード
 辞書の文字コードは、今回「UTF-8」を選択

あとはそのまま「次へ」で。

辞書の作成に1分ほどかかるとメッセージが出るが、
10秒ほどで終わった。

インストールは以上。

3. 動作確認
辞書の文字コードを「Shift-JIS」にした人は、
おそらくコマンドプロンプト上でうまく動作確認ができる。
公式サイトの「とりあえず解析してみる」を参照。
http://mecab.sourceforge.net/#parse

自分は辞書の文字コードを「UTF-8」にしたので、
ファイルの入力、出力で動作確認を行う。

以下のファイルを作る。

ファイル名:in.txt
文字コード:UTF-8
ファイルの中身:私は走りながら考えるエンジニアです。

そしたら、コマンドプロンプト上で、
mecab.exe in.txt -o out.txt

と入力して実行する。

結果が以下のとおりになったらOK。
私	名詞,代名詞,一般,*,*,*,私,ワタシ,ワタシ
は 助詞,係助詞,*,*,*,*,は,ハ,ワ
走り 動詞,自立,*,*,五段・ラ行,連用形,走る,ハシリ,ハシリ
ながら 助詞,接続助詞,*,*,*,*,ながら,ナガラ,ナガラ
考える 動詞,自立,*,*,一段,基本形,考える,カンガエル,カンガエル
エンジニア 名詞,一般,*,*,*,*,エンジニア,エンジニア,エンジニア
です 助動詞,*,*,*,特殊・デス,基本形,です,デス,デス
。 記号,句点,*,*,*,*,。,。,。
EOS


意外とあっさり動いた。
タグ:mecab
posted by handsrecs at 00:25 | Comment(0) | TrackBack(0) | 日記 | このブログの読者になる | 更新情報をチェックする
この記事へのコメント
コメントを書く
お名前:

メールアドレス:

ホームページアドレス:

コメント:

認証コード: [必須入力]


※画像の中の文字を半角で入力してください。
※ブログオーナーが承認したコメントのみ表示されます。
この記事へのトラックバックURL
http://blog.seesaa.jp/tb/140090025
※ブログオーナーが承認したトラックバックのみ表示されます。

この記事へのトラックバック
×

この広告は1年以上新しい記事の投稿がないブログに表示されております。