Javaで使用できる形態素解析器を探していたところ,GoSenというものを発見。
どうやらMeCabをJavaに移植したものらしい。
では、早速使わせて頂くことにしよう。
GoSenを使用するのに以下のサイトを参考にさせて頂きました。
このサイトの通りにやれば上手く導入できるのですが、いくつかの注意点だけ書いてみる。
・Windows環境にApache Antのインストールする
こちらに分かりやすい手順が説明されています。
・antコマンドを使用すると"Unable to locate tools.jar. Expected to find it in C:\Program Files\Java\jre6\lib\tools.jar"という出力を返す
jdkをインストールして、パスを通したところ正常にコマンドを実行できました。
辞書を作成して,実行したところ…
辞書を作成して,実行したところ…
やはりJavaで使えると嬉しいもんだ。
追記
Eclipseの標準入力をUTF-8にするために eclipse.ini ファイルに-Dfile.encoding=utf-8の記述を追加
追記
Eclipseの標準入力をUTF-8にするために eclipse.ini ファイルに-Dfile.encoding=utf-8の記述を追加