2012年5月2日水曜日

RMeCab インストール (for windows)



『RMeCab の使い方』
http://rmecab.jp/wiki/index.php?plugin=attach&refer=RMeCab&openfile=manual.pdf

・ MeCab インストール
http://mecab.googlecode.com/svn/trunk/mecab/doc/index.html#download

・ R インストール
http://www.kkaneko.com/rinkou/r/rinstall.html
http://cran.r-project.org/

・ RMeCab (パッケージ) インストール
http://sites.google.com/site/rmecab/
http://rmecab.jp/wiki/index.php?RMeCab
http://rmecab.jp/wiki/index.php?cmd=read&page=SoftArchive&word=RMeCabInstall




[Tips]

RMeCabInstall.bat:右クリック -> 管理者として実行



Readmeから

実装関数の解説ページ
『Rによるテキストマイニング入門』に記載の無い関数を含めて解説
http://rmecab.jp/wiki/index.php?RMeCabFunctions


本書の p.47 でコマンドラインから mecabを実行する方法について
 [スタート]->[すべてのプログラム]->[アクセサリ]->[コマンドプロンプト]
 Windows の場合,以下のように修正のうえ、実行してください.
 すなわち bin>mecab>  を bin\mecab に修正してください.

 C:\Program Files\MeCab\bin\mecab  c:\work\test.txt > c:\work\res.txt

 なお
  [スタート]->[すべてのプログラム]->[プログラム]->[MeCab]->[MeCab]
 を実行すると、mecabを単独で実行できます.
 黒い画面内にテキストを入力しますが,日本語を入力するには, [ALT] キーを押しながら[全角/半角] ボタンを押して入力します



PDFから

作業フォルダ:R のコンソール画面でgetwd() を実行

RMeCabFreq() 関数の実行直後にlength =447 と表示されているが,これはテキスト内の形態素のタイプ数(異なり語数) が(句読点などの記号を含め)447 個であったことを意味する


MeCab の辞書整備
 追加したいタームが活用するような場合は,その活用形をすべてユーザー定義しなければならない.詳細は
http://mecab.sourceforge.net/dic.html






0 件のコメント:

コメントを投稿