人気の投稿
2012年5月2日水曜日
RMeCab インストール (for windows)
『RMeCab の使い方』
http://rmecab.jp/wiki/index.php?plugin=attach&refer=RMeCab&openfile=manual.pdf
・ MeCab インストール
http://mecab.googlecode.com/svn/trunk/mecab/doc/index.html#download
・ R インストール
http://www.kkaneko.com/rinkou/r/rinstall.html
http://cran.r-project.org/
・ RMeCab (パッケージ) インストール
http://sites.google.com/site/rmecab/
http://rmecab.jp/wiki/index.php?RMeCab
http://rmecab.jp/wiki/index.php?cmd=read&page=SoftArchive&word=RMeCabInstall
[Tips]
RMeCabInstall.bat:右クリック -> 管理者として実行
Readmeから
実装関数の解説ページ
『Rによるテキストマイニング入門』に記載の無い関数を含めて解説
http://rmecab.jp/wiki/index.php?RMeCabFunctions
本書の p.47 でコマンドラインから mecabを実行する方法について
[スタート]->[すべてのプログラム]->[アクセサリ]->[コマンドプロンプト]
Windows の場合,以下のように修正のうえ、実行してください.
すなわち bin>mecab> を bin\mecab に修正してください.
C:\Program Files\MeCab\bin\mecab c:\work\test.txt > c:\work\res.txt
なお
[スタート]->[すべてのプログラム]->[プログラム]->[MeCab]->[MeCab]
を実行すると、mecabを単独で実行できます.
黒い画面内にテキストを入力しますが,日本語を入力するには, [ALT] キーを押しながら[全角/半角] ボタンを押して入力します
PDFから
作業フォルダ:R のコンソール画面でgetwd() を実行
RMeCabFreq() 関数の実行直後にlength =447 と表示されているが,これはテキスト内の形態素のタイプ数(異なり語数) が(句読点などの記号を含め)447 個であったことを意味する
MeCab の辞書整備
追加したいタームが活用するような場合は,その活用形をすべてユーザー定義しなければならない.詳細は
http://mecab.sourceforge.net/dic.html
登録:
コメントの投稿 (Atom)
0 件のコメント:
コメントを投稿