MeCabによる形態素解析 → マルコフ連鎖テスト
下記突っ込んでいただければ動くかと
mecabp.php の $path は適宜変更してください
元ネタを変える場合は index.php の $string いじってください
wget http://mecab.googlecode.com/files/mecab-0.996.tar.gz
tar xvzf mecab-0.996.tar.gz
cd mecab-0.996/
./configure
make
make check
make install
wget http://mecab.googlecode.com/files/mecab-ipadic-2.7.0-20070801.tar.gz
tar xvzf mecab-ipadic-2.7.0-20070801.tar.gz
cd mecab-ipadic-2.7.0-20070801/
./configure --with-charset=utf8
make
sudo make install
echo 'すもももももももものうち' | mecab
すもも 名詞,一般,*,*,*,*,すもも,スモモ,スモモ
も 助詞,係助詞,*,*,*,*,も,モ,モ
もも 名詞,一般,*,*,*,*,もも,モモ,モモ
も 助詞,係助詞,*,*,*,*,も,モ,モ
もも 名詞,一般,*,*,*,*,もも,モモ,モモ
の 助詞,連体化,*,*,*,*,の,ノ,ノ
うち 名詞,非自立,副詞可能,*,*,*,うち,ウチ,ウチ
EOS
git clone https://github.com/rsky/php-mecab.git
cd php-mecab/mecab/
phpize
./configure
make
make test
make install
vi /etc/php.ini
[Mecab]
extension_dir=/usr/lib/php/extensions/[install dir]
extension=mecab.so
php -r 'phpinfo();' | grep mecab
mkdir /usr/local/lib/mecab/dic/userdic
cp -a ./onomasticon.dic(下記参考URLにて生成) /usr/local/lib/mecab/dic/userdic/
vi /usr/local/etc/mecabrc
userdic=/usr/local/lib/mecab/dic/userdic/onomasticon.dic