mecabはオープンソースの形態素解析システム。
CRF を使っており chasen と比べて性能が高いとされる。
Open JTalk は mecab のソースコードを内包している。
nvdajp_jtalk で使っている。具体的には libopenjtalk は DLL 版の mecab を呼び出すようになっている。
since 2011-01-19
MeCab: Yet Another Part-of-Speech and Morphological Analyzer Copyright(C) 2001-2008 Taku Kudo Copyright(C) 2004-2008 Nippon Telegraph and Telephone Corporation Usage: /usr/lib/mecab/mecab-dict-index [options] files -d, --dicdir=DIR set DIR as dicdi (default ".") -o, --outdir=DIR set DIR as output dir (default ".") -U, --unknown build parameters for unknown words -u, --userdic=FILE build user dictionary -C, --charcategory build character category maps -m, --matrix build connection matrix -c, --charset=ENC make charset of binary dictionary ENC (default EUC-JP) -t, --charset=ENC alias of -c -f, --dictionary-charset=ENC assume charset of input CSVs as ENC (default EUC-JP) -w, --wakati build wakati-gaki only dictionary -p, --posid assign Part-of-speech id -F, --node-format=STR use STR as the user defined node format -v, --version show the version and exit. -h, --help show this help and exit.