目次

mecab

mecabはオープンソースの形態素解析システム。

CRF を使っており chasen と比べて性能が高いとされる。

日本語音声合成での利用

Open JTalk は mecab のソースコードを内包している。

nvdajp_jtalk で使っている。具体的には libopenjtalk は DLL 版の mecab を呼び出すようになっている。

Apple iOS における mecab

Apple の iOS の著作権表示には mecab の名前が出てくる。

日本語テキストを扱うアプリを作るなら注目!「Mecab on iPhone」

mecab+iPhone ブックマーク

mecab-dict-index

since 2011-01-19

MeCab: Yet Another Part-of-Speech and Morphological Analyzer

Copyright(C) 2001-2008 Taku Kudo
Copyright(C) 2004-2008 Nippon Telegraph and Telephone Corporation

Usage: /usr/lib/mecab/mecab-dict-index [options] files
 -d, --dicdir=DIR              set DIR as dicdi (default ".")
 -o, --outdir=DIR              set DIR as output dir (default ".")
 -U, --unknown                 build parameters for unknown words
 -u, --userdic=FILE            build user dictionary
 -C, --charcategory            build character category maps
 -m, --matrix                  build connection matrix
 -c, --charset=ENC             make charset of binary dictionary ENC (default EUC-JP)
 -t, --charset=ENC             alias of -c
 -f, --dictionary-charset=ENC  assume charset of input CSVs as ENC (default EUC-JP)
 -w, --wakati                  build wakati-gaki only dictionary
 -p, --posid                   assign Part-of-speech id
 -F, --node-format=STR         use STR as the user defined node format
 -v, --version                 show the version and exit.
 -h, --help                    show this help and exit.