jagtalk
English http://en.nishimotz.com/project:jagtalk
galateatalk をベースに nishimotz が開発を進めるかも知れない日本語音声合成エンジン。
リポジトリ http://github.com/nishimotz/jagtalk
最初のリポジトリ内容は gtalk-091012 そのものである。
名前の由来は ja (Japanese) + gtalk (GalateaTalk) である。
gtalk の名称は他のツール(例えば Google Talk) と区別しにくいので、名前をつけることにした。
視覚障害者支援技術への利用を重要なアプリケーションと考えている。 NVDA あるいは GNOME ORCA のような国際化を前提としたツールの一部として組み込まれることを想定している。 その際、日本語のTTSであることがわかりやすい名前をつけたかった。
関連記事:オープンソース音声技術の支援
当初の目標
当面は音質が犠牲になっても、高速性、安定性、Pythonとの親和性、再配布しやすいライセンス(GPL互換性)を目標にする。
具体的にはライブラリ化(so/DLL)や mecab 対応などを目指す。
その他のTODO
- PortAudio などオーディオデバイスまわりの見直し。
- 話速制御の研究など、自分が必要と思う改変
立場としては、どんどん github 上で fork してもらいたい。
技術メモ
Ubuntu 9.04 にて。gcc 環境は揃っているつもり。
sudo aptitude install libreadline5-dev make
この項、未完成
UTF-8 対応
2010-05-29 入出力だけ文字コード変換する方式で UTF-8 対応してみた。github に push してある。Ubuntu 9.04 以降に対応。
$ ./configure --enable-utf8 $ make $ ./gtalk -C ssm.conf set Text = あいうえお set Speak = NOW
で galatea-engine galatea-ja-chaone galatea-ja-unidic を使うテストができる。
ちなみに本家 gtalk もそうなのだが set Speak = NOW を "o" 1文字で短縮入力できる。
UTF8 モードでコンパイルすると libreadline を使わない。
configure.in をいじったときは autoconf をやり直すこと。
AC_ARG_ENABLE(utf8, [ --enable-utf8 Turn on utf8 mode (default=no)], [ if test "x$enable_utf8" = "xyes"; then AC_DEFINE(UTF8) AC_CHECK_LIB(iconv, iconv_open) enable_utf8=yes fi])