擬人化音声対話エージェントツールキット Galatea Toolkit は、広く人間と機械の音声対話の技術を開発・普及するべく、以下の特長を持つ技術として開発されました。
Galateaプロジェクトの母体であったコンソーシアム(ISTC)の活動は2009年に終了しました。 これを踏まえて、私は
を行う活動に取り組んでいます。
nishimotz アットマークを入れる gmail.com にお気軽に御連絡ください。
東京大学との共同研究は、西本の立場でオープンソースを活用したビジネス(直接の成果を公開できない場合)をサポートさせていただく一つの選択肢です。 不自然な枠組みと思われるかも知れませんが、就業規定や「利益相反」の問題を回避するために必要な手続きです。
具体的には、企業の方に、私の所属(東京大学)と共同研究契約を結んでいただき、私から情報提供や技術支援などのサービスを提供することが可能です。
必要に応じて、さらに適切なパートナーをご紹介することもありえます。予算については(下限の規定がないので)柔軟に対応できると思います。
ただし成果の帰属や公開等について、大学の基本方針に従った契約を結んでいただく必要があります。契約は年度ごとです。年度末が近い場合は新年度の契約開始にさせていただくことがあります。
参考までに、本件に関連しそうな東京大学の教職員の規定は下記の通りです。
企業の技術アドバイザーのような職務を私が大学と兼業でお引き受けできる場合があります (大学からの許可を得ることが必要です)。 特に協業の成果について、東京大学の共同研究規定がご要望を満たしにくい場合に、選択肢になるようです。 詳細はお問い合わせください。
同じく、東京大学の既存の制度を活用するアイディアです。
科研費や共同研究に頼らずに、法人や個人から少額の寄附金を幅広く集めて活動し、目的に合わせて成果の社会還元方法を選択する、非営利団体(NPO)型の研究プロジェクトができないだろうか、と考えています。
共同研究と異なり、いただいた寄附金について、個別に年度単位で会計を締める必要がないのが(受け入れ側の)メリットです。
奨学寄附金は文字通り「寄附」であり、特定の相手に(いただいた寄附に見合ったものであるとしても)独占的に便宜供与はできません。ですので、この場合、成果は誰に対してもオープンにすることになります。この考え方は、非営利団体型の活動にマッチすると考えられます。
今後の Galatea Toolkit について、このような趣旨の活動を遂行する非営利組織の設立が考えられます。具体的には、以下のような考え方の組織です:
もう少し活動の内容を具体的に挙げてみます:
「ビジネスの手法で社会に貢献する方法」について、いろいろな立場の方の御意見を伺いたいと思います。
既存の組織を活用させていただく可能性もありますが、その場合にも、本稿の考察を踏まえて検討をするつもりです。
ビジネスと直接つながらない活動をサポートするのであれば、まずはオープンソースコミュニティが活動の拠点です。
また、ビジネスでの利用をお考えの方についても、成果を部分的に無償公開することが戦略的に有効、という場合は、 オープンソースコミュニティでの支援が可能です。
現在は sourceforge.jp に galatea プロジェクトのサイトを開設しています。
西本個人も関連する技術情報を提供しています。
galatea プロジェクトはさらに、julius や galateatalk など、関連プロジェクトの成果を活用させていただいています。
今後の活動方針についていくつかの案:
具体的な作業についての案:
スクリーンリーダNVDA日本語化プロジェクトのメンバーとして、 日本語テキスト音声合成技術の組み込みに関するお手伝いをしています。
西本が IPA 未踏ソフトウェア事業に採択されて、2005年に開発をはじめた「オラビー:ラジオ番組投稿支援システム」は、 2009年よりオープンソースプロジェクトとして取り組んでいます。
Galatea Project では2000年~2002年度に情報処理技術振興協会(IPA) の支援 (2000, 2001年度 独創的情報技術育成事業、2002年度 重点領域情報技術開発事業) を受け、財団法人京都高度技術研究所 (ASTEM) とIPAの契約の元に、主に大学の十数名の研究者が協力して開発を行ないました。この成果は2003年に「IPAライセンス版(galatea-linux-ipa および galatea4win-ipa)」としてリリースされました。
2003年11月から2009年3月まで、情報処理学会 音声言語情報処理(SLP)研究会のもとで音声対話技術コンソーシアム(ISTC) が活動を行い、このツールキットの改良を行いつつ、技術講習会などを行いました。この期間の成果は「IPAライセンス版のアップデート」という形でのリリースを続けていく予定です。
この活動にずっと関わってきた私は「オープンソースプロジェクトであることの意味」を改めて考え直しているところです。
すでに商用の音声合成エンジンが複数存在します。一方で、商用のエンジンに依存せず行いたい研究開発や標準化検討などの活動は重要です。
例えば、スクリーンリーダや音声ブラウザなどのアクセシビリティ支援技術は、そもそも市場が小さく、ビジネスになりにくい、だから、こうした技術に使われる音声合成エンジンが無償であることに意味がある、という意見も頻繁に伺います。
一方で、ビジネスになるかどうかは「やり方次第」であり、既存のビジネスを破壊することが一方的な正義であってはいけない、という立場も納得できます。
私はオープンソースを「オープンプロセス=開発プロセスをオープン化した結果として生じる成果」と捉えています。オープンソースの発展は、「インターネットの速度感」に「ソフトウェア開発の速度感」が追いついてきた過程だと思います。その意味で、例えばCVSからGITへとオープンソフト開発のモデルが進化したことを好ましく思います。
また、いわゆるフリーソフトであることを保証するライセンスとは、利用、配付、改変に関する「コミュニケーションのコスト」を不要にするシステムと捉えています。
オープンソースソフトウェアでビジネスを行っていただくことは有意義だと私は考えています。既存の市場の構造にとらわれない枠組みを実現することは、新しいビジネスモデルの創出につながると期待できるからです。
例えば Galatea Toolkit は経済産業省の外郭団体であるIPAから支援を受けており、これは「いずれ経済活動に貢献せよ」という趣旨の支援であったと私は考えています。実際「IPAライセンス版」のツールキットは成果がどのように製品化されているか完全には把握できていませんが、「どこどこのなになには GalateaTalk の合成音声らしい」という話はときどき研究者同士で語られています。
一方で、プロジェクトの目標が野心的であればあるほど、研究開発には時間がかかります。Galatea Toolkit が本来の目標を達成するためには、技術や世の中の動向を正しく把握しながら、「売り物になる技術」に向かって進化させていく必要があります。企業に取り組んでいただくにはリスクがあります。研究者が本務の合間に取り組む活動としても限界があります。
この6年間はコンソーシアムという形で活動をさせていただきました。会員の方から多くの御意見を伺うことができ、有意義ではありました。しかし、一方で、コンソーシアムの外部の方から具体的な御要望や依頼をうけたときに、個別に対応させていたくための組織としては若干不適切のようにも感じました。
例えば、コンソーシアムが開発に関わり、会員向けに配付しているソフトウェアがあるとします。そしてこの技術をベースにある企業が独自に仕様を作って製品を開発したいとします。ベース技術の提供を受けるために会費を払っていただいてコンソーシアムの会員になっていただいたあとで、さらに「カスタマイズについて相談したい」という場合には「ベース技術に詳しい研究者・研究機関と個別に相談」ということになります。そのようなサービスを提供するにあたっては、守秘義務契約なども必要です。新たに技術者を探して作業を依頼する場合もあるでしょう。
音声認識がキャズムを超えるには、というテーマのイベントに参加しました。
パネル討論で私は「オープンソースとアクセシビリティについて」質問しましたが、積極的な発言はありませんでした。 その後、ビジネスモデルを成立させるためにいかにコストを下げるか、ベンダーが相互に設計やリソースを共有するか、ソリューションの提案をいかに促すか、といった議論になったのですが、「キャズムを超えるには」と議論していた今回の方々は「アーリーアダプター向けのビジネスの既得権を守りたい」という立場だと感じました。
以下のような発言をいただけたことは評価に値すると思います。
インターネット技術において、例えば、クラウド化するサービスが多様なソリューションの提案につながっていること、そういったサービスがオープンソース技術を戦略的に利用していることは、広く認知されつつあります。 現在は「無料であること」にバリューを感じておられるアクセシビリティ分野において、特にオープンソース音声技術の問い合わせを私自身はたくさんいただいております。 しかし、音声認識に無関心であったソフトウェア技術者の皆様に、手軽に試していただける音声技術を広めて行きつつ、技術の現状や限界についても正しく認知していただくことは、結果的に「大きな予算で動いている」既存の音声ソリューションを超えた、新しい可能性をもたらすと考えています。
皆様の御意見をお待ちしております。