製品化されている音声認識ソフト。現在は株式会社アセンティアから販売されている。
2004年から2005年にかけて radiofly.to/wiki に西本が執筆した記事を転載します。
*DragonSpeech ** 2005-10-12 : 最新情報 2005年秋に「ドラゴンスピーチ2005」が発売されました。 アスキーソリューションから スキャンソフトに販売元が変わっています。 廉価版の「パートナー」はソースネクストからも発売(価格5,970円でマイク同梱)。 いずれ最新版を試してみますね。。 **「買い」かどうか? 西本の私見ですが、ドラゴンスピーチ7セレクトを使ってみての意見です: - インタビューの文字起こしに使えるか? -- 録音した会話を直接認識するのは、現在の市販ソフトでは無理です。 -- ただしインタビューの音声を聞いて、 PCに向かって 自分の声で喋り直す(リスピーク)というやり方をするなら、 かなりうまく認識できると思います。 その場合は、Dragonエディタを使用するので、 一番安い「パートナー」版でも十分でしょう。 -- 音声認識を意識しないしゃべり方をすると (自分で喋った声でも) 認識性能はあまりよくなかった。 かなり訓練しないと(人間側もドラゴン側も)、 ICレコーダーの文字起こしはつらいでしょうね。 後で誤認識を修正する手間を考えると。。 - むかし IBM ViaVoice を使ったけど満足できなかった? -- Dragonエディタの操作性など、ViaVoice よりも改良されているので、 音声認識に興味があるなら再度チャレンジしてみる価値はあると思います。 - 音声入力が苦手な場面は? -- 考えながら書くような場合は流暢にしゃべれないので認識されにくい。 アルファベットや記号や数字が多い場合にも、 音声だと誤認識の修正などが煩雑。 そういう場合には、やっぱりキーボードの方が向いている。 -- 根本的には、いま作られているPCのソフトは、 そもそもキーボード入力を前提にしたものなのです。 最初から「音声で入力する」ということを前提にした ソフトではないから、どうしても無理があります。 -- 音声入力は「特別な手段」と割り切ったうえで、 それでも効率的に使えるという場面を創意工夫して見つけてください。 - マイクの選び方 -- ヘッドセットが便利だし、周囲の雑音に影響されにくい。 据え置きや手持ちのマイクだと、口とマイクの距離が一定にならない。 -- ドラゴンの付属品は「ノイズ対策機能付きマイク」で、 ヘッドセットだけ使いたいときにも重宝する。 最近よく売られているインターネット電話用のヘッドセットでも、 ドラゴンで使用可能と思われる。 オーディオテクニカの据え置きマイクでもうまく認識する。 -- ヘッドセットとPCとの相性問題はあるが、 Skypeの流行のおかげで(?) 昔ほどハマることはなくなってきた気がする。 ** アスキーソリューションの「ドラゴンスピーチ7」情報: - [[バージョンアップ情報:http://www.asciisolutions.com/news/index.html]] - [[議事録作成サポート:http://www.dragonspeech.jp/gijiroku/index.html]] -- かなり高価なサービスなので個人では導入できそうにない。 - [[津々見友彦氏の利用事例:http://www.dragonspeech.jp/special.html]] -- ここまで使いこなしておられる方は少ないかも。興味深いです。 ** 2004年12月 : ドラゴンスピーチ7セレクト 「ドラゴンスピーチ7セレクト」というソフトの自腹レビュー。 - ドラゴンスピーチ7 SELECT USB -- http://www.asciisolutions.com/ -- 秋葉原LAOXコンピュータ館にて税込17,640円 -- 付属品:USB オーディオアダプタ(TELEX)、ヘッドセット(メーカー不明、スイッチなし) - 実験環境:Panasonic CF-T1 (512MB RAM) 「ICレコーダー、PDAからの文字化」について: - すでに録音された音声ファイルを取り込んで文字化する機能です。 - ICレコーダーやPDAがなくてもPCで録音したwavファイルを利用できます。 - DedioFly の自動音声認識で使用しました -「パートナー」版にはこの機能がないので「セレクト」版以上が必要です。 * Dragonエディタで音声入力した文章 ** 2004-12-04 (実際に音声で入力してみた文章。Dragonエディタを使用。) このソフトについていろいろ考えてみました。 富田倫生の未来というテキストがトレーニングに使われているのは、なかなか面白い。 考えながら文章を書くということがこういうソフトでどのくらい可能なのだろうか? やっぱりちょっとずつ喋っては確認して、何か間違っていたら、取り消しのコマンドを使って、言いなおす。 そういうしゃべり方をしていたら、結構使えるんじゃないかなぁ。と思えてきました。 外は雨が降っています。 さっきからなかなか認識精度が良いです。 端李さんは、こういうソフトを真面目に使ったことがありますか。 僕は、時々あります。 インターフェイスの研究をしている人は、音声の研究者をこう非難します。 あなた達は、自分が研究しているシステムを自分たちで使ってないじゃないか。 その批判はごもっともですね。 ** 2004-12-05 (実際に音声で入力してみた文章。Dragonエディタを使用。) こんにちは。西本です。 昨夜すごい雨でしたね。すっかり寒くなったけど、元気ですか。 ドラゴンスピーチを真面目に使ったら、どんな感じだろうと思って、 試しているところです。 今使ってるのは、ドラゴンについているヘッドセットではなくて、 自分が持っている据え置き型のマイクです。 トレーニングは、100%までやっていません。大体半分ぐらいまでやって、学習に回します。 それでこのぐらいの認識精度が出るのなら、大したものではないかと思います。 ちょっと意地悪をしてみましょうか。ラジオをつけてみます。 今後で音楽が流れています。オーケストラと、ピアノの音が聞こえます。特に、スイッチを使わなくても、上手く認識しているようです。 音楽を聴きながらこうやって、文章を入力できるんだったら、いいかなって思うんだけど。 ちなみに後でラジオが喋ってるときには、さすがにヘッドセットでないと厳しいです。 ここからはヘッドセットに切り替えました。 次の行に移るときのコマンドは、マニュアルには、行を改めるという意味の漢字2文字のコマンドがありますが、 いまそのコマンドを喋ると、必ずそうなってしまうので、あえて言葉にはしませんが、 その言葉を使うときには、「ここで何とか」と言わなくても、ただ「何とか」と言うだけで、次の行に移動することができます。 便利なのは、マイクを一時的にポーズにする音声コマンドです。これは、前後に短い間を取って、「マイク」と言います。 ポーズの間は、「マイク」以外の言葉を無視してくれます。 昔いろんな人に、IBMのViaVoiceを使ってもらったことがあります。 なかなかうまく認識できなかった記憶があります。 それに比べると、このドラゴンは、よくできてるなあと思いました。 今「マイク」のコマンドを使って、ポーズの間に咳を一つしました。 とにかくよく使うのは、「取り消し」というコマンドです。 今このコマンドを喋るときには前後にかぎかっこをつけて喋ると上手く喋れます。 いまこの部屋は結構静かです。 上の文章を入力するときに、漢字の今をひらがなの「いま」に書き換えました。 こういう操作も、声だけでできます。「選択何とか」と言って、「何番を選択」と言えば、他の候補を選ぶことができます。 「修正何とか」というコマンドは、いきなり修正になってくれます。 この文章は最初から、ずっとマイクだけで入力しています。 訂正の操作もすべて音声だけでやっています。 音声コマンドは、すぐには覚えられないので、手元に開いたマニュアルを眺めたり、「クイックリファレンスカード」を見ながら操作しています。