View page as slide show

オープンソースのスクリーンリーダーNVDAとその日本語化

2011-11-18 日本音響学会東海支部 技術講習会 視覚・聴覚障害のための支援技術の現状と展望

西本卓也 オラビー・ジャパン (olarbee.com)

nishimotz @ olarbee.com / Twitter @24motz

世界の動向

  • NVDA の紹介
    • 日本音響学会誌 Vol.66 No.8 2010 pp.427 Q&Aコーナー「視覚に障害があるパソコンユーザが無料で使えるスクリーンリーダ(画面読み上げソフト)はありますか?」
  • 解説記事「インターネットと音声合成」
    • 西本・西田: 電子情報通信学会誌 Vol.91, No.12, pp.1030-1035, Dec 2008.

NVDAの躍進(WebAIM の調査)

    • 回答者の約95%が視覚障害
    • NVDAの利用者は8%
    • 49%が「2つ以上のスクリーンリーダーを使用」
    • 2.9%が主要なスクリーンリーダーとしてNVDAを回答
    • 25.6%がよく使うスクリーンリーダーとしてNVDAを回答
    • 8.6%が主要なスクリーンリーダーとしてNVDAを回答
    • 34.8%がよく使うスクリーンリーダーとしてNVDAを回答

NVDAの概要

  • NonVisual Desktop Access
  • Microsoft Windows 対応スクリーンリーダー
    • XP, Vista, 7 - 32bit/64bit
  • 無償で配布、オープンソース(GPL v2)
  • 音声と点字ディスプレイによる出力
  • 非営利団体 NV Access Inc.(オーストラリア)
  • インストール版とポータブル版
  • 20ヶ国語以上に対応(音声エンジン eSpeak)

nvda-project.org Webサイト

nvda-project.org Webサイト

背景

関連分野

    • Webアプリケーションの普及
    • 動的なWebサイトの増加
    • 内部的に WebKit などのレンダリングレンジンを使用しているアプリケーションの増加
    • 埋め込みオブジェクト Adobe Flash などのアクセシビリティ
    • リッチ・インターネット・アプリケーションは WAI-ARIA で対応
    • Windows 8 の Metro UI では JavaScript でアクセシブルなUIが実装できる

関連分野(2)

    • PDF の限界。メタ情報の欠落。リフロー不可。
    • 音声コンテンツからマルチメディアコンテンツへ。テキスト音声合成が重要。
    • 電子書籍の標準 EPUB は実質的に HTML コンテンツ。DAISY 技術を統合。
    • 文書の構造に基づくナビゲーション
  • スクリーンリーダーの指導と普及
    • 音声とキーボードだけの操作。Windows のショートカットキーは晴眼者も知識不足。
    • タイピング習得の壁。練習ソフトが有効 ウチコミくん など

日本の音声合成エンジン

日本のスクリーンリーダーで使われてきた製品:

  • 音声合成装置 富士通 FMVS-101 : MS-DOS 時代のベストセラー。通称 VSU
  • リコー 音声合成ライブラリ : 95Reader など。軽いという評価。関連:AquesTalk (アクエスト社)

日本の音声合成エンジン(2)

    • クリエートシステム開発
    • コーパスベースの商用日本語TTS。テレビ番組のナレーションにも。
    • 現在はHOYAサービス株式会社が販売
  • Microsoft の音声エンジン
    • Microsoft Agent と互換性のある SAPI4 エンジン L&H TruVoice TTS3000 が配布されていた。
    • 現在は SAPI 5 対応の Microsoft Speech Platform エンジンを無償で配布。独自開発。

音声合成への要求

  • 音質:ただし好みは多種多様。リアルすぎないほうが疲れにくいという意見も。
  • テキスト解析・読み付与の精度:メタ情報やコンテクスト情報が使えないことが多い。
  • キーエコー:出力開始までの遅延が少ない
  • 音切れ:中断操作時の遅延が少ない
  • 話速(早口化):3倍速以上への要求。「トップダウン知識」で補完しているらしい
  • 音声フォント:内容によって話者を切り替える

日本語の点字

  • 点字ディスプレイ
  • 六点入力:ホームポジションのFDS・JKLを使って点字キーボード方式の入力
  • 日本語の点字:かな文字体系、文節分かち書き
  • 外国語引用符、情報処理用点字

日本のスクリーンリーダーの誕生

1983年ごろ VDM100 など

  • 株式会社アクセス・テクノロジー。斎藤正夫氏。
  • NEC PC-6001mk2 に音声合成が搭載されたことがきっかけという話
  • PC-8801 + VSS-100 (1984 年 三洋電機が発売した外付け音声合成装置)から PC-9801 へ
  • 「詳細読み」「音切れ」などの概念

日本のスクリーンリーダーの誕生(2)

1984年(昭和59年)1月

日本初の音声ワープロ「AOKワープロ」開発

  • 会社案内 (株式会社 高知システム開発)
  • 点字入力・音声出力
  • 長谷川貞夫氏は対面朗読で計算機による日本語処理を独学。現在もAndroidアプリで文字入力など。

日本のMS-DOS対応スクリーンリーダー

1992年 画面読みプログラム「グラスルーツ」

  • MS-DOS NEC-PC9801 対応
  • 開発者:石川准氏
  • 発売元:株式会社アメディア

日本語入力の音声インタフェース

フォネティック読み:

  • ひらがな・けしき の け
  • ひらがな・るすばん の る

文字の種類が多いことへの対応:詳細読み

  • やくそく の やく → 約

日本語入力の音声インタフェース(2)

「たすける」を変換、候補「助ける」を選ぶと(nvdajpでの実装):

  • 詳細なし+フォネティックなし「すけ・け・る」
  • 詳細あり+フォネティックなし「たすけるのじょ・け・る」
  • 詳細あり+フォネティックあり「たすけるのじょ・ひらがな・けしきのけ・ひらがな・るすばんのる」

関連研究:

統合ソフトウェア

アクセシビリティのAPIや規格が未整備の時代に普及:

MS-DOS 用音声点字ブラウザ&エディタ ALTAIR(アルティア)

  • (財)日本障害者リハビリテーション協会が開発したフリーウェア
  • MS-DOS用 インターネットメールソフトWMAIL(Wメール)も同サイトで公開

ALTAIR for Windows

  • 公益財団法人 日本障害者リハビリテーション協会 から無償で提供されている「統合ソフトウェア」

統合ソフトウェア(2)

Bilingual Emacspeak Project

アクセシビリティAPI

  • MSAA, Java Access Bridge, IAccessible2, UI Automation など
  • オブジェクトの階層モデル (NVDAの資料より)
    • 名前:コントロールのラベル
    • ロール:ボタン、ダイアログ、編集可能テキスト、ウィンドウ、チェックボックス、など
    • 状態:フォーカス可能、フォーカス済み、選択済み、選択可能、展開済み、折りたたみ済み、チェック済み、など
    • 値:スクロールバーのパーセント値、コンボボックスの選択状態、など
    • 親オブジェクト、子オブジェクト、前オブジェクト、次オブジェクトへのリンク

アクセシビリティAPIの問題

NVDA開発者の言葉より

  • 良質な設計の安全なAPIが使える場合もあれば、危険なハックをしたり、情報不足に悩むこともある。例えば・・・
  • 他のプロセスにコードをねじ込んでAPI呼び出しを覗き見して、画面に書かれた文字を判別する。高速に情報を取り出すために、プロセス間通信を避ける。
  • 多種多様なアクセシビリティAPI、プラットフォームAPI、ツールキットに対応して、幅広いアプリケーションをアクセシブルにしなくてはならない。
  • アプリケーションの実装の不備を補うこともある。規格に関する知識不足、規格そのものの不備、テストの不足など。

日本のWindows対応スクリーンリーダー

95Readerシリーズ

日本のWindows対応SR(2)

PC-Talkerシリーズ

  • (株)高知システム開発
  • 視覚障害者向けパソコン講座、視覚障害者への指導者養成講座の事実上の標準
  • NetReader, MyWord, MyBook, MyMail などの関連アプリケーションも充実
  • (株)アクセステクノロジー VDM100W シリーズは PC-Talker を VDM100 ユーザ向けにカスタマイズした製品という話。

日本のWindows対応SR(3)

JAWS for Windows

  • 業務で使えるSRの世界標準。強力なスクリプティング機能
  • 日本語版は過去にIBMが販売
  • 現在は有限会社エクストラが販売。石川准氏作の自動点訳エンジンを搭載した自動点訳、点訳支援ソフトEXTRA for Windowsの開発・販売元。

xpNavo

  • 株式会社ナレッジクリエーションの製品。VoiceText 搭載。View‐Net神奈川で「らくらくホン」の改良に取り組んだ新城直氏。

日本のWindows対応SR(4)

FocusTalk

  • SkyFish 社の製品。Windows Vista にいち早く対応。
  • 95Reader と操作が同じという話。

Windows ナレーター

  • Windows が標準装備している基本的なスクリーンリーダー
  • アクセシビリティ関係者向けに日本語音声エンジンの無償配布も。

Windows 以外の環境

  • Linux : GNOME ORCA 日本語環境はほとんど整備されていない
  • NTTドコモ「らくらくホン」シリーズは詳細読みまで実装。
  • Mac OS X / iOS : VoiceOver 日本語入力には未対応
  • Android Talkback : N2 TTS とあわせて無料で使える

NVDAの登場

開発者の言葉 より

  • Leaders: Michael Curran, James Teh
  • 視覚障害の当事者として、晴眼者と同じコストでコンピューターを利用したい。政府や福祉団体だけが責任を負うべきでない。
  • オープンソースのSRを作れば協力を得られる?
  • Linux にはすでに存在(GNOME ORCA)
  • 不可能ではないだろうと思った
  • 最初のリリース 2006年4月28日

NVDAの成功

  • 2007年1月(開発開始から8か月)
    • Mozillaから支援:Firefoxウェブブラウザ対応
    • CSUN国際会議への参加
  • 世界中から多くの人が開発に参加
  • 小さな活動から実用的なSRへ
    • フリーなソリューションの実現
    • アクセシビリティの世界でリスペクトを得る

NVDAの価値

  • スクリーンリーダーのコストは許容できない
  • 視覚障害者の非雇用率は多くの国で60%以上
  • ソフトウェアやWebサイトの開発者に
    • アクセシビリティのテストが広まることも重要
  • スピーチビュアーは開発者に便利な機能

NVDAの普及

  • 家庭で無料で使えるSRとして
  • IT分野でJAWSの代替として
  • ニュージーランドの公共図書館のコンピュータ
  • Yahoo! アクセシビリティのテストやデモ

NVDA日本語化プロジェクトのWebサイト

sourceforge.jp/projects/nvdajp

NVDA日本語化プロジェクトのWebサイト

NVDAの日本語化

ITRC UAI(Universal Access to the Internet・高齢者と障害者のインターネット利用)研究会

NVDAの日本語化(2)

2008年

  • 4月26日 日本語化プロジェクトの(最初の?)ミーティング記録
  • 12月 NVDA R2540日本語版公開 ミツエーリンクス アクセシビリティBlog
    • 日本語への翻訳、無変換キーを使う独自の改良など
    • 特別企画「オープンソースソフトウェアとWebアクセシビリティ」を開催

NVDAの日本語化(3)

2009年

  • 3月 sourceforge.jp プロジェクト登録
  • 定期的にミーティングを開催
  • 12月 定例ミーティング。日本語音声エンジンも日本語IMEの読み上げ対応も進展せず。広島から新家氏が参加。Python コミュニティの有名人が参加。
  • 12月 Open JTalk がリリースされる。

NVDAの日本語化(4)

2010年

  • 1月 NVDAのソースコードレビューを始める。
  • 2月 PythonからMSAAでIMEの情報が取り出せるようになる。IME対応を新家氏が引継ぐ。
  • 8月 Open JTalk を NVDA の音声エンジンとして組み込む
  • 9月 音声エンジンと日本語入力の詳細読みに対応した最初のリリース jpdev100909 を公開
  • 9月 オープンソースカンファレンス2010 fall に出展

NVDAの日本語化(5)

2011年

  • 2月 NVDA 2010.2 ユーザガイド点訳版を公開
  • 2月 Twitter @nvdajp の利用を開始
  • 4月 2011.1.1j で実験的な日本語点字ディスプレイ対応を実装

日本語点字ディスプレイ対応

NVDA日本語版のダウンロード件数

NVDA日本語版のダウンロード件数(1ヶ月ごと)

NVDA日本語版サイトのページビュー

NVDA日本語版サイトのページビュー(1ヶ月ごと)

使ってみる

NVDAキー:無変換キーまたは Insert キー

ヘルプ

  • NVDA-N - ヘルプ(H) - ユーザーガイド(U)
  • キーボードヘルプモードのON/OFF: NVDA-1

NVDA の終了

  • NVDA-Q

Firefox で Web を読む

  • コンテンツを開くと読み上げが開始される
  • CTRL または Shift で停止
  • NVDA-下矢印 で再開
  • 一文字づつ読むには 左矢印 右矢印
  • 一行ずつ読むには 下矢印 上矢印

NVDAの基本操作

  • 読み上げモード切替 NVDA-S
  • 1文字パススルー NVDA-F2
  • 日付と時刻 NVDA-F12
  • クリップボード NVDA-C
  • 現在のフォーカス NVDA-Tab
  • タイトル NVDA-T
  • アクティブウィンドウ NVDA-B

Firefox で Web を読む(2)

  • 見出しジャンプ H
    • 数字 1 2 3 4 でそれぞれの見出しレベルの次要素に移動
    • Shift を押しながら操作すると前の要素に戻る(以後、共通)
  • リンクの移動は Tab キー。K でもよい。
  • リスト L
  • リスト項目 I
  • ランドマーク D : ページ構成要素を意味的に区切るもの
  • ブラウズモードの要素リスト:NVDA-F7

Web のテーブルを読む

  • テーブル T
    • テーブルの中では 上矢印 下矢印 で要素を(左から右へ、上から下へ)1つずつ移動
  • テーブル内の移動:CTRL-ALT-上矢印または下矢印
    • テーブルのセルの配置に従って上下左右に移動。端まで移動したらそれ以上進まない。

Web のフォームを操作する

  • フォームに移動 F
  • エディットボックスへの移動 E
    • フォーカスモードに入る: NVDA-スペース。ガチャっという効果音。
    • Esc でブラウズモードに戻る
  • コンボボックス C
  • チェックボックス X : 要素の一つ一つに順に移動
  • ラジオボタン R : スペースでチェック
  • ボタン B

NVDA日本語版操作ガイド

NVDA日本語版操作ガイド

課題

  • 日本語IME対応の改良 日本語キーボード / IMM, TSF / 32bit,64bit
  • 点字ディスプレイ対応の改良 テキスト解析、日本固有のデバイス
  • 日本語音声エンジンの改良 JTalk
  • 日本の視覚障害者向けアプリケーション、既存のスクリーンリーダーとの互換性
  • 普及のための情報提供、講習会など
  • 本家NVDAへの貢献
  • 日本語化プロジェクトの持続可能性

screen_reader.txt · 最終更新: 2012/01/11 14:26 by Takuya Nishimoto
www.chimeric.de Valid CSS Driven by DokuWiki do yourself a favour and use a real browser - get firefox!! Recent changes RSS feed Valid XHTML 1.0