View page as slide show

スクリーンリーダー

西本卓也 NVDA日本語チーム / NVDAユーザ会広島

nishimotz @ gmail.com / Twitter @24motz

  • オープンソースのスクリーンリーダーNVDAとアクセシビリティ入門(2012-03-24 第45回 WEB TOUCH MEETING in Hiroshima
  • オープンソースのスクリーンリーダーNVDAとその日本語化(2011-11-18 日本音響学会東海支部 技術講習会 視覚・聴覚障害のための支援技術の現状と展望)

世界の動向

  • NVDA の紹介
    • 日本音響学会誌 Vol.66 No.8 2010 pp.427 Q&Aコーナー「視覚に障害があるパソコンユーザが無料で使えるスクリーンリーダ(画面読み上げソフト)はありますか?」
  • 解説記事「インターネットと音声合成」
    • 西本・西田: 電子情報通信学会誌 Vol.91, No.12, pp.1030-1035, Dec 2008.

NVDAの躍進(WebAIM の調査)

NVDAの概要

  • NonVisual Desktop Access
  • Microsoft Windows 対応スクリーンリーダー
    • XP, Vista, 7, 8 - 32bit/64bit
  • 無償で配布、オープンソース(GPL v2)
  • 音声と点字ディスプレイによる出力
  • 非営利団体 NV Access Limited(オーストラリア)
  • 40ヶ国語以上に対応(音声エンジン eSpeak)

背景

関連分野

Windows 8

  • デスクトップ
    • 従来のWindowsと互換
    • 日本語音声合成 Haruka Desktop
    • タブレット:マルチタッチ、ソフトキー
  • モダンスタイル
    • キーボード操作と読み上げ考慮
    • アクセシビリティAPIの発展
    • 厳しいセキュリティモデル
    • RT版はナレーターのみ

関連分野(2)

    • PDF の限界。メタ情報の欠落。リフロー不可。
    • 音声コンテンツからマルチメディアコンテンツへ。テキスト音声合成が重要。
    • 電子書籍の標準 EPUB は実質的に HTML コンテンツ。DAISY 技術を統合。
    • 文書の構造に基づくナビゲーション、TTSへの読み情報の付与
  • スクリーンリーダーの指導と普及
    • 音声とキーボードだけの操作。Windows のショートカットキーは晴眼者も知識不足。
    • タイピング習得の壁。練習ソフトが有効 ウチコミくん など

日本の音声合成エンジン

日本のスクリーンリーダーで使われてきた製品:

  • 音声合成装置 富士通 FMVS-101 : MS-DOS 時代のベストセラー。通称 VSU
  • リコー 音声合成ライブラリ : 95Reader など。軽いという評価。関連:AquesTalk (アクエスト社)

日本の音声合成エンジン(2)

    • クリエートシステム開発 最近は Android 版も
    • コーパスベースの商用日本語TTS。テレビ番組のナレーションにも。
    • 現在はHOYAサービス株式会社が販売
  • Microsoft の音声エンジン
    • Microsoft Agent と互換性のある SAPI4 エンジン L&H TruVoice TTS3000 が配布されていた。
    • 現在は SAPI 5 対応の Microsoft Speech Platform エンジンを無償で配布。独自開発。

音声合成への要求

  • 効率:早口化 3倍速以上への要求。記憶(トップダウン知識)で補完?
  • 疲れない:リアルすぎないほうが疲れにくいという意見も。
  • 応答性:キーエコー(出力開始までの遅延)音切れ(中断操作時の遅延)
  • 音質:肉声に近い。ただし好みは多種多様。
  • 自然性:プロソディ、ポーズ
  • 正確性:テキスト解析・読み付与の精度:メタ情報やコンテクスト情報が使えないことが多い。
  • 音声フォント:内容によって話者を切り替える

日本語の点字

  • 点字ディスプレイ
  • 六点入力:ホームポジションのFDS・JKLを使って点字キーボード方式の入力
  • 日本語の点字:かな文字体系、文節分かち書き
  • 外国語引用符、情報処理用点字

日本のスクリーンリーダーの誕生

1983年ごろ VDM100 など

  • 株式会社アクセス・テクノロジー。斎藤正夫氏。
  • NEC PC-6001mk2 に音声合成が搭載されたことがきっかけという話
  • PC-8801 + VSS-100 (1984 年 三洋電機が発売した外付け音声合成装置)から PC-9801 へ
  • 「詳細読み」「音切れ」などの概念

日本のスクリーンリーダーの誕生(2)

1984年(昭和59年)1月

日本初の音声ワープロ「AOKワープロ」開発

  • 会社案内 (株式会社 高知システム開発)
  • 点字入力・音声出力
  • 長谷川貞夫氏は対面朗読で計算機による日本語処理を独学。現在もAndroidアプリで文字入力など。

日本のMS-DOS対応スクリーンリーダー

1992年 画面読みプログラム「グラスルーツ」

  • MS-DOS NEC-PC9801 対応
  • 開発者:石川准氏
  • 発売元:株式会社アメディア

日本語入力の音声インタフェース

フォネティック読み:

  • ひらがな・けしき の け
  • ひらがな・るすばん の る

文字の種類が多いことへの対応:詳細読み

  • やくそく の やく → 約

日本語入力の音声インタフェース(2)

「たすける」変換、候補「助ける」(nvdajpでの実装):

  • フォネティックなし「たすけるのじょ・ひらがな・ける」
  • フォネティックあり「たすけるのじょ・ひらがな・けしきのけ・るすばんのる」

関連研究:

統合ソフトウェア

アクセシビリティのAPIや規格が未整備の時代に普及:

MS-DOS 用音声点字ブラウザ&エディタ ALTAIR(アルティア)

  • (財)日本障害者リハビリテーション協会が開発したフリーウェア
  • MS-DOS用 インターネットメールソフトWMAIL(Wメール)も同サイトで公開

ALTAIR for Windows

  • 公益財団法人 日本障害者リハビリテーション協会 から無償で提供されている「統合ソフトウェア」

統合ソフトウェア(2)

Bilingual Emacspeak Project

音声インタフェース

アクセシビリティAPI

  • MSAA, Java Access Bridge, IAccessible2, UI Automation など
  • オブジェクトの階層モデル (NVDAの資料より)
    • 名前:コントロールのラベル
    • ロール:ボタン、ダイアログ、編集可能テキスト、ウィンドウ、チェックボックス、など
    • 状態:フォーカス可能、フォーカス済み、選択済み、選択可能、展開済み、折りたたみ済み、チェック済み、など
    • 値:スクロールバーのパーセント値、コンボボックスの選択状態、など
    • 親オブジェクト、子オブジェクト、前オブジェクト、次オブジェクトへのリンク

アクセシビリティAPIの問題

NVDA開発者の言葉より

  • 良質な設計の安全なAPIが使える場合もあれば、危険なハックをしたり、情報不足に悩むこともある。例えば・・・
  • 他のプロセスにコードをねじ込んでAPI呼び出しを覗き見して、画面に書かれた文字を判別する。高速に情報を取り出すために、プロセス間通信を避ける。
  • 多種多様なアクセシビリティAPI、プラットフォームAPI、ツールキットに対応して、幅広いアプリケーションをアクセシブルにしなくてはならない。
  • アプリケーションの実装の不備を補うこともある。規格に関する知識不足、規格そのものの不備、テストの不足など。

日本のWindows対応スクリーンリーダー

95Readerシリーズ

日本のWindows対応SR(2)

PC-Talkerシリーズ

  • (株)高知システム開発
  • 視覚障害者向けパソコン講座、視覚障害者への指導者養成講座の事実上の標準
  • NetReader, MyWord, MyBook, MyMail などの関連アプリケーションも充実
  • (株)アクセステクノロジー VDM100W シリーズは PC-Talker を VDM100 ユーザ向けにカスタマイズした製品という話。

日本のWindows対応SR(3)

JAWS for Windows

  • 業務で使えるSRの世界標準。強力なスクリプティング機能
  • 日本語版は過去にIBMが販売
  • 現在は有限会社エクストラが販売。石川准氏作の自動点訳エンジンを搭載した自動点訳、点訳支援ソフトEXTRA for Windowsの開発・販売元。

xpNavo

  • 株式会社ナレッジクリエーションの製品。VoiceText 搭載。View‐Net神奈川で「らくらくホン」の改良に取り組んだ新城直氏。

日本のWindows対応SR(4)

FocusTalk

  • SkyFish 社の製品。Windows Vista にいち早く対応。
  • 95Reader と操作が同じという話。

Windows ナレーター

  • Windows が標準装備している基本的なスクリーンリーダー
  • アクセシビリティ関係者向けに日本語音声エンジンの無償配布も。

Windows 以外の環境

  • NTTドコモ「らくらくホン」シリーズは詳細読みまで実装。
  • Android Talkback : N2 TTS とあわせて無料で
  • Linux : GNOME ORCA 日本語環境はほとんど整備されていない
    • Ubuntu 12.04 に Open JTalk が入るという話
  • Mac OS X / iOS : VoiceOver 日本語入力には未対応
    • 日本語音声合成は Lion から。iOS の iBooks は日本語読み上げ

NVDAの登場

開発者の言葉 より

  • Leaders: Michael Curran, James Teh
  • 視覚障害の当事者として、晴眼者と同じコストでコンピューターを利用したい。政府や福祉団体だけが責任を負うべきでない。
  • オープンソースのSRを作れば協力を得られる?
  • Linux にはすでに存在(GNOME ORCA)
  • 不可能ではないだろうと思った
  • 最初のリリース 2006年4月28日
  • Python と C++ で実装

NVDAの成功

  • 2007年1月(開発開始から8か月)
    • Mozillaから支援:Firefoxウェブブラウザ対応
    • CSUN国際会議への参加
  • 世界中から多くの人が開発に参加
  • 小さな活動から実用的なSRへ
    • フリーなソリューションの実現
    • アクセシビリティの世界でリスペクトを得る

NVDAの価値

  • スクリーンリーダーのコストは許容できない
  • 視覚障害者の非雇用率は多くの国で60%以上
  • ソフトウェアやWebサイトの開発者に
    • アクセシビリティのテストが広まることも重要
  • スピーチビュアーは開発者に便利な機能

NVDAの普及

  • 家庭で無料で使えるSRとして
  • IT分野でJAWSの代替として
  • ニュージーランドの公共図書館のコンピュータ
  • Yahoo! アクセシビリティのテストやデモ

NVDA日本語版のWebサイト

sourceforge.jp/projects/nvdajp

NVDA日本語化プロジェクトのWebサイト

NVDAの日本語化

ITRC UAI(Universal Access to the Internet・高齢者と障害者のインターネット利用)研究会

NVDAの日本語化(2)

2008年

  • 4月26日 日本語化プロジェクトの(最初の?)ミーティング記録
  • 12月 NVDA R2540日本語版公開 ミツエーリンクス アクセシビリティBlog
    • 日本語への翻訳、無変換キーを使う独自の改良など
    • 特別企画「オープンソースソフトウェアとWebアクセシビリティ」を開催

NVDAの日本語化(3)

2009年

  • 3月 sourceforge.jp プロジェクト登録
  • 定期的にミーティングを開催
  • 12月 定例ミーティング。日本語音声エンジンも日本語IMEの読み上げ対応も進展せず。広島から新家氏が参加。Python コミュニティの有名人が参加。
  • 12月 Open JTalk がリリースされる。

NVDAの日本語化(4)

2010年

  • 1月 NVDAのソースコードレビューを始める。
  • 2月 PythonからMSAAでIMEの情報が取り出せるようになる。IME対応を新家氏が引継ぐ。
  • 8月 Open JTalk を NVDA の音声エンジンとして組み込む
  • 9月 音声エンジンと日本語入力の詳細読みに対応した最初のリリース jpdev100909 を公開
  • 9月 オープンソースカンファレンス2010 fall に出展

NVDAの日本語化(5)

2011年

  • 2月 NVDA 2010.2 ユーザガイド点訳版を公開
  • 2月 Twitter @nvdajp の利用を開始
  • 4月 2011.1.1j で実験的な日本語点字ディスプレイ対応を実装
  • 6月 NVDAユーザ会広島 活動開始
  • 12月 2011.3j
    • JTalk の「声の高さ・抑揚の調節」を実装

NVDA日本語チーム

2012年

  • 4月 2012.1j 日本語IMEサポートの改善
    • NVDA翻訳チームの日本語を西本が担当
    • NVDA日本語チーム発足
  • 6月 2012.2.1jp
  • 9月
  • 11月
    • 本家: Windows 8 対応・東アジア言語対応を含む 2012.3
    • WBU(世界盲人連合)総会で各国の当事者団体がNVDAへの資金援助を表明
  • 12月
    • 日本語チーム 2012.3.1jp
    • 点訳エンジンの改良に着手

NVDA日本語チーム(2)

2013年

  • 2月
    • 文字入力サポートの本家版実装への移行
  • 4月
    • ソースコード管理を bzr から git に移行
    • 本家: PowerPoint対応 2013.1 リリース候補1
    • 日本語チーム: 2013.1jp ベータ2

nvda.jp

日本語点字ディスプレイ対応

NVDA日本語版のダウンロード件数

NVDA日本語版のダウンロード件数(1ヶ月ごと)

NVDA日本語版サイトのページビュー

NVDA日本語版サイトのページビュー(1ヶ月ごと)

使ってみる

  • NVDA(インストーラー版)起動 CTRL-ALT-N
  • NVDAキー:無変換キー, Insert キー, CapsLock キー
  • ヘルプ NVDA-N - ヘルプ(H) - ユーザーガイド(U)
  • キーボードヘルプモードのON/OFF: NVDA-1
  • NVDAの終了 NVDA-Q
  • 読み上げモード NVDA-S

Firefox で Web を読む

  • コンテンツを開くと読み上げが開始される
  • 停止 CTRL または SHIFT
  • 再開 NVDA-下矢印
  • 一文字づつ読む 左矢印 右矢印
  • 一行ずつ読む 下矢印 上矢印
  • メニュー操作 ALT / タブ切替 CTRL-TAB, CTRL-数字

NVDAの基本操作

  • 読み上げモード切替 NVDA-S
  • 1文字パススルー NVDA-F2
  • 日付と時刻 NVDA-F12
  • クリップボード NVDA-C
  • 現在のフォーカス NVDA-TAB
  • タイトル NVDA-T
  • アクティブウィンドウ NVDA-B

Firefox で Web を読む(2)

  • 見出しジャンプ H
    • 次の見出し要素 数字 1 2 3 ..
    • 前の見出し要素 Shift+数字
  • リンクの移動 Tab キー または K (未読U/既読V)
  • リスト L
  • リスト項目 I
  • ランドマーク D : ページ構成要素を意味的に区切るもの
  • ブラウズモードの要素リスト:NVDA-F7

Web のテーブルを読む

  • テーブル T
    • テーブルの中では 上矢印 下矢印 で要素を(左から右へ、上から下へ)1つずつ移動
  • テーブル内の移動:CTRL-ALT-上矢印または下矢印
    • テーブルのセルの配置に従って上下左右に移動。端まで移動したらそれ以上進まない。

Web のフォームを操作する

  • フォームに移動 F
  • エディットボックスへの移動 E
    • フォーカスモードに入る: NVDA-スペース。ガチャっという効果音。
    • Esc でブラウズモードに戻る
  • コンボボックス C
  • チェックボックス X : 要素の一つ一つに順に移動
  • ラジオボタン R : スペースでチェック
  • ボタン B

NVDA日本語版操作ガイド

課題

  • Windows 8: タッチ操作、ストアアプリ対応
  • NV Access への貢献 Donate
  • 日本ユーザー会の検討
    • イベントの企画、出展
    • 点字ディスプレイ対応の改良 テキスト解析、日本固有のデバイス
    • 日本語音声エンジンの改良 JTalk 辞書
    • ユーザー・指導者を増やす、雇用支援

screen_reader.txt · 最終更新: 2013/08/16 22:15 by Takuya Nishimoto
www.chimeric.de Valid CSS Driven by DokuWiki do yourself a favour and use a real browser - get firefox!! Recent changes RSS feed Valid XHTML 1.0