No renderer 's5' found for mode 's5'
~~SLIDESHOW~~
NVDA日本語拡張
前史
1980年代: 日本でスクリーンリーダー開発が始まる。文字の詳細説明
1988: 点字情報ネットワーク(てんやく広場)日本IBM
1996: Windows対応日本語スクリーンリーダー 95Reader
1997: IBM ホームページリーダー テキストを男性の声・リンクを女性の声
1998: PC-Talker発売。日本のベストセラーに
1999: 95Readerで日本語の点字対応
2001: 日本語版 JAWS for Windows 日本IBM
2006: 携帯電話が入力メソッドの読み上げに対応
NVDA日本語化のあゆみ
2006: NVDA リリース
2008: ITRC-UAI 高齢者・障害者のインターネット利用分科会によるNVDA日本語版の議論 (渡辺隆行先生、ミツエーリンクスさん)
2010: 音声エンジン、入力メソッド、文字説明 (西本卓也、新家昌高)
2011: 点字ディスプレイ対応、64ビット対応、ユーザ会広島
2012: NVDA日本語チーム
Python と nvdajp
PyCon mini JP, PyCon JP 2011
Bazaar バージョン管理システム, lunchpad.net, sourceforge.jp
ctypes 音声合成エンジン、テキスト解析、点字ディスプレイドライバー
Python で NVDA およびアドオン(機能拡張)
Plone で workshop.nvda.jp を構築
NLTK で自然言語処理?
国際化
日本語対応
依存するモジュール (日本語に対応していない)
入力メソッド
文字説明の機能
コミュニティ (2012)
日本語チーム: 非営利の開発者グループ
メーリングリスト 24 人
毎週音声会議 (Skype)
Japanese Users
NVDAを教えられる人を増やす
NVDAJPフレンズ
支援ボランティアのための教材開発
台湾・日本ジョイント
活動
日本のユーザーのための開発
海外の日本語ユーザーのための開発
NVDAの国際的なコミュニティ
日本語対応
入力メソッド
状態遷移モデル
中国語の入力例
日本語の入力例
初期状態
未変換(読み)文字列の編集 (on the spot), 変換キーが押されるまで
変換候補の1番目 (on the spot), 変換キーが押された直後
候補の選択 (候補選択ウィンドウ), 変換キーがさらに押されたとき
半角と全角
過去は1バイト文字と2バイト文字
Unicode: 文字の幅とバイト数は対応しない
入力メソッド
文字 1
ラテン文字(アルファベット)
数字
表音文字(かな)
文字 2
表意文字
記号、句読点
日本工業規格で全角記号が約 600 種類
記号によっては半角と全角の両方の文字
表記システム 1
文は表音文字と表意文字を両方含む
単語は空白で区切らない
表意文字の発音は前後関係によって変わる
表記システム 2
点字
一般的な6点点字
日本語の表音文字の体系がある
単語を空白で区切る規則が曖昧性を減らす
「はいりそーです」「はい□りそーです」
表音文字による点字:6点漢点字と8点漢点字
音声合成
形態素解析が多用される
読み「りそう」発音「りそー」
文字説明 1
中国語:複数の説明や用例
日本語:説明や用例は普通1種類
用法
入力メソッドの変換候補
文字のレビュー
文字の入力や編集(高頻度で文字説明を使う)
文字説明 2
文字説明
スペル読み(辞書が必要)
表意文字:文字の違いを区別する
フォネティック読み:音声を聞き取りやすくする
ラテン文字(アルファベット) A アルファー
日本語 あさひのあ
文字属性
英語でも「大文字の通知」
半角と全角 (ラテン、カタカナ、数字、記号)
表音文字の区別(カタカナとひらがな)
表音文字の入力
キーボード 1
半角全角キー
無変換キー
入力(翻字)モードの切り替え
表音文字のままで確定(ひらがな)
外来語用の表音文字に変換(カタカナ)
変換キー
かたかな・ひらがな・ローマ字キー
キーボード 2
好みの違い
かな入力の前にモードを切り替える
かな入力してから変換操作で文字を使い分ける
日本語音声
アプリケーション
入力システム(サードパーティ)
PC-Talker シリーズのソフトウェア
OpwBE などの点訳者向けソフトウェア
秀丸エディタ、日本限定のメールソフト
点字対応
点訳エンジン
実験的な実装
改良版を実装中
liblouis 拡張として統合すべき?
点訳エンジン
(1) 前処理
(2) 形態素解析 (日本語)
(3) 形態素単位の処理 (日本語)
単語区切り、長音記号
ラテン文字、数字、日本語記号
数字を点字表記に変換
(4) マスあけ (日本語)
(5) 後処理 ドットパターン作成
日本語、英語、情報処理点字の変換結果の統合
外字符、大文字符、数符、記号
展望
操作の言語と文書の言語を独立させる
音声出力はすでに言語切り替えできる
母国語に関わらず多言語が入力できる環境
日本語チームの開発体制
リリースに電子署名が必要
独自に開発するべき課題はどこまで?