ユーザ用ツール

サイト用ツール


polly

Amazon Polly

since 2018-07-31

2021-12-11 ssml からページを独立

クラウドサービスによる(日本語対応の)音声合成。

Polly で使える SSML タグ

レキシコン(辞書カスタマイズ)も W3C Pronunciation Lexicon Specification (PLS) バージョン 1.0 準拠とのこと。

Takumi ニューラル音声が登場 (2021年12月)

エイリアス

以下、AWS Polly のコンソールで確認。

日本語のテキストに PLS でユーザ辞書を適用して読み上げられる

ja.pls

<?xml version="1.0" encoding="UTF-8"?>
<lexicon version="1.0" 
      xmlns="http://www.w3.org/2005/01/pronunciation-lexicon"
      xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" 
      xsi:schemaLocation="http://www.w3.org/2005/01/pronunciation-lexicon 
        http://www.w3.org/TR/2007/CR-pronunciation-lexicon-20071212/pls.xsd"
      alphabet="ipa" 
      xml:lang="ja-JP">
  <lexeme>
    <grapheme>( ^)o(^ )</grapheme>
    <alias>顔文字</alias>
  </lexeme>
</lexicon>

プレーンテキスト

こんにちは ( ^)o(^ )

日本語で実行すると「こんにちは、かおもじ」と読み上げる。

alphabet に ipa と指定していても、alias 要素には関係ないようだ。

発音の指定

since 2018-07-31

日本語でも ipa や x-sampa で発音を指定できそうだが、あまり正しく再現されないようだ

SSML(PLSは使用せず phoneme タグで指定)

<speak><phoneme alphabet="ipa" ph='käkikɯkeko'>( ^)o(^ )</phoneme></speak>

日本語で実行すると「コーキクーケーコ」と読み上げているように聞こえる。

カナ文字で読みを指定できなさそう。 x-jeida は実装されていないようだ。

使用できる音素のリスト

PLS ファイルの記述例(英語の例)

aiopolly

since 2019-11-20

SSML を python でラップするとこんな感じになるのか

https://github.com/MrMrRobat/aiopolly

polly.txt · 最終更新: 2021/12/11 12:15 by Takuya Nishimoto

Donate Powered by PHP Valid HTML5 Valid CSS Driven by DokuWiki