Speech synthesis(音声合成) API
はじめに、ChromeBetaを使ってます。リリース時に仕様が大幅に代わることがあります。
Web Speech APIの音声合成機能 ようやく新しいブラウザーでサポートされてきました。 2014年はブラウザーで音声認識・合成が当たり前の年になるでしょう。
対応状況概要
OS | ブラウザー | 英語 | 日本語 |
---|---|---|---|
Windows7 | IE11 | X | X |
Windows7 | Firefox27 | X | X |
Windows7 | Chrome33 | OK | X |
Android4.4 | Chrome33Beta | OK | OK |
iOS | Safari7/Chrome33 | OK | OK |
Mac OS X | Safari7 | OK | OK |
Windows
IE11は論外、FirefoxはAPIは対応しているのですが、ボイスが見つかりませんでした。 Chromeは、片言で英語のみ発音しました。日本語は認識しませんでした。
Windows7は標準で日本語音声入っていなくて、裏技的に、Harukaも入れてみましたが、Chromeからは鳴りませんでした。ただし、Harukaを選択した状態で、体験版のドキュメントメーカー Plus2を入れると、日本語がなりました。
Windows8.1は日本語が入っていると聞いたことがあります。
Chrome33の正式版リリース時に対応していることを願います。
Android
日本語読み上げソフトが最初から入ってるせいかもしれませんが、綺麗に読み上げました。
iOS
iOSはSafari/Chrome共に同じエンジンを使ってます。音声の品質はいまいちでしたが、動きました。
Mac OS
別途、KyokoとOtoyaを入れると、綺麗に日本語を読み上げてくれました。 英語音声も種類が豊富で素晴らしい。
対応状況詳細
- ピッチ・レート - 音声の早さや声の高さを修正するものです。
- SSML - 音声をマークアップ言語で記述し、途中で音声を変更したり、抑揚をつけたりできます。
- バウンダリー - 現在読み上げている単語の位置がわかります。
Windows
実質対応はChromeだけになります。
Google提供の音声は、ピッチやレートに未対応でした。
native
という名前の音声(おそらくMS Ann)はピッチ・レートに対応しさらに、SSMLのタグの中のテキストだけを読めました。(SSMLの文法の対応は検証中)
Android
音声リストには、Google提供の物のみ ピッチやレート対応・バウンダリー未対応
別途、 KDDIのN2 TTS入れてもリストには表示されませんでした。
Mac OS
Google提供の音声は、ピッチやレート・バウンダリー未対応 OS付属の音声は、ピッチやレート(0.5-3.6)対応、バウンダリーにも対応
Mac OS提供の音声が大量にリストされました。(ChromeでもCompact版を除いたものが表示されていました。)