Chromeブラウザー向けウェブアプリ Androidでも動きます

akjava 音声単語レッスン SimpleResize フォルマント表示 GridPaint
音声認識で英語学習 手軽に画像をリサイズ 音声を画像に変換、母音分析の助けになる 手画像をグリッド単位で簡易修正
このエントリーをはてなブックマークに追加

スペクトラム画像から、具体的なフォルマント(下から1つめのピーク F1と2つめのF2)の見つけ方を説明します。

以下の3つを気をつければ、後は慣れで誰でも簡単に見つけることができます。

一定値以下は無視する。

具体的には、200hz以下は無視します。 ここは、F0と呼ばれる、ほぼすべての有声音で強くなる所です。

ただし稀に英語のiuの発音のF1の平均は240hz前後なので、200を下回る、あるいは画像の表示上の制限で、200辺りが強くなることがあります。 他の音と比べて、強い場合は、F1を200ぐらいになることもあります。

book(bˈʊk)のスペクトラム画像 - 発音が下手なせいで、kの所が有声音になってますが

最初のbの下の方と、最後のkはの下の方は無視します。

予想する

基本的に、F1は500hz前後、F2は1500hz前後にあります。

ただɔの音とか、F1とF2の間が狭い音があります。この場合、画像が小さかったりすると混ざって表示されることもあります。あるいはouとか母音が2つ変化してたりして自動判定が付きにくいです。

事前に音が予想できる場合(聞けばなんとなくわかる)は、狭い範囲にF1とF2が混在しているとして、見つけましょう。

英語の平均母音とか出ていますので、それを参考にします。

boat(bˈoʊt)スペクトラム画像 - ouが曲がっているのは母音が2種類あるからです。

予想がついていれば、どちからに合わせることができます。

下から数える

通常は、下の方が強く表示されるので気にする必要ないのですが、マイクから距離があったり音量が小さい場合、同じような強さのピークが複数ヶ所合ってわかりにくい場合があります。

その場合、下から順番にF1・F2とします。ただし、予想と大きくずれる場合は、予想を優先します。 あと、最初の一定値以下は無視も忘れないようにします。

r系の音のスペクトラム画像 - 真ん中や上の方にも線でていますが、これはF3・F4あたりなので、無視します。

関連

英語発音記号別フォルマントの値

和45式で英語の母音発音向上

akjavaフォルマント表示を使って9つの母音マップ画像を作成する