hirax.net::Keywords::「音場」のブログ



1999-12-06[n年前へ]

立体音感を考える 

バーチャルサウンドソフトウェアを作ってみよう



 立体感というものには何故か強く心惹かれるものがある。まして、それが人工的な立体感であるならば、なおさらである。それは、画像・映像であっても、音であっても同じだ。色覚なども同様なのだが、人間の感覚というものを人間自身の技術により再現できたりするのが、実に面白い。

 何より、自分が実感できるというのが良い。結果を自分で感じることができるというのは、素晴らしいと思う。よくソフト技術者などで、「もう少し目に見えるものが作りたい」という人がいるが、それと同じである。

 小・中学校などでも実感できる教材や授業というのがあれば素晴らしいと思う。最近のWEBを眺めていると、そういう先生方のグループも多いようだ。そういう先生は「えらいなぁ」とつくづく思う。今の学校の先生は、そういうことをすればするほど、仕事としては時間単価が下がってしまうのだろう。それでも、そういった先生方は、きっとそういうことは気にしてはいられないのだろう。ホントにエライ。

 さて、立体感を実現するソフトであるが、そういった技術には色々なモノがある。音響の立体感の実現を目指す技術に関しても、古くから数多い技術がある。そういったものを追求しているWEBも多々あり、
 「今日の必ずトクする一言(http://www.tomoya.com/)」の

 などはその最たるものである。ここのWEBマスターなどは聴覚の専門家でもあるので、こういう話題に惹かれるのは当然なのだろう。

 また、そういったものを実現しようとする製品は昔から掃いて捨てるほどある。最近の製品では、

などもそうである。(といっても、今回の話しはずいぶんと長い間塩漬けになっていたので、それほど最近ではなくなってしまったのが残念である。)

 私も出張などで新幹線などに乗っている際には、E-500などでヘッドホンで音楽を聴いていることが多い。そういう時には、先の「山本式スーパーバイノーラルコンペンセーター」などが欲しくなり、音の立体感などについて色々と考えてしまう。必要に迫られているせいか、立体音感については、私もとても興味を惹かれるのである。
 というわけで、「できるかな?」でも立体音響について考えてみたいと思う。といっても、考えるだけでは面白くない。それに「ナントカの考え休むに至り」ともいう。私が考えるだけでは、何にもならないし、しょうがない。色々と実験をして遊んでみたい。
 そのために、まずはいくつかの道具を作ってみることにした。

 今回、作成するのは、山本式バーチャルサウンドシステムソフトウェア(名付けてYVSSS。略称が長いので、以降YVS3と称することにする。)である。先の「今日の必ずトクする一言(http://www.tomoya.com/)」の一連の話しに出てくるそれである。スピーカーマトリックスの程度を小さくしたものである。

 バーチャルサウンドシステムソフトウェアというと仰々しいし、ものすごいソフトウェアに思えるかもしれないが、実はそんな大したモノではない。それどころか、実に簡単なモノである。実際には、Waveファイルを開いて、そのファイルの左チャンネル(L)、右チャンネル(R)に対して、

  • R'= R - 1/3L
  • L'= L - 1/3R
という処理をしてやるだけである。これが、どのような作用を持つか考えるのは、先に挙げた「山本式バーチャルサウンドシステム」のWEBを読めばわかるだろう。もちろん、本「できるかな?」的にも色々考えてみたいわけではあるが、それは次回以降に後回しである。今回は、YVS3を作成し、自分の耳でその効果を実感するだけである。

 ここに、今回作成したソフトを置いておく。いつものことであるが、完成度はアルファ版以下である。


 使い方を示しておく。まず、下が動作画面である。水平方向にスライダーがあるが、チャンネル同士の演算の係数を決めるものである。左端が0%であり、右端が100%である。

WaveMixPro(YVS3)の動作画面

 すなわち、スライダーが左端であれば、

  • R'= R - 0 L = R
  • L'= L- 0 R = L
となる。つまり、オリジナルそのままである。また、スライダーが右端であれば、
  • R'= R - L
  • L'= L- R
となる。差分を出力することになるわけだ。
 Load_Convertボタンを押して、WAVファイルを選択し、変換することができる。その際、オリジナルのファイルは"*.org"という名前で保存される。

  さて、このソフトを使って、

  • 種ともこのアルバム「感傷」から「はい、チーズ!」
  • THE POLICEのLive at the "Omni" Atlanta, Georgia During 1983 U.S.A Tourから"SoLonely"
を試聴してみた。「はい、チーズ!」は途中がLive録音であるし、"So Lonely"の方は完全にLive録音であるからだ。

 試聴のやりかたは、Cd2wav32.exeを使い、CDからWAVファイルにする。そして、WaveMixPro(YVS3)を使って、バーチャルサウンドシステム構築する。そして、それをヘッドホーンで試聴するわけだ。適当にチャンネル同士の演算の係数を変化させ、聴いてみた。果たして、立体感は増しているか?

 さて、試聴した結果であるが、「うーん。」という感じだ。
 係数を大きくすると、まるで「カラオケ製造器」である。ボーカルが消えるだけである。しかも、聴衆が頭の真ん中に居座っているような感じである。つまり、立体感がむしろなくなってしまっている。「何故、オマエらはオレの頭の真ん中で拍手をするのだ」、と言いたくなる。頭が変になりそうである。
 かといって、小さいとよく違いがわからない。困ったものである。

 さてさて、まだまだ第一回目ではあるが、前途多難の気配であるのが心配なところだ。

2000-01-03[n年前へ]

音場の定位を見てみたい 

立体音感を考える その2


 前回(といっても間に他の話も挟まっているのだが)、

で「音の立体感」について考え始めた。今回はその続きである。「音の立体感」を考えるための道具を作る準備をしてみたい。

 色々なことを考えるには、その目的にあった測定器が必要である。何か新しいことをしようと思ったら、そのための新しい測定器を作成しなければならない(と思うだけだが)。そして、何より私は計測器なんてほとんど持っていない。だからといって、計測器を買うお金があるわけではない。というわけで、困ってしまうのだ。

 そこで、立体音感を考えるための測定器を作っていくことにした。といっても、すぐにできるとも思えないので、色々実験をしながらボチボチとやってみることにした。勉強がてら、ボチボチやってみるのである。オーディオ関連のことにはかなり疎いので勉強にはちょうど良いだろう。

 資料をいくつか眺めてみたが、特に

  • 「立体視の不思議を探る」 井上 弘著 オプトロニクス社
の中に簡単に音の立体感に関する因子が簡単にまとめられている。それは
  • 音像定位の因子
    • 両耳差因子 (音響信号)
      • 音の強さ(振幅)の差
      • 位相の差
    • 周波数スペクトル因子
というものである。今回はこの中の「音の強さ(振幅)の差」というものに注目してみることにした。よくある2スピーカ方式の「音の立体感」を考えるとき一番メジャーである、と思うからだ。左のスピーカーと右のスピーカーから聞こえる音の大きさが違う、というヤツである。

 そこで、いきなりだが今回作成した解析ソフト「音場くん一号」のアルゴリズムは以下のようになる。

  1. PCのサウンド入力から、サンプリング周波数 22.05kHz、Stereo 各チャンネル8bitで取り込みを行う。
  2. 取り込んだデータを4096点毎にウィンドウ(Hamming or無し)処理をかける。
  3. 高速フーリエ変換(FFT)を行う
  4. FFTの結果の実部について、左右のチャンネルの差分を計算する
 このようにすることで、各周波数成分それぞれについて、左と右のチャンネルに記録されている「音の大きさ(音圧)」の差がわかるといいな、と考えたのである。

 次に示すのが、「音場くん(仮名)一号」の動作画面である。「音場くん(仮名)一号」の画面構成は、

  • 右側->制御部
  • 左側->計測データ表示部
である。そして、左側の計測データ表示部は上から、
  • 音声波形データ(赤=左、緑=右)
  • 周波数(横軸)vs左右での音圧の差(縦軸)
  • 時間(横軸)vs周波数(縦軸)vs左右での音圧の差(色)
となっている。ちなみに下の画面は種ともこの「うれしいひとこと」の中から、「安売り水着を結局買ったアタシの歌」のイントロ部を計測したものだ。
「音場くん(仮名)一号」の画面
「安売り水着を結局買ったアタシの歌」イントロ部

(黒字に赤、緑の色構成は変更の予定)

 計測データ表示部の拡大図を下に示す。

  • 音声波形データ(赤=左、緑=右)
  • 周波数(横軸)vs左右での音圧の差(縦軸)
  • 時間(横軸)vs周波数(縦軸)vs左右での音圧の差(色)
というのが判るだろうか?かなりわかりにくい表示系であるのが残念だ。また、色もみにくい表示色になっていると思うので、近く変更する予定である。

 この表示計の意味を例を挙げて説明したい。例えば、下の画面では左の方に定位している音が鳴ったときの状態を示している。一番上の音声波形データでは緑(右)の波形は小さいのに対して、赤(左)の大きな波形が見えている。
 また、真ん中の「周波数(横軸)vs左右での音圧の差(縦軸)」では横軸100(任意単位)程度の高さの辺りで左チャンネルに位置する音が発生しているのがわかる。
 また、一番下の「時間(横軸)vs周波数(縦軸)vs左右での音圧の差(色)」では時間的に一番最後(横軸で右側)の方の横軸560、縦軸100位の位置に白い(すなわち左チャンネルに定位する)音が発生しているのがわかると思う。

「音場くん(仮名)一号」の画面の拡大図
「安売り水着を結局買ったアタシの歌」イントロ部

 この曲のイントロでは、「ポンッ」という音が高さを変えつつ、左右にパンニング(定位位置を変化させること)する。
 一番下の「時間(横軸)vs周波数(縦軸)vs左右での音圧の差(色)」を示したグラフ中で白・黄色(左に定位)と青・黒(右に定位)する音が時間的にずれながら現れているのが判ると思う。

 このようにして、この「音場くん(仮名)一号」では音の定位状態についての「極めて大雑把な」計測が可能である(保証はしないけど)。「音場くん(仮名)一号」を使った他の例を示してみる。

 下は種ともこの「O・HA・YO」の中から「The Morning Dew」のイントロ部を示したものだ。

  • 左(白・黄)チャンネル方向に定位するピアノ
  • 右(黒・青)チャンネル方向に定位するガットギター
がつくる旋律が絡み合っているのがわかると思う。
「The Morning Dew」のイントロ部での
「時間(横軸)vs周波数(縦軸)vs左右での音圧の差(色)」
を示したもの

 これはまるでオルゴールのピンを見ているようだ。あるいは、シーケンサーや昔の自動演奏ピアノのロール譜のようである。対位法などの効果をこれで確認したくなってしまう。

 さて、ここまでの例は楽器も少なく、比較的自然な定位状態であった。しかし、以下に示すような場合には不自然なくらいの「音の壁」状態の場合である。かなり状態が異なる場合だ。

「KI・REI」のラストのラストコーラス部での
「時間(横軸)vs周波数(縦軸)vs左右での音圧の差(色)」
を示したもの

 これは、種ともこの「O・HA・YO」の中から「KI・REI」のラストのラストコーラス部を示したものである。人のコーラスが重なり合っていく部分である。色々な高さの声が重なり合っていく様子がわかるだろう。
 ところが、このグラフをよくみると、同じ音が時間的に持続しているにも関わらず、時間毎に定位位置が左右で入れ替わっているのがわかる。

 これはきっとエフェクターで言うところのコーラスなどをかけたせいだろう(素人判断だけど)。人工的にフィルタ処理をしているためにこのようになるのだろう。こういう結果を見ると、「音場くん(仮名)一号」をプログレ系の音の壁を解析してみたくなる。

 さて今回は、音声の定位状態を解析する「音場くん(仮名)一号」を作成し、いくつかの音楽に対して使ってみた。まだまだ「音場くん(仮名)一号」は作成途中である。これから続く立体音感シリーズとともに「音場くん(仮名)」も成長していく予定である。

 さて、一番先の画面中に"Re"という選択肢があるのがわかると思う。もちろん、これと対になるのは"Im"である。FFTをかけた結果の"実部"と"虚部"である。"実部"の方が左右の耳の間での音の大きさの違いを示すのに対して、"虚部"の方は左右の耳の間での位相差を示すものだ。つまり、ある周波数の音が左右の耳の間でどのような位相差を示すものか、測定しようとするものである。

 左右の耳に対する音の位相差というものは、立体音感を考える上では避けては通れないのだろう。しかし、位相差を処理しようとすると、どうしたらいいものかかなり迷う部分がある。また、今回のようなFFT処理をかけたときに得られる位相を用いて良いものかどうかもよくわからない。というわけで、今回は位相解析処理は後回し、ということにした。

2000-01-08[n年前へ]

着メロの音響工学 

この着信音は誰のだ!? 立体音感その3


 街中で携帯電話の着信音が鳴ると、周辺の人が一斉に自分のポケットを探る光景というのはよく見掛ける。それは、まるで「クイズ・ドレミファドン」のようである。そう「超・イントロクイズ」そのものなのだ。「このイントロはオレのか!?それとも!?」と皆が考えている瞬間である。
 着メロのイントロが始まるや否や、腰の携帯電話に手をやる様子は「おまえは荒野のガンマンか!」とツッコみたくなる程である。

 特に、私の勤務先などでは全員が同じPHSを持ち歩いているせいか、着信音が聞こえ始めると、みな自分のポケットを探り始める。もちろん、そのPHSの着信音は数種類ある。しかし、1500人程度の従業員がいるわけだから、1500人/ 数種類だけ同じ着信音があるわけだ。仮に15種類あるとしても、

1500(人) / 15(種類数) = 100(人/種類)
つまり、自分と全く同じ着信音のPHSを持つ人が100人もいるのだ。世の中には「自分と同じ顔の人が七人いる」というが、職場に同じ着信音の人が100人もいるのである。これでは、着信音が鳴ると同時に多くの人がポケットを探るのも自然だろう。

 もちろん、この解決策として、「着信音でなくてバイブレーターを使う」というものがあるわけだが、何故かその解決策は許されないらしい。不思議である。

 さて、そもそも、何故自分の着信音を区別できないのだろうか? まず、その辺りから考えてみることにする。
 着信音が鳴ったときに、「自分の着信音かどうか判断するための基準」は二つあるだろう。それは、

  1. 着信音の種類
  2. 着信音が鳴っている位置
の二つである。着信音が人それぞれ固有のものであるとしたら、着信音の種類を聞けば、誰の着信音か判断できる。また、仮に着信音がみな同じであっても、着信音が鳴っている位置を識別できれば、それでも誰の着信音であるか判断できる。自分の携帯電話の位置は、それぞれ把握しているのが自然である。だから、
着信音の鳴っている位置 = 自分の携帯電話の位置
が成立するかどうか即座に判断できれば、着信音が同じでも「自分の着信音であるか」の判断が可能ということだ。

  つまりは、「携帯電話の着信音という音源の定位」という問題を考えれば良いことになる。もし、「着信音の定位」が判れば、自分の携帯電話の着信音か他の人の着信音かどうかなんてことは考えなくて済むのだ。そう、今回は「立体音感」シリーズその3だったのである。

 それでは、一体「着信音がどこで鳴っているのか、すなわち、着信音の定位」が判るためには何が必要なのだろうか?
 

前回、

で「音の立体感に関する因子」について
  • 音像定位の因子
    • 両耳差因子 (音響信号)
      • 音の強さ(振幅)の差
      • 位相の差
    • 周波数スペクトル因子
の中の両耳差因子の内の「音の強さ(振幅)の差」について考えた。今回は、「着信音の定位」を考えるにあたり、「周波数スペクトル因子」に注目してみることにする。

 周波数スペクトル因子というのは、例えば、

の中の記述
 指を前方で鳴らしてみて下さい。 そしてすこしずつ手を頭の側方に、手と頭の距離を変えないようにして、移動してみて下さい。 音量がわずかに大きくなったこととある特定の中域および広域の音がより強調されることに気が付かれるでしょう。 この実験では、指を鳴らす動作は一定の音量と周波数を発生する音源として用いられたわけです。 耳は同一の音源が前方から来る場合と、側方から来る場合で全く違う音と聞き分け、頭脳にそれを登録します。 側方の音は若干大きく、また耳たぶのせいで高い周波数で聞こえます。
にあるようなものである。
 音波が人間の頭部を通過してくる間に音波の周波数分布が変化し、その変化具合で音波がやってきた方向を知ることができるというものだ(多分)。もちろん、位相分布も変化するだろうが、ここでは周波数分布しか考えない。

 こういう音像定位の因子における「周波数スペクトル因子」を考える時に、もし音源の周波数スペクトルがごく狭いものだったらどうだろうか?つまり、単一の周波数しか含まない音源だったらどうだろうか?周波数スペクトルが変化するといっても、単一のスペクトルしか含んでいないのだから、振幅が変化する効果しかない。周波数スペクトルの分布は何ら変化しない。
 ということは、「音像定位の因子における周波数スペクトル因子」が上手く作用しないことになってしまう。(もちろん、実際には非線形な効果が存在するだろうから、多少は周波数スペクトルも変化するとは思うが。)

 これと全く同じことはまたしても「物理の散歩道」で触れられている。ロゲルギスト著の岩波新書「第四物理の散歩道」の「不規則なものの効用 三節」である。純音より不規則な音の方が「立体感」を得られるだろう、と書いている。

 今回、「携帯電話の着信音の定位」を「着信音のスペクトル分布」という観点から調べてみることにする。携帯電話の着信音がどのような波形であるか、どのような周波数分布を持っているかを調べるのである。果たして、携帯電話の着信音の周波数分布はどうなっているのだろうか?(部品点数を考えれば、ほぼSin波か矩形波なのが当然だろうが...)

 まずは手持ちの機種で着信音の波形とスペクトルを見てみることにした。使った機種を以下に示す。
 

使用した Hitachi C201H

 それでは、着信音No4と着メロ「この木何の木」の波形とスペクトログラムを次に示す。それぞれのグラフ中で上は「時間vs周波数分布」を示すスペクトログラムであり、下は「時間vs強度」の波形グラフである。

 まずこれが、着信音No.4の波形とスペクトログラムであり、
 

No.4の波形とスペクトログラム

こちらが、「この木何の木」の波形とスペクトログラムだ。
 

「この木何の木」の波形とスペクトログラム

 どちらも周波数分布はそれほどブロードではない。すると、「音像定位の因子における周波数スペクトル因子」を用いた「立体音感」がうまく働かないかもしれない。ただし、着信音No.4に関しては時間的に変化しないが、着メロ「この木何の木」に関しては、当然だが時間的に変化していく。

 この違いが果たして、「着信音の音像の定位」の判断を左右するものか、自分の耳で実験することにした。着信音No.4と着メロ「この木何の木」を鳴らした時に、どこから鳴っているように聞こえるか判断してみるのだ。

 目をつぶり頭の周囲で着信音を鳴らし、その定位を判断してみた。すると、色々な着信音を聞いてみたがいずれも定位の判断がしづらかった。特に頭の前後の判断がしづらい。それは、着信音No.4と着メロ「この木何の木」でも同様であった。やはり、純音に近いと「音像定位の因子における周波数スペクトル因子」が働きづらいのかもしれない。

 そして、着信音No.4と着メロ「この木何の木」だが、むしろ着信音No.4の方が判断をしやすかった。メロディだと音が変わるときに定位が変わるかのような感覚を受けた。そのため、判断をしにくかった。もちろん、これは私だけの感覚かもしれない。その辺りは被験者を増やして実験をしてみたい(再実験をする日が来るかどうかは大いに疑問であるが)。
 また、もしかしたら着信音No.4の方が矩形波に近く、純音でないのが良かったのかもしれない。もしかしたら、の話だけれど。

 もし、今回使った音を聞いてみたい人がいるならば、

これを聞いてみてもらいたい。ただし、サイズがでかいので要注意だ。あとバックグラウンドがうるさいのはハードディスクとファンの回転音である。困ったものだ。

 最近多い「同時発声数が多い着メロ機能」というのも、使って実験すると面白そうだ。しかも、音が分厚いヤツがあると、案外良いモノかもしれないな、とうらやましく思ったりするのである。そして、着信音スピーカーがプアァで歪んでいる機種なんかが、色々な周波数成分を含んでいて、実は「着信音の定位」に関しては良かったりするのかもしれない、と考えたりする。しかし、こちらはチットモうらやましくないのであった。
 

2000-03-05[n年前へ]

私の日本語練習帳 

アメンボ赤いなアイウエオ

 もうすぐ、4月である。4月といえば、新学期だ。といっても、私は別に学生ではないので、新学期といっても特に何があるわけではない。別に新しい授業が始まるわけではないのである。しかし、私は何故かこの時期になると「英会話」を勉強したくなるのである。

 去年の初めにも英語学習熱に襲われ、NHKのラジオ講座を通勤途中やることにしてみた。しかし、いつものように二ヶ月だけで挫折してしまった。そういうわけで、NHKラジオ「英会話」講座の毎年4月分のテキストが私の家には沢山ある。
 それだけでなくて、この時期には「一週間でわかる英会話(仮名)」というような本も買い込んでしまう。しかし、これもまた買うだけで終わってしまっていたのだ。どうも、私の興味が散漫であることも理由の一つだろう。湯川秀樹は

 「今日はあれをやり、明日はこれ、というように、あまり気が散ると、結局どれもものにならないですね。」
という非常に的確なことを言っているらしいが、まさにその通りである。話題が飛びまくりの「できるかな?」には実に痛い指摘である。しかし、糸川英夫は
 「自分にできること」よりも「世の中が求めていること」に挑戦し続けた方が人生も楽しい。
言っているらしいし、気にしないでおく(進歩無し)。

 私はそういう生活が10年近く続いている。そんなわけで、英語のテキストは増えたが、英語能力は減る一方だ。いやまてよ、ということは

  • 一人の人が持つNHKラジオ「英会話」講座の4月分テキストの冊数
  • 一人の人が持つ英会話能力
は反比例するのかもしれない。その仮説を適用するならば、
  • 今年のNHKラジオ「英会話」講座の4月分テキストを買わなければ、私の英語能力はアップする
という推論が可能である。逆に言えば、今年もまたNHKラジオ「英会話」講座の4月分テキストを買うと、ますます英語能力が低下してしまう、ということだ。私の英語能力が低下したのは、英語のテキストを買いすぎたせいで、もしかしたら、英語のテキストを全部捨てれば英語能力がアップするかもしれない。

 いや、こんなワケのわからない仮説を論じている場合ではない。これは、非常にマズイ。今年こそ、三日坊主は止めなければならない。新しいミレニアムが訪れたことでもあるし、バージョンアップした私(仮に私2000とでも名付けておこう)になるためにも、今回こそ英会話の勉強をしてみたいと思う。

 そこで、発売されてすぐ買ったは良いが、そのまま本棚で眠っていた

  • BLUE BACKS 英語スピーキング科学的上達法 山田・足立・ATR人間情報通信研究所
で遊んでみることにした。この本は
  • BLUE BACKS 英語リスニング科学的上達法 山田・足立・ATR人間情報通信研究所
の続編である。もちろん、私は両者とも買っただけで「積ん読(つんどく)」であった。いや、ホントは読んだのだけれど…

 それでは、今年の勉強を始めてみることにしたい。この本の主な内容は

  • 英語における発音を科学的に分析(主にフォルマント、スペクトログラム)する。
という感じである。

 これまで、「できるかな?」では

といった感じで音のスペクトログラムはよく登場している。なので、きっと感覚的に判りやすいはずだ(少なくとも理屈としては…)。

 しかし、いきなり私に英語はキツイ。まずは日本語の練習から始めることにした。日本語の母音の発音を練習するのである。そうすれば、自分自身の日本語を再確認できるし、この本の信頼性もチェックできる。「フォルマントで音声を判断する」というのがどの程度使えるものであるかを、私の日本語でチェックすることができるのである。何しろ、変な発音かもしれないが、一応私は日本語のネイティブであるからだ。

 それでは、「英語スピーキング科学的上達法」に付属のソフトで私のフォルマントを調べてみる。これが私の「あいうえお」のスペクトログラムとフォルマントである。
 

私の「あいうえお」のスペクトログラムとフォルマント

縦軸=周波数, 横軸=時間

 ここで、色丸で示してあるのが

  • 赤 = 第1フォルマント ( F1 )
  • 青 = 第2フォルマント ( F2 )
  • 緑 = 第3フォルマント ( F3 )
である。簡単に言えば、周波数のピークを低い方から番号付けしたものである。

 それでは、私の「あいうえお」をF1-F2空間にマッピングしたものを次に示す。これも、「英語スピーキング科学的上達法」に付属のソフトによるモノであり、標準的な男性の「あいうえお」の分布が示されている。そして、赤丸で示してあるのが私の「あいうえお」である。
 そして、F1-F2空間における英語の母音分布の上に私の「あいうえお」を重ねたものも示す。
 

F1-F2空間における私の「あいうえお」
横軸 = F1(Hz)、縦軸 = F2(Hz)





私の「あいうえお」を
英語の母音に重ねてみた図

 こうフォルマント分析をしてみると、私の「い」「う」「え」は標準的な分布の中に入っていることがわかる。しかし、「あ」「お」はそうではない。
むしろ、私は発音は英語の母音でいうところの

  • 「あ」 = 
  • 「お」 = 
という感じである。まぁ、
  • 私の発音の精度の問題 = 私の発音がヘン?
  • 測定・解析の精度の問題
かはさておき、精度はこんなものなのだろう。結構、ちゃんと判断できるものだなぁ、というのがこの解析に対して私の受けた印象である。こういう音声解析というのも実に面白そうな分野である。

 さて、最初のうちはこの本付属のソフトを使って遊んでいくことになると思う。しかし、いつか自作のソフトウェアを作成し、F1-F2-F3空間での「あいうえお」の可視化でもしてみたい。言葉の可視化、さらには言霊の可視化をしていく予定である。(あれっ、そう言えば英会話の勉強はどこへ…)
 

今日はあれをやり、明日はこれ、というように、あまり気が散ると、結局どれもものにならないですね。
By 湯川秀樹

2003-06-13[n年前へ]

手をたたくだけで自動的に最適な音場を設定 

 「接続したスピーカーがマイク代わりに音を感知」というビクターのAVコントロールアンプ。このアイデアは素晴らしく面白い。そして、それを製品にまで持って行った辺りも素晴らしい。



■Powered by yagm.net