2000-01-03[n年前へ]
■音場の定位を見てみたい
立体音感を考える その2
前回(といっても間に他の話も挟まっているのだが)、
で「音の立体感」について考え始めた。今回はその続きである。「音の立体感」を考えるための道具を作る準備をしてみたい。色々なことを考えるには、その目的にあった測定器が必要である。何か新しいことをしようと思ったら、そのための新しい測定器を作成しなければならない(と思うだけだが)。そして、何より私は計測器なんてほとんど持っていない。だからといって、計測器を買うお金があるわけではない。というわけで、困ってしまうのだ。
そこで、立体音感を考えるための測定器を作っていくことにした。といっても、すぐにできるとも思えないので、色々実験をしながらボチボチとやってみることにした。勉強がてら、ボチボチやってみるのである。オーディオ関連のことにはかなり疎いので勉強にはちょうど良いだろう。
資料をいくつか眺めてみたが、特に
- 「立体視の不思議を探る」 井上 弘著 オプトロニクス社
- 音像定位の因子
- 両耳差因子 (音響信号)
- 音の強さ(振幅)の差
- 位相の差
- 周波数スペクトル因子
そこで、いきなりだが今回作成した解析ソフト「音場くん一号」のアルゴリズムは以下のようになる。
- PCのサウンド入力から、サンプリング周波数 22.05kHz、Stereo 各チャンネル8bitで取り込みを行う。
- 取り込んだデータを4096点毎にウィンドウ(Hamming or無し)処理をかける。
- 高速フーリエ変換(FFT)を行う
- FFTの結果の実部について、左右のチャンネルの差分を計算する
次に示すのが、「音場くん(仮名)一号」の動作画面である。「音場くん(仮名)一号」の画面構成は、
- 右側->制御部
- 左側->計測データ表示部
- 音声波形データ(赤=左、緑=右)
- 周波数(横軸)vs左右での音圧の差(縦軸)
- 時間(横軸)vs周波数(縦軸)vs左右での音圧の差(色)
(黒字に赤、緑の色構成は変更の予定) |
計測データ表示部の拡大図を下に示す。
- 音声波形データ(赤=左、緑=右)
- 周波数(横軸)vs左右での音圧の差(縦軸)
- 時間(横軸)vs周波数(縦軸)vs左右での音圧の差(色)
この表示計の意味を例を挙げて説明したい。例えば、下の画面では左の方に定位している音が鳴ったときの状態を示している。一番上の音声波形データでは緑(右)の波形は小さいのに対して、赤(左)の大きな波形が見えている。
また、真ん中の「周波数(横軸)vs左右での音圧の差(縦軸)」では横軸100(任意単位)程度の高さの辺りで左チャンネルに位置する音が発生しているのがわかる。
また、一番下の「時間(横軸)vs周波数(縦軸)vs左右での音圧の差(色)」では時間的に一番最後(横軸で右側)の方の横軸560、縦軸100位の位置に白い(すなわち左チャンネルに定位する)音が発生しているのがわかると思う。
この曲のイントロでは、「ポンッ」という音が高さを変えつつ、左右にパンニング(定位位置を変化させること)する。
一番下の「時間(横軸)vs周波数(縦軸)vs左右での音圧の差(色)」を示したグラフ中で白・黄色(左に定位)と青・黒(右に定位)する音が時間的にずれながら現れているのが判ると思う。
このようにして、この「音場くん(仮名)一号」では音の定位状態についての「極めて大雑把な」計測が可能である(保証はしないけど)。「音場くん(仮名)一号」を使った他の例を示してみる。
下は種ともこの「O・HA・YO」の中から「The Morning Dew」のイントロ部を示したものだ。
- 左(白・黄)チャンネル方向に定位するピアノ
- 右(黒・青)チャンネル方向に定位するガットギター
これはまるでオルゴールのピンを見ているようだ。あるいは、シーケンサーや昔の自動演奏ピアノのロール譜のようである。対位法などの効果をこれで確認したくなってしまう。
さて、ここまでの例は楽器も少なく、比較的自然な定位状態であった。しかし、以下に示すような場合には不自然なくらいの「音の壁」状態の場合である。かなり状態が異なる場合だ。
これは、種ともこの「O・HA・YO」の中から「KI・REI」のラストのラストコーラス部を示したものである。人のコーラスが重なり合っていく部分である。色々な高さの声が重なり合っていく様子がわかるだろう。
ところが、このグラフをよくみると、同じ音が時間的に持続しているにも関わらず、時間毎に定位位置が左右で入れ替わっているのがわかる。
これはきっとエフェクターで言うところのコーラスなどをかけたせいだろう(素人判断だけど)。人工的にフィルタ処理をしているためにこのようになるのだろう。こういう結果を見ると、「音場くん(仮名)一号」をプログレ系の音の壁を解析してみたくなる。
さて今回は、音声の定位状態を解析する「音場くん(仮名)一号」を作成し、いくつかの音楽に対して使ってみた。まだまだ「音場くん(仮名)一号」は作成途中である。これから続く立体音感シリーズとともに「音場くん(仮名)」も成長していく予定である。
さて、一番先の画面中に"Re"という選択肢があるのがわかると思う。もちろん、これと対になるのは"Im"である。FFTをかけた結果の"実部"と"虚部"である。"実部"の方が左右の耳の間での音の大きさの違いを示すのに対して、"虚部"の方は左右の耳の間での位相差を示すものだ。つまり、ある周波数の音が左右の耳の間でどのような位相差を示すものか、測定しようとするものである。
左右の耳に対する音の位相差というものは、立体音感を考える上では避けては通れないのだろう。しかし、位相差を処理しようとすると、どうしたらいいものかかなり迷う部分がある。また、今回のようなFFT処理をかけたときに得られる位相を用いて良いものかどうかもよくわからない。というわけで、今回は位相解析処理は後回し、ということにした。
2000-01-08[n年前へ]
■着メロの音響工学
この着信音は誰のだ!? 立体音感その3
街中で携帯電話の着信音が鳴ると、周辺の人が一斉に自分のポケットを探る光景というのはよく見掛ける。それは、まるで「クイズ・ドレミファドン」のようである。そう「超・イントロクイズ」そのものなのだ。「このイントロはオレのか!?それとも!?」と皆が考えている瞬間である。
着メロのイントロが始まるや否や、腰の携帯電話に手をやる様子は「おまえは荒野のガンマンか!」とツッコみたくなる程である。
特に、私の勤務先などでは全員が同じPHSを持ち歩いているせいか、着信音が聞こえ始めると、みな自分のポケットを探り始める。もちろん、そのPHSの着信音は数種類ある。しかし、1500人程度の従業員がいるわけだから、1500人/ 数種類だけ同じ着信音があるわけだ。仮に15種類あるとしても、
1500(人) / 15(種類数) = 100(人/種類)つまり、自分と全く同じ着信音のPHSを持つ人が100人もいるのだ。世の中には「自分と同じ顔の人が七人いる」というが、職場に同じ着信音の人が100人もいるのである。これでは、着信音が鳴ると同時に多くの人がポケットを探るのも自然だろう。
もちろん、この解決策として、「着信音でなくてバイブレーターを使う」というものがあるわけだが、何故かその解決策は許されないらしい。不思議である。
さて、そもそも、何故自分の着信音を区別できないのだろうか? まず、その辺りから考えてみることにする。
着信音が鳴ったときに、「自分の着信音かどうか判断するための基準」は二つあるだろう。それは、
- 着信音の種類
- 着信音が鳴っている位置
着信音の鳴っている位置 = 自分の携帯電話の位置が成立するかどうか即座に判断できれば、着信音が同じでも「自分の着信音であるか」の判断が可能ということだ。
つまりは、「携帯電話の着信音という音源の定位」という問題を考えれば良いことになる。もし、「着信音の定位」が判れば、自分の携帯電話の着信音か他の人の着信音かどうかなんてことは考えなくて済むのだ。そう、今回は「立体音感」シリーズその3だったのである。
それでは、一体「着信音がどこで鳴っているのか、すなわち、着信音の定位」が判るためには何が必要なのだろうか?
前回、
で「音の立体感に関する因子」について- 音像定位の因子
- 両耳差因子 (音響信号)
- 音の強さ(振幅)の差
- 位相の差
- 周波数スペクトル因子
周波数スペクトル因子というのは、例えば、
の中の記述指を前方で鳴らしてみて下さい。 そしてすこしずつ手を頭の側方に、手と頭の距離を変えないようにして、移動してみて下さい。 音量がわずかに大きくなったこととある特定の中域および広域の音がより強調されることに気が付かれるでしょう。 この実験では、指を鳴らす動作は一定の音量と周波数を発生する音源として用いられたわけです。 耳は同一の音源が前方から来る場合と、側方から来る場合で全く違う音と聞き分け、頭脳にそれを登録します。 側方の音は若干大きく、また耳たぶのせいで高い周波数で聞こえます。にあるようなものである。
音波が人間の頭部を通過してくる間に音波の周波数分布が変化し、その変化具合で音波がやってきた方向を知ることができるというものだ(多分)。もちろん、位相分布も変化するだろうが、ここでは周波数分布しか考えない。
こういう音像定位の因子における「周波数スペクトル因子」を考える時に、もし音源の周波数スペクトルがごく狭いものだったらどうだろうか?つまり、単一の周波数しか含まない音源だったらどうだろうか?周波数スペクトルが変化するといっても、単一のスペクトルしか含んでいないのだから、振幅が変化する効果しかない。周波数スペクトルの分布は何ら変化しない。
ということは、「音像定位の因子における周波数スペクトル因子」が上手く作用しないことになってしまう。(もちろん、実際には非線形な効果が存在するだろうから、多少は周波数スペクトルも変化するとは思うが。)
これと全く同じことはまたしても「物理の散歩道」で触れられている。ロゲルギスト著の岩波新書「第四物理の散歩道」の「不規則なものの効用 三節」である。純音より不規則な音の方が「立体感」を得られるだろう、と書いている。
今回、「携帯電話の着信音の定位」を「着信音のスペクトル分布」という観点から調べてみることにする。携帯電話の着信音がどのような波形であるか、どのような周波数分布を持っているかを調べるのである。果たして、携帯電話の着信音の周波数分布はどうなっているのだろうか?(部品点数を考えれば、ほぼSin波か矩形波なのが当然だろうが...)
まずは手持ちの機種で着信音の波形とスペクトルを見てみることにした。使った機種を以下に示す。
それでは、着信音No4と着メロ「この木何の木」の波形とスペクトログラムを次に示す。それぞれのグラフ中で上は「時間vs周波数分布」を示すスペクトログラムであり、下は「時間vs強度」の波形グラフである。
まずこれが、着信音No.4の波形とスペクトログラムであり、
こちらが、「この木何の木」の波形とスペクトログラムだ。
どちらも周波数分布はそれほどブロードではない。すると、「音像定位の因子における周波数スペクトル因子」を用いた「立体音感」がうまく働かないかもしれない。ただし、着信音No.4に関しては時間的に変化しないが、着メロ「この木何の木」に関しては、当然だが時間的に変化していく。
この違いが果たして、「着信音の音像の定位」の判断を左右するものか、自分の耳で実験することにした。着信音No.4と着メロ「この木何の木」を鳴らした時に、どこから鳴っているように聞こえるか判断してみるのだ。
目をつぶり頭の周囲で着信音を鳴らし、その定位を判断してみた。すると、色々な着信音を聞いてみたがいずれも定位の判断がしづらかった。特に頭の前後の判断がしづらい。それは、着信音No.4と着メロ「この木何の木」でも同様であった。やはり、純音に近いと「音像定位の因子における周波数スペクトル因子」が働きづらいのかもしれない。
そして、着信音No.4と着メロ「この木何の木」だが、むしろ着信音No.4の方が判断をしやすかった。メロディだと音が変わるときに定位が変わるかのような感覚を受けた。そのため、判断をしにくかった。もちろん、これは私だけの感覚かもしれない。その辺りは被験者を増やして実験をしてみたい(再実験をする日が来るかどうかは大いに疑問であるが)。
また、もしかしたら着信音No.4の方が矩形波に近く、純音でないのが良かったのかもしれない。もしかしたら、の話だけれど。
もし、今回使った音を聞いてみたい人がいるならば、
これを聞いてみてもらいたい。ただし、サイズがでかいので要注意だ。あとバックグラウンドがうるさいのはハードディスクとファンの回転音である。困ったものだ。 最近多い「同時発声数が多い着メロ機能」というのも、使って実験すると面白そうだ。しかも、音が分厚いヤツがあると、案外良いモノかもしれないな、とうらやましく思ったりするのである。そして、着信音スピーカーがプアァで歪んでいる機種なんかが、色々な周波数成分を含んでいて、実は「着信音の定位」に関しては良かったりするのかもしれない、と考えたりする。しかし、こちらはチットモうらやましくないのであった。
2000-01-17[n年前へ]
■夜のバットマン
超音波を可視化しよう
どんなものに対しても、「超」という文字をつけるという安易な手段はよく使われる。「超人ハルク」、「超常現象」、「超能力少年」、「超解像」等々である。「超Ultra」+「人 Man」ならば「超人 Ultra-Man」、すなわち、ウルトラマンだ。こういう風に並べてみると、何かアヤシげなものが多いような気がするが、それは私の気のせいだろう。
「超」をつければ、「モノスゴイ」という印象を受けるかというと、必ずしもそういうわけでもない。最近、「お笑いパソコン日誌」でよく取り上げられているBTRON仕様OS「超漢字」などは、その最たるものである。個人的には好きなネーミングなのだが、その名前を聞くと昔の「超兄貴」というゲームを思い出してしまうのだ。筋肉ムキムキなマッスルな兄貴達が動き回るゲームが思い出されるのだ。そして、そんなマッスルなデスクトップのイメージが連想されてしまうのである。困ったものである。
「超」の発音は同じ日本人でも一定というわけではない。あまりものを考えないタイプの人の場合、「超」でなくて「チョー」という発音するらしい。その使用例が、「チョー、ムカツクー」などである。これらの人を「チョー人」と呼ぶべきである(既に誰かが言っていそうな気がするが...)。
何故、こんな話になるのだ。話がずれた。
本題である。今回遊んでみるのは「超 Ultra」+「音波 Sonic」=「超音波UltraSonic」である。色々な応用はあると思うが、まずは基礎から始めたい。そういった場合、色々やり方はあるのだろうが、まずは実感するのが「できるかな?」のやり方である。そこで、まずは超音波を実際に聞いてみることにした。
普通は聞こえない周波数の音波を超音波というわけであるから、超音波を聞くというのは何ともスリリングである。参考までに、色々な動物の可聴域を以下に示す。
人間は大抵20kHz前後が上限であり、コオロギと同じくらいである。超音波と言えば、コウモリであり、コウモリは200kHz弱位が上限のようである。
まずは、超音波を聴くための情報を探してみた。すると、何とも素晴らしいサイトがあった。
- がーさんとたぬさんのホームページ( http://www.seaple.icc.ne.jp/~mixseeds/ )
また、コウモリ探知器である。バットディテクターに関しては、
- Bat Detecter ( http://www3.justnet.ne.jp/~hhas/BD.HTM)
迷わず、先の「がーさんとたぬさんのホームページ」の「釜利谷東ミックスシーズ」から、バットディテクターを購入することにした。こういう楽しいオモチャはすぐに手に入れるに限る。これが、購入したバットディテクターである。
このバットディテクターは超音波マイクからの入力を40kHz程度の周波数の信号と合成するものである。そして、その結果得られるビート音、うなり音を耳で聞くものである。
わからない人はほとんどいないと思うが、一応書いておく。例えば、10Hz周波数の音があるとしよう。
この波形は細かすぎて、この画面では目に見えないだろう。しかし、この波形と11kHzの周波数の音を合成してみる。
すると、10kHzと11kHzの周波数の差である1Hzのうなりが発生する。この1Hzのビート音の波形は目に見えるだろう。こういう原理である。
しかし、これでは実は説明が不十分であると思うのだが、今回はこれだけの説明で終わらせておくことにする。
さて、どんな超音波を聴くかであるが、「できるかな?」の実験を行うときには、大抵ビールを飲んでいるのである。今日もビールとお好み焼きがそばにある。そこで、お好み焼きを焼く音を
- 可聴域
- 超音波領域
もちろん、私自身は自分の耳で実感しているわけである。しかし、WEBページ上であれば、可視化した方が良いだろう。waveファイルはサイズが大きいし...
途中のスパイク部はお好み焼きをひっくり返した時の音である。レベルを合わせているわけではないし、実験は実に大雑把なものであるが、そんなに真剣に行う実験でもないのでこれで良いことにしておく。
硬いものと何かを擦ると超音波が実に多く発生するが、絨毯みたいな柔らかいもの相手ではあまり超音波が発生しなかったりして実に面白い。衣擦れの音などは実にリアルである。何か色っぽい音ですらあるように感じる。(それは私だけかもしれないが...)
超音波に関してはまだまだ色々とやってみたい実験がある。実は以前秋月で買った超音波マイク・スピーカセットが家に転がっていたりする。これを使って、次回は超音波オモチャを作成してみたいと思う。
さて、今日はTVで「バットマン&ロビン Mr.フリーズの逆襲」を放映するようだ。バットマンの映画は何故か夜の街が舞台である。
バットマンと言えば、Bat(コウモリ)+Man(男) = コウモリ男だ。このTVを見たあとの私はきっとバットマンになりきっているだろう。バットディティターを耳に差せば、私だって堂々たるバットマンだ。
というわけで、バットディテクターを耳に差し若葉マークをつけたバットマンは、夜の街へ出撃するのであった。夜のバットマンは眠らないのである(下品なギャグ禁止)。
2000-02-27[n年前へ]
■「文学論」と光学系
漱石の面白さ
前回、
でさて、モナリザと言うと、夏目漱石と「モナリサ」にも言及しなければならないだろう。と書いた。何しろ
- 恋の力学 三角関係編 - 恋の三体問題 - (1999.12.27)
- 草迷宮・空間'99 - ネコの目から見た世界- (1999.11.05)
- 「こころ」の中の「どうして?」-漱石の中の謎とその終焉 - (1999.09.10)
- 夏目漱石は温泉がお好き? -文章構造を可視化するソフトをつくる - (1999.07.14)
- [Scraps]人静月同照 - ぼくらが旅に出る理由- (1999.06.17)
その漱石は「永日小品(リンク先は青空文庫)」(リンク先は青空文庫)の「モナリサ」中で
「モナリサの唇には女性(にょしょう)の謎(なぞ)がある。原始以降この謎を描き得たものはダ・ヴィンチだけである。この謎を解き得たものは一人もない。」と書いている。女性には興味がなかったとも言われ、ずっと付き添っていた男性との関係も噂されるダ・ヴィンチである。ここらへんは、果たしてどうか?とも思う。むしろ、新宿のホストクラブのホストの方が女性(にょしょう)の謎(なぞ)については詳しいのではないかとも私は考えたりもする。
が、そんなことはどうでも良い。漱石はレオナルド・ダ・ビンチのモナリザに興味を持ち、小品を書き上げたのである。そこで、漱石とダ・ヴィンチの相似点を考えてみたい。
レオナルド・ダ・ビンチの著作には「文学論」というものがある。漱石にも同じ名前の「文学論」がある。この「文学論」はこれまで読んだことがなかったのだが、
- 「漱石の美術愛」推理ノート 新関公子 平凡社 ISBN4-582-82927-9
- 遠近法
- 漱石の文学論の「公式」
これが、とても面白い。仮名遣いが古いため、なかなか目に入ってこないのであるが、とても面白い。これは絶対に文庫本にすべきである。眺めているだけでも面白い。
まずは、冒頭のフレーズがいきなりこうである。
およそ文学的内容の形式は(F+f)なることを要す。Fは焦点的印象又は観念を意味し、fはこれに付着する情緒を意味す。まるで、理系の教科書である。そして、目次(編)を大雑把にさらってみる。
- 文学的内容の分類
- 文学的内容の数量的変化
- 文学的内容の特質
- 文学的内容の相互関係
- 集合的F
また、「文学論」中では、例えば、浪漫派と写実派の違いについて数値的な比較を通じて述べられていたりする。実に「科学的」な思考による「文学論」である。いや本当に漱石は凄い。
さて、中の文章を解説する力は私にはない。そこで、中の図表を示してみることにする。そこで適当に思うことなどを書いてみようと思う。
次に示すのは、「文学論」の冒頭の方で「意識の焦点・波形」を説明した図である。
漱石全集第十一巻より |
この図は人間が何かを感じるときには焦点にピークがある、そして、その周りはぼやけたものが連続的に続いているということを示したものだ。これなど、
の時の「恋のインパルス応答」を彷彿とさせる。あの時の「恋のインパルス応答」を次に示してみる。 この意識される恋心(f)は先の「意識の波形」と全く同じである。ある出来事(F)と、それに付着する情緒(f)を示したものとなるわけだ。付着する情緒(f)というのは中心が一番大きく、その周りにぼやけたものが繋がっているというわけである。人間の感じ方・情緒を光学系と結びつけているわけだ。
いやはや、「恋のインパルス応答」と同じようなことを考える人はやはりいるものである。まさかそれが漱石だとは思いもしなかった。しかも時代を考えると凄まじい、としか言いようがない。
そして、さらに次に示すのは
およそ文学的内容の形式は(F+f)なることを要す。Fは焦点的印象又は観念を意味し、fはこれに付着する情緒を意味す。ということを示す図である。先の - 「漱石の美術愛」推理ノート - ではこの図と遠近法の関連が述べられている。
漱石全集第十一巻より |
ここで、縦軸は「時間」となっており、横軸は「色々な出来事」である。ある人が感じた「色々な出来事」を時間方向に収斂させていくと、そこには「作者自身の視点がある」というわけだ。これが漱石の言う「文学論」の中心である。
この図などカメラや望遠鏡の光学系を彷彿とさせる。「光学系の一例」を以下に示す。
先の「文学の焦点」を示した図はレンズで光を焦点に集めるのと全く同じだ。いや、「焦点から光を投光する」のと同じと言った方が良いだろうか。以前、
で、景色に焦点を合わせて、フィルムに結像させるのがカメラだ。しかし、フィルムに写っているのは単なる景色ではない。カメラの光が集まる焦点にフィルムが位置していると思い込むとわからなくなる。逆から考えてみれば簡単に判るはずだ。カメラの視点にフィルムが位置しているのだ。フィルムに景色が写っているのではなく、フィルムが景色を選び、景色を切り取っているのである。と書いたのと全く同じである。その光学系には歪みもあるかもしれないし、色フィルターもかかっているかもしれない。しかし、とにかく焦点にはその人自身がいるのである。写真に写っているのは、撮影者の視点なのである。写真を見れば、撮影者が、どこに立ち、何を見てるかが浮かび上がってくるはずである。フィルムに写っているのは撮影者自身なのだ。
写真でも文章でもとにかく何であっても、色々感じたことを表現していく時、その焦点には表現者自身がいる。私の大好きなこの2000/2/25の日記なんか、実にそれを感じるのである。
2000-03-12[n年前へ]
■元気な私とカゼひく私
ガラガラ声の秘密
のどが痛いし、微熱がある。どうやら、扁桃腺が腫れているらしい。「あー」と言おうとすると、「あ”ー」という声になってしまう。まさにガラガラ声である。
ところで、ガラガラ声というのは一体どういう声なのだろう。もちろん、私の今の「あ”ー」という声はガラガラ声なのはわかる。しかし、このガラガラ声の特性をちゃんと定量化すべきだろう、と思うのである。まずは可能な限り、考えたり定量化したりしなければならないだろう。「感覚的なもの」というのは、そういうことをした後に持ち出すべきである。(考えること無しに)感覚的に判ったつもりになっているのは、何も感じていないのと同じである。それは、「想像力の欠如」に至ってしまうと思う。そして、想像力の欠如は「その人の地平線」を狭く(狭いという表現はおかしいようにも思うが)してしまう。何かワケの分からない文章だと感じるようであれば、それは私の頭が熱でふらふらになっているせいである。
さて、
で私の「アイウエオ」の声についての解析を行った。今回も、同じように私の「アイウエオ」の声について調べてみたいと思う。そうすれば、過去の「元気な私」と現在の「カゼひく私」の声の違いがわかるかもしれない。そして、ガラガラ声とは一体何なのか?ということの手がかりが掴めるかもしれない。 まずは、前回と同じように - F1-F2空間における私の「アイウエオ」 - を調べてみる。カゼをひいてガラガラ声になることで、私の「アイウエオ」のフォルマントはどう変化しただろうか?次の図がF1-F2空間における「元気な私のアイウエオ(●)と扁桃腺が腫れている私のアイウエオ(●)」を示したものである。
面白いことに、前回標準的な分布から外れていた私の「ア、オ」が今回は標準分布の中に収まっている。ガラガラ声になることで、私はやっと標準的な「アイウエオ」になるようである。何故だか、よくわからないが、面白い。まぁ、きっとフォルマント判断の際のピーク検出精度の問題だとは思うのであるが、不思議な結果である。
それでは、この「アイウエオ」の変化は一体どのようなものだろうか?音声波形を見てみることにする。それが次に示す図である。
まずは、「あ」の波形である。
元気な私 扁桃腺が腫れている私 |
元気な私の「あ」が割に単純な正弦波に近い。ただし、完全に上下対称な正弦波ではなくて、上に凸な部分の方が若干立ち上がりが速い波形のように見える。そして、割に綺麗に同じ波形が繰り返されている。
それに対して、扁桃腺が腫れている私の「あ」はスパイクノイズの入っている波形になってしまっている。こちらもスパイクノイズの入り方は割に同じ繰り返しである。
また、元気な頃の私の「あ」がF1-F2空間における標準的な「あ」分布と離れていたのは、F2が弱いせいではないかという予想ができるのではないだろうか?本来、上下の立ち上がりが異なるのが普通であるが、私の「あ」は上下が比較的同じであり、それでフォルマント判断の際のピーク検出精度が低下していたのではないか、という考えである。
それに対して、扁桃腺が腫れている私の「あ」は上下の立ち上がりがかなり異なり、周波数ピーク検出が容易であったのではないか、と私は考えるのである。
さて、次は「い」である。
元気な私 扁桃腺が腫れている私 |
これもやはり、基本的には同じ波形であることはわかる。しかし、元気な時には上に尖っている部分が、扁桃腺が腫れている私の「い」ではまるで部分的に上下逆転しているかのようになってしまっている。まるで、周波数毎の位相特性が異なっているアンプやスピーカーのようである。
次が「う」である。ここまでくると、同じ「う」に聞こえるのが不思議なくらいである。
元気な私 扁桃腺が腫れている私 |
見た目には、完全に別物の波形に見えてしまう。しかし、フォルマント上は「元気な私」と「扁桃腺が腫れている私」でほぼ同じ(F1-F2空間における私の「アイウエオ」を参照)であることを考えると、
- 各周波数の位相がずれている
- 高周波が重畳されている
次の「え」も「う」と同じ傾向である。フォルマント上は同じというのが、目で見る限りはよくわからない。いや、もしかしたら見慣れたらわかるようになるのかもしれないが、今の私の心の目ではよくわからないのである。
元気な私 扁桃腺が腫れている私 元気な私 |
最後の、「お」はもう何が何だかわからない。しいて言うならば、元気な私の「お」は高周波が極めて多いが、扁桃腺が腫れている私の「お」は高周波はあまりない。きっと、扁桃腺が腫れている私のノドの応答特性が低下しているせいだろう。しかし、これまでのスパイクノイズが増えている事実とどう繋がるかは、難しいところである。うーん、違うかもしれない…
元気な私 扁桃腺が腫れている私 |
ここまでは音声波形を見てきたが、最後に周波数空間での違いを示してみる。元気な私のアイウエオに比べて、扁桃腺が腫れている私のアイウエオは割に高周波が増えていることがわかる。やはり、先の「お」の考察は違っているのかもしれない。
扁桃腺が腫れている私の声の周波数が高い辺りにいくつも見えるピークは私の「のどの痛みの証し」である。あ”ー、しんどい。いや、ホントにしんどいのである。
さて、私は鈴が鳴るような綺麗な声がとても好きなのである。いつか、そういう声の秘密について調べてみたい、と思うのであった。また、色々な歌手の声のスペクトログラムについても調べてみたい、と思う。