Q and A (101)

Q:ピッチと基本周波数はどう違うのですか。
A:音声分野では,「ピッチ抽出」「ピッチ駆動ボコーダ」のように,有声音の基本周波数の別称としてピッチという用語が広く用いられています。一方,聴覚分野では,基本周波数とピッチは全く別概念です。一言で言えば,基本周波数は物理量ですが,ピッチは心理量,つまり主観的な属性なのです。
 何故両者を区別しなければならないかと言えば,要するに両者は単純に対応しないからです。もちろん,周波数を2倍にしても音の高さは2倍には感じられない,といったスケーリングの問題もありますが,それだけではありません。幾つか例を挙げてみましょう。
 例その1.「ミッシング・ファンダメンタル」という聴覚現象があります。例えば1,800Hz,2,000Hz,2,200Hzの正弦波を加算すると,ほぼ200Hzの正弦波に相当する高さが知覚されるという現象です。これは,1,800Hz,2,000Hz,2,200Hz がそれぞれ200Hzの第9倍音,第10倍音,第11倍音になっているからです。「なんだ,やはりピッチは基本周波数ではないか」と思われるかも知れません。では,加算する正弦波の周波数をそれぞれ40Hzシフトして,1,840Hz,2,040Hz,2,240Hzにするとどうなるでしょう。これらの基本周波数である40Hzに相当する高さが知覚されるでしょうか。実は,ほぼ204Hzの正弦波に相当する高さが知覚されます。
 例その2.はっきりと基本周波数が求められないような音に対しても,音の高さが知覚される場合があります。例えば,白色雑音を一定周期でオン・オフすると,長時間平均振幅スペクトルはフラットですが,オン・オフの周期に相当した高さが知覚されます。また,同一の白色雑音を左右の耳に2ms以上の時間差をつけて提示すると,時間差の逆数に相当する高さが,弱いながらも知覚されます。
 例その3.周波数以外の物理的要因も,知覚される音の高さに影響します。そのような要因には,音の継続時間,提示音圧,先行音や後続音の有無,マスキング等があります。
 他にも様々な例を挙げることができますが,「基本周波数とピッチは単純に対応しない」ということを示すには,これくらいで十分でしょう。
 さて,物理量と心理量を区別しなければならないのは,音の高さだけではありません。音の大きさの場合には,物理的な音の強さと区別して,心理量をラウドネスと呼びます。音色の場合にも,物理量であるスペクトル包絡や振幅包絡の形状等と,心理量である音色を混同してはならないのは言うまでもありません。音の空間的位置の知覚に関しても,ステレオ装置などを考えてみると明らかなように,音源の物理的位置と,知覚される音像の位置は違います。日本語では後者を特に音像定位と呼ぶことが多いようです。
 ところが,専門家の間でさえも,物理量と心理量の区別が明確になっていない属性があります。それは時間です。我々が知覚している時間は,同時性にしても,順序にしても,持続時間にしても,物理的な時間とは異なります。物理的な時間順序とは逆に知覚されるような例もごく日常的に存在します。それにもかかわらず,心理的な時間を指し示す用語がありません。このことは,時間知覚のメカニズムを議論する上で,暗黙のうちに重大な障害になっていると思われます。
 聴覚のメカニズムを分析したり,人間の振る舞いを予測したりする上では,心理量と物理量の違いを認識し,その関係を定量的に考察することが,まず基本となります。それが心理(精神)物理学という学問の役割です。恐らく,このような問題が無関係である分野も存在するでしょう。そういう分野内で議論が閉じている場合にはあまり問題ないのですが,分野をまたがる場合には,用語の違い,ひいてはその背後にある問題意識の違いが顕在化する可能性があります。学際的な研究の重要性は今後ますます高まるでしょうから,無用の混乱を避けるためにも,用語法には注意を払うべきだと考えます。

(柏野牧夫:NTTコミュニケーション科学基礎研究所)

<< Back