SA プログラムマニュアル
| Japanese | English |

 SA機能説明  操作マニュアル  リファレンスマニュアル  補足説明

1. インパルス応答の解析方法(神戸大学安藤研究室における音響測定)

2. 音声明瞭度指標(Speech Transmission Index: STI)の算出

3. 室内音響指標(ISO3382)の算出


インパルス応答の解析方法(神戸大学安藤研究室における音響測定)

ダミーヘッド(擬似頭)または実頭に取り付けたマイクロフォンにより測定された 両耳インパルス応答から音響パラメータ(物理指標)を算出する。 コンサートホール等の音場における主観的属性(音の響き、拡がりや好ましさといった心理的な印象) に影響を及ぼすすべての音響情報は、両耳の入口に到達する音圧信号(インパルス応答と音源信号) に含まれていると考えられる。そこで、音場の特性を把握するために、インパルス応答の特徴を最も良く表し、 主観的属性に独立に作用するパラメータが研究され、安藤1)により次の4つが導き出された。

  1. LL(Listening Level [dBA]):聴取音圧レベル(またはSPL [dB])
  2. Dt1(Initial time delay gap between the direct sound and the first reflection [ms]):直接音に対する第1反射音の遅れ時間
  3. Tsub(Subsequent reverberation time [s]):後続残響時間(または単に残響時間)
  4. IACC(Inter-Aural Cross Correlation):両耳間相互相関度

以下に、これらのパラメータの算出方法を述べる。


1. LL

聴取音圧レベル(LL)は、基準点で測定した音圧レベルに対する、 各受音点での相対的な音圧レベルを表す。1/1オクターブで中心周波数125Hzから4kHzの6帯域、 およびオールパス(全帯域のインパルス応答にA特性フィルタを掛けたもの)の値を求める。 測定値は左右の値の幾何平均とする。

上の式でhl,rは受音点における左右のインパルス応答を表す。 積分する範囲はインパルス応答の全区間とする。また、hrefは基準点における インパルス応答を表す。基準点では、積分区間は直接音の継続時間のみとする。 ほとんどの場合、最も早い反射音はステージの床から来るので、 積分区間は直接音の開始から4ms以内とすればよい。

※基準点はステージ上の音源から1mの距離とし、モノラルで測定した値を用いる。

 


2. Dt1

直接音以降、床または座席列上からの反射音を除き最初に到来する反射音を初期反射音とし、 その直接音からの遅れ時間をDt1と定義する。 初期反射音は、室の寸法を考慮してインパルス応答から直接読み取るが、 自動的に算出する方法としてはインパルス応答の最大振幅値を初期反射音とすればよい。 これは、実験室での心理実験により初期反射音の最適値は最も振幅の大きな反射音に 依存する2)ことがわかっているためである。 Dt1は各座席においてオールパスのデータのみ算出する。


3. Tsub

後続残響時間(Tsub)は、減衰曲線(2乗したインパルス応答を時間反転して積分した曲線、 Schroeder積分3)とも呼ばれる)において、直接音到来後、第1反射音から60dB減衰するまでの 時間で定義される。具体的には、残響曲線を対数表示した後、第1反射音以降60dB減衰するまでの時間を算出する。 しかし、通常は残響曲線が直線的に60dB減衰することはないので、初期部分のみを直線回帰して、 この直線が60dB減衰する時間を算出する。この区間は結果に添付しなければならない。 得られる残響時間はISOで規格化されているT30等とほぼ等しい値となる。各座席の残響時間は、 左右の結果の算術平均とする。1/1オクターブで中心周波数125Hzから4kHz(6帯域)、およびオールパス(A特性)を求める。


4. IACC

IACCの算出に関しては、以下の2通りの測定を行うことを推奨する。

(1)音場の音響特性を検査するために、各オクターブバンドの測定を行う。 IACCは直接音とすべての反射音及び残響音を含む積分区間(0-t)の範囲で計算される 相互相関関数の±1ms以内の最大値として定義される。

(2)実際にホールで演奏される音楽の拡がり感を評価するために、 ステージ上の音源から音楽あるいはスピーチ信号を再生して両耳間相互相関測定(IACCと、 以下に説明するtIACC、WIACCを含む) を行うことを推奨する。実際には、ホール内の座席で録音したステレオ信号にA特性フィルタを掛けた後、 相互相関関数からこれらの値を算出する。または、測定された両耳インパルス応答をドライソース (無響室で録音された音源)に畳み込んだ信号を解析しても良い。


その他のパラメータ

以下に述べるパラメータは安藤による独立ファクターではないが、主観的プリファレンスの算出や音場の空間的印象に大きく関わるものなので、上述のパラメータと同様解析に含められる。いずれもインパルス応答から算出される。

5. A-value(total Amplitude of reflections):反射音の総合振幅

直接音に対する反射音の総合振幅をA値と呼び、以下のように定義する。

ここでh(t)はインパルス応答の振幅を表す。また、eは直接音の持続時間を表し、通常は3-5ms程度となる(現在、SAではe=Dtとして計算)。A値は音の明瞭性や響きに深く関わるパラメータである。同じホール内では残響時間はほぼ一定となることが知られているが、前の座席と後ろの座席では反射音の比率が違うため、非常に異なる音場となる。例えばステージに近い座席では反射音に比べて直接音の比率が高くなり、A値は小さな値をとる。この場合は非常に明瞭な音が聞こえる。ステージから離れるにつれて反射音の比率が大きくなり、次第に響きを多く含んだ音が聞こえるようになる。

また、A値は最適なDt(初期反射音の遅れ時間)と深く関わっている。A値が大きく(つまり反射音の振幅が大きく)なるほど、最適なDtは短くなる。また、反射音の振幅が大きい時は、その遅れ時間の違いに対して人は敏感になるが、振幅が小さい時はその遅れ時間が少々変化しても気付かないため、Dtの最適なDtの範囲が大きくなる。

6. WIACC(両耳間相互相関関数の幅)

WIACCは見かけの音源の幅(Apparent Source Width)に関連するパラメータで、下の図に示すようにIACCからd(通常はIACCの閾値である0.1が計算に使用される)下がった所のピークの幅(単位は[ms])として定義される。信号に含まれる周波数成分によって値が異なり、低周波数ほど大きな値となる。

※両耳間相関関数から計算されるパラメータ、IACC、τIACC、WIACC

7. tIACC(両耳間時間差)

上の図で、相互相関関数のピークまでの遅れ時間として定義される。聴者が音源の方向を向いている時はtIACC=0となる。音源が右側に定位する時はIACC>0、左側に定位する時はIACC<0となる。

 


参考文献

  1. 安藤四一(1987)、コンサートホール音響学、シュプリンガー・フェアラーク東京
  2. Ando, Y., and Gottlob, D. (1979). Effects of early multiple reflections on subjective preference judgments of music sound fields, J. Acoust. Soc. Am., 65, 524-527.
  3. Schroeder, M.R. (1965). New Method of Measuring Reverberation Time, J.Acoust. Soc. Am., 37, 409-412.

音声明瞭度指標(Speech Transmission Index: STI)の算出

音声明瞭度の指標であるSTI(Speech Transmission Index)とその簡略版であるRASTI(Rapid Speech Transmission Index)は、信号の時間領域での歪みを表すMTF(Modulation Transfer Function:変調伝達関数)に基づいて計算される。STIはSteeneken & Houtgast (1980)、RASTIはHoutgast & Steeneken (1984)で提案され、その後若干の改良を経てIECによって規格化されている(IEC 60268-16)。


(1)MTFの測定方法

MTFは、帯域ノイズに正弦波変調を加えた試験信号を用いて測定されてきた。下の図で、m(F)は変調周波数Fに対する入力と出力の変調度(正弦波の振幅)の比を表す。mが小さいほど雑音や残響の影響で信号が歪んでいる(すなわち音声明瞭度が悪くなる)ことを示す。

その後、Schroeder (1981)によって、次式のようにインパルス応答のフーリエ変換としてMTFが直接計算できることが示され、現在はこの方法が主流となっている。

上の式で、h(t)は室内のインパルス応答を表す。分子は自乗インパルス応答のフーリエ変換、分母はインパルス応答の全パワーである。以降の計算のため、m(F)は、オクターブバンドフィルタを通したインパルス応答に対して計算される。


(2)STIの計算方法

STIの計算には、125、250、500、1k、2k、4k、8kHzの7帯域のMTFを使用する。計算されたm(F)から、音声のエンベロープに対応する変調周波数の値を求める。具体的には、0.63から12.5Hzまでを1/3オクターブに分割した14の周波数(0.63、0.8、1.0、1.25、1.6、2.0、2.5、3.15、4.0、5.0、6.3、8.0、10.0、12.5Hz)における値を求める。SAでは各帯域のMTFが下図のように表示される。

こうして求められたmk,f(k:オクターブバンド、f:変調周波数)からSTIを計算する手順を以下に示す。

1)mk,fをS/N比(SNRk,f)に変換

2)SNRk,fを正規化してTIk,f(Transmission Index)に変換

この変換で、-15から+15の範囲にあるSNRは0から1のTIに変換される。SNRが-15dB以下は0、+15以上は1とする。

3)各オクターブバンド内でTIk,fを平均してMTIk(Modulation Transfer Index)を求める。

4)MTIkを重み付き平均してSTIを算出

ここでWkは各バンドの重み係数。Steeneken&Houtgast(1980)では実験結果から次の値が採用されている。W1―W7:0.129、0.143、0.114、0.114、0.186、0.171、0.143。W1からW7の合計は1となる。さらに、IEC60268-16ではrevised STI(STIr)として男声(males)と女声(females)で異なる重み係数が定義されている。以上の計算によって、STI、STI_male、STI_femaleが算出される。


(3)RASTIの計算

RASTIについては500、2kHzの2帯域のMTFを使用する。変調周波数は、500Hzに対して1.0、2.0、4.0、8.0Hzの4つ、2kHzに対して0.7、1.4、2.8、5.6、11.2Hzの5つを使用する。計算手順1)から2)まではSTIと同様に計算すると、各バンド、変調周波数に対して合計9個のTIが求められる。これらを重み付けせずに平均した値がRASTIとなる。


参考文献

1)Steeneken, H.J.M. and Houtgast, T. (1980). A physical method for measuring speech-transmission quality, Journal of the Acoustical Society of America, 67, 318-326.

2)Houtgast, T. and Steeneken, H.J.M. (1984). A multi-language evaluation of the RASTI-Method for estimating speech intelligibility in auditoria, Acustica, 54, 185-199.

3)Schroeder, M.R. (1981). Modulation transfer functions: definition and measurement, Acustica, 49, 179-182.

4)IEC 60268-16 Third edition (2003-05). Sound system equipment- Part 16: Objective rating of speech intelligibility by speech transmission index.


室内音響指標(ISO3382)の算出

SAでは、安藤の主観的プリファレンス理論に基づくパラメータ(下記の画像中の表示パラメータ1)に加えてISO3382に基づくパラメータ(表示パラメータ2)が計算できる(DSSF3バージョン5.0.4.0以降)。

室内音響パラメータ計算の規格書(ISO3382: 1997)によると、音場の心理評価に関連する各種の音響パラメータは次の4つのグループに分けられる。1)音圧レベル(Strength:G)、2)残響時間、3)初期反射音と後続残響音のバランス(C値、 D値、Center time)、4)両耳パラメータ(IACC、Lateral Fraction)。これらはすべて測定されたインパルス応答から直接算出される。


1)音圧レベル(Strength:G [dB])

分子は受音点で測定された音圧レベル、分母は同じ音源を使用して無響室内で10m離れた地点で測定された音圧レベル(基準音圧)。従来SA(Sound Analyzer)で使用されてきたSPLとの違いは、基準となる音圧レベルの取り方だけである。


2)残響時間(T x[s]、EDT [s])

図1 残響曲線の回帰の例(T20)

残響時間は残響曲線が60dB減衰する時間として定義できるが、通常は初期部分を回帰した直線が60dB減衰するまでの時間を求める。回帰する区間によってT20(-5dB~-25dB)、T30(-5dB~-35dB)等と呼ばれる。残響曲線がきれいに減衰しない場合などは、回帰レベルによって結果が異なることがあるので、測定結果を示す時には20、30などの値も合わせて表示するのが一般的。例えばT20を計算する時は、図1に示すように最大レベルから5dBと25dBの区間を直線回帰する。この直線が60dB減衰するのに要する時間をT20とする。T30も同様に残響曲線の最大レベルから5dBと35dBの区間を回帰して求める。(SAではT20、T30に加えて回帰の範囲を指定できるT_customが算出される。) 

残響時間の中でも特に初期減衰を重視したパラメータがEDT(Early Decay Time)である。残響時間の最初の10dBを回帰して得られた直線が60dB減衰するのに要する時間をEDTとする。Jordan (1981)によれば、心理的な残響感は初期の減衰傾斜で決まるといわれている。そのためEDTはTとは別に評価するのが一般的である。

[補足] 従来SAで使用しているTsub(後続残響時間)は、第1反射音(Dt1)から60dB減衰するまでの時間として定義される。しかし、第1反射音が明確に定まらない拡散音場(オペラハウスなど)の場合、Dt1の取り方次第で残響時間も変化する可能性があるため、T20やT30を採用した方が良いと考えられる。


3)初期反射音と後続残響音のバランス(C値 [dB], D値 [%], Center time [s])

C値(Clarity)、D値(Definition)は、これまでもSAで使用されてきたA値(反射音の総合振幅)と同様に直接音と反射音のバランスを表す指標であり、明瞭性や残響感との関連が深いことからホールや教室の音響性能測定に一般的に使用される。A値は直接音に対する反射音の振幅比を表し次式で定義される。

ここでh(t)はインパルス応答波形、eは直接音の持続時間を表す。現行のプログラムではeDt1であるが、Dt1が決定しにくい場合はe=3-5ms以内とすれば直接音をカバーできる。

C値(Clarity [dB])は初期と後期のエネルギー比を表し、次式で定義される。以下、p(t)はインパルス応答波形を表す。A値が大きくなるとC値は小さくなるという関係にある。

ここでtは初期反射音と後続残響音の境界を示す時間である。音楽の明瞭性を評価する時はt=80ms、スピーチの明瞭性を評価する時にはt=50msとして計算され、それぞれC80、C50と表示される。一般的にはC80がClarityと呼ばれる。(残響時間の場合と同じくC80、C50をデフォルトとして、さらにtをマニュアルで指定できる。)

D値(Definition or Deutlichkeit [%])は全体のエネルギーに対する初期のエネルギー比を表し、次式で定義される。特にD50がスピーチの明瞭性評価に使用される。

C値とD値は互いに関連しており、次式で変換できる。そのため通常はどちらか一方だけを測定すればよいとされている。

Centre time (Ts: [s]) は自乗インパルス応答の時間重心を表し、次式で計算される。Tsが高い値を示す時は後続残響音が多いことを示し、明瞭度が低くなり残響感が増す。また残響時間との相関も高い。


4))両耳パラメータ(IACC、Lateral Fraction)

これまでIACCはインパルス応答全体を積分した相互相関関数から求めてきたが、積分時間を初期と後期に分けて計算する方法が取り入れられている(Hidaka, 1995)。次式のように積分時間を指定する以外は通常のIACCと同じ計算である。

IACCE(t1=0、t2=80ms)は初期反射音の影響を重視したIACCで、ASW(見かけの音源の幅)に良く対応するといわれている。
IACCL(t1=80ms、t2=750ms)は後続残響音の影響を重視したIACCで、ホール内の音の拡がり(又は音に包まれた感じ、Listener Envelopment: LEV)に良く対応するといわれている。さらに、オクターブごとに求めたIACCE,LのうちASWやLEVに与える影響が大きいとされる500Hz、1kHz、2kHzの平均値を取ったものをIACCE3、IACCL3とすることがHidaka(1995)によって提案されている。

以上のように、測定されたインパルス応答から、音場の心理評価に関連する音響パラメータが算出される。ただし、これらの指標はあくまで限られた実験条件で求められたものであり、一般性を持つものかどうかは今のところ不明である。ISO3372においても規格ではなく参考として付属書への記載となっている。また、幾つかのパラメータは互いに高い相関を持っており、心理評価に独立に作用するものではない。


参考文献

ISO 3382. Acoustics- Measurement of the reverberation time of rooms with reference to other acoustical parameters. International Organization for Standardization, 1997. 

Jordan VL. A group of objective acoustical criteria for concert halls. Applied Acoustics, 14, 1981. 

Hidaka, T., Beranek, L.L., & Okano, T. Interaural cross-correlation, lateral fraction, and low- and high-frequency sound levels as measures of acoustical quality in concert halls, Journal of the Acoustical Society of America, 98, 988-1007, 1995.