JP2007233264A

JP2007233264A - 音声品質客観評価装置および音声品質客観評価方法

Info

Publication number: JP2007233264A
Application number: JP2006058009A
Authority: JP
Inventors: Rei Takahashi; 玲高橋; Atsuko Kurashima; 敦子倉島
Original assignee: Nippon Telegraph and Telephone Corp
Current assignee: Nippon Telegraph and Telephone Corp
Priority date: 2006-03-03
Filing date: 2006-03-03
Publication date: 2007-09-13

Abstract

【課題】背景騒音が重畳した場合の音声品質を精度よく推定する。
【解決手段】音声品質客観評価装置２は、コーデック種別毎に符号化歪量Ｉｅ及びパケット損失耐性Ｂｐｌを保持するパラメータＤＢ２００と、コーデック種別情報に基づいてパラメータＤＢ２００を参照することにより、符号化歪量Ｉｅ及びパケット損失耐性Ｂｐｌを決定するパラメータ決定部２０１と、想定する背景騒音の特性毎に補正値を保持する補正値ＤＢ２０２と、騒音情報に基づいて補正値ＤＢ２０２を参照することにより、補正値を決定して符号化歪量Ｉｅ及びパケット損失耐性Ｂｐｌを補正するパラメータ補正部２０３と、補正された符号化歪量Ｉｅ及びパケット損失耐性Ｂｐｌから音質劣化量Ｉｅ−ｅｆｆを算出する音質劣化量算出部２０４とからなる。
【選択図】図１

Description

本発明は、人間が音声を聴いてその品質を評価する主観評価試験を行うことなく、音声通信の品質パラメータから音声信号の主観品質を推定する音声品質客観評価装置および音声品質客観評価方法に関するものである。

音声符号化やパケット損失に起因する音質劣化を対象とした従来の音声品質客観評価技術では、送話側背景雑音は品質に影響がない程度に十分小さいことを想定して評価している。このような音声品質客観評価技術による品質評価値の一例として、非特許文献１で規定される音質劣化量Ｉｅ−ｅｆｆがある。音質劣化量Ｉｅ−ｅｆｆは、音声符号化による歪とパケット損失による音声欠落歪を以下の式（１）で定量化する。

ここで、Ｉｅは符号化歪量、Ｂｐｌはパケット損失耐性を表し、符号化方式毎に予め決められている。例えば非特許文献２には、標準的な符号化方式に対応した符号化歪量Ｉｅとパケット損失耐性Ｂｐｌが掲載されている。ＢｕｒｓｔＲはパケット損失の発生パタンのバースト性を表す指標であり、Ｐｐｌはパケット損失率（％）である。このようにして定義されたＩｅ−ｅｆｆは、主観品質であるＭＯＳ（Mean Opinion Score：平均オピニオン評点）値と相関があることが知られている。

従来の音声品質客観評価装置の構成を図７に示す。従来の音声品質客観評価装置１は、コーデック種別（例えばＩＴＵ−Ｔ勧告Ｇ．７１１６４ｋｂ／ｓＰＣＭ方式など）に応じて予め用意された特徴量である符号化歪量Ｉｅとパケット損失耐性Ｂｐｌとを保持するパラメータデータベース（以下、パラメータＤＢとする）１００と、外部から入力されたコーデック種別情報に基づいてパラメータＤＢ１００を参照することにより、符号化歪量Ｉｅとパケット損失耐性Ｂｐｌとを決定するパラメータ決定部１０１と、外部から入力されたパケット損失率Ｐｐｌとパラメータ決定部１０１が決定した符号化歪量Ｉｅとパケット損失耐性Ｂｐｌとを式（１）に代入することにより音質劣化量Ｉｅ−ｅｆｆを算出する音質劣化量算出部１０２とからなる。この音声品質客観評価装置１で用いられる符号化歪量Ｉｅやパケット損失耐性Ｂｐｌは、基本的に背景騒音が含まれない純粋な音声信号を対象とした品質評価実験に基づいて決定される（例えば非特許文献３、非特許文献４参照）。

「The E-model，a computational model for use in transmission planning」，ITU-T Recommendation G.107，2003 「Provisional planning values for the equipment impairment factor Ie and packet-loss robustness factor Bpl」，ITU-T Recommendation G.113 Appendix I，2002 「Methodology for derivation of equipment impairment factors from subjective listening-only tests」，ITU-T Recommendation P.833，2001 「Methodology for the derivation of equipment impairment factors from Instrumental Models」，ITU-T Recommendation P.834，2002

一般に、音声符号化方式は音声信号の符号化に最適化されているため、例えば携帯電話アプリケーションなどに適用された場合、音声の背景に重畳される背景騒音の存在によって符号化品質は低下する。したがって、図７に示した従来の音声品質客観評価装置１で求められた音質劣化量Ｉｅ−ｅｆｆをもって推定された音声品質は、背景騒音が存在する場合の実際の主観品質と乖離してしまうという問題点があった。

本発明の目的は、背景騒音が重畳した場合の音声品質を精度よく推定することができる音声品質客観評価装置および音声品質客観評価方法を提供することにある。

本発明は、音声信号の主観品質を音声通信の品質パラメータから推定する音声品質客観評価装置において、前記音声信号の音声符号化方式に応じた品質パラメータである符号化品質とパケット損失耐性とを決定するパラメータ決定手段と、背景騒音の特性毎に前記符号化品質及び前記パケット損失耐性の補正値を記憶する補正値記憶手段と、前記音声信号の背景騒音の特性を示す騒音情報に対応する補正値を前記補正値記憶手段から取得して、前記パラメータ決定手段が決定した前記符号化品質と前記パケット損失耐性のうち少なくとも一方を前記取得した補正値により補正するパラメータ補正手段と、このパラメータ補正手段で少なくとも一方が補正された前記符号化品質と前記パケット損失耐性とから音質劣化量を算出する音質劣化量算出手段とを備えるものである。
また、本発明の音声品質客観評価装置の１構成例は、さらに、音声符号化方式毎に前記符号化品質と前記パケット損失耐性とを記憶するパラメータ記憶手段を備え、前記パラメータ決定手段は、前記音声信号の音声符号化方式に対応する前記符号化品質と前記パケット損失耐性とを前記パラメータ記憶手段から取得するものである。
また、本発明の音声品質客観評価装置の１構成例は、前記背景騒音の特性として、騒音種別と騒音量、あるいは騒音種別と音声対雑音比を用いるものである。
また、本発明の音声品質客観評価装置の１構成例において、前記補正値記憶手段は、音声符号化方式毎に前記補正値を記憶し、前記パラメータ補正手段は、前記騒音情報及び前記音声信号の音声符号化方式に対応する補正値を前記補正値記憶手段から取得するものである。
また、本発明の音声品質客観評価装置の１構成例は、さらに、背景騒音の特性毎に前記音声信号の主観品質に与える騒音影響量を記憶する騒音影響記憶手段と、前記騒音情報に対応する騒音影響量を前記騒音影響記憶手段から取得する騒音影響決定手段と、この騒音影響決定手段が導出した騒音影響量と前記音質劣化量算出手段が算出した音質劣化量とから主観品質劣化量を算出する劣化量統合手段とを備えるものである。

また、本発明の音声品質客観評価方法は、前記音声信号の音声符号化方式に応じた品質パラメータである符号化品質とパケット損失耐性とを決定するパラメータ決定手順と、前記音声信号の背景騒音の特性に応じて前記符号化品質と前記パケット損失耐性のうち少なくとも一方を補正するパラメータ補正手順と、このパラメータ補正手順で少なくとも一方が補正された前記符号化品質と前記パケット損失耐性とから音質劣化量を算出する音質劣化量算出手順とを備えるものである。

本発明によれば、想定する背景騒音の特性毎に符号化品質及びパケット損失耐性の補正値を補正値記憶手段に記憶しておき、騒音情報に対応する補正値を補正値記憶手段から取得して、符号化品質とパケット損失耐性のうち少なくとも一方を補正値により補正することにより、従来考慮していなかった、背景騒音が符号化歪やパケット損失歪に与える影響を加味した音声品質客観評価ができるようになり、品質推定精度の向上をもたらすことができる。本発明では、想定する背景騒音の特性に対応した符号化品質及びパケット損失耐性の補正値を予め求めておくため、この補正値の妥当性が維持される限り、従来技術より精度の高い品質推定を行うことができる。

また、本発明では、音声符号化方式毎に補正値を記憶しておくことにより、背景騒音の特性だけでなく、音声符号化方式に対応した補正値で符号化品質とパケット損失耐性のうち少なくとも一方を補正することができる。

また、本発明では、背景騒音の特性毎に音声信号の主観品質に与える騒音影響量を騒音影響記憶手段に記憶しておき、騒音情報に対応する騒音影響量を騒音影響記憶手段から取得して、騒音影響量と音質劣化量とから主観品質劣化量を算出するようにしたので、背景騒音が加わることによる品質劣化を加味した主観品質を推定することができる。

［第１の実施の形態］
以下、本発明の実施の形態について図面を参照して説明する。図１は本発明の第１の実施の形態に係る音声品質客観評価装置の構成を示すブロック図である。
音声品質客観評価装置２は、音声符号化方式に関する情報であるコーデック種別情報に応じて予め用意された特徴量である符号化歪量（符号化品質）Ｉｅ及びパケット損失耐性Ｂｐｌを保持するパラメータＤＢ２００と、外部から入力されたコーデック種別情報に基づいてパラメータＤＢ２００を参照することにより、当該音声符号化方式の符号化歪量Ｉｅ及びパケット損失耐性Ｂｐｌを決定するパラメータ決定部２０１と、想定する騒音の種別と騒音量に応じて予め用意された補正値を保持する補正値データベース（以下、補正値ＤＢとする）２０２と、騒音の種別と騒音量とを示す騒音情報に基づいて補正値ＤＢ２０２を参照することにより、補正値を決定して符号化歪量Ｉｅ及びパケット損失耐性Ｂｐｌを補正するパラメータ補正部２０３と、外部から入力されたパケット損失率Ｐｐｌとパラメータ補正部２０３が補正した符号化歪量Ｉｅ及びパケット損失耐性Ｂｐｌとを式（１）に代入することにより音質劣化量Ｉｅ−ｅｆｆを算出する音質劣化量算出部２０４とからなる。

まず、パラメータ記憶手段となるパラメータＤＢ２００の構成について説明する。図２はパラメータＤＢ２００の構成例を示す図である。図２に示すとおり、パラメータＤＢ２００は、コーデック種別（例えばＩＴＵ−Ｔ勧告Ｇ．７１１６４ｋｂ／ｓＰＣＭ方式など）毎に、符号化歪量Ｉｅ及びパケット損失耐性Ｂｐｌを保持している。上記の非特許文献２に記載されている符号化歪量Ｉｅ及びパケット損失耐性Ｂｐｌの例を表１に示す。

次に、補正値記憶手段となる補正値ＤＢ２０２の構成について説明する。図３は補正値ＤＢ２０２の構成例を示す図である。図３に示すとおり、補正値ＤＢ２０２は、騒音種別毎及び騒音量毎に、符号化歪量Ｉｅの補正値ΔＩｅとパケット損失耐性Ｂｐｌの補正値ΔＢｐｌとを保持している。本実施の形態では、騒音種別としてオフィス騒音と駅構内騒音とがあり、騒音量が３０ｄＢ（Ａ）〜６０ｄＢ（Ａ）の範囲で存在することを想定している。図３に示した各々の騒音条件（騒音種別と騒音量）の下で上記の非特許文献３あるいは非特許文献４に基づいて符号化歪量Ｉｅを求め、騒音のない条件で求めた符号化歪量Ｉｅとの差分を補正値ΔＩｅとして補正値ＤＢ２０２に登録する。同様に、各々の騒音条件下でパケット損失耐性Ｂｐｌを求め、騒音のない条件で求めたパケット損失耐性Ｂｐｌとの差分を補正値ΔＢｐｌとして補正値ＤＢ２０２に登録する。

図４は非特許文献３に則って音質劣化量を定量化して補正値ΔＩｅ，ΔＢｐｌを導出する手順を示すフローチャートである。
補正値ΔＩｅ，ΔＢｐｌを導出する手順として、まず図３に示した各騒音条件の下で主観品質評価実験を行う（ステップＳ１０１）。主観品質評価実験では、被験者が音声信号サンプルを聞いて５段階評価した値であるＭＯＳ値を求める。このとき、主観品質評価実験は、非特許文献３において定められたレファレンス条件と、音質劣化量Ｉｅ−ｅｆｆを求めたい符号化条件の下で行われる。符号化条件としては、パケット損失率が異なる複数の符号化条件があり、パケット損失率としては、０％と０％以外の複数の値がある。これらの符号化条件の各々について主観品質評価実験を行う。

続いて、評価対象条件（騒音条件、レファレンス条件、及び符号化条件）毎に主観品質評価実験で求めた各ＭＯＳ値を、上記の非特許文献１のAnnex Bで規定される変換式によりそれぞれＲ値に変換する（ステップＳ１０２）。
そして、レファレンス条件に含まれるＩＴＵ−Ｔ勧告Ｇ．７１１符号化音声に対するＲ値を基準値とし、この基準値とステップＳ１０２で求めた各Ｒ値との差分を評価対象条件毎に求める（ステップＳ１０３）。本実施の形態では、この差分を実験Ｉｅ−ｅｆｆ値と呼ぶ。

さらに、レファレンス条件に対する基準主観品質評価実験によって予め求めた音質劣化量Ｉｅ−ｅｆｆと同レファレンス条件に対する実験Ｉｅ−ｅｆｆ値との線形回帰式を求める。基準主観品質評価実験とは、非特許文献３に記載された主観品質評価データを得るために行われた主観品質評価実験のことである。導出した線形回帰式は、当該主観品質評価実験の結果と基準主観品質評価実験の結果との間のバイアス成分を表現していると考えられる。そこで、実験Ｉｅ−ｅｆｆ値を線形回帰式によって変換したものを最終的な音質劣化量Ｉｅ−ｅｆｆとする（ステップＳ１０４）。このような変換を評価対象条件毎に行い、音質劣化量Ｉｅ−ｅｆｆを評価対象条件毎に求める。

パケット損失率０％の条件に対してステップＳ１０４で求めた音質劣化量Ｉｅ−ｅｆｆは、式（１）から明らかなように符号化歪量Ｉｅそのものに対応するため、パケット損失率０％の条件に対する音質劣化量Ｉｅ−ｅｆｆから符号化歪量Ｉｅを導出する（ステップＳ１０５）。このような符号化歪量Ｉｅの導出を騒音条件毎に行う。

一方、式（１）をパケット損失耐性Ｂｐｌについて解いた式に、ステップＳ１０４で求めた音質劣化量Ｉｅ−ｅｆｆと、符号化条件としたパケット損失率と、ステップＳ１０５で求めた符号化歪量Ｉｅとを代入することにより、パケット損失耐性Ｂｐｌを導出する（ステップＳ１０６）。このようなパケット損失耐性Ｂｐｌの導出を騒音条件毎に行う。なお、主観品質評価実験は０％を含む複数のパケット損失率の各々に対して行われているので、パケット損失耐性Ｂｐｌもパケット損失率の条件毎に求まる。そこで、同じ騒音条件でパケット損失率の条件が異なる複数のパケット損失耐性Ｂｐｌの平均値を真のパケット損失耐性Ｂｐｌとする。以上のようにして、騒音条件毎に符号化歪量Ｉｅ及びパケット損失耐性Ｂｐｌを求めることができる。

最後に、ステップＳ１０５で求めた符号化歪量Ｉｅと表１に記載されている騒音のない条件に対する符号化歪量Ｉｅとの差分を補正値ΔＩｅとして求め（ステップＳ１０７）、同様にステップＳ１０６で求めたパケット損失耐性Ｂｐｌと騒音のない条件に対するパケット損失耐性Ｂｐｌとの差分を補正値ΔＢｐｌとして求める（ステップＳ１０８）。このような補正値ΔＩｅ，ΔＢｐｌの導出を騒音条件毎に行う。

本実施の形態では、コーデック種別によらずに騒音条件のみから補正値ΔＩｅ，ΔＢｐｌを決定しているが、騒音条件に加えて、コーデック種別毎に補正値ΔＩｅ，ΔＢｐｌを決定するようにしてもよい。また、本実施の形態では、騒音量に応じて異なる補正値ΔＩｅ，ΔＢｐｌを決定しているが、騒音量によらずに騒音種別のみから補正値ΔＩｅ，ΔＢｐｌを決定することもできる。

次に、パラメータ補正部２０３の動作について説明する。一例としてコーデック種別が方式Ｂ、騒音種別が駅構内騒音、騒音量が５０ｄＢ（Ａ）である場合の動作について述べる。パラメータ決定部２０１は、図２に示したパラメータＤＢ２００から、コーデック種別に対応した符号化歪量Ｉｅの値としてα_Bを取得し、パケット損失耐性Ｂｐｌの値としてβ_Bを取得する。

パラメータ補正部２０３は、外部から入力された騒音情報に基づいて図３に示す補正値ＤＢ２０２から符号化歪量Ｉｅの補正値ΔＩｅとしてΔα_S50を取得し、パケット損失耐性Ｂｐｌの補正値ΔＢｐｌとしてΔβ_S60を取得する。そして、パラメータ補正部２０３は、パラメータ決定部２０１から入力された符号化歪量Ｉｅ、パケット損失耐性Ｂｐｌにそれぞれ補正値ΔＩｅ，ΔＢｐｌを加える。結果として、補正後の符号化歪量Ｉｅの値はα_B＋Δα_S50となり、補正後のパケット損失耐性Ｂｐｌの値はβ_B＋Δβ_S60となる。

音質劣化量算出部２０４は、外部から入力されたパケット損失率Ｐｐｌとパラメータ補正部２０３が補正した符号化歪量Ｉｅ及びパケット損失耐性Ｂｐｌとを式（１）に代入することにより音質劣化量Ｉｅ−ｅｆｆを算出する。ここで、ＢｕｒｓｔＲは例えば１とする。

以上のように、本実施の形態によれば、想定する背景騒音の特性毎に符号化歪量Ｉｅの補正値ΔＩｅとパケット損失耐性Ｂｐｌの補正値ΔＢｐｌとを補正値ＤＢ２０２に登録しておき、騒音情報に対応する補正値ΔＩｅ，ΔＢｐｌを補正値ＤＢ２０２から取得して、符号化歪量Ｉｅとパケット損失耐性Ｂｐｌを補正するようにしたので、背景騒音が符号化歪やパケット損失歪に与える影響を加味した音声品質客観評価を行うことができる。
なお、本実施の形態では、符号化歪量Ｉｅとパケット損失耐性Ｂｐｌの両方を補正しているが、どちらか片方だけを補正することも可能である。

［第２の実施の形態］
次に、本発明の第２の実施の形態について説明する。図５は本発明の第２の実施の形態に係る音声品質客観評価装置の構成を示すブロック図である。第１の実施の形態では、背景騒音が符号化劣化量及びパケット損失劣化量に与える影響を考慮した場合の音質劣化量Ｉｅ−ｅｆｆを算出する方法を説明した。本実施の形態では、背景騒音が加わること自体による主観品質の劣化を加味し、主観評価値であるＭＯＳ値に対応した主観品質劣化量を算出する方法について述べる。

図５の音声品質客観評価装置３は、パラメータＤＢ３００と、パラメータ決定部３０１と、補正値ＤＢ３０２と、パラメータ補正部３０３と、音質劣化量算出部３０４と、想定する騒音の種別と騒音量に応じて予め用意された主観品質の劣化量（騒音影響量）を保持する騒音影響データベース（以下、騒音影響ＤＢとする）３０５と、外部から入力された騒音情報に基づいて騒音影響ＤＢ３０５を参照することにより、騒音に応じた騒音影響量を決定する騒音影響決定部３０６と、騒音影響決定部３０６が導出した騒音影響量と音質劣化量算出部３０４が算出した音質劣化量Ｉｅ−ｅｆｆとを加算することにより総合的な主観品質劣化量を算出する劣化量統合部３０７とからなる。

パラメータＤＢ３００、パラメータ決定部３０１、補正値ＤＢ３０２、パラメータ補正部３０３、音質劣化量算出部３０４の構成及び動作は、それぞれ第１の実施の形態のパラメータＤＢ２００、パラメータ決定部２０１、補正値ＤＢ２０２、パラメータ補正部２０３、音質劣化量算出部２０４と同じである。本実施の形態が第１の実施の形態と異なる点は、騒音影響ＤＢ３０５と騒音影響決定部３０６と劣化量統合部３０７を備えることである。

騒音影響記憶手段となる騒音影響ＤＢ３０５の構成について説明する。図６は騒音影響ＤＢ３０５の構成例を示す図である。騒音影響ＤＢ３０５は、騒音種別毎及び騒音量毎に騒音影響量を保持している。本実施の形態では、騒音種別としてオフィス騒音と駅構内騒音とがあり、騒音量が３０ｄＢ（Ａ）〜６０ｄＢ（Ａ）の範囲で存在することを想定している。

騒音影響量を導出する手順について説明する。まず、背景騒音の加わっていない純粋な音声信号Ｓａと図６に示した騒音条件で背景騒音を加えた音声信号Ｓｂとを用意する。音声信号Ｓｂは騒音条件毎に用意することになる。続いて、これらの音声信号Ｓａ，Ｓｂを評価する主観品質評価実験を非特許文献３に示す手順で実施する。そして、音声信号Ｓａについて前記のステップＳ１０１〜Ｓ１０５の手順で求められる符号化歪量Ｉｅから、音声信号Ｓｂについて同様に求められる符号化歪量Ｉｅを差し引いた値を騒音影響量とする。このような騒音影響量の導出を図６に示した騒音条件毎に行い、騒音条件毎の騒音影響量を騒音影響ＤＢ３０５に登録する。

騒音影響決定部３０６は、外部から入力された騒音情報に対応する騒音影響量を騒音影響ＤＢ３０５から取得する。
最後に、劣化量統合部３０７は、騒音影響決定部３０６が導出した騒音影響量と音質劣化量算出部３０４が算出した音質劣化量Ｉｅ−ｅｆｆとを加算し、その加算結果を主観品質劣化量として出力する。

以上のように、本実施の形態によれば、背景騒音の特性毎に音声信号の主観品質に与える騒音影響量を騒音影響ＤＢ３０５に登録しておき、騒音情報に対応する騒音影響量を騒音影響ＤＢ３０５から取得して、騒音影響量と音質劣化量Ｉｅ−ｅｆｆとから主観品質劣化量を算出するようにしたので、背景騒音が加わることによる品質劣化を加味した主観品質を推定することができる。
なお、第１、第２の実施の形態では、騒音の特性として騒音種別と騒音量を用いたが、騒音種別と音声対雑音比（ＳＮＲ）を用いるようにしてもよい。

また、第１、第２の実施の形態の音声品質客観評価装置は、ＣＰＵ、記憶装置および外部とのインタフェースを備えたコンピュータとこれらのハードウェア資源を制御するプログラムによって実現することができる。このようなコンピュータにおいて、本発明の音声品質客観評価方法を実現させるための音声品質客観評価プログラムは、フレキシブルディスク、ＣＤ−ＲＯＭ、ＤＶＤ−ＲＯＭ、メモリカードなどの記録媒体に記録された状態で提供される。ＣＰＵは、記録媒体から読み込んだプログラムを記憶装置に書き込み、プログラムに従って第１、第２の実施の形態で説明した処理を実行する。

本発明は、音声品質の推定技術に適用することができる。

本発明の第１の実施の形態に係る音声品質客観評価装置の構成を示すブロック図である。本発明の第１の実施の形態におけるパラメータＤＢの構成例を示す図である。本発明の第１の実施の形態における補正値ＤＢの構成例を示す図である。符号化歪量及びパケット損失耐性の補正値を実験により導出する手順を示すフローチャートである。本発明の第２の実施の形態に係る音声品質客観評価装置の構成を示すブロック図である。本発明の第２の実施の形態における騒音影響ＤＢの構成例を示す図である。従来の音声品質客観評価装置の構成を示すブロック図である。

符号の説明

２，３…音声品質客観評価装置、２００，３００…パラメータＤＢ、２０１，３０１…パラメータ決定部、２０２，３０２…補正値ＤＢ、２０３，３０３…パラメータ補正部、２０４，３０４…音質劣化量算出部、３０５…騒音影響ＤＢ、３０６…騒音影響決定部、３０７…劣化量統合部。

Claims

音声信号の主観品質を音声通信の品質パラメータから推定する音声品質客観評価装置において、
前記音声信号の音声符号化方式に応じた品質パラメータである符号化品質とパケット損失耐性とを決定するパラメータ決定手段と、
背景騒音の特性毎に前記符号化品質及び前記パケット損失耐性の補正値を記憶する補正値記憶手段と、
前記音声信号の背景騒音の特性を示す騒音情報に対応する補正値を前記補正値記憶手段から取得して、前記パラメータ決定手段が決定した前記符号化品質と前記パケット損失耐性のうち少なくとも一方を前記取得した補正値により補正するパラメータ補正手段と、
このパラメータ補正手段で少なくとも一方が補正された前記符号化品質と前記パケット損失耐性とから音質劣化量を算出する音質劣化量算出手段とを備えることを特徴とする音声品質客観評価装置。
請求項１記載の音声品質客観評価装置において、
さらに、音声符号化方式毎に前記符号化品質と前記パケット損失耐性とを記憶するパラメータ記憶手段を備え、
前記パラメータ決定手段は、前記音声信号の音声符号化方式に対応する前記符号化品質と前記パケット損失耐性とを前記パラメータ記憶手段から取得することを特徴とする音声品質客観評価装置。
請求項１に記載の音声品質客観評価装置において、
前記背景騒音の特性として、騒音種別と騒音量、あるいは騒音種別と音声対雑音比を用いることを特徴とする音声品質客観評価装置。
請求項１に記載の音声品質客観評価装置において、
前記補正値記憶手段は、音声符号化方式毎に前記補正値を記憶し、
前記パラメータ補正手段は、前記騒音情報及び前記音声信号の音声符号化方式に対応する補正値を前記補正値記憶手段から取得することを特徴とする音声品質客観評価装置。
請求項１乃至４のいずれか１項に記載の音声品質客観評価装置において、
さらに、背景騒音の特性毎に前記音声信号の主観品質に与える騒音影響量を記憶する騒音影響記憶手段と、
前記騒音情報に対応する騒音影響量を前記騒音影響記憶手段から取得する騒音影響決定手段と、
この騒音影響決定手段が導出した騒音影響量と前記音質劣化量算出手段が算出した音質劣化量とから主観品質劣化量を算出する劣化量統合手段とを備えることを特徴とする音声品質客観評価装置。
音声信号の主観品質を音声通信の品質パラメータから推定する音声品質客観評価方法において、
前記音声信号の音声符号化方式に応じた品質パラメータである符号化品質とパケット損失耐性とを決定するパラメータ決定手順と、
前記音声信号の背景騒音の特性に応じて前記符号化品質と前記パケット損失耐性のうち少なくとも一方を補正するパラメータ補正手順と、
このパラメータ補正手順で少なくとも一方が補正された前記符号化品質と前記パケット損失耐性とから音質劣化量を算出する音質劣化量算出手順とを備えることを特徴とする音声品質客観評価方法。