JP2007233264A - 音声品質客観評価装置および音声品質客観評価方法 - Google Patents
音声品質客観評価装置および音声品質客観評価方法 Download PDFInfo
- Publication number
- JP2007233264A JP2007233264A JP2006058009A JP2006058009A JP2007233264A JP 2007233264 A JP2007233264 A JP 2007233264A JP 2006058009 A JP2006058009 A JP 2006058009A JP 2006058009 A JP2006058009 A JP 2006058009A JP 2007233264 A JP2007233264 A JP 2007233264A
- Authority
- JP
- Japan
- Prior art keywords
- quality
- noise
- packet loss
- voice
- parameter
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
【課題】背景騒音が重畳した場合の音声品質を精度よく推定する。
【解決手段】音声品質客観評価装置2は、コーデック種別毎に符号化歪量Ie及びパケット損失耐性Bplを保持するパラメータDB200と、コーデック種別情報に基づいてパラメータDB200を参照することにより、符号化歪量Ie及びパケット損失耐性Bplを決定するパラメータ決定部201と、想定する背景騒音の特性毎に補正値を保持する補正値DB202と、騒音情報に基づいて補正値DB202を参照することにより、補正値を決定して符号化歪量Ie及びパケット損失耐性Bplを補正するパラメータ補正部203と、補正された符号化歪量Ie及びパケット損失耐性Bplから音質劣化量Ie−effを算出する音質劣化量算出部204とからなる。
【選択図】 図1
【解決手段】音声品質客観評価装置2は、コーデック種別毎に符号化歪量Ie及びパケット損失耐性Bplを保持するパラメータDB200と、コーデック種別情報に基づいてパラメータDB200を参照することにより、符号化歪量Ie及びパケット損失耐性Bplを決定するパラメータ決定部201と、想定する背景騒音の特性毎に補正値を保持する補正値DB202と、騒音情報に基づいて補正値DB202を参照することにより、補正値を決定して符号化歪量Ie及びパケット損失耐性Bplを補正するパラメータ補正部203と、補正された符号化歪量Ie及びパケット損失耐性Bplから音質劣化量Ie−effを算出する音質劣化量算出部204とからなる。
【選択図】 図1
Description
本発明は、人間が音声を聴いてその品質を評価する主観評価試験を行うことなく、音声通信の品質パラメータから音声信号の主観品質を推定する音声品質客観評価装置および音声品質客観評価方法に関するものである。
音声符号化やパケット損失に起因する音質劣化を対象とした従来の音声品質客観評価技術では、送話側背景雑音は品質に影響がない程度に十分小さいことを想定して評価している。このような音声品質客観評価技術による品質評価値の一例として、非特許文献1で規定される音質劣化量Ie−effがある。音質劣化量Ie−effは、音声符号化による歪とパケット損失による音声欠落歪を以下の式(1)で定量化する。
ここで、Ieは符号化歪量、Bplはパケット損失耐性を表し、符号化方式毎に予め決められている。例えば非特許文献2には、標準的な符号化方式に対応した符号化歪量Ieとパケット損失耐性Bplが掲載されている。BurstRはパケット損失の発生パタンのバースト性を表す指標であり、Pplはパケット損失率(%)である。このようにして定義されたIe−effは、主観品質であるMOS(Mean Opinion Score:平均オピニオン評点)値と相関があることが知られている。
従来の音声品質客観評価装置の構成を図7に示す。従来の音声品質客観評価装置1は、コーデック種別(例えばITU−T勧告G.711 64kb/s PCM方式など)に応じて予め用意された特徴量である符号化歪量Ieとパケット損失耐性Bplとを保持するパラメータデータベース(以下、パラメータDBとする)100と、外部から入力されたコーデック種別情報に基づいてパラメータDB100を参照することにより、符号化歪量Ieとパケット損失耐性Bplとを決定するパラメータ決定部101と、外部から入力されたパケット損失率Pplとパラメータ決定部101が決定した符号化歪量Ieとパケット損失耐性Bplとを式(1)に代入することにより音質劣化量Ie−effを算出する音質劣化量算出部102とからなる。この音声品質客観評価装置1で用いられる符号化歪量Ieやパケット損失耐性Bplは、基本的に背景騒音が含まれない純粋な音声信号を対象とした品質評価実験に基づいて決定される(例えば非特許文献3、非特許文献4参照)。
「The E-model,a computational model for use in transmission planning」,ITU-T Recommendation G.107,2003
「Provisional planning values for the equipment impairment factor Ie and packet-loss robustness factor Bpl」,ITU-T Recommendation G.113 Appendix I,2002
「Methodology for derivation of equipment impairment factors from subjective listening-only tests」,ITU-T Recommendation P.833,2001
「Methodology for the derivation of equipment impairment factors from Instrumental Models」,ITU-T Recommendation P.834,2002
一般に、音声符号化方式は音声信号の符号化に最適化されているため、例えば携帯電話アプリケーションなどに適用された場合、音声の背景に重畳される背景騒音の存在によって符号化品質は低下する。したがって、図7に示した従来の音声品質客観評価装置1で求められた音質劣化量Ie−effをもって推定された音声品質は、背景騒音が存在する場合の実際の主観品質と乖離してしまうという問題点があった。
本発明の目的は、背景騒音が重畳した場合の音声品質を精度よく推定することができる音声品質客観評価装置および音声品質客観評価方法を提供することにある。
本発明は、音声信号の主観品質を音声通信の品質パラメータから推定する音声品質客観評価装置において、前記音声信号の音声符号化方式に応じた品質パラメータである符号化品質とパケット損失耐性とを決定するパラメータ決定手段と、背景騒音の特性毎に前記符号化品質及び前記パケット損失耐性の補正値を記憶する補正値記憶手段と、前記音声信号の背景騒音の特性を示す騒音情報に対応する補正値を前記補正値記憶手段から取得して、前記パラメータ決定手段が決定した前記符号化品質と前記パケット損失耐性のうち少なくとも一方を前記取得した補正値により補正するパラメータ補正手段と、このパラメータ補正手段で少なくとも一方が補正された前記符号化品質と前記パケット損失耐性とから音質劣化量を算出する音質劣化量算出手段とを備えるものである。
また、本発明の音声品質客観評価装置の1構成例は、さらに、音声符号化方式毎に前記符号化品質と前記パケット損失耐性とを記憶するパラメータ記憶手段を備え、前記パラメータ決定手段は、前記音声信号の音声符号化方式に対応する前記符号化品質と前記パケット損失耐性とを前記パラメータ記憶手段から取得するものである。
また、本発明の音声品質客観評価装置の1構成例は、前記背景騒音の特性として、騒音種別と騒音量、あるいは騒音種別と音声対雑音比を用いるものである。
また、本発明の音声品質客観評価装置の1構成例において、前記補正値記憶手段は、音声符号化方式毎に前記補正値を記憶し、前記パラメータ補正手段は、前記騒音情報及び前記音声信号の音声符号化方式に対応する補正値を前記補正値記憶手段から取得するものである。
また、本発明の音声品質客観評価装置の1構成例は、さらに、背景騒音の特性毎に前記音声信号の主観品質に与える騒音影響量を記憶する騒音影響記憶手段と、前記騒音情報に対応する騒音影響量を前記騒音影響記憶手段から取得する騒音影響決定手段と、この騒音影響決定手段が導出した騒音影響量と前記音質劣化量算出手段が算出した音質劣化量とから主観品質劣化量を算出する劣化量統合手段とを備えるものである。
また、本発明の音声品質客観評価装置の1構成例は、さらに、音声符号化方式毎に前記符号化品質と前記パケット損失耐性とを記憶するパラメータ記憶手段を備え、前記パラメータ決定手段は、前記音声信号の音声符号化方式に対応する前記符号化品質と前記パケット損失耐性とを前記パラメータ記憶手段から取得するものである。
また、本発明の音声品質客観評価装置の1構成例は、前記背景騒音の特性として、騒音種別と騒音量、あるいは騒音種別と音声対雑音比を用いるものである。
また、本発明の音声品質客観評価装置の1構成例において、前記補正値記憶手段は、音声符号化方式毎に前記補正値を記憶し、前記パラメータ補正手段は、前記騒音情報及び前記音声信号の音声符号化方式に対応する補正値を前記補正値記憶手段から取得するものである。
また、本発明の音声品質客観評価装置の1構成例は、さらに、背景騒音の特性毎に前記音声信号の主観品質に与える騒音影響量を記憶する騒音影響記憶手段と、前記騒音情報に対応する騒音影響量を前記騒音影響記憶手段から取得する騒音影響決定手段と、この騒音影響決定手段が導出した騒音影響量と前記音質劣化量算出手段が算出した音質劣化量とから主観品質劣化量を算出する劣化量統合手段とを備えるものである。
また、本発明の音声品質客観評価方法は、前記音声信号の音声符号化方式に応じた品質パラメータである符号化品質とパケット損失耐性とを決定するパラメータ決定手順と、前記音声信号の背景騒音の特性に応じて前記符号化品質と前記パケット損失耐性のうち少なくとも一方を補正するパラメータ補正手順と、このパラメータ補正手順で少なくとも一方が補正された前記符号化品質と前記パケット損失耐性とから音質劣化量を算出する音質劣化量算出手順とを備えるものである。
本発明によれば、想定する背景騒音の特性毎に符号化品質及びパケット損失耐性の補正値を補正値記憶手段に記憶しておき、騒音情報に対応する補正値を補正値記憶手段から取得して、符号化品質とパケット損失耐性のうち少なくとも一方を補正値により補正することにより、従来考慮していなかった、背景騒音が符号化歪やパケット損失歪に与える影響を加味した音声品質客観評価ができるようになり、品質推定精度の向上をもたらすことができる。本発明では、想定する背景騒音の特性に対応した符号化品質及びパケット損失耐性の補正値を予め求めておくため、この補正値の妥当性が維持される限り、従来技術より精度の高い品質推定を行うことができる。
また、本発明では、音声符号化方式毎に補正値を記憶しておくことにより、背景騒音の特性だけでなく、音声符号化方式に対応した補正値で符号化品質とパケット損失耐性のうち少なくとも一方を補正することができる。
また、本発明では、背景騒音の特性毎に音声信号の主観品質に与える騒音影響量を騒音影響記憶手段に記憶しておき、騒音情報に対応する騒音影響量を騒音影響記憶手段から取得して、騒音影響量と音質劣化量とから主観品質劣化量を算出するようにしたので、背景騒音が加わることによる品質劣化を加味した主観品質を推定することができる。
[第1の実施の形態]
以下、本発明の実施の形態について図面を参照して説明する。図1は本発明の第1の実施の形態に係る音声品質客観評価装置の構成を示すブロック図である。
音声品質客観評価装置2は、音声符号化方式に関する情報であるコーデック種別情報に応じて予め用意された特徴量である符号化歪量(符号化品質)Ie及びパケット損失耐性Bplを保持するパラメータDB200と、外部から入力されたコーデック種別情報に基づいてパラメータDB200を参照することにより、当該音声符号化方式の符号化歪量Ie及びパケット損失耐性Bplを決定するパラメータ決定部201と、想定する騒音の種別と騒音量に応じて予め用意された補正値を保持する補正値データベース(以下、補正値DBとする)202と、騒音の種別と騒音量とを示す騒音情報に基づいて補正値DB202を参照することにより、補正値を決定して符号化歪量Ie及びパケット損失耐性Bplを補正するパラメータ補正部203と、外部から入力されたパケット損失率Pplとパラメータ補正部203が補正した符号化歪量Ie及びパケット損失耐性Bplとを式(1)に代入することにより音質劣化量Ie−effを算出する音質劣化量算出部204とからなる。
以下、本発明の実施の形態について図面を参照して説明する。図1は本発明の第1の実施の形態に係る音声品質客観評価装置の構成を示すブロック図である。
音声品質客観評価装置2は、音声符号化方式に関する情報であるコーデック種別情報に応じて予め用意された特徴量である符号化歪量(符号化品質)Ie及びパケット損失耐性Bplを保持するパラメータDB200と、外部から入力されたコーデック種別情報に基づいてパラメータDB200を参照することにより、当該音声符号化方式の符号化歪量Ie及びパケット損失耐性Bplを決定するパラメータ決定部201と、想定する騒音の種別と騒音量に応じて予め用意された補正値を保持する補正値データベース(以下、補正値DBとする)202と、騒音の種別と騒音量とを示す騒音情報に基づいて補正値DB202を参照することにより、補正値を決定して符号化歪量Ie及びパケット損失耐性Bplを補正するパラメータ補正部203と、外部から入力されたパケット損失率Pplとパラメータ補正部203が補正した符号化歪量Ie及びパケット損失耐性Bplとを式(1)に代入することにより音質劣化量Ie−effを算出する音質劣化量算出部204とからなる。
まず、パラメータ記憶手段となるパラメータDB200の構成について説明する。図2はパラメータDB200の構成例を示す図である。図2に示すとおり、パラメータDB200は、コーデック種別(例えばITU−T勧告G.711 64kb/s PCM方式など)毎に、符号化歪量Ie及びパケット損失耐性Bplを保持している。上記の非特許文献2に記載されている符号化歪量Ie及びパケット損失耐性Bplの例を表1に示す。
次に、補正値記憶手段となる補正値DB202の構成について説明する。図3は補正値DB202の構成例を示す図である。図3に示すとおり、補正値DB202は、騒音種別毎及び騒音量毎に、符号化歪量Ieの補正値ΔIeとパケット損失耐性Bplの補正値ΔBplとを保持している。本実施の形態では、騒音種別としてオフィス騒音と駅構内騒音とがあり、騒音量が30dB(A)〜60dB(A)の範囲で存在することを想定している。図3に示した各々の騒音条件(騒音種別と騒音量)の下で上記の非特許文献3あるいは非特許文献4に基づいて符号化歪量Ieを求め、騒音のない条件で求めた符号化歪量Ieとの差分を補正値ΔIeとして補正値DB202に登録する。同様に、各々の騒音条件下でパケット損失耐性Bplを求め、騒音のない条件で求めたパケット損失耐性Bplとの差分を補正値ΔBplとして補正値DB202に登録する。
図4は非特許文献3に則って音質劣化量を定量化して補正値ΔIe,ΔBplを導出する手順を示すフローチャートである。
補正値ΔIe,ΔBplを導出する手順として、まず図3に示した各騒音条件の下で主観品質評価実験を行う(ステップS101)。主観品質評価実験では、被験者が音声信号サンプルを聞いて5段階評価した値であるMOS値を求める。このとき、主観品質評価実験は、非特許文献3において定められたレファレンス条件と、音質劣化量Ie−effを求めたい符号化条件の下で行われる。符号化条件としては、パケット損失率が異なる複数の符号化条件があり、パケット損失率としては、0%と0%以外の複数の値がある。これらの符号化条件の各々について主観品質評価実験を行う。
補正値ΔIe,ΔBplを導出する手順として、まず図3に示した各騒音条件の下で主観品質評価実験を行う(ステップS101)。主観品質評価実験では、被験者が音声信号サンプルを聞いて5段階評価した値であるMOS値を求める。このとき、主観品質評価実験は、非特許文献3において定められたレファレンス条件と、音質劣化量Ie−effを求めたい符号化条件の下で行われる。符号化条件としては、パケット損失率が異なる複数の符号化条件があり、パケット損失率としては、0%と0%以外の複数の値がある。これらの符号化条件の各々について主観品質評価実験を行う。
続いて、評価対象条件(騒音条件、レファレンス条件、及び符号化条件)毎に主観品質評価実験で求めた各MOS値を、上記の非特許文献1のAnnex Bで規定される変換式によりそれぞれR値に変換する(ステップS102)。
そして、レファレンス条件に含まれるITU−T勧告G.711符号化音声に対するR値を基準値とし、この基準値とステップS102で求めた各R値との差分を評価対象条件毎に求める(ステップS103)。本実施の形態では、この差分を実験Ie−eff値と呼ぶ。
そして、レファレンス条件に含まれるITU−T勧告G.711符号化音声に対するR値を基準値とし、この基準値とステップS102で求めた各R値との差分を評価対象条件毎に求める(ステップS103)。本実施の形態では、この差分を実験Ie−eff値と呼ぶ。
さらに、レファレンス条件に対する基準主観品質評価実験によって予め求めた音質劣化量Ie−effと同レファレンス条件に対する実験Ie−eff値との線形回帰式を求める。基準主観品質評価実験とは、非特許文献3に記載された主観品質評価データを得るために行われた主観品質評価実験のことである。導出した線形回帰式は、当該主観品質評価実験の結果と基準主観品質評価実験の結果との間のバイアス成分を表現していると考えられる。そこで、実験Ie−eff値を線形回帰式によって変換したものを最終的な音質劣化量Ie−effとする(ステップS104)。このような変換を評価対象条件毎に行い、音質劣化量Ie−effを評価対象条件毎に求める。
パケット損失率0%の条件に対してステップS104で求めた音質劣化量Ie−effは、式(1)から明らかなように符号化歪量Ieそのものに対応するため、パケット損失率0%の条件に対する音質劣化量Ie−effから符号化歪量Ieを導出する(ステップS105)。このような符号化歪量Ieの導出を騒音条件毎に行う。
一方、式(1)をパケット損失耐性Bplについて解いた式に、ステップS104で求めた音質劣化量Ie−effと、符号化条件としたパケット損失率と、ステップS105で求めた符号化歪量Ieとを代入することにより、パケット損失耐性Bplを導出する(ステップS106)。このようなパケット損失耐性Bplの導出を騒音条件毎に行う。なお、主観品質評価実験は0%を含む複数のパケット損失率の各々に対して行われているので、パケット損失耐性Bplもパケット損失率の条件毎に求まる。そこで、同じ騒音条件でパケット損失率の条件が異なる複数のパケット損失耐性Bplの平均値を真のパケット損失耐性Bplとする。以上のようにして、騒音条件毎に符号化歪量Ie及びパケット損失耐性Bplを求めることができる。
最後に、ステップS105で求めた符号化歪量Ieと表1に記載されている騒音のない条件に対する符号化歪量Ieとの差分を補正値ΔIeとして求め(ステップS107)、同様にステップS106で求めたパケット損失耐性Bplと騒音のない条件に対するパケット損失耐性Bplとの差分を補正値ΔBplとして求める(ステップS108)。このような補正値ΔIe,ΔBplの導出を騒音条件毎に行う。
本実施の形態では、コーデック種別によらずに騒音条件のみから補正値ΔIe,ΔBplを決定しているが、騒音条件に加えて、コーデック種別毎に補正値ΔIe,ΔBplを決定するようにしてもよい。また、本実施の形態では、騒音量に応じて異なる補正値ΔIe,ΔBplを決定しているが、騒音量によらずに騒音種別のみから補正値ΔIe,ΔBplを決定することもできる。
次に、パラメータ補正部203の動作について説明する。一例としてコーデック種別が方式B、騒音種別が駅構内騒音、騒音量が50dB(A)である場合の動作について述べる。パラメータ決定部201は、図2に示したパラメータDB200から、コーデック種別に対応した符号化歪量Ieの値としてαBを取得し、パケット損失耐性Bplの値としてβBを取得する。
パラメータ補正部203は、外部から入力された騒音情報に基づいて図3に示す補正値DB202から符号化歪量Ieの補正値ΔIeとしてΔαS50を取得し、パケット損失耐性Bplの補正値ΔBplとしてΔβS60を取得する。そして、パラメータ補正部203は、パラメータ決定部201から入力された符号化歪量Ie、パケット損失耐性Bplにそれぞれ補正値ΔIe,ΔBplを加える。結果として、補正後の符号化歪量Ieの値はαB+ΔαS50となり、補正後のパケット損失耐性Bplの値はβB+ΔβS60となる。
音質劣化量算出部204は、外部から入力されたパケット損失率Pplとパラメータ補正部203が補正した符号化歪量Ie及びパケット損失耐性Bplとを式(1)に代入することにより音質劣化量Ie−effを算出する。ここで、BurstRは例えば1とする。
以上のように、本実施の形態によれば、想定する背景騒音の特性毎に符号化歪量Ieの補正値ΔIeとパケット損失耐性Bplの補正値ΔBplとを補正値DB202に登録しておき、騒音情報に対応する補正値ΔIe,ΔBplを補正値DB202から取得して、符号化歪量Ieとパケット損失耐性Bplを補正するようにしたので、背景騒音が符号化歪やパケット損失歪に与える影響を加味した音声品質客観評価を行うことができる。
なお、本実施の形態では、符号化歪量Ieとパケット損失耐性Bplの両方を補正しているが、どちらか片方だけを補正することも可能である。
なお、本実施の形態では、符号化歪量Ieとパケット損失耐性Bplの両方を補正しているが、どちらか片方だけを補正することも可能である。
[第2の実施の形態]
次に、本発明の第2の実施の形態について説明する。図5は本発明の第2の実施の形態に係る音声品質客観評価装置の構成を示すブロック図である。第1の実施の形態では、背景騒音が符号化劣化量及びパケット損失劣化量に与える影響を考慮した場合の音質劣化量Ie−effを算出する方法を説明した。本実施の形態では、背景騒音が加わること自体による主観品質の劣化を加味し、主観評価値であるMOS値に対応した主観品質劣化量を算出する方法について述べる。
次に、本発明の第2の実施の形態について説明する。図5は本発明の第2の実施の形態に係る音声品質客観評価装置の構成を示すブロック図である。第1の実施の形態では、背景騒音が符号化劣化量及びパケット損失劣化量に与える影響を考慮した場合の音質劣化量Ie−effを算出する方法を説明した。本実施の形態では、背景騒音が加わること自体による主観品質の劣化を加味し、主観評価値であるMOS値に対応した主観品質劣化量を算出する方法について述べる。
図5の音声品質客観評価装置3は、パラメータDB300と、パラメータ決定部301と、補正値DB302と、パラメータ補正部303と、音質劣化量算出部304と、想定する騒音の種別と騒音量に応じて予め用意された主観品質の劣化量(騒音影響量)を保持する騒音影響データベース(以下、騒音影響DBとする)305と、外部から入力された騒音情報に基づいて騒音影響DB305を参照することにより、騒音に応じた騒音影響量を決定する騒音影響決定部306と、騒音影響決定部306が導出した騒音影響量と音質劣化量算出部304が算出した音質劣化量Ie−effとを加算することにより総合的な主観品質劣化量を算出する劣化量統合部307とからなる。
パラメータDB300、パラメータ決定部301、補正値DB302、パラメータ補正部303、音質劣化量算出部304の構成及び動作は、それぞれ第1の実施の形態のパラメータDB200、パラメータ決定部201、補正値DB202、パラメータ補正部203、音質劣化量算出部204と同じである。本実施の形態が第1の実施の形態と異なる点は、騒音影響DB305と騒音影響決定部306と劣化量統合部307を備えることである。
騒音影響記憶手段となる騒音影響DB305の構成について説明する。図6は騒音影響DB305の構成例を示す図である。騒音影響DB305は、騒音種別毎及び騒音量毎に騒音影響量を保持している。本実施の形態では、騒音種別としてオフィス騒音と駅構内騒音とがあり、騒音量が30dB(A)〜60dB(A)の範囲で存在することを想定している。
騒音影響量を導出する手順について説明する。まず、背景騒音の加わっていない純粋な音声信号Saと図6に示した騒音条件で背景騒音を加えた音声信号Sbとを用意する。音声信号Sbは騒音条件毎に用意することになる。続いて、これらの音声信号Sa,Sbを評価する主観品質評価実験を非特許文献3に示す手順で実施する。そして、音声信号Saについて前記のステップS101〜S105の手順で求められる符号化歪量Ieから、音声信号Sbについて同様に求められる符号化歪量Ieを差し引いた値を騒音影響量とする。このような騒音影響量の導出を図6に示した騒音条件毎に行い、騒音条件毎の騒音影響量を騒音影響DB305に登録する。
騒音影響決定部306は、外部から入力された騒音情報に対応する騒音影響量を騒音影響DB305から取得する。
最後に、劣化量統合部307は、騒音影響決定部306が導出した騒音影響量と音質劣化量算出部304が算出した音質劣化量Ie−effとを加算し、その加算結果を主観品質劣化量として出力する。
最後に、劣化量統合部307は、騒音影響決定部306が導出した騒音影響量と音質劣化量算出部304が算出した音質劣化量Ie−effとを加算し、その加算結果を主観品質劣化量として出力する。
以上のように、本実施の形態によれば、背景騒音の特性毎に音声信号の主観品質に与える騒音影響量を騒音影響DB305に登録しておき、騒音情報に対応する騒音影響量を騒音影響DB305から取得して、騒音影響量と音質劣化量Ie−effとから主観品質劣化量を算出するようにしたので、背景騒音が加わることによる品質劣化を加味した主観品質を推定することができる。
なお、第1、第2の実施の形態では、騒音の特性として騒音種別と騒音量を用いたが、騒音種別と音声対雑音比(SNR)を用いるようにしてもよい。
なお、第1、第2の実施の形態では、騒音の特性として騒音種別と騒音量を用いたが、騒音種別と音声対雑音比(SNR)を用いるようにしてもよい。
また、第1、第2の実施の形態の音声品質客観評価装置は、CPU、記憶装置および外部とのインタフェースを備えたコンピュータとこれらのハードウェア資源を制御するプログラムによって実現することができる。このようなコンピュータにおいて、本発明の音声品質客観評価方法を実現させるための音声品質客観評価プログラムは、フレキシブルディスク、CD−ROM、DVD−ROM、メモリカードなどの記録媒体に記録された状態で提供される。CPUは、記録媒体から読み込んだプログラムを記憶装置に書き込み、プログラムに従って第1、第2の実施の形態で説明した処理を実行する。
本発明は、音声品質の推定技術に適用することができる。
2,3…音声品質客観評価装置、200,300…パラメータDB、201,301…パラメータ決定部、202,302…補正値DB、203,303…パラメータ補正部、204,304…音質劣化量算出部、305…騒音影響DB、306…騒音影響決定部、307…劣化量統合部。
Claims (6)
- 音声信号の主観品質を音声通信の品質パラメータから推定する音声品質客観評価装置において、
前記音声信号の音声符号化方式に応じた品質パラメータである符号化品質とパケット損失耐性とを決定するパラメータ決定手段と、
背景騒音の特性毎に前記符号化品質及び前記パケット損失耐性の補正値を記憶する補正値記憶手段と、
前記音声信号の背景騒音の特性を示す騒音情報に対応する補正値を前記補正値記憶手段から取得して、前記パラメータ決定手段が決定した前記符号化品質と前記パケット損失耐性のうち少なくとも一方を前記取得した補正値により補正するパラメータ補正手段と、
このパラメータ補正手段で少なくとも一方が補正された前記符号化品質と前記パケット損失耐性とから音質劣化量を算出する音質劣化量算出手段とを備えることを特徴とする音声品質客観評価装置。 - 請求項1記載の音声品質客観評価装置において、
さらに、音声符号化方式毎に前記符号化品質と前記パケット損失耐性とを記憶するパラメータ記憶手段を備え、
前記パラメータ決定手段は、前記音声信号の音声符号化方式に対応する前記符号化品質と前記パケット損失耐性とを前記パラメータ記憶手段から取得することを特徴とする音声品質客観評価装置。 - 請求項1に記載の音声品質客観評価装置において、
前記背景騒音の特性として、騒音種別と騒音量、あるいは騒音種別と音声対雑音比を用いることを特徴とする音声品質客観評価装置。 - 請求項1に記載の音声品質客観評価装置において、
前記補正値記憶手段は、音声符号化方式毎に前記補正値を記憶し、
前記パラメータ補正手段は、前記騒音情報及び前記音声信号の音声符号化方式に対応する補正値を前記補正値記憶手段から取得することを特徴とする音声品質客観評価装置。 - 請求項1乃至4のいずれか1項に記載の音声品質客観評価装置において、
さらに、背景騒音の特性毎に前記音声信号の主観品質に与える騒音影響量を記憶する騒音影響記憶手段と、
前記騒音情報に対応する騒音影響量を前記騒音影響記憶手段から取得する騒音影響決定手段と、
この騒音影響決定手段が導出した騒音影響量と前記音質劣化量算出手段が算出した音質劣化量とから主観品質劣化量を算出する劣化量統合手段とを備えることを特徴とする音声品質客観評価装置。 - 音声信号の主観品質を音声通信の品質パラメータから推定する音声品質客観評価方法において、
前記音声信号の音声符号化方式に応じた品質パラメータである符号化品質とパケット損失耐性とを決定するパラメータ決定手順と、
前記音声信号の背景騒音の特性に応じて前記符号化品質と前記パケット損失耐性のうち少なくとも一方を補正するパラメータ補正手順と、
このパラメータ補正手順で少なくとも一方が補正された前記符号化品質と前記パケット損失耐性とから音質劣化量を算出する音質劣化量算出手順とを備えることを特徴とする音声品質客観評価方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006058009A JP2007233264A (ja) | 2006-03-03 | 2006-03-03 | 音声品質客観評価装置および音声品質客観評価方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006058009A JP2007233264A (ja) | 2006-03-03 | 2006-03-03 | 音声品質客観評価装置および音声品質客観評価方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2007233264A true JP2007233264A (ja) | 2007-09-13 |
Family
ID=38553884
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006058009A Pending JP2007233264A (ja) | 2006-03-03 | 2006-03-03 | 音声品質客観評価装置および音声品質客観評価方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2007233264A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013205831A (ja) * | 2012-03-29 | 2013-10-07 | Nippon Telegr & Teleph Corp <Ntt> | 音声品質客観評価装置及び方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004056612A (ja) * | 2002-07-23 | 2004-02-19 | Nippon Telegr & Teleph Corp <Ntt> | 客観品質評価方法、客観品質評価装置、客観品質評価プログラム、客観品質評価プログラムを記録した記録媒体 |
JP2004222257A (ja) * | 2002-12-25 | 2004-08-05 | Nippon Telegr & Teleph Corp <Ntt> | 総合通話品質推定方法及び装置、その方法を実行するプログラム、及びその記録媒体 |
JP2005018076A (ja) * | 2003-06-25 | 2005-01-20 | Lucent Technol Inc | 客観的なスピーチ品質評価において時間/言語歪みを反映する方法 |
-
2006
- 2006-03-03 JP JP2006058009A patent/JP2007233264A/ja active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004056612A (ja) * | 2002-07-23 | 2004-02-19 | Nippon Telegr & Teleph Corp <Ntt> | 客観品質評価方法、客観品質評価装置、客観品質評価プログラム、客観品質評価プログラムを記録した記録媒体 |
JP2004222257A (ja) * | 2002-12-25 | 2004-08-05 | Nippon Telegr & Teleph Corp <Ntt> | 総合通話品質推定方法及び装置、その方法を実行するプログラム、及びその記録媒体 |
JP2005018076A (ja) * | 2003-06-25 | 2005-01-20 | Lucent Technol Inc | 客観的なスピーチ品質評価において時間/言語歪みを反映する方法 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013205831A (ja) * | 2012-03-29 | 2013-10-07 | Nippon Telegr & Teleph Corp <Ntt> | 音声品質客観評価装置及び方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101430321B1 (ko) | 오디오 시스템의 지각 품질을 결정하기 위한 방법 및 시스템 | |
RU2651616C2 (ru) | Способ и устройство оценки аудиопомехи | |
JP4486130B2 (ja) | 映像コミュニケーション品質推定装置、方法、およびプログラム | |
JP4745916B2 (ja) | 雑音抑圧音声品質推定装置、方法およびプログラム | |
US9025780B2 (en) | Method and system for determining a perceived quality of an audio system | |
AU2005285694B2 (en) | Frequency compensation for perceptual speech analysis | |
Takahashi et al. | Objective assessment methodology for estimating conversational quality in VoIP | |
US20100106489A1 (en) | Method and System for Speech Quality Prediction of the Impact of Time Localized Distortions of an Audio Transmission System | |
EP2037449B1 (en) | Method and system for the integral and diagnostic assessment of listening speech quality | |
JP2007194893A (ja) | 映像品質評価装置および方法 | |
US8583423B2 (en) | Method and arrangement for processing of speech quality estimate | |
Gaoxiong et al. | The perceptual objective listening quality assessment algorithm in telecommunication: introduction of itu-t new metrics polqa | |
De Lima et al. | On the quality-assessment of reverberated speech | |
JP2007233264A (ja) | 音声品質客観評価装置および音声品質客観評価方法 | |
JP5952252B2 (ja) | 通話品質推定方法、通話品質推定装置、及びプログラム | |
JP2004222257A (ja) | 総合通話品質推定方法及び装置、その方法を実行するプログラム、及びその記録媒体 | |
JP4514149B2 (ja) | 音声品質推定装置および音声品質推定方法 | |
Côté et al. | Conclusions and Outlooks | |
Möller | Quality Prediction | |
JP2009124634A (ja) | 客観品質評価装置および方法 | |
Chan et al. | Machine assessment of speech communication quality | |
JP2006148752A (ja) | 通話品質の主観評価のための評価サンプル数を決定する方法及びサーバ | |
Grah et al. | Dynamic QoS for commercial VoIP in heterogeneous networks | |
Côté et al. | Assessment of Different Loudness Models for Perceived Speech Quality |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20080129 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20100618 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100720 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20101214 |