JPH0784596A - 符号化音声の品質評価方法 - Google Patents

符号化音声の品質評価方法

Info

Publication number
JPH0784596A
JPH0784596A JP5227576A JP22757693A JPH0784596A JP H0784596 A JPH0784596 A JP H0784596A JP 5227576 A JP5227576 A JP 5227576A JP 22757693 A JP22757693 A JP 22757693A JP H0784596 A JPH0784596 A JP H0784596A
Authority
JP
Japan
Prior art keywords
bark spectrum
bark
speech
spectrum
quality evaluation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP5227576A
Other languages
English (en)
Inventor
Toshiaki Watanabe
俊朗 渡辺
Shinji Hayashi
伸二 林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP5227576A priority Critical patent/JPH0784596A/ja
Publication of JPH0784596A publication Critical patent/JPH0784596A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

(57)【要約】 【目的】 符号化音声に対する主観品質評価値の推定精
度を高める。 【構成】 原音声データと、該原音声データを符号化し
た後、復号化した音声データとを高速フーリエ変換した
後(SB1)、予め記憶されている臨界帯域フィルタの
フィルタ係数を用いて畳み込みを行なう(SB3)。次
に、高域を強調するプリエンファシス処理とBarkス
ペクトルの計算とを行なった後(SB4)、Barkス
ペクトル計算の結果として得られた現フレームのBar
kスペクトルを、1つ前のフレームで計算されたマスキ
ング量との差を用いて表現する(SB5)。そして、最
終的に得られたBarkスペクトル歪を利用して、品質
評価を行なう(SB6)。ここで、上記フィルタ係数と
しては、隣接する臨界帯域フィルタからのマスキング効
果を考慮して、中心周波数の両側の±(0.4〜0.
6)Barkの範囲内の係数のみを記憶させておく。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】この発明は、音声符号化方式の基
本性能を客観的に評価する場合などに用いられて好適な
符号化音声の品質評価方法に関する。
【0002】
【従来の技術】音声符号化装置から復号された出力音声
(以下、符号化音声という)の品質は、音声符号化装置
の導入に際して、主観的なオピニオン試験を行なって評
価されるが、方式開発段階においてパラメータの最適化
を行なう場合などでは手間のかかる作業となる。そのた
め、従来より、種々の物理量を用いた客観的な品質評価
方法が提案されている。
【0003】これらの品質評価方法のうち、特に、8k
bit/s以下の低ビットレート符号化装置における符
号化音声に適用できる方法として、Barkスペクトル
歪による品質評価方法と、Barkスペクトル上の重み
付き距離尺度方法とがある。これらの方法においては、
人間の耳の周波数分析機能を経た心理的な音の大きさに
基づく信号対雑音比が、符号化音声の主観評価値と対応
がよい。
【0004】図4は、従来のBarkスペクトル歪によ
る品質評価方法を用いた符号化音声の品質評価装置によ
る評価方法を示すフローチャートである。図4を参照す
ることにより、ラウドネスモデルの原理について説明す
る。
【0005】アナログの音声信号(原音声という)およ
びその被測定用の符号化装置からの符号化音声が、8k
Hzでサンプリングされて、例えば、20ms(160
サンプル)毎に1フレームにまとめられ、ハミング窓が
乗ぜられる。その後、ステップSA1において、上記フ
レーム単位で、交互に、高速フーリエ変換(FFT)処
理が行なわれ、周波数領域の信号に変換される。
【0006】次に、ステップSA2において、パワース
ペクトル算出処理により、短時間音声スペクトルS
(ω)の実部と虚部とが分離され、2乗和が計算されて
短時間パワースペクトルP(ω)が出力される。
【数1】 上記(1)式において、ωは角周波数である。
【0007】さらに、例えば、次に示す(2)式によっ
て、短時間パワースペクトルP(ω)は周波数軸ωから
Bark周波数Ω(ω)に変換される。
【数2】
【0008】次に、ステップSA3において、短時間パ
ワースペクトルP(Ω)と、予め計算され、フィルタ係
数記憶部に記憶されている臨界帯域フィルタの係数Ψ
(Ω)との乗算(以下、畳み込みという)が行なわれ
る。
【0009】ここで、臨界帯域フィルタの係数Ψ(Ω)
は、例えば、次に示す(3)式で与えられる。
【数3】
【0010】この臨界帯域フィルタの特性は、中心周波
数付近が平坦で、その両側に指数関数で表されるスカー
ト部を有し、低周波数側より高周波数側の方が傾きが鋭
い。また、フィルタのスカート部の端は中心周波数の利
得に対して−40dBまで伸びている。
【0011】そして、次に示す(4)式により、上記フ
ィルタ係数Ψ(Ω)の複数個のセットと上記短時間パワ
ースペクトルP(Ω)の畳み込みによって、複数個の臨
界帯域パワースペクトルΘ(Ωn)が得られる。
【数4】
【0012】上記(4)式において、nは臨界帯域フィ
ルタの個数(以下、チャネル数という)で、電話帯域
(0.3〜3.4kHz)をカバーする個数n=15と
している。また、上記臨界帯域パワースペクトルΘ(Ω
n)は周波数軸上で約1Bark間隔でサンプリングさ
れる。これにより、原音声のパワースペクトルP(Ω)
と比較して、Θ(Ωn)のスペクトル分解能は極端に減
少し、P(Ω)をダウンサンプリングした結果となる。
これは人間の内耳における周波数分析機能を模擬した形
になっている。
【0013】次に、上記臨界帯域パワースペクトルΘ
(Ωn)に等ラウドネス曲線を模擬したプリエンファシ
ス特性E(ω)が乗算され、複数個の総合的な臨界帯域
パワースペクトルΞ(Ωn)が得られる。
【数5】
【0014】上記(5)式において、プリエンファシス
特性E(ω)は、異なる周波数での人間の耳の感度が非
線形であることを近似しており、例えば、次に示す
(6)式で表される。
【数6】
【0015】次に、ステップSA4では、Barkスペ
クトル計算処理、例えば、(7)式に示す計算が行なわ
れる。
【数7】 以上の処理により、フレーム単位に原音声および符号化
音声のBarkスペクトルが求められる。
【0016】そして、ステップSA5において、原音声
に対する現フレームの上記BarkスペクトルΦ
x(Ωn)が、チャネル毎に2乗され、それらが加算され
てBarkエネルギーΣ[Φx(Ωn)]2が得られる。
また、現フレームまでのBarkエネルギーの平均値Σ
[Φx(Ωn)]2 aveが計算される。さらに、原音声に対
する現フレームの上記BarkスペクトルΦx(Ωn
と、符号化音声に対する現フレームのBarkスペクト
ルΦy(Ωn)との差が、チャネル毎に2乗され、それら
が加算されて、Barkスペクトル歪BSDuが得られ
る。また、現フレームまでのBarkスペクトル歪の平
均値BSDuaveが計算される。以上の処理から、現フレ
ームまでのBarkスペクトル歪BSDは、(8)式で
計算されて出力される。
【数8】
【0017】以上、1フレームにおける処理について説
明したが、例えば、フレーム更新周期δをフレーム長の
半分の長さとし、音声区間長に相当する全フレームにわ
たって、上述した処理を行なうと、最終的なBarkス
ペクトル歪が得られる。
【0018】もう1つの評価方法であるBarkスペク
トル上の重み付き距離尺度方法におけるBarKスペク
トル歪の算出過程は、図4に示すものと同一である。し
かしながら、両者の違いは、ステップSA5における歪
計算処理によるBarkスペクトル歪の計算法にある。
すなわち、重み付き距離尺度方法においては、フレーム
単位またはチャネル単位に、以下に示す重み付けの組み
合わせを、原音声および符号化音声から得られるBar
kスペクトルに乗算する形式をとっている。
【0019】フレーム単位で行なう処理には、フレーム
内において、Barkスペクトルのエネルギーの高いチ
ャネルまたは低いチャネルに重み付けする第1、第2の
処理と、Barkスペクトルのエネルギーの高いフレー
ムまたは低いフレームに重み付けする第3、第4の処理
がある。また、チャネル単位で行なう処理には、音声区
間を通してBarkスペクトルのエネルギーの高いチャ
ネルまたは低いチャネルに重み付けする第5、第6の処
理と、音声区間を通してBarkスペクトルのエネルギ
ー変化の大きいフレームまたは小さいフレームに重み付
けする第7、第8の処理がある。
【0020】なお、Barkスペクトル歪による品質評
価方法については、例えば、S.WangとA.SekeyとA.Gersh
oとが著した”An Objective Measure for Predicting S
ubjective Quality of Speech Codes”(IEEE Journal
on selected areas in communichations. Vol. 10. No.
5 June 1992, pp.819-829)を参照されたい。また、B
arkスペクトル上の重み付き距離尺度方法について
は、例えば、永野と小野が著した”音質予測モデルにお
ける重み付け距離の検討”(音響講論1-7-11,1993.5)
をそれぞれ参照されたい。また、臨界帯域フィルタの係
数の計算については、Hermanskyの著した”Perceptual
linear predictive (PLP) analysis of speech”(J. A
coust. Soc. Am. 87(4), April 1990, pp.1738-1752)
を参照されたい。
【0021】
【発明が解決しようとする課題】ところで、上述した従
来の符号化音声の品質評価方法では、フィルタ係数記憶
部に記憶されている図4に示す臨界帯域フィルタの係数
は、各フィルタの中心周波数での最大利得に対して、−
40dB程度まで用意され、その全ての係数が原音声お
よび符号化音声との畳み込みに用いられていた。しかし
ながら、この方法では、隣接するフィルタからのマスキ
ング効果によるラウドネスの減少が無視される結果にな
り、実際よりも過大に評価されるという欠点があった。
【0022】また、実際の音声を受聴する場合には、継
時マスキングの影響を受けるため、それを補正する必要
がある。しかしながら、従来の品質評価方法では、Ba
rkスペクトル上で8種類の重み付けの組み合わせを行
なうものの、その組み合わせ方は必ずしも継時マスキン
グ効果による補正とはなっていなかったという問題があ
る。
【0023】この発明は上述した事情に鑑みてなされた
もので、符号化音声に対する主観品質評価値の推定精度
を高めることができる符号化音声の品質評価方法を提供
することを目的としている。
【0024】
【課題を解決するための手段】上述した問題点を解決す
るために、この発明では、原音声データと、その音声デ
ータが被測定用の符号化装置で符号化され、復号化され
て出力された音声データとを、複数サンプルからなるフ
レームを単位として、高速フーリエ変換した後、予め記
憶されている臨界帯域フィルタ用の複数セットからなる
フィルタ係数を用いて、畳み込みを行なうフィルタ処理
と、高域を強調するプリエンファシス処理と、Bark
スペクトルの計算とを行ない、それらの出力であるBa
rkスペクトル歪を利用して、品質評価を行なう符号化
音声の品質評価方法において、前記フィルタ係数の個数
を必要最小限に抑えるための第1の処理と、前記Bar
kスペクトル計算の結果として得られた現フレームのB
arkスペクトルを、1つ前のフレームで計算されたマ
スキング量との差を用いて表現する第2の処理とのう
ち、少なくとも1つの処理を行ない、原音声の前記Ba
rkスペクトルに対する、符号化音声のBarkスペク
トルの比をデシベル表現することを特徴とする。
【0025】
【作用】上記方法では、2つのタイプのマスキング効果
による補正を行なっている。そのため、より実際に近い
ラウドネスを得ることができるようになり、符号化音声
の主観品質評価値を高い精度で推定できる。
【0026】
【実施例】次に図面を参照してこの発明の実施例につい
て説明する。図1は、本発明の一実施例による符号化音
声の品質評価方法を示すフローチャートである。図にお
いて、図4に示すステップSA1〜SA4は、各々、ス
テップSB1〜SB4に対応しているので、それらの説
明は省略する。同図において、本願の特徴的な箇所は、
フィルタ係数記憶部に記憶された臨界帯域フィルタのフ
ィルタ係数と、ステップSB5のマスキング量計算処理
と、ステップSB6の歪計算処理とである。
【0027】図1において、図示しないフィルタ係数記
憶部には、以下の事項を考慮して、臨界帯域フィルタの
フィルタ係数が予め記憶されている。臨界帯域フィルタ
の特性が、例えば、前述した(3)式で与えられる場合
には、隣接する臨界帯域フィルタからのマスキング効果
を考慮して、中心周波数の両側の±(0.4〜0.6)
Barkの範囲内の係数のみを記憶させておけばよい。
このフィルタ特性は、図2に示すように、中心周波数付
近の平坦部分のみを残してスカート部分をほとんど削除
したものとなっている。この実施例においては、(3)
式で表されるフィルタ特性に基づいて、その必要最小限
を示したが、ガウス分布型などのフィルタ特性である場
合にも同様に用いることができる。
【0028】次に、図1に示すステップSB5における
マスクキング量計算処理について説明する。Barkス
ペクトル計算処理の出力である臨界帯域パワースペクト
ルΦ(Ωn)がこのマスキング量計算処理に供給される
と、それまでのマスキングレベルM(Ωn)はリセット
され、次に示す(9)式で表されるリセット後のマスキ
ングレベルM’(Ωn)が得られ、現フレームでのBa
rkスペクトルが(10)式で計算される。
【数9】
【数10】
【0029】そして、次フレームでのマスキングレベル
M(Ωn)が(11)式により計算される。
【数11】 上記(11)式において、δはフレーム更新周期で、本
実施例では40に設定される。また、τは継時マスキン
グ効果の時定数で、本実施例ではフレーム更新周期の
0.5〜2倍程度に設定される。
【0030】次に、ステップSB6の歪計算処理におい
て、現フレームまでのBarkスペクトル歪尺度BSD
rは、現フレームまでのBarkスペクトル歪の平均値
BSDuと、Barkエネルギーの平均値との比のデシ
ベル表示が(12)式で計算され出力される。
【数12】
【0031】ここで、本発明による改善効果の一例を図
3に示す。この図は、数種類の4kb/s音声符号化装
置を用いて符号化音声を得た後、オピニオン試験を行な
ってえられた主観評価値と、実施例および従来の技術で
評価された評価値との相関を、フレーム長に対して示し
ている。図3において、Aの部分が必要最小限のフィル
タ係数を用いたことによる効果であり、Bの部分が継時
マスキングによる効果である。同図から、本発明を用い
たことにより主観品質の推定精度が向上することは明ら
かである。
【0032】以上、説明したように、この発明によれ
ば、符号化音声の品質を高い精度で推定でき、しかも計
算量が削減できるという効果が得られる。
【0033】
【発明の効果】以上説明したように、本発明によれば、
隣接する臨界帯域成分からマスキングの影響を考慮した
特性をもつフィルタ係数を用いることにより、主観評価
値の推定精度を向上させることができ、畳み込みを行な
うポイント数を半分以下に削減でき、この結果、計算量
を削減できる。また、継時マスキング効果を導入するこ
とにより、従来の方法と比べて、より実際に近いBar
kスペクトルを得ることができる。さらに、Barkス
ペクトル歪尺度は、原音声のBarkスペクトルと、原
音声と符号化音声とのBarkスペクトル歪の比をデシ
ベルで表すことにより、人間の感覚量との対応が良くな
る。従って、本発明は、符号化音声の主観品質を精度良
く推定することができ、手間のかかる主観評価試験を行
なうことなく、符号化音声の品質を評価することができ
る。
【図面の簡単な説明】
【図1】本発明の一実施例の符号化音声の品質評価方法
を示すフローチャートである。
【図2】本発明に用いる臨界帯域フィルタの係数の一例
を示す図である。
【図3】本発明の実施例による改善効果を示す図であ
る。
【図4】従来の技術における処理に基づいてラウドネス
モデルを説明するフローチャートである。
【符号の説明】
2 高速フーリエ変換処理 3 パワースペクトル計算処理 4 フィルタ処理 5 Barkスペクトル計算処理 6 歪計算処理 8 マスキング量計算処理

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】 原音声データと、その音声データが被測
    定用の符号化装置で符号化され、復号化されて出力され
    た音声データとを、複数サンプルからなるフレームを単
    位として、高速フーリエ変換した後、予め記憶されてい
    る臨界帯域フィルタ用の複数セットからなるフィルタ係
    数を用いて、畳み込みを行なうフィルタ処理と、高域を
    強調するプリエンファシス処理と、Barkスペクトル
    の計算とを行ない、それらの出力であるBarkスペク
    トル歪を利用して、品質評価を行なう符号化音声の品質
    評価方法において、 前記フィルタ係数の個数を必要最小限に抑えるための第
    1の処理と、 前記Barkスペクトル計算の結果として得られた現フ
    レームのBarkスペクトルを、1つ前のフレームで計
    算されたマスキング量との差を用いて表現する第2の処
    理とのうち、少なくとも1つの処理を行ない、 原音声の前記Barkスペクトルに対する、符号化音声
    のBarkスペクトルの比をデシベル表現することを特
    徴とする符号化音声の品質評価方法。
JP5227576A 1993-09-13 1993-09-13 符号化音声の品質評価方法 Pending JPH0784596A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5227576A JPH0784596A (ja) 1993-09-13 1993-09-13 符号化音声の品質評価方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5227576A JPH0784596A (ja) 1993-09-13 1993-09-13 符号化音声の品質評価方法

Publications (1)

Publication Number Publication Date
JPH0784596A true JPH0784596A (ja) 1995-03-31

Family

ID=16863084

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5227576A Pending JPH0784596A (ja) 1993-09-13 1993-09-13 符号化音声の品質評価方法

Country Status (1)

Country Link
JP (1) JPH0784596A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100347752B1 (ko) * 2000-01-25 2002-08-09 주식회사 하이닉스반도체 이동통신 시스템에서 객관적 음질 평가 장치 및 그 방법
JP2005018076A (ja) * 2003-06-25 2005-01-20 Lucent Technol Inc 客観的なスピーチ品質評価において時間/言語歪みを反映する方法
JP2013501952A (ja) * 2009-08-14 2013-01-17 コニンクリーケ・ケイピーエヌ・ナムローゼ・フェンノートシャップ オーディオ・システムの知覚品質を判定する方法およびシステム
US8532986B2 (en) 2009-03-26 2013-09-10 Fujitsu Limited Speech signal evaluation apparatus, storage medium storing speech signal evaluation program, and speech signal evaluation method
US9058821B2 (en) 2008-11-28 2015-06-16 Fujitsu Limited Computer-readable medium for recording audio signal processing estimating a selected frequency by comparison of voice and noise frame levels

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100347752B1 (ko) * 2000-01-25 2002-08-09 주식회사 하이닉스반도체 이동통신 시스템에서 객관적 음질 평가 장치 및 그 방법
JP2005018076A (ja) * 2003-06-25 2005-01-20 Lucent Technol Inc 客観的なスピーチ品質評価において時間/言語歪みを反映する方法
US9058821B2 (en) 2008-11-28 2015-06-16 Fujitsu Limited Computer-readable medium for recording audio signal processing estimating a selected frequency by comparison of voice and noise frame levels
US8532986B2 (en) 2009-03-26 2013-09-10 Fujitsu Limited Speech signal evaluation apparatus, storage medium storing speech signal evaluation program, and speech signal evaluation method
JP2013501952A (ja) * 2009-08-14 2013-01-17 コニンクリーケ・ケイピーエヌ・ナムローゼ・フェンノートシャップ オーディオ・システムの知覚品質を判定する方法およびシステム

Similar Documents

Publication Publication Date Title
TW445724B (en) Method for making a machine-aided assessment of the transmission quality of audio signals
JP4570609B2 (ja) 音声伝送システムの音声品質予測方法及びシステム
RU2312405C2 (ru) Способ осуществления машинной оценки качества звуковых сигналов
US20120143601A1 (en) Method and System for Determining a Perceived Quality of an Audio System
EP2037449B1 (en) Method and system for the integral and diagnostic assessment of listening speech quality
EP1187100A1 (en) A method and a device for objective speech quality assessment without reference signal
JP4263620B2 (ja) システムの伝送品質を測定する方法及びシステム
Liang et al. Output-based objective speech quality
US20080267425A1 (en) Method of Measuring Annoyance Caused by Noise in an Audio Signal
FI96247C (fi) Menetelmä puheen muuntamiseksi
US20090161882A1 (en) Method of Measuring an Audio Signal Perceived Quality Degraded by a Noise Presence
CN1538667A (zh) 一种宽频带语音质量客观评价方法
JPH0784596A (ja) 符号化音声の品質評価方法
JPH0783752A (ja) オーディオ歪曲測定装置およびその方法
US20080255834A1 (en) Method and Device for Evaluating the Efficiency of a Noise Reducing Function for Audio Signals
Somek et al. Speech quality assessment
JPH113097A (ja) 符号化音声信号品質評価方法及びこれに用いるデータベース
KR100388454B1 (ko) 배경잡음 예측을 통한 음성 출력 이득 조정 방법
JPH07111462A (ja) 音声圧縮方法および装置
JP2002033709A (ja) 信号伝送媒体の信号伝送品質の評価装置、評価方法、ならびに、情報記録媒体
JP3089690B2 (ja) ディジタルデータの高能率符号化方法
CN118197350A (zh) 一种噪声提取模型的训练、噪声提取方法及装置和模型
JP2972459B2 (ja) 自動音質評価装置
Holub et al. Computationally efficient non-intrusive algorithm for speech transmission quality measurement
JPH0990998A (ja) 音響信号変換復号化方法