JPH113097A - 符号化音声信号品質評価方法及びこれに用いるデータベース - Google Patents

符号化音声信号品質評価方法及びこれに用いるデータベース

Info

Publication number
JPH113097A
JPH113097A JP9156905A JP15690597A JPH113097A JP H113097 A JPH113097 A JP H113097A JP 9156905 A JP9156905 A JP 9156905A JP 15690597 A JP15690597 A JP 15690597A JP H113097 A JPH113097 A JP H113097A
Authority
JP
Japan
Prior art keywords
signal
band
evaluation value
frequency band
subjective evaluation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP9156905A
Other languages
English (en)
Inventor
Chiharu Morioka
千晴 森岡
Hiromi Nagabuchi
裕実 長渕
Toshiaki Watanabe
俊朗 渡辺
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP9156905A priority Critical patent/JPH113097A/ja
Publication of JPH113097A publication Critical patent/JPH113097A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

(57)【要約】 【課題】 周波数帯に拘らず、符号化音声信号の主観評
価値を推定可能とする。 【解決手段】 第1帯域(0〜4kHz)、第2帯域
(4〜8kHz)について、原信号をLPC分析し、そ
の結果により白色雑音のスペクトル包絡を原信号に近似
させて、模擬符号化歪を作り、更に符号化信号を模疑し
たモデル信号を作り、そのLPC分析次数P=0,1,
4,8ごとに各モデル信号のSNRとケプストラム距離
CDと主観評価値とをデータベースとしておき、評価さ
れるべき信号Aとその原信号を第1、第2帯域にわけ、
原信号のLPC分析を利用して、同様に各種の模疑符号
化歪を作り、この中で信号Aの符号化歪と最も類似する
ものを探し、その作成時の分析次数Pと同一次数のデー
タベースのデータと、信号AのSNR又はCDを用いて
主観評価値を推定する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】この発明は音声信号符号化方
式の基本性能を客観的に比較評価する方法、及びこれに
用いられるデータベースに関する。
【0002】
【従来の技術】音声符号化方法では、符号化側で、入力
音声信号はAD変換手段により周期的にサンプリングさ
れてデジタル信号系列に変換される。このディジタル信
号系列を以下「原信号」と呼ぶ。この原信号は符号化手
段により符号化されて「符号化信号」に変換されて伝送
路を通して伝送され、または蓄積手段に蓄積される。復
号側では復号化手段により復号化されて「復号化信号」
に戻され、さらにディジタル−アナログ(DA)変換手
段により再びアナログの再生音声信号に戻される。
【0003】この再生音声信号の品質は、音声信号のサ
ンプリング周波数、即ち「周波数帯域」(一般に、サン
プリング周波数の半分が周波数帯域になる)と、符号化
手段での「符号化方式」に影響される。音声品質の評価
方法には、人間が実際に再生音声を聴いて評価する方法
(「主観品質評価法」と略記)と、既に主観品質が得ら
れている再生音声に対して品質を規定する物理量とその
主観品質の関係を予め求めておき、評価対象の復号化信
号と原信号の前記物理量を測定して、これらを前記の関
係に代入するなどの方法により、評価対象の再生音声の
品質を推定する方法(「客観品質評価」と略記)とがあ
る。主観品質評価法は多大な時間と労力を必要とするの
で、音声符号化方式の開発段階において、パラメータの
最適化などを行なう場合には手間のかかる作業となる。
そのため従来から種々の客観品質評価法が提案されてい
るが、いずれの方法もサンプリング周波数が等しい符号
化方式を比較する場合にしか適用できなかった。尚、符
号化音声信号の客観品質評価方法については、例えば北
脇が著した「音のコミュニケーション工学」コロナ社
(1996年)などに詳しい。
【0004】ここで、上記符号化手段により符号化され
た符号化信号を「狭義の符号化信号」と呼び、上記復号
化手段により復号化された復号化信号(ディジタル信
号)及びディジタル−アナログ(DA)変換手段により
変換された再生音声信号(アナログ信号)を「広義の符
号化音声信号」と呼ぶこととする。後者は、原信号が符
号化され、復号化された音声信号の総称として一般的に
使われており、ディジタル信号を表わす場合もアナログ
信号を表わす場合もある。これ以降、特に矛盾が生じな
い場合には、この「広義の符号化音声信号」を単に「符
号化音声信号」と記述することとする。
【0005】
【発明が解決しようとする課題】前述したように、従来
の客観品質評価法の適用は符号化方式のサンプリング周
波数が等しい場合だけに限られていた。しかし、近年の
符号化方式では符号化音声信号の低ビットレート化と共
に、サンプリング周波数の高速化も検討されている。単
純に(ビットレートも上昇して符号化歪が増加すること
なく)サンプリング周波数を高くすれば周波数帯域が広
がるので再生音声の品質は向上するが、例えば伝送速度
が一定の伝送路においては、サンプリング周波数を高く
すると符号化手段に起因する符号化歪が増加する可能性
もあるので、一概に音声品質が向上するとは言えず、両
者はトレードオフの関係にある。従って、「周波数帯
域」と「符号化歪」はいずれも再生音声の品質を決定す
る要因であって、符号化方式を選定する際には、これら
の要因が複合した場合の音声品質を比較評価する必要が
ある。
【0006】この発明の目的は、周波数帯域と符号化歪
の2つの要因が複合した符号化音声信号の客観品質評価
方法及びこれに用いるデータベースを提供することであ
る。
【0007】
【課題を解決するための手段】この発明によれば、第1
周波数帯域と、その第1周波数帯域及びその高域側に隣
接する第2周波数帯域とについて、符号化音声信号を模
疑したモデル信号のスペクトル包絡の特徴量をパラメー
タとして、そのモデル信号の符号化歪を表わす物理量
と、そのモデル信号の主観評価値との関係を示すデータ
ベースを用い、評価されるべき符号化音声信号の周波数
帯域と等しい周波数帯域における評価値−物理量関係デ
ータ中から、評価されるべき符号化音声信号のスペクト
ル包絡の特徴量が似ているものをデータベースから選択
し、また評価されるべき符号化音声信号の原信号に対す
る歪を表わす物理量を求め、選択した評価値−物理量関
係データから、上記求めた物理量と対応する主観評価値
を求める。
【0008】つまりこの発明によれば、符号化信号の特
徴を模疑したモデル信号を作成し、その周波数帯域及び
模疑符号化歪量と主観評価値の関係をデータベース化す
ることによって、周波数帯域と符号化歪が複合した未知
の符号化信号の品質を客観的に評価することを可能とす
る。
【0009】
【発明の実施の形態】まずこの発明の評価方法に用いる
データベースの作成方法を図1を参照して説明する。ま
ず音声符号化の対象となる原信号は複数の周波数帯域に
分割される(S1)。つまり例えばあるサンプリング周
波数でサンプリングされた原信号は、あるフレーム長毎
に高速フーリエ変換(FFT)されて時間領域から周波
数領域に変換される。一般的に、音声信号では「高域」
より「低域」の方にパワーが集中しているので、主観評
価値に及ぼす符号化歪の影響は「低域」の方が大きいこ
とが知られている。この点を考慮して、原信号の周波数
帯域はその上限がたとえば4kHzの倍数を越えるか否
かにより、分割される。例えば、原信号が電話帯域音声
(上限=3.4kHz)である場合には分割数n=1
(帯域分割されない)であり、7kHz帯域音声である
場合には分割数n=2、16kHz帯域信号である場合
には分割数n=4となる。これら分割された各帯域の信
号はそれぞれLPC(線形予測係数)分析が行われる
(S2)。この場合のLPC分析次数Pは0,1,4,
8などと各種につき行われ、この次数の間隔は、次数の
差により音声品質にある程度影響が生じる程度とされ
る。次数P=0は、LPC分析を行わない場合である。
【0010】このLPC分析結果を用いて帯域毎に符号
化歪を模疑した物理量の変化、つまり模疑符号化歪が各
帯域ごとに生成される(S3)。つまり例えばスペクト
ル包絡が原信号に類似した特性をもつ雑音として作成さ
れる。即ち、LCP分析係数を用いて白色雑音をスペク
トル整形し、例えばLCP分析係数を線形合成フィルタ
のフィルタ係数として白色雑音をフィルタ処理して、原
信号のスペクトル包絡と類似したスペクトル包絡をもつ
雑音、つまり模疑符号化歪が生成される。
【0011】LPC分析次数を種々変化させることによ
り、原信号に対するスペクトル包絡の類似度が異なる雑
音(模疑符号化歪)を作成する。LPC分析次数を高く
すると、原信号に対するスペクトル包絡の類似度が高く
なり、雑音性が薄れていく。各LPC分析次数の雑音
(模疑符号化歪)について、その雑音量を種々変化させ
ることにより、LPC分析次数と雑音量の2つのパラメ
ータを種々変えた模疑符号化歪を作成することができ
る。なお、LPC分析次数P=0の場合は、前記模疑符
号化歪は白色雑音となり、この雑音が付加された電話帯
域音声信号は振幅相関雑音付加音声(Modulate
d Noise Reference:MNR)と呼ば
れ、符号化方式の国際標準化のための主観評価試験など
のレファレンスとして使用されている。
【0012】以上述べたように、各帯域毎に符号化歪を
模疑するための前記のLPC分析次数と雑音量の2つの
パラメータを種々変えた模疑符号化歪を、それぞれ原信
号に付加することにより、多数のモデル信号を作成する
(S4)。前記の2つのパラメータ(LPC分析次数と
雑音量)を様々に代えることによって、モデル信号の品
質を、主観価値が「非常によい」から「非常に悪い」ま
で制御することができる。原信号の周波数帯域及び模疑
符号化歪を種々変えて多くのモデル信号を作成できる。
【0013】例えばLPC分析次数P=0で雑音量を表
わす信号対称比(SNR)を20dB〜45dB、P=
8でSNRを10dB〜30dBそれぞれ変化させれば
主観評価値は「非常に悪い」から「非常によい」まで変
化する。このようにして品質評価に必要とされる全ての
モデル信号を作成した後、これら全モデル信号に対して
主観評価法により主観評価値(一般的には、平均オピニ
オン値:MOS)を求める(S5)。
【0014】次に全モデル信号を、ステップS1で分割
した周波数帯域に分割し(S7)、更にこれら各周波数
帯域ごとに全モデル信号の原信号に対する模疑符号化歪
を表わす物理量としてSNR、スペクトル包絡歪量を表
わすLPCケプストラム距離(CD)をそれぞれ測定す
る(S7)。このようにして得られたモデル信号の周波
数帯域ごとのそのLPC分析次数Pと、SNR又はCD
と主観評価値との関係データを求める(S8)。つまり
この例では周波数帯域が電話帯域(300Hz〜3.4
KHz)のモデル信号については図2Aに示すように、
その模疑符号化歪生成に用いた分析次数Pをパラメータ
として、全モデル信号について得られた各種のSNR値
とその主観評価値との関係データを求め、同様に図2B
に示すように、分析次数Pをパラメータとして、全モデ
ル信号について得られた各種のCD値と、その主観評価
値との関係データを求める。
【0015】また周波数帯域が7kHzのモデル信号に
ついては、図2Cに示すように、その模疑符号化歪生成
時に用いた周波数帯域0〜4kHzの分析次数P1と、
周波数帯域4〜8kHzの分析次数P2と、が同一のも
のについて、帯域0〜4kHzのSNR1をパラメータ
として、例えばSNR1=40dBのすべてのモデル信
号についての帯域4kHz〜8kHzのSNR2の各種
値と、主観評価値との関係データを求める。
【0016】同様に図2Dに示すように模疑符号化歪生
成時に用いた分析次数P1とP2が同一のものについ
て、帯域0〜4kHzのケプストラム距離CD1をパラ
メータとして、例えばCD1=0.5dBのすべてのモ
デル信号についての帯域4kHz〜8kHzのCD2の
各種値と、主観評価値との関係データを求める。図2C
に示す関係データの代りに、SNR2をパラメータとし
て、SNR1と主観評価値との関係データを求め、図2
Dに示す関係データの代りにCD2をパラメータとし
て、CD1と主観評価値との関係データを求めてもよ
い。なお、後述で明らかにするが品質評価において第1
帯域0〜4kHzの分析次数P1がゼロの場合は、CD
と主観評価価値の関係データを用い、P1≠0の場合は
SNRと主観評価値の関係データを用いることがある。
その場合は、図2BではP=0の関係データのみあれば
よく、図2DではP1=0とP2=0,1,4,8との
各組合せにおけるCDと主観評価値の関係データがあれ
ばよい。
【0017】図2に示す関係データがそれぞれテーブル
として品質評価用データベースに格納される。つまり前
記例では周波数帯域が電話帯域の信号用に第1スペクト
ル包絡の原信号に対する類似度を表わすデータとしての
分析次数P=1,P=4,P=8それぞれについて各種
SNR値に対する主観評価値がテーブルとして格納さ
れ、P=0について各種CD値に対する主観評価値がテ
ーブルとして格納される。周波数帯域が7kHzの信号
用に、第1帯域の分析次数P1=1,4,8と第2帯域
の分析次数P2=0,1,4,8の各組合せ(P1,P
2)ごとに、かつ第1帯域のSNR1=20dB,30
dB,40dBごとにそれぞれ第2帯域の各種のSNR
2の値に対する主観評価値がそれぞれテーブルとして格
納され、またP1=0と、P2=0,1,4,8の各組
合せ(P1,P2)ごとに、かつ第1帯域のCD1=
0.5dB,1.5dB,2.5dBごとにそれぞれ第
2帯域の各種のCD2の値に対する主観評価値がそれぞ
れテーブルとして格納されている。なお、SNR,CD
の各値は実際にはもっと小さい間隔でデータをとる。
【0018】次に上述したデータベースを用いて符号化
音声信号を品質評価する実施例を述べる。図3にこの品
質評価を行う装置の機能構成を示し、図4にその処理手
順を示す。評価されるべき符号化音声信号(信号A)
と、その原信号とが入力され、これら両信号の周波数帯
域が測定部11で測定される(S1)。この測定は、例
えば信号をFFTにより周波数帯域に変換し、その下限
周波数、及び上限周波数を求める。
【0019】両信号の下限周波数、上限周波数をそれぞ
れ比較し、周波数帯域が互いに等しいかを調べる(S
2)。等しくない場合は原信号の周波数帯域をフィルタ
処理により制限して信号Aと同一帯域とする(S3)。
次に信号Aの周波数帯域が、データベース12の第1周
波数帯域、前記例では4kHzより広いか否かを調べる
(S4)。広い場合はデータベース12の利用信号帯域
に合せて、複数の帯域、この例では0〜4kHzと4〜
8kHzの第1、第2帯域に両信号を分割する(S
5)。これら両信号はメモリ13に一時蓄積される。次
に原信号がLPC分析され、この分析次数は、データベ
ース12内にパラメータとして記憶されている各分析次
数について行われる。なお原信号が帯域分割された場合
は、これら各分割された信号についてそれぞれ行う。
【0020】これら各分析結果のLPC係数を用いて、
白色雑音のスペクトル包絡を、原信号のそれにスペクト
ル整形して模疑符号化歪を生成する(S7)。一方、信
号Aの原信号に対する歪、つまり符号化歪を符号化歪測
定部14で求める(S9)。この符号化歪と最も類似す
る模疑符号化歪を、ステップS7で生成した模疑符号化
歪から選択し、その選択した模疑符号化歪の生成に用い
たLPC分析次数PA 、帯域分割の場合はLPC分析次
数の組合せ(PA ,PB )を求める(S9)。つまり符
号化歪のスペクトル包絡とスペクトル包絡が最も類似し
た模疑符号化歪を探し、その模疑符号化歪の生成時のL
PC分析次数を求める。
【0021】この類似度の測定尺度はデータベース12
を作成した時に使用したものと同一のものを用いる。次
に主観品質推定部15ではステップS9で求めたLPC
分析次数又はその組合せに対するデータベース12中の
データを用いて主観評価値を推定する。その際にステッ
プS9で求めたLPC分析次数PA 又は第1帯域の分析
次数PA がゼロであるか否かを調べ(S10)、その結
果により次の処理を分ける。この理由は次にもとづく。
即ちステップS9で、符号化歪と類似している模疑符号
化歪を探しており、PA ≠0ということは原信号のスペ
クトル包絡で雑音をスペクトル整形した模疑符号化歪
に、符号化歪が類似しているということであるから、信
号Aと原信号とのスペクトル包絡の違いで品質評価に用
いるより、SNRを品質評価に用いた方がよい。逆にP
A =0の場合は、スペクトル整形した雑音と類似したも
のがないから、信号Aの原信号に対するスペクトル包絡
の変動が品質に大きく影響していると推定され、例えば
CDにより品質評価に用いた方がよいからである。この
ことは実験的にも認められた。
【0022】そこでPA =0であればステップS11に
移り、各帯域について信号Aと原信号とケプストラム距
離CDA 、帯域分割の場合はCDA ,CDB を求める
(S11)。このCDA 又はCDA ,CDB を用いて信
号Aの主観評価値を推定する(S12)。即ち分割され
ていない場合はデータベース12内の図2Bに対応する
ものの、CDA に対する主観評価値MA を求め、また帯
域分割されてるい場合はデータベース12内の分析次数
(PA =0,PB )、例えばPB =0であれば、図2D
のP1 =0、P2 =0と対応するものを選び、そのCD
B の線16上に、CDA に近い二つのCD1 の値、例え
ば0.5dB<CDA <1.5dBであればCD1
0.5dBの線17とCD1 =1.5dBの線18との
各交点に対応する主観評価値M1 とM2 を求め、M1
2 を、CD1 =0.5dB、CD1=1.5dB、C
A の関係を用いて、内挿して、主観評価値MA を求め
る。このようにして求めたMA を信号Aの主観評価値と
推定して出力する。
【0023】ステップS10でPA =0でないと判定さ
れると、ステップS13に移り、各帯域ごとに原信号と
信号Aのレベル比、つまりSNRA 又はSNRA とSN
Bを求め、ステップS12に移る。この場合も、ステ
ップS9で求めた分析次数P A 又は(PA ,PB )に対
するSNRと主観評価値、又はSNR1 及びSNR2
主観評価値とのデータを用いて、CDについて求めたと
同様にして、主観評価値を推定して出力する。
【0024】符号化音声信号(信号A)と、他の符号化
音声信号(信号B)との品質を比較する場合は、信号B
についてもこれとその原信号と同様に処理して、主観評
価値MB を推定し、両推定値MA とMB を比較すること
により、両信号A,Bの品質を比較評価することができ
る。上述において、帯域分割を2帯域としたが、8〜1
2kHz、12〜16kHzとそれぞれ3分割、4分割
してもよい。また帯域を4kHzごとに分割する場合に
限らず、3kHzごとに分割してもよく、また、必ずし
も等分割としなくてもよい。図4のステップS9で最も
類似した模疑符号化歪を探し、その作成時のLPC分析
次数を求め、その分析次数に対するデータをデータベー
ス12が得て評価値を推定していることから理解される
ように、データベース12で分析次数、その組合せごと
のデータを格納しているのは、モデル信号のスペクトル
包絡の特徴量を表わす量として、分析次数、その組合せ
を用いているのである。
【0025】従って、データベース12で、分析次数、
その組合せの代りに、モデル信号のスペクトル包絡の特
徴量を表する他の量を用いてもよい。更にデータベース
12におけるSNR,CDはモデル信号の符号化歪を表
わす物理量であり、これらSNR,CDの代りに、モデ
ル信号の符号化歪を表わす他の物理量を用いてもよい。
特にスペクトル歪量としてはCDのみならず、cosh
尺度など各種のものが知られており、これらを用いても
よい。
【0026】データベース12を用いる評価値の推定処
理は、そのデータベース12に記憶しているスペクトル
包絡の特徴量を表わす量、符号化歪を表わす物理量と同
種のものを用いる。評価されるべき信号と、原信号とは
それぞれ、予め、同一の周波数帯に帯域制限されて入力
される場合があり、その場合は、両信号の帯域を同一に
するための処理は当然省略される。
【0027】
【発明の効果】以上述べたように、この発明によれば、
周波数帯域及び模疑符号化歪を種々変化させて、その符
号化音声を模疑したモデル信号を作り、そのモデル信号
のスペクトル包絡の特徴量ごとにその模疑符号化歪を表
わす物理量、つまりSNR及びスペクトル歪量とそのモ
デル信号の主観評価値との関係がデータベースに格納さ
れているため、このデータベースを用いることにより、
未知符号化信号の周波数帯域と付号化歪量を測定するた
けで、手間のかかる主観評価試験を行うことなく、主観
評価値を推定することができる。
【図面の簡単な説明】
【図1】この発明によるデータベースを作成する手順を
示す流れ図。
【図2】この発明によるデータベースに蓄積されている
データの例を示す図。
【図3】この発明による品質評価方法を実験する装置の
機能構成を示す図。
【図4】この発明による品質評価方法の処理手順を示す
流れ図。

Claims (5)

    【特許請求の範囲】
  1. 【請求項1】 第1周波数帯域と、その第1周波数帯域
    及びその高域側に隣接する第2周波数帯域とについて、
    符号化音声信号を模疑したモデル信号のスペクトル包絡
    の特徴量をパラメータとして、そのモデル信号の符号化
    歪を表わす物理量とそのモデル信号の主観評価値との関
    係を示す評価値−物理量関係データが蓄積されたデータ
    ベースを用い、 評価されるべき符号化音声信号の周波数帯域と等しい周
    波数帯域における評価値−物理量関係データ中から、上
    記評価されるべき符号化音声信号のスペクトル包絡の特
    徴量が似ているものを上記データベースから選択する関
    係データ選択工程と、 上記評価されるべき符号化音声信号の原信号に対す歪を
    表わす物理量を求める物理量検出工程と、 上記選択した評価値−物理量関係データから上記求めた
    物理量と対応する主観評価値を求める評価値推定工程
    と、 を有する符号化音声信号品質評価方法。
  2. 【請求項2】 第1周波数帯域信号用として、 その帯域について各種LPC分析次数ごとの、各種のS
    NR値に対する主観評価値が格納され、 上記第1帯域について、LPC分析次数がゼロの各種の
    スペクトル包絡間距離値に対する主観評価値が格納さ
    れ、 上記第1帯域とこれと高域側で隣接する第2帯域とを周
    波数帯域とする信号用として、 第1帯域の分析次数P1の各種の値(P1≠0)と第2
    帯域の分析次数P2の各種の値との各組合せ(P1,P
    2)ごとに、かつ第1帯域のSNR値及び第2帯域のS
    NR値の一方の各種値ごとに、他方の各種の値に対する
    主観評価値が格納され、 第1帯域の分析次数P1=0と第2帯域の各種の分析次
    数P2との各組合せ(P1,P2)ごとに、かつ、第1
    帯域のスペクトル包絡間距離値及び第2帯域のスペクト
    ル包絡間距離値の一方の各種値ごとに、他方の各種の値
    に対する主観評価値が格納されている符号化音声信号品
    質評価用データベース。
  3. 【請求項3】 評価されるべき符号化音声信号(以下単
    に符号化音声信号と記す)とその符号化前の原信号と、
    請求項2に記載したデータベースを用いて符号化音声信
    号の品質を評価する方法であって、 上記符号化音声信号が上記データベースの第2周波数帯
    域を含むか否かを調べ、含む場合は符号化音声信号及び
    原信号をそれぞれ、第1帯域、第2帯域に分割する分割
    工程と、 上記原信号を各種の次数でLPC分析する分析工程と、 上記各LPC分析結果を用いて雑音のスペクトル包絡を
    上記原信号のそれと類似させた模疑符号化歪を生成する
    模疑歪生成工程と、 上記符号化音声信号の符号化歪を求める実質歪生成工程
    と、 上記符号化歪と最も類似した模疑符号化歪を探し、その
    模疑符号化歪生成時に用いたLPC分析結果の分析次数
    を求める類似歪決定工程と、 上記求めた第1帯域の分析次数がゼロであるか否かを判
    定する判定工程と、 その判定工程の判定が0であれば上記符号化音声信号と
    上記原信号とのスペクトル包絡距離を求め、その求めた
    距離の値に対し、上記求めた次数についての上記データ
    ベース中のスペクトル包絡距離に対する主観評価値から
    主観評価値を推定する第1推定工程と、 上記判定工程の判定が0でなければ、上記符号化音声信
    号のSNRを求め、その求めたSNR値に対し、上記求
    めた次数についての上記データベース中のSNRに対す
    る主観評価値から主観評価値を推定する第2推定工程
    と、 を有する符号化音声信号品質評価方法。
  4. 【請求項4】 上記符号化音声信号と上記原信号との周
    波数帯域を測定する工程と、 上記符号化音声信号と上記原信号の周波数帯域が等しい
    か否かを調べ、等しくなければ、上記原信号をフィルタ
    処理して、符号化音声信号と同一周波数帯域として上記
    分割工程へ移る工程と、 を有する請求項3記載の符号化音声信号品質評価方法。
  5. 【請求項5】 上記第1推定工程で、上記求めたスペク
    トル包絡距離に近い二つのスペクトル距離と対応する各
    主観評価値を上記データベースより求めて、これら求め
    た二つの主観評価値の内挿により上記推定主観評価値を
    求め、 上記第2推定工程で、上記求めたSNRに近い二つのS
    NRと対応する各主観評価値を上記データベースより求
    めてこれら求めた二つの主観評価値の内挿により上記推
    定主観評価値を求めることを特徴とする請求項3又は4
    記載の符号化音声信号品質評価方法。
JP9156905A 1997-06-13 1997-06-13 符号化音声信号品質評価方法及びこれに用いるデータベース Pending JPH113097A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP9156905A JPH113097A (ja) 1997-06-13 1997-06-13 符号化音声信号品質評価方法及びこれに用いるデータベース

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP9156905A JPH113097A (ja) 1997-06-13 1997-06-13 符号化音声信号品質評価方法及びこれに用いるデータベース

Publications (1)

Publication Number Publication Date
JPH113097A true JPH113097A (ja) 1999-01-06

Family

ID=15637963

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9156905A Pending JPH113097A (ja) 1997-06-13 1997-06-13 符号化音声信号品質評価方法及びこれに用いるデータベース

Country Status (1)

Country Link
JP (1) JPH113097A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005018076A (ja) * 2003-06-25 2005-01-20 Lucent Technol Inc 客観的なスピーチ品質評価において時間/言語歪みを反映する方法
JP2007049462A (ja) * 2005-08-10 2007-02-22 Ntt Docomo Inc 音声品質評価装置、音声品質評価プログラム及び音声品質評価方法
JP2007065547A (ja) * 2005-09-02 2007-03-15 Nippon Telegr & Teleph Corp <Ntt> 音声品質推定装置および音声品質推定方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005018076A (ja) * 2003-06-25 2005-01-20 Lucent Technol Inc 客観的なスピーチ品質評価において時間/言語歪みを反映する方法
JP2007049462A (ja) * 2005-08-10 2007-02-22 Ntt Docomo Inc 音声品質評価装置、音声品質評価プログラム及び音声品質評価方法
JP2007065547A (ja) * 2005-09-02 2007-03-15 Nippon Telegr & Teleph Corp <Ntt> 音声品質推定装置および音声品質推定方法
JP4514149B2 (ja) * 2005-09-02 2010-07-28 日本電信電話株式会社 音声品質推定装置および音声品質推定方法

Similar Documents

Publication Publication Date Title
EP2465113B1 (en) Method, computer program product and system for determining a perceived quality of an audio system
AU2006233504A1 (en) Apparatus and method for generating multi-channel synthesizer control signal and apparatus and method for multi-channel synthesizing
KR20050023426A (ko) 오디오 코딩
JP4769673B2 (ja) オーディオ信号補間方法及びオーディオ信号補間装置
WO2005117517A2 (en) Neuroevolution-based artificial bandwidth expansion of telephone band speech
CN102044250A (zh) 频带扩展方法及装置
JP2000506631A (ja) オーディオ信号の聴覚に適応した品質評価方法および装置
US20020022898A1 (en) Digital audio coding apparatus, method and computer readable medium
JPH10319996A (ja) 雑音の効率的分解と波形補間における周期信号波形
KR100865860B1 (ko) 보다 높은 지각의 품질을 위한 전화 음성의 광대역 확장
JP2003533753A (ja) スペクトルのモデル化
Gaoxiong et al. The perceptual objective listening quality assessment algorithm in telecommunication: introduction of itu-t new metrics polqa
Heute et al. Integral and diagnostic speech-quality measurement: State of the art, problems, and new approaches
JPH113097A (ja) 符号化音声信号品質評価方法及びこれに用いるデータベース
JPH09243679A (ja) 任意区間波形を用いた非調和的周波数分析法
US6990475B2 (en) Digital signal processing method, learning method, apparatus thereof and program storage medium
JPH04345327A (ja) 通話品質客観測定方法
Karmakar et al. A multiresolution model of auditory excitation pattern and its application to objective evaluation of perceived speech quality
JP2002049397A (ja) ディジタル信号処理方法、学習方法及びそれらの装置並びにプログラム格納媒体
JP2006505818A (ja) オーディオ成分を生成する方法および装置
Pendharkar Auralization of road vehicles using spectral modeling synthesis
JPH0784596A (ja) 符号化音声の品質評価方法
KR20050085761A (ko) 오디오 인코딩에서의 사인곡선 선택
RU2782364C1 (ru) Устройство и способ отделения источников с использованием оценки и управления качеством звука
JP3019603B2 (ja) 音声の基本周波数の抽出装置