JP3868278B2 - 音声信号品質評価装置及びその方法 - Google Patents
音声信号品質評価装置及びその方法 Download PDFInfo
- Publication number
- JP3868278B2 JP3868278B2 JP2001365512A JP2001365512A JP3868278B2 JP 3868278 B2 JP3868278 B2 JP 3868278B2 JP 2001365512 A JP2001365512 A JP 2001365512A JP 2001365512 A JP2001365512 A JP 2001365512A JP 3868278 B2 JP3868278 B2 JP 3868278B2
- Authority
- JP
- Japan
- Prior art keywords
- audio signal
- evaluated
- frame
- phase
- adjustment amount
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Telephonic Communication Services (AREA)
Description
【発明の属する技術分野】
本発明は、音声信号品質評価装置及びその方法に関するものである。例えば、VoIP(Voice Over Internet Protocol)を採用した音声信号伝送システムにおいて、送話された音声信号が遅延やゆらぎを起こした場合、その遅延ゆらぎを含んだ複合的な音声信号の品質を評価する装置及びその方法に適用することができる。
【0002】
【従来の技術】
従来、音声信号伝送システムにおいて、音声信号の品質を評価する方法として、主観的音声信号品質評価方法と客観的音声信号品質評価方法とがある。
【0003】
主観的音声信号品質評価方法とは、音声信号伝送システムによる実際の会話の中で、通話者が音声信号の品質を評価する方法であって、従来、主に行なわれているものであるが、試験環境を整えることが難しく、多くの被験者を必要とすること又は音声信号品質評価に要するコストが高価であるという問題を有している。また、試験結果は、試験環境や、被験者の主観に大きく依存するので、試験の再現性に乏しいという問題を有している。
【0004】
一方、客観的音声品質評価方法とは、上記のような主観的音声品質評価を効率良くするために、客観的に音声信号の品質を評価するものである。すなわち、客観的音声品質評価方法は、主観的音声品質評価方法のように人による評価ではないため、試験環境や被験者の差異によって生じる試験結果の違いがなくなり、試験の再現性に富んだ評価手段である。
【0005】
上述したように、主観的音声信号品質評価方法は試験環境等の問題を有することから、客観的音声信号品質評価方法の開発が望まれている。
【0006】
国際電気通信連合の電気通信標準化部門(ITU−T:International Telecommunication Union−Telecommunication Standardization Sector)は、このような客観的音声信号品質評価方法としてP.861を勧告し、そのP.861に客観的音声信号品質評価方法が記載されている。
【0007】
このP.861に記載されている客観的音声信号品質評価方法は、被評価音声信号の全波形の初期位相のみを、参照音声信号の全波形の初期位相に合わせ込むことにより評価値を得る方法である。
【0008】
図2は、P.861が勧告する音声信号品質評価方法により、歪み等を生じた被評価音声信号の初期位相のみを、参照音声信号の初期位相に合わせ込んだ場合に生成された音声信号を表したチャートである。
【0009】
例えば、VoIPを採用した音声信号伝送システムおいて、送話者と受話者とが通話をしている場合であって、受話者が受話器を通して聞く送話者の声が、VoIP端末(例えば音声信号符号化・復号化装置等)等の障害により音声の歪み等を生じている場合、受話者が受話器を通して送話者の声を聞く声(被評価音声信号T)は、送話者が受話器に対して話しかけている声(参照音声信号R)に対して歪み等が生じ、快適な通話が維持されていない状態である。
【0010】
上記例で挙げたような状態において、図2に示すように、P.861勧告の音声信号品質評価方法によると、被評価音声信号Tの全波形の初期位相と参照音声信号Rの全波形の初期位相とを合わせ込み、人間の聴覚特性に基づいて、両者の全波形を比較し、被評価音声信号を客観的に評価することができる。
【0011】
すなわち、P.861勧告の音声信号品質評価方法は、音声信号符号化・復号化による歪み等によって劣化した音声信号を主観的な評価と高い相関性で客観的に評価する方法である。
【0012】
【発明が解決しようとする課題】
上述したように、P.861勧告の音声信号品質評価方法によれば、被評価音声信号の全波形の初期位相を合わせ込むことによって、客観的な音声信号の評価値を得ることができる。
【0013】
しかしながら、P.861勧告の音声信号品質評価方法は、ネットワーク伝送などによって遅延やゆらぎ等が生じた音声信号に対しては、適正な品質評価を得ることができない場合がある。
【0014】
すなわち、ネットワーク伝送などによって遅延やゆらぎ等が生じた音声信号に対しては、P.861勧告の音声信号品質評価方法による評価と主観的音声信号品質評価方法による評価とを比較した場合に、P.861勧告の音声信号品質評価方法による評価が適正でない評価をする場合がある。
【0015】
これは、P.861勧告の音声信号品質評価方法による評価が、上述したように被評価音声信号の全波形の初期位相のみしか、参照音声信号の全波形の初期位相に合わせ込んでおらず、ネットワーク伝送による音声信号の遅延やゆらぎ等を考慮していないからである。
【0016】
すなわち、P.861勧告の従来の音声信号品質評価方法では、音声信号符号化・復号化装置(CODEC)等で生じる音声信号の歪み等は考慮して評価しているが、ネットワーク伝送によって生じる遅延やゆらぎ等は考慮していないためである。
【0017】
図2における音声信号T’に示されるように、被評価音声信号Tの全波形の初期位相のみを、参照音声信号Rの全波形の初期位相に合わせ込んだとしても、遅延ゆらぎが生じた部分(図2中の1の部分)以降は、位相が合わなくなっていることがわかる(但し、図2中の矢印2〜3の間の音声は、ネットワーク伝送中において、欠落したことを示す)。
【0018】
VoIPを採用した音声信号伝送システムにおいて、ネットワーク構成やネットワークトラフィック量等が原因で遅延やゆらぎ等が生じてしまうのが現状であり、このようにして生じた遅延やゆらぎ等を考慮した客観的音声信号品質評価装置及び方法に対しての要望が強い。
【0019】
そのため、ネットワーク伝送によって生じた遅延やゆらぎ等の劣化要因を複合的に含んだ音声信号に対しても、有効かつ適正に音声信号品質評価をすることができる音声信号品質評価装置及び音声信号品質評価方法が求められている。
【0020】
【課題を解決するための手段】
かかる課題を解決するために、第1の発明に係る音声信号品質評価装置は、外部から受信した、参照音声信号と、参照音声信号と同一波形であることが期待される少なくとも遅延ゆらぎを含んだ被評価音声信号との位相差に基づいて、被評価音声信号の品質を評価する音声信号品質評価装置において、少なくとも遅延ゆらぎを含んだ被評価音声信号に対してフレームを生成するフレーム生成手段と、フレーム生成手段から受け取ったフレーム毎の有音な被評価音声信号と、参照音声信号との相関値が最大となる位相調整量を求め、相関値が最大となる上記フレーム毎の被評価音声信号の波形の位相に上記位相調整量分だけずらし込むことにより、被評価音声信号の遅延ゆらぎをフレーム毎に補正する遅延補正手段と、遅延補正手段によってフレーム毎の遅延ゆらぎが補正された被評価音声信号を繋ぎ合わせた位相補正音声信号と、参照音声信号とに基づいて、所定の客観的音声信号品質評価方式に従って、位相補正音声信号の第1の評価値を求める第1の品質評価手段と、遅延補正手段が補正した被評価音声信号の位相調整量と第1の評価値の単位値の劣化に要する遅延時間とから遅延ゆらぎ時間に対する位相調整量を求め、第1の品質評価手段が求めた第1の評価値と、遅延ゆらぎ時間に対する位相調整量とを合わせることにより、被評価音声信号の第2の評価値を求める第2の品質評価手段とを備えることを特徴とする。
【0021】
また、第2の発明に係る音声信号品質評価方法は、上述した第1の発明と対応するものであり、外部から受信した、参照音声信号と、参照音声信号と同一波形であることが期待される少なくとも遅延ゆらぎを含んだ被評価音声信号との位相差に基づいて、被評価音声信号の品質を評価する音声信号品質評価方法において、少なくとも遅延ゆらぎを含んだ被評価音声信号に対してフレームを生成し、フレーム毎の有音な被評価音声信号と、参照音声信号との相関値が最大となる位相調整量を求め、相関値が最大となる上記フレーム毎の被評価音声信号の波形の位相に上記位相調整量分だけずらし込むことにより、被評価音声信号の遅延ゆらぎをフレーム毎に補正し、フレーム毎の遅延ゆらぎが補正された被評価音声信号を繋ぎ合わせた位相補正音声信号と、参照音声信号とに基づいて、所定の客観的音声信号品質評価方式に従って、位相補正音声信号の第1の評価値を求め、補正した被評価音声信号の位相調整量と第1の評価値の単位値の劣化に要する遅延時間とから遅延ゆらぎ時間に対する位相調整量を求め、上記第1の評価値と、遅延ゆらぎ時間に対する位相調整量とを合わせることにより、被評価音声信号の第2の評価値を求めることを特徴とする。
【0022】
【発明の実施の形態】
(A)第1の実施形態
以下、本発明の音声信号品質評価装置及び音声信号品質評価方法の第1の実施形態を図1、図3及び図4を参照して説明する。
【0023】
第1の実施形態は、P.861勧告に記載されている音声信号品質評価値算出方法を採用した音声信号品質評価装置及び音声信号品質評価方法である。
【0024】
(A)第1の実施形態の構成
図1は、第1の実施形態に係る音声信号品質評価装置の構成を示したブロック図である。
【0025】
第1の実施形態に係る音声信号品質評価装置は、位相調整回路部101と、客観的品質評価値計算回路部102と、遅延劣化評価値計算回路部103と、を備えている。
【0026】
位相調整回路部101は、外部から参照音声信号X(n)と被評価音声信号Y(n)とを受け取り、被評価音声信号Y(n)を所定間隔のサンプリングによりフレーム化し、そのフレーム毎の被評価音声信号の波形と、受け取った参照音声信号の波形との位相差を比較して、位相差をなくすために求めた位相調整量Lmに基づいて、被評価音声信号が含んでいる遅延やゆらぎ等を補正した位相補正音声信号Y’(n)を生成するものである。位相調整回路部101は、そのようにして生成された位相補正音声信号Y’(n)を、客観的品質評価値計算回路部102に与えるものである。
【0027】
ここで、参照音声信号X(n)とは、例えば、通話において送話者が受話器に向かって話す送話者の声等であり、被評価音声信号Y(n)とは、例えば、VoIPを採用した音声信号伝送システム等のネットワークを介して受話者が受話器を通して聞く送話者の声等である。
【0028】
また、位相調整回路部101は、フレーム毎に求めた位相調整量Lmに基づいて、被評価音声信号Y(n)の全波形についての平均位相調整量Laを求め、その求めた平均位相調整量Laを、遅延劣化品質評価値計算回路部103へ与えるものである。位相調整回路部101の内部構成については後述する。
【0029】
客観的評価値計算回路部102は、位相調整回路部101が求めた位相補正音声信号Y’(n)と、参照音声信号X(n)とを受け取り、従来のITU−T勧告のP.861に記載されている音声信号品質評価方法により、客観的品質評価値Pが求められ、その求められた客観的品質評価値Pを遅延劣化評価値計算回路部103へ与えるものである。ここで、この音声信号品質評価方法は、参照音声信号と被評価音声信号をフーリエ変換し、さらに聴覚特性を加味した変換を行い、受話器の特性を加味し比較する。
【0030】
客観的品質評価値Pは、従来のP.861勧告の音声信号品質評価方法による評価値である。また、ここで評価される音声信号は、図2中の矢印1等に代表される遅延やゆらぎ等を補正した位相補正音声信号Y’(n)である。
【0031】
従って、遅延やゆらぎ等が生じた場合であっても、評価される際は既にその遅延やゆらぎ等が補正されている音声信号であるので、従来よりも適性に評価することができる。
【0032】
遅延劣化評価値計算回路部103は、客観的品質評価値計算回路部102から客観的品質評価値Pと、位相調整回路部101から平均位相調整量Laとを受け取り、これら客観的品質評価値Pと平均位相調整量Laとに基づいて、遅延ゆらぎ時間を考慮した遅延劣化品質評価値Qを求めるものである。
【0033】
遅延劣化評価値計算回路部103が遅延劣化品質評価値Qを求める方法は、例えば予め設定された客観的評価値Pが「1」減少するときに要する遅延時間Zを用いて、下記式(1)に従うようにして求める(客観的評価値Pは、0≦P≦7となり、客観的評価値Pの最もよい値は「0」、最も悪い値は「7」とする)。
【0034】
Q=P+(La/Z) …(1)
ここで、予め設定された客観的評価値Pが「1」減少するときに要する遅延時間Zとは、例えば遅延時間が200ms生じた場合に、客観的評価値Pが「1」減少するであろうというときの遅延時間をいう。このように遅延時間が200ms生じた場合に客観的評価値Pが1減少するとした場合には、P.861勧告に従って、遅延劣化品質評価値は0≦Q≦7となる(遅延劣化品質評価値Qの最もよい値は「0」、最も悪い値は「7」とする)。
【0035】
すなわち(La/Z)の値は、客観的評価値Pの補正値であり、被評価音声信号波形の遅延補正に要する位相調整量(ここでは平均位相調整量La)に応じて客観的評価値Pを補正するものである。
【0036】
次に、位相調整回路部101の内部構成について説明する。
【0037】
図3は、位相調整回路部101の内部構成を示したブロック図である。
【0038】
図3に示すように位相調整回路部101は、フレーム作成部201と、有音無音判定部202と、位相調整量算出部203と、位相補正音声信号作成部204と、平均位相調整量計算部205と、を備えている。
【0039】
フレーム作成部201は、与えられた被評価音声信号に対して、予め設定された所定のサンプリング間隔によってサンプリングし、そのサンプリングしたサンプル数N(Nは自然数)を1フレームとし、フレーム毎の被評価音声信号を有音無音判定部202に与えるものである。
【0040】
有音無音判定部202は、フレーム作成部201からフレーム毎の被評価音声信号を与えられ、そのフレーム毎にフレームパワーW(第mフレームのフレームパワーをWmとする(mは0以上の整数)。)を求め、予め設定された有音無音判定閾値Wtに基づいて、そのフレーム毎の被評価音声信号が有音であるか無音であるかを判定するものである。有音無音判定部202は、有音と判定したフレームの被評価音声信号Y(n)を位相調整量算出部203に与えるものである。
【0041】
ここで、有音無音判定部202が、有音であるか否かの判定方法について説明する。
【0042】
有音無音判定部202が求めるフレームパワーWmは、下記式(2)に示すようにして求める。
【0043】
【数1】
有音無音判定部202は、上記式(2)から分かるようにフレーム毎の被評価音声信号波形について自乗したものからフレームパワーWmを求めている。
【0044】
また、有音であるか否かの判定は、求められたフレームパワーWmと、予め設定された有音判定閾値Wtとを比較して、フレームパワーがWmが有音判定閾値Wtよりも大きい場合(Wm>Wt)を有音であるとする。
【0045】
位相調整量算出部203は、有音無音判定部202において有音と判定されたフレーム毎の被評価音声信号Y(n)が与えられ、そのフレームの被評価音声信号Y(n)の波形と、位相lだけずらした参照音声信号X(n)の波形との相互相関値Cをとり、その相互相関値Cが最大となり、ネットワークによる遅延を補正するような位相lの値を位相調整量Lmとして求めるものである。
【0046】
【数2】
位相補正音声信号作成部204は、位相調整量算出部203が求めたフレーム毎の相互相関値Cの最大値に基づいて、フレーム毎に被評価音声信号の波形を調整して、被評価音声信号の全波形の位相を合わせこんで位相補正した位相補正音声信号Y’(n)を作成するものである。位相補正音声信号作成部204は、作成した位相補正音声信号Y’(n)を客観的品質評価値計算部102へ与えるものである。
【0047】
ここで、位相補正音声信号作成部204が、フレーム毎の被評価音声信号の波形を調整する方法について図4を参照して説明する。
【0048】
図4は、遅延位相の補正動作の様子を示したチャートである。
【0049】
位相調整量算出部203から与えられるフレーム毎の相互相関値Cが最大値となる波形、すなわち波形の相関が高くなる位相lの値を探し、その波形の相関が高い位相に、フレーム毎の被評価音声信号の波形をずらし込むことによって遅延ゆらぎを補正することができる。つまり、位相補正音声信号作成部204は、フレーム毎に遅延位相の補正をする。
【0050】
このような被評価音声信号の波形のずらし込みを、全てのフレームについて行うことにより、被評価音声信号の全波形の遅延ゆらぎを補正することができる。
【0051】
また、例えば、フレームの被評価音声信号の波形をずらし込む場合であって、前フレームの波形と重なり合ってしまうときには、前フレームの重なり合ってしまう波形に上書きするようにしても良い。
【0052】
平均位相調整量計算部205は、位相調整量算出部203からフレーム毎の位相調整量Lmを受け取り、この受け取った位相調整量Lmに基づいて、被評価音声信号の全信号(全波形)についての平均位相調整量Laを計算して、その計算した平均位相調整量Laを、遅延劣化品質評価値計算回路部103へ与えるものである。ここで、平均位相調整量Laの求め方は、例えば、全てのフレームについて、各フレーム毎の位相調整量Lmの総和を求めて、全フレームの数で割ることで求めたり、また、別の統計的に求めても良い。
【0053】
(A−2)第1の実施形態の動作
以下、第1の実施形態に係る音声信号品質評価装置の動作について説明する。
【0054】
参照音声信号X(n)及び被評価音声信号Y(n)は、位相調整回路部101に与えられる。
【0055】
位相調整回路部101のフレーム作成部201において、被評価音声信号Y(n)は所定間隔毎のサンプリングにより分割されて、所定サンプル数Nを1フレームとするようなフレームが作成される。
【0056】
被評価音声信号Y(n)は、作成されたフレーム毎に有音無音判定部202に与えられる。
【0057】
有音無音判定部202において、フレーム毎の被評価音声信号Y(n)は、フレーム毎のフレームパワーWm(mは第mフレームとする)を求められる。このフレームパワーWmは、上記式(2)に従って求められる。
【0058】
この求められたフレームパワーWmは、有音無音判定部202において予め設定された有音判定閾値Wtと比較されて、フレームパワーWmが、この有音判定閾値Wtよりも大きいときには、そのフレームに対する被評価音声信号Y(n)は有音であると判定される。
【0059】
このようにして有音であると判定された被評価音声信号Y(n)のフレームは、位相調整量算出部203に与えられる。
【0060】
位相調整量算出部203において、有音であると判定された被評価音声信号Y(n)のフレーム波形は、位相lだけずらした参照音声信号X(n)の波形と相互相関を求められる。そのとき、その相互相関値Cが最大となったときの位相lを位相調整量Lmとする。
【0061】
この位相調整量Lmは、平均位相調整量計算部205に与えられる。平均位相調整量計算部205において、注目されるフレームより与えられた位相調整量Lmに基づいて、被評価音声信号Y(n)の全フレームについての平均位相調整量Laが求められる。
【0062】
また、相互相関値Cが最大となったときの位相調整量Lmが求められた被評価音声信号Y(n)のフレーム波形は、位相補正音声信号作成部において、次の有音と判定されたフレーム波形によってずらし込まれる。このとき、フレーム単位でずらし込まれるので、例えば、当該被評価音声信号のフレームが有している波形に対してずらし込まれる場合には、そのずらし込む波形を上書きするようにする。
【0063】
このようにして、全フレームに対してのずらし込みが行なわれることにより、被評価音声信号Y(n)の全波形に対して遅延ゆらぎの補正が完成され、位相補正音声信号Y’(n)が生成される。
【0064】
この生成された位相補正音声信号Y’(n)は、客観的品質評価計算回路部102に与えられる。
【0065】
客観的品質評価値計算回路部102において、与えられた位相補正音声信号Y’(n)と参照音声信号X(n)とに基づいて、P.861勧告の音声信号品質評価方法に従って、客観的品質評価値Pが求められる。すなわち、与えられた位相補正音声信号Y’(n)は遅延やゆらぎ等について位相補正されたものである。従って、客観的品質評価値計算回路部102において、被評価音声信号(すなわち、ここでは位相補正音声信号Y’(n)である)の初期位相のみを、参照音声信号X(n)の初期位相に組み合せることによって位相の補正をすることができる。
【0066】
求められた客観的品質評価値Pは、遅延劣化評価値計算回路部103に与えられる。また、位相調整回路部101で求められた平均位相調整量Laも遅延劣化評価値計算回路部103に与えられる。
【0067】
遅延劣化評価値計算回路部103において、与えられた客観的品質評価値Pと平均位相調整量Laに基づいて、遅延劣化品質評価値Qが求められる。
【0068】
この遅延劣化品質評価Qは、下記式(1)のようにして求められる。
【0069】
Q=P+(La/Z) …(1)
Zは、予め設定された客観的評価値Pが「1」減少するときに要する遅延時間である。
【0070】
(A−3)第1の実施形態の効果
以上、第1の実施形態に係る音声信号品質評価装置によれば、客観的品質評価値計算回路部102の前段に、位相調整回路部101を備えることにより、被評価音声信号が有する遅延やゆらぎ等を考慮して位相を補正することができるので、客観的品質評価計算回路部102によって得られる評価値が、より適正に求めることができる。
【0071】
また、遅延やゆらぎ等の位相補正に係る位相調整量に基づいて、遅延等劣化に係る位相調整量を考慮した評価値を求めることができる。
【0072】
(B)その他の実施形態
第1の実施形態の音声信号品質評価装置は、音声信号符号化・復号化装置(CODEC)のみの評価もすることができ、第1の実施形態の客観的品質評価値Pが、音声信号符号化・復号化装置の評価に相当する。
【0073】
【発明の効果】
以上、本発明の音声信号品質評価装置及び方法によれば、遅延補正手段及び離縁劣化評価手段を設けることにより、フレーム化した被評価音声信号と参照音声信号との相関値が最大となる位相調整量に基づいて、被評価音声信号の遅延を補正することができ、その位相調整量と遅延を補正した音声信号の評価値とに基づいて、被評価音声信号の評価値を求めることができるので、ネットワーク伝送等によって生じた遅延やゆらぎ等の劣化要因を複合的に含んだ被評価音声信号についての品質を適正に評価することができる。
【図面の簡単な説明】
【図1】第1の実施形態に係る音声信号品質評価装置の構成を示したブロック図である。
【図2】従来の客観的音声信号品質評価方法によって被評価音声信号の初期位相を組み合せが行なわれる動作説明する説明図である。
【図3】第1の実施形態に係る位相調整回路部101の内部構成を示したブロック図である。
【図4】第1の実施形態に係る遅延位相の補正動作を説明する説明図である。
【符号の説明】
101…位相調整回路部、102…客観的品質評価値計算部、
103…遅延劣化品質評価値計算部、201…フレーム作成部、
202…有音無音判定部、203…位相調整量算出部、
204…位相補正音声信号作成部、205…平均位相調整量計算部。
Claims (3)
- 外部から受信した、参照音声信号と、当該参照音声信号と同一波形であることが期待される少なくとも遅延ゆらぎを含んだ被評価音声信号との位相差に基づいて、当該被評価音声信号の品質を評価する音声信号品質評価装置において、
少なくとも遅延ゆらぎを含んだ被評価音声信号に対してフレームを生成するフレーム生成手段と、
上記フレーム生成手段から受け取ったフレーム毎の有音な被評価音声信号と、上記参照音声信号との相関値が最大となる位相調整量を求め、相関値が最大となる上記フレーム毎の被評価音声信号の波形の位相に上記位相調整量分だけずらし込むことにより、上記被評価音声信号の遅延ゆらぎをフレーム毎に補正する遅延補正手段と、
上記遅延補正手段によってフレーム毎の遅延ゆらぎが補正された上記被評価音声信号を繋ぎ合わせた位相補正音声信号と、上記参照音声信号とに基づいて、所定の客観的音声信号品質評価方式に従って、当該位相補正音声信号の第1の評価値を求める第1の品質評価手段と、
上記遅延補正手段が補正した被評価音声信号の位相調整量と上記第1の評価値の単位値の劣化に要する遅延時間とから遅延ゆらぎ時間に対する位相調整量を求め、上記第1の品質評価手段が求めた上記第1の評価値と、上記遅延ゆらぎ時間に対する位相調整量とを合わせることにより、上記被評価音声信号の第2の評価値を求める第2の品質評価手段と
を備えることを特徴とする音声信号品質評価装置。 - 上記遅延補正手段は、
上記フレーム毎の被評価音声信号が、有音であるか否かを判定する有音判定部と、
上記有音判定部によって有音であると判定されたフレーム毎の被評価音声信号について、上記参照音声信号との相関値が最大となる位相調整量をフレーム毎に求める位相調整量算出部と、
上記位相調整量算出部から位相調整が必要なフレームについて、当該フレームの前のフレームに対してずらし込むことで遅延ゆらぎを補正して、位相補正音声信号を生成する位相補正音声信号生成部と、
上記位相調整算出部が求めたフレーム毎の位相調整量に基づいて、上記被評価音声信号の位相調整量を求める平均調整量計算部と
を有することを特徴とする請求項1に記載の音声信号品質評価装置。 - 外部から受信した、参照音声信号と、当該参照音声信号と同一波形であることが期待される少なくとも遅延ゆらぎを含んだ被評価音声信号との位相差に基づいて、当該被評価音声信号の品質を評価する音声信号品質評価方法において、
少なくとも遅延ゆらぎを含んだ被評価音声信号に対してフレームを生成し、
上記フレーム毎の有音な被評価音声信号と、上記参照音声信号との相関値が最大となる位相調整量を求め、相関値が最大となる上記フレーム毎の被評価音声信号の波形の位相に上記位相調整量分だけずらし込むことにより、上記被評価音声信号の遅延ゆらぎをフレーム毎に補正し、
上記フレーム毎の遅延ゆらぎが補正された上記被評価音声信号を繋ぎ合わせた位相補正音声信号と、上記参照音声信号とに基づいて、所定の客観的音声信号品質評価方式に従って、当該位相補正音声信号の第1の評価値を求め、
上記補正した被評価音声信号の位相調整量と上記第1の評価値の単位値の劣化に要する遅延時間とから遅延ゆらぎ時間に対する位相調整量を求め、上記第1の評価値と、上記遅延ゆらぎ時間に対する位相調整量とを合わせることにより、上記被評価音声信号の第2の評価値を求める
ことを特徴とする音声信号品質評価方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2001365512A JP3868278B2 (ja) | 2001-11-30 | 2001-11-30 | 音声信号品質評価装置及びその方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2001365512A JP3868278B2 (ja) | 2001-11-30 | 2001-11-30 | 音声信号品質評価装置及びその方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2003167596A JP2003167596A (ja) | 2003-06-13 |
JP3868278B2 true JP3868278B2 (ja) | 2007-01-17 |
Family
ID=19175525
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2001365512A Expired - Fee Related JP3868278B2 (ja) | 2001-11-30 | 2001-11-30 | 音声信号品質評価装置及びその方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3868278B2 (ja) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7305341B2 (en) * | 2003-06-25 | 2007-12-04 | Lucent Technologies Inc. | Method of reflecting time/language distortion in objective speech quality assessment |
CN1321400C (zh) * | 2005-01-18 | 2007-06-13 | 中国电子科技集团公司第三十研究所 | 客观音质评价中基于噪声掩蔽门限算法的巴克谱失真测度方法 |
CN1321390C (zh) * | 2005-01-18 | 2007-06-13 | 中国电子科技集团公司第三十研究所 | 客观音质评价归一化主客观统计相关模型的建立方法 |
JP2007049462A (ja) * | 2005-08-10 | 2007-02-22 | Ntt Docomo Inc | 音声品質評価装置、音声品質評価プログラム及び音声品質評価方法 |
JP4666485B2 (ja) * | 2005-08-18 | 2011-04-06 | Kddi株式会社 | 音声信号のセグメント境界整合方式 |
-
2001
- 2001-11-30 JP JP2001365512A patent/JP3868278B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2003167596A (ja) | 2003-06-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Liang et al. | Adaptive playout scheduling and loss concealment for voice communication over IP networks | |
JP5277508B2 (ja) | マルチ・チャンネル音響信号をエンコードするための装置および方法 | |
JP4456601B2 (ja) | 音声データ受信装置および音声データ受信方法 | |
JP4098083B2 (ja) | 電気通信網における電話リンクの会話品質の測定 | |
US6735192B1 (en) | Method and apparatus for dynamically varying a packet delay in a packet network based on a log-normal delay distribution | |
JP5357904B2 (ja) | 変換補間によるオーディオパケット損失補償 | |
JP4320033B2 (ja) | 音声パケット送信方法、音声パケット送信装置、および音声パケット送信プログラムとそれを記録した記録媒体 | |
JP2009050013A (ja) | エコー検出および監視 | |
Hines et al. | ViSQOL: The virtual speech quality objective listener | |
KR20190027820A (ko) | 청력 테스트 및 오디오 신호들의 수정 | |
JP5153791B2 (ja) | ステレオ音声復号装置、ステレオ音声符号化装置、および消失フレーム補償方法 | |
JP2006115498A (ja) | 音声品質自動測定発表テストシステム | |
US20060245364A1 (en) | Bi-directional continuous voice and video quality testing system with TTMF tones | |
US20200112600A1 (en) | Managing jitter buffer length for improved audio quality | |
JP3868278B2 (ja) | 音声信号品質評価装置及びその方法 | |
CN109817235B (zh) | 一种VoIP设备的回声消除方法 | |
US8000976B2 (en) | Speech band extension device | |
WO2021120795A1 (zh) | 采样率处理方法、装置、系统、存储介质和计算机设备 | |
Hines et al. | Detailed comparative analysis of PESQ and VISQOL behaviour in the context of playout delay adjustments introduced by VOIP jitter buffer algorithms | |
JPS62239631A (ja) | ステレオ音声伝送蓄積方式 | |
Agnihotri et al. | A new technique for improving quality of speech in voice over IP using time-scale modification | |
JP4116955B2 (ja) | 音声品質客観評価装置および音声品質客観評価方法 | |
Liu et al. | Quality enhancement of packet audio with time-scale modification | |
JP5210788B2 (ja) | 音声信号通信システム、音声合成装置、音声合成処理方法、音声合成処理プログラム、並びに該プログラムを格納した記録媒体 | |
Aoki | A VoIP packet loss concealment technique taking account of pitch variation in pitch waveform replication |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20040921 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20060711 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20060725 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20060921 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20061010 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20061010 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 Ref document number: 3868278 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101020 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111020 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111020 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121020 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121020 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131020 Year of fee payment: 7 |
|
LAPS | Cancellation because of no payment of annual fees |