JP7298719B2 - 音声品質推定装置、音声品質推定方法及びプログラム - Google Patents
音声品質推定装置、音声品質推定方法及びプログラム Download PDFInfo
- Publication number
- JP7298719B2 JP7298719B2 JP2021577781A JP2021577781A JP7298719B2 JP 7298719 B2 JP7298719 B2 JP 7298719B2 JP 2021577781 A JP2021577781 A JP 2021577781A JP 2021577781 A JP2021577781 A JP 2021577781A JP 7298719 B2 JP7298719 B2 JP 7298719B2
- Authority
- JP
- Japan
- Prior art keywords
- sequence
- series
- quality
- voice
- quality estimation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 14
- 230000006866 deterioration Effects 0.000 claims description 53
- 238000004364 calculation method Methods 0.000 claims description 19
- 230000015556 catabolic process Effects 0.000 claims description 14
- 238000006731 degradation reaction Methods 0.000 claims description 14
- 230000006870 function Effects 0.000 claims description 13
- 238000009499 grossing Methods 0.000 claims description 9
- 238000013441 quality evaluation Methods 0.000 claims description 8
- 238000013507 mapping Methods 0.000 claims description 6
- 230000008447 perception Effects 0.000 claims description 4
- 238000004891 communication Methods 0.000 description 16
- 238000012545 processing Methods 0.000 description 12
- 238000010586 diagram Methods 0.000 description 9
- 238000011156 evaluation Methods 0.000 description 5
- 238000007726 management method Methods 0.000 description 5
- 230000005540 biological transmission Effects 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 238000004088 simulation Methods 0.000 description 2
- 238000005094 computer simulation Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
- G10L25/60—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for measuring the quality of voice signals
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/69—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for evaluating synthetic or decoded voice signals
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/005—Correction of errors induced by the transmission channel, if related to the coding algorithm
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/22—Arrangements for supervision, monitoring or testing
- H04M3/2236—Quality of speech transmission monitoring
Landscapes
- Engineering & Computer Science (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
- Monitoring And Testing Of Exchanges (AREA)
- Telephonic Communication Services (AREA)
Description
本発明は、音声品質推定装置、音声品質推定方法及びプログラムに関する。
ネットワークや端末性能パラメータを用いて、音声通話における音声品質を推定するE-modelが従来から知られている(非特許文献1)。E-modelでは、ネットワークの性能指標であるパケット損失率とBurstRを用いることで、パケットネットワークのパケット損失が音声品質に与える影響の評価を可能にしている。
ここで、E-modelで音声品質を推定する際におけるパケット損失のバースト性の評価尺度として、或るパケットの損失が発見された場合、この損失パケットよりも1つ前のパケットから所定の長さ分遡ったパケット系列のパタンに対して、当該損失パケットに近いパケットが損失しているほど損失への重みを大きくすることが提案されている(非特許文献2)。また、通話中のパケットの損失パタンに対して損失のランダム性の高いgap状態とバースト性の高いburst状態とを定義することで音声品質を推定する手法も知られている(非特許文献3)。
非特許文献1に記載されているE-modelによる音声品質推定と、非特許文献2に記載されている評価尺度を適用したE-modelによる音声品質推定と、非特許文献3に記載されている音声品質推定との比較も行なわれている(非特許文献4)。また、或る期間に亘った音声品質について、突発的に発生した品質劣化では、損失発生期間のバースト性が異なってもユーザにとっては同程度の音声品質が知覚されることが知られている(非特許文献5)。
ITU-T G.107 The E-model: a computational model for use in transmission planning
H. Zhang, L. Xie, J. Byun, P. Flynn, C. Shim, "Packet Loss Burstiness and Enhancement to the E-Model"
A. D. Clark, "Modeling the Effects of Burst Packet Loss and Recency on Subjective Voice"
S. Jelassi, G. Rubino, "A Comparison Study of Automatic Speech Quality Assessors Sensitive of Packet Loss Burstiness"
「IP電話サービスにおけるバースト損失の影響の主観品質評価」信学技報IEICE Technical Report CQ2019-3(2019.4)
ところで、非特許文献1では、観測されたバースト損失の平均長をBurstRとして用いている。このため、バースト損失の分布情報が欠落し、或る期間に亘ってバースト損失の平均長が同じであれば同一のBurstRが算出される。したがって、非特許文献1に記載されているE-modelによる音声品質推定ではバースト損失の分布が異なってもその平均長が同じであれば同じ品質が算出され、非特許文献5に記載されている音声品質の特徴を捉えることができない。
また、非特許文献2に記載されている評価尺度を適用したE-modelによる音声品質推定では、当該評価尺度により、連続してパケットが損失するほど音声品質の劣化量が単調増加する。したがって、必ずしも連続してパケットが損失してないが、或る範囲にまとまって突発的に発生するパケット損失が音声品質に与える影響を的確にとらえることができない。
更に、非特許文献4では、非特許文献3に記載されている音声品質推定の性能は、非特許文献1に記載されているE-modelによる音声品質推定の性能や非特許文献2に記載されている評価尺度を適用したE-modelによる音声品質推定の性能よりも低いことが示されている。したがって、非特許文献3に記載されている音声品質推定でもパケット損失のバースト性を的確に捉えられていない。
以上のように従来の音声品質推定では、定常的なパケット損失による品質劣化(つまり、ランダム的に発生するパケット損失による品質劣化)以外の突発的な品質劣化(つまり、バースト的に発生するパケット損失による品質劣化)を的確に捉えることができなかった。
本発明の一実施形態は、上記の点に鑑みてなされたもので、通信ネットワークを介した音声通話における音声品質を高い精度で推定することを目的とする。
上記目的を達成するため、一実施形態に係る音声品質推定装置は、音声通話の各パケットが損失したか否かをそれぞれ示す各要素で構成される系列に対して、パケット損失による品質劣化がまとまってユーザに知覚されることを表す第1の特徴を反映した第1の系列を作成する第1の系列作成手段と、前記第1の系列作成手段により作成された第1の系列に対して、品質劣化が大きいほどユーザがより品質劣化を知覚しやすいことを表す第2の特徴を反映した第2の系列を作成する第2の系列作成手段と、前記第2の系列作成手段により作成された第2の系列に対して、パケット損失補償によって品質劣化の知覚が緩和されることを表す第3の特徴を反映した第3の系列を作成する第3の系列作成手段と、前記第3の系列作成手段により作成された第3の系列から単位時間あたりの劣化量を算出する算出手段と、音声品質の劣化量とユーザの主観による音声品質の評価値との間の関係性を示すマッピング関数を用いて、前記算出手段により算出された劣化量から、ユーザが体感する音声品質を推定する推定手段と、を有することを特徴とする。
通信ネットワークを介した音声通話における音声品質を高い精度で推定することができる。
以下、本発明の一実施形態について説明する。以降の各実施形態では、通信ネットワークを介した音声通話における音声品質(より正確には、ユーザが体感する音声品質)を高い精度で推定することが可能な音声品質推定システム1について説明する。
[第一の実施形態]
まず、第一の実施形態について説明する。
まず、第一の実施形態について説明する。
<音声品質推定システム1の全体構成>
第一の実施形態に係る音声品質推定システム1の全体構成について、図1を参照しながら説明する。図1は、第一の実施形態に係る音声品質推定システム1の全体構成の一例を示す図である。
第一の実施形態に係る音声品質推定システム1の全体構成について、図1を参照しながら説明する。図1は、第一の実施形態に係る音声品質推定システム1の全体構成の一例を示す図である。
図1に示すように、第一の実施形態に係る音声品質推定システム1には、音声品質推定装置10と、パケットキャプチャ装置20と、送信端末30と、受信端末40とが含まれる。
送信端末30は、通信ネットワークNを介して音声通話パケット(以下、単に「パケット」ともいう。)を送信する端末である。受信端末40は、通信ネットワークNを介してパケットを受信する端末である。送信端末30及び受信端末40としては、音声通話パケットを送受信可能な任意の端末、装置又は機器を用いることが可能である。例えば、送信端末30及び受信端末40として、音声通話を行うためのアプリケーションプログラムがインストールされたPC(パーソナルコンピュータ)、スマートフォン、タブレット端末、ウェアラブルデバイス、IoT(Internet of Things)機器、ゲーム機器等を用いることが可能である。なお、通信ネットワークNは、例えば、インターネット等の任意のネットワークである。
パケットキャプチャ装置20は、送信端末30から受信端末40に送信されたパケットをキャプチャする装置である。以降では、パケットキャプチャ装置20によりキャプチャされたパケットを「キャプチャパケット」とも表す。パケットキャプチャ装置20としては、パケットをキャプチャ可能な任意の端末、装置又は機器を用いることが可能である。例えば、パケットキャプチャ装置20は、パケットをキャプチャするためのアプリケーションプログラムがインストールされたPCやルータ等を用いることが可能である。
音声品質推定装置10は、キャプチャパケットを用いて、音声通話サービスのユーザ(つまり、受信端末40のユーザ)が体感する音声品質を推定する装置である。ここで、音声品質推定装置10は、定常的でない品質劣化(つまり、バースト的に発生するパケット損失による品質劣化)を定量化する際に、以下の(a)~(c)の3つの特徴を反映させることで、ユーザが体感(知覚)する音声品質を高い精度で推定することが可能になる。
(a)パケット損失による品質劣化がまとまってユーザに知覚されるという特徴
(b)品質劣化が大きいほど、ユーザがより品質劣化を知覚しやすいという特徴
(c)パケット損失補償(PLC:Packet Loss Concealment)によって品質劣化の知覚が緩和されるという特徴
ただし、上記の(a)~(c)は、バースト的に発生するパケット損失(以下、「バースト損失」ともいう。)だけでなく、従来のランダム的に発生するパケット損失(以下、「ランダム損失」ともいう。)による品質劣化を定量化する際にも有効な特徴である。したがって、上記の(a)~(c)の特徴を反映することで、音声通話サービスのパケット損失(バースト損失・ランダム損失を問わないパケット損失)による音声品質の劣化量を的確に定量化することが可能となる。
(b)品質劣化が大きいほど、ユーザがより品質劣化を知覚しやすいという特徴
(c)パケット損失補償(PLC:Packet Loss Concealment)によって品質劣化の知覚が緩和されるという特徴
ただし、上記の(a)~(c)は、バースト的に発生するパケット損失(以下、「バースト損失」ともいう。)だけでなく、従来のランダム的に発生するパケット損失(以下、「ランダム損失」ともいう。)による品質劣化を定量化する際にも有効な特徴である。したがって、上記の(a)~(c)の特徴を反映することで、音声通話サービスのパケット損失(バースト損失・ランダム損失を問わないパケット損失)による音声品質の劣化量を的確に定量化することが可能となる。
なお、図1に示す音声品質推定システム1の構成は一例であって、他の構成であってもよい。例えば、パケットキャプチャ装置20は受信端末40と一体となっていてもよいし、又は音声品質推定装置10と一体となっていてもよい。すなわち、受信端末40がパケットをキャプチャする機能を備えていてもよいし、音声品質推定装置10がパケットをキャプチャする機能を備えていてもよい。
<音声品質推定装置10のハードウェア構成>
次に、第一の実施形態に係る音声品質推定装置10のハードウェア構成について、図2を参照しながら説明する。図2は、第一の実施形態に係る音声品質推定装置10のハードウェア構成の一例を示す図である。
次に、第一の実施形態に係る音声品質推定装置10のハードウェア構成について、図2を参照しながら説明する。図2は、第一の実施形態に係る音声品質推定装置10のハードウェア構成の一例を示す図である。
図2に示すように、第一の実施形態に係る音声品質推定装置10は一般的なコンピュータ又はコンピュータシステムであり、入力装置11と、表示装置12と、外部I/F13と、通信I/F14と、プロセッサ15と、メモリ装置16とを有する。これら各ハードウェアは、それぞれがバス17を介して通信可能に接続されている。
入力装置11は、例えば、キーボードやマウス、タッチパネル等である。表示装置12は、例えば、ディスプレイ等である。なお、音声品質推定装置10は、入力装置11及び表示装置12のうちの少なくとも一方を有していなくてもよい。
外部I/F13は、外部装置とのインタフェースである。外部装置には、記録媒体13a等がある。音声品質推定装置10は、外部I/F13を介して、記録媒体13aの読み取りや書き込み等を行うことができる。なお、記録媒体13aには、例えば、CD(Compact Disc)、DVD(Digital Versatile Disc)、SDメモリカード(Secure Digital memory card)、USB(Universal Serial Bus)メモリカード等がある。
通信I/F14は、音声品質推定装置10が他の装置(例えば、パケットキャプチャ装置20等)とデータ通信を行うためのインタフェースである。プロセッサ15は、CPU(Central Processing Unit)やGPU(Graphics Processing Unit)等の各種演算装置である。メモリ装置16は、例えば、HDD(Hard Disk Drive)やSSD(Solid State Drive)、RAM(Random Access Memory)、ROM(Read Only Memory)、フラッシュメモリ等の各種記憶装置である。
第一の実施形態に係る音声品質推定装置10は、図2に示すハードウェア構成を有することにより、後述する音声品質推定処理を実現することができる。なお、図2に示すハードウェア構成は一例であって、音声品質推定装置10は、他のハードウェア構成を有していてもよい。例えば、音声品質推定装置10は、複数のプロセッサ15を有していてもよいし、複数のメモリ装置16を有していてもよい。
<音声品質推定装置10の機能構成>
次に、第一の実施形態に係る音声品質推定装置10の機能構成について、図3を参照しながら説明する。図3は、第一の実施形態に係る音声品質推定装置10の機能構成の一例を示す図である。
次に、第一の実施形態に係る音声品質推定装置10の機能構成について、図3を参照しながら説明する。図3は、第一の実施形態に係る音声品質推定装置10の機能構成の一例を示す図である。
図3に示すように、第一の実施形態に係る音声品質推定装置10は、パケット系列作成部101と、品質劣化量算出部102と、受聴品質推定部103とを有する。これら各部は、例えば、音声品質推定装置10にインストールされた1以上のプログラムがプロセッサ15に実行させる処理により実現される。
また、第一の実施形態に係る音声品質推定装置10は、パラメータDB104を有する。パラメータDB104は、例えば、メモリ装置16により実現される。なお、パラメータDB104は、例えば、音声品質推定装置10と通信ネットワークを介して接続される記憶装置(例えば、NAS(Network-Attached Storage)やデータベースサーバ等)により実現されてもよい。
パケット系列作成部101は、音声品質を推定する所定の期間におけるキャプチャパケットを入力として、送信端末30から送信されたパケットが受信端末40に到着したか又は受信端末40に到着せずに損失したかを判定し、この判定結果を示すパケット系列を作成する。例えば、パケット系列作成部101は、パケットが受信端末40に到着した場合は0、損失した場合は1として、0又は1の要素で構成されるパケット系列を作成する。この場合、パケット系列の一例を以下の式(1)に示す。
品質劣化量算出部102は、パケット系列作成部101により作成されたパケット系列に対して上記の(a)~(c)の特徴を反映した劣化量を算出する。ここで、品質劣化量算出部102には、平滑化部111と、劣化量強調部112と、パケット損失耐性特性反映部113と、劣化量算出部114とが含まれる。
平滑化部111は、上記の(a)の特徴を各x(i)にそれぞれ反映したx1(i)を作成する。平滑化部111は、平滑化する窓長をMとして、M=2k+1の場合は以下の式(2)によりx1(i)を作成し、M=2kの場合は以下の式(3)によりx1(i)を作成する。
なお、以降では、平滑化部111により得られたx1(i)の総数をN、これらx1(1),・・・,x1(N)で構成されるパケット系列の時間幅をTとする。
劣化量強調部112は、上記の(b)の特徴をx1(i)にそれぞれ反映したx2(i)を作成する。劣化量強調部112は、以下の式(4)によりx2(i)を作成する。
パケット損失耐性特性反映部113は、上記の(c)の特徴を各x2(i)にそれぞれ反映したx3(i)を作成する。パケット損失耐性特性反映部113は、以下の式(5)によりx3(i)を作成する。
劣化量算出部114は、パケット系列の時間幅Tでx3(i)の総和を除することで単位時間あたりの劣化量を算出する。すなわち、劣化量算出部114は、以下の式(6)により劣化量yを算出する。
受聴品質推定部103は、劣化量算出部114により算出された劣化量yと主観品質評価値との間の関係を示すマッピング関数により受聴音声品質(つまり、ユーザが体感する音声品質)の推定値(以下、「受聴音声品質推定値」という。)を算出する。受聴品質推定部103は、例えば、以下の式(7)により受聴音声品質推定値を算出する。
なお、上記の式(7)に示すマッピング関数は一例であって、劣化量yが増加するに従って主観品質評価値が減少する単調減少関数であれば、上記の式(7)以外の関数が用いられてもよい。
ここで、パラメータDB104に格納されているパラメータについて、図4を参照しながら説明する。図4は、パラメータDB104に格納されているパラメータの一例を示す図である。
図4に示すように、パラメータDB104には、コーデック種別及びPLC種別の組み合わせ毎に、当該組み合わせに対応するパラメータM,α,β,γ,a,b,cが格納されている。したがって、品質劣化量算出部102は、上記の式(2)~式(6)を計算する際、音声通話のコーデック種別及びPLC種別の組み合わせに対応するパラメータM,α,β,γを用いる。同様に、受聴品質推定部103は、上記の式(7)を計算する際、音声通話のコーデック種別及びPLC種別の組み合わせに対応するパラメータa,b,cを用いる。
これらのパラメータM,α,β,γ,a,b,cは、上述したように、音声通話のコーデック種別やPLCに依存するものである。このため、これらのパラメータの値は、事前の主観品質評価実験により様々なパケット系列の場合の音声品質を取得し、主観受聴品質とその推定値との誤差が最も小さくなるように事前に決定しおく。ここで、主観受聴品質とはユーザが音声信号を聴取したときに感じる主観的な品質であり、例えば、ITU-T P.800に記載されているような5段階の絶対カテゴリ尺度(ACR:Absolute Category Rating)によって得られた評点に対する平均オピニオン評点(MOS:Mean Opinion Score)として主観品質評価実験によって求められるものである。
なお、音声通話のコーデック種別とPLC種別の組み合わせが1つしかない場合は、データベース化されていなくてもよい。この場合、品質劣化量算出部102及び受聴品質推定部103は、該当のパラメータ値を用いればよい。
<音声品質推定処理>
次に、第一の実施形態に係る音声品質推定処理について、図5を参照しながら説明する。図5は、第一の実施形態に係る音声品質推定処理の一例を示すフローチャートである。
次に、第一の実施形態に係る音声品質推定処理について、図5を参照しながら説明する。図5は、第一の実施形態に係る音声品質推定処理の一例を示すフローチャートである。
パケット系列作成部101は、音声品質を推定する所定の期間におけるキャプチャパケットを入力として、送信端末30から送信された各パケットが受信端末40に到着したか又は受信端末40に到着せずに損失したかをそれぞれ判定し、これらの判定結果をそれぞれ示すx(i)で構成されるパケット系列を作成する(ステップS101)。
次に、品質劣化量算出部102の平滑化部111は、M=2k+1の場合は上記の式(2)、M=2kの場合は上記の式(3)によりx(i)からx1(i)をそれぞれ作成する(ステップS102)。これにより、上記の(a)の特徴が反映されたx1(i)で構成される系列が得られる。
次に、品質劣化量算出部102の劣化量強調部112は、上記の式(4)によりx1(i)からx2(i)をそれぞれ作成する(ステップS103)。これにより、上記の(b)の特徴が反映されたx2(i)で構成される系列が得られる。
次に、品質劣化量算出部102のパケット損失耐性特性反映部113は、上記の式(5)によりx2(i)からx3(i)をそれぞれ作成する(ステップS104)。これにより、上記の(c)の特徴(つまり、パケット損失耐性特性)が反映されたx3(i)で構成される系列が得られる。
次に、品質劣化量算出部102の劣化量算出部114は、上記の式(6)により劣化量yを算出する(ステップS105)。
そして、受聴品質推定部103は、例えば、上記の式(7)により受聴音声品質推定値を算出する(ステップS106)。これにより、ユーザが体感する音声品質の推定値が得られる。なお、この受聴音声品質推定値は、例えば、任意の出力先(例えば、メモリ装置16や表示装置12、通信ネットワークを介して接続される他の装置又は機器等)に出力される。
以上のように、第一の実施形態に係る音声品質推定装置10は、上記の(a)~(c)の特徴をパケット系列に反映することで、ユーザが体感する音声品質を高い精度で推定することができる。このため、第一の実施形態に係る音声品質推定装置10は、例えば、音声通話サービスの提供中に、ユーザが体感する音声品質を高い精度で推定することが可能となる。
[第二の実施形態]
次に、第二の実施形態について説明する。第一の実施形態では、キャプチャパケットを入力として音声品質推定装置10がパケット系列を作成したが、第二の実施形態では、音声品質推定装置10にパケット系列を入力する場合について説明する。これにより、第二の実施形態では、例えば、予め準備されたパケット系列を用いたり、シミュレーション等により作成されたパケット系列を用いたりしてユーザが体感する音声品質を推定することが可能となる。
次に、第二の実施形態について説明する。第一の実施形態では、キャプチャパケットを入力として音声品質推定装置10がパケット系列を作成したが、第二の実施形態では、音声品質推定装置10にパケット系列を入力する場合について説明する。これにより、第二の実施形態では、例えば、予め準備されたパケット系列を用いたり、シミュレーション等により作成されたパケット系列を用いたりしてユーザが体感する音声品質を推定することが可能となる。
なお、第二の実施形態では、主に、第一の実施形態との相違点について説明し、第一の実施形態と同様の構成要素についてはその説明を省略する。
<音声品質推定システム1の全体構成>
第二の実施形態に係る音声品質推定システム1の全体構成について、図6を参照しながら説明する。図6は、第二の実施形態に係る音声品質推定システム1の全体構成の一例を示す図である。
第二の実施形態に係る音声品質推定システム1の全体構成について、図6を参照しながら説明する。図6は、第二の実施形態に係る音声品質推定システム1の全体構成の一例を示す図である。
図6に示すように、第二の実施形態に係る音声品質推定システム1には、音声品質推定装置10と、パケット系列管理装置50とが含まれる。
パケット系列管理装置50は、x(i)で構成されるパケット系列を管理する装置である。なお、このパケット系列は、実際の音声通話から作成されたものであってもよいし、シミュレーション等により作成されたものであってもよい。
音声品質推定装置10は、パケット系列管理装置50が管理するパケット系列を用いて、音声通話サービスのユーザが体感する音声品質を推定する装置である。
<音声品質推定装置10の機能構成>
次に、第二の実施形態に係る音声品質推定装置10の機能構成について、図7を参照しながら説明する。図7は、第二の実施形態に係る音声品質推定装置10の機能構成の一例を示す図である。
次に、第二の実施形態に係る音声品質推定装置10の機能構成について、図7を参照しながら説明する。図7は、第二の実施形態に係る音声品質推定装置10の機能構成の一例を示す図である。
図7に示すように、第二の実施形態に係る音声品質推定装置10は、第一の実施形態と異なり、パケット系列作成部101を有しない。すなわち、第二の実施形態に係る音声品質推定装置10の品質劣化量算出部102は、パケット系列管理装置50が管理するパケット系列を入力として、このパケット系列に対して上記の(a)~(c)の特徴を反映した劣化量を算出する。
<音声品質推定処理>
次に、第二の実施形態に係る音声品質推定処理について、図8を参照しながら説明する。図8は、第二の実施形態に係る音声品質推定処理の一例を示すフローチャートである。
次に、第二の実施形態に係る音声品質推定処理について、図8を参照しながら説明する。図8は、第二の実施形態に係る音声品質推定処理の一例を示すフローチャートである。
品質劣化量算出部102の平滑化部111は、パケット系列管理装置50が管理するパケット系列を入力して、M=2k+1の場合は上記の式(2)、M=2kの場合は上記の式(3)により当該パケット系列を構成するx(i)からx1(i)をそれぞれ作成する(ステップS201)。以降のステップS202~ステップS205は、図5のステップS103~ステップS106とそれぞれ同様であるため、その説明を省略する。
以上のように、第二の実施形態に係る音声品質推定装置10は、第一の実施形態と同様に、上記の(a)~(c)の特徴をパケット系列に反映することで、ユーザが体感する音声品質を高い精度で推定することができる。また、第二の実施形態に係る音声品質推定装置10は、パケット系列管理装置50が管理するパケット系列を用いるため、例えば、音声品質のサービス開始前等でも、ユーザが体感する音声品質を高い精度で推定することが可能となる。
本発明は、具体的に開示された上記の各実施形態に限定されるものではなく、請求の範囲の記載から逸脱することなく、種々の変形や変更、既知の技術との組み合わせ等が可能である。
1 音声品質推定システム
10 音声品質推定装置
11 入力装置
12 表示装置
13 外部I/F
13a 記録媒体
14 通信I/F
15 プロセッサ
16 メモリ装置
17 バス
20 パケットキャプチャ装置
30 送信端末
40 受信端末
101 パケット系列作成部
102 品質劣化量算出部
103 受聴品質推定部
104 パラメータDB
111 平滑化部
112 劣化量強調部
113 パケット損失耐性特性反映部
114 劣化量算出部
N 通信ネットワーク
10 音声品質推定装置
11 入力装置
12 表示装置
13 外部I/F
13a 記録媒体
14 通信I/F
15 プロセッサ
16 メモリ装置
17 バス
20 パケットキャプチャ装置
30 送信端末
40 受信端末
101 パケット系列作成部
102 品質劣化量算出部
103 受聴品質推定部
104 パラメータDB
111 平滑化部
112 劣化量強調部
113 パケット損失耐性特性反映部
114 劣化量算出部
N 通信ネットワーク
Claims (8)
- 音声通話の各パケットが損失したか否かをそれぞれ示す各要素で構成される系列に対して、パケット損失による品質劣化がまとまってユーザに知覚されることを表す第1の特徴を反映した第1の系列を作成する第1の系列作成手段と、
前記第1の系列作成手段により作成された第1の系列に対して、品質劣化が大きいほどユーザがより品質劣化を知覚しやすいことを表す第2の特徴を反映した第2の系列を作成する第2の系列作成手段と、
前記第2の系列作成手段により作成された第2の系列に対して、パケット損失補償によって品質劣化の知覚が緩和されることを表す第3の特徴を反映した第3の系列を作成する第3の系列作成手段と、
前記第3の系列作成手段により作成された第3の系列から単位時間あたりの劣化量を算出する算出手段と、
音声品質の劣化量とユーザの主観による音声品質の評価値との間の関係性を示すマッピング関数を用いて、前記算出手段により算出された劣化量から、ユーザが体感する音声品質を推定する推定手段と、
を有することを特徴とする音声品質推定装置。 - 前記第2の系列作成手段は、
前記音声通話のコーデック種別及び前記パケット損失補償の種別の組み合わせに応じて予め決定されたパラメータMを窓長として、前記系列を平滑化することで前記第1の系列を作成する、ことを特徴とする請求項1に記載の音声品質推定装置。 - 前記第2の系列作成手段は、
前記音声通話のコーデック種別及び前記パケット損失補償の種別の組み合わせに応じて予め決定されたパラメータα及びγが設定された劣化強調関数により前記第1の系列から前記第2の系列を作成する、ことを特徴とする請求項1又は2に記載の音声品質推定装置。 - 前記第3の系列作成手段は、
前記音声通話のコーデック種別及び前記パケット損失補償の種別の組み合わせに応じて予め決定されたパラメータβを用いて、前記第2の系列を構成する各要素から前記パラメータβを減算した値と、0との大小関係により前記第3の系列を作成する、ことを特徴とする請求項1乃至3の何れか一項に記載の音声品質推定装置。 - 前記算出手段は、
前記第3の系列を構成する各要素の総和を、前記第3の系列の時間幅で除することで、前記劣化量を算出する、ことを特徴とする請求項1乃至4の何れか一項に記載の音声品質推定装置。 - 前記音声通話のコーデック種別及び前記パケット損失補償の種別の組み合わせに応じて予め決定されたパラメータa,b及びcが設定されたマッピング関数を用いて、前記算出手段により算出された劣化量から、ユーザが体感する音声品質を推定する、ことを特徴とする請求項1乃至5の何れか一項に記載の音声品質推定装置。
- 音声通話の各パケットが損失したか否かをそれぞれ示す各要素で構成される系列に対して、パケット損失による品質劣化がまとまってユーザに知覚されることを表す第1の特徴を反映した第1の系列を作成する第1の系列作成手順と、
前記第1の系列作成手順で作成された第1の系列に対して、品質劣化が大きいほどユーザがより品質劣化を知覚しやすいことを表す第2の特徴を反映した第2の系列を作成する第2の系列作成手順と、
前記第2の系列作成手順で作成された第2の系列に対して、パケット損失補償によって品質劣化の知覚が緩和されることを表す第3の特徴を反映した第3の系列を作成する第3の系列作成手順と、
前記第3の系列作成手順で作成された第3の系列から単位時間あたりの劣化量を算出する算出手順と、
音声品質の劣化量とユーザの主観による音声品質の評価値との間の関係性を示すマッピング関数を用いて、前記算出手順で算出された劣化量から、ユーザが体感する音声品質を推定する推定手順と、
をコンピュータが実行することを特徴とする音声品質推定方法。 - コンピュータを、請求項1乃至6の何れか一項に記載の音声品質推定装置における各手段として機能させるためのプログラム。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2020/005492 WO2021161440A1 (ja) | 2020-02-13 | 2020-02-13 | 音声品質推定装置、音声品質推定方法及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2021161440A1 JPWO2021161440A1 (ja) | 2021-08-19 |
JP7298719B2 true JP7298719B2 (ja) | 2023-06-27 |
Family
ID=77291482
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021577781A Active JP7298719B2 (ja) | 2020-02-13 | 2020-02-13 | 音声品質推定装置、音声品質推定方法及びプログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US11749297B2 (ja) |
JP (1) | JP7298719B2 (ja) |
WO (1) | WO2021161440A1 (ja) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005244609A (ja) | 2004-02-26 | 2005-09-08 | Nippon Telegr & Teleph Corp <Ntt> | ネットワーク品質管理目標値算出方法および装置、並びに、ネットワーク品質監視方法および装置 |
JP2008172365A (ja) | 2007-01-09 | 2008-07-24 | Kddi Corp | 受聴品質評価方法および装置 |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1975924A1 (en) * | 2007-03-29 | 2008-10-01 | Koninklijke KPN N.V. | Method and system for speech quality prediction of the impact of time localized distortions of an audio transmission system |
EP2037449B1 (en) * | 2007-09-11 | 2017-11-01 | Deutsche Telekom AG | Method and system for the integral and diagnostic assessment of listening speech quality |
JP5123384B2 (ja) * | 2008-06-11 | 2013-01-23 | 日本電信電話株式会社 | オーディオ品質推定方法、オーディオ品質推定装置およびプログラム |
WO2011018428A1 (en) * | 2009-08-14 | 2011-02-17 | Koninklijke Kpn N.V. | Method and system for determining a perceived quality of an audio system |
EP2363852B1 (en) * | 2010-03-04 | 2012-05-16 | Deutsche Telekom AG | Computer-based method and system of assessing intelligibility of speech represented by a speech signal |
US9396738B2 (en) * | 2013-05-31 | 2016-07-19 | Sonus Networks, Inc. | Methods and apparatus for signal quality analysis |
US9031838B1 (en) * | 2013-07-15 | 2015-05-12 | Vail Systems, Inc. | Method and apparatus for voice clarity and speech intelligibility detection and correction |
CA3018039C (en) * | 2016-03-24 | 2023-08-29 | Harman International Industries, Incorporated | Signal quality-based enhancement and compensation of compressed audio signals |
WO2018028767A1 (en) * | 2016-08-09 | 2018-02-15 | Huawei Technologies Co., Ltd. | Devices and methods for evaluating speech quality |
US11138989B2 (en) * | 2019-03-07 | 2021-10-05 | Adobe Inc. | Sound quality prediction and interface to facilitate high-quality voice recordings |
US12087321B2 (en) * | 2020-01-30 | 2024-09-10 | Nippon Telegraph And Telephone Corporation | Evaluation method, evaluation apparatus, and program |
JP2021135935A (ja) * | 2020-02-28 | 2021-09-13 | 株式会社東芝 | コミュニケーション管理装置及び方法 |
US11611664B2 (en) * | 2021-03-25 | 2023-03-21 | Agora Lab, Inc | Voice quality assessment system |
US11545159B1 (en) * | 2021-06-10 | 2023-01-03 | Nice Ltd. | Computerized monitoring of digital audio signals |
-
2020
- 2020-02-13 JP JP2021577781A patent/JP7298719B2/ja active Active
- 2020-02-13 WO PCT/JP2020/005492 patent/WO2021161440A1/ja active Application Filing
- 2020-02-13 US US17/798,669 patent/US11749297B2/en active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005244609A (ja) | 2004-02-26 | 2005-09-08 | Nippon Telegr & Teleph Corp <Ntt> | ネットワーク品質管理目標値算出方法および装置、並びに、ネットワーク品質監視方法および装置 |
JP2008172365A (ja) | 2007-01-09 | 2008-07-24 | Kddi Corp | 受聴品質評価方法および装置 |
Non-Patent Citations (3)
Title |
---|
上村 郷志 Satoshi UEMURA,ロスパケットのペイロード情報弁別に基づく音声受聴品質評価法 An Objective speech quality assessment b,電子情報通信学会技術研究報告 Vol.106 No.600 IEICE Technical Report,日本,社団法人電子情報通信学会 The Institute of Electro,2007年03月08日 |
青木 仁志 Hitoshi AOKI,IP電話サービスにおけるバースト損失の影響の主観品質評価 Subjective Quality Evaluation of Bursty Pa,電子情報通信学会技術研究報告 Vol.119 No.7 [online] IEICE Technical Report,日本,一般社団法人電子情報通信学会 The Institute of Ele,2019年05月20日 |
高橋 玲 Akira TAKAHASHI,広帯域音声通信サービスの総合通話品質推定のための音質定量化に関する検討 A study on quantifying liste,映像情報メディア学会技術報告 Vol.29 No.51 ITE Technical Report,日本,(社)映像情報メディア学会 The Institute of Image,2005年09月16日 |
Also Published As
Publication number | Publication date |
---|---|
WO2021161440A1 (ja) | 2021-08-19 |
JPWO2021161440A1 (ja) | 2021-08-19 |
US11749297B2 (en) | 2023-09-05 |
US20230079632A1 (en) | 2023-03-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CA2617893C (en) | Video communication quality estimation device, method, and program | |
WO2012018574A1 (en) | System and method to measure and track trust | |
JP5865486B2 (ja) | 利用者体感品質推定装置、端末ボトルネック判定装置、類似操作抽出装置、及び方法、並びにプログラム | |
JP4490374B2 (ja) | 映像品質評価装置および方法 | |
Hashimzade et al. | Fixed‐b asymptotic approximation of the sampling behaviour of nonparametric spectral density estimators | |
US8694635B1 (en) | Time series technique for analyzing performance in an online professional network | |
JP5957419B2 (ja) | QoE推定装置、QoE推定方法及びプログラム | |
CN109525933B (zh) | 位置隐私保护方法及装置 | |
JP7298719B2 (ja) | 音声品質推定装置、音声品質推定方法及びプログラム | |
EP1656806A2 (en) | Method and system for analysing data quality measurements in wireless data communication networks | |
JP7099533B2 (ja) | 影響範囲推定装置、影響範囲推定方法、及びプログラム | |
WO2019244507A1 (ja) | 品質推定装置、品質推定方法及びプログラム | |
JP2017156888A (ja) | 性能劣化要因推定プログラム、および性能劣化要因推定装置 | |
JP3905891B2 (ja) | ネットワーク品質管理目標値算出方法および装置、並びに、ネットワーク品質監視方法および装置 | |
JP2007135187A (ja) | トラヒック量推定方法、トラヒック量推定装置及びトラヒック量推定プログラム、並びに当該トラヒック量推定方法を利用したパケット廃棄防止方法 | |
JP4733071B2 (ja) | 映像品質推定方法および装置 | |
JP2007006203A (ja) | ユーザ体感品質推定モデル生成装置、品質管理装置、およびプログラム | |
JP2006352528A (ja) | ユーザ体感品質推定モデル生成装置、方法、およびプログラム | |
JP5952252B2 (ja) | 通話品質推定方法、通話品質推定装置、及びプログラム | |
Han et al. | Accuracy analysis on call quality assessments in voice over IP | |
EP3226511B1 (en) | Evaluation of perceptual delay impact on conversation in teleconferencing system | |
Zseby et al. | Sampling schemes for validating service level agreements | |
JP6114702B2 (ja) | ユーザ体感品質推定装置、ユーザ体感品質推定方法及びプログラム | |
JP2003348154A (ja) | 通信品質管理閾値決定方法及びその装置並びにプログラム及び情報記録媒体 | |
JP2024091094A (ja) | モデル作成装置、モデル作成システム、体感品質推定システム、モデル作成方法およびモデル作成プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220610 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230516 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230529 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7298719 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |