JP2017204840A - Voice quality estimation device, voice quality estimation method and program - Google Patents
Voice quality estimation device, voice quality estimation method and program Download PDFInfo
- Publication number
- JP2017204840A JP2017204840A JP2016097399A JP2016097399A JP2017204840A JP 2017204840 A JP2017204840 A JP 2017204840A JP 2016097399 A JP2016097399 A JP 2016097399A JP 2016097399 A JP2016097399 A JP 2016097399A JP 2017204840 A JP2017204840 A JP 2017204840A
- Authority
- JP
- Japan
- Prior art keywords
- packet
- voice
- loss rate
- lost
- packets
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Abstract
Description
本発明は、ネットワークを介した音声通話サービスの音声品質推定装置、方法及びプログラムに関する。 The present invention relates to a voice quality estimation apparatus, method, and program for a voice call service via a network.
サービス事業者は、音声通話サービスを維持・改善していくために、サービスの品質を把握することが重要である。サービスの品質を評価する指標の一つが会話品質である。会話品質は、サービスの利用ユーザが会話をした時に体感する品質を表す。運用の場面においては、主観評価で会話品質を評価すると費用と時間がかかることから、会話品質の主要因である受聴品質を用いて会話品質が推定される。ここで、受聴品質とは、ユーザが音声を受聴した時に感じる品質を表す。 It is important for service providers to understand the quality of services in order to maintain and improve voice call services. One of the indicators for evaluating service quality is conversation quality. The conversation quality represents the quality experienced by the user using the service when having a conversation. In a scene of operation, since it is expensive and time consuming to evaluate the conversation quality by subjective evaluation, the conversation quality is estimated using the listening quality which is the main factor of the conversation quality. Here, the listening quality represents the quality that the user feels when listening to the voice.
受聴品質の評価指標に受聴MOS(Mean Opinion Score)がある。受聴MOSの評価は、実際に評価者が音声サンプルを聴いて判定することになるが、評価者を必要とせずに推定するアルゴリズム手法がある。例えば、VoLTE(Voice over Long Term Evolution)のような広帯域音声サービスの受聴MOSを推定する手法として、POLQA(Perceptual Objective Listening Quality Analysis)に基づく手法が知られている(非特許文献1参照)。POLQAは、発話側から入力される参照音声信号と、受話側で出力される収録音声信号とを比較し、POLQA評価値を算出することで、受聴品質を評価する客観評価手法である。POLQA評価値は、ITU−T(Telecommunication standardization sector of International Telecommunication Union)勧告P.863のImplementer's guide(P. Imp 863)で規定するマッピング関数を適用することにより、推定受聴MOS(MOS-LQO : Mean Opinion Score - Listening Quality Objective)に変換可能である。 Listening MOS (Mean Opinion Score) is an evaluation index of listening quality. The evaluation of the listening MOS is actually judged by the evaluator listening to the audio sample, but there is an algorithm method that estimates without requiring the evaluator. For example, a technique based on POLQA (Perceptual Objective Listening Quality Analysis) is known as a technique for estimating the listening MOS of a broadband voice service such as VoLTE (Voice over Long Term Evolution) (see Non-Patent Document 1). POLQA is an objective evaluation method for evaluating listening quality by comparing a reference voice signal input from the utterance side with a recorded voice signal output on the reception side and calculating a POLQA evaluation value. The POLQA evaluation value is ITU-T (Telecommunication standardization sector of International Telecommunication Union) recommendation P.I. By applying a mapping function defined in 863 Implementer's guide (P. Imp 863), conversion to an estimated listening MOS (MOS-LQO: Mean Opinion Score-Listening Quality Objective) is possible.
POLQAは、音声信号を入力して処理する必要がある。しかしながら、端末に録音機能が必ずしも搭載されているとは限らず、音声通話サービスの品質把握を目的とした音声信号の取得が困難な場合がある。このように音声信号を直接扱えず、ネットワーク内のパケットをキャプチャして品質を推定する際には、POLQAは適用できないという不都合がある。 POLQA needs to input and process audio signals. However, the recording function is not always installed in the terminal, and it may be difficult to obtain a voice signal for the purpose of grasping the quality of the voice call service. In this way, voice signals cannot be handled directly, and there is a disadvantage that POLQA cannot be applied when estimating quality by capturing packets in the network.
これに対し、パケットキャプチャを用いて高精度な品質推定をする方法が、非特許文献2、3において提案されている。非特許文献2や非特許文献3では、音声区間検出機構を持つコーデック(AMR-WB等)の特性を利用し、パケット形式により有音/無音区間の判定を行い、有音区間のパケット(以下、有音パケット)が損失した割合(以下、有音損失率)を考慮した推定を行う。 On the other hand, Non-Patent Documents 2 and 3 propose a method for estimating quality with high accuracy using packet capture. Non-Patent Document 2 and Non-Patent Document 3 use the characteristics of a codec (AMR-WB, etc.) that has a voice section detection mechanism, determine voice / silent sections according to the packet format, , Voice packet) is estimated in consideration of the loss rate (hereinafter referred to as voice loss rate).
しかしながら、非特許文献2はネットワーク等で損失が発生した後のパケット情報と、その損失が発生する前のパケット情報を比較するフルリファレンスモデルであり、網の制約により1点測定となる場合には適用できないという不都合がある。 However, Non-Patent Document 2 is a full reference model that compares packet information after loss occurs in a network and the like and packet information before the loss occurs. There is an inconvenience that it cannot be applied.
一方、非特許文献3は、受信側のパケット情報のみから推定するノンリファレンスモデルであり、1点でのパケットキャプチャに基づいて有音損失率を考慮した推定を行う。この推定方法では、損失したパケットの前後のパケットのヘッダ情報から損失した個数と当該損失したパケットが有音パケットか否かを判断する。特に、前後のパケットが有音パケットと無音パケットの場合、損失したパケット全てを有音パケットとみなしている。しかしながら、有音区間と無音区間が切り替わる箇所は、無音、もしくは、受聴MOSに影響を与えにくい状況が多くあるため、受聴MOSが実際は高いものの、過小推定される可能性がある、という不都合がある。 On the other hand, Non-Patent Document 3 is a non-reference model that is estimated from only packet information on the receiving side, and performs estimation in consideration of the sound loss rate based on packet capture at one point. In this estimation method, it is determined from the header information of the packets before and after the lost packet and whether or not the lost packet is a voice packet. In particular, when the preceding and following packets are voice packets and silence packets, all lost packets are regarded as voice packets. However, there are many situations where the voiced and silent sections are switched, because there are many situations where it is difficult to affect the listening MOS, or the listening MOS is actually high, but it may be underestimated. .
上記のように、ネットワークを介して複数端末間で音声通信による会話を行うシステムにおいて、1点でのパケットキャプチャに基づいて有音損失率を考慮した推定を行う際、有音区間と無音区間が切り替わる箇所でパケット損失が生じた場合に、受聴MOSが実際は高いものの、過小推定される可能性がある、という問題があった。 As described above, in a system that performs conversation by voice communication between a plurality of terminals via a network, when performing estimation considering the voice loss rate based on packet capture at one point, the voiced and silent sections are When packet loss occurs at the switching point, there is a problem that although the listening MOS is actually high, it may be underestimated.
上述した問題を解決するため、本発明の課題は、パケットキャプチャに基づき受聴品質を推定する際、より精度の高い有音損失率を利用した音声品質推定技術を提供することである。 In order to solve the above-described problem, an object of the present invention is to provide a voice quality estimation technique using a more accurate voice loss rate when estimating listening quality based on packet capture.
上記課題を解決するため、本発明の一態様は、音声パケットフローから有音損失率を推定する有音損失率推定部と、所定のマッピング関数を利用して、前記推定された有音損失率から受聴品質を推定する受聴品質推定部と、を有する音声品質推定装置であって、前記有音損失率推定部は、前記音声パケットフローにおける損失したパケットの前後のパケットが有音パケットと無音パケットとの何れの組み合わせであるかに応じて有音パケット損失数を推定し、前記推定された有音パケット損失数から前記有音損失率を推定する音声品質推定装置に関する。 In order to solve the above-described problem, an aspect of the present invention provides a sound loss rate estimator that estimates a sound loss rate from a voice packet flow, and the estimated sound loss rate using a predetermined mapping function. A voice quality estimation device having a voice quality estimation unit for estimating a voice quality from the voice packet flow rate, and the voice loss rate estimation unit includes voice packets and silence packets before and after a lost packet in the voice packet flow. It is related with the audio | voice quality estimation apparatus which estimates the number of voice packet loss according to which combination and and estimates the said voice loss rate from the estimated number of voice packet loss.
本発明の他の態様は、音声パケットフローを取得するステップと、前記音声パケットフローから有音損失率を推定するステップと、所定のマッピング関数を利用して、前記推定された有音損失率から受聴品質を推定するステップと、を有する音声品質推定方法であって、前記有音損失率を推定するステップは、前記音声パケットフローにおける損失したパケットの前後のパケットが有音パケットと無音パケットとの何れの組み合わせであるかに応じて有音パケット損失数を推定し、前記推定された有音パケット損失数から前記有音損失率を推定する方法に関する。 According to another aspect of the present invention, a voice packet flow is obtained, a voice loss rate is estimated from the voice packet flow, and a predetermined mapping function is used to calculate the voice loss rate from the estimated voice loss rate. A voice quality estimation method comprising: a step of estimating a listening quality, wherein the step of estimating the voice loss rate includes: a packet before and after a lost packet in the voice packet flow is a voice packet and a voice packet; The present invention relates to a method for estimating the number of voice packet losses according to which combination is used, and estimating the voice loss rate from the estimated number of voice packet losses.
本発明の更なる他の態様は、上述した音声品質推定装置の各部としてプロセッサを機能させるためのプログラムに関する。 Still another aspect of the present invention relates to a program for causing a processor to function as each unit of the speech quality estimation apparatus described above.
本発明によると、パケットキャプチャに基づき受聴品質を推定する際、より精度の高い有音損失率を利用した音声品質推定技術を提供することができる。 ADVANTAGE OF THE INVENTION According to this invention, when estimating listening quality based on a packet capture, the speech quality estimation technique using a more accurate voice loss rate can be provided.
以下、図面に基づいて本発明の実施の形態を説明する。 Hereinafter, embodiments of the present invention will be described with reference to the drawings.
本発明の音声品質推定装置は、IP網やモバイルネットワークを介して接続される2つの音声通話端末で構成されるVoLTE等の音声通話システムにおいて、端末間で通信される音声が含まれるパケットを受信側端末又は網内で測定するものである。 The voice quality estimation apparatus of the present invention receives a packet including voice communicated between terminals in a voice call system such as VoLTE composed of two voice call terminals connected via an IP network or a mobile network. It is measured at the side terminal or network.
まず、図1を参照して、本発明の一実施例による音声通信サービスの概略を説明する。図1は、本発明の一実施例によるネットワークを介した音声通信サービスの構成を示す概略図である。 First, an outline of a voice communication service according to an embodiment of the present invention will be described with reference to FIG. FIG. 1 is a schematic diagram showing a configuration of a voice communication service via a network according to an embodiment of the present invention.
図1に示されるように、本実施例による音声通信サービスでは、無線端末がキャリアネットワーク(NW)を介し音声通信を実行する。より詳細には、各無線端末はキャリアNW内の近傍の基地局に無線アクセスし、基地局は中継ノードを介し音声パケットフローをやりとりする。本実施例では、音声パケットフローのプロトコルは、シーケンス番号及び送信タイムスタンプを含むRTP (Realtime Transport Protocol)を利用し、図示されるように、音声パケットフローは無音パケットと有音パケットから構成される。RTPによると、無音パケットは相対的に小さなサイズを有し、また、無音パケット間の間隔は相対的に大きくなるよう配置され、他方、有音パケットは相対的に大きなサイズを有し、また、有音パケット間の間隔は相対的に小さくなるよう配置される。しかしながら、本発明による音声通信サービスはRTPに限定されず、シーケンス番号及び送信タイムスタンプが含まれているその他のプロトコルが用いられてもよい。例えば、音声区間検出機構を持ち、有音/無音によりパケット形式やパケット送信間隔が異なるコーデック(AMR-WB等)が利用されてもよい。 As shown in FIG. 1, in the voice communication service according to the present embodiment, a wireless terminal performs voice communication via a carrier network (NW). More specifically, each wireless terminal wirelessly accesses a nearby base station in the carrier NW, and the base station exchanges a voice packet flow via the relay node. In this embodiment, the voice packet flow protocol uses RTP (Realtime Transport Protocol) including a sequence number and a transmission time stamp. As shown in the figure, the voice packet flow is composed of a silent packet and a voice packet. . According to RTP, silence packets have a relatively small size, and the spacing between silence packets is arranged to be relatively large, whereas voice packets have a relatively large size, and The intervals between voice packets are arranged to be relatively small. However, the voice communication service according to the present invention is not limited to RTP, and other protocols including a sequence number and a transmission time stamp may be used. For example, a codec (AMR-WB or the like) that has a voice section detection mechanism and has different packet formats and packet transmission intervals depending on sound / silence may be used.
次に、図2を参照して、本発明の一実施例による通信システムを説明する。図2は、本発明の一実施例による通信システムの構成を示すブロック図である。 Next, a communication system according to an embodiment of the present invention will be described with reference to FIG. FIG. 2 is a block diagram showing a configuration of a communication system according to an embodiment of the present invention.
図2に示されるように、通信システム10は、端末20、ネットワーク30、パケットキャプチャ装置40及び音声品質推定装置100を有する。
As illustrated in FIG. 2, the
端末20は、VoLTE対応端末などのパケットベース音声通信機能を備えた端末である。端末20のユーザは、ネットワーク30を介し音声通信により会話を行うことができる。
The
ネットワーク30は、キャリアネットワーク、インターネットなどのパケット交換ネットワークである。端末20から送信された音声パケットフローは、ネットワーク30内の中継ノードを介しルーティングされ、宛先の端末20に送信される。
The
パケットキャプチャ装置40は、送信側端末20から送信された音声パケットフローを取得する。図示された実施例では、パケットキャプチャ装置40は、受信側端末20とネットワーク30との間で音声パケットフローを取得する。しかしながら、本発明はこれに限定されず、パケットキャプチャ装置40は、端末20間の何れか任意のポイントで音声パケットフローを取得してもよい。パケットキャプチャ装置40は、取得した音声パケットフローを音声品質推定装置100に送信する。また、パケットキャプチャ装置40は、図示されるようなスタンドアローンな装置として実現されてもよいし、あるいは、音声品質推定装置100に搭載されてもよい。
The
音声品質推定装置100は、パケットキャプチャ装置40から受信した音声パケットフローに対して後述される処理を実行し、音声品質の1つの指標である受聴品質の推定値を出力する。
The voice
音声品質推定装置100は、典型的には、サーバにより実現されてもよく、例えば、バスを介し相互接続されるドライブ装置、補助記憶装置、メモリ装置、プロセッサ、インタフェース装置及び通信回路から構成される。音声品質推定装置100における後述される各種機能及び処理を実現するプログラムを含む各種コンピュータプログラムは、CD−ROM(Compact Disk−Read Only Memory)、DVD(Digital Versatile Disk)、フラッシュメモリなどの記録媒体によって提供されてもよい。プログラムを記憶した記録媒体がドライブ装置にセットされると、プログラムが記録媒体からドライブ装置を介して補助記憶装置にインストールされる。但し、プログラムのインストールは必ずしも記録媒体により行う必要はなく、ネットワークなどを介し何れかの外部装置からダウンロードするようにしてもよい。補助記憶装置は、インストールされたプログラムを格納すると共に、必要なファイルやデータなどを格納する。メモリ装置は、プログラムの起動指示があった場合に、補助記憶装置からプログラムやデータを読み出して格納する。プロセッサは、メモリ装置に格納されたプログラムやプログラムを実行するのに必要なパラメータなどの各種データに従って、後述されるような音声品質推定装置100の各種機能及び処理を実行する。インタフェース装置は、ネットワーク又は外部装置に接続するための通信インタフェースとして用いられる。通信回路は、インターネットなどのネットワークと通信するための各種通信処理を実行する。しかしながら、上述したハードウェア構成は単なる一例であり、音声品質推定装置100は、上述したハードウェア構成に限定されるものでなく、他の何れか適切なハードウェア構成により実現されてもよい。
The voice
次に、図3を参照して、本発明の一実施例による音声品質推定装置を説明する。図3は、本発明の一実施例による音声品質推定装置を示すブロック図である。 Next, a speech quality estimation apparatus according to an embodiment of the present invention will be described with reference to FIG. FIG. 3 is a block diagram illustrating a speech quality estimation apparatus according to an embodiment of the present invention.
図3に示されるように、音声品質推定装置100は、有音損失率推定部110及び受聴品質推定部120を有する。
As shown in FIG. 3, the speech
有音損失率推定部110は、音声パケットフローから有音損失率を推定する。ここで、有音損失率とは、音声パケットフローにおける有音パケットの個数に対する損失した有音パケットの個数の比率を表す。すなわち、有音損失率Lは、
The voice loss
損失した有音パケットの個数を推定するため、有音損失率推定部110はまず、音声パケットフローにおけるパケット損失部分を検出し、検出したパケット損失部分に含まれる有音パケットの個数を推定する。例えば、当該パケット損失部分は、各パケットのヘッダ情報におけるシーケンス番号に基づき検出されてもよい。すなわち、有音損失率推定部110は、受信したパケットのシーケンス番号に欠落を検出した場合、欠落したシーケンス番号に対応するパケットを損失したパケットとして判断してもよい。あるいは、有音損失率推定部110は、音声パケットフローにおけるパケットの送信タイムスタンプの進行状況からパケット損失部分を判断してもよい。例えば、順次受信した2つのパケットについて、有音パケット間の間隔及び無音パケット間の間隔の何れか大きい方より大きな送信タイムスタンプの差分が検出されると、有音損失率推定部110は、当該2つのパケットの間にパケット損失部分があると判断してもよい。
In order to estimate the number of lost voice packets, the voice loss
このようにしてパケット損失部分を検出すると、有音損失率推定部110は、検出したパケット損失部分の前後のパケットが有音パケットと無音パケットとの何れの組み合わせであるかに応じて損失した有音パケットの個数を推定する。なお、有音損失率推定部110は、パケットサイズに基づき各パケットが有音パケット又は無音パケットであるか判断してもよい。すなわち、利用されているプロトコルタイプに応じて、有音パケット及び無音パケットのパケットサイズが規定されており、有音損失率推定部110は、各パケットのパケットサイズを判断することによって、当該パケットが有音パケット又は無音パケットであるか判断できる。
When the packet loss part is detected in this way, the voice loss
具体的には、ケース1)損失したパケットの前後のパケットが有音パケットである場合、有音損失率推定部110は、損失したパケットを有音パケットと推定してもよい。すなわち、図4に示されるように、損失したパケットの前後のパケットが有音パケットである場合、有音損失率推定部110は、損失した全てのパケットを有音パケットであると推定してもよい。そして、有音損失率推定部110は、損失したパケットの前後のパケットのシーケンス番号に基づき損失したパケットの個数を算出し、当該損失した個数を損失した有音パケットの個数として決定してもよい。
Specifically, Case 1) When the packet before and after the lost packet is a voice packet, the voice loss
次に、ケース2)損失したパケットの前後のパケットが無音パケットである場合、有音損失率推定部110は、損失したパケットを無音パケットと推定してもよい。すわなち、図4に示されるように、損失した前後のパケットが無音パケットである場合、有音損失率推定部110は、損失した全てのパケットを無音パケットであると推定する。この場合、有音損失率推定部110は、損失した有音パケットの個数を0として決定する。
Next, Case 2) When the packets before and after the lost packet are silence packets, the voice loss
次に、ケース3)損失したパケットの前のパケットが有音パケットであって、後のパケットが無音パケットである場合、有音損失率推定部110は、損失したパケットを無音パケットと推定してもよい。すなわち、図4に示されるように、損失したパケットの前のパケットが有音パケットであって、後のパケットが無音パケットである場合、有音損失率推定部110は、損失した全てのパケットを無音パケットであると推定してもよい。この場合、有音損失率推定部110は、損失した有音パケットの個数を0として決定する。
Next, Case 3) When the packet before the lost packet is a voice packet and the subsequent packet is a voice packet, the voice loss
次に、ケース4)損失したパケットの前のパケットが無音パケットであって、後のパケットが有音パケットである場合、有音損失率推定部110は、損失したパケットのシーケンス番号と送信タイムスタンプとに基づき損失した有音パケットの個数を推定してもよい。具体的には、有音損失率推定部110は、損失したパケットの前後のパケットのシーケンス番号に基づき損失したパケットの個数を算出すると共に、損失したパケットの前後のパケットの送信タイムスタンプの差分を算出する。例えば、図4に示される具体例では、損失したパケットの前後のパケットのシーケンス番号はそれぞれ、"120"と"123"であるため、損失したパケットは2個であると分かる。また、送信タイムスタンプはそれぞれ、"0:00:00.0100"と"0:00:00.0400"であるため、送信タイムスタンプの差分は300msであると分かる。このとき、有音損失率推定部110は、
Next, Case 4) When the packet before the lost packet is a silent packet and the subsequent packet is a voice packet, the voice loss
このようにして損失した有音パケットの個数を決定すると、有音損失率推定部110は、上述した式に従って有音損失率Lを決定することができる。
When the number of lost voice packets is determined in this way, the voice loss
受聴品質推定部120は、所定のマッピング関数を利用して、推定された有音損失率から受聴品質を推定する。当該所定のマッピング関数は、有音損失率と受聴品質推定値との対応関係を示す何れかの適切な関係式であり、例えば、事前の実験により様々な端末にて有音損失率を与えた状況でPOLQA測定した受聴品質推定値MOS_LQOと与えられた有音損失率との間の対応関係を示す関係式であってもよい。
The listening
より詳細には、マッピング関数は、事前の実験により求められ、品質劣化環境(エミュレータ設置の検証環境等)で、対象端末を用いて網内/端末パケット取得とPOLQAによる受聴品質測定とを実施し、有音損失率と受聴品質推定値MOS_LQO(POLQA)との組み合わせ(複数のバリエーションがあると好ましい)による関数式のカーブフィッティングにより決定されてもよい。例えば、マッピング関数は、 More specifically, the mapping function is obtained by a prior experiment, and in the quality degradation environment (e.g., the verification environment where the emulator is installed), the target terminal is used to perform in-network / terminal packet acquisition and listening quality measurement using POLQA. Further, it may be determined by curve fitting of a functional expression based on a combination (preferably with a plurality of variations) of the sound loss rate and the listening quality estimation value MOS_LQO (POLQA). For example, the mapping function is
しかしながら、本発明によるマッピング関数はこれに限定されず、例えば、実験で求めた有音損失率と受聴品質推定値との対応関係に精度よくフィッティングできる関数であればよく、例えば、二次関数等の線形関数であってもよいし、非線形関数であってもよい。 However, the mapping function according to the present invention is not limited to this, and may be any function that can be accurately fitted to the correspondence relationship between the sound loss rate and the listening quality estimation value obtained through experiments, for example, a quadratic function, The linear function may be a non-linear function.
次に、図5を参照して、本発明の一実施例による音声品質推定処理を説明する。図5は、本発明の一実施例による音声品質推定処理を示すフロー図である。 Next, a speech quality estimation process according to an embodiment of the present invention will be described with reference to FIG. FIG. 5 is a flowchart showing the voice quality estimation process according to one embodiment of the present invention.
図5に示されるように、ステップS101において、有音損失率推定部110は、音声パケットフローを取得する。具体的には、有音損失率推定部110は、パケットキャプチャ装置40から音声パケットフローを取得する。
As shown in FIG. 5, in step S <b> 101, the sound loss
ステップS102において、有音損失率推定部110は、音声パケットフローから有音損失率を推定する。具体的には、有音損失率推定部110は、音声パケットフローにおける損失したパケットの前後のパケットが有音パケットと無音パケットとの何れの組み合わせであるかに応じて有音パケット損失数を推定し、推定された有音パケット損失数から有音損失率を推定する。上述したように、有音損失率推定部110は、ケース1)損失したパケットの前後のパケットが有音パケットである場合、損失したパケットを有音パケットと推定し、ケース2)損失したパケットの前後のパケットが無音パケットである場合、損失したパケットを無音パケットと推定し、ケース3)損失したパケットの前のパケットが有音パケットであって、後のパケットが無音パケットである場合、損失したパケットを無音パケットと推定し、ケース4)損失したパケットの前のパケットが無音パケットであって、後のパケットが有音パケットである場合、損失したパケットのシーケンス番号と送信タイムスタンプとに基づき有音パケットの個数を推定してもよい。ここで、ケース4において、有音損失率推定部110は、
In step S102, the voice loss
ステップS103において、受聴品質推定部120は、所定のマッピング関数を利用して、推定された有音損失率から受聴品質を推定する。当該マッピング関数は、有音損失率と受聴品質推定値の対応関係を示す何れかの関係式であってもよく、事前の実験等により定義されてもよい。
In step S103, the listening
なお、上述した音声品質推定装置100の各部及びステップS101〜S103は、コンピュータのメモリに記憶されたプログラムをプロセッサが実行することによって実現されてもよい。
Note that each unit of the speech
以上、本発明の実施例について詳述したが、本発明は上述した特定の実施形態に限定されるものではなく、特許請求の範囲に記載された本発明の要旨の範囲内において、種々の変形・変更が可能である。 As mentioned above, although the Example of this invention was explained in full detail, this invention is not limited to the specific embodiment mentioned above, In the range of the summary of this invention described in the claim, various deformation | transformation・ Change is possible.
10 通信システム
20 端末
30 ネットワーク
40 パケットキャプチャ装置
100 音声品質推定装置
110 有音損失率推定部
120 受聴品質推定部
DESCRIPTION OF
Claims (7)
所定のマッピング関数を利用して、前記推定された有音損失率から受聴品質を推定する受聴品質推定部と、
を有する音声品質推定装置であって、
前記有音損失率推定部は、前記音声パケットフローにおける損失したパケットの前後のパケットが有音パケットと無音パケットとの何れの組み合わせであるかに応じて有音パケット損失数を推定し、前記推定された有音パケット損失数から前記有音損失率を推定する音声品質推定装置。 A voice loss rate estimator that estimates the voice loss rate from the voice packet flow;
A listening quality estimation unit that estimates listening quality from the estimated sound loss rate using a predetermined mapping function;
A speech quality estimation device comprising:
The voiced loss rate estimation unit estimates the number of voiced packet losses according to which combination of voiced packets and voiceless packets before and after the lost packet in the voice packet flow, and the estimation A speech quality estimation apparatus for estimating the speech loss rate from the number of speech packet loss.
i)前記損失したパケットの前後のパケットが有音パケットである場合、前記損失したパケットを有音パケットと推定し、
ii)前記損失したパケットの前後のパケットが無音パケットである場合、前記損失したパケットを無音パケットと推定し、
iii)前記損失したパケットの前のパケットが有音パケットであって、後のパケットが無音パケットである場合、前記損失したパケットを無音パケットと推定し、
iv)前記損失したパケットの前のパケットが無音パケットであって、後のパケットが有音パケットである場合、前記損失したパケットのシーケンス番号と送信タイムスタンプとに基づき前記有音パケット損失数を推定する、請求項1記載の音声品質推定装置。 The sound loss rate estimation unit
i) When packets before and after the lost packet are voice packets, the lost packet is estimated as a voice packet;
ii) If the packets before and after the lost packet are silent packets, the lost packet is estimated as a silent packet;
iii) If the packet before the lost packet is a voice packet and the subsequent packet is a silence packet, the lost packet is estimated as a silence packet;
iv) When the packet before the lost packet is a silent packet and the subsequent packet is a voice packet, the number of voice packet loss is estimated based on the sequence number of the lost packet and a transmission time stamp. The speech quality estimation apparatus according to claim 1.
を満たす整数xを求めることによって、前記有音パケット損失数を推定する、請求項2記載の音声品質推定装置。 The voice loss rate estimation unit iv) when the packet before the lost packet is a silent packet and the subsequent packet is a voice packet,
The speech quality estimation apparatus according to claim 2, wherein the voice packet loss number is estimated by obtaining an integer x satisfying
である、請求項1乃至4何れか一項記載の音声品質推定装置。 The predetermined mapping function is:
The speech quality estimation apparatus according to any one of claims 1 to 4, wherein
前記音声パケットフローから有音損失率を推定するステップと、
所定のマッピング関数を利用して、前記推定された有音損失率から受聴品質を推定するステップと、
を有する音声品質推定方法であって、
前記有音損失率を推定するステップは、前記音声パケットフローにおける損失したパケットの前後のパケットが有音パケットと無音パケットとの何れの組み合わせであるかに応じて有音パケット損失数を推定し、前記推定された有音パケット損失数から前記有音損失率を推定する方法。 Obtaining a voice packet flow;
Estimating a voiced loss rate from the voice packet flow;
Estimating listening quality from the estimated sound loss rate using a predetermined mapping function;
A speech quality estimation method comprising:
The step of estimating the voice loss rate estimates the number of voice packet loss according to which combination of the voice packet and the voice packet the packet before and after the lost packet in the voice packet flow is, A method of estimating the voice loss rate from the estimated number of voice packet losses.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016097399A JP6586044B2 (en) | 2016-05-13 | 2016-05-13 | Speech quality estimation apparatus, speech quality estimation method and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016097399A JP6586044B2 (en) | 2016-05-13 | 2016-05-13 | Speech quality estimation apparatus, speech quality estimation method and program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2017204840A true JP2017204840A (en) | 2017-11-16 |
JP6586044B2 JP6586044B2 (en) | 2019-10-02 |
Family
ID=60323364
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016097399A Active JP6586044B2 (en) | 2016-05-13 | 2016-05-13 | Speech quality estimation apparatus, speech quality estimation method and program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6586044B2 (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10972516B1 (en) | 2018-08-24 | 2021-04-06 | Amdocs Development Limited | System, method, and computer program for probabilistic estimation and prevention of muting occurrences in voice over LTE (VoLTE) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001268124A (en) * | 2000-03-23 | 2001-09-28 | Nippon Telegr & Teleph Corp <Ntt> | Device and method for monitoring quality of audio/video communication, and recording medium recorded with the method |
WO2004068098A1 (en) * | 2003-01-30 | 2004-08-12 | Fujitsu Limited | Audio packet vanishment concealing device, audio packet vanishment concealing method, reception terminal, and audio communication system |
JP2006352528A (en) * | 2005-06-16 | 2006-12-28 | Nippon Telegr & Teleph Corp <Ntt> | User body-sensible quality estimating model generating apparatus, method and program thereof |
JP2014192710A (en) * | 2013-03-27 | 2014-10-06 | Oki Electric Ind Co Ltd | Voice communication quality measuring system, voice communication quality measuring method, voice communication quality measuring device, voice communication quality measuring program, voice communication quality requesting device, and voice communication quality requesting program |
US20150117653A1 (en) * | 2012-08-21 | 2015-04-30 | Huawei Technologies Co., Ltd. | Method and apparatus for evaluating audio stream quality |
US20150172455A1 (en) * | 2012-08-24 | 2015-06-18 | Huawei Technologies Co., Ltd. | Method, network element, and system for assessing voice quality |
CN105100508A (en) * | 2014-05-05 | 2015-11-25 | 华为技术有限公司 | Network voice quality estimation method, device and system |
-
2016
- 2016-05-13 JP JP2016097399A patent/JP6586044B2/en active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001268124A (en) * | 2000-03-23 | 2001-09-28 | Nippon Telegr & Teleph Corp <Ntt> | Device and method for monitoring quality of audio/video communication, and recording medium recorded with the method |
WO2004068098A1 (en) * | 2003-01-30 | 2004-08-12 | Fujitsu Limited | Audio packet vanishment concealing device, audio packet vanishment concealing method, reception terminal, and audio communication system |
JP2006352528A (en) * | 2005-06-16 | 2006-12-28 | Nippon Telegr & Teleph Corp <Ntt> | User body-sensible quality estimating model generating apparatus, method and program thereof |
US20150117653A1 (en) * | 2012-08-21 | 2015-04-30 | Huawei Technologies Co., Ltd. | Method and apparatus for evaluating audio stream quality |
US20150172455A1 (en) * | 2012-08-24 | 2015-06-18 | Huawei Technologies Co., Ltd. | Method, network element, and system for assessing voice quality |
JP2014192710A (en) * | 2013-03-27 | 2014-10-06 | Oki Electric Ind Co Ltd | Voice communication quality measuring system, voice communication quality measuring method, voice communication quality measuring device, voice communication quality measuring program, voice communication quality requesting device, and voice communication quality requesting program |
CN105100508A (en) * | 2014-05-05 | 2015-11-25 | 华为技术有限公司 | Network voice quality estimation method, device and system |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10972516B1 (en) | 2018-08-24 | 2021-04-06 | Amdocs Development Limited | System, method, and computer program for probabilistic estimation and prevention of muting occurrences in voice over LTE (VoLTE) |
Also Published As
Publication number | Publication date |
---|---|
JP6586044B2 (en) | 2019-10-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP1267555B1 (en) | Measuring speech quality | |
EP2288087B1 (en) | Audio quality estimation method, audio quality estimation device, and program | |
US11748643B2 (en) | System and method for machine learning based QoE prediction of voice/video services in wireless networks | |
US8817632B2 (en) | Method of measuring packet loss rate, packet loss rate measuring device and storage medium | |
EP1938496B1 (en) | Method and apparatus for estimating speech quality | |
KR100738162B1 (en) | Method for measuring interactive speech quality in VoIP network | |
CN110536314B (en) | Method, device, equipment and medium for determining voice quality | |
JPWO2011090185A1 (en) | Voice quality measuring device, voice quality measuring method and program | |
JP6586044B2 (en) | Speech quality estimation apparatus, speech quality estimation method and program | |
US10044455B2 (en) | End-to-end real-time transport protocol (RTP) packet transmission delay measurement apparatus and method | |
Zhang et al. | Perceived QoS assessment for Voip networks | |
JP6511003B2 (en) | Voice quality estimation device, voice quality estimation method, and program | |
JP2005077970A (en) | Device and method for speech quality objective evaluation | |
JP5952252B2 (en) | Call quality estimation method, call quality estimation device, and program | |
JP2016139848A (en) | Voice quality estimation device, method and program | |
Matousek et al. | On-line monitoring of VoIP quality using IPFIX | |
JP2007329630A (en) | Echo quality measuring apparatus, system, method, and program | |
JP5792689B2 (en) | Transmitting loudness rating information measuring device and transmitting loudness rating information measuring method | |
JP2006148752A (en) | Method and server for deciding evaluation sample number for subjective evaluation of telephone call quality | |
JP2018022956A (en) | Reaction estimation device, reaction estimation method, and program | |
JP2016144035A (en) | Voice quality estimation device, method and program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20180528 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20190426 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20190514 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190619 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20190903 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20190906 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6586044 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |