WO2020225850A1

WO2020225850A1 - 音響品質評価装置、音響品質評価方法、およびプログラム

Info

Publication number: WO2020225850A1
Application number: PCT/JP2019/018260
Authority: WO
Inventors: 祥子栗原; 登原田
Original assignee: 日本電信電話株式会社
Priority date: 2019-05-07
Filing date: 2019-05-07
Publication date: 2020-11-12
Also published as: JPWO2020225850A1; JP7184173B2; US20220277765A1; US11699458B2

Abstract

会話試験による音響品質評価において適切な評価値を得る。音響品質評価装置３は、音声通信網４を通じて近端端末１と遠端端末２との間で行われる通話の音響品質を評価する。評価値提示部３１は、複数の評価観点それぞれについて所定数の段階に分類した評価カテゴリーを表示部１３へ表示する。入力部１４は、評価者が各評価観点について選択した評価カテゴリーを評価値決定部３２へ送信する。評価値決定部３２は、入力部１４から受信した評価カテゴリーに割り当てられた評価値のうち最も低い評価値を音響品質の主観評価値として決定する。

Description

音響品質評価装置、音響品質評価方法、およびプログラム

　本発明は、通話品質を評価するための技術に関し、特に拡声系通信システムの品質評価試験技術に関する。

　通信技術の発達とともに、機器を持たずに通話できる手軽さから、会議システムやスマートフォンによるハンズフリー拡声通話などの拡声系通信システムを利用する機会が増えている。拡声系通信システムで問題となる音響エコーや周辺雑音を除去し、快適な通話環境を提供するために、音響エコーキャンセラ（AEC: Acoustic Echo Canceller）が利用されている。

　音響エコーとは、近端から送信された音声が遠端のスピーカから出力され、遠端のマイクロホンが拾うことで発生する現象である。音響エコーキャンセラの効果が弱ければ音響エコーが消し残り、強すぎれば遠端からの送話音声までもが除去されてしまい、歪んだり消えたりして聞き取りにくくなる。音響エコーキャンセラの性能は音響エコーがどれだけ的確に消去されているかに依存することから、従来の音響エコーキャンセラの性能評価は、音響エコーの消去量に着目した客観評価が主流であった。客観評価は計算機処理で評価できるため手軽であるが、必ずしも実際の通話でユーザが体感する品質（「ユーザ体感品質」とも呼ぶ）とは一致しないという問題があった。

　ハンドセットを使用して通話するIP電話では、遠端から送信される音声は、音響エコーなど近端話者の影響を受けず、遠端音声のみを評価対象にできる。そのため、IP電話の品質評価は、会話試験を簡略化し、片方向通話を対象とした受聴試験により行うことが一般的である。受聴試験は、会話試験に較べて再現性が高く、実施時間が短いため、利便性が高い。また、受聴試験による主観評価値（「受聴MOS: Mean Opinion Score」とも呼ぶ）を推定するPESQ（Perceptual Evaluation of Speech Quality）などの客観評価法も確立されている（非特許文献１参照）。

　一方、主観評価で音響エコーや音響エコーキャンセラによる処理音を評価するためには、音響エコーを知覚する必要があり、評価者本人が通話することで初めて評価可能となる。そのため、ハンズフリー拡声通話などの拡声系通信システムでは、双方向の会話試験による品質評価が推奨されてきた（非特許文献２参照）。

　近年ではスマートフォンや携帯電話など音響品質が低い通話環境が普及している。音響品質が低いとは、例えばQ値が10db以下であるような音響信号である。このような音響信号は、本来であればMOS値が１～２となることが期待される。MOS値は通常１～５の５段階で表され、数値が大きいほど品質が高いことを表す。Q値と期待されるMOS値との関係については、非特許文献３を参照されたい。

ITU-T, "ITU-T Recommendation P.862: Perceptual evaluation of speech quality (PESQ): An objective method for end-to-end speech quality assessment of narrow-band telephone networks and speech codecs", ITU, 1996 ITU-T, "ITU-T Recommendation P.800: Methods for subjective determination of transmission quality", ITU, 1996 通信トラヒック品質プロジェクト、"音声品質評価法 > 3.音声品質の主観評価法 > 3.5.等価Q値換算法"、［online］、［平成31年3月5日検索］、インターネット<URL:http://www.ntt.co.jp/qos/technology/sound/03_5.html>

　音響品質が低い通話環境に慣れている評価者は音響品質に対する基準が低くなっているため、例えば相手の音声が聞き取れれば音響品質が良いなど、高い評価値を与える傾向が強い。そのため、従来の会話試験で主観評価を行った場合、高い評価値に偏り、適切な評価値が得られないという問題があった。

　この発明の目的は、上記のような技術的課題に鑑みて、会話試験による音響品質評価において、音響品質が低い通話環境に慣れた評価者であっても、適切な評価値を得ることができる音響品質評価技術を実現することである。

　上記の課題を解決するために、本発明の一態様の音響品質評価装置は、複数の通信端末間で行われる通話の音響品質を評価する音響品質評価装置であって、複数の評価観点それぞれについて所定数の段階に分類した評価カテゴリーを評価者へ提示する評価値提示部と、評価者が各評価観点について選択した評価カテゴリーに割り当てられた評価値のうち最も低い評価値を音響品質の主観評価値として決定する評価値決定部と、を含む。

　この発明の音響品質評価技術によれば、会話試験による音響品質評価において、音響品質が低い通話環境に慣れた評価者であっても、適切な評価値を得ることができる。

図１は、音響品質評価システムの機能構成を例示する図である。図２は、音響品質評価方法の処理手順を例示する図である。図３は、評価入力画面の表示内容を例示する図である。図４は、実験結果を説明するための図である。

　以下、この発明の実施の形態について詳細に説明する。なお、図面中において同じ機能を有する構成部には同じ番号を付し、重複説明を省略する。

　＜拡声系通信システムでの会話試験＞
　まず、拡声系通信システムでの会話試験による音響品質評価試験を概念的に説明する。この評価試験では、近端話者と遠端話者とが拡声系通信システムを通じて会話を行い、近端話者側に位置する評価者が当該拡声系通信システムの品質評価を行う。なお、拡声系通信システムとは、マイクロホンとスピーカとを備えた端末装置間で音響信号を送受信する通信システムであって、端末装置のスピーカから出力された音の少なくとも一部がその端末装置のマイクロホンで受音されるもの（音の回り込みが生じるもの）をいう。拡声系通信システムの一例は、音声会議システムやテレビ会議システムである。

　拡声系通信システムでは、近端話者の音声が近端話者側のマイクロホンで受音され、それに基づいて得られた音響信号がネットワーク経由で遠端話者側に伝送され、当該音響信号が表す音が遠端話者側のスピーカから出力される。また、遠端話者側の音が遠端話者側のマイクロホンで受音され、それに基づいて得られた音響信号がネットワーク経由で近端話者側に伝送され、当該音響信号が表す音が近端話者側のスピーカから出力される。ただし、遠端話者側のスピーカから出力された音の少なくとも一部は遠端話者側のマイクロホンでも受音される。すなわち、遠端話者側のマイクロホンで受音される遠端話者側の音は、遠端話者の音声に近端話者の音声の回り込み（音響エコー）が重畳されたものである。すなわち、遠端話者側のマイクロホンで受音される遠端話者側の音は、遠端話者の音声に基づく信号に近端話者の音声に基づく信号が遠端話者側の空間で劣化して重畳した信号に基づく。なお、近端話者が発話していないときは、近端話者の音声に基づく信号が重畳しないため遠端話者の音声が劣化することはない。また、遠端話者側の音の劣化は、遠端話者側の周囲騒音の重畳も要因となり得る。

　近端話者側に伝送される音響信号は、遠端話者側のマイクロホンで受音された音を表す信号に所定の信号処理を行って得られた処理信号に由来するものであってもよいし、このような信号処理を行うことなく得られたものであってもよい。信号処理は、どのような処理であってもよい。信号処理の例は、エコーキャンセル処理およびノイズキャンセル処理の少なくとも一方を含む処理である。なお、エコーキャンセル処理とは、エコーを低減させるための広義のエコーキャンセラによる処理を意味する。広義のエコーキャンセラによる処理とは、エコーを低減させるための処理全般を意味する。広義のエコーキャンセラによる処理は、例えば、適応フィルタを用いた狭義のエコーキャンセラのみによって実現されてもよいし、音声スイッチによって実現されてもよいし、エコーリダクションによって実現されてもよいし、これらの少なくとも一部の技術の組み合わせによって実現されてもよいし、さらにその他の技術との組み合わせによって実現されてよい（下記参考文献１参照）。またノイズキャンセル処理とは、遠端端末のマイクロホンの周囲で発生する、遠端話者の音声以外のあらゆる環境雑音に起因する雑音成分を抑圧または除去する処理を意味する。環境雑音とは、例えば、オフィスの空調音、走行中の車内音、交差点での車の通行音、虫の音、キーボードのタッチ音、複数の人の声（ガヤガヤ音）などを指し、音の大／小、屋内／屋外は問わない（下記参考文献２参照）。

　〔参考文献１〕知識ベース　知識の森、２群－６編－５章、“音響エコーキャンセラ”、電子情報通信学会、［online］、［平成31年3月5日検索］、インターネット<URL:http://www.ieice-hbkb.org/files/02/02gun_06hen_05.pdf>
　〔参考文献２〕阪内澄宇，羽田陽一，田中雅史，佐々木潤子，片岡章俊，“雑音抑圧及びエコー抑圧機能を備えた音響エコーキャンセラ”，電子情報通信学会論文誌，Vol.J87-A，No.4，pp.448-457，2004年4月

　評価者（近端話者）は、近端話者側のスピーカから出力される音響信号を受聴し、予め定めた所定数の段階に分類された評価カテゴリーから近端話者の主観に基づいて最も適合する評価カテゴリーを選択する。例えば、非特許文献１に挙げたITU-T Recommendation P.800では"Excellent", "Good", "Fair", "Poor", "Bad"の５段階の評価カテゴリーに分類し、各評価カテゴリーに順に5, 4, 3, 2, 1の評価値を割り当てることが提案されている。この主観評価を、複数の評価者が通話相手を入れ替えながらそれぞれ複数回行い、収集した評価値を集計することで音響品質の評価が行われる。

　＜音響品質評価システム＞
　実施形態の音響品質評価システムは、上述の会話試験を実行するための情報通信システムである。実施形態の音響品質評価システム１０は、図１に示すように、近端話者が用いる近端端末１と、遠端話者が用いる遠端端末２と、音響品質評価装置３とを含む。近端端末１は、少なくとも送話部１１、受話部１２、表示部１３、および入力部１４を備える。遠端端末２は、少なくとも送話部２１および受話部２２を備え、さらに信号処理部２３を備えてもよい。音響品質評価装置３は、評価値提示部３１、評価値決定部３２、集計部３３、および集計結果記憶部３０を備える。この音響品質評価システム１０が図２に例示する各ステップの処理を行うことにより実施形態の音響品質評価方法が実現される。

　以下の説明では、近端端末１を使用する近端話者が音響品質を評価する評価者であり、遠端端末２を使用する遠端話者が音響品質の評価対象となる会話の通話相手とするが、同一の通話を近端話者と遠端話者とが同時に評価してもよい。この場合、近端話者と遠端話者はいずれも評価者であり、かつ、通話相手となる。このとき、近端端末１と遠端端末２とは同一の機能構成となり、近端端末１が信号処理部をさらに備え、遠端端末２が表示部および入力部をさらに備えることになる。また、以下の説明では、近端端末１と遠端端末２との二者間の通話の音響品質を評価することを前提とするが、遠端端末２が複数存在し、近端端末１と複数の遠端端末２との間で行われる三者以上の会議通話を評価対象としてもよい。

　近端端末１と遠端端末２とは音声通信網４を介して接続される。音響品質評価装置３は、近端端末１と図示していないネットワークを介して接続される。ただし、音声通信網４が帯域制御等により音声用の通信経路とデータ用の通信経路とを論理的に分割可能であれば、音声通信網４を介して近端端末１と音響品質評価装置３とが接続されてもよい。音声通信網４は、接続される各装置が相互に通信可能なように構成された回線交換方式もしくはパケット交換方式の通信網であり、特に音声通信を想定して構成されたものである。音声通信網４は、具体的には、インターネットやWAN（Wide Area Network）、LAN（Local Area Network）、専用線、公衆交換電話網、携帯電話通信網などで構成することができる。

　近端端末１および遠端端末２は、例えば、中央演算処理装置（CPU: Central Processing Unit）、主記憶装置（RAM: Random Access Memory）などを有する公知又は専用のコンピュータに特別なプログラムが読み込まれて構成された特別な装置である。近端端末１および遠端端末２は、例えば、中央演算処理装置の制御のもとで各処理を実行する。近端端末１および遠端端末２に入力されたデータや各処理で得られたデータは、例えば、主記憶装置に格納され、主記憶装置に格納されたデータは必要に応じて中央演算処理装置へ読み出されて他の処理に利用される。近端端末１および遠端端末２は、少なくとも一部が集積回路等のハードウェアによって構成されていてもよい。近端端末１および遠端端末２は、具体的には、スマートフォンやタブレットのようなモバイル端末、もしくはデスクトップ型やラップトップ型のパーソナルコンピュータなどの音声送受信機能およびデータ通信機能を備えた情報処理装置である。

　音響品質評価装置３は、例えば、中央演算処理装置（CPU: Central Processing Unit）、主記憶装置（RAM: Random Access Memory）などを有する公知又は専用のコンピュータに特別なプログラムが読み込まれて構成された特別な装置である。音響品質評価装置３は、例えば、中央演算処理装置の制御のもとで各処理を実行する。音響品質評価装置３に入力されたデータや各処理で得られたデータは、例えば、主記憶装置に格納され、主記憶装置に格納されたデータは必要に応じて中央演算処理装置へ読み出されて他の処理に利用される。音響品質評価装置３は、少なくとも一部が集積回路等のハードウェアによって構成されていてもよい。音響品質評価装置３が備える各記憶部は、例えば、RAM（Random Access Memory）などの主記憶装置、ハードディスクや光ディスクもしくはフラッシュメモリ（Flash Memory）のような半導体メモリ素子により構成される補助記憶装置、またはリレーショナルデータベースやキーバリューストアなどのミドルウェアにより構成することができる。音響品質評価装置３は、具体的には、デスクトップ型やラックマウント型のサーバコンピュータなどのデータ通信機能およびデータ処理機能を備えた情報処理装置である。

　ステップＳ１において、近端端末１と遠端端末２とが音響品質の評価対象とする通話を開始する。まず、近端端末１が近端話者の操作に従って遠端端末２へ発信を行う。遠端端末２は遠端話者の操作に従って近端端末１からの着信に応答する。これにより、近端端末１と遠端端末２との間で通話が確立する。ここでは近端端末１から遠端端末２へ発信する例を示したが、遠端端末２から近端端末１へ発信することで通話を確立しても構わない。

　通話が確立すると、近端話者の発話した音声が近端端末１のマイクロホンＭ１により音響信号に変換され、送話部１１がその音響信号を遠端端末２の受話部２２へ送信する。遠端端末２の受話部２２は、近端端末１の送話部１１から受信した音響信号を遠端端末２のスピーカＳ２から出力する。遠端話者の発話した音声は遠端端末２のマイクロホンＭ２により音響信号に変換されるが、このとき遠端端末２のスピーカＳ２から出力された近端話者の音声の回り込みが遠端話者の音声に重畳して音響信号に変換される。遠端端末２の送話部２１は、音響信号を近端端末１の受話部１２へ送信する。遠端端末２が信号処理部２３を備える場合、信号処理部２３が送信される音響信号に対してエコーキャンセル処理およびノイズキャンセル処理の少なくとも一方を含む信号処理を行う。近端端末１の受話部１２は、遠端端末２の送話部２１から受信した音響信号を近端端末１のスピーカＳ１から出力する。このようにして、近端話者と遠端話者とは近端端末１と遠端端末２との間で確立した通話を介して会話を行う。

　ステップＳ２において、音響品質評価装置３の評価値提示部３１は、近端端末１の表示部１３へ近端話者が音響品質の評価を入力する評価入力画面を表示させるための制御信号を送信する。近端端末１の表示部１３は、受信した制御信号に従って評価入力画面を表示する。評価入力画面には、予め定めた複数の評価観点それぞれについて複数の段階に分類した評価カテゴリーが表示される。これらの評価カテゴリーには各評価観点での品質の高さに応じた評価値が割り当てられている。評価入力画面は、各評価観点について１つの評価カテゴリーのみが選択できるように設定されるものとする。

　評価観点は、例えば、「相手の声の聞き取り易さ」「雑音感」「自分の声の戻り」の３つの観点を含む。「相手の声の聞き取り易さ」の評価観点に対しては、例えば「非常に聞き取りやすい」「聞き取りには問題がない」「少し聞き取りにくい」「聞き取りにくい」「非常に聞き取りにくい」の５段階の評価カテゴリーが設けられ、各評価カテゴリーには順に5, 4, 3, 2, 1の評価値が割り当てられる。「雑音感」の評価観点に対しては、例えば「雑音が全くない」「雑音が少しある」「雑音がある」「雑音がかなり重畳している」「雑音が非常に多く重畳している」の５段階の評価カテゴリーが設けられ、各評価カテゴリーには順に5, 4, 3, 2, 1の評価値が割り当てられる。「自分の声の戻り」の評価観点に対しては、例えば「自分の声の戻りが全くない」「自分の声の戻りが少しある」「自分の声の戻りがある」「自分の声の戻りが大きい」「自分の声の戻りが非常に大きい」の５段階の評価カテゴリーが設けられ、各評価カテゴリーには順に5, 4, 3, 2, 1の評価値が割り当てられる。上記の例で示した評価観点と評価カテゴリーと評価値の関係をまとめると、下記のようになる。

　図３に、上記の例の評価カテゴリーに基づいて評価を入力するための評価入力画面を例示する。評価入力画面１３０には、「相手の声の聞き取り易さ」の評価観点に対応するエリア１３１－１、「雑音感」の評価観点に対応するエリア１３１－２、および「自分の声の戻り」の評価観点に対応するエリア１３１－３が設けられる。エリア１３１－１には「相手の声の聞き取り易さ」を５段階に分類した評価カテゴリーを表すラベル１３２－１が表示され、各評価カテゴリーに対して一対一で５つのボタン１３３－１が設けられる。ボタン１３３－１は選択状態が切り替えられる機能を持ち、エリア１３１－１内で１つのみが選択できるように設定される。例えば、ボタン１３３－１はエリア１３１－１内でグループが設定されたオプションボタンである。エリア１３１－２およびエリア１３１－３についても同様にラベル１３２－２，１３２－３およびボタン１３３－２，１３３－３が設けられる。図３は評価入力画面のデザインの一例であり、操作の利便性等を鑑みて異なるデザインとしても構わない。

　ステップＳ３において、近端話者は近端端末１のスピーカＳ１から出力される音声を受聴し、その音響品質を評価する。音響品質の評価は、表示部１３に表示された評価入力画面において、各評価観点について、自らの主観に基づいて最も当てはまると考える評価カテゴリーを選択することで行う。図３の評価入力画面１３０の例であれば、「相手の声の聞き取り易さ」について最も当てはまる評価カテゴリーを選択し、そのラベル１３２－１に対応するボタン１３３－１を選択する。同様に、「雑音感」について最も当てはまる評価カテゴリーおよび「自分の声の戻り」について最も当てはまる評価カテゴリーにそれぞれ対応するボタン１３３－２，１３３－３を選択する。近端話者はすべての評価観点について評価カテゴリーを選択した後、確定ボタン１３４を押下する。近端端末１の入力部１４は、評価入力画面１３０中の選択状態に従って、選択された各評価カテゴリーに割り当てられた評価値を音響品質評価装置３の評価値決定部３２へ送信する。

　ステップＳ４において、音響品質評価装置３の評価値決定部３２は、近端端末１の入力部１４から受信した各評価観点についての評価値に基づいて、音響品質に関する１つの主観評価値を決定する。具体的には、各評価観点についての評価値のうち最も低い評価値を音響品質に関する主観評価値として決定する。図３の例であれば、評価者は、「相手の声の聞き取り易さ」について「非常に聞き取りやすい」（評価値は５）、「雑音感」について「雑音がある」（評価値は３）、「自分の声の戻り」について「自分の声の戻りが少しある」（評価値は４）をそれぞれ選択しているため、主観評価値は最も低い評価値である“３”に決定する。評価値決定部３２は、決定した主観評価値を集計部３３へ出力する。

　音響品質評価装置３の集計部３３は、評価値決定部３２から複数回入力された複数の主観評価値を集計し、その集計結果を集計結果記憶部３０へ記憶する。複数の主観評価値は、同じ評価者により複数回実行された会話試験に基づく複数の主観評価値であってもよいし、１つの会話試験において複数の評価者が入力した複数の主観評価値であってもよいし、複数の評価者がそれぞれ複数回実行された会話試験に基づいて入力した複数の主観評価値であってもよい。集計部３３は、集計結果記憶部３０へ記憶された複数の主観評価値に基づいて、例えば平均等の統計処理を行って集計結果記憶部３０へ記憶してもよい。

　図４に、実施形態の音響品質評価システムによる評価試験の実験結果を示す。この試験では、４つの実験条件Ｉ～ＩＶを設定し、各実験条件下で４名の評価者が通信相手を入れ替えながら４日間にわたって３回ずつの会話試験を行った。実験条件Ｉは、明らかに良い音であり、４～５の評価値が付くことが想定される（言い換えると、評価値１～２を付ける人はいないであろう）条件である。実験条件ＩＩは、明らかに悪い音であり、１～２の評価値が付くことが想定される（言い換えると、評価値４～５を付ける人はいないであろう）条件である。実験条件ＩＩＩは、多くの人が普通と判断する音のうち比較的良い音であり、３～４の評価値が付くことが想定される（言い換えると、評価値１を付ける人はいないであろう）条件である。実験条件ＩＶは、多くの人が普通と判断する音のうち比較的悪い音であり、２～３の評価値が付くことが想定される（言い換えると、評価値５を付ける人はいないであろう）条件である。このような実験条件それぞれで、従来の一般的な評価カテゴリー（「大変良い」「良い」「やや悪い」「悪い」「大変悪い」）と、実施形態の評価カテゴリー（３つの評価観点それぞれで５段階の評価カテゴリーを設定）とを用いて会話試験を行い、それぞれの評価値の平均を集計した。図４に示すように、実施形態の評価カテゴリーでは想定評価値の範囲内の評価値を得ることができたが、従来の評価カテゴリーでは、特に低い評価値が付くことが想定される実験条件ＩＩやＩＶで、想定よりも高い評価値が付いていることがわかる。すなわち、従来の評価カテゴリーでは高い評価値を与える傾向がある評価者であっても、実施形態の評価カテゴリーを用いれば適切な評価値を得られることが、本実験により実証されたと言える。

　以上、この発明の実施の形態について説明したが、具体的な構成は、これらの実施の形態に限られるものではなく、この発明の趣旨を逸脱しない範囲で適宜設計の変更等があっても、この発明に含まれることはいうまでもない。実施の形態において説明した各種の処理は、記載の順に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されてもよい。

　［プログラム、記録媒体］
　上記実施形態で説明した各装置における各種の処理機能をコンピュータによって実現する場合、各装置が有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、上記各装置における各種の処理機能がコンピュータ上で実現される。

　この処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、例えば、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等どのようなものでもよい。

　また、このプログラムの流通は、例えば、そのプログラムを記録したDVD、CD-ROM等の可搬型記録媒体を販売、譲渡、貸与等することによって行う。さらに、このプログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することにより、このプログラムを流通させる構成としてもよい。

　このようなプログラムを実行するコンピュータは、例えば、まず、可搬型記録媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、一旦、自己の記憶装置に格納する。そして、処理の実行時、このコンピュータは、自己の記憶装置に格納されたプログラムを読み取り、読み取ったプログラムに従った処理を実行する。また、このプログラムの別の実行形態として、コンピュータが可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することとしてもよく、さらに、このコンピュータにサーバコンピュータからプログラムが転送されるたびに、逐次、受け取ったプログラムに従った処理を実行することとしてもよい。また、サーバコンピュータから、このコンピュータへのプログラムの転送は行わず、その実行指示と結果取得のみによって処理機能を実現する、いわゆるASP（Application Service Provider）型のサービスによって、上述の処理を実行する構成としてもよい。なお、本形態におけるプログラムには、電子計算機による処理の用に供する情報であってプログラムに準ずるもの（コンピュータに対する直接の指令ではないがコンピュータの処理を規定する性質を有するデータ等）を含むものとする。

　また、この形態では、コンピュータ上で所定のプログラムを実行させることにより、本装置を構成することとしたが、これらの処理内容の少なくとも一部をハードウェア的に実現することとしてもよい。

１０　音響品質評価システム
１　近端端末
２　遠端端末
３　音響品質評価装置
４　音声通信網
１１　送話部
１２　受話部
１３　表示部
１４　入力部
２１　送話部
２２　受話部
２３　信号処理部
３０　集計結果記憶部
３１　評価値提示部
３２　評価値決定部
３３　集計部

Claims

　複数の通信端末間で行われる通話の音響品質を評価する音響品質評価装置であって、
　複数の評価観点それぞれについて所定数の段階に分類した評価カテゴリーを評価者へ提示する評価値提示部と、
　上記評価者が各評価観点について選択した評価カテゴリーに割り当てられた評価値のうち最も低い評価値を上記音響品質の主観評価値として決定する評価値決定部と、
　を含む音響品質評価装置。
　請求項１に記載の音響品質評価装置であって、
　上記評価観点は、少なくとも相手の声の聞き取り易さ、雑音感、および自分の声の戻りを含み、
　上記評価カテゴリーは、各評価観点での品質の高さを５段階で分類し、品質が高いほど高い評価値が割り当てられている、
　音響品質評価装置。
　複数の通信端末間で行われる通話の音響品質を評価する音響品質評価方法であって、
　評価値提示部が、複数の評価観点それぞれについて所定数の段階に分類した評価カテゴリーを評価者へ提示し、
　評価値決定部が、上記評価者が各評価観点について選択した評価カテゴリーに割り当てられた評価値のうち最も低い評価値を上記音響品質の主観評価値として決定する、
　音響品質評価方法。
　請求項１または２に記載の音響品質評価装置としてコンピュータを機能させるためのプログラム。