JP5782402B2 - 音声品質客観評価装置及び方法 - Google Patents

音声品質客観評価装置及び方法 Download PDF

Info

Publication number
JP5782402B2
JP5782402B2 JP2012078335A JP2012078335A JP5782402B2 JP 5782402 B2 JP5782402 B2 JP 5782402B2 JP 2012078335 A JP2012078335 A JP 2012078335A JP 2012078335 A JP2012078335 A JP 2012078335A JP 5782402 B2 JP5782402 B2 JP 5782402B2
Authority
JP
Japan
Prior art keywords
noise
filter
speech
quality
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2012078335A
Other languages
English (en)
Other versions
JP2013205831A (ja
Inventor
敦子 倉島
敦子 倉島
岡本 淳
淳 岡本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2012078335A priority Critical patent/JP5782402B2/ja
Publication of JP2013205831A publication Critical patent/JP2013205831A/ja
Application granted granted Critical
Publication of JP5782402B2 publication Critical patent/JP5782402B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Telephone Function (AREA)

Description

本発明は、音声品質客観評価装置及び方法に係り、特に、人間が音声を聞いてその品質を評価する主観評価試験を行うことなく、音声信号の物理的特徴量の測定から主観品質を推定するための音声品質客観評価装置及び方法に関する。
従来の音声品質客観評価装置は、予め固定的に用意された評価対象である基準音源を評価対象系に通し、これを元の音源と比較することにより、評価対象系において生じる歪みを定量化し、主観品質を推定する。
音声品質客観評価技術であるITU-T 勧告 P.862(非特許文献1参照)及びP.863(非特許文献2参照)に基づく従来の評価においては、評価対象系に通す基準音源は背景雑音を含まないクリアな音声信号であることが求められている。
しかしながら、上記従来の評価技術では、基準音源としてクリアな音声信号を確保することが困難である場合には、品質推定精度の低下を招き、適切な客観評価値を得ることができない問題があった。
本発明は、上記の点に鑑みなされたもので、基準音源としてクリアな音声信号を予め確保することを必要とせず、背景雑音を含む劣化した音声(劣化音声)信号を基準音源として、主観品質の推定を高い精度で実現することが可能な音声品質客観評価装置及び方法を提供することを目的とする。
上記の問題を解決するため、本発明は、入力された基準音声と劣化音声から主観品質を推定する音声品質客観評価装置であって、
前記基準音声に含まれるノイズを除去するノイズ除去手段と、
ノイズが除去された基準音声と前記劣化音声から主観品質を推定する品質推定手段と、を有し、
前記ノイズ除去手段は、
予め発生するノイズの特性に対応するフィルタ情報を格納したフィルタ情報記憶手段と、
無音声区間の音信号を周波数帯域特性に基づいて前記フィルタ情報記憶手段を参照することにより取得したフィルタ情報に対応するフィルタを用いてノイズを除去するフィルタ選択手段と、を含む
上記のように本発明によれば、実際に会話を行っている際の音声品質を導出する際に、基準音源である発話音声をマイクで受音するため、必然的に基準音源に背景雑音が重畳してしまう。しかし、本発明により背景雑音の影響をなくすことにより精度よく主観品質を推定することが可能となる。
本発明の第1の実施の形態における音声品質客観評価装置の構成図である。 フィルタ特性の例である。 本発明の第2の実施の形態におけるノイズ除去部の構成図である。 本発明の第2の実施の形態における無音声区間分類部の動作である。 本発明の第2の実施の形態におけるフィルタDB部の例である。
以下、図面と共に本発明の実施の形態の例を説明する。
本発明は、上述の課題を解決するため、基準音源にノイズ除去フィルタをかけ背景雑音を除去することで精度の高い音声品質を導出するものである。
[第1の実施の形態]
本実施の形態では、バンドパスフィルタのような固定のノイズ除去フィルタを用いて基準音源に存在する背景雑音を除去する。
図1は、本発明の第1の実施の形態における音声品質客観評価装置の構成を示す。
音声品質客観評価装置100は、ノイズ除去部110、品質推定部120を有し、ノイズ除去部110は内部にフィルタ処理部115を有する。
音声品質客観評価装置100は、背景雑音有基準音声信号10と、当該背景雑音有基準音声信号10が評価対象系200を通って劣化した劣化音声信号20を用いて音声品質客観評価値30を導出する。
これを実現するために、ノイズ除去部110では、背景雑音を含んだ基準音声信号10が入力され、フィルタ処理部115においてノイズを除去するフィルタをかけることにより、背景雑音を除去したクリアな基準音声信号12を出力する。
フィルタ処理部115では、例えば、図2に示すように、電話音声帯域幅である300Hz〜3400Hzを通過するバンドパスフィルタを利用することとし、これ以外の雑音成分が多い周波数成分を減衰させることで背景雑音を除去し、背景雑音無基準音声信号12を導出する。
なお、これ以外に、通常時の雑音の発生状況に応じて、ハイパスフィルタ、ローパスフィルタなどのアナログフィルタや音声信号を窓関数としてその帯域をノイズとするデジタルフィルタを利用することも考えられる。
品質推定部120では、上記で出力された背景雑音無基準音声信号12と劣化音声信号20が入力され、たとえば音声品質客観評価アルゴリズムであるITU-T勧告P.862を用いて、音声信号の物理的特徴量の測定から音声品質客観評価値30を導出する。
[第2の実施の形態]
上記の第1の実施の形態におけるノイズ除去部110では、特定のフィルタのみでは最適にノイズを除去できない場合があることから、本実施の形態では、背景雑音の特徴にあったノイズ除去フィルタを選択的に用いることにより、適切に背景雑音を除去した基準音源を導出する。さらに、背景雑音の特徴は音声が含まれていると捉えにくいことから、基準音源の信号レベルから有音声音と無音声音の区間に分類し、無音声区間のみに含まれる背景雑音の特徴を利用することで、さらに適切に背景雑音を除去したクリアな基準音源を導出する。
図3は、本発明の第2の実施の形態におけるノイズ除去部の構成を示す。同図において、図1と同一構成部分については同一符号を付し、その説明を省略し、第1の実施の形態と異なるノイズ除去部についてのみ説明する。
図3に示すノイズ除去部110は、無音声区間分類部112、ノイズ除去フィルタ選定部113、フィルタ処理部115、フィルタDB部117を有する。
ノイズ除去部110は、背景雑音を含んだ背景雑音有基準音声信号10が入力され、無音声区間分類部112で無音声区間信号11を作成する。ノイズ除去フィルタ選定部113は無音声区間信号11が入力されると、無音声区間信号11の周波数特性40をフィルタDB部117に出力する。フィルタDB部117は受け取った周波数特性40から対応するノイズ除去フィルタ45を抽出し、ノイズ除フィルタ選定部113に渡す。ノイズ除去フィルタ選定部113は受け取ったノイズ除去フィルタの情報(フィルタ名、フィルタの種別情報または識別子など)45をフィルタ処理部115に出力する。フィルタ処理部115において受け取ったノイズ除去フィルタの情報45を用いて背景雑音有基準音声信号10から背景雑音無基準音声信号12にフィルタ処理し出力する。
以下に各部の処理の詳細を示す。
無音声区間分類部112では、図4に示すように背景雑音を含んだ基準音声信号10が入力されると、信号レベルにより、単位時間あたりの有音/無音判別閾値を超えるかどうかにより有音声区間と無音声区間に分類し、無音声区間のみ繋げ合わせた信号を無音声区間信号11として出力する。当該無音声区間信号11には、背景雑音が含まれる。ノイズ除去フィルタ選定部113では、受け取った背景雑音を含む無音声区間信号11が表わす背景雑音を周波数変換し、その周波数特性40に基づいてフィルタDB部117を参照し、当該周波数特性に対応するフィルタ名またはフィルタ識別子、または、フィルタ種別等のノイズ除去フィルタの情報45を受け取り、そのノイズ除去フィルタ45をフィルタ処理部115に出力する。
フィルタ処理部115では、除去フィルタ選定部113で選定されたフィルタを用いて、第1の実施の形態と同様に、背景雑音有基準音声信号10から背景雑音を除去し、背景雑音無基準音声信号12を導出する。
フィルタDB部117は、実験結果に基づき、図5に示すように予め得られた周波数特性40に対応した当該ノイズの除去に最適なフィルタを選択するためのデータが格納されており、ノイズ除去フィルタ選定部113から送られた周波数特性40に対応した最適なノイズ除去フィルタを選定し、当該フィルタの情報45をフィルタ処理部115に出力する。最適なノイズ除去フィルタは、周波数特性40によって大きく異なることから、バンドパスフィルタをはじめ、ローパスフィルタやハイパスフィルタ等のアナログフィルタや音声信号を窓関数としてその帯域をノイズとするデジタルフィルタ、入力信号の逆位相を使うフィルタなどの中で、予め実験的に、どのフィルタが最もよくノイズを除去できるか導出したものとする。
上記のような構成とすることにより、無音声区間のみに含まれる背景雑音の特徴に応じたノイズ除去フィルタの選択を可能にすることにより、適切に背景雑音を除去した基準音源を利用して高精度に音声品質値を導出する。
なお、図1、図3に示す音声品質客観評価装置の各構成要素の動作をプログラムとして構築し、音声品質客観評価装置として利用されるコンピュータにインストールして実行させる、または、ネットワークを介して流通させることが可能である。
本発明は、上記の実施の形態に限定されることなく、特許請求の範囲内において、種々変更・応用が可能である。
10 背景雑音有基準音声信号
11 無音声区間信号
12 背景雑音無基準音声信号
20 劣化音声信号
30 音声品質客観評価値
40 周波数特性
45 ノイズ除去フィルタ情報
100 音声品質客観評価装置
110 ノイズ除去部
112 無音声区間分類部
113 ノイズ除去フィルタ選定部
115 フィルタ処理部
117 フィルタDB部
120 品質推定部
200 評価対象系

Claims (6)

  1. 入力された基準音声と劣化音声から主観品質を推定する音声品質客観評価装置であって、
    前記基準音声に含まれるノイズを除去するノイズ除去手段と、
    ノイズが除去された基準音声と前記劣化音声から主観品質を推定する品質推定手段と、
    を有し、
    前記ノイズ除去手段は、
    予め発生するノイズの特性に対応するフィルタ情報を格納したフィルタ情報記憶手段と、
    無音声区間の音信号を周波数帯域特性に基づいて前記フィルタ情報記憶手段を参照することにより取得したフィルタ情報に対応するフィルタを用いてノイズを除去するフィルタ選択手段と、
    を含むことを特徴とする音声品質客観評価装置。
  2. 前記ノイズ除去手段は、
    ノイズ除去フィルタを用いてノイズを除去する
    請求項1記載の音声品質客観評価装置。
  3. 前記ノイズ除去手段は、
    前記基準音声を有音声区間と無音声区間に分離し、分離された無音声区間を背景雑音として利用する
    請求項1記載の音声品質客観評価装置。
  4. 入力された基準音声と劣化音声から主観品質を推定する音声品質客観評価方法であって、
    ノイズ除去手段が、前記基準音声に含まれるノイズを除去するノイズ除去ステップと、
    品質推定手段が、ノイズが除去された基準音声と前記劣化音声から主観品質を推定する品質推定ステップと、
    を行い、
    前記ノイズ除去ステップにおいて、
    予め発生するノイズの特性に対応するフィルタ情報をフィルタ情報記憶手段に格納しておき、
    無音声区間の音信号を周波数帯域特性に基づいて前記フィルタ情報記憶手段を参照することにより取得したフィルタ情報に対応するフィルタを用いてノイズを除去する
    ことを特徴とする音声品質客観評価方法。
  5. 前記ノイズ除去ステップにおいて、
    ノイズ除去フィルタを用いてノイズを除去する
    請求項記載の音声品質客観評価方法。
  6. 前記ノイズ除去ステップにおいて、
    前記基準音声を有音声区間と無音声区間に分離し、分離された無音声区間を背景雑音として利用する
    請求項記載の音声品質客観評価方法。
JP2012078335A 2012-03-29 2012-03-29 音声品質客観評価装置及び方法 Active JP5782402B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012078335A JP5782402B2 (ja) 2012-03-29 2012-03-29 音声品質客観評価装置及び方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012078335A JP5782402B2 (ja) 2012-03-29 2012-03-29 音声品質客観評価装置及び方法

Publications (2)

Publication Number Publication Date
JP2013205831A JP2013205831A (ja) 2013-10-07
JP5782402B2 true JP5782402B2 (ja) 2015-09-24

Family

ID=49524918

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012078335A Active JP5782402B2 (ja) 2012-03-29 2012-03-29 音声品質客観評価装置及び方法

Country Status (1)

Country Link
JP (1) JP5782402B2 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2922058A1 (en) * 2014-03-20 2015-09-23 Nederlandse Organisatie voor toegepast- natuurwetenschappelijk onderzoek TNO Method of and apparatus for evaluating quality of a degraded speech signal
CN105989853B (zh) * 2015-02-28 2020-08-18 科大讯飞股份有限公司 一种音频质量评测方法及系统
JP7005848B2 (ja) * 2018-11-22 2022-01-24 株式会社Jvcケンウッド 音声処理条件設定装置、無線通信装置、および音声処理条件設定方法
JP7196993B2 (ja) * 2018-11-22 2022-12-27 株式会社Jvcケンウッド 音声処理条件設定装置、無線通信装置、および音声処理条件設定方法
CN111128226A (zh) * 2019-12-30 2020-05-08 广东电网有限责任公司电力科学研究院 一种噪声声品质检测的装置及方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2953238B2 (ja) * 1993-02-09 1999-09-27 日本電気株式会社 音質主観評価予測方式
JPH11231897A (ja) * 1998-02-12 1999-08-27 Hitachi Ltd 音声認識装置及び方法
JP2007233264A (ja) * 2006-03-03 2007-09-13 Nippon Telegr & Teleph Corp <Ntt> 音声品質客観評価装置および音声品質客観評価方法
US9025780B2 (en) * 2009-08-14 2015-05-05 Koninklijke Kpn N.V. Method and system for determining a perceived quality of an audio system

Also Published As

Publication number Publication date
JP2013205831A (ja) 2013-10-07

Similar Documents

Publication Publication Date Title
JP4350690B2 (ja) 音声品質向上方法及び装置
JP6553111B2 (ja) 音声認識装置、音声認識方法及び音声認識プログラム
US8073689B2 (en) Repetitive transient noise removal
US8949118B2 (en) System and method for robust estimation and tracking the fundamental frequency of pseudo periodic signals in the presence of noise
JP5782402B2 (ja) 音声品質客観評価装置及び方法
EP2881948A1 (en) Spectral comb voice activity detection
JP5542206B2 (ja) オーディオ・システムの知覚品質を判定する方法およびシステム
JP5649488B2 (ja) 音声判別装置、音声判別方法および音声判別プログラム
CN108305637B (zh) 耳机语音处理方法、终端设备及存储介质
JP6174856B2 (ja) 雑音抑制装置、その制御方法、及びプログラム
JP2008015443A (ja) 雑音抑圧音声品質推定装置、方法およびプログラム
KR101317813B1 (ko) 노이지 음성 신호의 처리 방법과 이를 위한 장치 및 컴퓨터판독 가능한 기록매체
JP2008076636A (ja) オーディオ信号補間方法及びオーディオ信号補間装置
KR101961998B1 (ko) 즉각적인 바람 잡음을 감소시키는 것
CA2701439C (en) Measuring double talk performance
CN110503967B (zh) 一种语音增强方法、装置、介质和设备
JP2014513320A (ja) オーディオ信号におけるドミナント周波数を減衰する方法及び装置
KR101335417B1 (ko) 노이지 음성 신호의 처리 방법과 이를 위한 장치 및 컴퓨터판독 가능한 기록매체
KR101824648B1 (ko) 음성 신호 처리 방법 및 장치
JP5840087B2 (ja) 音声信号復元装置および音声信号復元方法
KR20200095370A (ko) 음성 신호에서의 마찰음의 검출
KR100931487B1 (ko) 노이지 음성 신호의 처리 장치 및 그 장치를 포함하는 음성기반 어플리케이션 장치
JP7347520B2 (ja) 音信号処理装置、音信号処理方法および音信号処理プログラム
JP5327735B2 (ja) 信号再生装置
JP2020190606A (ja) 音声雑音除去装置及びプログラム

Legal Events

Date Code Title Description
RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20131001

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20140311

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20141120

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20141209

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150209

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20150714

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20150717

R150 Certificate of patent or registration of utility model

Ref document number: 5782402

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150