JP2008257042A - 音声信号レベル表示装置およびその方法 - Google Patents
音声信号レベル表示装置およびその方法 Download PDFInfo
- Publication number
- JP2008257042A JP2008257042A JP2007100647A JP2007100647A JP2008257042A JP 2008257042 A JP2008257042 A JP 2008257042A JP 2007100647 A JP2007100647 A JP 2007100647A JP 2007100647 A JP2007100647 A JP 2007100647A JP 2008257042 A JP2008257042 A JP 2008257042A
- Authority
- JP
- Japan
- Prior art keywords
- signal level
- signal
- unit
- input
- noise suppression
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Telephone Function (AREA)
Abstract
【課題】各種装置等に音声信号を入力する際、ユーザに対して入力音声信号の大きさだけでなく、品質情報についても提示し、その提示情報に応じてユーザ自らが入力環境を適切に改善できるようにする。
【解決手段】音声信号入力部101から入力された音声信号のゲインを入力ゲイン調整部102で適正レベルに調整し、A/D変換部103でディジタル信号に変換し、このディジタル信号について一定時間ごとに切り出したフレームごとに、第1信号レベル計算部104で第1信号レベルを計算するとともに、音声尤度計算部107でスペクトル特徴量計算部105において求めた上記ディジタル信号の特徴量とクリーン音声信号の確率モデル(GMM)パラメータとから音声尤度値を計算する。そして、同一フレームの上記第1信号レベルと上記音声尤度値とを表示部108に表示する。
【選択図】図1
Description
ここで音声を入力する装置とは、例えば、一般の電話端末、電話会議用端末、TV会議用端末等の通信機器のほか、ICレコーダー等の音声記録装置、音声認識機能を有する端末装置等である。また、専用装置ではなく、パソコンのアプリケーションソフトウェアとして実装されるものも含む。
入力信号レベルを表示することにより、ユーザは発声した音声が適切なレベルにあるか否かを知ることができる。
従来、入力信号レベルのユーザへの提示手段としては、例えばパワーや対数パワー、振幅などを短時間ごとに計算し、これをレベルメータにより提示するという手段があった。
例えば、TV会議装置と共に設置される卓上マイク(バウンダリマイク)を使用した場合を考える。発言者が紙の資料を見ながら発言する際に、紙が卓上マイクに触れると紙が擦れる音と発言者の音声が重畳して収音され、受信側に不快な音が伝送される場合がある。発言者は紙がマイクに触れていることに気づかないことが多々あり、受信側から指摘されるまで不快な状態が継続するという問題が生じる。
そしてユーザは、その提示内容に応じて自らが入力環境を適切に改善できる。
図1は、本発明の音声信号レベル表示装置100の機能構成例である。また、図2は処理フローである。
音声信号レベル表示装置100は、音声信号入力部101、入力ゲイン調整部102、A/D変換部103、第1信号レベル計算部104、スペクトル特徴量計算部105、音声モデル格納部106、音声尤度計算部107及び第1表示部108から構成される。
入力ゲイン調整部102は、上記アナログ音声信号X0(t)が入力され、ゲインを調整して以降の処理が可能な強度の音声信号X(t)´を出力する(S2)。
また、ディジタル音声信号を利用する装置やソフトウェア、例えば、通信機器や音響装置、音声認識ソフトウェアなどに対しては、ここからディジタル音声信号を出力する。
従って、ユーザに音声尤度値を提示することで、ユーザは入力中の音声にスペクトル的な雑音・歪み(品質劣化)がどの程度あるかを知ることができる。
第1表示部108は、上記第1信号レベルA1(t)と上記音声尤度値p(xt)とが入力され、その両方を上記フレームごとに同時に表示する(S5−ab)。
例えば、図3のように棒グラフ形式で表示する方法がある。この場合、信号レベルについては信号レベルメータのレベル棒111の幅を変化させることにより表現する。一方、音声尤度値については、信号レベルメータの背景部112や枠部113の色を尤度値によって変化させることにより表現することが考えられる。このように色で表現する場合には、尤度値を予め決められた段階に従って色に変換してもよいし、尤度値に従って色を連続的に変化させてもよい。
図5は、本発明の音声信号レベル表示装置200の機能構成例である。また、図6は処理フローである。
音声信号レベル表示装置200は、音声信号入力部101、入力ゲイン調整部102、A/D変換部103、雑音抑圧部201、第1信号レベル計算部104、スペクトル特徴量計算部105、音声モデル格納部106、音声尤度計算部107及び第1表示部108から構成される。つまり、雑音抑圧部201以外は第1実施形態と同じ構成である。
また、ディジタル音声信号を利用する装置やソフトウェア、例えば、通信機器や音響装置、音声認識ソフトウェアなどに対しては、第1実施形態のようにA/D変換部103からではなく、ここからディジタル音声信号を出力する。
時刻tのパワースペクトルの周波数fの雑音抑圧後のパワースペクトルYD(t,f)は、式(2)のように計算される。
〔第3実施形態〕
図7は、本発明の音声信号レベル表示装置300の機能構成例である。また、図8は処理フローである。
図10は、本発明の音声信号レベル表示装置400の機能構成例である。また、図11は処理フローである。
音声信号レベル表示装置400は、音声信号入力部101、入力ゲイン調整部102、A/D変換部103、雑音抑圧パラメータ生成部401、雑音抑圧部402、第1信号レベル計算部104、スペクトル特徴量計算部105、音声モデル格納部106、音声尤度計算部107及び第1表示部108から構成される。つまり、第2実施形態の構成に雑音抑圧パラメータ生成部401を加え、雑音抑圧部201の代わりに雑音抑圧部402を適用する構成である。
雑音抑圧部402は、A/D変換部103からのディジタル信号が入力され、雑音抑圧パラメータ生成部401で生成したパラメータに基づき、雑音成分を抑圧して、雑音抑圧ディジタル信号を出力する(S7)。
図12は、本発明の音声信号レベル表示装置500の機能構成例である。また、図13は処理フローである。
音声信号レベル表示装置500は、音声信号入力部101、ゲイン制御部501、入力ゲイン調整部502、A/D変換部103、雑音抑圧パラメータ生成部503、雑音抑圧部402、第1信号レベル計算部104、スペクトル特徴量計算部105、音声モデル格納部106、音声尤度計算部107及び第1表示部108から構成される。つまり、第2実施形態の構成にゲイン制御部501を加え、入力ゲイン調整部102の代わりに入力ゲイン調整部502を、雑音抑圧パラメータ生成部401の代わりに雑音抑圧パラメータ生成部503をそれぞれ適用する構成である。
入力ゲイン調整部502は、上記入力音声信号が入力され、上記ゲイン制御信号に基づきゲインを調整して、以降の処理が可能な強度の音声信号を出力する(S8)。
雑音抑圧パラメータ生成部503は、上記音声尤度値が入力され、この入力値に応じて雑音抑圧パラメータを生成して出力する(S8)。
Claims (10)
- 入力された音声信号のレベルを表示する音声信号レベル表示装置であり、
音声信号が入力され、ゲインを調整して処理に適正なレベルで信号を出力する入力ゲイン調整部と、
上記信号が入力され、ディジタル信号に変換して出力するA/D変換部と、
上記ディジタル信号が入力され、これを短時間窓で切り出したフレームごとに信号の大きさを計算して第1信号レベルを出力する第1信号レベル計算部と、
上記ディジタル信号が入力され、これを上記短時間窓で切り出したフレームごとにスペクトル特徴量を計算して出力するスペクトル特徴量計算部と、
クリーン音声信号の複数の正規分布を含有する混合正規分布に基づく確率モデル(GMM:Gaussian Mixture Model)パラメータを記憶する音声モデル格納部と、
上記スペクトル特徴量が入力され、上記確率モデルパラメータを用いて音声尤度値を計算して出力する音声尤度計算部と、
上記第1信号レベルと上記音声尤度値とが入力され、その両方を上記フレームごとに同時に表示する第1表示部と、
を具備することを特徴とする音声信号レベル表示装置。 - 請求項1に記載の音声信号レベル表示装置において、更に、
上記A/D変換部から出力されたディジタル信号が入力され、雑音成分を抑圧し、この雑音成分を抑圧したディジタル信号を上記第1信号レベル計算部及び上記スペクトル特徴量計算部に入力するディジタル信号として出力する雑音抑圧部を具備することを特徴とする音声信号レベル表示装置。 - 請求項2に記載の音声信号レベル表示装置において、更に、
上記A/D変換部から出力されたディジタル信号が入力され、これを一定時間ごとに切り出したフレームごとに信号の大きさを計算して第2信号レベルを出力する第2信号レベル計算部と、
上記第2信号レベルが入力され、上記フレームごとに表示する第2表示部と、
を具備することを特徴とする音声信号レベル表示装置。 - 請求項2又は3のいずれかに記載の音声信号レベル表示装置において、更に、
入力手段を有し、そこからの入力操作に応じて雑音抑圧パラメータを生成して出力する雑音抑圧パラメータ生成部を具備し、
上記雑音抑圧部は、上記生成した雑音抑圧パラメータに応じて雑音成分抑圧量が可変であることを特徴とする音声信号レベル表示装置。 - 請求項4に記載の音声信号レベル表示装置において、
上記第1信号レベルが入力され、そのレベルに応じて上記入力ゲイン調整部がゲイン調整する度合いを制御するためのゲイン制御信号を出力するゲイン制御部を具備し、
上記入力ゲイン調整部は、上記ゲイン制御信号に基づきゲインを調整し、
上記雑音抑圧パラメータ生成部は、上記音声尤度値に応じて雑音抑圧パラメータを生成する、
ことを特徴とする音声信号レベル表示装置。 - 入力された音声信号のレベルを表示する音声信号レベル表示方法であり、
入力ゲイン調整部が、入力された音声信号のゲインを調整して処理に適正なレベルで信号を出力する入力ゲイン調整ステップと、
A/D変換部が、上記信号をディジタル信号に変換するA/D変換ステップと、
第1信号レベル計算部が、上記ディジタル信号を短時間窓で切り出したフレームごとの信号の大きさである第1信号レベルを計算する第1信号レベル計算ステップと、
上記ディジタル信号を上記短時間窓で切り出したフレームごとにスペクトル特徴量を計算するスペクトル特徴量計算ステップと、
音声尤度計算部が、上記スペクトル特徴量とクリーン音声信号の複数の正規分布を含有する混合正規分布に基づく確率モデル(GMM)パラメータとから音声尤度値を計算する音声尤度計算ステップと、
第1表示部が、上記第1信号レベルと上記音声尤度値との両方を上記フレームごとに同時に表示する第1表示ステップと、
を実行することを特徴とする音声信号レベル表示方法。 - 請求項6に記載の音声信号レベル表示方法において、更に、
雑音抑圧部が、上記A/D変換部から出力されたディジタル信号の雑音成分を抑圧し、この雑音成分を抑圧したディジタル信号を上記第1信号レベル計算部及び上記スペクトル特徴量計算部に入力するディジタル信号として出力する雑音抑圧ステップを実行することを特徴とする音声信号レベル表示方法。 - 請求項7に記載の音声信号レベル表示方法において、更に、
第2信号レベル計算部が、上記A/D変換部から出力されたディジタル信号を一定時間ごとに切り出したフレームごとの信号の大きさである第2信号レベルを計算する第2信号レベル計算ステップと、
第2表示部が、上記第2信号レベルを上記フレームごとに表示する第2表示ステップと、
を実行することを特徴とする音声信号レベル表示方法。 - 請求項7又は8のいずれかに記載の音声信号レベル表示方法において、更に、
雑音抑圧パラメータ生成部が、入力手段からの入力操作に応じて雑音抑圧パラメータを生成する雑音抑圧パラメータ生成ステップを実行し、
上記雑音抑圧ステップにおいては、上記生成した雑音抑圧パラメータに応じて雑音成分抑圧量を変化させることを特徴とする音声信号レベル表示方法。 - 請求項9に記載の音声信号レベル表示方法において、
ゲイン制御部が、第1信号レベルに応じて上記入力ゲイン調整部がゲイン調整する度合いを制御するためのゲイン制御信号を出力するゲイン制御ステップを実行し、
上記入力ゲイン調整ステップにおいては、上記ゲイン制御信号に基づきゲインを調整し、
上記雑音抑圧パラメータ生成ステップにおいては、上記音声尤度値に応じて雑音抑圧パラメータを生成する
ことを特徴とする音声信号レベル表示方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007100647A JP2008257042A (ja) | 2007-04-06 | 2007-04-06 | 音声信号レベル表示装置およびその方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007100647A JP2008257042A (ja) | 2007-04-06 | 2007-04-06 | 音声信号レベル表示装置およびその方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2008257042A true JP2008257042A (ja) | 2008-10-23 |
Family
ID=39980667
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007100647A Pending JP2008257042A (ja) | 2007-04-06 | 2007-04-06 | 音声信号レベル表示装置およびその方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2008257042A (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010286586A (ja) * | 2009-06-10 | 2010-12-24 | Nippon Telegr & Teleph Corp <Ntt> | 音声認識装置及び音響モデル作成装置とそれらの方法と、プログラムと記録媒体 |
CN102314883A (zh) * | 2010-06-30 | 2012-01-11 | 比亚迪股份有限公司 | 一种判断音乐噪声的方法以及语音消噪方法 |
JP2013058820A (ja) * | 2011-09-07 | 2013-03-28 | Ehime Univ | 声量表示端末及び声量表示プログラム |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH05158493A (ja) * | 1991-12-10 | 1993-06-25 | Fujitsu Ltd | 音声認識装置 |
JPH0974596A (ja) * | 1995-09-06 | 1997-03-18 | Canon Inc | 風雑音簡易モニタ装置 |
JPH11119696A (ja) * | 1997-10-09 | 1999-04-30 | Sony Corp | ドットマトリクス表示装置によるレベル表示方法 |
JPH11126093A (ja) * | 1997-10-24 | 1999-05-11 | Hitachi Eng & Service Co Ltd | 音声入力調整方法および音声入力システム |
JPH11212595A (ja) * | 1998-01-23 | 1999-08-06 | Olympus Optical Co Ltd | 音声処理装置、音声認識プログラムを記録した記録媒体、処理プログラムを記録した記録媒体 |
JP2004309959A (ja) * | 2003-04-10 | 2004-11-04 | Matsushita Electric Ind Co Ltd | 音声認識装置および音声認識方法 |
JP2005257805A (ja) * | 2004-03-09 | 2005-09-22 | Nippon Telegr & Teleph Corp <Ntt> | 周期性ノイズ抑圧方法、周期性ノイズ抑圧装置、周期性ノイズ抑圧プログラム |
JP2005284191A (ja) * | 2004-03-30 | 2005-10-13 | Advanced Telecommunication Research Institute International | 音声波形データ表示装置及びそのためのコンピュータプログラム |
JP2007057692A (ja) * | 2005-08-23 | 2007-03-08 | Advanced Telecommunication Research Institute International | 音声処理装置、およびプログラム |
-
2007
- 2007-04-06 JP JP2007100647A patent/JP2008257042A/ja active Pending
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH05158493A (ja) * | 1991-12-10 | 1993-06-25 | Fujitsu Ltd | 音声認識装置 |
JPH0974596A (ja) * | 1995-09-06 | 1997-03-18 | Canon Inc | 風雑音簡易モニタ装置 |
JPH11119696A (ja) * | 1997-10-09 | 1999-04-30 | Sony Corp | ドットマトリクス表示装置によるレベル表示方法 |
JPH11126093A (ja) * | 1997-10-24 | 1999-05-11 | Hitachi Eng & Service Co Ltd | 音声入力調整方法および音声入力システム |
JPH11212595A (ja) * | 1998-01-23 | 1999-08-06 | Olympus Optical Co Ltd | 音声処理装置、音声認識プログラムを記録した記録媒体、処理プログラムを記録した記録媒体 |
JP2004309959A (ja) * | 2003-04-10 | 2004-11-04 | Matsushita Electric Ind Co Ltd | 音声認識装置および音声認識方法 |
JP2005257805A (ja) * | 2004-03-09 | 2005-09-22 | Nippon Telegr & Teleph Corp <Ntt> | 周期性ノイズ抑圧方法、周期性ノイズ抑圧装置、周期性ノイズ抑圧プログラム |
JP2005284191A (ja) * | 2004-03-30 | 2005-10-13 | Advanced Telecommunication Research Institute International | 音声波形データ表示装置及びそのためのコンピュータプログラム |
JP2007057692A (ja) * | 2005-08-23 | 2007-03-08 | Advanced Telecommunication Research Institute International | 音声処理装置、およびプログラム |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010286586A (ja) * | 2009-06-10 | 2010-12-24 | Nippon Telegr & Teleph Corp <Ntt> | 音声認識装置及び音響モデル作成装置とそれらの方法と、プログラムと記録媒体 |
CN102314883A (zh) * | 2010-06-30 | 2012-01-11 | 比亚迪股份有限公司 | 一种判断音乐噪声的方法以及语音消噪方法 |
CN102314883B (zh) * | 2010-06-30 | 2013-08-21 | 比亚迪股份有限公司 | 一种判断音乐噪声的方法以及语音消噪方法 |
JP2013058820A (ja) * | 2011-09-07 | 2013-03-28 | Ehime Univ | 声量表示端末及び声量表示プログラム |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10504539B2 (en) | Voice activity detection systems and methods | |
Reddy et al. | An individualized super-Gaussian single microphone speech enhancement for hearing aid users with smartphone as an assistive device | |
CN111149370B (zh) | 会议系统中的啸叫检测 | |
Uemura et al. | Automatic optimization scheme of spectral subtraction based on musical noise assessment via higher-order statistics | |
US20090018826A1 (en) | Methods, Systems and Devices for Speech Transduction | |
Marzinzik | Noise reduction schemes for digital hearing aids and their use for the hearing impaired | |
EP3826012B1 (en) | Method and device for evaluating performance of speech enhancement algorithm, electronic device and computer-readable storage medium | |
Ma et al. | Speech enhancement using a masking threshold constrained Kalman filter and its heuristic implementations | |
JP6371516B2 (ja) | 音響信号処理装置および方法 | |
JP2011033717A (ja) | 雑音抑圧装置 | |
CN112053702B (zh) | 一种语音处理的方法、装置及电子设备 | |
CA2701439C (en) | Measuring double talk performance | |
Rao et al. | Smartphone-based real-time speech enhancement for improving hearing aids speech perception | |
Chao et al. | Perceptual contrast stretching on target feature for speech enhancement | |
JP6268916B2 (ja) | 異常会話検出装置、異常会話検出方法及び異常会話検出用コンピュータプログラム | |
EP2151820B1 (en) | Method for bias compensation for cepstro-temporal smoothing of spectral filter gains | |
JP2008257042A (ja) | 音声信号レベル表示装置およびその方法 | |
Bhat et al. | Formant frequency-based speech enhancement technique to improve intelligibility for hearing aid users with smartphone as an assistive device | |
Bhat et al. | Smartphone based real-time super gaussian single microphone speech enhancement to improve intelligibility for hearing aid users using formant information | |
JP7383122B2 (ja) | 信号認識または修正のために音声データから抽出した特徴を正規化するための方法および装置 | |
US20090276220A1 (en) | Measuring double talk performance | |
JP4527654B2 (ja) | 音声通信装置 | |
CN112133320A (zh) | 语音处理装置及语音处理方法 | |
Shankar et al. | Smartphone-based single-channel speech enhancement application for hearing aids | |
Vaziri et al. | Evaluating noise suppression methods for recovering the Lombard speech from vocal output in an external noise field |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20090729 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20110418 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110426 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110624 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20110810 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120214 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20120619 |