JP2008197200A - 了解度自動調整装置及び了解度自動調整方法 - Google Patents
了解度自動調整装置及び了解度自動調整方法 Download PDFInfo
- Publication number
- JP2008197200A JP2008197200A JP2007030073A JP2007030073A JP2008197200A JP 2008197200 A JP2008197200 A JP 2008197200A JP 2007030073 A JP2007030073 A JP 2007030073A JP 2007030073 A JP2007030073 A JP 2007030073A JP 2008197200 A JP2008197200 A JP 2008197200A
- Authority
- JP
- Japan
- Prior art keywords
- intelligibility
- voice
- amplitude level
- level
- noise
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M1/00—Substation equipment, e.g. for use by subscribers
- H04M1/60—Substation equipment, e.g. for use by subscribers including speech amplifiers
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L21/0232—Processing in the frequency domain
Abstract
【課題】聴取者が高又は低環境騒音の状況下に置かれた時に音声の了解度を自動的に増加させる。
【解決手段】本発明に係る了解度自動調整装置1は、受信音声の振幅レベルを検出する受信側音声動作検出手段4と、送信騒音の振幅レベルを計算する送信側音声動作手段5と、受信側音声動作手段4が検出した受信音声の振幅レベルと、送信側音声動作手段5が計算した送信騒音の振幅レベルとに基づき、利得を調整する音声改善手段3とを備えていることを特徴とする。
【選択図】図1
【解決手段】本発明に係る了解度自動調整装置1は、受信音声の振幅レベルを検出する受信側音声動作検出手段4と、送信騒音の振幅レベルを計算する送信側音声動作手段5と、受信側音声動作手段4が検出した受信音声の振幅レベルと、送信側音声動作手段5が計算した送信騒音の振幅レベルとに基づき、利得を調整する音声改善手段3とを備えていることを特徴とする。
【選択図】図1
Description
本発明は、了解度のキューを改善するための了解度自動調整装置及び了解度自動調整方法に関する。
人間の音声は有声音と無声音から成り、英語では、母音及び子音の幾つかは有声音に分類される。音声域は音声域の音響学の共振周波数を導入することによりこの励振を変更する。これらの共振周波数はホルマントとして公知である。他方、子音(摩擦音、破裂音等のような音)は無声音のカテゴリーに分類される。無声音は、空気流が可聴乱流を引き起こす音声コードの圧縮により強制される時に生成される。この圧縮は音声コード(声門)の開口部と口との間の幾つかの場所で発生することがある。これにより、無声音は音声域のせばめにより特徴付けられ、励振信号の基本周波数や高調波構造のいずれも有していない。
母音のホルマント構造は聴取者に了解度のキューを送る重要な役割をすることで知られている。「フィルタリング及びクリッピングによる高騒音レベルの了解度の改善(Enhancement of Speech Intelligibility at High
Noise Levels by Filtering and Clipping, Thomas,Ian B.;Niederjohn, Russell J.,
JAES Volume 16 Number 4 pp.412-415; Octover 1968)」という論文では、実験結果は音声の了解度と第2のホルマント周波数との間に強い相関関係があることを示している。子音は了解度のキューを送信する場合に母音と比べて重要な寄与をすると考えられている。これらの観察に基づき、「急な振幅の圧縮により生じる高域フィルターによる高騒音における了解度の改善(The enhancement of speech intelligibility in
high noise levels by high-pass filtering followed by rapid amplitude
compression, Niederjohn,R., and Grotelueschen,J.,IEEE Transactions on
Acoustice, Speech, and Signal Processing, vol.24, Issue 4, pp.277-282,
August,1976)」という論文では、高騒音レベルにおいて音声信号の了解度を改善するため高域フィルターにより生じる急な振幅の圧縮が提案されている。
Noise Levels by Filtering and Clipping, Thomas,Ian B.;Niederjohn, Russell J.,
JAES Volume 16 Number 4 pp.412-415; Octover 1968)」という論文では、実験結果は音声の了解度と第2のホルマント周波数との間に強い相関関係があることを示している。子音は了解度のキューを送信する場合に母音と比べて重要な寄与をすると考えられている。これらの観察に基づき、「急な振幅の圧縮により生じる高域フィルターによる高騒音における了解度の改善(The enhancement of speech intelligibility in
high noise levels by high-pass filtering followed by rapid amplitude
compression, Niederjohn,R., and Grotelueschen,J.,IEEE Transactions on
Acoustice, Speech, and Signal Processing, vol.24, Issue 4, pp.277-282,
August,1976)」という論文では、高騒音レベルにおいて音声信号の了解度を改善するため高域フィルターにより生じる急な振幅の圧縮が提案されている。
米国特許第4,454,609号では、子音に関連したスペクトラル構成要素がそれらを重量で増加させることにより改善される音声改善装置が開示されている(特許文献1参照)。
米国特許第5,479,560では、ホルマント周波数が音声信号のコントラスト改善のパワースペクトラムから検出される装置が開示されている。音声ホルマント周波数は一つの利得により増加され、残りの周波数は一つより少ない値により増加され、音声信号の了解度を改善している。また、この米国特許第5,479,560に開示された装置では、入力音声信号は音声ホルトマントを同一にするスペクトラムアナライザーを使用して分析されている。音声ホルトマントは制御された量により個々に増幅され、増幅量は異なる重み付け値により重み付けされる。増幅され重み付けされたホルトマントは入力音声振動と共に結合され、改善された了解度の音声信号を生成する。さらに、米国特許第5,479,560では、入力音声信号の上昇部分が了解度を増加させるために改善される了解度改善装置が開示されている(特許文献2参照)。
米国特許第6,993,480では、音声スペクトラムは人間の聴取システムの伝達関数の逆関数を近似する伝達関数により増加される(特許文献3参照)。
(例えば、特許文献1参照)。
米国特許第4,454,609号
米国特許第5,479,560号
米国特許第6,993,480号
(例えば、特許文献1参照)。
しかしながら、上記した従来の技術では、無線通信環境は、可聴レベルで了解度を明瞭に送受することを困難にさせる相当な環境騒音又は暗騒音を有している結果、電話で会話する人は、その騒音に負けずに聞き取るために、会話のプライバシーを妥協して、会話を繰り返したり、叫んだり、大声を出したりしなければならないことがよくある。騒々しい環境下において人は、他方で話している人の話をより良く聞くために電話の音量を増加することもある。さらに、電話中、応答時に音量レベルを手動で調整することは的外れな会話を伝えることもある。さらにまた、暗騒音に応じて手動で音量を増加させることは、後に暗騒音が静まった時に甲高い大声の受信をさけるために手動で減少させなければならない。
本発明は、上記した課題を解決すべくなされたものであり、低環境騒音の状況下での了解度を改善するため、了解度に関連した知覚特性を利得の増加なしで高めることできる一方、高環境騒音の状況下での了解度を改善するため、了解度に関連した知覚特性を高めることができるのと同様に、利得が音響心理学モデルに基づいて自動的に調整され、聴取者が高又は低環境騒音の状況下に置かれた時に音声の了解度を自動的に増加させることのできる了解度自動調整装置及び了解度自動調整方法を提供することを目的とするものである。
上記した目的を達成するため、本発明に係る了解度自動調整装置は、受信音声の振幅レベルを検出する受信側音声動作検出手段と、送信騒音の振幅レベルを計算する送信側音声動作手段と、前記受信側音声動作手段が検出した受信音声の振幅レベルと、前記送信側音声動作手段が計算した送信騒音の振幅レベルとに基づき、利得を調整する音声改善手段とを備えていることを特徴とする。
そして、前記音声改善手段は、出力音声包絡線の振幅レベルが入力音声包絡線の出力レベルと略等しくなるように遮断周波数を調整するフィルターを備えているのが好ましい。
また、本発明に係る了解度自動調整方法は、受信音声の振幅レベルを検出する受信音声検出ステップと、送信騒音の振幅レベルを計算する送信騒音計算ステップと、前記検出した受信音声の振幅レベルと、前記計算した送信騒音の振幅レベルとに基づき、利得を調整する利得調整ステップとを備えていることを特徴とする。
そして、前記利得調整ステップは、出力音声包絡線の振幅レベルが入力音声包絡線の出力レベルと略等しくなるように遮断周波数を調整することを含んでいるのが好ましい。
本発明によれば、音声信号の明瞭度が十分に保持され、計算や記憶の複雑さを軽減し、携帯電話等のプラットフォームの使用に適応させることができる。
以下、図面を参照しつつ、本発明の実施の形態について説明する。
図1は、本発明の実施の形態に係る了解度自動調整装置の全体構成を示すブロック図であり、本実施の形態において、了解度自動調整装置1は携帯電話7の双方向の通信システムに組み込まれている。そして、この了解度自動調整装置1は、自動レベル制御部2と、音声改善部3と、2つの音声動作検出器4,5と、騒音推定器6とを備えている。
自動レベル制御部2は、米国特許第6,298,247号の「自動的に音量を制御するための方法及び装置」と同様の機能を備えている一方、音声改善部3は、本発明の特徴部分であり、詳細については後述する。
2つの音声動作検出器4,5(VAD)は、一方の音声動作検出器4が受信機(Rx)として使用され、他方の音声動作検出器5が送信機(Tx)として使用される。携帯電話7で通話中、受信器側音声動作検出器4は音声の動作を決定し、自動レベル制御部2と共に音声改善部3はマイクロホン8(図2参照)からの推定騒音レベルに基づいて動作する。また、自動レベル制御部3は、利得がいつどの程度増加されるかを決定するために使用される。この動作基準は受信器側音声動作検出器4のエネルギーレベルと送信機側音声動作検出器5の騒音エネルギーの間の差の量に基づいている。さらに、騒音推定器6は、騒音量(平均エネルギーレベル)を計算し、比較のため一定数に変換する。
図2は、本発明の実施の形態に係る了解度自動調整装置の実施例を示すブロック図であり、マイクロホン8やスピーカ9等の組み込まれたハードウェア構成部品10を利用し、この実施のために追加のハードウェアの構成部品は要求されない。音声改善部3及び基地局はTx/RxPCMインターフェース11,12を使用してお互いに通信する。本発明の実施の形態におけるアルゴリズムは、例えば、ARM9−EJS等のマイクロプロセッサ13により実行されるが、プロセッサはこれに限定されるものではない。
CodecRx部14は、アンテナ15からの音声信号受信部であり、CodecTx部16は、マイクロホン8に対する音声信号送信部である。また、Tx/Rx音声DSP17,18は、いずれも音声デジタル信号処理部で、PCMバッファ19は、本発明と特定の携帯電話7との間のデータ伝達手段である。
図3は、本発明の実施の形態に係る了解度自動調整装置1の音声改善部3を示すブロック図であり、この音声改善部3は自動レベル制御部2(図1参照)と共に動作する。しかしながら、環境騒音が自動レベル制御部2を動作させるのに十分でない時には、音声改善部3は個別に作動される。これはRx音声信号が利得の調整なしに改善を得ることができることを意味する。これは本発明の特徴の一つであり、これについてのさらなる説明は以下において行う。
受信音声信号は音声改善部3により改善され、改善された音声信号は1つ以上のスピーカ9(図2参照)を使用して再生される。一方、送信側では、送信音声信号の了解度が増加される。可聴音声信号はマイクロホン8(図2参照)により電気信号に変換される。アナログ又はデジタル形式の音声信号は適切な処理され、送信前に了解度のキューを強めさせる。
受信音声信号はデジタル高域シェルビングフィルターにより処理され、その遮断周波数は出力音声包絡線の振幅レベルが入力音声包絡線の振幅レベルとほぼ等しくなるように調整される。入力音声包絡線の振幅レベルが出力音声信号包絡線の振幅レベルより大きい時には、シェルビングフィルターの遮断周波数は一様性を保持するため、より低い値の方に移動する。また、入力音声包絡線の振幅レベルが出力音声包絡線の振幅レベルより小さい時には、シェルビングフィルターの遮断周波数はより高い値の方に移動する。
音声改善部3は図3に示されているようにシェルビングフィルターにより設計され、以下のように、全通過フィルター20を使用して離散領域で実行される。
H(z)=Lπ(1+A(z))/2+L0(1−A(z))/2 (1)
ここで、L0はゼロ周波数での利得であり、Lπは高周波数での利得であり、全通過フィルターA(z)は
A(z)=a+z−1/1−az−1 (2)
シェルビングフィルターは全通過フィルター20のパラメータaを変化させることにより調整される。シェルビングフィルターの遮断周波数が異なるため、aの値は事前に計算される。これらの値は予めルックアップ表に格納されているのが好ましい。
H(z)=Lπ(1+A(z))/2+L0(1−A(z))/2 (1)
ここで、L0はゼロ周波数での利得であり、Lπは高周波数での利得であり、全通過フィルターA(z)は
A(z)=a+z−1/1−az−1 (2)
シェルビングフィルターは全通過フィルター20のパラメータaを変化させることにより調整される。シェルビングフィルターの遮断周波数が異なるため、aの値は事前に計算される。これらの値は予めルックアップ表に格納されているのが好ましい。
レベル比較測定器22は、入力音声包絡線の振幅レベルを推定するために使用される。この時、レベル比較測定器22は、一種のレベル等化を行い、例えば、入力信号と出力信号を等しくし、音量を変更することなく、最大の了解度を増加させる。なお、入力音声包絡線の振幅レベルを推定するため、二乗平均レベル推定等の他の推定アルゴリズム、低域フィルター21が後に設置される整流器等も使用可能である。入力音声は調整可能な高域シェルビングフィルターを使用してフィルタリングされ、改善された出力音声を作り出す。また、最適係数推定器23は、了解度のための重要な役割をし、例えば、どの程度の子音の利得が信号に適用されるべきかを決定する。
このように、上記した本発明の形態によれば、第1のステップで、入力音声の振幅レベルが受信側音声動作検出器4により検出され、入力音声包絡線が騒音推定器4により推定され、第2のステップで、送信側音声動作検出器5により騒音信号の振幅レベルが計算され、第3のステップで、騒音量が推定され、自動レベル制御部2により音響心理学モデルと比較され、自動聴取レベルの調整のために要求される利得が決定される。そして、これにより、計算及び記憶装置を単純化し、了解度改善システムの実施のために高価な装置を装備できない携帯電話においても実施可能となる。また、自動レベル調整により、或いはそれなしで、音声改善部を動作させることができ、音声改善部3がレベル調整なしで適用された場合、聴取者はエネルギーレベルの変化なしで改善された了解度を得ることができる。さらに、激しい騒音の環境においては、聴取者は適切な利得調整で改善された了解度を得ることができる。
このように、本発明は、特に、聴取者が高環境騒音の状況下に置かれている時に音声を再生する場合の了解度の低下を最小限にすることを目的としたものであるが、本発明の使用は、高環境騒音に限定されるものではなく、低環境騒音の場合にも可能であり、知覚音声特性は利得の増加なしで高められる。そのため、ここで説明される発明は、いかなる騒音環境の状況においても了解度を高めるのに十分な性能を有しており、それによって、より所望な解決策となり得る。また、本発明は、携帯電話に限らず、拡声装置等においても実施可能であることは言う迄もない。
1 了解度自動調整装置
3 音声改善部
4 受信側音声動作検出器
5 送信側音声動作検出器
3 音声改善部
4 受信側音声動作検出器
5 送信側音声動作検出器
Claims (4)
- 受信音声の振幅レベルを検出する受信側音声動作検出手段と、
送信騒音の振幅レベルを計算する送信側音声動作手段と、
前記受信側音声動作手段が検出した受信音声の振幅レベルと、前記送信側音声動作手段が計算した送信騒音の振幅レベルとに基づき、利得を調整する音声改善手段と、
を備えていることを特徴とする了解度自動調整装置。 - 前記音声改善手段は、出力音声包絡線の振幅レベルが入力音声包絡線の出力レベルと略等しくなるように遮断周波数を調整するフィルターを備えている請求項1に記載の了解度自動調整装置。
- 受信音声の振幅レベルを検出する受信音声検出ステップと、
送信騒音の振幅レベルを計算する送信騒音計算ステップと、
前記検出した受信音声の振幅レベルと、前記計算した送信騒音の振幅レベルとに基づき、利得を調整する利得調整ステップと、
を備えていることを特徴とする了解度自動調整方法。 - 前記利得調整ステップは、出力音声包絡線の振幅レベルが入力音声包絡線の出力レベルと略等しくなるように遮断周波数を調整することを含んでいる請求項3に記載の了解度自動調整方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007030073A JP2008197200A (ja) | 2007-02-09 | 2007-02-09 | 了解度自動調整装置及び了解度自動調整方法 |
US11/733,141 US20080228473A1 (en) | 2007-02-09 | 2007-04-09 | Method and apparatus for adjusting hearing intelligibility in mobile phones |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007030073A JP2008197200A (ja) | 2007-02-09 | 2007-02-09 | 了解度自動調整装置及び了解度自動調整方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2008197200A true JP2008197200A (ja) | 2008-08-28 |
Family
ID=39756230
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007030073A Pending JP2008197200A (ja) | 2007-02-09 | 2007-02-09 | 了解度自動調整装置及び了解度自動調整方法 |
Country Status (2)
Country | Link |
---|---|
US (1) | US20080228473A1 (ja) |
JP (1) | JP2008197200A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103714825A (zh) * | 2014-01-16 | 2014-04-09 | 中国科学院声学研究所 | 基于听觉感知模型的多通道语音增强方法 |
Families Citing this family (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102017402B (zh) | 2007-12-21 | 2015-01-07 | Dts有限责任公司 | 用于调节音频信号的感知响度的系统 |
JP5326533B2 (ja) * | 2008-12-09 | 2013-10-30 | 富士通株式会社 | 音声加工装置及び音声加工方法 |
EP2247082B1 (en) * | 2009-04-30 | 2013-11-20 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Telecommunication device, telecommunication system and method for telecommunicating voice signals |
KR101068227B1 (ko) * | 2009-06-23 | 2011-09-28 | 주식회사 더바인코퍼레이션 | 명료도 향상장치와 이를 이용한 음성출력장치 |
US8538042B2 (en) | 2009-08-11 | 2013-09-17 | Dts Llc | System for increasing perceived loudness of speakers |
US8204742B2 (en) | 2009-09-14 | 2012-06-19 | Srs Labs, Inc. | System for processing an audio signal to enhance speech intelligibility |
KR20120034863A (ko) * | 2010-10-04 | 2012-04-13 | 삼성전자주식회사 | 이동통신 단말기에서 오디오 신호 처리 방법 및 장치 |
PL2737479T3 (pl) | 2011-07-29 | 2017-07-31 | Dts Llc | Adaptacyjna poprawa zrozumiałości głosu |
US9312829B2 (en) | 2012-04-12 | 2016-04-12 | Dts Llc | System for adjusting loudness of audio signals in real time |
CN107479852B (zh) * | 2017-08-18 | 2019-08-30 | Oppo广东移动通信有限公司 | 音量调节方法、装置、终端设备及存储介质 |
US11164592B1 (en) * | 2019-05-09 | 2021-11-02 | Amazon Technologies, Inc. | Responsive automatic gain control |
US11140264B1 (en) * | 2020-03-10 | 2021-10-05 | Sorenson Ip Holdings, Llc | Hearing accommodation |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5526419A (en) * | 1993-12-29 | 1996-06-11 | At&T Corp. | Background noise compensation in a telephone set |
US6868162B1 (en) * | 2000-11-17 | 2005-03-15 | Mackie Designs Inc. | Method and apparatus for automatic volume control in an audio system |
-
2007
- 2007-02-09 JP JP2007030073A patent/JP2008197200A/ja active Pending
- 2007-04-09 US US11/733,141 patent/US20080228473A1/en not_active Abandoned
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103714825A (zh) * | 2014-01-16 | 2014-04-09 | 中国科学院声学研究所 | 基于听觉感知模型的多通道语音增强方法 |
Also Published As
Publication number | Publication date |
---|---|
US20080228473A1 (en) | 2008-09-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2008197200A (ja) | 了解度自動調整装置及び了解度自動調整方法 | |
US8675884B2 (en) | Method and a system for processing signals | |
TW586303B (en) | Enhancing the intelligibility of received speech in a noisy environment | |
US8315400B2 (en) | Method and device for acoustic management control of multiple microphones | |
US9711162B2 (en) | Method and apparatus for environmental noise compensation by determining a presence or an absence of an audio event | |
US9099972B2 (en) | Method and apparatus for multi-stage adaptive volume control | |
KR101068227B1 (ko) | 명료도 향상장치와 이를 이용한 음성출력장치 | |
EP1667416A2 (en) | Reverberation estimation and suppression system | |
JP5151762B2 (ja) | 音声強調装置、携帯端末、音声強調方法および音声強調プログラム | |
US20140364171A1 (en) | Method and system for improving voice communication experience in mobile communication devices | |
WO2009136953A1 (en) | Method and device for acoustic management control of multiple microphones | |
JP2007522706A (ja) | オーディオ信号処理システム | |
JP4018571B2 (ja) | 音声強調装置 | |
CN110447069A (zh) | 自适应噪声环境的语音信号处理的方法和装置 | |
EP3777114B1 (en) | Dynamically adjustable sidetone generation | |
WO2011001010A1 (en) | Apparatus, method and computer program for controlling an acoustic signal | |
CN108133712A (zh) | 一种处理音频数据的方法和装置 | |
US8954322B2 (en) | Acoustic shock protection device and method thereof | |
JP2008522511A (ja) | 適応可能な音声処理パラメータ用の方法及び装置 | |
JPH08214391A (ja) | 骨導気導複合型イヤーマイクロホン装置 | |
JP2012095047A (ja) | 音声処理装置 | |
JP5298769B2 (ja) | 雑音推定装置、通話装置および雑音推定方法 | |
WO2020203258A1 (ja) | エコー抑圧装置、エコー抑圧方法及びエコー抑圧プログラム | |
EP4362015A1 (en) | Near-end speech intelligibility enhancement with minimal artifacts | |
US20240144947A1 (en) | Near-end speech intelligibility enhancement with minimal artifacts |