JP2008197200A

JP2008197200A - 了解度自動調整装置及び了解度自動調整方法

Info

Publication number: JP2008197200A
Application number: JP2007030073A
Authority: JP
Inventors: Yukie Kinoshita; 幸恵木下
Original assignee: ARI ASSOCIATES KK
Current assignee: ARI ASSOCIATES KK
Priority date: 2007-02-09
Filing date: 2007-02-09
Publication date: 2008-08-28
Also published as: US20080228473A1

Abstract

【課題】聴取者が高又は低環境騒音の状況下に置かれた時に音声の了解度を自動的に増加させる。
【解決手段】本発明に係る了解度自動調整装置１は、受信音声の振幅レベルを検出する受信側音声動作検出手段４と、送信騒音の振幅レベルを計算する送信側音声動作手段５と、受信側音声動作手段４が検出した受信音声の振幅レベルと、送信側音声動作手段５が計算した送信騒音の振幅レベルとに基づき、利得を調整する音声改善手段３とを備えていることを特徴とする。
【選択図】図１

Description

本発明は、了解度のキューを改善するための了解度自動調整装置及び了解度自動調整方法に関する。

人間の音声は有声音と無声音から成り、英語では、母音及び子音の幾つかは有声音に分類される。音声域は音声域の音響学の共振周波数を導入することによりこの励振を変更する。これらの共振周波数はホルマントとして公知である。他方、子音（摩擦音、破裂音等のような音）は無声音のカテゴリーに分類される。無声音は、空気流が可聴乱流を引き起こす音声コードの圧縮により強制される時に生成される。この圧縮は音声コード（声門）の開口部と口との間の幾つかの場所で発生することがある。これにより、無声音は音声域のせばめにより特徴付けられ、励振信号の基本周波数や高調波構造のいずれも有していない。

母音のホルマント構造は聴取者に了解度のキューを送る重要な役割をすることで知られている。「フィルタリング及びクリッピングによる高騒音レベルの了解度の改善（Enhancement of Speech Intelligibility at High
Noise Levels by Filtering and Clipping, Thomas,Ian B.;Niederjohn, Russell J.,
JAES Volume 16 Number 4 pp.412-415; Octover 1968）」という論文では、実験結果は音声の了解度と第2のホルマント周波数との間に強い相関関係があることを示している。子音は了解度のキューを送信する場合に母音と比べて重要な寄与をすると考えられている。これらの観察に基づき、「急な振幅の圧縮により生じる高域フィルターによる高騒音における了解度の改善（The enhancement of speech intelligibility in
high noise levels by high-pass filtering followed by rapid amplitude
compression, Niederjohn,R., and Grotelueschen,J.,IEEE Transactions on
Acoustice, Speech, and Signal Processing, vol.24, Issue 4, pp.277-282,
August,1976）」という論文では、高騒音レベルにおいて音声信号の了解度を改善するため高域フィルターにより生じる急な振幅の圧縮が提案されている。

米国特許第４，４５４，６０９号では、子音に関連したスペクトラル構成要素がそれらを重量で増加させることにより改善される音声改善装置が開示されている（特許文献１参照）。

米国特許第５，４７９，５６０では、ホルマント周波数が音声信号のコントラスト改善のパワースペクトラムから検出される装置が開示されている。音声ホルマント周波数は一つの利得により増加され、残りの周波数は一つより少ない値により増加され、音声信号の了解度を改善している。また、この米国特許第５，４７９，５６０に開示された装置では、入力音声信号は音声ホルトマントを同一にするスペクトラムアナライザーを使用して分析されている。音声ホルトマントは制御された量により個々に増幅され、増幅量は異なる重み付け値により重み付けされる。増幅され重み付けされたホルトマントは入力音声振動と共に結合され、改善された了解度の音声信号を生成する。さらに、米国特許第５，４７９，５６０では、入力音声信号の上昇部分が了解度を増加させるために改善される了解度改善装置が開示されている（特許文献２参照）。

米国特許第６，９９３，４８０では、音声スペクトラムは人間の聴取システムの伝達関数の逆関数を近似する伝達関数により増加される（特許文献３参照）。
（例えば、特許文献１参照）。
米国特許第４，４５４，６０９号米国特許第５，４７９，５６０号米国特許第６，９９３，４８０号

しかしながら、上記した従来の技術では、無線通信環境は、可聴レベルで了解度を明瞭に送受することを困難にさせる相当な環境騒音又は暗騒音を有している結果、電話で会話する人は、その騒音に負けずに聞き取るために、会話のプライバシーを妥協して、会話を繰り返したり、叫んだり、大声を出したりしなければならないことがよくある。騒々しい環境下において人は、他方で話している人の話をより良く聞くために電話の音量を増加することもある。さらに、電話中、応答時に音量レベルを手動で調整することは的外れな会話を伝えることもある。さらにまた、暗騒音に応じて手動で音量を増加させることは、後に暗騒音が静まった時に甲高い大声の受信をさけるために手動で減少させなければならない。

本発明は、上記した課題を解決すべくなされたものであり、低環境騒音の状況下での了解度を改善するため、了解度に関連した知覚特性を利得の増加なしで高めることできる一方、高環境騒音の状況下での了解度を改善するため、了解度に関連した知覚特性を高めることができるのと同様に、利得が音響心理学モデルに基づいて自動的に調整され、聴取者が高又は低環境騒音の状況下に置かれた時に音声の了解度を自動的に増加させることのできる了解度自動調整装置及び了解度自動調整方法を提供することを目的とするものである。

上記した目的を達成するため、本発明に係る了解度自動調整装置は、受信音声の振幅レベルを検出する受信側音声動作検出手段と、送信騒音の振幅レベルを計算する送信側音声動作手段と、前記受信側音声動作手段が検出した受信音声の振幅レベルと、前記送信側音声動作手段が計算した送信騒音の振幅レベルとに基づき、利得を調整する音声改善手段とを備えていることを特徴とする。

そして、前記音声改善手段は、出力音声包絡線の振幅レベルが入力音声包絡線の出力レベルと略等しくなるように遮断周波数を調整するフィルターを備えているのが好ましい。

また、本発明に係る了解度自動調整方法は、受信音声の振幅レベルを検出する受信音声検出ステップと、送信騒音の振幅レベルを計算する送信騒音計算ステップと、前記検出した受信音声の振幅レベルと、前記計算した送信騒音の振幅レベルとに基づき、利得を調整する利得調整ステップとを備えていることを特徴とする。

そして、前記利得調整ステップは、出力音声包絡線の振幅レベルが入力音声包絡線の出力レベルと略等しくなるように遮断周波数を調整することを含んでいるのが好ましい。

本発明によれば、音声信号の明瞭度が十分に保持され、計算や記憶の複雑さを軽減し、携帯電話等のプラットフォームの使用に適応させることができる。

以下、図面を参照しつつ、本発明の実施の形態について説明する。

図１は、本発明の実施の形態に係る了解度自動調整装置の全体構成を示すブロック図であり、本実施の形態において、了解度自動調整装置１は携帯電話７の双方向の通信システムに組み込まれている。そして、この了解度自動調整装置１は、自動レベル制御部２と、音声改善部３と、２つの音声動作検出器４，５と、騒音推定器６とを備えている。

自動レベル制御部２は、米国特許第６，２９８，２４７号の「自動的に音量を制御するための方法及び装置」と同様の機能を備えている一方、音声改善部３は、本発明の特徴部分であり、詳細については後述する。

２つの音声動作検出器４，５（ＶＡＤ）は、一方の音声動作検出器４が受信機（Ｒｘ）として使用され、他方の音声動作検出器５が送信機（Ｔｘ）として使用される。携帯電話７で通話中、受信器側音声動作検出器４は音声の動作を決定し、自動レベル制御部２と共に音声改善部３はマイクロホン８（図２参照）からの推定騒音レベルに基づいて動作する。また、自動レベル制御部３は、利得がいつどの程度増加されるかを決定するために使用される。この動作基準は受信器側音声動作検出器４のエネルギーレベルと送信機側音声動作検出器５の騒音エネルギーの間の差の量に基づいている。さらに、騒音推定器６は、騒音量（平均エネルギーレベル）を計算し、比較のため一定数に変換する。

図２は、本発明の実施の形態に係る了解度自動調整装置の実施例を示すブロック図であり、マイクロホン８やスピーカ９等の組み込まれたハードウェア構成部品１０を利用し、この実施のために追加のハードウェアの構成部品は要求されない。音声改善部３及び基地局はＴｘ／ＲｘＰＣＭインターフェース１１，１２を使用してお互いに通信する。本発明の実施の形態におけるアルゴリズムは、例えば、ＡＲＭ９−ＥＪＳ等のマイクロプロセッサ１３により実行されるが、プロセッサはこれに限定されるものではない。

ＣｏｄｅｃＲｘ部１４は、アンテナ１５からの音声信号受信部であり、ＣｏｄｅｃＴｘ部１６は、マイクロホン８に対する音声信号送信部である。また、Ｔｘ／Ｒｘ音声ＤＳＰ１７，１８は、いずれも音声デジタル信号処理部で、ＰＣＭバッファ１９は、本発明と特定の携帯電話７との間のデータ伝達手段である。

図３は、本発明の実施の形態に係る了解度自動調整装置１の音声改善部３を示すブロック図であり、この音声改善部３は自動レベル制御部２（図１参照）と共に動作する。しかしながら、環境騒音が自動レベル制御部２を動作させるのに十分でない時には、音声改善部３は個別に作動される。これはＲｘ音声信号が利得の調整なしに改善を得ることができることを意味する。これは本発明の特徴の一つであり、これについてのさらなる説明は以下において行う。

受信音声信号は音声改善部３により改善され、改善された音声信号は１つ以上のスピーカ９（図２参照）を使用して再生される。一方、送信側では、送信音声信号の了解度が増加される。可聴音声信号はマイクロホン８（図２参照）により電気信号に変換される。アナログ又はデジタル形式の音声信号は適切な処理され、送信前に了解度のキューを強めさせる。

受信音声信号はデジタル高域シェルビングフィルターにより処理され、その遮断周波数は出力音声包絡線の振幅レベルが入力音声包絡線の振幅レベルとほぼ等しくなるように調整される。入力音声包絡線の振幅レベルが出力音声信号包絡線の振幅レベルより大きい時には、シェルビングフィルターの遮断周波数は一様性を保持するため、より低い値の方に移動する。また、入力音声包絡線の振幅レベルが出力音声包絡線の振幅レベルより小さい時には、シェルビングフィルターの遮断周波数はより高い値の方に移動する。

音声改善部３は図３に示されているようにシェルビングフィルターにより設計され、以下のように、全通過フィルター２０を使用して離散領域で実行される。
Ｈ（ｚ）＝Ｌπ（１＋Ａ（ｚ））／２＋Ｌ０（１−Ａ（ｚ））／２（１）
ここで、Ｌ０はゼロ周波数での利得であり、Ｌπは高周波数での利得であり、全通過フィルターＡ（ｚ）は
Ａ（ｚ）＝ａ＋ｚ−１／１−ａｚ−１（２）
シェルビングフィルターは全通過フィルター２０のパラメータａを変化させることにより調整される。シェルビングフィルターの遮断周波数が異なるため、ａの値は事前に計算される。これらの値は予めルックアップ表に格納されているのが好ましい。

レベル比較測定器２２は、入力音声包絡線の振幅レベルを推定するために使用される。この時、レベル比較測定器２２は、一種のレベル等化を行い、例えば、入力信号と出力信号を等しくし、音量を変更することなく、最大の了解度を増加させる。なお、入力音声包絡線の振幅レベルを推定するため、二乗平均レベル推定等の他の推定アルゴリズム、低域フィルター２１が後に設置される整流器等も使用可能である。入力音声は調整可能な高域シェルビングフィルターを使用してフィルタリングされ、改善された出力音声を作り出す。また、最適係数推定器２３は、了解度のための重要な役割をし、例えば、どの程度の子音の利得が信号に適用されるべきかを決定する。

このように、上記した本発明の形態によれば、第１のステップで、入力音声の振幅レベルが受信側音声動作検出器４により検出され、入力音声包絡線が騒音推定器４により推定され、第２のステップで、送信側音声動作検出器５により騒音信号の振幅レベルが計算され、第３のステップで、騒音量が推定され、自動レベル制御部２により音響心理学モデルと比較され、自動聴取レベルの調整のために要求される利得が決定される。そして、これにより、計算及び記憶装置を単純化し、了解度改善システムの実施のために高価な装置を装備できない携帯電話においても実施可能となる。また、自動レベル調整により、或いはそれなしで、音声改善部を動作させることができ、音声改善部３がレベル調整なしで適用された場合、聴取者はエネルギーレベルの変化なしで改善された了解度を得ることができる。さらに、激しい騒音の環境においては、聴取者は適切な利得調整で改善された了解度を得ることができる。

このように、本発明は、特に、聴取者が高環境騒音の状況下に置かれている時に音声を再生する場合の了解度の低下を最小限にすることを目的としたものであるが、本発明の使用は、高環境騒音に限定されるものではなく、低環境騒音の場合にも可能であり、知覚音声特性は利得の増加なしで高められる。そのため、ここで説明される発明は、いかなる騒音環境の状況においても了解度を高めるのに十分な性能を有しており、それによって、より所望な解決策となり得る。また、本発明は、携帯電話に限らず、拡声装置等においても実施可能であることは言う迄もない。

本発明の実施の形態に係る了解度自動調整装置の全体構成を示すブロック図である。本発明の実施の形態に係る了解度自動調整装置の実施例を示すブロック図である。本発明の実施の形態に係る了解度自動調整装置の音声改善部を示すブロック図である。

符号の説明

１了解度自動調整装置
３音声改善部
４受信側音声動作検出器
５送信側音声動作検出器

Claims

受信音声の振幅レベルを検出する受信側音声動作検出手段と、
送信騒音の振幅レベルを計算する送信側音声動作手段と、
前記受信側音声動作手段が検出した受信音声の振幅レベルと、前記送信側音声動作手段が計算した送信騒音の振幅レベルとに基づき、利得を調整する音声改善手段と、
を備えていることを特徴とする了解度自動調整装置。
前記音声改善手段は、出力音声包絡線の振幅レベルが入力音声包絡線の出力レベルと略等しくなるように遮断周波数を調整するフィルターを備えている請求項１に記載の了解度自動調整装置。
受信音声の振幅レベルを検出する受信音声検出ステップと、
送信騒音の振幅レベルを計算する送信騒音計算ステップと、
前記検出した受信音声の振幅レベルと、前記計算した送信騒音の振幅レベルとに基づき、利得を調整する利得調整ステップと、
を備えていることを特徴とする了解度自動調整方法。
前記利得調整ステップは、出力音声包絡線の振幅レベルが入力音声包絡線の出力レベルと略等しくなるように遮断周波数を調整することを含んでいる請求項３に記載の了解度自動調整方法。