JP4430035B2 - 音声調整装置および音声調整方法 - Google Patents

音声調整装置および音声調整方法 Download PDF

Info

Publication number
JP4430035B2
JP4430035B2 JP2006127764A JP2006127764A JP4430035B2 JP 4430035 B2 JP4430035 B2 JP 4430035B2 JP 2006127764 A JP2006127764 A JP 2006127764A JP 2006127764 A JP2006127764 A JP 2006127764A JP 4430035 B2 JP4430035 B2 JP 4430035B2
Authority
JP
Japan
Prior art keywords
signal
average value
level
audio
output
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP2006127764A
Other languages
English (en)
Other versions
JP2006270989A (ja
Inventor
渉 波多野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tamura Corp
Original Assignee
Tamura Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tamura Corp filed Critical Tamura Corp
Priority to JP2006127764A priority Critical patent/JP4430035B2/ja
Publication of JP2006270989A publication Critical patent/JP2006270989A/ja
Application granted granted Critical
Publication of JP4430035B2 publication Critical patent/JP4430035B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Landscapes

  • Control Of Amplification And Gain Control (AREA)

Description

本発明は、例えば、音声信号の信号レベルを一定に保つ音声調整装置、および音声調整方法に関するものである。
たとえば、マイクロフォンから入力された音声信号の信号レベルを一定に保つ音量制御装置が知られている(例えば、特許文献1参照。)。
その制御方法としては様々な方法が考案されているが、上述した音量制御装置では、音声の出力レベルを読み取り、予め記憶している出力レベルとの差に応じた補正値を演算し、演算結果に応じて音声の出力レベルを一定に保持している。
また、音声信号を平均値検波処理を行い、1秒間の平均値信号を生成し、その平均値信号に応じて信号レベルを一定に保つように音声信号を増幅し出力する方法も知られている(平均値検波処理法)
特開平8−33734号公報
ーザ(話者)がしゃべり始めた場合には、たとえば、マイクロフォンで検出した信号は、それまでの無音状態から急激に音声信号の入力レベルが強くなる。
このため、従来の平均値検波処理を行う方法では、それまでの無音状態を含む1秒間の平均値が低い。その低い平均値に基づいて、その低い値を所定のレベルまで増幅するため、大きな増幅度で音声信号を増幅するので、たとえば、図4(b)に例示したように、大きな増幅度で入力された音声信号を過度に増幅してしまい、話しはじめた音声信号の出力レベルが非常に大きくなり耳障りになる。
これを避けるためには、ユーザ(話者)は、しゃべり始めに手動で増幅度を変更するという煩雑な操作を行う必要があった。
本発明は、かかる事情に鑑みてなされたものであり、その目的は、無音状態から急激に音声信号のレベルが高くなる場合に、信号調整のための増幅によって音声信号の出力レベルが過度に大きくならない音声調整装置、および音声調整方法を提供することにある。
本発明によれば、話者の音声を検出して電気信号に変換する音声検出手段と、話者の操作に応じてオンレベルのタイミング信号を発生する、信号発生手段と、前記タイミング信号がオンレベルの期間、前記音声検出手段が検出した音声信号のピークを検出し、当該音声信号のピークが所定レベル以上のとき、そのピークに応じた制御信号を出力する、ピーク検波手段と、時定数が可変であり、前記制御信号に基づく時定数で前記音声検出手段が検出した音声信号の平均値を演算する時定数が変更可能な第1平均値処理手段と、固定の時定数で前記音声検出手段が検出した音声信号の平均値を算出する第2平均値処理手段とを有し、前記第1平均値処理手段で演算した第1平均値信号と前記第2平均値処理手段で演算した第2平均値信号とを比較して大きい値の平均値信号を出力する、平均値処理手段と、事前に複数の話者の音声パターンデータを記憶している記憶手段と、前記記憶手段に記憶されている前記複数の話者の音声パターンデータの1つを選択して前記記憶手段から読みだす選択手段と、前記タイミング信号がオンレベルになってから所定時間の間、前記選択手段から出力された1の音声パターンデータを音声出力処理手段に出力し、前記所定の期間が経過後は、前記平均値処理手段から出力された平均値信号を前記音声出力処理手段に出力する、レベル算出手段と、前記音声検出手段で検出した音声信号を、前記レベル算出手段から出力された信号に基づく増幅度で増幅する、音声出力処理手段と、を有する、音声調整装置が提供される。

また本発明によれば、タイミング信号がオンレベルの期間、音声検出手段が検出した音声信号のピークを検出し、当該音声信号のピークが所定レベル以上のとき、そのピークに応じた制御信号を出力する、ピーク検波工程と、時定数が可変であり、前記制御信号に基づく時定数で前記音声検出手段が検出した音声信号の平均値を演算する時定数が変更可能な第1平均値処理工程と、固定の時定数で前記音声検出手段が検出した音声信号の平均値を算出する第2平均値処理工程とを有し、前記第1平均値処理工程で演算した第1平均値信号と前記第2平均値処理工程で演算した第2平均値信号とを比較して大きい値の平均値信号を出力する、平均値処理工程と、当該平均値処理工程において得られた平均値信号のレベルに応じた信号を算出するレベル算出工程と、事前に記憶手段に記憶されている複数の話者の音声パターンデータ1つを選択して前記記憶手段から読みだす選択工程と、前記タイミング信号がオンレベルになってから所定時間の間、前記選択工程で選択された1の音声パターンデータを出力し、前記所定の期間が経過後は、前記平均値処理工程で得られた平均値信号を出力する、レベル算出工程と、前記音声検出手段で検出した音声信号を、前記レベル算出工程で算出された信号に基づく増幅度で増幅する、音声出力処理工程と、を有する、音声調整方法が提供される。
本発明によれば、無音状態から急激に音声信号のレベルが強くなる場合に、音声調整装置から出力する音声信号の出力レベルが急激に大きくならないようにすることができる。
特に、本発明は複数の話者の音声信号パターンをデータとして事前に記憶しておき、話者に対応した音声信号パターンをデータを用いて平均値を調整する。その結果、話者の話し方に応じて、無音状態から急激に音声信号のレベルが強くなる場合でも、装置から出力される音声信号の出力レベルが急激に大きくならないようにすることができる。
第1実施形態
図1は本発明に係る音声調整装置の第1実施形態の機能ブロック図である。
本実施形態に係る音声調整装置1は、例えば外部入力部としてのマイクロフォン2により入力された音声信号の出力レベルが一定になるように音声信号を増幅して出力する。
マイクロフォン2は、図1に示すように、音声検出手段としての音声入力部21、および、タイミング信号生成手段としてのタイミング指示信号生成部22を有する。
音声入力部21は、例えば、話者からの音波(音声)を検出して電気信号に変換して、音声信号S21として音声調整装置1に出力する。
タイミング指示信号生成部22は、第1の状態または第2の状態を設定し、その設定に応じてタイミング指示信号S22の出力を制御する。
例えば、マイクロフォン2に設けられたタイミング指示信号生成部22は、ユーザ(話者)が話をするときに話者が操作するスイッチを含み、そのスイッチがオン状態またはオフ状態かに応じて第1の状態および第2の状態を設定する。
詳細には、タイミング指示信号生成部22は、マイクロフォン2のスイッチ(図示せず)がオフ状態の場合には第1の状態が設定されローレベルの電圧のタイミング指示信号S22を出力し、スイッチがオン状態の場合には第2の状態が設定されてハイレベルの電圧のタイミング指示信号S22を出力する。
例えば、ローレベルの電圧のタイミング指示信号S22はミュート信号mに相当し、ハイレベルの電圧のタイミング指示信号S22は、後述する信号処理を行うタイミング指示信号tに相当する。
音声調整装置1は、図1に示すように、検波部11、レベル算出部12、および、出力処理部13を有する。
検波部11は、マイクロフォン2からの話者の音声信号S21の検波処理を行い、検波処理の結果S112をレベル算出部12に出力する。
検波部11は詳細には、ピーク検波部111、および平均値検波部112を有する。
ピーク検波部111は本発明に係るピーク検波手段に相当し、平均値検波部112は本発明に係る平均値処理手段に相当し、レベル算出部12は本発明に係るレベル算出手段に、出力処理部13は本発明に係る出力処理手段に相当する。
ピーク検波部111は、タイミング指示信号生成部22から出力されるタイミング指示信号S22が示すハイレベルのタイミング指示信号tに応じて規定される所定の期間、マイクロフォン2の音声入力部21のピークを検出し、検出したピークに応じた制御信号S111を平均値検波部112に出力する。
すなわち、ピーク検波部111は、タイミング指示信号S22がハイレベルの間(タイミング指示信号tの間)、後述する平均値検波部112内の時定数が可変の第1平均値検出部1121における時定数を変化させる制御信号S111を、ピーク検波部111における音声信号S12のピーク検波の結果に応じて生成し出力する。なお、ピーク検波部111から出力する制御信号S111は、平均値検波部112において平均値信号を生成させないことを指示することもある。
ピーク検波部111は、タイミング指示信号生成部22からハイレベルのタイミング指示信号S22が入力されると、ハイレベルのその期間、マイクロフォン2から出力された音声信号S21のピーク検波処理を行いピーク検波信号S1111を生成し(図3(B))、そのピーク検波信号S1111に基づいて制御信号S111を出力する。
図2を参照して後述するように、平均値検波部112内の第1平均値検波部1121は、例えば制御信号S111に応じて時定数を設定し、設定した時定数に応じて音声信号S21の平均値化処理を行う。
また、ピーク検波部111は、マイクロフォン2からの音声信号S21が所定のレベル以下、例えばノイズレベル以下の場合には、平均値検波部112において平均値信号を生成させないことを示す制御信号S111を生成し、平均値検波部112内の切換制御部1124に出力する。
図2は、図1に示した音声調整装置の平均値検波部112の機能ブロックの一具体例を示す図である。
平均値検波部112は、例えば図2に示すように、第1平均値検波部1121、第2平均値検波部1122、切換部1123、および切換制御部1124を有する。
第1平均値検波部1121は本発明に係る第1平均値処理手段に相当し、第2平均値検波部1122は本発明に係る第2平均値処理手段に相当し、切換部1123および切換制御部1124は本発明に係る信号切換制御手段に相当する。
第1平均値検波部1121は、ピーク検波部111から出力された制御信号S111に応じて時定数を設定し、その時定数に基づいて音声入力部21から出力された音声信号S21の平均値信号レベルを検出し、第1の平均値信号S1121として出力する。
詳細には、第1平均値検波部1121は、ピーク検波部111から出力された制御信号S111に応じて、時定数を設定し、その時定数に基づいて音声入力部21から出力された音声信号S21の平均値信号レベルを検出して、第1の平均値信号S1121として出力する。
例えば、ピーク検波部111から時定数を小さく設定させる制御信号S111が出力されると、第1平均値検波部1121は、その制御信号S111に応じて時定数を小さく設定し、その小さな時定数に基づいて、短い期間の音声信号S21の平均値レベルを検出し、第1の平均値信号S1121を生成する。
また、ピーク検波部111から時定数を大きく設定させる制御信号S111が出力されると、第1平均値検波部1121は、その制御信号S111に応じて時定数を大きく設定し、その大きな時定数に基づいて、時定数が小さい時より長い期間にわたる音声信号S21の平均値レベルを検出し、第1の平均値信号S1121を生成する。
第1平均値検波部1121は、時定数が小さいほど、短期間の音声信号S21について平均値を検出する、すなわち、短期間の音声信号S21のレベルの変化に追従するように平均値信号レベルを検出する。つまり、第1平均値検波部1121は、時定数が小さいほど音声信号S21の平均化処理を行う際の処理単位時間が短いので、音声信号S21のレベルの変化に迅速に追従するように平均値信号レベルを検出する。
一方、第1平均値検波部1121は、時定数が大きいほど、音声信号S21の平均化処理を行う処理単位時間が長いので、時定数が小さいときよりは、音声信号S21のレベルの変化に迅速に追従せずに、大まかな平均値信号レベルを検出する。
ピーク検波部111は、このように、第1平均値検波部1121における時定数を設定させる制御信号S111を、音声信号S12のピーク検波の結果に応じて生成して出力する。
また、第1平均値検波部1121は、ピーク検波部111から平均値信号を生成させないことを示す制御信号S111が出力された場合には、平均値信号を生成する処理を行わない。
第2平均値検波部1122は、マイクロフォン2の音声入力部21から出力された音声信号S21に基づいて、例えば、所定の時定数で音声信号S21の平均値信号S1122を生成し、切換部1123に出力する。
切換部1123は、切換制御部1124からの切換制御信号S1124に応じて、第1平均値検波部1121から出力された第1平均値信号S1121または第2平均値検波部1122から出力された第2平均値信号S1122を切換えて、レベル算出部12に出力する。
切換制御部1124は、第1平均値検波部1121から出力された第1平均値信号S1121と第2平均値検波部1122から出力された第2平均値信号S1122に基づいて、切換部1123に第1平均値信号S1121または第2平均値信号S1122を選択的に出力させる切換制御信号S1123を生成して、切換部1123に出力する。
詳細には、切換制御部1124は、第1平均値検波部1121から出力された可変の時定数で演算した第1平均値信号S1121と固定の時定数で演算した第2平均値検波部1122から出力された第2平均値信号S1122を比較し、第2平均値信号S1122の信号レベルが第1平均値信号S1121の信号レベルよりも低い場合には、レベルの高い第1平均値信号S1121を選択させる制御信号S1124を切換部1123に出力する。
他方、切換制御部1124は、第1平均値信号S1121と第2平均値信号S1122を比較し、第2平均値信号S1122の信号レベルが第1平均値信号S1121の信号レベルとほぼ同じか、そのレベル以上になった場合に、レベルの高い第2平均値信号S1122を選択させる制御信号S1124を切換部1123に出力する。
また、切換制御部1124は、ピーク検波部111から出力された制御信号S111が平均値を出力しないことを示す場合は、切換部1123平均値信号の出力を行わないように制御させる。
図3は、図1に示した音声調整装置の動作を説明するための図である。
図3(a)は音声信号S21を示す図であり、図3(b)は図3(a)に示した音声信号S21の絶対値を示す信号S1110を示す図であり、図3(c)はピーク検波部111における図3(b)に示した音声信号S21のピーク検波処理を説明するための図であり、図3(d)はピーク検波処理の結果、生成されたピーク検波信号S1111を示す図である。図3(e)は第2平均値信号S1122を示す図である。図3(f)は、平均値検波部112から出力される平均値信号S112を示す図である。
ピーク検波部111は、例えば図3(a)に示すように、マイクロフォン2の音声入力部21から出力された音声信号S21の絶対値処理を行い、図3(b)に示すような絶対値信号S1110を生成する。
ピーク検波部111は、図3(c)に示すように、絶対値信号S1110の変化に追従して絶対値信号S1110のピーク検波処理を行い、図3(d)に示すようなピーク検波信号S1111を生成する。
さらに、ピーク検波部111はピーク検波信号S1111に応じた制御信号S111を生成する。
ピーク検波部111は、詳細には、図3(d)に示すピーク検波信号S1111に基づいて、平均値検波部112内の時定数が可変の第1平均値検波部1121において検出する音声信号S21の平均値が所定のレベルsl以上になるように、第1平均値検波部1121における検波を行う期間を規定する時定数に設定させる制御信号S111を出力する。
ピーク検波は、図3(c)を参照して上述したように波形の振幅のピーク(最大値)に応じた信号を生成する検波方法である。
平均値検波部112内の第1平均値検波部1121は、ピーク検波部111から出力される制御信号S111に応じて時定数を設定、例えば、小さい時定数を設定し、その時定数に基づいて音声信号S21を平均値検波する。
図3(e)は、平均値検波を説明するための図である。
平均値検波部112内の固定の時定数の第2平均値検波部1122は、音声信号S21の絶対値信号S1110に基づいて、所定の期間の平均値検波処理を行う。
例えば第2平均値検波部1122における平均値検波処理としては、所定の時間、所定の時定数に基づいて絶対値信号S1110の平均値を生成する。
第2平均値検波部1122は、例えば、LPF(Low pass filter )を有し、LPFに絶対値信号S1110を入力させて平均値検波処理を行い、図3(e)に示すように、立上がりが緩やかな平均値信号S1122を生成する。
また、例えば第2平均値検波部1122は、予め設定された、絶対値信号S1110の1秒間の平均値をとるような時定数に基づいて、立上りが緩やかな平均値信号S1122を生成する。
図3(f)は、図1に示した音声調整装置の平均値検波部の動作を説明するための図である。
検波部11内の平均値検波部112は、音声信号S21の立上がりに追従した信号をレベル算出部12に出力するために、詳細には平均値検波部112内の時定数が可変の第1平均値検波部1121は、ピーク検波部111からピーク検波信号S1111(図3(d))の値に応じた制御信号S111が出力された場合には、その制御信号S111に基づいた時定数に基づいて音声信号S21の平均値レベルが所定のレベルsl以上になるような平均値信号S112を生成し、切換部1123を介してレベル算出部12に出力する。
第1平均値検波部1121は、詳細には、例えば図3(d)に示すように、話者の音声信号が存在しない時から、タイミング信号tがオンレベルになってから時間tsまでピーク検波部111から、制御信号S1111が所定のレベルsl以上の場合に、小さい時定数を設定させる制御信号S111が出力されると、その制御信号S111に応じて時定数を小さく設定して、その時定数に基づいて、短い期間、音声信号S12の平均値検波を行い、図3(d)のタイミング信号tがオンレベルになってから時間ts以前の信号について第1平均値信号S1121を生成して、レベル算出部12に出力する。
例えば時刻tsに、切換制御部1124は時定数が変化する第1平均値検波部1121から出力された平均値信号S1121と、時定数が固定の第2平均値検波部1122から出力された平均値信号1122を比較し、略同じレベルになった場合に、切換部1123に第2平均値検波部1122から出力された第2平均値信号S1122に切換えさせる切換制御信号S1124を出力する。図3(e)に示すように、切換部1123は、その切換制御信号S1124に基づいて、第2平均値検波部1122から出力された第2平均値信号S1122に切換えて、平均値信号S112として、レベル算出部12に出力する。
レベル算出部12は、平均値検波部112から出力された平均値信号S112に基づいて、音声信号S21の信号強度を示す強度信号S12を生成して、出力処理部13に出力する。
出力処理部13は、レベル算出部12から出力された強度信号S12に基づいて増幅度を決定し、マイクロフォン2の音声入力部21から入力された音声信号S21の出力レベルが一定になるように、音声信号S21を増幅して、音声信号S13を生成して出力する。
例えば、出力処理部13は、レベル算出部12から出力された平均値信号S112に応じた信号強度S12の信号レベルに基づいて、その平均値信号S112に反比例するような増幅度で、マイクロフォン2の音声入力部21から入力された音声信号S21を増幅して音声信号S13を生成して出力する。
図4は、図1に示した音声調整装置の動作を説明するための図である。
図4(a)は、マイクロフォン2の音声入力部21入力される音声信号のレベル特性を示す図である。
図4(b)は、一般的な音声調整装置から出力される増幅された音声信号の特性を説明するための図である。
図4(a)に示すように、音声信号S21が例えばユーザ(話者)の話し始めの立上り部分で、詳細には音声信号S21の信号レベルがローレベルから急激にハイレベルになった場合に、一般的な音声調整装置では、入力された音声信号S21の平均値信号が、音声信号が存在しない時から所定の長い期間の平均値を生成しているために、平均値が低く、その低い平均値に基づいて増幅度を大きくし、音声信号S21を増幅してしまう。このため、例えば図4(b)に示すように、一般的な音声調整装置では、音声信号S21の話し始めが極度に大きな出力レベルの信号S200が出力される。
本実施形態に係る音声調整装置1では、図3(d)に示すように、話者がマイクロフォン2を用いて話し始めたとき、第1平均値検波部1121における音声信号S21の平均値を検出する期間(時定数)が短いので迅速に音声信号S21の平均値が検出でき、平均値検波部112からその第1平均値信号S1121がレベル算出部12に入力されて第1平均値信号S1121に応じた強度が決定されるので、出力処理部13における増幅度が過度に大きくならないので、話者が話し始めの出力レベルが小さく、徐々に出力レベルが一定になるような音声信号S13を生成し出力する。
図5は、音声調整装置の動作を説明するためのフローチャートである。以上の構成の音声調整装置1の動作を、図5を参照しながら説明する。
ステップST1において、例えば、ユーザはマイクロフォン2で話すために、マイクロフォン2の不図示のスイッチをオン状態にすると、タイミング指示信号生成部22からハイレベルの電圧のタイミング指示信号S22(タイミング指示信号t)が出力される。ユーザがマイクロフォン2に向かって発音すると、音声入力部21では音声信号S21が生成され出力される。
タイミング指示信号生成部22から出力されたハイレベルのタイミング指示信号S22ピーク検波部111に入力されると、ピーク検波部111により、マイクロフォン2の音声入力部21から出力された音声信号S21に基づいて音声信号S21のピーク検波が行われ、ピーク検波の結果に応じた制御信号S111が、平均値検波部112内の第1平均値検出部1121と切換制御部1124に出力される。
ステップST2において、音声信号S21は、平均値検波部112内の時定数が変化する第1平均値検出部1121により、上述したタイミング指示信号S22がハイレベルの期間、例えば、話し始めの1秒間は、少なくともピーク検波部111から出力された制御信号S111に基づいて、音声信号S21の平均値レベルが所定のレベルsl以上になるように平均値信号S112が生成される。
ステップST3において、音声信号S21は、上述した所定の期間の後には、平均値検波部112内の固定の時定数の第2平均値検波部1122により、入力された音声信号S21に基づいて平均値検波処理が行われ、音声信号S21の平均値レベルが検出され平均値信号S112が生成される。
平均値検波部112により生成された平均値信号S112は、レベル算出部12により、音声信号S21の信号強度を示す強度信号S12が生成され出力処理部13に出力される。
ステップST4において、出力処理部13では、レベル算出部12から出力された強度信号S12に基づいて、入力された音声信号S21の出力レベルが一定になるように調整すべく、音声信号S21が増幅されて、音声信号S13が生成され出力される。
以上説明したように、本実施の形態においては、
(a)マイクロフォン2からハイレベルのタイミング指示信号S22(タイミング指示信号t)が入力されると、所定のタイミングで、所定の期間、音声信号S21に応じてピーク検波処理を行い、所定のタイミング指示信号tに応じて規定される所定の期間、音声信号S21の平均値レベルを所定のレベル以上にする制御信号S111を出力するピーク検波部111と、
(b)所定の期間は、制御信号S111に基づいて所定のレベル以上の平均値レベルの平均値信号S112を生成し、所定の期間の後には、音声信号S21に基づいて平均値検波処理を行い平均値レベルを検出し、検出した結果に基づいて平均値信号S112を生成する平均値検波部112と、
(c)平均値信号S112に基づいて音声信号S21の信号強度を示す強度信号S12を生成し出力するレベル算出部12と、
(d)強度信号S12に基づいて音声信号S21を増幅して、増幅によるレベル調整により、一定のレベルを持つ音声信号S13を生成する出力処理部13と
を設けたので、無音状態から急激に音声信号の信号強度(レベル)が強くなる場合であっても、出力信号の信号強度が大きくならずに、略一定の信号強度で出力することができる。
また、ピーク検波部111からの制御信号S111に応じて時定数を設定し、その時定数に基づいて平均値検波を行う第1平均値検波部1121と、所定の時定数で平均値検波を行う第2平均値検波部1122と、それぞれの出力に応じてレベル算出部12への出力を制御する切換部1123および切換制御部1124とを設けたので、音声信号のレベルに追従するように音声信号を増幅することができる。
また、一般的な音声調整装置で時定数を小さく設定した場合では増幅度が不安定になるが、本実施形態において、第1平均値検波部1121では、ピーク検波の結果に応じて時定数を小さく設定し、その時定数で平均値検波を行い、第2平均値検波部1122では、例えば、それよりも大きい所定の時定数で平均値検波を行い、切換部1123および切換制御部1124でそれらの出力を制御しているので増幅度が不安定にならない。
第2実施形態
図6は、本発明に係る音声調整装置の第2実施形態の機能ブロック図である。
本実施形態の音声調整装置1aは、図6に示すように、検波部11、レベル算出部12a、出力処理部13、記憶部14、および入力部15を有する。
図1を参照して述べた第2実施の形態の音声調整装置1aと、図6に図解されている第1実施形態に係る音声調整装置1との大きな相違点は、レベル算出部12aにタイミング指示信号生成部22からのタイミング指示信号S22(タイミング指示信号t)が入力する点と、新たに記憶部14および入力部15が構成要素として加わった点である。
第1実施の形態と同様な機能の構成要素については説明を省略し、以下、第1実施の形態との相違点のみ説明する。
レベル算出部12aは、平均値検波部112から出力された平均値信号S112に基づいて、音声出力部21から出力処理部13に入力される音声信号S21の信号強度を示す強度信号S12を生成して出力処理部13に出力する。
レベル算出部12aは、ユーザの音声ごとに求めた、平均値検波部112から出力される平均値信号S112の信号パターンSPを記憶部14に記憶する。
また、レベル算出部12aは、ユーザの音声ごとに求めて記憶部14に記憶されている信号パターンSPと、平均値検波部112から出力される平均値信号S112と、タイミング指示信号生成部22から出力されるハイレベルのタイミング指示信号S22(タイミング指示信号t)とに基づいて、例えば、図3(d)に示すように、所定の期間、音声信号S21の平均値レベル所定のレベルs1以上になるように、新たに平均値信号を生成して、出力処理部13に出力する。
なお、レベル算出部12aから、事前に、複数のユーザの音声信号S21の信号パターンSP_1〜SP_nを記憶部14に記憶させておく
入力部15は、例えば、ユーザの操作に応じて、信号パターンSP_1〜SP_nの内から所定の信号パターンSPを選択させる選択信号S15を生成する。
レベル算出部12aは、記憶部14に記憶されている複数の信号パターンSP_1〜nの内からこの入力部15から出力された選択信号S15に対応する信号パターンSPを選択し、選択したその信号パターンを新たに平均値信号として出力処理部13に出力する。そのような信号パターンとしては、例えば、図3(d)に示すように、タイミング指示信号生成部22から出力されるタイミング信号S22がハイレベルになった後、所定の期間tsの間、所定のレベルs1以上の信号パターンである。
所定の期間ts以降は、レベル算出部12aは平均値検波部112から出力される平均値信号S112を用いる。
出力処理部13は、レベル算出部12aから出力された新たな平均値信号に基づいて増幅度を決定し、マイクロフォン2から入力された音声信号S21の出力レベルが一定になるように音声信号S21を増幅して、音声信号S13を生成し出力する。
以上説明した構成の音声調整装置1aの動作を簡単に説明する。
例えば、ユーザはマイクロフォン2を用いて話すために、マイクロフォン2の不図示のスイッチをオン状態にすると、タイミング指示信号生成部22から、ハイレベルの電圧の信号S22、具体的には、タイミング指示信号tが出力される。
ユーザがマイクロフォン2に向かって発音すると、音声入力部21で音声信号S21が生成されて出力される。
タイミング指示信号生成部22から出力されたハイレベルのタイミング指示信号S22(タイミング指示信号t)がピーク検波部111に入力されると、ピーク検波部111において、マイクロフォン2の音声入力部21から出力された音声信号S21に基づいて音声信号S21のピーク検波が行われ、ピーク検波部111からピーク検波の結果に応じた制御信号S111が、平均値検波部112内の第1平均検波部1121に出力される。
音声信号S21は、平均値検波部112内の時定数が設定される第1平均検波部1121により、上述した所定の期間、例えば話し始めの1秒間は、少なくともピーク検波部111から出力された制御信号S111に基づいた時定数で、音声信号S21の平均値レベルを所定のレベルs1以上になるように平均値信号S112が生成される。
音声信号S21は、平均値検波部112により、上述した所定の期間の後には、入力された音声信号S21に基づいて、時定数が固定の第2の平均検波部1122において平均値検波処理が行われ、音声信号S21の平均値レベルが検出されて平均値信号S112が生成される。
平均値検波部112により生成された平均値信号S112は、レベル算出部12aにより、音声信号S21の平均値の信号強度を示す強度信号S12が生成されて出力処理部13に出力される。
レベル算出部12aは、平均値検波部112aから出力される平均値信号S112に基づいて、平均値信号S112の信号パターンSPを記憶部14に記憶する。
例えば、レベル算出部12aは、事前に、記憶部14内に、信号パターンSPを複数記憶しておく。
ユーザの操作に応じて、入力部15は、その信号パターンSP_1〜SP_nの内から所定の信号パターンSPを選択させる選択信号S15をレベル算出部12aに出力する。
レベル算出部12aは、選択信号S15に基づいて、記憶部14に記憶されている複数の信号パターンSP_1〜SP_nの内から対応する信号パターンSPを選択する。
レベル算出部12aは、選択したその信号パターンを新たに平均値信号として出力処理部13に出力する。
出力処理部13は、レベル算出部12aから出力された強度信号S12に基づいて、マイクロフォン2から入力された音声信号S21の出力レベルが一定になるように、音声信号S21が増幅されて、音声信号S13が生成されて出力される。
以上説明したように、第2実施の形態においては、複数の信号パターンSP_1〜SP_nを記憶する記憶部14と、信号パターンSP_1〜SP_nを選択させる選択信号S15を生成する入力部15とをさらに設け、選択された信号パターンSP、平均値信号S112、タイミング指示信号tに基づいて、強度信号S12を生成するレベル算出部12aを設けたので、本実施の形態は、ユーザが事前に登録したパターンを用いた安定した信号処理か可能となり、例えば、第1実施の形態に比べてより早く安定したレベルの調整を行うことができる。
本実施の形態においては、記憶部14に複数の信号パターンSP_1〜SP_nを記憶し、入力部15によりそれらを選択することができるので、例えば、予め複数のユーザの信号パターンを記憶しておき、入力部15で必要に応じて、所定の信号パターンSPを選択することにより、ユーザの音声に適合する、最適なレベルを設定することができる。
たとえば、話し始めの時を検出し、図3(c)のように滑らかに立ち上がる特性をもった、安定した音量調整を行うことができる。
第3実施形態
図7は、本発明に係る音声調整装置の第3実施形態の機能ブロックの一部を拡大した図である。
本実施形態に係る音声調整装置1bは、第1および第2実施形態に係る音声調整装置1、1aと略同じ構成であり、以下、相違点のみ説明する。
音声調整装置1bにおいて、平均値検波部112bは、図7に示すように、バッファ11231、加算器11232、バッファ11233、および初期加算部11234を有する。
また、音声調整装置1bは、第2実施形態に係る音声調整装置1aと同様に、記憶部14b、入力部15bを有する。
加算器11232は、バッファ11231を介して入力された、音声信号S21と、バッファ11233を介して初期加算部11234から出力された信号S11234とを加算して信号S11232を生成し、信号S112として出力する。
初期加算部11234は、平均値検波処理の初期時には、検波入力部15bから出力された選択信号S15bに応じて、記憶部14bから出力された信号パターンSP_nと、加算器11232から出力された信号S11232とを加算して、信号S11234として出力する。
入力部15bは、例えばユーザの操作に応じて、記憶部14bに記憶されている信号パターンSP_1〜SP_nの内から所定の信号パターンSPを選択させる選択信号S15bを生成し、初期加算部11234に出力する。
また、入力部15bは、記憶部14bに記憶されている信号パターンSP_1〜SP_nの内から所定の信号パターンSPを選択させる選択信号S151bを生成し、記憶部14bに出力する。
記憶部14bは、入力部15bから出力された信号S151bに基づいて、記憶している信号パターンSP_1〜SP_nの内から所定の信号パターンSPを選択し、初期加算部11234に出力する。
以上説明した構成の音声調整装置1bの動作を簡単に説明する。
例えば、入力部15bから、平均値検波部112bに平均値検波処理の初期値として、記憶部14bに記憶されている信号パターンSP_1〜の内から所定の信号パターンSPを選択させる選択信号S151bが記憶部14bに出力され、信号15bが初期加算部11234に出力される。
記憶部14bは、信号151bに応じて信号パターンSP初期加算部11234に出力する。
初期加算部11234では、初期時には、入力部15bから出力された信号S151b、および記憶部14bから出力された信号パターンSPに基づいて、信号パターンSPを平均値検波処理の初期値として用いて、信号S11232に加算し、信号S11234として出力される。
そして、信号S11234は、バッファ11233を介して加算器11232に入力され、バッファ11231を介して入力された音声信号S21と加算され、信号11232として出力される。
以上説明したように、本実施形態では、平均値検波部112bに、平均値検波処理の初期時には、記憶部に記憶されている所望の信号パターンSPを入力しているので、平均値検波の初期時の不安定さを解消することができる。
なお、本発明は本実施の形態に限られるものではなく、任意好適な種々の変更が可能である。
例えば、記憶部14に記憶された信号パターンSPを他の記憶媒体に記憶することで、バックアップ等を行うことができる。
また、第1実施形態ではタイミング指示信号生成部22がタイミング指示信号tを出力すると、ピーク検波部111はそのタイミング指示信号tに応じて規定される所定の期間、レベル算出部12から出力される音声信号S21の平均値レベルを所定のレベル以上にする制御信号を平均値検波部112に出力したが、この形態に限られるものではない。
例えば、タイミング指示信号生成部22がタイミング指示信号tを出力すると、ピーク検波部111は、所定の時間、例えば30秒の後に平均値信号を生成させる制御信号S111を出力し、平均値検波部112はその制御信号S111に応じて所定の時間の後に音声信号S12に応じた平均値検波を行ってもよい。
また、タイミング指示信号生成部22がハイレベルのタイミング指示信号tを出力すると、ピーク検波部111は、所定の時間、例えば30秒の後に平均値信号を生成させる制御信号S111を出力し、平均値検波部112はその制御信号S111に応じて所定の時間の後に音声信号S12に応じた平均値検波を行ってもよい。
また、この所定の時間は、例えばユーザそれぞれにより、マイクロフォン2のスイッチをオンし、タイミング指示信号生成部22がハイレベルのタイミング指示信号tを生成してから、話し始める時間が異なるので、ユーザそれぞれに対応した時間を設定する機構を設けてもよい。
本発明の実施の形態によれば、無音状態から急激に音声信号のレベルが強くなる場合に、音声信号の出力レベルが大きくならない音声調整装置、および音声調整方法を提供することができる。
図1は本発明に係る音声調整装置の第1実施形態の機能ブロック図である。 図2は図1に示した音声調整装置の平均値検波部の機能ブロックの一具体例を示す図である。 図3は図1に示した音声調整装置の動作を説明するための図である。 図4は図1に示した音声調整装置の動作を説明するための図である。 図5は音声調整装置1の動作を説明するためのフローチャートである。 図6は本発明に係る音声調整装置の第2実施形態の機能ブロック図である。 図7は本発明に係る音声調整装置の第3実施形態の機能ブロックの一部を拡大した図である。
1…音声調整装置、2…マイク、11…検波部、12…レベル算出部、13…出力処理部、14…記憶部、15…入力部、21…音声入力部、22…タイミング指示信号生成部、111…ピーク検波部、112…平均値検波部、1111…第1平均値検波部、1112…第2平均値検波部、1123…切換部、1124…切換制御部、11231…バッファ、11232…加算器、11233…バッファ、11234…初期加算部。

Claims (2)

  1. 話者の音声を検出して電気信号に変換する音声検出手段と、
    話者の操作に応じてオンレベルのタイミング信号を発生する、信号発生手段と、
    前記タイミング信号がオンレベルの期間、前記音声検出手段が検出した音声信号のピークを検出し、当該音声信号のピークが所定レベル以上のとき、そのピークに応じた制御信号を出力する、ピーク検波手段と、
    時定数が可変であり、前記制御信号に基づく時定数で前記音声検出手段が検出した音声信号の平均値を演算する時定数が変更可能な第1平均値処理手段と、固定の時定数で前記音声検出手段が検出した音声信号の平均値を算出する第2平均値処理手段とを有し、前記第1平均値処理手段で演算した第1平均値信号と前記第2平均値処理手段で演算した第2平均値信号とを比較して大きい値の平均値信号を出力する、平均値処理手段と、
    事前に複数の話者の音声パターンデータを記憶している記憶手段と、
    前記記憶手段に記憶されている前記複数の話者の音声パターンデータの1つを選択して前記記憶手段から読みだす選択手段と、
    前記タイミング信号がオンレベルになってから所定時間の間、前記選択手段から出力された1の音声パターンデータを音声出力処理手段に出力し、前記所定の期間が経過後は、前記平均値処理手段から出力された平均値信号を前記音声出力処理手段に出力する、レベル算出手段と、
    前記音声検出手段で検出した音声信号を、前記レベル算出手段から出力された信号に基づく増幅度で増幅する、音声出力処理手段と、
    を有する、
    音声調整装置。
  2. タイミング信号がオンレベルの期間、音声検出手段が検出した音声信号のピークを検出し、当該音声信号のピークが所定レベル以上のとき、そのピークに応じた制御信号を出力する、ピーク検波工程と、
    時定数が可変であり、前記制御信号に基づく時定数で前記音声検出手段が検出した音声信号の平均値を演算する時定数が変更可能な第1平均値処理工程と、固定の時定数で前記音声検出手段が検出した音声信号の平均値を算出する第2平均値処理工程とを有し、前記第1平均値処理工程で演算した第1平均値信号と前記第2平均値処理工程で演算した第2平均値信号とを比較して大きい値の平均値信号を出力する、平均値処理工程と、
    当該平均値処理工程において得られた平均値信号のレベルに応じた信号を算出するレベル算出工程と、
    事前に記憶手段に記憶されている複数の話者の音声パターンデータ1つを選択して前記記憶手段から読みだす選択工程と、
    前記タイミング信号がオンレベルになってから所定時間の間、前記選択工程で選択された1の音声パターンデータを出力し、前記所定の期間が経過後は、前記平均値処理工程で得られた平均値信号を出力する、レベル算出工程と、
    前記音声検出手段で検出した音声信号を、前記レベル算出工程で算出された信号に基づく増幅度で増幅する、音声出力処理工程と、
    を有する、音声調整方法。
JP2006127764A 2006-05-01 2006-05-01 音声調整装置および音声調整方法 Expired - Lifetime JP4430035B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006127764A JP4430035B2 (ja) 2006-05-01 2006-05-01 音声調整装置および音声調整方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006127764A JP4430035B2 (ja) 2006-05-01 2006-05-01 音声調整装置および音声調整方法

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2003001458A Division JP3853293B2 (ja) 2003-01-07 2003-01-07 音声調整装置および音声調整方法

Publications (2)

Publication Number Publication Date
JP2006270989A JP2006270989A (ja) 2006-10-05
JP4430035B2 true JP4430035B2 (ja) 2010-03-10

Family

ID=37206369

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006127764A Expired - Lifetime JP4430035B2 (ja) 2006-05-01 2006-05-01 音声調整装置および音声調整方法

Country Status (1)

Country Link
JP (1) JP4430035B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5771774B2 (ja) * 2010-12-14 2015-09-02 パナソニックIpマネジメント株式会社 自動音量補正装置、音声転送装置及びインターホンシステム

Also Published As

Publication number Publication date
JP2006270989A (ja) 2006-10-05

Similar Documents

Publication Publication Date Title
EP2928076B1 (en) Level adjustment device and method
JP5342945B2 (ja) 音声信号の振幅調整装置及び音声信号の振幅調整方法
CN109983782B (zh) 会话辅助装置及会话辅助方法
JP4430035B2 (ja) 音声調整装置および音声調整方法
JP3853293B2 (ja) 音声調整装置および音声調整方法
JP5062055B2 (ja) 音声信号処理装置及び方法
TWI609365B (zh) 助聽器及其寬動態範圍壓縮的恢復時間動態調整方法
KR20150064557A (ko) 스피커의 임피던스를 자동 검출하는 증폭기 및 증폭기의 제어 방법
JP4131255B2 (ja) オーディオ再生装置
WO2013069229A1 (ja) 音声入出力装置、ハウリング防止方法およびハウリング防止用プログラム
JP4661422B2 (ja) ミューティング装置、デジタルオーディオ装置
JP2008205522A (ja) 音声信号処理装置
JP2015141294A (ja) 通信装置
JP4493557B2 (ja) 音声信号判断装置
JP6507893B2 (ja) 増幅装置、及び、スピーカー装置
JP2018160885A (ja) 音響装置、スピーカー装置、および音響信号処理方法
JP7422683B2 (ja) マイクロホン装置
JP2020080509A (ja) 聴覚特性検出装置、補聴器、聴覚特性検出プログラム、および補聴器プログラム
JP2003037650A (ja) 携帯電話機
TWI490854B (zh) 音訊調整方法與聲學處理裝置
JP4882818B2 (ja) ダイナミクス制御装置
JP2009200777A (ja) オーディオ信号の利得制御装置および利得制御方法
JP2013117659A (ja) 音声処理装置及び音声処理装置の制御方法
KR100644633B1 (ko) 최대 사운드 레벨 제어 장치 및 방법
JP2004200970A (ja) 音量制御装置及び音量制御方法

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090120

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090323

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090630

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090723

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20091117

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20091216

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121225

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4430035

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131225

Year of fee payment: 4

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

EXPY Cancellation because of completion of term