JP5863928B1 - 音声調整装置 - Google Patents

音声調整装置 Download PDF

Info

Publication number
JP5863928B1
JP5863928B1 JP2014219802A JP2014219802A JP5863928B1 JP 5863928 B1 JP5863928 B1 JP 5863928B1 JP 2014219802 A JP2014219802 A JP 2014219802A JP 2014219802 A JP2014219802 A JP 2014219802A JP 5863928 B1 JP5863928 B1 JP 5863928B1
Authority
JP
Japan
Prior art keywords
voice
sound
signal
time
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2014219802A
Other languages
English (en)
Other versions
JP2016085420A (ja
Inventor
中村 圭介
圭介 中村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP2014219802A priority Critical patent/JP5863928B1/ja
Priority to PCT/JP2015/055093 priority patent/WO2016067644A1/ja
Application granted granted Critical
Publication of JP5863928B1 publication Critical patent/JP5863928B1/ja
Publication of JP2016085420A publication Critical patent/JP2016085420A/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/20Speech recognition techniques specially adapted for robustness in adverse environments, e.g. in noise, of stress induced speech
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0316Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
    • G10L21/0324Details of processing therefor
    • G10L21/034Automatic adjustment
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • G10L25/84Detection of presence or absence of voice signals for discriminating voice from noise

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Quality & Reliability (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Telephone Function (AREA)

Abstract

【課題】 音声信号の入力ゲインや出力ゲインを使用環境に合わせて適切に調整し、音声認識率を向上させた音声調整装置を提供する。【解決手段】 マイクから入力された電気信号を音声信号に変換するマイク信号入力部と、音声信号の強度を測定して予め設定した音声強度閾値と比較する音声信号強度測定部と、音声信号が音声強度閾値よりも小さい無音状態が継続する無音時間を計測する無音時間測定部と、音声信号が音声強度閾値よりも大きい有音状態が継続する有音時間を計測する有音時間測定部と、無音時間または有音時間を予め設定した時間閾値と比較して音声信号を調整する音声調整手段とを備えたことを特徴とする。【選択図】 図1

Description

本発明は、音声調整装置に関するものである。
近年では、ロボットやスマートフォンなど、様々な機器に音声認識機能が搭載され、使用者との音声対話により指示を実行する機器も増えつつある。このような音声対話型の機器では、音声認識率を向上させるために、マイクロフォンの感度(入力ゲイン)を周囲の雑音の状況に応じて逐次自動調整することが望ましい。
例えば、音声認識において、マイクロフォンの感度が低くすぎると、必要な音声信号が十分に得られず正しく音声認識できない。また、音声認識において、マイクロフォンの感度が高すぎても、音声信号の歪みや周囲の雑音を拾ってしまい正しく音声認識できない。
そこで、マイクロフォンの感度を調整して適切な状態に維持する音声調整装置が実用化されている。
例えば、特許文献1の音声認識装置は、入力音声データにユーザの発話音声が含まれる時間区間を発話音声区間として検出したうえで、発話音声区間において入力音声信号に含まれる発話音声の平均的なレベルと、発話音声区間以外の時間区間において入力音声信号に含まれる騒音のレベルとをそれぞれ算出し、上記騒音のレベルと平均的な発話音声レベルとにより入力音声信号のレベルを推定し、入力音声信号のレベルを入力アンプで増幅したレベルが音声認識に適合したレベルとなるように、入力アンプのゲインを設定する。
特許第5457293号公報
しかしながら、特許文献1の音声認識装置では、入力音声データにユーザの発話音声が含まれる区間とそれ以外の区間とを正確に判別する必要があるが、このような発話音声の判別は一般的に非常に困難である。
特許文献1の音声認識装置では、トークスイッチを備えており、ユーザのトークスイッチの押し下げ時点から発話音声区間の終了時点までをユーザの発話音声が含まれる区間と判別しているが、ユーザが音声入力毎にトークスイッチを押し下げることは、ユーザの操作を煩雑にさせるという問題がある。
また、トークスイッチを備えない一般的な音声認識装置では、別の手段で発話音声区間の開始時点を判定する必要がある。さらに、一般的に音声入力データには、ユーザの発話音声信号と騒音の信号とが混在しており、そのうちユーザの発話音声信号のみが終了した時点を判定することは困難である。
特許文献1の音声認識装置では、入力音声データにユーザの発話音声が含まれる区間とそれ以外の区間との判別が正確ではない場合、発話音声区間において入力音声信号に含まれる発話音声の平均的なレベルと、発話音声区間以外の時間区間において入力音声信号に含まれる騒音のレベルとをそれぞれ誤って算出してしまう虞があり、入力音声信号のレベルを使用環境に合わせて適切に調整できないという問題があった。
本発明は上記の課題に鑑みてなされたものであり、その目的は、音声信号の入力ゲインや出力ゲインを使用環境に合わせて適切に調整し、音声認識率を向上させることができる音声調整装置を提供することである。
本発明の音声調整装置は、マイクから入力された電気信号を音声信号に変換するマイク信号入力部と、音声信号の強度を測定して予め設定した音声強度閾値と比較する音声信号強度測定部と、音声信号が音声強度閾値よりも小さい無音状態が継続する無音時間を計測する無音時間測定部と、音声信号が音声強度閾値よりも大きい有音状態が継続する有音時間を計測する有音時間測定部と、無音時間または有音時間を予め設定した時間閾値と比較して音声信号を調整する音声調整手段とを備えたことを特徴とする。
また、本発明の音声調整装置において、音声調整手段は、マイク信号入力部の入力ゲインを調整するためのマイク感度調整部を備え、無音時間が予め設定した無音時間閾値より長いときに入力ゲインを上げて、有音時間が予め設定した有音時間閾値より長いときに入力ゲインを下げることを特徴とする。
また、本発明の音声調整装置において、音声調整手段は、スピーカに音声信号を出力するスピーカ信号出力部と、スピーカ信号出力部の出力ゲインを調整するためのスピーカ音量調整部とを備え、無音時間が予め設定した無音時間閾値より長いときに出力ゲインを下げて、有音時間が予め設定した有音時間閾値より長いときに出力ゲインを上げることを特徴とする。
また、本発明の音声調整装置において、音声調整手段は、マイク信号入力部の入力ゲインを調整するためのマイク感度調整部と、スピーカに音声信号を出力するスピーカ信号出力部と、スピーカ信号出力部の出力ゲインを調整するためのスピーカ音量調整部とを備え、無音時間が予め設定した無音時間閾値より長いときに入力ゲインを上げるとともに出力ゲインを下げて、有音時間が予め設定した有音時間閾値より長いときに入力ゲインを下げるとともに出力ゲインを上げることを特徴とする。
本発明によれば、有音時間と無音時間とに基づき入力ゲインや出力ゲインの調整を行うことで、音声信号の入力ゲインや出力ゲインを使用環境に合わせて適切に調整し、音声認識率を向上させることができる音声調整装置を提供することができる。
本発明の音声調整装置の基本構成図である。 実施例1の音声調整装置の構成図である。 無音時間を利用したマイク感度の調整方法を示す原理図である。 有音時間を利用したマイク感度の調整方法を示す原理図である。 実施例1のマイク感度の調整ステップを示すフロー図である。 実施例2の音声調整装置の構成図である。 実施例2のスピーカ音量の調整ステップを示すフロー図である。 実施例3の音声調整装置の構成図である。 実施例3のマイク感度及びスピーカ音量の調整ステップを示すフロー図である。
図1に、本発明の音声調整装置20の基本構成を示す。本発明の音声調整装置20は、マイクロフォン10から入力した電気信号を音声信号に変換するマイク信号入力部31と、音声信号の強度を測定して予め設定した音声強度閾値と比較する音声信号強度測定部32を備えている。
また、音声調整装置20は、音声信号が音声強度閾値よりも小さい無音状態が継続する無音時間を計測する無音時間測定部33と、音声信号が音声強度閾値よりも大きい有音状態が継続する有音時間を計測する有音時間測定部34と、無音時間または有音時間を予め設定した時間閾値と比較して音声信号を調整する音声調整手段40を備えている。
通常、人間が会話により連続して発話可能な時間は息継ぎの制約からせいぜい5秒程度までと考えられ、15秒程度息継ぎなしで発話し続けることはほとんど考えられない。そこで、本発明の音声調整装置20では、音声信号が所定の音声強度閾値よりも大きい状態(有音状態)で任意の一定時間(5〜10秒)を超えて継続している場合、その音声信号は人間の音声ではなく周囲の雑音であるとみなし、このような雑音による音声認識への影響を低減するように音声信号を調整している。
また、本発明の音声調整装置20では、音声信号が所定の音声強度閾値よりも小さい状態(無音状態)で任意の一定時間(20〜30秒)を超えて継続している場合、その音声信号は周囲の雑音を含んでいないとみなし、音声認識率が向上するように音声信号を調整している。本発明の音声調整装置20は、このような音声信号の調整により、例えば、音声認識機能を有する機器の音声認識率を向上させることができる。
(実施例1)
図2に、実施例1の音声調整装置21の構成を示す。実施例1の音声調整装置21は、音声認識機能や音声合成などの音声出力機能を有するロボットや情報端末に搭載される音声調整装置であり、使用環境における周囲の雑音の大きさに合わせてマイク感度(入力ゲイン)を調整して、音声認識機能を向上させるものである。
音声調整装置21は、図2に示すように、マイクロフォン10から電気信号を入力して音声信号に変換するマイク信号入力部31と、音声信号の強度を測定して予め設定した音声強度閾値と比較する音声信号強度測定部32を備える。
また、音声調整装置21は、音声信号が音声強度閾値よりも小さい無音状態が継続する無音時間を計測する無音時間測定部33と、音声信号が音声強度閾値よりも大きい有音状態が継続する有音時間を計測する有音時間測定部34を備える。
さらに、音声調整装置21は、音声調整手段40として、無音時間または有音時間を予め設定した時間閾値と比較し、その比較結果によってマイク信号入力部31の感度(入力ゲイン)を調整するマイク感度調整部41を備えている。
音声調整装置21には、外部の音を電気信号に変換するマイクロフォン10が接続されており、ここからマイク信号入力部31を介して数値化された音声信号が音声信号強度測定部32に渡される。
音声信号強度測定部32は、例えば、予め設定された音声強度閾値を持っていて、その音声強度閾値と現在の音声信号の値を比較して音声の有無を判定する。
なお、音声信号強度測定部32は、市販製品等の音声認識処理部に内蔵されることで音声強度閾値の設定が困難な場合があり、その場合は音声認識処理部の処理状況を取得して音声信号の有無を判定してもよい。
図3は、音声信号強度測定部32で音声信号が無音と判定された時にマイク感度(入力ゲイン)を調整する説明図である。音声信号強度測定部32により、現在の音声信号が無音とみなせると判定した場合には、無音時間測定部33にて無音時間(無音状態の経過時間)を測定する。
無音時間が予め設定された無音時間閾値を超えて継続した場合は、マイク感度調整部41にてマイクロフォン10のマイク感度を上げる。この無音時間閾値は、具体的には10秒〜60秒程度で、マイク感度の上昇率は1〜5%程度が望ましい。マイク感度調整部41は、上記のような無音時間閾値とマイク感度の上昇率の設定により、静かな環境下においては次第にマイク感度を上げていくように調整する。
具体的には、図3に示すように、無音時間が任意の無音時間閾値(T11)だけ継続すると、マイク感度を数%上げる。そこから更に無音時間が無音時間閾値(T12)だけ継続すると、再びマイク感度を数%上げる。これを無音時間が継続している間中繰り返す。
なお、無音時間閾値(T11)と無音時間閾値(T12)は、必ずしも等しくする必要はない。また、それぞれのマイク感度の上昇率を等しくする必要もない。
マイク感度が上昇していくと、やがて、無音時間がこれまで程長く継続しなくなり、マイク感度が使用環境に適した一定の水準に落ち着く。
図4は、音声信号強度測定部32で音声信号が有音と判定された時にマイク感度(入力ゲイン)を調整する説明図である。音声信号強度測定部32により、現在の音声信号が有音とみなせると判定した場合には、有音時間測定部34にて有音時間(有音状態の経過時間)を測定する。
有音時間が予め設定された任意の有音時間閾値を超えて継続した場合は、マイク感度調整部41にてマイクロフォン10のマイク感度を下げる。この有音時間閾値は、具体的には5〜20秒程度で、感度の下降率は10〜50%程度が望ましく、通常、人が一呼吸で話すことのできる時間を目安に設定される。マイク感度調整部41は、上記のような有音時間閾値とマイク感度の上昇率の設定により、騒がしい環境下では速やかにマイクロフォンのマイク感度を下げるように調整する。
具体的には、有音時間が任意の有音時間閾値(T21)だけ継続すると、マイク感度を数%〜数十%下げる。更にそこから有音時間が有音時間閾値(T22)だけ継続すると、再びマイク感度を数%〜数十%下げる。これを有音時間が継続している間中繰り返す。
なお、有音時間閾値(T21)と有音時間閾値(T22)は必ずしも等しくする必要はない。また、それぞれでの入力ゲインの下降率も等しくする必要はない。
やがてマイク感度が下降していくと有音時間がこれまで程長く継続しなくなり、マイク感度が使用環境に適した一定の水準に落ち着く。
図5に、実施例1の音声調整装置21において、マイク感度(入力ゲイン)を調整するための処理フローを示す。図5に基づいて処理フローを説明すると以下の通りである。
S11.音声調整処理を開始する。
S12.音声信号強度測定部32において、音声信号の強度を任意の音声強度閾値と比較し(あるいは音声認識中か否かを元にして)、音声信号の強度が音声強度閾値よりも大きければ有音、音声信号の強度が音声強度閾値よりも小さければ無音と判定する。
S13.音声信号強度測定部32において、無音(音声信号なし)と判定した場合は、無音時間測定部33で無音時間(音声信号のない区間の継続時間)を計測する。
S14.無音時間が任意の無音時間閾値よりも短かった場合は、マイク感度を変更せずに音声調整処理の開始(S11)に戻る。無音時間が無音時間閾値をより長かった場合は、次の処理(S15)に進む。
S15.無音時間が無音時間閾値よりも長かった場合は、周囲に雑音のない静かな環境でマイク感度に余裕があると判断して、マイク信号入力部31のマイク感度を任意の割合で上げた後、音声調整処理の開始(S11)に戻る。
S16.音声信号強度測定部32において、有音(音声信号あり)と判定した場合は、有音時間測定部34で有音時間(音声信号のある区間の継続時間)を測定する。
S17.有音時間が任意の有音時間閾値より短かった場合は、通常の会話であると判断して、マイク感度を変更せずに音声調整処理の開始(S11)に戻る。有音時間が有音時間閾値よりも長かった場合は、次の処理(S18)に進む。
S18.有音時間が有音時間閾値よりも長かった場合は、周囲に一定の雑音があると判断して、マイク信号入力部31でマイクロフォン10のマイク感度を任意の割合で下げた後、音声調整処理の開始(S11)に戻る。
上記処理フローのように、本発明は、音声信号から無音状態と有音状態が継続する長さを測定して、音声認識に適した音声信号に調整することを特徴としている。すなわち、実施例1の音声調整装置21によれば、無音時間または有音時間が継続する長さにより、周囲の雑音と人間の会話とを区別しており、使用環境に応じて最適なマイク感度を設定することができる。
(実施例2)
図6に、実施例2の音声調整装置22の構成を示す。実施例2の音声調整装置22は、音声調整手段40としてスピーカ音量調整部42とスピーカ信号出力部43を備え、静かな環境や雑音の多い騒がしい環境など、使用環境に応じてスピーカ50の音量(出力ゲイン)を聞き取り易く調整する音声調整装置である。
音声調整装置22において、音声信号がマイクロフォン10およびマイク信号入力部31を経て入力され、音声信号の強度が音声信号強度測定部32で測定され、無音時間測定部33および有音時間測定部34にて無音時間および有音時間を測定するまでの処理は、実施例1の音声調整装置21と同様である。
その後、実施例2の音声調整装置22では、無音時間測定部33にて、無音時間が予め設定された任意の無音時間閾値よりも長かった場合は、スピーカ音量調整部42にてスピーカ50の音量(出力ゲイン)を下げる。この無音時間閾値は、具体的には10秒〜60秒程度で、音量の下降率は1〜5%程度が望ましい。スピーカ音量調整部42は、このような無音時間閾値と音量の下降率の設定により、静かな環境下においてはスピーカ50の音量を次第に低下するように調整する。
また、スピーカ音量調整部42は、有音時間が予め設定した任意の有音時間閾値よりも長かった場合は、スピーカ音量調整部42にてスピーカ50の音量(出力ゲイン)を上げる。この有音時間閾値は、具体的には5〜20秒程度で、音量の上昇率は10〜50%程度が望ましく、通常、人が一呼吸で話すことのできる時間を目安に設定される。スピーカ音量調整部42は、このような無音時間閾値と音量の下降率の設定により、騒がしい環境下においてはスピーカ50の音量を速やかに上げるように調整する。
図7に、実施例2の音声調整装置22において、スピーカ音量(出力ゲイン)を調整するため処理フローを示す。図7に基づいて処理フローを説明すると以下の通りである。
S11.音声調整処理を開始する。
S12.音声信号強度測定部32において、音声信号の強度を任意の音声強度閾値と比較し(あるいは音声認識中か否かを元にして)、音声信号の強度が音声強度閾値よりも大きければ有音、音声信号の強度が音声強度閾値よりも小さければ無音と判定する。
S13.音声信号強度測定部32において、無音(音声信号なし)と判定した場合は、無音時間測定部33で無音時間(音声信号のない区間の継続時間)を測定する。
S14.無音時間が任意の無音時間閾値よりも短かった場合は、スピーカの音量を変更せずに音声調整処理の開始(S11)に戻る。無音時間が無音時間閾値よりも長かった場合は、次の処理(S21)に進む。
S21.無音時間が無音時間閾値よりも長かった場合は、周囲に雑音がなく静かな環境であると判断して、スピーカ50の音量(出力ゲイン)を任意の割合で下げた後、音声調整処理の開始(S11)に戻る。
S16.音声信号強度測定部32において、有音(音声信号あり)と判定した場合は、有音時間測定部34で有音時間(音声信号のある区間の継続時間)を測定する。
S17.有音時間が任意の有音時間閾値より短かった場合は、通常の会話であると判断して、出力ゲインを変更せずに音声調整処理の開始(S11)に戻る。有音時間が有音時間閾値よりも長かった場合は、次の処理(S22)に進む。
S22.有音時間が有音時間閾値よりも長かった場合は、周囲の雑音であると判断して、スピーカ50の音量(出力ゲイン)を任意の割合で上げた後、音声調整処理の開始(S11)に戻る。
実施例2の音声調整装置22によれば、周囲の雑音の強度に応じてスピーカ50の音量(出力ゲイン)を調整しているため、使用環境に合わせて人間の会話の音量を聞き取り易く調整することができる。
(実施例3)
実施例3の音声調整装置23の構成を図8に示す。実施例3の音声調整装置23は、実施例1の音声調整装置21と実施例2の音声調整装置22を組み合わせたものである。実施例3の音声調整装置23は、静かな環境や雑音の多い騒がしい環境などでは、マイクロフォンの感度(入力ゲイン)を音声認識機能が良好な状態となるよう調整すると共に、周囲の雑音に対してスピーカの音量(出力ゲイン)を聞き取り易く調整する音声調整装置である。
実施例3の音声調整装置23は、図8に示すように、実施例1の音声調整装置21の構成と、実施例2の音声調整装置22の構成を兼ね備えている。音声調整装置23の各構成の詳細は、実施例1や実施例2と同じであるため説明を省略する。
図9に、実施例3の音声調整装置23によるマイクおよびスピーカの音声調整の処理フローを示す。図9に基づいて処理フローを説明すると以下の通りである。
S11.音声調整処理を開始する。
S12.音声信号強度測定部32において、音声信号の強度を任意の音声強度閾値と比較し(あるいは音声認識中か否かを元にして)、音声信号の強度が音声強度閾値よりも大きければ有音、音声信号の強度が音声強度閾値よりも小さければ無音と判定する。
S13.音声信号強度測定部32において、無音(音声信号なし)と判定した場合は、無音時間測定部33で無音時間(音声信号のない区間の継続時間)を測定する。
S14.無音時間が任意の無音時間閾値よりも短かった場合は、マイク感度及びスピーカ音量を変更せずに音声調整処理の開始(S11)に戻る。無音時間が無音時間閾値よりも長かった場合は、次の処理(S15)に進む。
S15.無音時間が無音時間閾値よりも長かった場合は、周囲に雑音のない静かな環境でマイク感度に余裕あると判断して、マイク感度(入力感度)を任意の割合で上げるとともに、続くS21で、スピーカ音量(出力ゲイン)を任意の割合で下げた後、音声調整処理の開始(S11)に戻る。
S16.音声信号強度測定部32において、有音(音声信号あり)と判定した場合は、有音時間測定部34で有音時間(音声信号のある区間の継続時間)を測定する。
S17.有音時間が任意の有音時間閾値より短かった場合は、通常の会話であると判断して、マイク感度及びスピーカ音量を変更せずに音声調整処理の開始(S11)に戻る。有音時間が有音時間閾値よりも長かった場合は、次の処理(S18)に進む。
S18.有音時間が有音時間閾値よりも長かった場合は、周囲に一定の雑音があると判断して、マイク感度(入力感度)を任意の割合で下げるとともに、続くS22で、スピーカ音量(出力ゲイン)を任意の割合で上げた後、音声調整処理の開始(S11)に戻る。
実施例3の音声調整装置23によれば、無音時間または有音時間が継続する長さにより、周囲の雑音と人間の会話とを区別しているため、周囲の雑音の強度に合わせてマイク感度とスピーカ音量を設定しているため、使用環境に応じて人間の会話の音量を聞き取り易く調整することが可能である。また、本発明の音声調整装置23を備えることにより、音声認識機能を有する機器で音声認識率を向上させることができる。
本発明によれば、音声認識機能や音声応答機能を有するあらゆる機器での利用が可能である。
10 マイクロフォン
20、21、22、23 音声調整装置
31 マイク信号入力部
32 音声信号強度測定部
33 無音時間測定部
34 有音時間測定部
40 音声調整手段
41 マイク感度調整部
42 スピーカ音量調整部
43 スピーカ信号出力部
50 スピーカ

Claims (3)

  1. マイクから入力された電気信号を音声信号に変換するマイク信号入力部と、
    前記音声信号の強度を測定して予め設定した音声強度閾値と比較する音声信号強度測定部と、
    前記音声信号が前記音声強度閾値よりも小さい無音状態が継続する無音時間を計測する無音時間測定部と、
    前記音声信号が前記音声強度閾値よりも大きい有音状態が継続する有音時間を計測する有音時間測定部と、
    前記無音時間または前記有音時間を予め設定した時間閾値と比較して前記音声信号を調整する音声調整手段とを備え
    前記音声調整手段は、
    前記マイク信号入力部の入力ゲインを調整するためのマイク感度調整部を備え、
    前記無音時間が予め設定した無音時間閾値より長いときに前記入力ゲインを上げて、前記有音時間が予め設定した有音時間閾値より長いときに前記入力ゲインを下げることを特徴とする音声調整装置。
  2. マイクから入力された電気信号を音声信号に変換するマイク信号入力部と、
    前記音声信号の強度を測定して予め設定した音声強度閾値と比較する音声信号強度測定部と、
    前記音声信号が前記音声強度閾値よりも小さい無音状態が継続する無音時間を計測する無音時間測定部と、
    前記音声信号が前記音声強度閾値よりも大きい有音状態が継続する有音時間を計測する有音時間測定部と、
    前記無音時間または前記有音時間を予め設定した時間閾値と比較して前記音声信号を調整する音声調整手段とを備え
    前記音声調整手段は、
    スピーカに音声信号を出力するスピーカ信号出力部と、前記スピーカ信号出力部の出力ゲインを調整するためのスピーカ音量調整部とを備え、
    前記無音時間が予め設定した無音時間閾値より長いときに前記出力ゲインを下げて、前記有音時間が予め設定した有音時間閾値より長いときに前記出力ゲインを上げることを特徴とする音声調整装置。
  3. マイクから入力された電気信号を音声信号に変換するマイク信号入力部と、
    前記音声信号の強度を測定して予め設定した音声強度閾値と比較する音声信号強度測定部と、
    前記音声信号が前記音声強度閾値よりも小さい無音状態が継続する無音時間を計測する無音時間測定部と、
    前記音声信号が前記音声強度閾値よりも大きい有音状態が継続する有音時間を計測する有音時間測定部と、
    前記無音時間または前記有音時間を予め設定した時間閾値と比較して前記音声信号を調整する音声調整手段とを備え
    前記音声調整手段は、
    前記マイク信号入力部の入力ゲインを調整するためのマイク感度調整部と、スピーカに音声信号を出力するスピーカ信号出力部と、前記スピーカ信号出力部の出力ゲインを調整するためのスピーカ音量調整部とを備え、
    前記無音時間が予め設定した無音時間閾値より長いときに前記入力ゲインを上げるとともに前記出力ゲインを下げて、
    前記有音時間が予め設定した有音時間閾値より長いときに前記入力ゲインを下げるとともに前記出力ゲインを上げることを特徴とする音声調整装置。
JP2014219802A 2014-10-29 2014-10-29 音声調整装置 Active JP5863928B1 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2014219802A JP5863928B1 (ja) 2014-10-29 2014-10-29 音声調整装置
PCT/JP2015/055093 WO2016067644A1 (ja) 2014-10-29 2015-02-23 音声調整装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014219802A JP5863928B1 (ja) 2014-10-29 2014-10-29 音声調整装置

Publications (2)

Publication Number Publication Date
JP5863928B1 true JP5863928B1 (ja) 2016-02-17
JP2016085420A JP2016085420A (ja) 2016-05-19

Family

ID=55346919

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014219802A Active JP5863928B1 (ja) 2014-10-29 2014-10-29 音声調整装置

Country Status (2)

Country Link
JP (1) JP5863928B1 (ja)
WO (1) WO2016067644A1 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6531776B2 (ja) * 2017-04-25 2019-06-19 トヨタ自動車株式会社 音声対話システムおよび音声対話方法
JP6887315B2 (ja) * 2017-06-05 2021-06-16 キヤノン株式会社 音声処理装置およびその制御方法、プログラム並びに記憶媒体
JP7404664B2 (ja) 2019-06-07 2023-12-26 ヤマハ株式会社 音声処理装置及び音声処理方法
US20210065691A1 (en) * 2019-08-29 2021-03-04 Microsoft Technology Licensing, Llc Automatic speech sensitivity adjustment feature

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58190993A (ja) * 1982-05-01 1983-11-08 日産自動車株式会社 車両用音声検出装置
JPH1091184A (ja) * 1996-09-12 1998-04-10 Oki Electric Ind Co Ltd 音声検出装置
JP2006209069A (ja) * 2004-12-28 2006-08-10 Advanced Telecommunication Research Institute International 音声区間検出装置および音声区間検出プログラム
WO2008114448A1 (ja) * 2007-03-20 2008-09-25 Fujitsu Limited 音声認識システム、音声認識プログラムおよび音声認識方法
JP2009175179A (ja) * 2008-01-21 2009-08-06 Denso Corp 音声認識装置、プログラム、及び発話信号抽出方法
JP2014075674A (ja) * 2012-10-03 2014-04-24 Oki Electric Ind Co Ltd 音声信号処理装置、方法及びプログラム

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58190993A (ja) * 1982-05-01 1983-11-08 日産自動車株式会社 車両用音声検出装置
JPH1091184A (ja) * 1996-09-12 1998-04-10 Oki Electric Ind Co Ltd 音声検出装置
JP2006209069A (ja) * 2004-12-28 2006-08-10 Advanced Telecommunication Research Institute International 音声区間検出装置および音声区間検出プログラム
WO2008114448A1 (ja) * 2007-03-20 2008-09-25 Fujitsu Limited 音声認識システム、音声認識プログラムおよび音声認識方法
JP2009175179A (ja) * 2008-01-21 2009-08-06 Denso Corp 音声認識装置、プログラム、及び発話信号抽出方法
JP2014075674A (ja) * 2012-10-03 2014-04-24 Oki Electric Ind Co Ltd 音声信号処理装置、方法及びプログラム

Also Published As

Publication number Publication date
JP2016085420A (ja) 2016-05-19
WO2016067644A1 (ja) 2016-05-06

Similar Documents

Publication Publication Date Title
US10579327B2 (en) Speech recognition device, speech recognition method and storage medium using recognition results to adjust volume level threshold
EP2860730B1 (en) Speech processing
US20110004468A1 (en) Hearing aid and hearing-aid processing method
US20090010456A1 (en) Method and device for voice operated control
CN113766073B (zh) 会议系统中的啸叫检测
EP2081405A1 (en) A hearing aid adapted to a specific type of voice in an acoustical environment, a method and use
WO2009128853A1 (en) Method and device for voice operated control
JP5863928B1 (ja) 音声調整装置
US10320967B2 (en) Signal processing device, non-transitory computer-readable storage medium, signal processing method, and telephone apparatus
US9749741B1 (en) Systems and methods for reducing intermodulation distortion
JP2009178783A (ja) コミュニケーションロボット及びその制御方法
EP2743923B1 (en) Voice processing device, voice processing method
JP4876245B2 (ja) 子音加工装置、音声情報伝達装置及び子音加工方法
US8935168B2 (en) State detecting device and storage medium storing a state detecting program
WO2016017229A1 (ja) 発話区間検出装置、音声処理システム、発話区間検出方法およびプログラム
US20200152185A1 (en) Method and Device for Voice Operated Control
US9179225B2 (en) Hearing aid device
JP2006333396A (ja) 音声信号拡声装置
KR101602298B1 (ko) 음량측정기를 이용한 오디오시스템
JP2015141294A (ja) 通信装置
JPS6257040B2 (ja)
WO2017085815A1 (ja) 困惑状態判定装置、困惑状態判定方法、及びプログラム
JP3284968B2 (ja) 話速変換機能を有する補聴器
JP5054477B2 (ja) 補聴装置
US11758337B2 (en) Audio processing apparatus

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20151124

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20151222

R150 Certificate of patent or registration of utility model

Ref document number: 5863928

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150