JP6020461B2 - 音声入出力装置、ハウリング防止方法およびハウリング防止用プログラム - Google Patents

音声入出力装置、ハウリング防止方法およびハウリング防止用プログラム Download PDF

Info

Publication number
JP6020461B2
JP6020461B2 JP2013542824A JP2013542824A JP6020461B2 JP 6020461 B2 JP6020461 B2 JP 6020461B2 JP 2013542824 A JP2013542824 A JP 2013542824A JP 2013542824 A JP2013542824 A JP 2013542824A JP 6020461 B2 JP6020461 B2 JP 6020461B2
Authority
JP
Japan
Prior art keywords
input
volume
voice
sound
output
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2013542824A
Other languages
English (en)
Other versions
JPWO2013069229A1 (ja
Inventor
剛範 辻川
剛範 辻川
聡 塚田
聡 塚田
英司 高田
英司 高田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Publication of JPWO2013069229A1 publication Critical patent/JPWO2013069229A1/ja
Application granted granted Critical
Publication of JP6020461B2 publication Critical patent/JP6020461B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0316Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
    • G10L21/0324Details of processing therefor
    • G10L21/034Automatic adjustment
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0272Voice signal separating
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0316Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
    • G10L21/0364Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude for improving intelligibility
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/02Circuits for transducers, loudspeakers or microphones for preventing acoustic reaction, i.e. acoustic oscillatory feedback
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/225Feedback of the input speech
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R1/00Details of transducers, loudspeakers or microphones
    • H04R1/10Earpieces; Attachments therefor ; Earphones; Monophonic headphones
    • H04R1/1083Reduction of ambient noise
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2410/00Microphones
    • H04R2410/05Noise reduction with a separate noise microphone
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/005Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones

Landscapes

  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Quality & Reliability (AREA)
  • Computational Linguistics (AREA)
  • Multimedia (AREA)
  • General Health & Medical Sciences (AREA)
  • Otolaryngology (AREA)
  • Circuit For Audible Band Transducer (AREA)

Description

本発明は、入力した音声と、その音声を音声認識した結果とを出力する際のハウリングを防止する音声入出力装置、ハウリング防止方法およびハウリング防止用プログラムに関する。
ヘッドセットマイクロフォンのように、マイクロフォンなどの音声入力装置とヘッドフォンなどの音声出力装置とを備える音声入出力装置が知られている。他にも、音声入力装置から入力される音声を認識してテキスト化し、認識結果のテキストを音声に変換して音声出力装置から出力する音声によるデータ入力装置が知られている。利用者は、認識結果のテキストを変換した音声(以下、合成音声と記す。)を確認することで、自身の発声した音声が適切に認識されているか否かを判断することができる。
すなわち、上述するデータ入力装置を用いて入力音声を確認(以下、モニタと記すこともある。)する場合、データ入力装置は、合成音声だけでなく、入力音声も音声出力装置に出力する。
図10は、データ入力装置の一例を示す説明図である。図10に示す例では、利用者が発声した音声がマイクロフォン71に入力されると、その音声がスピーカ72から出力される。このとき、利用者が発声した音声は、同時に音声認識/合成装置73に入力され、音声認識および音声合成処理を行って作成された合成音声が、同様にスピーカ72から出力される。
音声入力装置からの入力音声を音声出力装置でモニタする一つの理由は、音声入力装置から音声が入力できていることを確認するためである。その他の理由として、周囲の音が大きい環境で音声を発する際、いわゆるLombard効果による音声認識率の低下を防ぐことが挙げられる。また、音声出力装置にヘッドフォンを用いる場合、耳が塞がり、周囲の音が聞こえなくなる場合がある。そのような場合でも、音声入力装置からの入力音声を音声出力装置(ヘッドフォン)に出力することで、周囲の音を聞くことが可能になる。
なお、一般に、音声入力装置に入力される音声が出力されるタイミングと、合成音声が出力されるタイミングには、ずれが生じる。これは、合成音声を作成する際の音声認識に一定の処理時間がかかるからである。そのため、利用者は、音声を発してから一定時間の経過後、合成音声を聞くことになる。
音声入力装置と音声出力装置がセットになった音声入出力装置では、ハウリングを防止するために、音声の入力レベルと出力レベルとのバランスを調整する必要がある。そのため、これらのレベルを調整する方法が各種知られている。
特許文献1には、歌唱音声を入力するために用いられるマイクロフォンの調整を行う機能を備えたカラオケ装置が記載されている。特許文献1に記載されたカラオケ装置では、マイク音量やエフェクトを調整する際に、歌唱者の音声をPCM(Pulse Code Modulation )により変換し、変換したデータを音声として録音しておく。そして、このように録音された音声を繰り返し再生しながら歌唱者がマイク音量を調整し、その音声を再度録音することで、利用者が何度も発声する必要がなくなる。
特許文献2には、複数のスピーカから出力される各音声を自動的に調節してハウリングを起きにくくするカラオケ装置が記載されている。特許文献2に記載されたカラオケ装置は、予め定められたスピーカ位置と指定されたマイク位置との関係に応じて、マイク入力音声信号レベルを下げたり、各スピーカから出力する際のミキシングレベルを下げたりすることでハウリングの発生を防止する。
特許4360212号公報 特許2958930号公報
上述するデータ入力装置では、入力音声をモニタするために、音声出力装置から入力音声を出力させることがある。しかし、カラオケ装置の場合と同様、音声出力装置から音声入力装置に音が漏れ込んだ場合、ハウリングが発生することがある。具体的には、音声出力装置から音声入力装置に音が漏れ込み、その漏れ込んだ音がさらに増幅されて音声出力装置から出力されると、ハウリングが発生することがある。
ハウリングを防ぐ最も簡単な方法は、音声入力装置および音声出力装置の音量を下げればよい。しかし、音声入力装置の音量を下げてしまうと、音声認識の精度が低下するおそれがある。一方、音声出力装置の音量を下げてしまうと、合成音声が聞き取りづらくなってしまうおそれがある。
特許文献1に記載されたカラオケ装置の場合、ハウリングが発生したことを利用者が検知し、利用者がその都度音量を調整する必要がある。すなわち、特許文献1に記載されたカラオケ装置を利用する場合、ハウリングが発生しないように利用者がその都度音量を調整しなければならないため、ハウリングを容易に防止できないという問題がある。
また、特許文献2に記載されたカラオケ装置のように、音量レベルを下げることでハウリングを防止することは可能である。しかし、上述するように、入力レベルを下げてしまうと、音声認識の精度を低下させてしまう恐れがあり、また、出力レベルを下げてしまうと、出力される合成音声が聞き取りづらくなってしまうという問題がある。
そこで、本発明は、入力音声を音声認識した結果を入力音声と共にモニタする場合に、入力音声の音声認識精度の低下を抑制し、かつ入力音声を音声認識した結果出力される合成音声が聞き取りづらくなることを抑制しつつ、ハウリングを容易に防止できる音声入出力装置、ハウリング防止方法およびハウリング防止用プログラムを提供することを目的とする。
本発明による音声入出力装置は、入力装置に入力される入力音声の音量を調整する入力音量調整手段と、入力音量調整手段により調整された音量の入力音声を、音声認識に用いられる音声である音声認識用音声と、入力音声のモニタに用いられる音声であるモニタ用音声とに分割する音声分割手段と、モニタ用音声の音量を調整するモニタ音量調整手段と、音声認識用音声を音声認識した結果作成された情報から合成される音声である合成音声と、モニタ音量調整手段によって音量調整されたモニタ音声とを合成した音声である出力音声の音量を調整して出力装置に出力させる出力音量調整手段と、入力音声の音量に対する出力音声の音量の増幅率が1を超えないようにモニタ音声の音量を調整する指示をモニタ音量調整手段に行う制御手段とを備えたことを特徴とする。
本発明によるハウリング防止方法は、入力装置に入力される入力音声の音量を調整し、調整された音量の入力音声を、音声認識に用いられる音声である音声認識用音声と、入力音声のモニタに用いられる音声であるモニタ用音声とに分割し、モニタ用音声の音量を調整し、音声認識用音声を音声認識した結果作成された情報から合成される音声である合成音声と、音量調整されたモニタ音声とを合成した音声である出力音声の音量を調整して出力装置に出力させ、入力音声の音量に対する出力音声の音量の増幅率が1を超えないようにモニタ音声の音量を調整することを特徴とする。
本発明によるハウリング防止用プログラムは、コンピュータに、入力装置に入力される入力音声の音量を調整する入力音量調整処理、入力音量調整処理で調整された音量の入力音声を、音声認識に用いられる音声である音声認識用音声と、入力音声のモニタに用いられる音声であるモニタ用音声とに分割する音声分割処理、モニタ用音声の音量を調整するモニタ音量調整処理、音声認識用音声を音声認識した結果作成された情報から合成される音声である合成音声と、モニタ音量調整処理で音量調整されたモニタ音声とを合成した音声である出力音声の音量を調整して出力装置に出力させる出力音量調整処理、および、入力音声の音量に対する出力音声の音量の増幅率が1を超えないようにモニタ音声の音量の調整を行う制御処理を実行させることを特徴とする。
本発明によれば、入力音声を音声認識した結果を入力音声と共にモニタする場合に、入力音声の音声認識精度の低下を抑制し、かつ入力音声を音声認識した結果出力される合成音声が聞き取りづらくなることを抑制しつつ、ハウリングを容易に防止できる。
本発明による音声入出力装置の第1の実施形態の構成例を示すブロック図である。 音量の増幅率の関係を示す説明図である。 第1の実施形態の音声入出力装置の動作例を示すフローチャートである。 本発明による音声入出力装置の第2の実施形態の構成例を示すブロック図である。 本発明による音声入出力装置の第3の実施形態の構成例を示すブロック図である。 本発明による音声入出力装置の第4の実施形態の構成例を示すブロック図である。 音声入出力装置の実施例を示す説明図である。 実施例の音声入出力装置を含む音声認識システムの例を示す説明図である。 本発明による音声入出力装置の最小構成の例を示すブロック図である。 データ入力装置の一例を示す説明図である。
以下、本発明の実施形態を図面を参照して説明する。
実施形態1.
図1は、本発明による音声入出力装置の第1の実施形態の構成例を示すブロック図である。本実施形態の音声入出力装置10は、入力音量調整部11と、モニタ用音量調整部12と、出力音量調整部13と、制御部14と、入力音声分割部15と、入力部16と、出力部17とを備えている。
また、音声入出力装置10は、音声認識部18および音声合成部19と通信を行う。音声入出力装置10と、音声認識部18および音声合成部19との通信は、無線通信であってもよく、有線通信であってもよい。また、音声入出力装置10が、音声認識部18と音声合成部19とを備えていてもよい。本実施形態では、音声認識部18および音声合成部19は、音声入出力装置10とは別の装置に設けられているものとする。
入力部16は、利用者の音声や、周囲の音を入力する入力装置である。入力部16は、例えば、マイクロフォンにより実現される。入力部16は、入力された音声を、入力音量調整部11に入力する。入力部16は、入力された音声を表すアナログ信号をそのまま入力音量調整部11に入力してもよい。また、入力部16は、アナログ信号で表わされる音声をA/D(Analog/Digital )変換し、変換後のデジタル信号を入力音量調整部11に入力してもよい。
入力音量調整部11は、入力部16に入力された音声の音量を調整する。入力音量調整部11は、音量の指定に用いられる操作パネルなどの音量指定部(図示せず)を含み、音量指定部に対する利用者の操作に応じて入力音量を調整する。
例えば、入力音声がデジタル信号に変換されている場合、入力音量調整部11は、デジタル信号が示す値を増減させることで音量を調整してもよい。また、入力部16から入力された音声がアナログ信号であった場合、入力音量調整部11は、入力された音声をA/D変換する際に音量の調整を行ってもよい。なお、音量を調整する方法は広く知られているため、詳細な説明は省略する。入力音量調整部11は、調整した音量の入力音声を入力音声分割部15に入力する。
入力音声分割部15は、入力音量調整部11が調整した音量の入力音声を、音声認識部18が音声認識処理に用いる音声(以下、音声認識用音声と記す)と、入力音声のモニタに用いられる音声(以下、モニタ音声)とに分割する。具体的には、入力音声分割部15は、入力音量調整部11から入力された入力音声を示すデジタルデータを複製し、複製したデジタルデータを音声認識部18およびモニタ用音量調整部12にそれぞれ入力する。
なお、入力音声分割部15は、利用者からモニタ機能の有無を示す指示を受け付けるようにしてもよい。例えば、利用者から「モニタ機能有り」を示す指示を受け付けた場合に、入力音声分割部15は、入力音声をモニタ用音量調整部12に入力するようにしてもよい。一方、利用者から「モニタ機能なし」を示す指示を受け付けた場合に、入力音声分割部15は、入力音声をモニタ用音量調整部12に入力しないようにしてもよい。
また、本実施形態では、入力音量調整部11が音量調整後の入力音声を入力音声分割部15に入力し、入力音声分割部15が音声認識部18およびモニタ用音量調整部12にそれぞれ入力音声を入力する場合について説明する。なお、入力音量調整部11が入力音声分割部15の機能を備えていてもよい。すなわち、入力音量調整部11が、音声認識部18およびモニタ用音量調整部12にそれぞれ入力音声を入力してもよい。
モニタ用音量調整部12は、入力音量調整部11と同様、入力音声分割部15から入力されたモニタ音声の音量を調整する。すなわち、モニタ用音量調整部12は、利用者による指示に応じてモニタ音声の音量を調整してもよい。また、モニタ用音量調整部12は、後述する制御部14の指示に応じて、モニタ音声の音量を調整する。なお、利用者による音量調整の指示と、制御部14による音量調整の指示の両方あった場合、モニタ用音量調整部12は、制御部14による指示を優先する。モニタ用音量調整部12は、調整した音量のモニタ音声を出力音量調整部13に入力する。
音声認識部18は、入力音声分割部15から入力された音声に基づいて音声認識処理を行う。そして、音声認識部18は、音声認識結果を音声合成部19に入力する。音声認識部18は、一般的な方法を用いて音声認識処理を行う。例えば、音声認識部18は、音声認識結果をテキスト化し、作成したテキストを音声合成部19に入力してもよい。ここでは、音声認識処理の詳細な説明は省略する。
音声合成部19は、音声認識部18から入力される音声認識結果から合成音声を生成する。そして、音声合成部19は、生成した合成音声を出力音量調整部13に入力する。音声合成部19は、一般的な方法を用いて音声合成処理を行う。ここでは、音声合成処理の詳細な説明は省略する。
出力音量調整部13は、入力音量調整部11と同様、音声合成部19から入力された合成音声と、モニタ用音量調整部12から入力されたモニタ音声を合わせた音声(以下、出力音声と記す。)の音量を調整する。すなわち、出力音量調整部13は、音量の指定に用いられる操作パネルなどの音量指定部(図示せず)を含み、音量指定部に対する利用者の操作に応じて出力音量を調整する。
出力音量調整部13は、音量調整後の出力音声を出力部17に入力する。出力音量調整部13は、出力音声をD/A変換し、変換後のアナログ信号を出力部17に入力してもよい。また、出力音量調整部13は、音量調整後の出力音声を示すデジタル信号をそのまま出力部17に入力してもよい。ただし、その場合は出力部17にD/A変換器が含まれる。
出力部17は、出力音量調整部13から入力された出力音声を出力する。出力部17は、例えば、スピーカにより実現される。
制御部14は、モニタ用音量調整部12にモニタ音声の音量調整を指示する。具体的には、制御部14は、入力部16に入力される入力音声の音量に対し、出力部17が出力する出力音声の音量の増幅率が1を超えないようにモニタ音声の音量を調整する指示をモニタ用音量調整部12に行う。
ハウリングは、出力された音声が増幅されることにより発生する。すなわち、入力音声の音量に対する出力音声の音量の増幅率が1を超えなければハウリングを防止できる。そこで、音量の増幅率が1を超えないように制御することで、ハウリングを防止できる。
具体的には、制御部14は、入力音量調整部11、モニタ用音量調整部12および出力音量調整部13から、各調整部において音量の増減させる割合(増幅率)を示す情報(以下、音量情報と記すこともある。)を受け取る。そして、制御部14は、受け取った各調整部の増幅率に基づいて、入力音声の音量に対する出力音声の音量の増幅率が1を超えないように、モニタ用音量調整部12の増幅率を調整する。
図2は、音量の増幅率の関係を示す説明図である。ここで、入力音量調整部11で調整される増幅率をC、モニタ用音量調整部12で調整される増幅率をC、出力音量調整部13で調整される増幅率をCとする。また、入力音量調整部11に入力される音声の音量をi、入力音量調整部11から出力されてモニタ用音量調整部12に入力される音声の音量をi、モニタ用音量調整部12から出力されて出力音量調整部13に入力される音声の音量をi、出力音量調整部13から出力される音量をiとする。
また、出力部17から出力された音声に対し、入力部16に入力される音声の増幅率をCとする。増幅率Cは、出力部17(スピーカ)の特性や、出力部17(スピーカ)から入力部16(マイクロフォン)までの伝達特性、入力部16(マイクロフォン)の特定などにより決定される。増幅率Cには、実測した値を使用してもよいが、出力部17から出力された音が入力部16に漏れ込む間に増幅回路が存在しない場合、エネルギーは減衰するため、増幅率Cの最大値は1と仮定できる。
この場合、i=C,i=C=C,i=C=C,i=C<iが成り立つ。ここで、i>iを満たす必要があることから、i>i=C、すなわち、C<1を満たせばよい。したがって、制御部14は、C<(1/C)の条件を満たすように、モニタ用音量調整部12の増幅率を調整すればよい。
具体的には、C<(1/C)を満たす間は、モニタ用音量調整部12は、利用者による音量調整の指示に従って増幅率を調整すればよい。一方、C<(1/C)を満たさない増幅率Cが指示された場合、制御部14は、C<(1/C)を増幅率にするよう、モニタ用音量調整部12に指示する。
入力音量調整部11と、モニタ用音量調整部12と、出力音量調整部13と、制御部14とは、プログラム(音声入出力用プログラム)に従って動作するコンピュータのCPUによって実現される。例えば、プログラムは、音声入出力装置10の記憶部(図示せず)に記憶され、CPUは、そのプログラムを読み込み、プログラムに従って、入力音量調整部11、モニタ用音量調整部12、出力音量調整部13および制御部14として動作してもよい。
また、入力音量調整部11と、モニタ用音量調整部12と、出力音量調整部13と、制御部14とは、それぞれが専用のハードウェアで実現されていてもよい。具体的には、入力音量調整部11と、モニタ用音量調整部12と、出力音量調整部13とは、それぞれ、音量の指定に用いられる操作パネルなどの音量指定部(図示せず)を含んでいてもよい。
次に、本実施形態の音声入出力装置の動作を説明する。図3は、本実施形態の音声入出力装置の動作例を示すフローチャートである。
利用者が入力部16に音声を入力すると(ステップS1)、入力部16は、入力音声を入力音量調整部11に入力する(ステップS2)。入力音量調整部11は、入力音声を利用者によって指定された音量に調整する(ステップS3)。入力音声分割部15は、入力音量調整部11が調整した音量の入力音声を、音声認識用音声とモニタ音声とに分割する(ステップS4)。そして、入力音声分割部15は、音声認識用音声を音声認識部18に送信し、モニタ音声をモニタ用音量調整部12に入力する。このとき、入力音声分割部15は、音声認識用音声を音声認識部18に無線送信してもよい。
音声認識部18は、受信した入力音声の音声認識を行う(ステップS21)。そして、音声合成部19は、音声認識部18による音声認識結果から合成音声を生成し(ステップS22)、生成した合成音声を出力音量調整部13に入力する(ステップS23)。
一方、モニタ用音量調整部12は、利用者によって、モニタ音声の音量が指定されている場合、指定された音量にモニタ音声を調整する(ステップS5)。
さらに、制御部14は、入力部16に入力される入力音声の音量に対し、出力部17が出力する出力音声の音量の増幅率が1を超えているか否かを判断する(ステップS6)。増幅率が1を超えている場合(ステップS6におけるYES)、制御部14は、増幅率が1を超えないようにモニタ音声の音量を調整する指示をモニタ用音量調整部12に行う(ステップS7)。この場合、モニタ用音量調整部12は、制御部14による指示に応じて、モニタ音声の音量を調整し(ステップS8)、音量調整後のモニタ音声を出力音量調整部13に入力する(ステップS9)。
一方、増幅率が1を超えていない場合(ステップS5におけるNO)、制御部14は、モニタ用音量調整部12に対する指示を行わない。すなわち、モニタ用音量調整部12は、利用者により指定された音量のモニタ音声を出力音量調整部13に入力する(ステップS9)。
出力音量調整部13は、合成音声とモニタ音声とを合わせた出力音声の音量を、利用者によって指定された音量に調整する(ステップS10)。出力音量調整部13は、音量調整後の出力音声を出力部17に入力する。出力部17は、音量調整後の出力音声を出力する(ステップS11)。
以上のように、本実施形態によれば、入力音量調整部11が、入力部16に入力される入力音声の音量を調整し、入力音声分割部15が、調整された音量の入力音声を、音声認識用音声とモニタ用音声とに分割する。また、モニタ用音量調整部12が、モニタ用音声の音量を調整し、出力音量調整部13が、合成音声と音量調整されたモニタ音声とを合成した出力音声の音量を調整して出力部17に出力させる。そして、制御部14が、入力音声の音量に対する出力音声の音量の増幅率が1を超えないようにモニタ音声の音量を調整する。
よって、入力音声を音声認識した結果を入力音声と共にモニタする場合に、入力音声の音声認識精度の低下を抑制し、かつ入力音声を音声認識した結果出力される合成音声が聞き取りづらくなることを抑制しつつ、ハウリングを容易に防止できる。
実施形態2.
図4は、本発明による音声入出力装置の第2の実施形態の構成例を示すブロック図である。なお、第1の実施形態と同様の構成については、図1と同一の符号を付し、説明を省略する。
本実施形態の音声入出力装置20は、2つ以上の入力部16(入力部16a,b)、各入力部16に対応する入力音量調整部11(入力音量調整部11a,b)および各入力音量調整部11に対応するモニタ用音量調整部12(モニタ用音量調整部12a,b)を備える点において第1の実施形態における音声入出力装置10と異なる。それ以外については、第1の実施形態と同様である。
なお、図4には、入力部16、入力音量調整部11およびモニタ用音量調整部12をそれぞれ2つ例示しているが、入力部16、入力音量調整部11およびモニタ用音量調整部12の数は2つに限定されず、3つ以上であってもよい。
また、図4には、入力部16ごとにモニタ用音量調整部12を備える場合を例示しているが、入力音声ごとに分割されたモニタ用音声の音量を調整できれば、モニタ用音量調整部12は、1つであってもよい。
本実施形態においても、入力音声の音量に対する出力音声の音量の増幅率が1を超えなければハウリングを防止できる。したがって、入力音声の音量は、入力部16ごとに考慮すればよい。すなわち、制御部14は、各入力音声の音量に対する出力音声の音量の増幅率が1を超えないようにモニタ音声の音量の調整指示をモニタ用音量調整部12に対して行う。
ここで、入力音量調整部11a,bで調整される増幅率をそれぞれC1a,C1b、モニタ用音量調整部12a,bで調整される増幅率をそれぞれC2a,C2b、出力音量調整部13で調整される増幅率をCとする。また、入力音量調整部11a,bに入力される音声の音量をそれぞれi0a,i0b、入力音量調整部11a,bから出力されてモニタ用音量調整部12に入力される音声の音量をそれぞれi1a,i1b、モニタ用音量調整部12a,bから出力されて出力音量調整部13に入力される音声の音量をそれぞれi2a,i2b、出力音量調整部13から出力される音量をiとする。
また、出力部17から出力された音声が、入力部16a,bにそれぞれ音量iで入力されるものとする。すなわち、出力部17から出力された音声に対し、入力部16に入力される音声の増幅率を1と仮定する。この場合、i0a>iおよびi0b>iを満たす必要がある。第1の実施形態と同様に整理すると、以下の式が得られる。
(1−C1a2a)(1−C1b2b)>(C1a2a)(C1b2b
すなわち、
(C1a2a+C1b2b)C<1
したがって、制御部14は、上記式を満たすように、モニタ用音量調整部12a,bの増幅率を調整すればよい。
また、本実施形態においても、入力音声分割部15が、利用者からモニタ機能の有無を示す指示を受け付けるようにしてもよい。例えば、利用者から入力部16に対応する入力音声分割部15に対して「モニタ機能有り」を示す指示を受け付けた場合に、その入力音声分割部15は、対応する入力部16に入力される入力音声をモニタ用音量調整部12に入力するようにしてもよい。一方、利用者から入力部16に対応する入力音声分割部15に対して「モニタ機能なし」を示す指示を受け付けた場合に、その入力音声分割部15は、対応する入力部16に入力される入力音声をモニタ用音量調整部12に入力しないようにしてもよい。
また、本実施形態では、入力部16ごとに入力音声分割部15を備えている場合について説明しているが、入力音声分割部15は1つであってもよい。この場合、入力音声分割部15は、モニタする音声が入力される入力部16を指定するスイッチを備え、そのスイッチで指定された入力部16に入力される音声のみをモニタ用音量調整部12に入力するようにしてもよい。
すなわち、本実施形態では、複数の入力部16(マイクロフォン)が存在する場合、入力部16を選択してモニタ音声を出力するようにしてもよい。なお、入力部16が1つ選択された場合は、第1の実施形態と同様になる。
以上のように、本実施形態では、複数の入力音量調整部11が、各入力部16に入力される入力音声の音量を調整する。また、モニタ用音量調整部12が、入力音声ごとに分割されたモニタ用音声の音量を調整する。そして、制御部14が、各入力音声の音量に対する出力音声の音量の増幅率が1を超えないようにモニタ音声の音量調整の指示をモニタ用音量調整部12に行う。よって、第1の実施形態の効果に加え、複数の入力装置から入力される複数の入力音声を利用して処理を行う場合にも、ハウリングを防止できる。
実施形態3.
図5は、本発明による音声入出力装置の第3の実施形態の構成例を示すブロック図である。なお、第1の実施形態と同様の構成については、図1と同一の符号を付し、説明を省略する。
本実施形態の音声入出力装置30は、2つ以上の出力部17(出力部17c,17d)、各出力部17に対応する出力音量調整部13(出力音量調整部13c,d)および各出力音量調整部13に対応するモニタ用音量調整部12(モニタ用音量調整部12c,d)を備える点において第1の実施形態における音声入出力装置10と異なる。それ以外については、第1の実施形態と同様である。
なお、図5には、出力部17、出力音量調整部13およびモニタ用音量調整部12をそれぞれ2つ例示しているが、出力部17、出力音量調整部13およびモニタ用音量調整部12の数は2つに限定されず、3つ以上であってもよい。
また、図5には、出力部17ごとにモニタ用音量調整部12を備える場合を例示しているが、出力部17ごとにモニタ用音声の音量を調整できれば、モニタ用音量調整部12は、1つであってもよい。
本実施形態において、入力音声の音量に対し、各出力部17から出力される出力音声の合計音量の増幅率が1を超えなければハウリングを防止できる。したがって、入力音声の音量は、出力部17から出力される音声の音量の合計を考慮すればよい。すなわち、制御部14は、入力音声の音量に対し、各出力部17から出力される出力音声の音量の合計の増幅率が1を超えないようにモニタ音声の音量の調整指示をモニタ用音量調整部12に対して行う。
ここで、入力音量調整部11で調整される増幅率をC、モニタ用音量調整部12c,dで調整される増幅率をそれぞれC2c,C2d、出力音量調整部13c,dで調整される増幅率をそれぞれC3c,C3dとする。また、入力音量調整部11に入力される音声の音量をi、入力音量調整部11から出力されてモニタ用音量調整部12c,dに入力される音声の音量をi、モニタ用音量調整部12c,dから出力されて出力音量調整部13c,dに入力される音声の音量をそれぞれi2c,i2d、出力音量調整部13c,dから出力される音量をそれぞれi3c,i3dとする。
また、出力部17c,dから出力された音声が、入力部16に音量i3c+i3dで入力されるものとする。すなわち、出力部17c,dから出力された音声に対し、入力部16に入力される音声の増幅率を1と仮定する。この場合、i>i3c+i3dを満たす必要がある。第1の実施形態と同様に整理すると、以下の式が得られる。
(C2c3c+C2d3d)<1
したがって、制御部14は、上記式を満たすように、モニタ用音量調整部12c,dの増幅率を調整すればよい。
また、本実施形態では、各出力音量調整部13が各出力部17への音声の出力有無を示す指示を受け付けるようにしてもよい。例えば、利用者から出力部17に対応する出力音量調整部13に対して「音声出力有り」を示す指示を受け付けた場合に、その出力音量調整部13は、対応する出力部17に合成音声を出力するようにしてもよい。一方、利用者から出力部17に対応する出力音量調整部13に対して「音声出力無し」を示す指示を受け付けた場合に、その出力音量調整部13は、対応する出力部17に合成音声を出力しないようにしてもよい。
以上のように、本実施形態によれば、複数の出力音量調整部13が、各出力部17から出力される出力音声の音量を調整する。また、モニタ用音量調整部12が、出力部17ごとにモニタ用音声の音量を調整する。そして、制御部14が、入力音声の音量に対し、各出力部17から出力される出力音声の合計音量の増幅率が1を超えないようにモニタ音声の音量調整の指示をモニタ用音量調整部12に行う。よって、第1の実施形態の効果に加え、複数の出力部から音声を出力する場合にも、ハウリングを防止できる。
実施形態4.
図6は、本発明による音声入出力装置の第4の実施形態の構成例を示すブロック図である。なお、第1〜3の実施形態と同様の構成については、図1、図4または図5と同一の符号を付し、説明を省略する。
本実施形態の音声入出力装置40は、制御部14と、2つ以上の入力部16(入力部16a,b)と、各入力部16に対応する入力音量調整部11(入力音量調整部11a,b)と、各入力音量調整部11に対応するモニタ用音量調整部12(モニタ用音量調整部12a,b)と、2つ以上の出力部17(出力部17c,17d)と、各出力部17に対応する出力音量調整部13(出力音量調整部13c,d)と、各出力音量調整部13に対応するモニタ用音量調整部12(モニタ用音量調整部12c,d)を備えている。
複数の入力部16に対して音声が入力される場合の処理は、第2の実施形態と同様である。また、複数の出力部17から音声が出力される場合の処理は、第3の実施形態と同様である
また、本実施形態では、音声を入力する入力部16と、合成音声を出力する出力部17の組を選択してモニタ音声を出力するようにしてもよい。例えば、各入力音声分割部15が、利用者からモニタ機能の有無を示す指示を受け付けるとともに、各出力音量調整部13が各出力部17への音声の出力有無を示す指示を受け付けることで、音声を入力する入力部16と、合成音声を出力する出力部17の組を選択してもよい。
このとき、モニタ用音量調整部12は、選択された入力部16に入力される入力音声ごとに分割されたモニタ用音声、および、選択された出力部17ごとにモニタ用音声の音量を調整してもよい。そして、制御部14は、選択された各入力部16に入力される入力音声の音量に対し、選択された出力部17から出力される出力音声の合計音量の増幅率が1を超えないようにモニタ音声の音量を調整する指示をモニタ用音量調整部12に行ってもよい。この場合、複数の入力音声を利用して処理が行われる場合であって、かつ、複数の出力部から音声を出力する場合にも、ハウリングを防止できる。
以下、具体的な実施例により本発明を説明するが、本発明の範囲は以下に説明する内容に限定されない。
図7は、本実施例の音声入出力装置の例を示す説明図である。本実施例の音声入出力装置50は、入力部と出力部とが一つの筐体に収まっている。具体的には、音声入出力装置50は、入力部として2つのマイクロフォン56a,56bと、出力部として1つのスピーカ57とを備えている。2つのマイクロフォン56a,56bのうち、1つのマイクロフォン56aは、利用者の口元に配置され、もう1つのマイクロフォン56bは、利用者の耳元に配置される。また、スピーカ57も利用者の耳元に配置される。
また、音声認識および音声合成を行う音声認識装置60が存在し、音声入出力装置50は、マイクロフォン56a,56bに入力された音を無線通信で音声認識装置60に送信する。また、音声入出力装置50は、無線通信で受信した合成音声を音声認識装置60から受信する。
マイクロフォン56aは、特に利用者の音声の入力に用いられ、マイクロフォン56bは、周囲の雑音の入力に用いられる。音声認識装置60は、マイクロフォン56bに入力された周囲の雑音を、マイクロフォン56aに含まれる音から除去することで、利用者の音声を抽出する機能を有する。また、音声認識装置60は、利用者の音声を認識して合成音声を生成する機能を有する。このように、2つの音源から利用者の音声を抽出し、抽出した音声を認識して合成音声を生成する方法は広く知られているため、ここでは説明を省略する。
図8は、本実施例の音声入出力装置を含む音声認識システムの例を示す説明図である。マイクロフォン56aには、入力音量調整部51aが接続され、入力音量調整部51aには、入力音声分割部55aが接続される。入力音声分割部55aは、マイクロフォン56aに入力された音声を分割し、音声認識装置60とモニタ用音量調整部52aにそれぞれ入力音声を送信する。音声認識装置60は、音声認識した結果の合成音声を出力音量調整部53に無線送信する。また、モニタ用音量調整部52aは、モニタ音声を出力音量調整部53に送信する。
同様に、マイクロフォン56bには、入力音量調整部51bが接続され、入力音量調整部51bには、入力音声分割部55bが接続される。入力音声分割部55bは、マイクロフォン56bに入力された音声を分割し、音声認識装置60とモニタ用音量調整部52bにそれぞれ入力音声を送信する。音声認識装置60は、音声認識した結果の合成音声を出力音量調整部53に無線送信する。また、モニタ用音量調整部52bは、モニタ音声を出力音量調整部53に送信する。
出力音量調整部53は、調整後の出力音声をスピーカ57に入力する。そして、スピーカ57は、出力音声を出力する。このとき、制御部54は、モニタ用音量調整部52a,52bを制御する。
具体的には、制御部54は、マイクロフォン56aに入力される入力音声の音量よりもスピーカ57が出力する出力音声の音量の方が大きい場合、出力音声の音量が入力音声の音量以下になるようにモニタ音声の音量を調整する指示をモニタ用音量調整部52aに行う。
同様に、制御部54は、マイクロフォン56bに入力される入力音声の音量に対するスピーカ57が出力する出力音声の音量の増幅率が1を超える場合、増幅率が1を超えないようにモニタ音声の音量を調整する指示をモニタ用音量調整部52bに行う。
本実施例では、周囲の雑音を取得するためのマイクロフォン56bとスピーカ57とが利用者の耳元に近接して配置されている。このような場合、スピーカ57から出力される音がマイクロフォン56bにそのまま入力されやすく、ハウリングを起こしやすい。しかし、本実施例では、マイクロフォンに入力される入力音声の音量に対するスピーカが出力する出力音声の音量の増幅率が1を超える場合、増幅率が1を超えないようにモニタ音声の音量を調整するため、ハウリングが発生することを抑制できる。
次に、本発明の最小構成例を説明する。図9は、本発明による音声入出力装置の最小構成の例を示すブロック図である。本発明による音声入出力装置は、入力装置(例えば、入力部16、マイクロフォン)に入力される入力音声の音量を調整する入力音量調整手段81(例えば、入力音量調整部11)と、入力音量調整手段81により調整された音量の入力音声を、音声認識に用いられる音声である音声認識用音声と、入力音声のモニタに用いられる音声であるモニタ用音声とに分割する音声分割手段82(例えば、入力音声分割部15)と、モニタ用音声の音量を調整するモニタ音量調整手段83(例えば、モニタ用音量調整部12)と、音声認識用音声を音声認識した結果作成された情報から合成される音声である合成音声と、モニタ音量調整手段83によって音量調整されたモニタ音声とを合成した音声である出力音声の音量を調整して出力装置(例えば、出力部17、スピーカ)に出力させる出力音量調整手段84(例えば、出力音量調整部13)と、入力音声の音量に対する出力音声の音量の増幅率が1を超えないようにモニタ音声の音量を調整する指示をモニタ音量調整手段83に行う制御手段85(例えば、制御部14)とを備えている。
そのような構成により、入力音声を音声認識した結果を入力音声と共にモニタする場合に、入力音声の音声認識精度の低下を抑制し、かつ入力音声を音声認識した結果出力される合成音声が聞き取りづらくなることを抑制しつつ、ハウリングを容易に防止できる。
また、音声入出力装置は、2以上の入力装置ごとに設けられ、その入力装置ごとに入力される各入力音声の音量を調整する2以上の入力音量調整手段(例えば、入力音量調整部11a,b)を備えていてもよい。そして、モニタ音量調整手段83が、入力音声ごとに分割されたモニタ用音声の音量を調整し、制御手段85が、各入力音声の音量に対する出力音声の音量の増幅率が1を超えないようにモニタ音声の音量を調整する指示をモニタ音量調整手段83に行ってもよい。
そのような構成により、複数の入力装置から入力される複数の入力音声を利用して処理を行う場合にも、ハウリングを防止できる。
また、音声入出力装置は、2以上の出力装置ごとに設けられ、その出力装置ごとに出力される各出力音声の音量を調整する2以上の出力音量調整手段(例えば、出力音量調整部13c,d)を備えていてもよい。そして、モニタ音量調整手段83が、出力装置ごとにモニタ用音声の音量を調整し、制御手段85が、入力音声の音量に対し、各出力装置から出力される出力音声の合計音量の増幅率が1を超えないようにモニタ音声の音量を調整する指示をモニタ音量調整手段に行ってもよい。
そのような構成により、複数の出力部から音声を出力する場合にも、ハウリングを防止できる。
また、音声入出力装置は、入力音声の入力を受け付ける入力装置と合成音声を出力させる出力装置の組を選択する選択手段(例えば、入力音声分割部15,出力音量調整部13)を備えていてもよい。そして、モニタ音量調整手段83が、選択された入力装置に入力される入力音声ごとに分割されたモニタ用音声、および、選択された出力装置ごとにモニタ用音声の音量を調整してもよい。また、制御手段85が、選択された各入力装置に入力される入力音声の音量に対し、選択された出力装置から出力される出力音声の合計音量の増幅率が1を超えないようにモニタ音声の音量を調整する指示をモニタ音量調整手段83に行ってもよい。
そのような構成により、複数の入力音声を利用して処理が行われる場合であって、かつ、複数の出力部から音声を出力する場合にも、ハウリングを防止できる。
また、音声分割手段82は、音声認識用音声を無線を用いて音声認識装置に送信し、出力音量調整手段84は、無線を介して送信される合成音声を受信してもよい。
また、音声入出力装置は、音声認識用音声に基づいて音声認識を行う音声認識手段(例えば、音声認識部18)と、音声認識手段による音声認識の結果から合成音声を作成し、作成した合成音声を出力音量調整手段84に入力する音声合成手段(例えば、音声合成部19)とを備えていてもよい。この場合、音声入出力装置は、音声認識装置としての役割を果たす。
また、入力装置としてのマイクロフォンと、出力装置としてのスピーカとが1つの筐体に収納されていてもよい。
以上、実施形態及び実施例を参照して本願発明を説明したが、本願発明は上記実施形態および実施例に限定されるものではない。本願発明の構成や詳細には、本願発明のスコープ内で当業者が理解し得る様々な変更をすることができる。
この出願は、2011年11月9日に出願された日本特許出願2011−245615を基礎とする優先権を主張し、その開示の全てをここに取り込む。
本発明は、入力した音声と、その音声を音声認識した結果とを出力する際のハウリングを防止する音声入出力装置に好適に適用される。
10,20,30,40,50 音声入出力装置
11,11a,11b 入力音量調整部
12,12a,12b,12c,12d モニタ用音量調整部
13,13c,13d 出力音量調整部
14 制御部
15,15a,15b 入力音声分割部
16,16a,16b 入力部
17,17c,17d 出力部
18 音声認識部
19 音声合成部

Claims (9)

  1. 入力装置に入力される入力音声の音量を調整する入力音量調整手段と、
    前記入力音量調整手段により調整された音量の入力音声を、音声認識に用いられる音声である音声認識用音声と、前記入力音声のモニタに用いられる音声であるモニタ用音声とに分割する音声分割手段と、
    前記モニタ用音声の音量を調整するモニタ音量調整手段と、
    前記音声認識用音声を音声認識した結果作成された情報から合成される音声である合成音声と、前記モニタ音量調整手段によって音量調整されたモニタ音声とを合成した音声である出力音声の音量を調整して出力装置に出力させる出力音量調整手段と、
    前記入力音声の音量に対する前記出力音声の音量の増幅率が1を超えないように前記モニタ音声の音量を調整する指示を前記モニタ音量調整手段に行う制御手段とを備えた
    ことを特徴とする音声入出力装置。
  2. 2以上の入力装置ごとに設けられ、当該入力装置ごとに入力される各入力音声の音量を調整する2以上の入力音量調整手段を備え、
    モニタ音量調整手段は、入力音声ごとに分割されたモニタ用音声の音量を調整し、
    制御手段は、前記各入力音声の音量に対する出力音声の音量の増幅率が1を超えないようにモニタ音声の音量を調整する指示を前記モニタ音量調整手段に行う
    請求項1記載の音声入出力装置。
  3. 2以上の出力装置ごとに設けられ、当該出力装置ごとに出力される各出力音声の音量を調整する2以上の出力音量調整手段を備え、
    モニタ音量調整手段は、前記出力装置ごとにモニタ用音声の音量を調整し、
    制御手段は、入力音声の音量に対し、前記各出力装置から出力される出力音声の合計音量の増幅率が1を超えないようにモニタ音声の音量を調整する指示を前記モニタ音量調整手段に行う
    請求項1または請求項2記載の音声入出力装置。
  4. 入力音声の入力を受け付ける入力装置と合成音声を出力させる出力装置の組を選択する選択手段を備え、
    モニタ音量調整手段は、選択された入力装置に入力される入力音声ごとに分割されたモニタ用音声、および、選択された出力装置ごとにモニタ用音声の音量を調整し
    制御手段は、前記選択された各入力装置に入力される入力音声の音量に対し、選択された出力装置から出力される出力音声の合計音量の増幅率が1を超えないようにモニタ音声の音量を調整する指示を前記モニタ音量調整手段に行う
    請求項2または請求項3記載の音声入出力装置。
  5. 音声分割手段は、音声認識用音声を無線を用いて音声認識装置に送信し、
    出力音量調整手段は、無線を介して送信される合成音声を受信する
    請求項1から請求項4のうちのいずれか1項に記載の音声入出力装置。
  6. 音声認識用音声に基づいて音声認識を行う音声認識手段と、
    前記音声認識手段による音声認識の結果から合成音声を作成し、作成した合成音声を出力音量調整手段に入力する音声合成手段とを備えた
    請求項1から請求項4のうちのいずれか1項に記載の音声入出力装置。
  7. 入力装置としてのマイクロフォンと、出力装置としてのスピーカとが1つの筐体に収納されている
    請求項1から請求項6のうちのいずれか1項に記載の音声入出力装置。
  8. 入力装置に入力される入力音声の音量を調整し、
    調整された音量の入力音声を、音声認識に用いられる音声である音声認識用音声と、前記入力音声のモニタに用いられる音声であるモニタ用音声とに分割し、
    前記モニタ用音声の音量を調整し、
    前記音声認識用音声を音声認識した結果作成された情報から合成される音声である合成音声と、音量調整された前記モニタ音声とを合成した音声である出力音声の音量を調整して出力装置に出力させ、
    前記入力音声の音量に対する前記出力音声の音量の増幅率が1を超えないように前記モニタ音声の音量を調整する
    ことを特徴とするハウリング防止方法。
  9. コンピュータに、
    入力装置に入力される入力音声の音量を調整する入力音量調整処理、
    前記入力音量調整処理で調整された音量の入力音声を、音声認識に用いられる音声である音声認識用音声と、前記入力音声のモニタに用いられる音声であるモニタ用音声とに分割する音声分割処理、
    前記モニタ用音声の音量を調整するモニタ音量調整処理、
    前記音声認識用音声を音声認識した結果作成された情報から合成される音声である合成音声と、前記モニタ音量調整処理で音量調整されたモニタ音声とを合成した音声である出力音声の音量を調整して出力装置に出力させる出力音量調整処理、および、
    前記入力音声の音量に対する前記出力音声の音量の増幅率が1を超えないように前記モニタ音声の音量の調整を行う制御処理
    を実行させるためのハウリング防止用プログラム。
JP2013542824A 2011-11-09 2012-10-31 音声入出力装置、ハウリング防止方法およびハウリング防止用プログラム Expired - Fee Related JP6020461B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2011245615 2011-11-09
JP2011245615 2011-11-09
PCT/JP2012/006985 WO2013069229A1 (ja) 2011-11-09 2012-10-31 音声入出力装置、ハウリング防止方法およびハウリング防止用プログラム

Publications (2)

Publication Number Publication Date
JPWO2013069229A1 JPWO2013069229A1 (ja) 2015-04-02
JP6020461B2 true JP6020461B2 (ja) 2016-11-02

Family

ID=48289173

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013542824A Expired - Fee Related JP6020461B2 (ja) 2011-11-09 2012-10-31 音声入出力装置、ハウリング防止方法およびハウリング防止用プログラム

Country Status (3)

Country Link
US (1) US9355648B2 (ja)
JP (1) JP6020461B2 (ja)
WO (1) WO2013069229A1 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11064009B2 (en) * 2015-08-19 2021-07-13 Honeywell International Inc. Augmented reality-based wiring, commissioning and monitoring of controllers
US11195542B2 (en) * 2019-10-31 2021-12-07 Ron Zass Detecting repetitions in audio data
CN109862474B (zh) * 2018-12-22 2020-12-18 深圳唐恩科技有限公司 防啸叫的无线合唱方法、存储介质、控制装置及k歌宝

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2958930B2 (ja) 1992-08-27 1999-10-06 株式会社ケンウッド カラオケ装置
JP4330302B2 (ja) * 2001-09-27 2009-09-16 日産自動車株式会社 音声入出力装置
US7099821B2 (en) * 2003-09-12 2006-08-29 Softmax, Inc. Separation of target acoustic signals in a multi-transducer arrangement
JP4360212B2 (ja) 2004-01-27 2009-11-11 ブラザー工業株式会社 カラオケ装置
JP2009094707A (ja) * 2007-10-05 2009-04-30 Sony Corp 音声信号処理装置、音声信号処理方法
US20120263317A1 (en) * 2011-04-13 2012-10-18 Qualcomm Incorporated Systems, methods, apparatus, and computer readable media for equalization

Also Published As

Publication number Publication date
US20140324418A1 (en) 2014-10-30
US9355648B2 (en) 2016-05-31
WO2013069229A1 (ja) 2013-05-16
JPWO2013069229A1 (ja) 2015-04-02

Similar Documents

Publication Publication Date Title
US10382853B2 (en) Method and device for voice operated control
US8781836B2 (en) Hearing assistance system for providing consistent human speech
JP2016519906A (ja) オーディオ・ヘッドセット用のマルチモード適応雑音消去のためのシステム及び方法
US20210375303A1 (en) Natural Ear
JP2013501969A (ja) 方法、システム及び機器
JP2009246870A (ja) 通信端末、通信端末の音声出力調整方法
US11489966B2 (en) Method and apparatus for in-ear canal sound suppression
JP6020461B2 (ja) 音声入出力装置、ハウリング防止方法およびハウリング防止用プログラム
JP2012163692A (ja) 音声信号処理システム、音声信号処理方法および音声信号処理方法プログラム
US20220122605A1 (en) Method and device for voice operated control
KR101422838B1 (ko) 외부음 청취가 가능한 음원출력장치 및 휴대용 전자기기그리고 그 방법
JP2007219241A (ja) 音声処理装置、音声処理プログラム
JP2010068292A (ja) 音声出力装置、プロジェクタ、プログラムおよび情報記憶媒体
JP2002223500A (ja) モバイルフィッティングシステム
JP5842364B2 (ja) 音量制御装置及び音量制御方法
JP2008040431A (ja) 音声加工装置
JP2018163304A (ja) 信号処理装置およびアクティブノイズキャンセルシステム
JP4527654B2 (ja) 音声通信装置
JP4457986B2 (ja) 語学学習システム及び端末装置
JP2008224816A (ja) カラオケ装置
JP4077436B2 (ja) 補聴器調整システム及び補聴器調整装置
KR101976091B1 (ko) 청각 기기의 동작 모드를 결정하는 방법 및 청각 기기
JP2017173677A (ja) カラオケ装置
JP2003037650A (ja) 携帯電話機
JP2012049634A (ja) 音量調節システムおよび発音システム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20150908

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160906

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160919

R150 Certificate of patent or registration of utility model

Ref document number: 6020461

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees