JP2004514926A - 音響出力手段を備えたデバイスの制御方法 - Google Patents
音響出力手段を備えたデバイスの制御方法 Download PDFInfo
- Publication number
- JP2004514926A JP2004514926A JP2002544708A JP2002544708A JP2004514926A JP 2004514926 A JP2004514926 A JP 2004514926A JP 2002544708 A JP2002544708 A JP 2002544708A JP 2002544708 A JP2002544708 A JP 2002544708A JP 2004514926 A JP2004514926 A JP 2004514926A
- Authority
- JP
- Japan
- Prior art keywords
- signal
- command signal
- volume
- output
- command
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 27
- 230000009467 reduction Effects 0.000 claims description 7
- 230000008859 change Effects 0.000 claims description 4
- 238000011144 upstream manufacturing Methods 0.000 claims description 3
- 230000007704 transition Effects 0.000 claims description 2
- 230000005236 sound signal Effects 0.000 description 8
- 238000012546 transfer Methods 0.000 description 6
- 230000004044 response Effects 0.000 description 5
- 230000000694 effects Effects 0.000 description 4
- 230000003044 adaptive effect Effects 0.000 description 3
- 238000011038 discontinuous diafiltration by volume reduction Methods 0.000 description 3
- 238000001914 filtration Methods 0.000 description 3
- 230000009471 action Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000002592 echocardiography Methods 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 241000282414 Homo sapiens Species 0.000 description 1
- 230000003213 activating effect Effects 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000002238 attenuated effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000010079 rubber tapping Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Circuit For Audible Band Transducer (AREA)
- Selective Calling Equipment (AREA)
- Control Of Amplification And Gain Control (AREA)
Abstract
Description
本発明は、音響出力を含むデバイスを音響的な指令信号により制御する方法に関する。更に、本発明は、音響出力手段と、指令信号を受信する受信手段と、これらの指令信号を認識する認識手段と、認識した指令信号との関係でデバイスを制御する制御手段とを有するデバイスに関する。
【0002】
特に民生電子機器の分野のデバイスにおいて、デバイスの使用に対する選択及びユーザフレンドリ性を向上させ、それによりデバイスをより魅力的なものとするために、ますます多くのデバイスが、音響的な指令信号によりその制御が可能となるようにされている。例えば、アラーム付き時計や電灯のような切換可能なデバイスは、長年、市場で入手可能な状態であり、拍手の音や口笛の音のような非常に単純な音響的な指令信号により、スイッチのオンオフが行われ、若しくは異なるモード間の切り替えが行われている。音声認識システムの発展に伴い、多様な声を指令信号として受信及び認識するデバイスが入手可能となっており、かかるデバイスの複雑な制御が可能となる。かかる音声制御型デバイスは、操作者が手を用いることなく各々のデバイスを操作できるので、非常に便利である。この制御方法は、結果的に、例えば操作者が音量やチャンネルを変更するためにステアリングホイールを離さなければならない車両用ラジオの制御の場合のような、操作者が他の動作のために手を必要とする場合であれば如何なる場合も、顕著な効果を奏する。更に、本方法は、デバイス操作に関して一層魅力的なものとなる。この理由は、かかる音声制御が、人間−機械インターフェース(MMI)によって、ボタンやコントローラにより操作である、機械との従前の通信水準から、音声を介した情報の伝達である、人類にとって標準的な通信水準への移行を可能とさせるためである。しかしながら、例えばCDプレーヤ、テレビジョン、ビデオプレーヤ、コンピューター等のようなあらゆるオーディオ若しくはオーディオヴィジュアルデバイスといった、音声出力手段を含むデバイスの制御に関して、それらの機能自身が音響信号を生成することから、問題点が生じる。オーディオ機能を備えたデバイスを用いると、指令信号を識別するよう設計された認識手段は、指令信号のみならず、デバイス自身により生成される音響的な出力信号(例えば、CDプレーヤ上で演奏される音楽)をも音響エコーとして受信することになる。デバイス自信の出力信号は、結果的に、背景雑音の態様で指令信号の下に存在する。指令信号若しくはデバイス自信の出力信号の音量に依存して、これは、指令信号を認識する際に重大な問題点をもたらすことになる。
【0003】
いわゆる“AEC法”(音響エコー消去)が、かかるデバイスの認識性能を改善するために従来的に使用されている。このアプローチを用いると、デバイス自身によって生成される出力信号は、室内(ルーム)インパルス応答信号を推定するため、即ちデバイスが配置される室内での出力信号の反射に起因して検出手段により再度検出される信号を推定するために使用される。これは、いわゆる“適応フィルタ法”により実現され、この場合、伝達関数が反復的に決定され、それにより元の出力信号が変換され、次いでかくして変換された出力信号が、受信した全体の入力信号からフィルタで除去される。この方法は、反復法が永久的に継続するほどまで適応し、かくして伝達関数の変化に伴って生じる室内の変化が検出される。例えば、音響エコーの変化は、室内のカーテンが開閉された場合、ドアが開けられた場合、若しくは人が室内で動いた場合に生じうる。一般的には、この方法は成功している。しかしながら、音声認識システムの精度はデバイス自身の出力信号の音量が増加する場合に著しく低下することがわかっている。この理由は、適応AECフィルタは、室内特性を最適にモデル化できず、それ故に、音響エコーのフィルタ除去後の信号の干渉が、デバイス自身の音量に略比例するためである。
【0004】
本発明の目的は、音響的な出力信号を自身が生成するデバイスの音響的制御のための簡易でユーザフレンドリな方法、及び、指令信号の認識精度が従来技術に比して改善された関連デバイスを提供することにある。
【0005】
上記目的は、請求項1の方法及び請求項10のデバイスによって達成される。
【0006】
本発明によれば、予想される音響的な指令信号が送信されているとデバイスが認識すると同時に、音量がデバイス自身によって速やかに下げられる。デバイスの音量を自動的に下げることによって、デバイスに対する指令信号は、より小さな音響エコーに起因してより容易且つより確実に認識されることになる。更に、通常的には、オーディオデバイスがあまりうるさくないときに発声することにユーザは賛成できる。更に、いわゆる“ロンバード効果”も音量の低減により低減され、この効果は、背景雑音に抗して話す必要があるとき、人は自然に異なる態様で、例えばより大きな声で且つより注意深い発音で、話すことを意味し、音声認識システムの認識性能に必然的に影響を及ぼすものである。
【0007】
本発明による適切なデバイスは、音響出力手段と、従来的なマイクロフォンのような、音響的な指令信号を受信する受信手段とを第1に含み、これらの指令信号を認識する認識手段と、認識した指令信号との関係でデバイスを制御する制御手段とを更に含む。更に、デバイスは、デバイスに対する予想される指令信号を受信手段が受信していることを認識するのに適した手段を、デバイスに対する予想される指令信号の受信が認識されると同時に音響出力手段による出力信号の音量を低減する適切な手段と共に、含まなければならない。
【0008】
指令信号がデバイスに向けられているという認識は、種々の方法で実現されてよい。例えば、デバイスは、ユーザにより所定の音量及び/又はピッチ及び/又は音声方向で話される言葉を予想される指令信号として認識すると共に、次いで音量を低減するように構成若しくは調整されてよい。
【0009】
特に簡易で好ましい実施例では、キー指令信号が本来の指令信号の前に送信され、当該キー指令信号が認識されたときに音量が低減される。このキー指令信号が、更なる指令信号を受信するための準備状態にデバイスを調整する、即ち各々のデバイスの制御手段を初期的に活性化する指令信号そのものであることは有効である。かかる“活性化信号”は、多くの場合いずれ必要となり、この理由は、この方法によって、ユーザにより意図せずに出力される指令信号(例えば、特に会話中の言葉や他の背景雑音)を、デバイスが認識及び受信してしまい、ひいては実際には望んでいない制御動作を実行してしまうことを防止できるためである。特に、かかるキー指令信号は、複数の音声制御型デバイスが、類似若しくは同一の指令信号を受信する同一領域内に存在する場合に意味がある。かかる場合、特定の指令信号が意図されるデバイスは、適切な先行のキー指令信号によりアドレス指定される必要がある。従って、例えば音声制御型コンピューター及びテレビジョンは、隣接して配置されうり、デバイスに対する指令信号には、キー指令信号である“コンピューター”若しくは“TV”がそれぞれ前置される。
【0010】
また、キー指令信号の認識と同時に行われる、デバイスの出力信号の音量の自動的な低減は、各々のデバイスが、更なる指令信号を受けるための準備状態、いわゆるユーザに“耳を傾ける”状態となったことを、ユーザが同時に知ることができるという、効果を奏する。デバイスは、任意的にまた追加的に、可視的若しくは音響的なキー指令信号の受信の確認を出力してよい。
【0011】
音量低減は、好ましくは、例えばキー指令信号に後続する、指令信号が認識された後に自動的に再度実行される。これは、例えば、指令信号が各キー指令信号の直後に受信されることを意味する。代替的に、キー指令信号若しくは指令信号の認識後ある一定時間経過後に、音量を先に設定された音量に自動的に再調整することも可能である。かかる場合、指令信号の受信後ある一定時間だけ待機し、更なる指令信号が後続するか否かを確認するだろう。そのときだけ、デバイスは、自動的に、準備状態若しくは活性化状態から抜け出すよう切り替えられるだろう。
【0012】
特に好ましい実施例の場合、出力信号の音量は、検出した指令信号エネルギの関数として低減される。指令信号エネルギは、受信した指令信号の信号エネルギを意味すると理解でき、キー指令信号は、必然的に、ある意味で(特別な)指令信号と理解されるべきである。従って、例えば、デバイス自身の出力信号の音量は、デバイス自身の出力信号が指令信号に対してあまりに大きくて指令信号の信頼性のある認識が保証できないときのみ、低減される。これは、出力信号エネルギ、又は、算出若しくは推定された出力信号の音響エコーと、指令信号エネルギとの間の比が算出されることで、単純に制御されてよい。この比が所定の閾値に対して特定の範囲内に属する場合のみ、音量が低減される。例えば、出力信号若しくは音響エコーのエネルギの指令信号エネルギに対する比が算出された場合、当該比が所定の閾値を上回ったときのみ音量が低減される。逆に、指令信号エネルギの出力信号若しくは音響エコーのエネルギに対する比が算出された場合、当該比が所定の閾値を下回ったときのみ音量が低減される。指令信号エネルギは、例えば受信手段の入力若しくはマイクロフォンで測定されてよい。
【0013】
特に好ましい実施例の場合、出力信号の音量は、信号エネルギの比が所定の値となるまで厳密に低減される。ユーザにとって、これは、デバイス自身が出力する音響信号、例えばCDプレーヤからの音楽が静かであるとき、若しくはユーザがデバイスのマイクロフォンに非常に近い位置にいるとき、音楽の音量は低減されず、変更されないままであることを意味する。他方、音量は、音楽のエネルギ及びマイクロフォンでの音声指令のエネルギが所定の比になるまで、低減される。この比は、予め定義されてよく、ユーザにより設定されてよく、或いは、認識手段の所与の認識の信頼性が達成されるよう自動的に定義されてよい。
【0014】
かかる場合、特に、デバイスが、キー指令信号が認識されたことを表示する可視的若しくは音響的なディスプレイに対する更なる手段を有することは、キー指令信号の認識後に音量が低減されるという事実にユーザが常に頼ることができない故に、有用となる。
【0015】
デバイスは、好ましくは、デバイスにより受信された全体の信号から、デバイス自身が出力する出力信号の音響エコーを除去するためのフィルタ手段を更に有する。即ち、新規な方法は、AEC法と共に使用され、これにより、最適な認識性能を実現する。
【0016】
オーディオデバイス若しくはオーディオヴィジュアルデバイスを制御するために使用される典型的な音声指令は、デバイスの音量を制御するための指令言葉である。これら“音量指令信号”は、例えば言葉“音量アップ”若しくは“音量ダウン”を含んでよい。本発明によれば音量がキー指令信号の認識後速やかにデバイスにより低減されるので、ユーザは、自己の音量指令信号自体が如何なる作用を有するかを認識できない場合ありうる。かかる音量指令信号に対して、それ故に、かかる音量指令信号の認識後、デバイス自身は、好ましくは、低減前に設定された値まで音量を初期的に戻す。その後、音量が、音量指令信号に対応する値に設定される。即ち、言葉“音量ダウン”が認識されたとき、例えば、音量が所与の度合いだけ低減され、言葉“音量アップ”が認識されたとき、音量が所与の度合いだけ増加される。
【0017】
これより、本発明は、図示した実施例を参照して更に説明されるが、本発明はこれに限定されるものでない。
【0018】
図1は、例えばCDプレーヤであるオーディオデバイスの概略図を示し、本発明にとって重要な部品のみが示されている。
【0019】
オーディオデバイス1は、オーディオ信号源6を第1に含む。例えばCDプレーヤの場合、このオーディオ信号源6は、CDドライブ、標本化手段、及び、音声信号に検出した光データを変換する電子部品である。オーディオ信号源6により生成される音声信号は、次いで、例えば従来的な出力段である増幅器8に供給され、そこから、本例では従来的なスピーカ2である音響出力手段2を介して出力される。
【0020】
制御の目的のため、デバイス1は、例えばマイクロコントローラ等の形態であってよい制御手段5を含む。制御手段5によって、オーディオ信号源6が作動させられてよく、例えばCD上の特定のトラックが選択されてよい。この制御の実現は、制御線18により図中に示される。同様に、デバイス1の音量は、制御手段5を介して調整されてよい。これは、出力段8の作動により実現される。この制御の実現は、制御線19により図中に示される。
【0021】
制御指令は、本例では音声指令である音響的な指令信号BSの形式でデバイス1により受信され、この制御指令は、線14,15に従って、ユーザにより本例ではマイクロフォン3である検出手段3を介して入力され、本例では音声認識システム4である認識手段4に供給される。認識された指令は、次いで、信号線17を介して制御手段5に供給され、制御手段5は、受信した指令に従ってデバイス1の個々の構成要素を制御する。
【0022】
図示するように、マイクロフォン3は、指令信号BSのみならず、本例ではCDからの音楽であるデバイス1自身のスピーカ2が出力する音響信号によって生成される音響エコーAEをも検出する。音響エコーAEは、出力信号のみならず室の音響的なパラメータにも依存する。指令信号BSの認識中に音響エコーAEによる干渉を低減するため、デバイスは、フィルタ手段9(以下、AECユニットと称する)を含み、そこで、音響エコーAEが、マイクロフォン3が受信した全体の信号から除去される。
【0023】
この目的のため、出力信号は、オーディオ信号源6からスピーカ2まで出力段8を介して延在する信号出力ブランチから、タップ点21にて出力段8の前でタップされ、タップされた出力信号を伝達関数により変換するAECユニット9に信号線11を介して供給される。この伝達関数は、推定された室内インパルス応答に対応する。各々の現在の室内インパルス応答は、反復法により算出され、更新が常に実行され、従って、例えば人若しくは物体の移動のような室内の変化を考慮する適応フィルタ処理が実行される。伝達関数により変換された出力信号は、AECユニット9の加算器10で信号線14によるマイクロフォン3からの全体の信号から除去される。次いで、出力線15を介して、理想的には指令信号BSにのみ一致する残差信号が、AECユニット9から音声認識システム4に供給される。AECユニット9は、入力12を更に含み、この入力12に、制御手段5により出力段8に制御線19を介して出力される制御信号が音量を調整するために印加される。伝達関数に対する係数は、かくしてAECユニット9で設定音量に従って変倍される。
【0024】
本発明によれば、デバイス1は、減衰器7の形態の手段7を更に含み、これにより、デバイス1の音量が、キー指令信号SBSが音声認識システム4により認識された場合に低減される。本実施例では、それ故に、キー指令信号SBSが、第1の指令信号としてユーザにより話される必要がある。音声認識システム4は、この特別なキー指令信号SBS、即ち例えば言葉“CD”のような特別なキーワードを単に待ち受けるように設計される。このキーワードが受信されると、音声認識システム4の全体の複雑な指令用語集が活性化し、デバイス1が準備モードとなり、例えば“音量アップ”、“音量ダウン”、“次の曲”、“トラック5”等のような更なる指令信号が認識及び受信される。キー指令信号SBSに後続する各々の指令信号BSが認識されると、デバイス1は、キー指令信号SBSを再び待ち受ける状態に復帰する。
【0025】
キー指令信号SBSの認識と同時に、減衰器7は、制御手段5により制御線20を介して本発明により自動的に活性化され、かくしてデバイス1自身の出力信号の音量が低減される。このようにして、続く指令信号BS、即ち本来の指令が音声認識システム4にとって識別しやすいものとなる。音量は、例えばある値(例えば、10dB)毎に低減されてよく、若しくは予め設定された音量レベルまで低減されてよい。
【0026】
しかしながら、図示された実施例では、フィルタ10の上流及び下流で信号入力ブランチに印加される信号は、制御手段5に信号線13,16を介して供給される。フィルタ10の上流及び下流のこれらの信号から、制御手段5が、音響エコーAEがマイクロフォンで示すエネルギ、及び、実際に望まれる指令信号BSが示すエネルギを算出することが可能である。制御手段5は、音響エコーAEの信号エネルギと指令信号BSの信号エネルギとの間の所与の比が達成されるまで、減衰器7により出力信号の音量を低減するように設計される。信号エネルギの比がこの値を既に下回っている場合、音量は一切低減されない。即ち、音楽の音量は、音楽が静かであるとき、若しくはユーザがマイクロフォンに近い位置であり指令信号BSが容易に識別されるときには低減されない。他方、音楽の音量は、音楽のエネルギ及びマイクロフォン入口での音声指令のエネルギが所定の比になるほど十分に正確に低減される。
【0027】
信号出力ブランチの減衰器7は、図示された実施例のように、簡易なスイッチ22によってバイパスされてよく、ユーザにより必要に応じて本発明による機能を非可動状態にすることが可能とされる。
【0028】
分離した減衰器7は、本例では信号出力ブランチに配設され、AECユニット9に対する出力信号のタッピングのために、信号がタップ点21の前で減衰されるようにする。このようにして、音量の低減の結果、室内インパルス応答を推定するときにAECユニット9が当該音量低減を考慮するという事実が自動的に考慮される。AECユニット9で考慮がなされないデバイス1の出力信号の音量の低減は、フィルタ10でのフィルタ処理に起因して付加的な干渉をもたらすことになり、指令信号BSの認識を阻害する傾向となるだろう。
【0029】
分離した減衰器7に代わって、制御手段5の音量を、出力段8の調整によりキー指令信号SBSの認識後に低減することも可能である。
【0030】
本発明によるデバイス1若しくは本発明による方法によれば、音声制御の認識の精度が、音声認識システムの入力信号の歪みを低減することによって大幅に向上する。ユーザは、音量の低減という形式で音声指令に対する準備がなされていることを示す肯定応答をデバイス1から受信するので、非常にユーザフレンドリな音声インターフェースが提供されることになる。更なる肯定応答が、任意的に、可視的な信号若しくは例えば信号音のような更なる音響信号の形式で後続してもよい。
【図面の簡単な説明】
【図1】
オーディオデバイスの概略図である。
Claims (15)
- 音響出力手段を含むデバイスを音響的な指令信号により制御する方法であって、
上記デバイスが該デバイスに音響的な指令信号が送信されていると認識すると同時に、上記音響出力手段により出力される出力信号の音量が低減されることを特徴とする、方法。 - 上記デバイスを更なる指令信号を受信する準備状態に移行させる音響的なキー指令信号が第1に送信され、上記デバイスによる該キー指令信号の認識と同時に、上記音響出力手段により出力される出力信号の音量が低減されることを特徴とする、請求項1記載の方法。
- 上記出力信号の上記音量は、導出された指令信号エネルギの関数として低減されることを特徴とする、請求項1又は2記載の方法。
- 上記出力信号の上記音量は、導出された出力信号エネルギ若しくは出力信号の音響エコーの導出された信号エネルギと導出された指令信号エネルギとの間の比が、所定のしきい値に対して特定の範囲内にある場合に、低減されることを特徴とする、請求項3記載の方法。
- 上記出力信号の上記音量は、出力信号エネルギ若しくは出力信号の音響エコーの信号エネルギと指令信号エネルギとの間の比が所定のしきい値に一致するまで、低減されることを特徴とする、請求項4記載の方法。
- 上記キー指令信号に後続する指令信号の認識後、上記音量が上記低減前に設定されていた値に再調整されることを特徴とする、請求項1乃至5のうちいずれか記載の方法。
- キー指令信号若しくは指令信号の認識後から所定時間経過後に、上記音量が上記低減前に設定されていた値に再調整されることを特徴とする、請求項1乃至6のうちいずれか記載の方法。
- 音量を変更するために送信される音量指令信号の認識後、音量が上記低減前に設定されていた値に再調整され、次いで、上記音量指令信号に一致する値まで調整されることを特徴とする、請求項1乃至7のうちいずれか記載の方法。
- 上記デバイスのユーザに、上記キー指令信号の認識が可視的若しくは音響的に表示される、請求項1乃至8のうちいずれか記載の方法。
- 音響出力手段と、音響的な指令信号を受信する受信手段と、該指令信号を認識する認識手段と、認識した指令信号との関係でデバイスを制御する制御手段とを有するデバイスであって、
上記受信手段が上記デバイスに対する指令信号を受信していることを認識する手段、及び、上記デバイスに対する予想される指令信号の受信が認識されると同時に上記音響出力手段により出力される出力信号の音量を低減する手段を更に有することを特徴とする、デバイス。 - デバイスに対する指令信号を受信する受信手段が、更なる指令信号を受信するための準備状態にデバイスを移行させるキー指令信号を認識する手段を含むことを特徴とする、請求項10記載のデバイス。
- 上記デバイス自身によって出力される出力信号の音響エコーを、上記受信手段により受信された全体の信号から除去するためのフィルタ手段を更に有することを特徴とする、請求項10又は11記載のデバイス。
- 上記デバイスの分岐点の出力信号を低減する手段が、上記出力信号に一致する信号が上記フィルタ手段のためにタップされるタップ点の上流に、配置されたことを特徴とする、請求項12記載のデバイス。
- 上記フィルタ手段が、上記デバイスの上記出力信号の音量を低減させる制御指令を送信するための入力を含むことを特徴とする、請求項12又は13記載のデバイス。
- 出力信号及び/又は上記出力信号の音響エコーの信号エネルギと上記指令信号の信号エネルギとの間の比を算出する手段を更に有することを特徴とする、請求項10乃至14のうちいずれか記載のデバイス。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE10058786A DE10058786A1 (de) | 2000-11-27 | 2000-11-27 | Verfahren zum Steuerung eines eine akustische Ausgabeeinrichtung aufweisenden Geräts |
PCT/EP2001/013468 WO2002043049A1 (de) | 2000-11-27 | 2001-11-19 | Verfahren zur steuerung eines eine akustische ausgabeeinrichtung aufweisenden geräts |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2004514926A true JP2004514926A (ja) | 2004-05-20 |
Family
ID=7664796
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002544708A Pending JP2004514926A (ja) | 2000-11-27 | 2001-11-19 | 音響出力手段を備えたデバイスの制御方法 |
Country Status (7)
Country | Link |
---|---|
US (1) | US20030138118A1 (ja) |
EP (1) | EP1340224A1 (ja) |
JP (1) | JP2004514926A (ja) |
KR (1) | KR20020071966A (ja) |
CN (1) | CN1216364C (ja) |
DE (1) | DE10058786A1 (ja) |
WO (1) | WO2002043049A1 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008205896A (ja) * | 2007-02-21 | 2008-09-04 | Yamaha Corp | 放収音装置 |
JP2015535952A (ja) * | 2012-09-29 | 2015-12-17 | シェンジェン ピーアールテック カンパニー リミテッド | マルチメディアデバイス用音声制御システム及び方法、及びコンピュータ記憶媒体 |
Families Citing this family (30)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005530213A (ja) * | 2002-06-19 | 2005-10-06 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | 音声信号処理装置 |
US7454331B2 (en) * | 2002-08-30 | 2008-11-18 | Dolby Laboratories Licensing Corporation | Controlling loudness of speech in signals that contain speech and other types of audio material |
GB2394589B (en) * | 2002-10-25 | 2005-05-25 | Motorola Inc | Speech recognition device and method |
US8607281B2 (en) * | 2006-09-07 | 2013-12-10 | Porto Vinci Ltd. Limited Liability Company | Control of data presentation in multiple zones using a wireless home entertainment hub |
US9319741B2 (en) | 2006-09-07 | 2016-04-19 | Rateze Remote Mgmt Llc | Finding devices in an entertainment system |
US8214219B2 (en) * | 2006-09-15 | 2012-07-03 | Volkswagen Of America, Inc. | Speech communications system for a vehicle and method of operating a speech communications system for a vehicle |
KR101590332B1 (ko) | 2012-01-09 | 2016-02-18 | 삼성전자주식회사 | 영상장치 및 그 제어방법 |
KR101987255B1 (ko) * | 2012-08-20 | 2019-06-11 | 엘지이노텍 주식회사 | 음성 인식 장치 및 이의 음성 인식 방법 |
US9922646B1 (en) | 2012-09-21 | 2018-03-20 | Amazon Technologies, Inc. | Identifying a location of a voice-input device |
US9165566B2 (en) | 2013-01-24 | 2015-10-20 | Microsoft Technology Licensing, Llc | Indefinite speech inputs |
DK179691B1 (en) | 2013-02-05 | 2019-03-26 | Contour Design | Improved pointing device |
DE102013012453B3 (de) * | 2013-07-26 | 2014-10-16 | Audi Ag | Verfahren zum Betreiben eines Infotainment-Systems eines Kraftwagens und Infotainment-System für einen Kraftwagen |
US8874448B1 (en) * | 2014-04-01 | 2014-10-28 | Google Inc. | Attention-based dynamic audio level adjustment |
KR102338041B1 (ko) * | 2014-09-29 | 2021-12-10 | 현대모비스 주식회사 | 음성 인식 장치 및 방법 |
CN104505092B (zh) * | 2014-12-10 | 2017-12-22 | 广东美的制冷设备有限公司 | 空调器语音控制方法和系统 |
US10031591B2 (en) | 2015-05-08 | 2018-07-24 | Contour Design, Inc. | Pointing device bracket assembly and system |
US9691378B1 (en) * | 2015-11-05 | 2017-06-27 | Amazon Technologies, Inc. | Methods and devices for selectively ignoring captured audio data |
CN106297837A (zh) * | 2016-08-05 | 2017-01-04 | 易晓阳 | 一种语音控制音乐本地播放方法 |
US10043516B2 (en) * | 2016-09-23 | 2018-08-07 | Apple Inc. | Intelligent automated assistant |
CN106409294B (zh) * | 2016-10-18 | 2019-07-16 | 广州视源电子科技股份有限公司 | 防止语音命令误识别的方法和装置 |
US11023053B2 (en) | 2016-11-11 | 2021-06-01 | Contour Innovations Llc | Inner-sensor pointing device system |
WO2018090252A1 (zh) * | 2016-11-16 | 2018-05-24 | 深圳达闼科技控股有限公司 | 机器人语音指令识别的方法及相关机器人装置 |
KR102398390B1 (ko) * | 2017-03-22 | 2022-05-16 | 삼성전자주식회사 | 전자 장치 및 전자 장치의 제어 방법 |
EP3610480B1 (en) | 2017-12-06 | 2022-02-16 | Google LLC | Ducking and erasing audio signals from nearby devices |
JP6929811B2 (ja) * | 2018-03-13 | 2021-09-01 | Tvs Regza株式会社 | 音声対話端末、および音声対話端末制御方法 |
CN109658930B (zh) * | 2018-12-19 | 2021-05-18 | Oppo广东移动通信有限公司 | 语音信号处理方法、电子装置及计算机可读存储介质 |
WO2020140271A1 (zh) * | 2019-01-04 | 2020-07-09 | 珊口(上海)智能科技有限公司 | 移动机器人的控制方法、装置、移动机器人及存储介质 |
US11373686B1 (en) * | 2019-12-23 | 2022-06-28 | Gopro, Inc. | Systems and methods for removing commands from sound recordings |
FR3109050B1 (fr) * | 2020-04-01 | 2022-03-04 | Sagemcom Broadband Sas | Réduction de la consommation électrique d’un équipement de restitution audio |
CN112413859B (zh) * | 2020-11-24 | 2021-11-16 | 珠海格力电器股份有限公司 | 空调器控制方法、装置、空调器及存储介质 |
Family Cites Families (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE2240557A1 (de) * | 1971-08-18 | 1973-02-22 | Jean Albert Dreyfus | Spracherkennungsvorrichtung zum steuern von maschinen |
US4378603A (en) * | 1980-12-23 | 1983-03-29 | Motorola, Inc. | Radiotelephone with hands-free operation |
US4712231A (en) * | 1984-04-06 | 1987-12-08 | Shure Brothers, Inc. | Teleconference system |
JPS63171071A (ja) * | 1987-01-08 | 1988-07-14 | Matsushita Commun Ind Co Ltd | 音声制御装置 |
US5267323A (en) * | 1989-12-29 | 1993-11-30 | Pioneer Electronic Corporation | Voice-operated remote control system |
DE4009900A1 (de) * | 1990-03-20 | 1991-11-07 | Blaupunkt Werke Gmbh | Kraftfahrzeugkommunikationszentrale |
JPH07109560B2 (ja) * | 1990-11-30 | 1995-11-22 | 富士通テン株式会社 | 音声認識装置 |
US5457769A (en) * | 1993-03-30 | 1995-10-10 | Earmark, Inc. | Method and apparatus for detecting the presence of human voice signals in audio signals |
US5633936A (en) * | 1995-01-09 | 1997-05-27 | Texas Instruments Incorporated | Method and apparatus for detecting a near-end speech signal |
JP3674990B2 (ja) * | 1995-08-21 | 2005-07-27 | セイコーエプソン株式会社 | 音声認識対話装置および音声認識対話処理方法 |
EP0810502A1 (de) * | 1996-05-30 | 1997-12-03 | DIEHL GMBH & CO. | Steuereinheit für eine Heizungsanlage |
DE19712632A1 (de) * | 1997-03-26 | 1998-10-01 | Thomson Brandt Gmbh | Verfahren und Vorrichtung zur Sprachfernsteuerung von Geräten |
EP1085500B1 (en) * | 1999-09-13 | 2007-01-17 | Matsushita Electric Industrial Co., Ltd. | Voice recognition for controlling a device |
-
2000
- 2000-11-27 DE DE10058786A patent/DE10058786A1/de not_active Ceased
-
2001
- 2001-11-19 WO PCT/EP2001/013468 patent/WO2002043049A1/de not_active Application Discontinuation
- 2001-11-19 CN CN018042198A patent/CN1216364C/zh not_active Expired - Fee Related
- 2001-11-19 JP JP2002544708A patent/JP2004514926A/ja active Pending
- 2001-11-19 EP EP01991744A patent/EP1340224A1/de not_active Withdrawn
- 2001-11-19 US US10/240,592 patent/US20030138118A1/en not_active Abandoned
- 2001-11-19 KR KR1020027009554A patent/KR20020071966A/ko not_active Application Discontinuation
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008205896A (ja) * | 2007-02-21 | 2008-09-04 | Yamaha Corp | 放収音装置 |
JP2015535952A (ja) * | 2012-09-29 | 2015-12-17 | シェンジェン ピーアールテック カンパニー リミテッド | マルチメディアデバイス用音声制御システム及び方法、及びコンピュータ記憶媒体 |
US9955210B2 (en) | 2012-09-29 | 2018-04-24 | Shenzhen Prtek Co. Ltd. | Multimedia device voice control system and method, and computer storage medium |
Also Published As
Publication number | Publication date |
---|---|
WO2002043049A1 (de) | 2002-05-30 |
CN1397063A (zh) | 2003-02-12 |
EP1340224A1 (de) | 2003-09-03 |
DE10058786A1 (de) | 2002-06-13 |
KR20020071966A (ko) | 2002-09-13 |
US20030138118A1 (en) | 2003-07-24 |
CN1216364C (zh) | 2005-08-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2004514926A (ja) | 音響出力手段を備えたデバイスの制御方法 | |
EP1556857B1 (en) | Controlling an apparatus based on speech | |
US10586534B1 (en) | Voice-controlled device control using acoustic echo cancellation statistics | |
US7110800B2 (en) | Communication system using short range radio communication headset | |
US20060247927A1 (en) | Controlling an output while receiving a user input | |
KR20190024775A (ko) | 헤드폰 시스템 | |
JP4554044B2 (ja) | Av機器用音声認識装置 | |
JPWO2019138651A1 (ja) | 情報処理装置、情報処理システム、および情報処理方法、並びにプログラム | |
WO2003107327A1 (en) | Controlling an apparatus based on speech | |
KR100556365B1 (ko) | 음성 인식장치 및 방법 | |
US5054078A (en) | Method and apparatus to suspend speech | |
CN113314121B (zh) | 无声语音识别方法、装置、介质、耳机及电子设备 | |
JP3877271B2 (ja) | 音声認識用オーディオキャンセル装置 | |
JPH0635497A (ja) | 音声入力装置 | |
JP4765394B2 (ja) | 音声対話装置 | |
JP2003255987A (ja) | 音声認識を利用した機器の制御方法、制御装置及び制御プログラム | |
JP6559051B2 (ja) | 発声機能を備えたロボット装置、発声制御方法およびプログラム | |
JPH02103599A (ja) | 音声認識装置 | |
JP2001134291A (ja) | 音声認識のための方法及び装置 | |
CN116320872A (zh) | 耳机的模式切换方法、装置、电子设备及存储介质 | |
CN116783900A (zh) | 基于子带域声学回声消除器的声学状态估计器 | |
CN112328201A (zh) | 音频路径切换方法 | |
Edlund et al. | Is it really worth it? Cost-based selection of system responses to speech-in-overlap | |
JPS63209296A (ja) | 音声認識制御装置 | |
JP2006311413A (ja) | 音声通信装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20041117 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20061017 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20070116 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20070123 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070417 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20080826 |