JP2001125594A - ボイス制御のためにマイクロホンの指向特性を適合させる装置 - Google Patents

ボイス制御のためにマイクロホンの指向特性を適合させる装置

Info

Publication number
JP2001125594A
JP2001125594A JP2000277686A JP2000277686A JP2001125594A JP 2001125594 A JP2001125594 A JP 2001125594A JP 2000277686 A JP2000277686 A JP 2000277686A JP 2000277686 A JP2000277686 A JP 2000277686A JP 2001125594 A JP2001125594 A JP 2001125594A
Authority
JP
Japan
Prior art keywords
user
microphones
voice control
voice
microphone
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2000277686A
Other languages
English (en)
Inventor
Ernst F Schroeder
エフ シュレーダー エルンスト
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Deutsche Thomson Brandt GmbH
Original Assignee
Deutsche Thomson Brandt GmbH
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Deutsche Thomson Brandt GmbH filed Critical Deutsche Thomson Brandt GmbH
Publication of JP2001125594A publication Critical patent/JP2001125594A/ja
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/005Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/20Speech recognition techniques specially adapted for robustness in adverse environments, e.g. in noise, of stress induced speech
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L2021/02161Number of inputs available containing the signal or the noise to be suppressed
    • G10L2021/02166Microphone arrays; Beamforming
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2201/00Details of transducers, loudspeakers or microphones covered by H04R1/00 but not provided for in any of its subgroups
    • H04R2201/40Details of arrangements for obtaining desired directional characteristic by combining a number of identical transducers covered by H04R1/40 but not provided for in any of its subgroups
    • H04R2201/403Linear arrays of transducers

Abstract

(57)【要約】 【課題】 比較的遠い距離からのボイス入力の場合でも
十分な妨害に対する安全性を可能とするボイス制御のた
めの装置を提供することを目的とする。 【解決手段】 ボイス制御システムは様々な技術分野で
使用される。この場合、話された単語は、通常は1つ以
上のマイクロホンによってまず検出され、次に検出され
た信号から最も高い確率の単語を決定する音声認識シス
テムに供給される。音響的な妨害の影響に対する強さ
は、話者の口のすぐ前方にマイクロホンを固定又は保持
することで高められうる。本発明は、指向性マイクロホ
ン又はマイクロホンアレイ(M1,M2)を用いて妨害
的な背景信号を空間に分離することによって、比較的遠
くからのボイス制御を可能とする。この場合、指向特性
はユーザの位置を検出する手段(IR,VR、CIR)
が設けられることによって適合される。このために1つ
以上の赤外線動き検出器が使用されることが望ましい。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、ボイス制御のため
にマイクロホンの指向特性を適合させるための、特に消
費者電子機器に属する機器を制御するために使用されう
る装置に関する。
【0002】
【従来の技術】ボイス制御システムは、多くの技術分野
において使用される。この場合、話された単語は、通常
は1つ以上のマイクロホンによってまずサウンド信号と
して検出され、次に音声認識システムに供給される。こ
の場合、音声認識は通常は音響モデル及び音声モデルに
基づく。音響モデルは多数の音声パターンを利用し、話
された単語に音響的に最もよく一致する単語を示すため
に数学アルゴリズムが使用される。音声モデルは或る単
語が通常使用される文脈及び頻度を確かめるために多数
の文書サンプルを用いる解析に基づく。かかる音声認識
システムは、個々の単語だけでなく、高い認識率で流暢
に話された文章も認識することを可能とする。しかしな
がら、無視できないほどの背景雑音が存在する場合、認
識率は大きく低減する。
【0003】かかる音響的な妨害の影響に対する強さは
様々な方法で高められうる。従って、コンピュータ用の
ディクテーションシステムでは、ヘッドセット枠体に設
けられたマイクロホンは、話者の口のすぐ前方に固定さ
れている。これらのシステムでは、非常に一定の信号、
そして或る状況ではかなりの認識率は、口のすぐ近傍で
しか達成できない。同様に、遠隔制御装置に一体化され
たマイクロホンに向かって操作命令を話すことによって
テレビジョン受像機を制御することが知られている。し
かしながら、この場合も、遠隔制御装置は使用者の口の
すぐ前方に保持されねばならない。
【0004】
【発明が解決しようとする課題】本発明は、比較的遠い
距離からのボイス入力の場合でも十分な妨害に対する安
全性を可能とするボイス制御のための装置を提供するこ
とを目的とする。
【0005】
【課題を解決するための手段】上記目的は請求項1に記
載の装置によって達成される。比較的遠くからのボイス
制御を可能とするため、ボイス信号は妨害的な背景信号
から分離されねばならない。これは、指向性マイクロホ
ン又は2つ以上のマイクロホンを含むマイクロホンアレ
イを用いて空間に分離することによって行われうる。し
かしながら、ボイス入力中に、ユーザが例えば機器の前
方の中央といった限られた領域にいることを制限される
のではなく、室内を自由に移動することを可能とするこ
とを目的とするのであれば、これらのマイクロホンアレ
イの指向特性は適合されねばならない。この適合のため
に、マイクロホン信号自体が使用されうる。この場合、
対応する信号の有無をまず検出せねばならず、次にマイ
クロホンアレイは対応して適合され、その後で満足のい
く音声認識が開始する。しかしながら、この一連の過程
は多くの秒数を必要とし、即ち最初の音節又は単語が認
識されえない。
【0006】原理的に、本発明のボイス作動遠隔制御装
置のための装置は、ボイス命令を電気信号へ変換する1
つ以上のマイクロホンと、これらの電気信号を操作命令
へ返還する音声認識ユニットと、ユーザの位置を検出
し、マイクロホンの指向特性をユーザの位置に適合させ
るために使用されうる信号を発生する手段とを有する。
【0007】別々の検出手段を使用することは、ユーザ
の位置の迅速な検出により、命令の最初の音節又は単語
が検出され認識されることを常に可能とするという利点
を有する。原理的に、全ての十分に迅速な検出手段がこ
の目的に適している。
【0008】ユーザの位置を検出する手段は、有利には
1つ以上の赤外線動き検出器を有する。同様に、ユーザ
の位置を検出する手段が、赤外線動き検出器に加えて、
又は、赤外線動き検出器の代わりに電気接点を有するこ
とが有利である。望ましくは、ユーザの位置に向けられ
る指向性マイクロホンが設けられうる。本発明による装
置は、消費者電子機器に一体化されることが特に有利で
ある。
【0009】
【発明の実施の形態】以下、本発明を添付の図面を参照
して説明する。
【0010】図1は、例えばテレビジョン受像機、ビデ
オレコーダ、又はDVDプレーヤに一体化されうるよう
に、本発明による装置を概略的に示す図である。ユーザ
が使用命令を発行する前にユーザの位置を検出するため
に、赤外線位置検出器が設けられる。赤外線位置検出器
は、対象又は人物によって放射される赤外線放射の強度
が夫々の温度に依存するという原理に基づく。赤外線位
置検出器は、当業者によって周知であり従ってここでは
詳述されない多数の赤外線検出器IRを有する。これ
は、単一の検出器はユーザの存在又は動きのみを決定し
うるが、位置を決定できないからである。解像度につい
ての要件に依存して、装置は複数の個々の検出器、又は
赤外線又は熱画像カメラに使用されるのと同じ種類の配
列を含みうる。この場合、観察範囲は、レンズ又はレン
ズの組み合わせ(図示せず)によって影響を受けうる。
赤外線検出器によって赤外線放射から得られる電気信号
は、次に増幅器V3によって増幅され、制御ユニットC
IRに渡され、制御ユニットCIRにおいて検出された
信号から位置が決定され、適切であればユーザの動きの
方向も決定される。
【0011】ボイス信号の検出のために、2つのマイク
ロホンM1及びM2を有するマイクロホンアレイが設け
られる。マイクロホンは、検出されたサウンド信号を電
気信号に変換し、電気信号はまず増幅器V1及びV2に
よって増幅され、次に信号処理ユニットPROCに供給
される。信号処理ユニットは次に、検出されたサウンド
信号の異なるスケーリング又は処理によってユーザの夫
々の位置を考慮に入れる。このようにして処理された信
号は次に、電気信号を単語へ変換する音声認識ユニット
RECに供給される。最後に、これらの単語に対応する
命令はシステムを制御するシステムマネージャCSYS
に供給される。
【0012】2つのマイクロホンを有するマイクロホン
アレイでは、2つのマイクロホンは有利に夫々の機器の
筐体の左側及び右側に収容されうる。しかしながら、マ
イクロホンアレイは2つのマイクロホンに限られるもの
ではなく、2つ以上のマイクロホンを有しても良い。同
様に、はっきりした指向特性を有する指向性マイクロホ
ンを使用し、検出されたユーザの位置に依存して回転さ
せることも可能である。
【0013】基本的な設定では、機器が設置された部屋
の入口領域の方向に向けられることが可能であることが
有利である。これにより、機器はユーザが部屋に入ると
同時にすぐに使用する準備ができる。
【0014】複数の可能なユーザが検出されれば、様々
な過程が考えられる。例えば、指向特性は最初に検出さ
れたユーザに対して常に適合され、それによりマイクロ
ホンアレイはこのユーザを追跡するようにされてもよ
い。同様に、マイクロホンアレイは最初にボイス入力を
行なったユーザを追跡してもよい。更に、異なった可能
なユーザ間で向きを定期的に切り換えてもよい。最後
に、ユーザのペットに対して向けられないよう、検出さ
れた対象の大きさが評価されうる。
【0015】更に、赤外線検出器を用いる代わりに、部
屋に入るユーザをドア又は照明のスイッチに対する接触
によって検出することが考えられる。最後に、かかる接
触と、赤外線検出の組み合わせが可能である。
【0016】更なる実施例によれば、検出手段は、機器
がオフとされた状態で連続的に作動されうる。ユーザが
検出されると、マイクロホンの指向特性のみが適合さ
れ、音声認識ユニットがオンとされる。使用命令、特に
制御されるべき機器をオンとする命令が生ずると、機器
の残る機能グループもまた作動される。このようにし
て、機器は、低い電力出力で連続的に利用される準備が
できている。
【0017】本発明は、例えば、テレビジョン受像機、
ビデオレコーダ、DVDプレーヤ、衛星受信器、テレビ
ジョン/ビデオの組合せ、オーディオ装置、又はパーソ
ナルコンピュータ又は家庭用機器の同様の完全なオーデ
ィオシステムといった消費者電子機器に属する広範な機
器のボイス作動遠隔制御のために使用されうる。
【図面の簡単な説明】
【図1】本発明によるボイス制御のための装置を示す図
である。
【符号の説明】
M1、M2 マイクロホン V1、V2、V3 増幅器 IR 赤外線検出器

Claims (5)

    【特許請求の範囲】
  1. 【請求項1】 ボイス命令を電気信号へ変換する1つ以
    上のマイクロホン(M1,M2)と、上記電気信号を操
    作命令へ変換する音声認識ユニット(REC)とを有す
    る、ボイス作動遠隔制御用の装置であって、 ユーザの位置を検出する手段(IR,V3,CIR)が
    設けられ、上記ユーザの位置を検出する手段は上記1つ
    以上のマイクロホンの指向特性を上記ユーザの位置に適
    合させるために使用されうる信号を発生することを特徴
    とする装置。
  2. 【請求項2】 上記ユーザの位置を検出する手段は1つ
    以上の赤外線動き検出器を有することを特徴とする、請
    求項1記載の装置。
  3. 【請求項3】 上記ユーザの位置を検出する手段は電気
    接点を有することを特徴とする、請求項1又は2記載の
    装置。
  4. 【請求項4】 上記ユーザの位置に向けられる指向性マ
    イクロホンが設けられることを特徴とする、請求項1乃
    至3のうちいずれか一項記載の装置。
  5. 【請求項5】 請求項1乃至4のうちいずれか一項記載
    の装置を有する消費者電子機器。
JP2000277686A 1999-09-14 2000-09-13 ボイス制御のためにマイクロホンの指向特性を適合させる装置 Pending JP2001125594A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
DE1999143872 DE19943872A1 (de) 1999-09-14 1999-09-14 Vorrichtung zur Anpassung der Richtcharakteristik von Mikrofonen für die Sprachsteuerung
DE19943872.2 1999-09-14

Publications (1)

Publication Number Publication Date
JP2001125594A true JP2001125594A (ja) 2001-05-11

Family

ID=7921896

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000277686A Pending JP2001125594A (ja) 1999-09-14 2000-09-13 ボイス制御のためにマイクロホンの指向特性を適合させる装置

Country Status (4)

Country Link
EP (1) EP1085781A3 (ja)
JP (1) JP2001125594A (ja)
CN (1) CN1288223A (ja)
DE (1) DE19943872A1 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008145574A (ja) * 2006-12-07 2008-06-26 Nec Access Technica Ltd 音源方向推定装置、音源方向推定方法、及びロボット装置
JP2008205896A (ja) * 2007-02-21 2008-09-04 Yamaha Corp 放収音装置
JP5318258B1 (ja) * 2012-07-03 2013-10-16 株式会社東芝 集音装置
JP2014506428A (ja) * 2011-01-05 2014-03-13 コーニンクレッカ フィリップス エヌ ヴェ オーディオシステム及びオーディオシステムの動作方法

Families Citing this family (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
NO316560B1 (no) * 2001-02-21 2004-02-02 Meditron Asa Mikrofon med avstandsmåler
GB2375276B (en) * 2001-05-03 2003-05-28 Motorola Inc Method and system of sound processing
DE10208469A1 (de) * 2002-02-27 2003-09-04 Bsh Bosch Siemens Hausgeraete Elektrisches Gerät, insbesondere Dunstabzugshaube
DE10252457A1 (de) * 2002-11-12 2004-05-27 Harman Becker Automotive Systems Gmbh Spracheingabe-Interface
DE10308414B4 (de) * 2003-02-27 2007-10-04 Bayerische Motoren Werke Ag Verfahren zur Steuerung eines Akustiksystems im Fahrzeug
DE10339973A1 (de) 2003-08-29 2005-03-17 Daimlerchrysler Ag Intelligentes akustisches Mikrofon-Frontend mit Spracherkenner-Feedback
EP1581026B1 (en) * 2004-03-17 2015-11-11 Nuance Communications, Inc. Method for detecting and reducing noise from a microphone array
EP1800291B1 (de) * 2004-10-04 2012-09-05 Volkswagen Aktiengesellschaft Vorrichtung zur akustischen kommunikation und/oder wahrnehmung in einem kraftfahrzeug
DE102004049345A1 (de) 2004-10-08 2006-04-13 Robert Bosch Gmbh Verfahren und Vorrichtung zur Steuerung eines Antriebseinheit
EP1695873B1 (en) * 2005-02-23 2008-07-09 Harman Becker Automotive Systems GmbH Vehicle speech recognition system
US7809568B2 (en) * 2005-11-08 2010-10-05 Microsoft Corporation Indexing and searching speech with text meta-data
US8068619B2 (en) * 2006-05-09 2011-11-29 Fortemedia, Inc. Method and apparatus for noise suppression in a small array microphone system
JP5555987B2 (ja) * 2008-07-11 2014-07-23 富士通株式会社 雑音抑圧装置、携帯電話機、雑音抑圧方法及びコンピュータプログラム
GB2493327B (en) 2011-07-05 2018-06-06 Skype Processing audio signals
GB2495278A (en) 2011-09-30 2013-04-10 Skype Processing received signals from a range of receiving angles to reduce interference
GB2495131A (en) * 2011-09-30 2013-04-03 Skype A mobile device includes a received-signal beamformer that adapts to motion of the mobile device
GB2495130B (en) 2011-09-30 2018-10-24 Skype Processing audio signals
GB2495128B (en) 2011-09-30 2018-04-04 Skype Processing signals
GB2495129B (en) 2011-09-30 2017-07-19 Skype Processing signals
GB2495472B (en) 2011-09-30 2019-07-03 Skype Processing audio signals
GB2496660B (en) 2011-11-18 2014-06-04 Skype Processing audio signals
GB201120392D0 (en) 2011-11-25 2012-01-11 Skype Ltd Processing signals
GB2497343B (en) 2011-12-08 2014-11-26 Skype Processing audio signals
US9408011B2 (en) 2011-12-19 2016-08-02 Qualcomm Incorporated Automated user/sensor location recognition to customize audio performance in a distributed multi-sensor environment
US9984675B2 (en) * 2013-05-24 2018-05-29 Google Technology Holdings LLC Voice controlled audio recording system with adjustable beamforming
CN104200816B (zh) * 2014-07-31 2017-12-22 广东美的制冷设备有限公司 语音控制方法和系统
CN104267618B (zh) * 2014-07-31 2017-06-13 广东美的制冷设备有限公司 基于红外定位的语音控制方法和系统
CN104200817B (zh) * 2014-07-31 2017-07-28 广东美的制冷设备有限公司 语音控制方法和系统
EP3434024B1 (en) 2016-04-21 2023-08-02 Hewlett-Packard Development Company, L.P. Electronic device microphone listening modes

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4523185A (en) * 1982-03-15 1985-06-11 Albert Roth Zoned intrusion display with series-connected sensors
US4586195A (en) * 1984-06-25 1986-04-29 Siemens Corporate Research & Support, Inc. Microphone range finder
EP0472356B1 (en) * 1990-08-16 1994-03-30 Fujitsu Ten Limited Speech recognition apparatus for a vehicle, using a microphone arrangement to determine the seat from which a command is generated
JPH05207117A (ja) * 1992-01-30 1993-08-13 Mazda Motor Corp マイクロホンの指向性制御装置
DE4313256A1 (de) * 1993-04-23 1994-10-27 Sel Alcatel Ag Verfahren zum Unterdrücken von Rückkopplungen bei Saal- oder Großfeldbeschallungsanlagen und Schaltungsanordnung zur Ausführung des Verfahrens
DE4439146A1 (de) * 1994-11-03 1996-05-09 Deutsche Telekom Ag Freisprechanordnung mit einem Lautsprecher und einem Mikrofon
US5641963A (en) * 1995-09-29 1997-06-24 Mueller; Thomas J. Infrared location system
DE19712632A1 (de) * 1997-03-26 1998-10-01 Thomson Brandt Gmbh Verfahren und Vorrichtung zur Sprachfernsteuerung von Geräten
DE19741596A1 (de) * 1997-09-20 1999-03-25 Bosch Gmbh Robert Verfahren zur Optimierung des Empfangs akustischer Signale und elektrisches Gerät
DE19812697A1 (de) * 1998-03-23 1999-09-30 Volkswagen Ag Verfahren und Einrichtung zum Betrieb einer Mikrofonanordnung, insbesondere in einem Kraftfahrzeug
DE19844748A1 (de) * 1998-09-29 1999-10-07 Siemens Audiologische Technik Verfahren zum Bereitstellen einer Richtmikrofoncharakteristik und Hörgerät

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008145574A (ja) * 2006-12-07 2008-06-26 Nec Access Technica Ltd 音源方向推定装置、音源方向推定方法、及びロボット装置
JP2008205896A (ja) * 2007-02-21 2008-09-04 Yamaha Corp 放収音装置
JP2014506428A (ja) * 2011-01-05 2014-03-13 コーニンクレッカ フィリップス エヌ ヴェ オーディオシステム及びオーディオシステムの動作方法
US9596549B2 (en) 2011-01-05 2017-03-14 Koninklijke Philips N.V. Audio system and method of operation therefor
JP5318258B1 (ja) * 2012-07-03 2013-10-16 株式会社東芝 集音装置

Also Published As

Publication number Publication date
DE19943872A1 (de) 2001-03-15
CN1288223A (zh) 2001-03-21
EP1085781A3 (en) 2001-08-16
EP1085781A2 (en) 2001-03-21

Similar Documents

Publication Publication Date Title
JP2001125594A (ja) ボイス制御のためにマイクロホンの指向特性を適合させる装置
US10586534B1 (en) Voice-controlled device control using acoustic echo cancellation statistics
US10504511B2 (en) Customizable wake-up voice commands
KR102481454B1 (ko) 방향성 인터페이스를 갖는 핸즈 프리 디바이스
KR100215946B1 (ko) 게임장치,음성선택장치,음성인식장치및음성응답장치
EP2587481B1 (en) Controlling an apparatus based on speech
JP5442703B2 (ja) 消費者電化製品に関連する装置をボイス制御する方法及び装置
US6351222B1 (en) Method and apparatus for receiving an input by an entertainment device
JP4792156B2 (ja) マイクロホンアレイを有するボイス制御システム
US20180090138A1 (en) System and method for localization and acoustic voice interface
JP2019159306A (ja) ファーフィールド音声制御デバイス及びファーフィールド音声制御システム
US7050971B1 (en) Speech recognition apparatus having multiple audio inputs to cancel background noise from input speech
KR102060949B1 (ko) 청각 기기의 저전력 운용 방법 및 장치
KR20190024775A (ko) 헤드폰 시스템
WO2003107327A1 (en) Controlling an apparatus based on speech
GB2526980A (en) Sensor input recognition
JP3838159B2 (ja) 音声認識対話装置およびプログラム
JP2019184809A (ja) 音声認識装置、音声認識方法
US10523170B1 (en) Audio signal processing for motion detection
WO2019175960A1 (ja) 音声処理装置および音声処理方法
WO2020051841A1 (en) Human-machine speech interaction apparatus and method of operating the same
GB2553040A (en) Sensor input recognition
JPH07307989A (ja) 音声入力装置
JP2001134291A (ja) 音声認識のための方法及び装置
JPH0277799A (ja) 車載用音声認識装置