JP2001100785A - Av機器用音声認識装置 - Google Patents

Av機器用音声認識装置

Info

Publication number
JP2001100785A
JP2001100785A JP2000227787A JP2000227787A JP2001100785A JP 2001100785 A JP2001100785 A JP 2001100785A JP 2000227787 A JP2000227787 A JP 2000227787A JP 2000227787 A JP2000227787 A JP 2000227787A JP 2001100785 A JP2001100785 A JP 2001100785A
Authority
JP
Japan
Prior art keywords
monaural
signal
voice
unit
output
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2000227787A
Other languages
English (en)
Other versions
JP4554044B2 (ja
JP2001100785A5 (ja
Inventor
Satoru Ibaraki
悟 茨木
Takeo Kanamori
丈郎 金森
Takeshi Kawamura
岳 河村
Mikio Oda
幹夫 小田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP2000227787A priority Critical patent/JP4554044B2/ja
Publication of JP2001100785A publication Critical patent/JP2001100785A/ja
Publication of JP2001100785A5 publication Critical patent/JP2001100785A5/ja
Application granted granted Critical
Publication of JP4554044B2 publication Critical patent/JP4554044B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)
  • Stereophonic System (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

(57)【要約】 【課題】 スピーカから2チャンネル音響が出力されて
いる状態で高精度の音声認識が行え、しかも安価である
ようなAV機器用音声認識装置を実現する。 【解決手段】 モノラル化部13は、スピーカ9a,9
bに入力される2チャンネル信号をモノラル化する。1
つのエコーキャンセラ14には、マイクロホン6の出力
と、モノラル化部13の出力(モノラル化信号)とが与
えられ、エコーキャンセラ14は、モノラル化信号に基
づいてマルチチャンネル音響の反響音を推定し、その反
響音をマイクロホン出力から除去する。これにより、た
だ1つのエコーキャンセラを備えるだけで、スピーカか
ら2チャンネル音響が出力されている状態で音声認識が
行えるようになる。また、2つのエコーキャンセラを備
える場合と異なり、エコーキャンセラ間の相互干渉が生
じて音声認識性能が低下することもない。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、音声認識装置に関
し、より特定的には、2チャンネルステレオを含むマル
チチャンネルオーディオを再生するTV、ラジオ、オー
ディオシステムなどのAV機器に用いられ、スピーカか
らオーディオが拡声された状態であっても、音声による
AV機器の制御や、音声によるAV機器への情報入力等
が可能であるAV機器用音声認識装置に関する。
【従来の技術】従来、スピーカからオーディオが拡声さ
れた状態において音声認識を行う技術を記載した文献と
しては、特開平5−22779号公報(発明の名称「音
声認識遠隔制御装置」)が知られている。
【0002】図23は、上記公報に開示されている技術
を用いた従来のAV機器用音声認識装置の構成を示すブ
ロック図である。図23の音声認識装置は、1つのスピ
ーカ201を持ったAV機器に用いられる。図23にお
いて、従来のAV機器用音声認識装置は、マイクロホン
202と、音声認識部203と、エコーキャンセラ20
4とを備えている。
【0003】以上のように構成された従来のAV機器用
音声認識装置について、図24を用いてその動作を述べ
る。図24は、図23の音声認識装置において、各構成
要素に入力される、または各構成要素から出力される信
号の時間波形を示す図である。図24において、スピー
カ201からオーディオ信号が拡声された状態で、音声
制御用の音声をユーザが発した場合を考える。
【0004】スピーカ201からオーディオ信号が拡声
されない状態で、ユーザが音声を発した場合は、マイク
ロホン202からは、図24の211に示す極めてS/
Nのよい音声信号が出力される。ところが、スピーカ2
01に図24の212に示すTV番組のオーディオ信号
が入力されていると、このスピーカ入力212と相似の
図24の213に示す反響信号がマイクロホン202の
出力に混入することになる。
【0005】従って、マイクロホン202からは、ユー
ザ音声211と反響信号213とが加算された、図24
の214に示す、ユーザ音声を認識するには極めてS/
Nの悪い信号が出力される。このS/Nの悪いマイクロ
ホン出力214が、音声認識部203に入力されても、
音声認識部203で十分な音声認識結果が期待できない
のは当然である。
【0006】そこで、図23の音声認識装置では、スピ
ーカ201からマイクロホン202に回り込む反響信号
213を、エコーキャンセラ204内部の適応ディジタ
ルフィルタで推定している。そして、エコーキャンセラ
204内部の減算回路により、マイクロホン出力214
からこの推定反響信号を差し引くことによって反響信号
213を完全にキャンセルし、ユーザ音声211だけを
抽出している。
【0007】エコーキャンセラ204には、スピーカ2
01への入力信号であるスピーカ入力212が与えられ
る。エコーキャンセラ204内部の適応ディジタルフィ
ルタは、このスピーカ入力212の波形と、内部に記憶
されたスピーカ201からマイクロホン202までの反
響路のインパルスレスポンスとから、反響信号215を
推定する。次に、エコーキャンセラ204内部の減算回
路が、マイクロホン出力214から、この推定反響信号
215を差し引き、それによって、エコーキャンセラ出
力216を得ている。
【0008】このエコーキャンセラ出力216と、ユー
ザ音声の波形211とを比較すればわかるように、スピ
ーカ201からオーディオが拡声された状態であって
も、上記のようなエコーキャンセラ204の反響音打ち
消し作用によって、音声認識部203が正確な音声認識
を行うことが期待できる。
【0009】しかしながら、図23の音声認識装置は、
モノラルオーディオ方式のAV機器にしか対応しておら
ず、複数のスピーカを使用するマルチチャンネルオーデ
ィオ方式のAV機器には用いることができないという、
大きな欠点を有していた。
【0010】図25は、別の従来のAV機器用音声認識
装置の構成を示すブロック図である。図25の音声認識
装置は、2つのスピーカ221および222を持った2
チャンネルオーディオ方式のAV機器に用いられる。図
25において、別の従来の音声認識装置は、マイクロホ
ン223と、音声認識部224と、2つのエコーキャン
セラ225および226とを備えている。
【0011】この従来例は、スピーカ221からマイク
ロホン223に回り込む反響音と、スピーカ222から
マイクロホン223に回り込む反響音とを、エコーキャ
ンセラ225内部の適応ディジタルフィルタと、エコー
キャンセラ226内部の適応ディジタルフィルタとで推
定し、マイクロホンの出力信号から、この2つの推定値
を差し引くことにより、ユーザ音声だけを抽出するもの
である。先の図23の音声認識装置と異なり、図25の
音声認識装置は、ステレオ方式のAV機器に適用でき
る。
【0012】しかしながら、図25の音声認識装置で
は、オーディオチャンネルの数だけエコーキャンセラを
必要とするので、マルチチャンネルオーディオのAV機
器に用いる場合には、極めて価格の高い音声認識装置に
なるという欠点を有していた。さらに、このように複数
のエコーキャンセラを用いたシステムにおいては、エコ
ーキャンセラ間の相互干渉が起こるので、エコーキャン
セラの適応動作が極めて不安定であり、適応失敗による
反響音の増加や発振などが生じてしまうという大きな欠
点も知られていた。
【0013】
【発明が解決しようとする課題】AV機器用の音声認識
装置においては、スピーカでオーディオを再生しながら
音声認識が行えること、マルチチャンネルオーディオに
対応できること、信頼性が高いこと、安価であることが
強く要望されている。
【0014】しかしながら、従来のAV機器用音声認識
装置は、前述のように、オーディオチャンネルの数だけ
エコーキャンセラを必要とするので、マルチチャンネル
オーディオ方式のAV機器に用いる場合には、極めて価
格が高くなるという課題を有していた。さらに、エコー
キャンセラ間の相互干渉のためにエコーキャンセラの適
応動作が極めて不安定となって、適応失敗による反響音
の増加や発振などを生じ、その結果、音声認識性能が低
下するという別の課題も有していた。
【0015】それゆえに、本発明の目的は、スピーカか
らマルチチャンネル音響が出力されている状態で高精度
の音声認識が行え、しかも安価であるような、マルチチ
ャンネルAV機器用の音声認識装置を実現することであ
る。
【0016】
【課題を解決するための手段および発明の効果】第1の
発明は、複数のスピーカを通じてマルチチャンネル音響
を出力するAV機器に用いられ、マイクロホンを通じて
入力されるユーザ音声を認識して、当該AV機器に所定
の処理動作を行わせるための音声認識装置であって、複
数のスピーカへ向かうマルチチャンネル信号をモノラル
化するモノラル化手段、マイクロホンの出力(以下、マ
イクロホン出力)と、モノラル化手段の出力(以下、モ
ノラル化信号)とが与えられ、当該モノラル化信号に基
づいてマルチチャンネル音響の反響音を推定して、当該
マイクロホン出力から当該反響音を除去する1つのエコ
ーキャンセラ、1つのエコーキャンセラの出力(以下、
エコーキャンセラ出力)に基づいてユーザ音声を認識す
る音声認識手段を備えている。
【0017】上記第1の発明では、マルチチャンネル信
号をモノラル化して1つのエコーキャンセラに与え、そ
の1つのエコーキャンセラがマイクロホン出力からマル
チチャンネル音響の反響音を除去するので、チャンネル
数に関わらずただ1つのエコーキャンセラを備えるだけ
で、スピーカからマルチチャンネル音響が出力されてい
る状態で音声認識が行えるようになる。また、複数のエ
コーキャンセラを備える場合と異なり、エコーキャンセ
ラ間の相互干渉が生じて音声認識性能が低下することも
ない。
【0018】第2の発明は、第1の発明において、複数
のスピーカへは、マルチチャンネル信号が入力されるこ
とを特徴としている。
【0019】上記第2の発明では、複数のスピーカから
マルチチャンネル音響が出力されるので、反響音をモノ
ラル化信号で完全に打ち消すことはできない。しかし、
マルチチャンネル信号のモノラル度が”1”に近けれ
ば、反響音を概ね打ち消すことができる。少なくとも、
マルチチャンネル信号のモノラル度が”0”でない限り
は、反響音の一部を打ち消すことができる。ここで、マ
ルチチャンネル信号のモノラル度とは、その信号中に占
める、全チャンネルに共通して含まれる成分(モノラル
成分)の割合をいい、全チャンネルの信号が互いに全く
無相関であれば、モノラル度は”0”、同一であれば、
モノラル度は”1”となる。
【0020】第3の発明は、第1の発明において、マル
チチャンネル信号およびモノラル化信号のいずれかを複
数のスピーカへと入力するための切り替え手段をさらに
備えている。
【0021】上記第3の発明では、複数のスピーカか
ら、マルチチャンネル音響およびモノラル化音響のいず
れかを選択的に出力させることができる。
【0022】第4の発明は、第3の発明において、モノ
ラル化信号とエコーキャンセラ出力とに基づいてユーザ
音声を検出する音声検出手段をさらに備え、切り替え手
段は、音声検出手段によってユーザ音声が検出されてい
ない時、マルチチャンネル信号を複数のスピーカへと入
力し、音声検出手段によってユーザ音声が検出されてい
る時、モノラル化信号を複数のスピーカへと入力するこ
とを特徴としている。
【0023】上記第4の発明では、音声認識を行う必要
がない(ユーザ音声が検出されない)場合はマルチチャ
ンネル音響を、音声認識を行う必要がある(ユーザ音声
が検出されている)場合はモノラル化音響を出力させる
ので、十分に高い精度で音声認識が行えるようになる。
【0024】第5の発明は、第3の発明において、音声
認識動作の起動を命令する起動命令手段、音声認識動作
の終了を命令する終了命令手段、および起動命令手段お
よび終了命令手段からの命令に応じて、音声認識手段を
動作状態および待機状態のいずれかに設定する状態設定
手段をさらに備え、切り替え手段は、状態設定手段によ
って音声認識手段が待機状態に設定されている時、マル
チチャンネル信号を複数のスピーカへと入力し、状態設
定手段によって音声認識手段が動作状態に設定されてい
る時、モノラル化信号を複数のスピーカへと入力するこ
とを特徴としている。
【0025】上記第5の発明では、音声認識手段が待機
状態(”OFF”状態)にある場合はマルチチャンネル
音響を、動作状態(”ON”状態)にある場合はモノラ
ル化音響を出力させるので、十分に高い精度で音声認識
が行えるようになる。
【0026】第6の発明は、第5の発明において、マル
チチャンネル信号のモノラル度を判定するモノラル度判
定手段、およびマルチチャンネル信号を任意のモノラル
度にモノラル化する任意度モノラル化手段をさらに備
え、モノラル化手段は、マルチチャンネル信号を完全に
モノラル化し、任意度モノラル化手段は、モノラル度判
定手段の判定結果が予め定められたモノラル度よりも低
い場合、マルチチャンネル信号を当該予め定められたモ
ノラル度にモノラル化することを特徴としている。
【0027】上記第6の発明では、マルチチャンネル信
号のモノラル度が常に、予め定められたモノラル度以上
になるので、音声認識手段が動作状態(”ON”状態)
にある場合でも、立体感をあまり損なうことなく、高い
精度で音声認識性能が行えるようになる(すなわち、立
体感と音声認識性能とをバランスさせることができ
る)。
【0028】第7の発明は、第5の発明において、マル
チチャンネル信号は、3チャンネル以上の信号であり、
マルチチャンネル信号を2チャンネル化する2チャンネ
ル化手段をさらに備え、モノラル化手段は、2チャンネ
ル化手段の出力(以下、2チャンネル化信号)をモノラ
ル化し、切り替え手段は、マルチチャンネル信号、2チ
ャンネル化信号およびモノラル化信号のいずれかを複数
のスピーカへと入力することを特徴としている。
【0029】上記第7の発明では、複数のスピーカか
ら、マルチチャンネル音響、2チャンネル化音響および
モノラル化音響のいずれかを選択的に出力させることが
できる。
【0030】第8の発明は、第7の発明において、モノ
ラル化信号とエコーキャンセラ出力とに基づいてユーザ
音声を検出する音声検出手段をさらに備え、切り替え手
段は、状態設定手段が音声認識手段を待機状態に設定し
ている時には、マルチチャンネル信号を複数のスピーカ
へと入力し、状態設定手段が音声認識手段を動作状態に
設定しているが、音声検出手段によってユーザ音声が検
出されていない時には、2チャンネル化信号を複数のス
ピーカへと入力し、音声検出手段によってユーザ音声が
検出されている時には、モノラル化信号を複数のスピー
カへと入力することを特徴としている。
【0031】上記第8の発明では、音声認識手段が待機
状態(”OFF”状態)にある場合はマルチチャンネル
音響を、動作状態(”ON”状態)にあるが音声認識を
行う必要がない(ユーザ音声が検出されない)場合はマ
ルチチャンネル音響を、音声認識を行う必要がある(ユ
ーザ音声が検出されている)場合はモノラル化音響を出
力させるので、待機状態における立体感をあまり損なう
ことなく、十分に高い精度で音声認識が行えるようにな
る。
【0032】第9の発明は、第5の発明において、モノ
ラル化信号とエコーキャンセラ出力とに基づいて、エコ
ーキャンセラにおいて反響音が十分に打ち消されている
かを監視する打ち消し監視手段、モノラル化信号とエコ
ーキャンセラ出力とに基づいてユーザ音声を検出する音
声検出手段、およびマルチチャンネル信号を減衰させる
減衰手段をさらに備え、減衰手段は、打ち消し監視手段
の監視結果が打ち消し不十分を示している状態におい
て、音声検出手段がユーザ音声を検出した時、マルチチ
ャンネル信号を減衰させることを特徴としている。
【0033】上記第9の発明では、反響音が十分に打ち
消されていない状態でユーザ音声が検出された時、複数
のスピーカから出力される音響のレベルを下げることに
よって、反響音の混入を抑制する。その結果、反響音が
十分に打ち消されていない状態での音声認識性能が高ま
る。
【0034】第10の発明は、第5の発明において、エ
コーキャンセラは、複数のスピーカとマイクロホンとの
間の反響路のインパルスレスポンスを推定して、当該推
定インパルスレスポンスと、モノラル化信号とから反響
音を算出する適応ディジタルフィルタ、およびマイクロ
ホン出力から、適応ディジタルフィルタの出力を減算す
る減算手段を含んでいる。
【0035】上記第10の発明では、マイクロホン出力
からマルチチャンネル音響の反響音を除去して、ユーザ
音声だけを音声認識手段に与えることができる。
【0036】第11の発明は、第10の発明において、
切り替え手段によって複数のスピーカへの入力がマルチ
チャンネル信号からモノラル化信号へと切り替えられる
際に、適応ディジタルフィルタの適応を促進するための
モノラル適応音を発生する適応音発生手段をさらに備え
ている。
【0037】上記第11の発明では、スピーカへの入力
がマルチチャンネル信号からモノラル化信号に切り替わ
る際に、複数のスピーカからモノラルの適応音響が出力
されるので、もし切り替え直後のモノラル化音響が無音
状態であっても、ディジタルフィルタが保持しているイ
ンパルスレスポンスを強制的に反響路のインパルスレス
ポンスに適応させることができる。
【0038】第12の発明は、第10の発明において、
適応ディジタルフィルタの適応速度を制御する適応制御
手段をさらに備え、適応制御手段は、モノラル用の速い
適応速度と、マルチチャンネル用の遅い適応速度とを持
ち、状態設定手段が音声認識手段を動作状態に設定して
いる時には速い適応速度を選択し、待機状態に設定して
いる時には遅い適応速度を選択することを特徴としてい
る。
【0039】上記第12の発明では、エコーキャンセラ
内の適応ディジタルフィルタの適応速度を、音声認識手
段が動作状態に設定されている時には速い速度に、待機
状態に設定されている時には遅い速度に制御するので、
モノラル,マルチチャンネルそれぞれに好適なエコー打
ち消しを行うことができる。すなわち、スピーカから出
力されるのがマルチチャンネル音響の場合は、適応ディ
ジタルフィルタから見ると雑音であるステレオ成分が多
いので、遅い適応速度とすることによって耐雑音性を高
め、一方、モノラル化音響の場合は、ステレオ成分がな
いので、速い適応速度とすることによって、反響路のイ
ンパルスレスポンスの変動への追従性を高めることがで
きる。その結果、待機状態において優れたエコー打ち消
し効果が実現され、動作状態へ移行した直後における音
声認識性能が高まる。
【0040】第13の発明は、第12の発明において、
適応制御手段へは、複数のスピーカに入力される信号が
マルチチャンネル信号かモノラル信号かを示す識別信号
が与えられ、適応制御手段は、識別信号がモノラルを示
す場合、状態設定手段が音声認識手段を動作状態に設定
しているか待機状態に設定しているかに関わらず、速い
適応速度を選択することを特徴としている。
【0041】上記第13の発明では、複数のスピーカに
入力される信号がマルチチャンネル信号かモノラル信号
かを識別信号によって判別して、モノラル信号の場合
は、状態設定手段が音声認識手段を動作状態に設定して
いるか待機状態に設定しているかに関わらず、速い適応
速度を選択するので、反響路のインパルスレスポンスの
変動への追従性が低下することがなく、その結果、待機
状態において優れたエコー打ち消し効果が実現され、動
作状態へ移行した直後における音声認識性能が高まる。
【0042】第14の発明は、第10の発明において、
マルチチャンネル信号のモノラル度を判定するモノラル
度判定手段、およびモノラル度判定手段の判定結果に基
づいて、適応ディジタルフィルタの適応速度を制御する
適応制御手段をさらに備えている。
【0043】上記第14の発明では、マルチチャンネル
信号のモノラル度に基づいて、適応ディジタルフィルタ
の適応速度を制御するので、様々なモノラル度を持った
マルチチャンネル信号に好適なエコー打ち消しを行うこ
とができる。すなわち、モノラル度が低い場合、適応速
度を遅くして、耐雑音性を高める。一方、モノラル度が
高い場合、適応ディジタルフィルタから見ると雑音であ
るステレオ成分が少ないので、耐雑音性はあまり必要で
ない。よって、下記第15の発明のように、適応速度を
速くすることによって、反響路のインパルスレスポンス
の変動への追従性を高めることができる。その結果、特
にモノラル度が高い場合に、優れたエコー打ち消し効果
が実現でき、動作状態へ移行した直後における音声認識
性能が高まる。
【0044】第15の発明は、第14の発明において、
適応制御手段は、マルチチャンネル信号のモノラル度が
高いほど、適応ディジタルフィルタの適応速度を速くす
ることを特徴としている。
【0045】第16の発明は、第10の発明において、
不揮発メモリをさらに備え、不揮発メモリは、電源が”
OFF”される時、適応ディジタルフィルタによって推
定されたインパルスレスポンスを取得して記憶し、電源
が”ON”される時、記憶している電源”OFF”時の
推定インパルスレスポンスを適応ディジタルフィルタに
与え、適応ディジタルフィルタは、不揮発メモリから与
えられた電源”OFF”時の推定インパルスレスポンス
を初期値として、インパルスレスポンスの推定を開始す
ることを特徴としている。
【0046】上記第16の発明では、電源”OFF”時
の推定インパルスレスポンスを記憶しておき、電源”O
N”時、それを初期値としてインパルスレスポンスの推
定を開始するので、”0”を初期値とする場合と比べ、
電源”ON”直後の推定誤差が小さくなり、その結果、
音声認識性能が高まる。
【0047】第17の発明は、第5の発明において、モ
ノラル化信号とエコーキャンセラ出力とに基づいてユー
ザ音声を検出する音声検出手段をさらに備え、起動命令
手段は、ボタンが押されると、状態設定手段へ起動命令
を発するようなボタンスイッチであり、終了命令手段
は、音声検出手段がユーザ音声を検出しない状態が予め
定められた時間以上継続すると、状態設定手段へ終了命
令を発する時限スイッチであることを特徴としている。
【0048】上記第17の発明では、音声認識動作を自
動的に終了できる。
【0049】第18の発明は、第5の発明において、モ
ノラル化信号とエコーキャンセラ出力とに基づいてユー
ザ音声を検出する音声検出手段をさらに備え、起動命令
手段は、音声検出手段がユーザ音声を検出すると、状態
設定手段へ起動命令を発する音声スイッチであり、終了
命令手段は、音声検出手段がユーザ音声を検出しない状
態が予め定められた時間以上継続すると、状態設定手段
へ終了命令を発する時限スイッチであることを特徴とし
ている。
【0050】上記第18の発明では、音声認識動作を自
動的に開始・終了できる。
【0051】
【発明の実施の形態】以下、本発明の実施の形態につい
て、図面を参照しながら説明する。最初に、本発明が用
いられるAV機器について説明しておく。図1は、本発
明が用いられるAV機器の構成の一例を示すブロック図
である。図1に示されるAV機器は、テレビション放送
を受信するためのテレビジョン受像機である。ここでい
うテレビション放送では、マルチチャンネル(2チャン
ネルも含む;以下同様)の音響方式が採用されていると
する。
【0052】図1において、AV機器は、アンテナ1
と、受信部2と、AV処理部3と、コントローラ4と、
コントロールパネル5と、マイクロホン6と、音声認識
装置7と、ディスプレイユニット8と、スピーカユニッ
ト9とを備えている。
【0053】アンテナ1は、放送局から送信された電波
を捉えて電気信号に変換する。受信部2は、アンテナ1
から出力される電気信号から、特定の周波数帯に含まれ
る信号を抽出する。AV処理部3は、受信部2から出力
される信号を処理して、映像信号と、マルチチャンネル
の音響信号(以下、マルチチャンネル信号)とを出力す
る。
【0054】コントローラ4は、コントロールパネル5
または音声認識装置7からのコントロール信号を受け、
受信部2および/またはAV処理部3に、例えば受信チ
ャンネルの切り換えや音量の増減、主電源の”ON”
/”OFF”等の予め決められた処理を実行させる。デ
ィスプレイユニット8は、ディスプレイを含み、AV処
理部3からの映像信号を受けて映像を表示する。スピー
カユニット9は、複数のスピーカ(9a,9b,…)を
含み、AV処理部3からのマルチチャンネル信号を受け
てマルチチャンネル音響を出力する。
【0055】コントロールパネル5(受像機本体に設け
られても、リモコンに設けられてもよい)は、ボタン等
によって構成され、ユーザのボタン操作と対応するコン
トロール信号を生成する。マイクロホン6は、ユーザが
発した音声を電気信号に変換する。音声認識装置7は、
マイクロホン6から出力される電気信号を受け、ユーザ
の音声と対応するコントロール信号を生成する。
【0056】ここで、上記受信部2から出力される信号
は、アナログ信号であっても、ディジタル信号であって
もよい。前者の場合、AV処理部3は、受信部2から出
力される信号をアナログ的に処理する回路によって構成
される。後者の場合、AV処理部3は、受信部2から出
力される信号をディジタル的に処理する回路によって構
成される。
【0057】上記のように構成されたテレビジョン受像
機では、アンテナ1が、放送局から送信された電波を捉
えて電気信号に変換し、受信部2は、その電気信号か
ら、特定の周波数帯の信号を抽出する。次いで、AV処
理部3は、受信部2から出力される信号を処理して、映
像信号とマルチチャンネル信号とを出力する。AV処理
部3から出力された映像信号は、ディスプレイユニット
8に与えられ、ディスプレイに映像が表示される。一
方、マルチチャンネル信号は、スピーカユニット9に与
えられ、複数のスピーカからマルチチャンネル音響が出
力される。
【0058】ユーザは、コントロールパネル5を操作す
ることにより、テレビジョン受像機に、受信チャンネル
の切換等を行わせることができる。すなわち、コントロ
ールパネル5がユーザのボタン操作と対応するコントロ
ール信号を生成し、コントローラ4は、そのコントロー
ル信号を受け、受信部2および/またはAV処理部3
に、受信チャンネルの切り換え等を実行させる。
【0059】また、ユーザは、マイクロホン6を通じて
音声を入力をすることにより、テレビジョン受像機に、
受信チャンネルの切り換え等を行わせることができる。
すなわち、音声認識装置7がユーザの音声と対応するコ
ントロール信号を生成し、コントローラ4は、そのコン
トロール信号を受け、受信部2および/またはAV処理
部3に、受信チャンネルの切り換え等を実行させる。
【0060】なお、以上では、本発明が用いられるAV
機器の一例として、マルチチャンネル音響を出力するテ
レビジョン受像機について説明したが、本発明は、テレ
ビジョン受像機に限らず、例えば、マルチチャンネル音
響を出力するラジオ受信機に用いてもよい。あるいは、
マルチチャンネル信号が記されたCD,DVD等のメデ
ィアを再生するための再生機、アンプ、およびスピーカ
ユニット9等からなるマルチチャンネル・オーディオシ
ステムなど、マルチチャンネル音響を出力する機能を持
つあらゆる機器,システムに用いることができる。
【0061】(第1の実施形態)図2は、本発明の第1
の実施形態に係るAV機器用音声認識装置の構成を示す
ブロック図である。図2の音声認識装置7は、図1のA
V機器に設けられた音声認識装置7と対応している。た
だし、本実施形態では、AV機器において、AV処理部
3から2チャンネル信号が出力され、スピーカユニット
9に含まれる2つのスピーカ9aおよび9bを通じて2
チャンネル音響が出力されるものとする。
【0062】図2において、音声認識装置7は、モノラ
ル化部13と、1個のエコーキャンセラ14と、音声認
識部15とを備えている。スピーカ9aおよび9bへと
入力される信号は、図1のAV処理部3から出力される
2チャンネル信号である。
【0063】スピーカ9aおよび9bへ向かう2チャン
ネル信号が分岐されてモノラル化部13に入力され、モ
ノラル化部13は、その2チャンネル信号をモノラル化
する。マイクロホン6から出力される信号(以下、マイ
クロホン出力)と、モノラル化部13から出力される信
号(以下、モノラル化信号)とがエコーキャンセラ14
へと与えられ、エコーキャンセラ14は、そのマイクロ
ホン出力からユーザの音声と対応する信号(以下、ユー
ザ音声)だけを抽出する。
【0064】ここで、エコーキャンセラ14の動作原理
について、簡単に説明する。エコーキャンセラ14は、
適応ディジタルフィルタ14aと、減算回路14bとを
含む。マイクロホン出力には、ユーザ音声に加え、スピ
ーカ9aおよび9bから出力された音響が屋内を反響し
てマイクロホン6へと回り込んだ結果生じる信号(以
下、反響信号)が含まれている。
【0065】適応ディジタルフィルタ14aへは、モノ
ラル化信号が入力されると共に、減算回路14bから出
力される信号がフィードバックされ、適応ディジタルフ
ィルタ14aは、それら2つの信号に基づいて反響信号
を推定する。こうして得られた推定反響信号と、マイク
ロホン出力とが減算回路14bへと与えられ、減算回路
14bは、マイクロホン出力から推定反響信号を減算す
る。これにより、エコーキャンセラ14からは、反響信
号の除去されたユーザ音声が出力される。
【0066】音声認識部15は、エコーキャンセラ14
からのユーザ音声を認識して、その音声が示すコントロ
ール信号を生成する。こうして生成されたコントロール
信号は、図1のコントローラ4に伝達され、コントロー
ラ4が受信部2やAV処理部3を制御することによっ
て、テレビジョン受像機において、受信チャンネルの切
り換え等の処理が実行される。
【0067】図3は、図1の音声認識装置7のハードウ
エア的な構成を示すブロック図である。図3において、
音声認識装置7は、CPU10と、RAM11と、RO
M12とを備えている。ROM12には、所定のプログ
ラムが予め格納されている。このプログラムには、
(a)2チャンネル信号をモノラル化するためのアルゴ
リズムや、(b)マイクロホン出力から反響信号を除去
するためのアルゴリズム、(c)ユーザ音声を認識して
コントロール信号を生成するためのアルゴリズム等が記
述されている。CPU10は、RAM11を作業領域と
して利用しつつ、上記のプログラムに従って動作する。
これによって、図2に示される各ブロックの機能が実現
される。なお、各ブロックの機能をソフト的に実現する
代わりに、各々専用のハード回路によって実現すること
もできる。
【0068】以上のように構成されたAV機器用音声認
識装置7について、以下、図4を利用してその動作を述
べる。図4は、図2の音声認識装置7において、各構成
要素に入力される、または各構成要素から出力される信
号の時間波形を示す図である。まず、スピーカ9aとス
ピーカ9bとに図4の21に示す左スピーカ入力と図4
の22に示す右スピーカ入力とが入力されている状態
で、ユーザが図4の23に示す音声を発した場合を考え
る。この時、マイクロホン6からは、左スピーカ入力2
1の反響音と右スピーカ入力22の反響音とユーザ音声
23とが加算された図4の24に示すマイクロホン出力
信号が出力される。一方、左スピーカ入力21と右スピ
ーカ入力22とは、モノラル化部13にも入力され、こ
こで加算されて、図4の25に示すモノラル化信号が得
られる。
【0069】このモノラル化信号25がエコーキャンセ
ラ14に入力され、エコーキャンセラ14は、このモノ
ラル化信号25と内部に記憶した推定インパルスレスポ
ンスとから、図4の26に示す推定反響信号を推定す
る。エコーキャンセラ14の内部では、マイクロホン出
力信号24から、推定した推定反響信号26を差し引き
くことにより、図4の27に示すエコーキャンセラ出力
信号を得る。この信号が音声認識部15に入力される。
エコーキャンセラ出力信号27とユーザ音声23とマイ
クロホン出力信号24とを比較すれば、反響信号がかな
り効果的に打ち消されていることがわかる。
【0070】次に、なぜステレオ信号(以下では、2チ
ャンネル信号を適宜、ステレオ信号と呼ぶ)が1個のエ
コーキャンセラ14で打ち消せるかを説明する。右チャ
ンネル用のスピーカ9aからマイクロホン6までの伝達
特性(インパルスレスポンス)をHr、左チャンネル用
のスピーカ9bからマイクロホン6までの伝達特性をH
lとし、右チャンネル信号をSr、左チャンネル信号を
Slとすると、マイクロホン6の出力に混入する反響信
号Seは、Se=(Sr*Hr+Sl*Hl)となる。
【0071】この時、もし、左右の伝達特性がほぼ等し
くHr≒Hl(≒H)なら、Se≒(Sr+Sl)*H
となり、もし、左右のチャンネルの信号がほぼ等しくS
r≒Sl≒Sなら、Se≒S*(Hr+Hl)となる。
従って、どちらかの仮定が成り立つ場合には、1個のエ
コーキャンセラ14でも打ち消しが可能であることがわ
かる。
【0072】伝達特性HrおよびHlを決める最大の要
因は、スピーカ9aおよび9bとマイクロホン6との間
の距離および部屋の反射構造であるが、実際の聴取状態
では、音声認識用のマイクロホン6と、右チャンネル用
のスピーカ9a,左チャンネル用のスピーカ9bとの間
の各距離は、例えばマイクロホン6をユーザの手元に置
く場合には、当然、ほぼ等距離となる。また、TVの上
に設置する場合でも、TVの中央に設置すれば等距離と
なる。さらに、部屋の反響構造も当然ほぼ同一である。
【0073】高域周波数では、波長が短いため僅かな距
離差によって位相逆転が生じるので、たとえほぼ等距離
といえども位相を含めた伝達特性の一致は不十分であ
る。しかし、低中域周波数では、かなりよく伝達特性が
一致している場合が多いので、、Hr≒Hlの仮定が成
立し、1個のエコーキャンセラ14でもある程度のキャ
ンセル効果が期待できることになる。
【0074】さらに、実際のTV番組などでの音づくり
では、センター定位音(モノラル成分)を比較的高いレ
ベルで左右チャンネル均等にミキシングし、このモノラ
ル成分に、左右に定位させる音(ステレオ成分)を比較
的低レベルでミキシングしている場合が多い。すなわ
ち、センター音源主体の音づくりがなされており、先の
21と22で示した左右のスピーカ入力のかなりの部分
がモノラル成分である。このようなセンター音源主体の
オーディオ信号の場合には、Sr≒Slの仮定が成り立
ち、1個のエコーキャンセラ14を用いたシステムで
も、反響音を効果的にキャンセルできることになる。以
上の理由により、実際のTV視聴状態においては、図2
のような構成の音声認識装置7でも、かなりのエコーキ
ャンセル効果が得られることが確かめられている。
【0075】以上のように、本実施形態によれば、1個
のエコーキャンセラのみでステレオソース(2チャンネ
ル信号)に対応できるため、安価なAV機器用音声認識
装置が実現できる。また、1個のエコーキャンセラしか
使用しないため、エコーキャンセラ間の相互干渉がな
く、安定した動作が保証できるという、実用上極めて重
要な効果が得られる。
【0076】なお、上記第1の実施形態(および下記第
2〜4,6〜13の実施形態)では、図1のAV機器に
おいて、AV処理部3から2チャンネル信号が出力さ
れ、スピーカユニット9を通じて2チャンネル音響が拡
声されるとしたが、代わりに、AV処理部3から4チャ
ンネル信号,6チャンネル信号等のマルチチャンネル信
号が出力され、スピーカユニット9を通じて4チャンネ
ル音響,6チャンネル音響等のマルチチャンネル音響が
出力されてもよい。この場合、図2のモノラル化部13
がマルチチャンネル信号のモノラル化を行うように、R
OM12のプログラムの記述(あるいは専用ハード回路
の構成)に一部変更を加えればよい。その場合、モノラ
ル化部13は、全チャンネルの信号を加算してもよく、
あるいは、前方左右中央といった主チャンネル信号だけ
を加算してもよい。また、加算する際に、各チャンネル
を均等に加算するのでなく、重み付けをして加算しても
よい。
【0077】(第2の実施形態)図5は、本発明の第2
の実施形態に係るAV機器用音声認識装置の構成を示す
ブロック図である。図5の音声認識装置7は、図1のA
V機器に設けられた音声認識装置7と対応している。た
だし、本実施形態では、AV機器において、AV処理部
3から2チャンネル信号が出力され、スピーカユニット
9に含まれる2つのスピーカ9aおよび9bを通じて2
チャンネル音響が出力されるものとする。
【0078】図5において、音声認識装置7は、モノラ
ル化部33と、1個のエコーキャンセラ34と、音声認
識部35と、音声検出部37と、切り替え部36とを備
えている。すなわち、図5の音声認識装置7は、図2の
音声認識装置7(第1の実施形態)に、音声検出部37
と、切り替え部36とを追加したものである。スピーカ
9aおよび9bへと入力される信号は、図1のAV処理
部3から出力される2チャンネル信号である。
【0079】スピーカ9aおよび9bへ向かう2チャン
ネル信号が分岐されてモノラル化部33に入力され、モ
ノラル化部33は、その2チャンネル信号をモノラル化
する。マイクロホン6から出力される信号(マイクロホ
ン出力)と、モノラル化部33から出力される信号(モ
ノラル化信号)とがエコーキャンセラ34へと与えら
れ、エコーキャンセラ34は、そのマイクロホン出力か
らユーザの音声と対応する信号(以下、ユーザ音声)だ
けを抽出する。なお、エコーキャンセラ34の動作原理
については、第1の実施形態で説明した。
【0080】音声検出部37へは、モノラル化部33の
出力(モノラル化信号)と、エコーキャンセラ34の出
力(ユーザ音声)とが与えられ、音声検出部37は、両
出力のレベル比に基づいて、ユーザ音声を検出する。切
り替え部36は、音声検出部37がユーザ音声を検出す
ると、スピーカ9aおよび9bへの入力を、(非検出時
における)2チャンネル信号から、モノラル化信号に切
り替える。また、音声検出部37がユーザ音声を検出し
ている状態から検出しない状態へ変化すると、スピーカ
9aおよび9bへの入力を、(検出時における)モノラ
ル化信号から、2チャンネル信号に切り替える。
【0081】音声認識部35は、音声検出部37がユー
ザ音声を検出すると、音声認識動作を開始する。すなわ
ち、エコーキャンセラ34からのユーザ音声を認識し
て、その音声が示すコントロール信号を生成する。こう
して生成されたコントロール信号は、図1のコントロー
ラ4に伝達され、コントローラ4が受信部2やAV処理
部3を制御することによって、テレビジョン受像機にお
いて、受信チャンネルの切り換え等の処理が実行され
る。
【0082】図5の音声認識装置7のハードウエア的な
構成は、図3と同様である。図3において、ROM12
には、所定のプログラムが予め格納されている。このプ
ログラムには、第1の実施形態で述べた(a)〜(c)
のアルゴリズムに加え、さらに(d)ユーザ音声を検出
するためのアルゴリズム、および(e)スピーカ9aお
よび9bへの入力信号を切り替えるためのアルゴリズム
が記述されている。CPU10は、RAM11を作業領
域として利用しつつ、上記のプログラムに従って動作す
る。これによって、図5に示される各ブロックの機能が
実現される。なお、各ブロックの機能をソフト的に実現
する代わりに、各々専用のハード回路によって実現する
こともできる。
【0083】以上のように構成されたAV機器用音声認
識装置7について、以下、図6を利用してその動作を述
べる。図6は、図5の音声認識装置7において、各構成
要素に入力される、または各構成要素から出力される信
号の時間波形を示す図である。まず、先の第1実施形態
で説明したと同様、スピーカ9aとスピーカ9bとに、
図6の41に示す左スピーカ入力と図6の42に示す右
スピーカ入力とが入力されている状態で、ユーザが図6
の43に示す音声を発した場合を考える。この時、モノ
ラル化部33からは、図6の44の信号が出力される。
図3の音声認識装置7では、音声検出部37がユーザが
音声を発したか否かを判断し、ユーザが音声を発してい
ない図6の43に示したA〜BとC〜Dの期間では、切
り替え部36は、スピーカ9aおよび9bへの入力をス
テレオ信号側に切り替え、ユーザが音声を発しているB
〜Cの期間では、モノラル信号側に切り替えている。こ
の時、マイクロホン6から出力される信号を、図6の4
5に示す。
【0084】エコーキャンセラ34には、常に図6のモ
ノラル化信号44が入力され、エコーキャンセラ34
は、このモノラル化信号44と、内部に記憶した推定イ
ンパルスレスポンスとから、図6の46に示す推定反響
信号を推定する。エコーキャンセラ34の内部では、マ
イクロホン出力信号45から推定反響信号46を差し引
くことにより、図6の47に示すエコーキャンセラ出力
信号を得る。
【0085】図5の音声認識装置7では、音声検出部3
7が、モノラル化信号44とエコーキャンセラ出力信号
47とのレベル比を監視し、モノラル化信号44のレベ
ルと反響路の伝達特性とから予想される反響信号のレベ
ル以上に、エコーキャンセラ出力信号47のレベルが上
昇した時に、ユーザが音声を発したと判断し、切り替え
部36は、スピーカ9aおよび9bへの入力をモノラル
化信号44に切り替える。スピーカ9aおよび9bへの
入力を(Sr+Sl)なるモノラル化信号に切り替えた
場合においては、反響信号Seは、Se=(Sr+S
l)*(Hr+Hl)となり、原理的に、1個のエコー
キャンセラ34により反響信号を完全に消去できること
となる。先の図2の構成では、Sr≒Slの仮定が成り
立たないステレオ成分の強いオーディオ信号の場合に
は、当然、エコーキャンセラ34の打ち消し効果が損な
われ、音声認識部35に入力される音声に反響信号が混
入して音声認識の性能を悪化させていたが、図5の構成
では、この場合においても完全に反響信号を打ち消すこ
とができ、音声認識部35で精度の高い音声認識が可能
となる。
【0086】図6の48に、図5の音声認識装置7にお
けるエコーキャンセラ出力信号47中に含まれる反響信
号を抜き出して示し、図6の49に、図2の構成におけ
る図2のエコーキャンセラ出力信号27中に含まれる反
響信号を抜き出して示す。この48と49を比較する
と、本実施の形態では、B〜Cのユーザ音声が入力され
ている期間において反響信号がより効果的に打ち消さ
れ、音声認識のためのS/Nが大幅に向上していること
がわかる。
【0087】以上のように、本実施形態によれば、通常
はステレオ再生で、ユーザが音声を発した時のみモノラ
ル再生に切り替えることにより、第1の実施形態よりさ
らにS/Nのよいユーザ音声を抽出でき、認識性能の向
上が図れる。
【0088】(第3の実施形態)図7は、本発明の第3
の実施形態に係るAV機器用音声認識装置の構成を示す
ブロック図である。図7の音声認識装置7は、図1のA
V機器に設けられた音声認識装置7と対応している。た
だし、本実施形態では、AV機器において、AV処理部
3から2チャンネル信号が出力され、スピーカユニット
9に含まれる2つのスピーカ9aおよび9bを通じて2
チャンネル音響が出力されるものとする。
【0089】図7において、音声認識装置7は、モノラ
ル化部53と、1個のエコーキャンセラ54と、音声認
識部55と、起動命令部581と、終了命令部582
と、状態設定部57と、切り替え部56とを備えてい
る。すなわち、図7の音声認識装置7は、図2の音声認
識装置7(第1の実施形態)に、起動命令部581と、
終了命令部582と、状態設定部57と、切り替え部5
6とを追加したものである。スピーカ9aおよび9bへ
と入力される信号は、図1のAV処理部3から出力され
る2チャンネル信号である。
【0090】スピーカ9aおよび9bへ向かう2チャン
ネル信号が分岐されてモノラル化部53に入力され、モ
ノラル化部53は、その2チャンネル信号をモノラル化
する。マイクロホン6から出力される信号(マイクロホ
ン出力)と、モノラル化部53から出力される信号(モ
ノラル化信号)とがエコーキャンセラ54へと与えら
れ、エコーキャンセラ54は、そのマイクロホン出力か
らユーザの音声と対応する信号(以下、ユーザ音声)だ
けを抽出する。なお、エコーキャンセラ54の動作原理
については、第1の実施形態で説明した。
【0091】起動命令部581は、音声認識動作の起動
を命令する。終了命令部582は、音声認識動作の終了
を命令する。状態設定部57は、起動命令部581,終
了命令部582からの命令を受け、音声認識部55の動
作状態を設定(つまり音声認識動作を”ON”/”OF
F”)する。切り替え部56は、状態設定部57が音声
認識動作を”ON”状態に設定すると、スピーカ9aお
よび9bへの入力を、(”OFF”状態における)2チ
ャンネル信号から、モノラル化信号に切り替える。ま
た、”OFF”状態に設定すると、スピーカ9aおよび
9bへの入力を、(”ON”状態における)モノラル化
信号から、2チャンネル信号に切り替える。
【0092】音声認識部55は、状態設定部57の設定
に従い、音声認識を実行/終了する。すなわち、エコー
キャンセラ54からのユーザ音声を認識して、その音声
が示すコントロール信号を生成する。こうして生成され
たコントロール信号は、図1のコントローラ4に伝達さ
れ、コントローラ4が受信部2やAV処理部3を制御す
ることによって、テレビジョン受像機において、受信チ
ャンネルの切り換え等の処理が実行される。
【0093】図7の音声認識装置7のハードウエア的な
構成は、図3と同様である。図3において、ROM12
には、所定のプログラムが予め格納されている。このプ
ログラムには、第1の実施形態で述べた(a)〜(c)
のアルゴリズムと、第2の実施形態で述べた(e)のア
ルゴリズムに加え、さらに(f)音声認識部55の動作
状態を設定するためのアルゴリズムが記述されている。
CPU10は、RAM11を作業領域として利用しつ
つ、上記のプログラムに従って動作する。これによっ
て、図7に示される各ブロックの機能が実現される。
【0094】なお、起動命令部581,終了命令部58
2は、図1のコントローパネルを構成するボタンによっ
て実現される。また、起動命令部581,終了命令部5
82以外の各ブロックの機能をソフト的に実現する代わ
りに、各々専用のハード回路によって実現することもで
きる。
【0095】以上のように構成されたAV機器用音声認
識装置7について、以下、その動作を述べる。図7の音
声認識装置7は、図5の音声認識装置7において、音声
検出部37が行っていた切り替え部56の制御を、起動
命令部581および終了命令部582と、状態設定部5
7とで行う構成である。音声認識機能を利用しようとす
る場合は、まず、起動命令部581により音声認識機能
の起動信号が状態設定部57に送られ、状態設定部57
は、切り替え部56を制御してスピーカ9aおよびスピ
ーカ9bへの入力信号をステレオ信号からモノラル化信
号へ切り替え、音声認識の状態をスピーカ9aおよび9
bにステレオ信号が入力された待機状態から、スピーカ
9aおよび9bにモノラル化信号が入力された動作状態
に移行させる。
【0096】動作状態においては、ステレオ感は損なわ
れるがオーディオ信号の聞き取りには大きな問題はな
い。すなわち、動作状態においては、反響信号の打ち消
し効果は最良の状態にあり、精度の高い音声認識が期待
できる一方、ステレオ感が損なわれるため、音声認識機
能の利用が終了すると同時に、終了命令部582により
音声認識機能の終了信号が状態設定部57に送られ、状
態設定部57は、切り替え部56を制御してスピーカ9
aおよびスピーカ9bへの入力信号をモノラル化信号か
らステレオ信号へ切り替え、音声認識の状態をスピーカ
9aおよび9bにモノラル化信号が入力された動作状態
から、スピーカ9aおよび9bにステレオ信号が入力さ
れた待機状態に移行させる。
【0097】図8は、図7の音声認識装置7において、
各構成要素に入力される、または各構成要素から出力さ
れる信号の時間波形を示す図である。図8の61に、動
作状態における音声認識部55への入力信号を示し、6
2に、その信号中に含まれる反響信号を示す。この図8
の61,62の信号と、先の図6の47,48の信号と
を比較すれば、図7の音声認識装置7では、図5の音声
認識装置7よりも語頭や語尾部分のS/Nが大幅に改善
されることがわかる。先の図5の構成では、音声検出に
数10msecの検出時間を要するため、数10mse
cの語頭部分でのS/Nが悪く、語頭にある子音を認識
しにくいという欠点があったが、図7の構成では、この
欠点が完全に解消される。
【0098】以上のように、本実施形態によれば、通常
はステレオ再生で、音声認識機能を必要とした時のみモ
ノラル再生に切り替えることにより、第2の実施形態よ
りさらにS/Nのよいユーザ音声を抽出でき、認識性能
のさらなる向上が図れる。
【0099】(第4の実施形態)図9は、本発明の第4
の実施形態に係るAV機器用音声認識装置の構成を示す
ブロック図である。図9の音声認識装置7は、図1のA
V機器に設けられた音声認識装置7と対応している。た
だし、本実施形態では、AV機器において、AV処理部
3から2チャンネル信号が出力され、スピーカユニット
9に含まれる2つのスピーカ9aおよび9bを通じて2
チャンネル音響が出力されるものとする。
【0100】図9において、音声認識装置7は、完全モ
ノラル化部75と、モノラル度判定部76と、任意度モ
ノラル化部77と、1個のエコーキャンセラ73と、音
声認識部74と、起動命令部792と、終了命令部79
3と、状態設定部791と、切り替え部78とを備えて
いる。すなわち、図9の音声認識装置7は、図7の音声
認識装置7(第3の実施形態)に、モノラル度判定部7
6と、任意度モノラル化部77とを追加したものである
(なお、完全モノラル化部75は、任意度モノラル化部
77と区別するために”完全”と呼んでいるが、図7の
モノラル化部53と同様のものである)。スピーカ9a
および9bへと入力される信号は、図1のAV処理部3
から出力される2チャンネル信号である。
【0101】スピーカ9aおよび9bへ向かう2チャン
ネル信号が分岐されて完全モノラル化部75に入力さ
れ、完全モノラル化部75は、その2チャンネル信号を
完全にモノラル化する。さらに、スピーカ9aおよび9
bへ向かう2チャンネル信号が分岐されてモノラル度判
定部76および任意度モノラル化部77に入力され、モ
ノラル度判定部76は、その2チャンネル信号のモノラ
ル度を判定する。任意度モノラル化部77は、モノラル
度判定部76の判定結果を受けて、その2チャンネル信
号を任意の程度にモノラル化する。
【0102】すなわち、任意度モノラル化部77は、そ
の2チャンネル信号のモノラル度に応じて、その2チャ
ンネル信号のモノラル度を高める処理を施す。そのため
に、任意度モノラル化部77は、モノラル度を高める処
理をどの強度で行うべきかをモノラル度をもとに決定す
るための関数(処理強度決定特性;図12(A)に参照
番号101で示される)を記憶している。
【0103】ここで、上記2チャンネル信号のモノラル
度とは、その信号中に占める、両チャンネルに共通して
含まれる信号成分(モノラル成分)の割合をいい、両チ
ャンネルの信号が互いに全く無相関であれば、モノラル
度は”0”、同一であれば、モノラル度は”1”とな
る。
【0104】マイクロホン6から出力される信号(マイ
クロホン出力)と、完全モノラル化部75から出力され
る信号(完全モノラル化信号)とがエコーキャンセラ7
3へと与えられ、エコーキャンセラ73は、そのマイク
ロホン出力からユーザの音声と対応する信号(以下、ユ
ーザ音声)だけを抽出する。なお、エコーキャンセラ7
3の動作原理については、第1の実施形態で説明した。
【0105】起動命令部792は、音声認識動作の起動
を命令する。終了命令部793は、音声認識動作の終了
を命令する。状態設定部791は、起動命令部792,
終了命令部793からの命令を受け、音声認識部74の
動作状態を設定(つまり音声認識動作を”ON”/”O
FF”)する。
【0106】任意度モノラル化部77から出力される信
号(以下、任意度モノラル化信号)と、図1のAV処理
部3からの2チャンネル信号とが切り替え部78へと与
えられ、切り替え部78は、状態設定部791が音声認
識動作を”ON”状態に設定すると、スピーカ9aおよ
び9bへの入力を、(”OFF”状態における)2チャ
ンネル信号から、任意度モノラル化信号に切り替える。
また、”OFF”状態に設定すると、スピーカ9aおよ
び9bへの入力を、(”ON”状態における)任意度モ
ノラル化信号から、2チャンネル信号に切り替える。
【0107】音声認識部74は、状態設定部791の設
定に従い、音声認識を実行/終了する。すなわち、エコ
ーキャンセラ73からのユーザ音声を認識して、その音
声が示すコントロール信号を生成する。こうして生成さ
れたコントロール信号は、図1のコントローラ4に伝達
され、コントローラ4が受信部2やAV処理部3を制御
することによって、テレビジョン受像機において、受信
チャンネルの切り換え等の処理が実行される。
【0108】図9の音声認識装置7のハードウエア的な
構成は、図3と同様である。図3において、ROM12
には、所定のプログラムが予め格納されている。このプ
ログラムには、第1の実施形態で述べた(a)〜(c)
のアルゴリズムと、第2の実施形態で述べた(e)のア
ルゴリズムと、第3の実施形態で述べた(f)のアルゴ
リズムとに加え、さらに(g)2チャンネル信号のモノ
ラル度を判定するためのアルゴリズム、および(h)2
チャンネル信号を任意の程度にモノラル化するためのア
ルゴリズムが記述されている。CPU10は、RAM1
1を作業領域として利用しつつ、上記のプログラムに従
って動作する。これによって、図9に示される各ブロッ
クの機能が実現される。
【0109】なお、起動命令部792,終了命令部79
3は、図1のコントローパネルを構成するボタンによっ
て実現される。また、起動命令部792,終了命令部7
93以外の各ブロックの機能をソフト的に実現する代わ
りに、各々専用のハード回路によって実現することもで
きる。
【0110】以上のように構成されたAV機器用音声認
識装置7について、以下、その動作を述べる。図7の音
声認識装置7では、音声認識の動作状態(”ON”状
態)においては、ステレオ信号を完全にモノラル化して
からスピーカ9aおよび9bで再生しているため、ステ
レオ感がまったく無いという欠点があった。一方、音声
認識の動作状態でもステレオ再生を行った図2の音声認
識装置7では、Sr≒Slの仮定が大きく崩れるモノラ
ル度の低いオーディオ信号が入力している時に、エコー
キャンセラ14のエコー打ち消し量が大きく悪化すると
いう欠点を有していた。ただし、前述したように、通常
のTVなどのステレオ番組にあっては、エコーキャンセ
ラ14の打ち消し量を大きく悪化させるほど、相関の低
いオーディオ信号が左右のチャンネルにミキシングされ
ている場面は少なく、左右均等にミキシングしたセンタ
ー音源に比較的弱いレベルで左右の音源をミキシングし
ている場面がほとんどである。このため、たとえステレ
オ放送であっても、左右のチャンネル間の相関が極めて
強いSr≒Slの仮定が成り立つ時間が多い。問題は、
相関の低い時間をどう乗り切るかである。
【0111】そこで、本実施形態では、エコーキャンセ
ラ73へは常に、完全モノラル化部75で完全にモノラ
ル化信号を入力しているが、スピーカ9aおよび9bへ
は、音声認識の待機状態(”OFF”状態)ではステレ
オ信号を、動作状態では任意度モノラル化部77の出力
を入力する。モノラル度判定部76が信号のモノラル度
を監視し、モノラル度が低いと判定された時にのみ、任
意度モノラル化部77は、モノラル化処理の程度を強め
る。それによって、左右のチャンネルで常に一定以上の
相関が確保できるようになる。
【0112】音声認識機能を利用しようとする場合は、
まず、先の図7の音声認識装置7と同様に、図9の起動
命令部792により音声認識機能の起動信号が状態設定
部791に送られ、状態設定部791は、切り替え部7
8を制御してスピーカ9aおよび9bへの入力信号をス
テレオ信号から任意度モノラル化部77の出力に切り替
え、音声認識の状態をスピーカ9aおよび9bにステレ
オ信号が入力された待機状態から、スピーカ9aおよび
9bに任意度合モノラル化信号が入力された動作状態に
移行させる。モノラル度判定部76が常にオーディオ信
号のモノラル度を監視しており、モノラル度が低いと判
定された時にのみ、任意度モノラル化部77が任意度モ
ノラル化処理を行う。モノラル度の低い一瞬の時間だけ
オーディオ信号のステレオ感が損なわれるが、十分なエ
コー打ち消し量が得られる。
【0113】図10に、図9のモノラル度判定部76の
詳細を示す。図10において、モノラル度判定部76
は、加算器81と、減算器82と、レベル比較器83
と、モノラル度計算部84とを含む。
【0114】完全なモノラル信号の場合は、Sr=Sl
であるから、加算器81の出力は2Srとなり、減算器
82の出力は”0”となり、{(減算器82の出力レベ
ル)/(加算器81の出力レベル)}を求めるレベル比
較器83の出力も”0”になる。一方、完全なステレオ
信号の場合、すなわちSrとSlとが完全に無相関であ
る場合には、加算器81の出力はSr+Sl、減算器8
2の出力はSr−Slになる。SrとSlとが完全に無
相関であるから、Sr+Slのレベルと、Sr−Slの
レベルとは等しく、レベル比較器83の出力は”1”に
なる。次に、モノラル度計算部84が{1−(レベル比
較器出力)}を計算し、モノラル度判定部76は、完全
なモノラル信号では”1”を、完全なステレオ信号で
は”0”を出力する。
【0115】このように、モノラル度判定部76は、入
力信号のモノラル度に応じて1〜0の間の値を出力し、
この値を監視することにより、入力信号のモノラル度を
判定することができる。
【0116】図11に、図9の任意度モノラル化部77
の詳細を示す。図11において、任意度モノラル化部7
7は、処理強度決定部91と、減衰器921〜924
と、加算器931および932とを含む。図10のモノ
ラル度計算部84の出力が、図11の処理強度決定部9
1に入力され、処理強度決定部91は、この値に応じて
モノラル化の処理強度を決定する。この処理強度に応じ
て、減衰器921〜924の減衰量が制御される。
【0117】図12は、図11の処理強度決定部91が
行うモノラル化処理の強度、および図11の減衰器92
1〜924を通じて実現される利得(減衰量)を示す図
である。図12(A)において、特性101は、図11
の処理強度決定部91に入力されたモノラル度と、処理
強度決定部91から出力される処理強度との関係を示
す。図12(B)において、特性102および特性10
3は、この処理強度決定部91から出力される処理強度
により、減衰器921〜924の利得がどのように制御
されるかを示している。特性102が減衰器921およ
び減衰器924の利得を示し、特性103が減衰器92
2および減衰器923の利得を示している。
【0118】本実施形態においては、処理強度決定部9
1は、入力信号のモノラル度が1.0〜0.5の範囲で
は、特性101に示すように、減衰器921〜924に
対し、モノラル化処理強度として”0”を出力する。モ
ノラル化処理強度が”0”の時、任意度モノラル化部7
7は、特性102と特性103とからからるように、モ
ノラル化処理を行わない。
【0119】処理強度決定部91は、入力信号のモノラ
ル度が0.5以下になった場合にのみ”0”以上のモノ
ラル度処理強度を出力する。たとえばモノラル度”0”
の完全なステレオ信号が入力された場合は、処理強度決
定部91は、減衰器921〜924に対し、モノラル化
処理強度として”0.5”を出力し、この時、任意度モ
ノラル化部77からは、”0.5”のモノラル度をもつ
信号が出力される。
【0120】図12に示す制御方式に従えば、モノラル
化の処理強度が”0”の時には、右チャンネル信号がS
r、左チャンネル信号がSlになり、図1のAV処理部
3からのステレオ信号がそのままスピーカ9aおよび9
bに入力される。処理強度が”1”の時には、両チャン
ネルとも{(Sr+Sl)/2}となり、完全にモノラ
ル化された信号がスピーカ9aおよび9bに入力され
る。図12に示す特性では、処理強度の最大値が0.5
に制限されている。このような範囲に制限する理由は、
聴感上の自然性を確保しつつ、実用上十分なエコー打ち
消し量を得られるようにするためである。
【0121】このようにモノラル化の程度を制限して
も、音声認識の動作状態においては、短時間ではあるが
オーディオ信号のステレオ感が損なわれる。そこで、音
声認識機能の利用が終了すると同時に、終了命令部79
3から音声認識機能の終了信号が状態設定部791に送
られ、状態設定部791は、切り替え部78を制御して
スピーカ9aおよび9bへの入力信号を任意度モノラル
化部77の出力からステレオ信号へ切り替え、音声認識
の状態を、スピーカ9aおよび9bに任意度モノラル化
信号が入力された動作状態から、スピーカ9aおよび9
bにステレオ信号が入力された待機状態に切り替える。
これにより、ある程度以上のステレオ感を確保しなが
ら、常に十分なエコー打ち消し量を得ることができる。
【0122】以上のように、本実施形態によれば、音声
認識機能の動作状態にあっても、普通のステレオ信号の
場合はそのまま再生し、極端にモノラル度の低いステレ
オ信号だけに対してモノラル化処理を加えることによ
り、第3の実施形態よりも若干はエコー打ち消し効果は
落ちるが、常に一定レベル以上のエコー打ち消し量を確
保しつつ、ステレオ感の悪化をはるかに小さく抑えるこ
とができる。
【0123】(第5の実施形態)図13は、本発明の第
5の実施形態に係るAV機器用音声認識装置の構成を示
すブロック図である。図13の音声認識装置7は、図1
のAV機器に設けられた音声認識装置7と対応してい
る。ただし、本実施形態では、AV機器において、AV
処理部3から4チャンネル信号が出力され、スピーカユ
ニット9に含まれる4つのスピーカ9a〜9dを通じて
4チャンネル音響が出力されるものとする。
【0124】図13において、音声認識装置7は、2チ
ャンネル化部115と、モノラル化部116と、1個の
エコーキャンセラ113と、音声認識部114と、起動
命令部1192と、終了命令部1193と、音声検出部
117と、状態設定部1191と、切り替え部118と
を備えている。すなわち、図13の音声認識装置7は、
図7の音声認識装置7(第3の実施形態)において、2
つの選択肢の間で切り替えを行う切り替え部56を、3
つの選択肢の間で切り替えを行う切り替え部118に置
き換えた上、2チャンネル化部115と、音声検出部1
17とを追加したものである。音声検出部117は、図
5の音声検出部37(第2の実施形態を参照)と同じも
のである。スピーカ9a〜9dへと入力される信号は、
図1のAV処理部3から出力される4チャンネル信号で
ある。
【0125】スピーカ9a〜9dへ向かう4チャンネル
信号が分岐されて2チャンネル化部115に入力され、
2チャンネル化部115は、その4チャンネル信号を2
チャンネル化する。2チャンネル化部115の出力(以
下、2チャンネル化信号)は、モノラル化部116に入
力され、モノラル化部116は、その2チャンネル化信
号をモノラル化する。
【0126】マイクロホン6から出力される信号(マイ
クロホン出力)と、モノラル化部116から出力される
信号(モノラル化信号)とがエコーキャンセラ113へ
と与えられ、エコーキャンセラ113は、そのマイクロ
ホン出力からユーザの音声と対応する信号(以下、ユー
ザ音声)だけを抽出する。なお、エコーキャンセラ11
3の動作原理については、第1の実施形態で説明した。
【0127】起動命令部1192は、音声認識動作の起
動を命令する。終了命令部1193は、音声認識動作の
終了を命令する。状態設定部1191は、起動命令部1
192,終了命令部1193からの命令を受け、音声認
識部114の動作状態を設定(つまり音声認識動作を”
ON”/”OFF”)する。音声検出部117へは、モ
ノラル化部116の出力(モノラル化信号)と、エコー
キャンセラ113の出力(ユーザ音声)とが与えられ、
音声検出部117は、両出力のレベル比に基づいて、ユ
ーザ音声を検出する。
【0128】モノラル化部116から出力される信号
(モノラル化信号)と、2チャンネル化部115から出
力される信号(2チャンネル化信号)と、図1のAV処
理部3からの4チャンネル信号とが切り替え部118へ
と与えられ、切り替え部118は、状態設定部1191
が音声認識動作を”ON”状態に設定すると、スピーカ
9a〜9dへの入力を、(”OFF”状態における)4
チャンネル信号から、2チャンネル化信号に切り替え
る。さらに、この”ON”状態において、音声検出部1
17がユーザ音声を検出すると、スピーカ9a〜9dへ
の入力を、(”ON”状態における)2チャンネル化信
号から、モノラル化信号に切り替える。また、切り替え
部118は、状態設定部1191が音声認識動作を”O
FF”状態に設定すると、スピーカ9a〜9dへの入力
を、(”ON”状態における)2チャンネル化信号また
はモノラル化信号から、4チャンネル信号に切り替え
る。
【0129】音声認識部114は、状態設定部1191
の設定に従い、音声認識を実行/終了する。すなわち、
エコーキャンセラ113からのユーザ音声を認識して、
その音声が示すコントロール信号を生成する。こうして
生成されたコントロール信号は、図1のコントローラ4
に伝達され、コントローラ4が受信部2やAV処理部3
を制御することによって、テレビジョン受像機におい
て、受信チャンネルの切り換え等の処理が実行される。
【0130】図13の音声認識装置7のハードウエア的
な構成は、図3と同様である。図3において、ROM1
2には、所定のプログラムが予め格納されている。この
プログラムには、第1の実施形態で述べた(a)〜
(c)のアルゴリズムと、第2の実施形態で述べた
(d)および(e)のアルゴリズム(ただしスピーカへ
の入力信号を切り替える際の選択肢の数は異なる)と、
第3の実施形態で述べた(f)のアルゴリズムとに加
え、さらに(i)4チャンネル信号を2チャンネル化す
るためのアルゴリズムが記述されている。CPU10
は、RAM11を作業領域として利用しつつ、上記のプ
ログラムに従って動作する。これによって、図13に示
される各ブロックの機能が実現される。
【0131】なお、起動命令部1192,終了命令部1
193は、図1のコントローパネルを構成するボタンに
よって実現される。また、起動命令部1192,終了命
令部1193以外の各ブロックの機能をソフト的に実現
する代わりに、各々専用のハード回路によって実現する
こともできる。
【0132】以上のように構成されたAV機器用音声認
識装置7について、以下、その動作を述べる。4チャン
ネルステレオでは、360°の音像定位を特徴とする音
づくりがなされているため、チャンネル間の相関が極め
て弱い。そのため、図1のスピーカユニット9に含まれ
る4つのスピーカ9a〜9dを通じて4チャンネルステ
レオ信号を再生する場合、図2の音声認識装置7では、
十分なエコー打ち消し量が得られず、その結果、正確な
音声認識が行えないことが多い。そこで、図5の音声認
識装置7や、図7の音声認識装置7、図9の音声認識装
置7のように、音声認識の動作状態においてのみ、ある
いはユーザが音声を発した時のみ、スピーカ9a〜9d
からの音響をモノラル化して、必要なエコー打ち消し量
を確保しようということになる。
【0133】ところが、4チャンネルステレオ信号を一
気にモノラル信号にまで変換してユーザに聴かせたので
は、ステレオ感(立体感)の喪失によるユーザの不満が
極めて大きい。そこで、本実施形態では、音声認識の動
作状態においては、4チャンネル信号を2チャンネル化
して2チャンネルステレオ音響をユーザに聴かせ、さら
に、この動作状態においてユーザが音声を発した時の
み、モノラル化音響をユーザに聴かせる。これにより、
動作状態においても、そこそこのステレオ感を保持しな
がら、十分なエコー打ち消し量を確保できる。
【0134】図13において、入力された4チャンネル
信号から、2チャンネル化部115で2チャンネル化信
号が、モノラル化部116でモノラル化信号が生成され
る。エコーキャンセラ113には、常にモノラル化信号
が入力される。音声認識機能を利用しない待機状態で
は、4チャンネル信号がスピーカ9a〜9dに入力され
ている。
【0135】音声認識機能を利用しようとする場合は、
まず、図11の起動命令部1192により音声認識機能
の起動信号が状態設定部1191に送られ、状態設定部
1191は、切り替え部118を制御して、スピーカ9
a〜9dへの入力信号を4チャンネル信号から2チャン
ネル化信号に切り替え、音声認識の状態をスピーカ9a
〜9dに4チャンネル信号が入力された待機状態から、
スピーカ9a〜9dに2チャンネル化信号が入力された
動作状態に移行させる。4チャンネルから2チャンネル
への変換は、右の前後チャンネルの信号を加算して右チ
ャンネル信号とし、左の前後チャンネル信号を加算して
左チャンネル信号とすることにより可能である。モノラ
ル化は、上記4つのチャンネル信号を加算するか、ある
いは左右2つの2チャンネル化信号を加算することによ
り行える。
【0136】動作状態においては、音声検出部117
が、モノラル化信号とエコーキャンセラ出力信号のレベ
ルを監視し、モノラル化信号から予想されるレベル以上
にエコーキャンセラ出力信号のレベルが上昇した時に、
ユーザが音声を発したと判断し、切り替え部118がス
ピーカ9a〜9dの入力を2チャンネル化信号からモノ
ラル化信号に切り替える。
【0137】以上のように、本実施形態によれば、音声
認識機能を利用しない時は4チャンネル再生、音声認識
の機能を働かせた時は2チャンネル再生、音声の入力時
はモノラル再生というように、再生モードを段階的に切
り替えることによって、待機状態においてもそこそこの
ステレオ感が確保でき、しかも、十分なエコー打ち消し
量を得ることが可能となる。
【0138】(第6の実施形態)図14は、本発明の第
6の実施形態に係るAV機器用音声認識装置の構成を示
すブロック図である。図14の音声認識装置7は、図1
のAV機器に設けられた音声認識装置7と対応してい
る。ただし、本実施形態では、AV機器において、AV
処理部3から2チャンネル信号が出力され、スピーカユ
ニット9に含まれる2つのスピーカ9aおよび9bを通
じて2チャンネル音響が出力されるものとする。
【0139】図14において、音声認識装置7は、モノ
ラル化部125と、1個のエコーキャンセラ123と、
音声認識部124と、起動命令部1282と、終了命令
部1283と、状態設定部1281と、切り替え部12
7と、適応音発生部126とを備えている。すなわち、
図14の音声認識装置7は、図7の音声認識装置7(第
3の実施形態)に、適応音発生部126を追加したもの
である。スピーカ9aおよび9bへと入力される信号
は、図1のAV処理部3から出力される2チャンネル信
号である。
【0140】適応音発生部126は、状態設定部128
1の設定に関連して、モノラルの適応音を発生する。す
なわち、状態設定部1281の設定によって音声認識動
作が”OFF”状態から”ON”状態へと移行するのを
受け、適応音発生部126は、モノラルの適応音を発生
する。
【0141】上記の適応音は、エコーキャンセラ123
の適応動作を促進する作用を有する。すなわち、音声認
識動作が”OFF”状態から”ON”状態へと移行する
のに伴い、スピーカ9aおよび9bからの出力が2チャ
ンネル音響からモノラル化音響へと切り替わるが、この
切り替わり直後のスピーカ9aおよび9b出力のレベル
が0(つまり無音響)または0に近い値であったとする
と、エコーキャンセラ123では、2チャンネルに適応
していたディジタルフィルタ123aのモノラルへの適
応が進行しない。
【0142】この時突然、スピーカ9aおよび9bから
高レベルのモノラル化音響が出力されると、エコーキャ
ンセラ123は、その音響を打ち消すことができない。
その結果、音声認識部124に反響音が混入し、ユーザ
音声を正確に認識できなくなる恐れがある。そこで、音
声認識動作が”OFF”状態から”ON”状態へと移行
する際、スピーカ9aおよび9bからモノラルの適応音
響が出力されるようにして、ディジタルフィルタ123
を強制的にモノラルに適応させる。適応音発生部126
以外の構成要素の動作は、第3の実施形態と同様なの
で、説明を省略する。
【0143】図14の音声認識装置7のハードウエア的
な構成は、図3と同様である。図3において、ROM1
2には、所定のプログラムが予め格納されている。この
プログラムには、第1の実施形態で述べた(a)〜
(c)のアルゴリズムと、第2の実施形態で述べた
(e)のアルゴリズムと、第3の実施形態で述べた
(f)のアルゴリズムとに加え、さらに(j)適応音を
発生するためのアルゴリズム(あるいは適応音のサンプ
リングデータ)が記述されている。CPU10は、RA
M11を作業領域として利用しつつ、上記のプログラム
に従って動作する。これによって、図14に示される各
ブロックの機能が実現される。
【0144】なお、起動命令部1282,終了命令部1
283は、図1のコントローパネルを構成するボタンに
よって実現される。また、起動命令部1282,終了命
令部1283以外の各ブロックの機能をソフト的に実現
する代わりに、各々専用のハード回路によって実現する
こともできる。
【0145】以上のように構成されたAV機器用音声認
識装置7について、以下、その動作を述べる。図14の
音声認識装置7は、図7の音声認識装置7が持つ欠点、
すなわち、音声認識の待機状態から動作状態への移行直
後において、エコーキャンセラ54のエコー打ち消し量
が十分ではないという欠点を解決するものである。
【0146】図7の音声認識装置7では、音声認識の待
機状態において、スピーカ9aおよび9bにはステレオ
信号が、エコーキャンセラ54にはモノラル化信号が入
力されているため、エコーキャンセラ54の適応は十分
なものではなく、完全なエコー打ち消しが行えない。そ
こで、音声認識機能を利用しようとする時に、動作状態
に移行してスピーカ9aおよび9bへの入力信号をモノ
ラル化信号に切り替えることによりエコーキャンセラ5
4を十分に適応させ、完全なエコー打ち消しを行わせる
ようにしていた。しかし、そのようにしても、スピーカ
9aおよび9bから音が出ない限りは、エコーキャンセ
ラ54の適応は進まない。従って、切り替え直後から長
い無音区間が続き、ユーザが音声を入力中にスピーカ9
aおよび9bから音が出始めた時には、スピーカ9aお
よび9bからの反響音を十分に打ち消せないことにな
る。
【0147】そこで、図14の音声認識装置7では、待
機状態から動作状態への移行の直後に、適応音発生部1
26からスピーカ9aおよび9bに、エコーキャンセラ
123の適応を促進するためのモノラルの適応音を数秒
間入力する構成としている。適応音としては、「音声入
力をお願いします」などの合成音声が考えられる。
【0148】以上のように、本実施形態によれば、待機
状態から動作状態に移行した直後に、モノラルの適応音
をスピーカ9aおよび9bから出力させることにより、
移行直後であっても、十分なエコー打ち消し量を保証す
ることが可能となる。
【0149】(第7の実施形態)図15は、本発明の第
7の実施形態に係るAV機器用音声認識装置の構成を示
すブロック図である。図15の音声認識装置7は、図1
のAV機器に設けられた音声認識装置7と対応してい
る。ただし、本実施形態では、AV機器において、AV
処理部3から2チャンネル信号が出力され、スピーカユ
ニット9に含まれる2つのスピーカ9aおよび9bを通
じて2チャンネル音響が出力されるものとする。
【0150】図15において、音声認識装置7は、モノ
ラル化部135と、1個のエコーキャンセラ133と、
音声認識部134と、起動命令部1382と、終了命令
部1383と、状態設定部1381と、切り替え部13
6と、打ち消し監視部1371と、音声検出部1372
と、減衰部1373とを備えている。すなわち、図15
の音声認識装置7は、図7の音声認識装置7(第3の実
施形態)に、打ち消し監視部1371と、音声検出部1
372と、減衰部1373とを追加したものである。ス
ピーカ9aおよび9bへと入力される信号は、図1のA
V処理部3から出力される2チャンネル信号である。
【0151】打ち消し監視部1371へは、モノラル化
部135の出力(モノラル化信号)と、エコーキャンセ
ラ133の出力(ユーザ音声)とが与えられ、各出力の
レベル変動を監視することにより、エコーキャンセラ1
33において反響音が十分打ち消されているか(つま
り、ディジタルフィルタ133aのモノラルへの適応が
十分進んでいるか)を判定する。すなわち、モノラル化
信号のレベルが急激に立ち上がった時、ユーザ音声のレ
ベルも急に立ち上がれば、反響音は十分には打ち消され
ていないことになり、逆に、ほとんど立ち上がらなけれ
ば、反響音は十分に打ち消されているといえる。
【0152】減衰部1373は、打ち消し監視部137
1の監視結果、および状態設定部1381の設定に関連
して、図1のAV処理部3から入力される2チャンネル
信号を減衰させる。すなわち、エコーキャンセラ133
において反響音が十分には打ち消されていない時に、状
態設定部1381の設定によって音声認識動作が”OF
F”状態から”ON”状態へと移行するのを受け、減衰
部1373は2チャンネル信号を一時的に減衰させる。
【0153】上記のようにして2チャンネル信号を減衰
させれば、音声認識部134への反響音の混入を防止す
ることができる。すなわち、音声認識動作が”OFF”
状態から”ON”状態へと移行するのに伴い、スピーカ
9aおよび9bからの出力が2チャンネル音響からモノ
ラル化音響へと切り替わるが、この切り替わり直後のス
ピーカ出力のレベルが0(つまり無音響)または0に近
い値であったとすると、エコーキャンセラ133では、
2チャンネルに適応していたディジタルフィルタ133
aのモノラルへの適応が進行しない。
【0154】この時突然、スピーカ9aおよび9bから
高レベルのモノラル化音響が出力されると、エコーキャ
ンセラ133は、その音響を打ち消すことができない。
そこで、反響音が十分には打ち消されていない場合に
は、音声認識動作が”OFF”状態から”ON”状態へ
と移行する際に、スピーカ9aおよび9bから出力され
るモノラル化信号のレベルを低下させることによって、
音声認識部134への反響音の混入を防止する。打ち消
し監視部1371、音声検出部1372および減衰部1
373以外の構成要素の動作は、第3の実施形態と同様
なので、説明を省略する。
【0155】図15の音声認識装置7のハードウエア的
な構成は、図3と同様である。図3において、ROM1
2には、所定のプログラムが予め格納されている。この
プログラムには、第1の実施形態で述べた(a)〜
(c)のアルゴリズムと、第2の実施形態で述べた
(e)のアルゴリズムと、第3の実施形態で述べた
(f)のアルゴリズムとに加え、さらに(k)反響音が
十分打ち消されているかを監視するためのアルゴリズ
ム、および(l)スピーカへの2チャンネル信号を減衰
させるためのアルゴリズムが記述されている。CPU1
0は、RAM11を作業領域として利用しつつ、上記の
プログラムに従って動作する。これによって、図15に
示される各ブロックの機能が実現される。
【0156】なお、起動命令部1382,終了命令部1
383は、図1のコントローパネルを構成するボタンに
よって実現される。また、起動命令部1382,終了命
令部1383以外の各ブロックの機能をソフト的に実現
する代わりに、各々専用のハード回路によって実現する
こともできる。
【0157】以上のように構成されたAV機器用音声認
識装置7について、以下、その動作を述べる。図15の
音声認識装置7は、先の図14の音声認識装置7と同
様、図7の音声認識装置7が持つ欠点、すなわち、待機
状態から動作状態への移行直後において、エコーキャン
セラ54のエコー打ち消し量が十分ではないという欠点
を解決するものである。
【0158】図15の音声認識装置7には、前述のよう
に、モノラル化部135の出力信号レベルと、エコーキ
ャンセラ133の出力信号レベルとを監視して、反響音
が十分打ち消されているかを判定する打ち消し監視部1
371と、モノラル化部135の出力信号レベルと、エ
コーキャンセラ133の出力信号レベルとを監視して、
ユーザが音声を発したか否かを判断する音声検出部13
72と、スピーカ9aおよび9bへの入力信号を減衰さ
せる減衰部1373とが設けられている。待機状態から
動作状態に移行した直後は、エコーキャンセラ133の
適応が完全ではなく、当然、エコーキャンセラ133に
おけるエコー打ち消し効果も悪い。もし、動作状態への
移行後、スピーカ9aおよび9bへの入力信号において
無音区間が続き、エコーキャンセラ133が適応できな
いうちに、ユーザが音声を発し、しかも、ユーザが音声
を発している最中にスピーカ9aおよび9bから音が出
始めた時、エコーキャンセラ133は、スピーカ9aお
よび9bからの反響音を十分に打ち消すことができず、
音声認識部134への音声にスピーカ9aおよび9bか
らの反響音が混入することになる。
【0159】そこで、本実施形態では、音声検出部13
72と減衰部1373とを設け、モノラル化信号におい
て無音区間が続いており、エコーキャンセラ133によ
って反響音が十分打ち消されてないと打ち消し監視部1
371が判定し、しかも音声検出部1372がユーザ音
声を検出した時、減衰部1373によりスピーカ9aお
よび9bへの入力信号を減衰させ、それによって、ユー
ザ音声への反響音の混入を少なくしている。ユーザが音
声を発しない状態でスピーカ9aおよび9bへのモノラ
ル化信号が無音から有音となった場合には、減衰部13
73の減衰量を”0”とし、スピーカ9aおよび9bか
ら出力されるモノラル化音響を適応音として、エコーキ
ャンセラ133の適応を促進する。また、エコーキャン
セラ133の適応が進み、残存エコーが小さくなった場
合には、音声検出時においても減衰量は”0”に制御さ
れる。
【0160】以上のように、本実施形態によれば、待機
状態(音声認識動作が”OFF”の状態)から動作状態
(”ON”の状態)に移行した直後のエコー打ち消し量
が十分でない状態においてユーザが音声を発した時、こ
れを検知してスピーカ9aおよび9bへの入力信号に適
切な減衰を挿入して、スピーカ9aおよび9bからの音
響のレベルを下げ、それによって反響音の混入を防止す
るので、エコー打ち消し量が十分でない状態における音
声認識性能が高まる。
【0161】(第8の実施形態)図16は、本発明の第
8の実施形態に係るAV機器用音声認識装置の構成を示
すブロック図である。図16の音声認識装置7は、図1
のAV機器に設けられた音声認識装置7と対応してい
る。ただし、本実施形態では、AV機器において、AV
処理部3から2チャンネル信号が出力され、スピーカユ
ニット9に含まれる2つのスピーカ9aおよび9bを通
じて2チャンネル音響が出力されるものとする。
【0162】図16において、音声認識装置7は、モノ
ラル化部145と、1個のエコーキャンセラ143と、
音声認識部144と、起動命令部1482と、終了命令
部1483と、状態設定部1481と、切り替え部14
6と、適応制御部147とを備えている。すなわち、図
16の音声認識装置7は、図7の音声認識装置7(第3
の実施形態)に、適応制御部147を追加したものであ
る。スピーカ9aおよび9bへと入力される信号は、図
1のAV処理部3から出力される2チャンネル信号であ
る。
【0163】適応制御部147は、状態設定部1481
の設定に関連して、エコーキャンセラ143内の適応デ
ィジタルフィルタ143aの適応速度を制御する。すな
わち、ディジタルフィルタ143aは、入力信号への適
応速度が可変であり、適応制御部147は、モノラル用
の速い適応速度と、2チャンネル用の遅い適応速度とを
予め記憶している。そして、状態設定部1481の設定
によって音声認識動作が”OFF”状態から”ON”状
態へと移行する(それに伴い、スピーカ出力が2チャン
ネル音響からモノラル音響に切り替わる)のを受け、適
応制御部147は、ディジタルフィルタ143aの適応
速度を、遅い適応速度から速い適応速度に変更する。ま
た、音声認識動作が”ON”状態から”OFF”状態へ
と移行するのを受け、ディジタルフィルタ143aの適
応速度を、速い適応速度から遅い適応速度に変更する。
適応制御部147以外の構成要素の動作は、第3の実施
形態と同様なので、説明を省略する。
【0164】図16の音声認識装置7のハードウエア的
な構成は、図3と同様である。図3において、ROM1
2には、所定のプログラムが予め格納されている。この
プログラムには、第1の実施形態で述べた(a)〜
(c)のアルゴリズムと、第2の実施形態で述べた
(e)のアルゴリズムと、第3の実施形態で述べた
(f)のアルゴリズムとに加え、さらに(m)エコーキ
ャンセラの適応速度を制御するためのアルゴリズムが記
述されている。CPU10は、RAM11を作業領域と
して利用しつつ、上記のプログラムに従って動作する。
これによって、図16に示される各ブロックの機能が実
現される。
【0165】なお、起動命令部1482,終了命令部1
483は、図1のコントローパネルを構成するボタンに
よって実現される。また、起動命令部1482,終了命
令部1483以外の各ブロックの機能をソフト的に実現
する代わりに、各々専用のハード回路によって実現する
こともできる。
【0166】以上のように構成されたAV機器用音声認
識装置7について、以下、その動作を述べる。よく知ら
れているように、エコーキャンセラ143の適応は、そ
の出力が”0”になる方向に、推定インパルスレスポン
スを逐次修正していくものである。スピーカ9aおよび
9bとマイクロホン6との間の系(反響路)のインパル
スレスポンスは、家具、人、窓、カーテンなどの影響を
受けて刻々と変化するため、適応動作なくしては満足な
打ち消し量が得られない。ただし、騒音のように、イン
パルスレスポンスをいかに修正しても消去できない信号
がエコーキャンセラ143への入力信号に含まれている
場合には、推定インパルスレスポンスにおいて誤差が生
じ、この誤差がエコー打ち消し量を悪化させる。
【0167】推定インパルスレスポンスの逐次修正にお
いて、1回当たりの修正量を変えることにより、適応速
度を制御することができる。1回当たりの修正量が大き
いと適応速度が速くなり、修正量が小さいと適応速度が
遅くなる。適応速度を速めると、系の変動には強い(つ
まり反響路のインパルスレスポンス変動に素早く追従で
きる)が、雑音には弱くなる(つまり雑音によって適応
動作が不安定となりやすい)。逆に、適応速度を遅くす
ると、系の変動には弱くなるが、雑音には強くなる。従
って、実際の装置では、系の変動への追従性と耐雑音性
との両方をそこそこ満足するような適応速度が選ばれて
いた。
【0168】図7の音声認識装置7では、音声認識の動
作状態においては、スピーカ9aおよび9bからモノラ
ル化された音響が出力され、そのモノラル化音響の反響
音をモノラル化信号で打ち消すため、比較的速い適応速
度でも良好な動作が可能である。ところが、待機状態に
おいては、ステレオ音響の反響音を、モノラル化信号で
打ち消すため、動作状態と同じ適応速度では、推定イン
パルスレスポンスに含まれる誤差が極めて大きくなる。
原理的に打ち消し不可能な信号成分を打ち消そうとエコ
ーキャンセラ143が適応動作を重ねるため、せっかく
推定したインパルスレスポンスを破壊してしまうことに
なる。このように、図7の音声認識装置7は、待機状態
における適応性能が悪いため、待機状態から動作状態へ
の移行直後のエコー打ち消し量が極めて少ないという欠
点を持っていた。
【0169】そこで、図16の音声認識装置7では、エ
コーキャンセラ143の適応速度を制御する適応制御部
147を設けることにより、待機状態から動作状態に切
り替わった直後においても、十分なエコー打ち消し量が
得られるようにした。すなわち、適応制御部147は、
エコーキャンセラ143に対し、スピーカ9aおよび9
bにステレオ信号が入力される待機状態と、モノラル化
信号が入力される動作状態とで、互いに異なる適応速度
を設定する。具体的には、適応制御部147は、待機状
態では、適応速度を遅くして、インパルスレスポンスの
推定精度を確保する。一方、動作状態では、適応速度を
速めることにより、待機状態から動作状態への移行直後
においても、十分なエコー打ち消し効果が得られるよう
にする。
【0170】以上のように、本実施形態によれば、エコ
ーキャンセラ143(内の適応ディジタルフィルタ14
3a)の適応速度を、音声認識部144が動作状態に設
定されている時には速い速度に、待機状態に設定されて
いる時には遅い速度に制御するので、モノラル,マルチ
チャンネルそれぞれに好適なエコー打ち消しを行うこと
ができる。すなわち、スピーカ9a,9bから出力され
るのがマルチチャンネル音響の場合は、適応ディジタル
フィルタ143aから見ると雑音であるステレオ成分が
多いので、遅い適応速度とすることによって耐雑音性を
高め、一方、モノラル化音響の場合は、ステレオ成分が
ないので、速い適応速度とすることによって、反響路の
インパルスレスポンスの変動への追従性を高めることが
できる。
【0171】また、エコーキャンセラ143の適応速度
を、上記のように音声認識動作の状態に応じて変化させ
ることにより、待機状態から動作状態への移行直後にお
いても、優れたエコー打ち消し効果が実現できる。
【0172】(第9の実施形態)図17は、本発明の第
9の実施形態に係るAV機器用音声認識装置の構成を示
すブロック図である。図17の音声認識装置7は、図1
のAV機器に設けられた音声認識装置7と対応してい
る。ただし、本実施形態では、AV機器において、AV
処理部3から2チャンネル信号が出力され、スピーカユ
ニット9に含まれる2つのスピーカ9aおよび9bを通
じて2チャンネル音響が出力されるものとする。
【0173】図17において、音声認識装置7は、モノ
ラル化部155と、1個のエコーキャンセラ153と、
音声認識部154と、起動命令部1582と、終了命令
部1583と、状態設定部1581と、切り替え部15
6と、適応制御部157とを備えている。すなわち、図
17の音声認識装置7は、図16の音声認識装置7(第
8の実施形態)と同様の構成を有する。図16の音声認
識装置7との相違は、次の点である。すなわち、図1の
AV処理部3からの音響信号は、2チャンネル(ステレ
オ)の場合と、モノラルの場合とがあり、図1のAV処
理部3から適応制御部157へ、モノラル/ステレオ識
別信号がさらに与えられる。スピーカ9aおよび9bへ
と入力される信号は、図1のAV処理部3から出力され
る2チャンネルまたはモノラル信号である。
【0174】適応制御部157は、状態設定部1581
の設定と、モノラル/ステレオ識別信号とに関連して、
エコーキャンセラ153内の適応ディジタルフィルタ1
53aの適応速度を制御する。すなわち、ディジタルフ
ィルタ153aは、入力信号への適応速度が可変であ
り、適応制御部157は、モノラル用の速い適応速度
と、2チャンネル用の遅い適応速度とを予め記憶してい
る。状態設定部1581の設定によって音声認識動作
が”OFF”状態から”ON”状態へと移行する(それ
に伴い、スピーカ出力が2チャンネル音響からモノラル
音響に切り替わる)のを受け、適応制御部157は、デ
ィジタルフィルタ153aの適応速度を、遅い適応速度
から速い適応速度に変更する。また、音声認識動作が”
ON”状態から”OFF”状態へと移行するのを受け、
ディジタルフィルタ153aの適応速度を、速い適応速
度から遅い適応速度に変更する。
【0175】ただし、適応制御部157は、モノラル/
ステレオ識別信号がステレオを示している場合のみ、上
記のような適応速度の変更を行い、モノラルを示す場合
には、状態設定部1581の設定に関わらず、ディジタ
ルフィルタ153aの適応速度を速い適応速度とする。
適応制御部157以外の構成要素の動作は、第8の実施
形態と同様なので、説明を省略する。
【0176】図17の音声認識装置7のハードウエア的
な構成は、図3と同様である。図3において、ROM1
2に格納されているプログラムは、第8の実施形態と同
様である。ただし、上記(m)のアルゴリズム、すなわ
ちエコーキャンセラの適応速度を制御するためのアルゴ
リズムについては、音声認識動作の”ON”/”OF
F”状態だけでなく、モノラル/ステレオ識別信号をも
参照して制御を行うように変更が加えられている。CP
U10は、RAM11を作業領域として利用しつつ、上
記のプログラムに従って動作する。これによって、図1
7に示される各ブロックの機能が実現される。
【0177】なお、起動命令部1582,終了命令部1
583は、図1のコントローパネルを構成するボタンに
よって実現される。また、起動命令部1582,終了命
令部1583以外の各ブロックの機能をソフト的に実現
する代わりに、各々専用のハード回路によって実現する
こともできる。
【0178】以上のように構成されたAV機器用音声認
識装置7について、以下、その動作を述べる。一般のT
V放送においては、ステレオ番組とモノラル番組の2つ
の番組があり、ステレオ番組かモノラル番組かを識別す
る識別信号が、映像/音響信号とともに放送されてい
る。受信側では、この識別信号により、現在の番組がス
テレオ番組かモノラル番組かを知ることができる。先の
図16の音声認識装置7では、現在受信しているのがス
テレオ番組かモノラル番組かを問わず、モノラル化部1
55で処理した信号がスピーカ9aおよび9bに入力さ
れていない待機状態においては、エコーキャンセラ15
3の適応速度を落としていたが、待機状態であっても、
適応速度を落としたくないのは当然である。
【0179】適応速度を落とした状態では、エコーキャ
ンセラ153が系の変動に追従できていない可能性があ
り、そのような時に動作状態に移行すると、十分なエコ
ー打ち消し量が得られない。これに対して、待機状態で
あっても適応速度を落とさなければ、エコーキャンセラ
153が常に系の変動に追従できているので、いつ動作
状態に移行しても、十分なエコー打ち消し量が確保でき
るからである。
【0180】放送そのものがモノラル番組であれば、モ
ノラル化部155でモノラル化していない待機状態にお
いても、適応速度を速めることが可能である。そこで、
図17の音声認識装置7では、適応部157は、まず識
別信号をチェックし、その結果、現在受信しているのが
ステレオ番組の場合、待機状態では、エコーキャンセラ
153の適応速度を遅くするが、モノラル番組の場合、
待機状態であっても動作状態と同様、適応速度を速いま
まに保つ。
【0181】以上のように、本実施形態によれば、ステ
レオ/モノラル識別信号に基づいて、現在受信している
番組の音声がステレオかモノラルかを判定して、モノラ
ルの場合は、音声認識動作が待機状態であっても、エコ
ーキャンセラ153の適応速度を遅くしないので、反響
路のインパルスレスポンスの変動への追従性が低下する
ことがなく、その結果、待機状態において優れたエコー
打ち消し効果が実現でき、動作状態へ移行した直後にお
ける音声認識性能が高まる。
【0182】(第10の実施形態)図18は、本発明の
第10の実施形態に係るAV機器用音声認識装置の構成
を示すブロック図である。図18の音声認識装置7は、
図1のAV機器に設けられた音声認識装置7と対応して
いる。ただし、本実施形態では、AV機器において、A
V処理部3から2チャンネル信号が出力され、スピーカ
ユニット9に含まれる2つのスピーカ9aおよび9bを
通じて2チャンネル音響が出力されるものとする。
【0183】図18において、音声認識装置7は、モノ
ラル化部165と、1個のエコーキャンセラ163と、
音声認識部164と、起動命令部1682と、終了命令
部1683と、状態設定部1681と、切り替え部16
6と、モノラル度判定部1671と、適応制御部167
2とを備えている。すなわち、図18の音声認識装置7
は、図16の音声認識装置7(第8の実施形態)に、モ
ノラル度判定部1671を追加したものである。モノラ
ル度判定部1671は、図9のモノラル度判定部76
(第4の実施形態を参照)と同じものである。スピーカ
9aおよび9bへと入力される信号は、図1のAV処理
部3から出力される2チャンネル信号である。
【0184】モノラル度判定部1671へは、上記の2
チャンネル信号が分岐入力され、モノラル度判定部16
71は、その2チャンネル信号のモノラル度を判定す
る。適応制御部1672は、モノラル判定部の判定結果
に関連して、エコーキャンセラ163内の適応ディジタ
ルフィルタ163aの適応速度を制御する。
【0185】すなわち、適応制御部1672は、2チャ
ンネル信号のモノラル度に応じて、ディジタルフィルタ
163aの適応速度を変化させる。好ましくは、モノラ
ル度が高いほど、適応速度を速くする。そのために、適
応制御部1672は、適応速度を速める処理をどの強度
で行うべきかをモノラル度をもとに決定するための関数
(処理強度決定特性;図19に参照番号104で示され
る)を記憶している。モノラル度判定部1671および
適応制御部1672以外の構成要素の動作は、第8の実
施形態と同様なので、説明を省略する。
【0186】図18の音声認識装置7のハードウエア的
な構成は、図3と同様である。図3において、ROM1
2には、所定のプログラムが予め格納されている。この
プログラムには、第1の実施形態で述べた(a)〜
(c)のアルゴリズムと、第2の実施形態で述べた
(e)のアルゴリズムと、第3の実施形態で述べた
(f)のアルゴリズムと、第4の実施形態で述べた
(g)のアルゴリズムと、第8の実施形態で述べた
(m)のアルゴリズムとが記述されている。
【0187】ただし、上記(m)のアルゴリズム、すな
わちエコーキャンセラの適応速度を制御するためのアル
ゴリズムについては、音声認識動作の”ON”/”OF
F”状態に基づいて制御を行う(第8の実施形態)ので
はなく、スピーカへの2チャンネル信号のモノラル度に
基づいて制御を行うように変更が加えられている。CP
U10は、RAM11を作業領域として利用しつつ、上
記のプログラムに従って動作する。これによって、図1
8に示される各ブロックの機能が実現される。
【0188】なお、起動命令部1682,終了命令部1
683は、図1のコントローパネルを構成するボタンに
よって実現される。また、起動命令部1682,終了命
令部1683以外の各ブロックの機能をソフト的に実現
する代わりに、各々専用のハード回路によって実現する
こともできる。
【0189】以上のように構成されたAV機器用音声認
識装置7について、以下、その動作を述べる。図18の
音声認識装置7は、先の図7の音声認識装置7におい
て、モノラル度の低い信号が入力された時に、エコーキ
ャンセラ163の適応精度が劣化するという欠点を解決
するものである。前述したように、エコーキャンセラ1
63の適応は、その出力が”0”になる方向に、推定イ
ンパルスレスポンスを逐次修正していくものであり、騒
音のように、インパルスレスポンスをいかに修正しても
消去できない信号がエコーキャンセラ163への入力信
号に含まれている場合には、推定インパルスレスポンス
において誤差が生じ、この誤差がエコー打ち消し量を悪
化させる。
【0190】これと同じことが、ステレオ信号の反響音
を、モノラル化信号で打ち消す場合に起きる。すなわ
ち、ステレオ信号の反響音をモノラル化信号で打ち消す
場合、原理的に、インパルスレスポンスをいかに修正し
ても打ち消せない成分が残る。この打ち消せない成分
(ステレオ成分)が多い場合、すなわち、モノラル度の
低いステレオ信号の場合には、原理的に打ち消せない信
号を打ち消そうとエコーキャンセラ163が適応動作を
重ねるため、せっかく推定したインパルスレスポンスを
大きく破壊することになる。
【0191】そこで、図18の音声認識装置7では、A
V処理部3からのステレオ信号を分析して、原理的にエ
コー打ち消しが精度よく行え適応動作に適した信号であ
るかどうかを判断し、適応動作に適すると判断された時
に、エコーキャンセラ163に適応動作を行わせる。
【0192】図18の音声認識装置7では、適応に適し
た信号か否かは、信号のモノラル度で判断している。前
述したように、モノラル度の高い信号ほどエコー打ち消
し効果が高く、インパルスレスポンスの推定がうまく行
える。そこで、まず、モノラル度判定部1671がステ
レオ信号のモノラル度を求める。次に、適応制御部16
72がこのモノラル度に応じて、エコーキャンセラ16
3の適応速度を制御する。
【0193】図19は、図18の適応制御部1672が
行う適応速度制御処理の特性を示す図である。図19に
おいて、特性191は、図18のスピーカ9aおよび9
bへ向かうステレオ信号のモノラル度と、エコーキャン
セラ163の適応速度との関係を示している。図19か
らわかるように、適応制御部1672は、ステレオ信号
のモノラル度が高く適応に適すると判断した場合には、
適応速度を上げて常に最良の推定インパルスレスポンス
を得られるようにする。一方、モノラル度が低く適応に
適さないと判断した場合には、適応速度を下げて推定イ
ンパルスレスポンスの破壊を防止する。
【0194】以上のように、本実施形態によれば、2チ
ャンネル信号(ステレオ信号)のモノラル度に基づい
て、適応ディジタルフィルタ163aの適応速度を制御
するので、様々なモノラル度を持った2チャンネル信号
に好適なエコー打ち消しを行うことができる。すなわ
ち、モノラル度が低い場合、適応速度を遅くして、耐雑
音性を高める。一方、モノラル度が高い場合、適応ディ
ジタルフィルタ163aから見ると雑音であるステレオ
成分が少ないので、耐雑音性はあまり必要でない。よっ
て、適応速度を速くすることによって、反響路のインパ
ルスレスポンスの変動への追従性を高めることができ
る。その結果、特にモノラル度が高い場合に、優れたエ
コー打ち消し効果が実現でき、動作状態へ移行した直後
における音声認識性能が高まる。
【0195】(第11の実施形態)図20は、本発明の
第11の実施形態に係るAV機器用音声認識装置の構成
を示すブロック図である。図20の音声認識装置7は、
図1のAV機器に設けられた音声認識装置7と対応して
いる。ただし、本実施形態では、AV機器において、A
V処理部3から2チャンネル信号が出力され、スピーカ
ユニット9に含まれる2つのスピーカ9aおよび9bを
通じて2チャンネル音響が出力されるものとする。
【0196】図20において、音声認識装置7は、モノ
ラル化部175と、1個のエコーキャンセラ173と、
音声認識部174と、起動命令部1782と、終了命令
部1783と、状態設定部1781と、切り替え部17
6と、不揮発メモリ177とを備えている。すなわち、
図20の音声認識装置7は、図7の音声認識装置7(第
3の実施形態)に、不揮発メモリ177を追加したもの
である。スピーカ9aおよび9bへと入力される信号
は、図1のAV処理部3から出力される2チャンネル信
号である。
【0197】不揮発メモリ177へは、図1のコントロ
ールパネル5からの電源”ON”/”OFF”信号が与
えられ、不揮発メモリ177は、電源”OFF”時、エ
コーキャンセラ173が保持している推定インパルスレ
スポンスを取得し、それを記憶する。そして、電源”O
N”時、記憶している推定インパルスレスポンスを、エ
コーキャンセラ173(内の適応ディジタルフィルタ1
73a)に与える。エコーキャンセラ173は、反響音
を打ち消す動作を開始する際に、この不揮発メモリ17
7から与えられた推定インパルスレスポンスを初期値と
して用いる。すなわち、適応ディジタルフィルタ173
aは、不揮発メモリ177から与えられた値を初期値と
してインパルスレスポンスの推定を開始する。
【0198】エコーキャンセラ173は、電源”ON”
時に用いる初期値の違いを除けば、図7のエコーキャン
セラ54(第3の実施形態)と同様の動作を行う。な
お、エコーキャンセラ54の場合、反響音を打ち消す動
作を開始する際、”0”を初期値として用いるので、電
源”ON”の直後から、ディジタルフィルタ54aの適
応が進むまでの期間、反響音が十分に打ち消されない問
題があった。不揮発メモリ177およびエコーキャンセ
ラ173以外の構成要素の動作は、第3の実施形態と同
様なので、説明を省略する。
【0199】図20の音声認識装置7のハードウエア的
な構成は、図3において、さらに不揮発メモリ177を
追加したものである。ROM12には、所定のプログラ
ムが予め格納されている。このプログラムには、第1の
実施形態で述べた(a)〜(c)のアルゴリズムと、第
2の実施形態で述べた(e)のアルゴリズムと、第3の
実施形態で述べた(f)のアルゴリズムとに加え、さら
に(n)電源”OFF”時にエコーキャンセラ173が
保持している推定インパルスレスポンスを不揮発メモリ
177に書き込み、かつ電源”ON”時、その推定イン
パルスレスポンスをエコーキャンセラ173に与える手
順が記述されている。CPU10は、RAM11を作業
領域として利用しつつ、上記のプログラムに従って動作
する。これによって、図20に示される各ブロックの機
能が実現される。
【0200】なお、起動命令部1782,終了命令部1
783は、図1のコントローパネルを構成するボタンに
よって実現される。また、起動命令部1782,終了命
令部1783以外の各ブロックの機能をソフト的に実現
する代わりに、各々専用のハード回路によって実現する
こともできる。
【0201】以上のように構成されたAV機器用音声認
識装置7について、以下、その動作を述べる。スピーカ
9aおよび9bからマイクロホン6までの反響路のイン
パルスレスポンスは、壁、天井、床、家具、人、窓、カ
ーテンなどでの音響の反射状態によって決まる。同じA
V機器であっても、設置環境により千差万別のインパル
スレスポンスが得られる。しかも、AV機器の移動、家
具の移動、人の出入り、窓の開閉などにより時々刻々と
変化する。固定したインパルスレスポンスでは、十分な
エコー打ち消し効果が得られない。このため、図7の音
声認識装置7のエコーキャンセラ173は、逐次適応を
行っており、常に最新のインパルスレスポンスを推定し
ている。しかし、インパルスレスポンスの初期値を”
0”とした適応方法では、電源”ON”の直後に十分な
エコー打ち消し量が得られないという欠点があった。
【0202】人とか窓といった細かい変化を除けば、A
V機器の設置位置や部屋形状などで決まる大まかなイン
パルスレスポンスは、部屋の家具の配置換えなどをしな
ければ、今日昨日で大きく変わるものではない。昨日の
電源”OFF”時の推定インパルスレスポンスを、今日
の電源”ON”時に使用しても、そこそこのエコー打ち
消し量が得られる場合が多い。
【0203】そこで、図20の音声認識装置7では、不
揮発メモリ177を設け、電源”OFF”時にエコーキ
ャンセラ173が保持していた推定インパルスレスポン
スを不揮発メモリ177に記憶させ、電源”ON”時に
は、この不揮発メモリ177が記憶している推定インパ
ルスレスポンスを初期値として、エコーキャンセラ17
3をスタートさせる。
【0204】以上のように、本実施形態によれば、電
源”OFF”時の推定インパルスレスポンスを記憶して
おき、電源”ON”時、それを初期値としてインパルス
レスポンスの推定を開始するので、”0”を初期値とす
る場合と比べ、電源”ON”直後の推定誤差が小さくな
り、その結果、音声認識性能が高まる。
【0205】(第12の実施形態)図21は、本発明の
第12の実施形態に係るAV機器用音声認識装置の構成
を示すブロック図である。図21の音声認識装置7は、
図1のAV機器に設けられた音声認識装置7と対応して
いる。ただし、本実施形態では、AV機器において、A
V処理部3から2チャンネル信号が出力され、スピーカ
ユニット9に含まれる2つのスピーカ9aおよび9bを
通じて2チャンネル音響が出力されるものとする。
【0206】図21において、音声認識装置7は、モノ
ラル化部185と、1個のエコーキャンセラ183と、
音声認識部184と、音声検出部187と、起動命令部
としてのボタンスイッチ1882と、終了命令部として
の時限スイッチ1883と、状態設定部1881と、切
り替え部186とを備えている。すなわち、図21の音
声認識装置7は、図7の音声認識装置7(第3の実施形
態)において、音声検出部187を追加し、さらに、起
動命令部581を特にボタンスイッチ1882とし、か
つ終了命令部582を特に時限スイッチ1883とした
ものである。音声検出部187は、図5の音声検出部3
7と同じものである(第2の実施形態を参照)。スピー
カ9aおよび9bへと入力される信号は、図1のAV処
理部3から出力される2チャンネル信号である。
【0207】ボタンスイッチ1882が押されると、ボ
タンスイッチ1882から状態設定部1881へ、音声
認識動作の起動を命令する信号が送られる。音声検出部
187は、ユーザ音声の有無を検出して、検出結果を時
限スイッチ1883に通知する。時限スイッチ1883
は、ユーザの音声が有の状態から無の状態へ移行した瞬
間を捉えて計時処理を開始する。そして、計時開始から
予め決められた時間が経過すると、状態設定部1881
へ、音声認識動作の終了を命令する信号を送る。
【0208】状態設定部1881は、ボタンスイッチ1
882,時限スイッチ1883からの命令信号を受け、
音声認識部184の動作状態を設定(つまり音声認識動
作を”ON”/”OFF”)する。音声検出部187、
ボタンスイッチ1882、時限スイッチ1883および
状態設定部1881以外の構成要素の動作は、第3の実
施形態と同様なので、説明を省略する。
【0209】図21の音声認識装置7のハードウエア的
な構成は、図3と同様である。図3において、ROM1
2には、所定のプログラムが予め格納されている。この
プログラムには、第1の実施形態で述べた(a)〜
(c)のアルゴリズムと、第2の実施形態で述べた
(e)のアルゴリズムと、第3の実施形態で述べた
(f)のアルゴリズムとに加え、さらに(o)計時を行
い、かつ計時開始から予め決められた時間が経過すると
終了命令信号を送信する手順が記述されている。CPU
10は、RAM11を作業領域として利用しつつ、上記
のプログラムに従って動作する。これによって、図21
に示される各ブロックの機能が実現される。
【0210】なお、ボタンスイッチ1882は、図1の
コントローパネルを構成するいずれかのボタンによって
実現される。また、ボタンスイッチ1882以外の各ブ
ロックの機能をソフト的に実現する代わりに、各々専用
のハード回路によって実現することもできる。
【0211】以上のように構成されたAV機器用音声認
識装置7について、以下、その動作を述べる。本実施形
態では、図7の音声認識装置7において、起動命令部5
81および終了命令部582の具体例を示している。ユ
ーザは、音声認識機能を利用しようとする場合、まず、
図7の起動命令部581に相当するボタンスイッチ18
82を押す。すると、状態設定部1881に対して待機
状態(音声認識動作が”OFF”の状態)から動作状態
(”ON”状態)への切り替えの指示がなされ、かつ、
時限スイッチ1883に対して時間計測開始の指示がな
される。
【0212】動作状態においては、音声検出部187が
ユーザ音声が入力されたか否かをチェックし、音声が検
出された時に、時限スイッチ1883は、計測時間をリ
セットする(つまり計測時間を0に戻す)。音声が検出
されない状態が続き、時限スイッチ1883の計測時間
が定められた値を超えた時、時限スイッチ1883は、
状態設定部1881に動作状態から待機状態への切り替
えを指示する。
【0213】以上のように、本実施形態によれば、音声
認識機能の終了を自動的に行えるようになる。
【0214】(第13の実施形態)図22は、本発明の
第13の実施形態に係るAV機器用音声認識装置の構成
を示すブロック図である。図22の音声認識装置7は、
図1のAV機器に設けられた音声認識装置7と対応して
いる。ただし、本実施形態では、AV機器において、A
V処理部3から2チャンネル信号が出力され、スピーカ
ユニット9に含まれる2つのスピーカ9aおよび9bを
通じて2チャンネル音響が出力されるものとする。
【0215】図22において、音声認識装置7は、モノ
ラル化部195と、1個のエコーキャンセラ193と、
音声認識部194と、音声検出部197と、起動命令部
としての音声スイッチ1982と、終了命令部としての
時限スイッチ1983と、状態設定部1981と、切り
替え部196とを備えている。すなわち、図22の音声
認識装置7は、図7の音声認識装置7(第3の実施形
態)において、音声検出部197を追加し、さらに、起
動命令部581を特に音声スイッチ1982とし、かつ
終了命令部582を特に時限スイッチ1983としたも
のである。音声検出部197は、図5の音声検出部37
と同じものである(第2の実施形態を参照)。スピーカ
9aおよび9bへと入力される信号は、図1のAV処理
部3から出力される2チャンネル信号である。
【0216】音声検出部197は、ユーザ音声の有無を
検出して、検出結果を音声スイッチ1982および時限
スイッチ1983に通知する。音声スイッチ1982
は、ユーザ音声が無から有に移行した瞬間を捉えて、状
態設定部1981へ音声認識動作の起動を命令する信号
を送る。時限スイッチ1983は、ユーザの音声が有の
状態から無の状態へ移行した瞬間を捉えて計時処理を開
始する。そして、計時開始から予め決められた時間が経
過すると、状態設定部1981へ、音声認識動作の終了
を命令する信号を送る。
【0217】状態設定部1981は、音声スイッチ19
82,時限スイッチ1983からの命令信号を受け、音
声認識部194の動作状態を設定(つまり音声認識動作
を”ON”/”OFF”)する。音声検出部197、音
声スイッチ1982、時限スイッチ1983および状態
設定部1981以外の構成要素の動作は、第3の実施形
態と同様なので、説明を省略する。
【0218】図22の音声認識装置7のハードウエア的
な構成は、図3と同様である。図3において、ROM1
2には、所定のプログラムが予め格納されている。この
プログラムには、第1の実施形態で述べた(a)〜
(c)のアルゴリズムと、第2の実施形態で述べた
(e)のアルゴリズムと、第3の実施形態で述べた
(f)のアルゴリズムと、第12の実施形態で述べた
(o)の手順とに加え、さらに(p)音声が検出される
と起動命令信号を送信する手順が記述されている。CP
U10は、RAM11を作業領域として利用しつつ、上
記のプログラムに従って動作する。これによって、図2
1に示される各ブロックの機能が実現される。
【0219】なお、各ブロックの機能をソフト的に実現
する代わりに、各々専用のハード回路によって実現する
こともできる。
【0220】以上のように構成されたAV機器用音声認
識装置7について、以下、その動作を述べる。図22の
音声認識装置7では、待機状態にあっても音声検出部1
97がユーザの音声の検出している。ユーザが音声認識
機能を利用しようとする場合、まず、比較的大きな声を
発する。音声検出部197がこの音声を検出し、検出結
果を音声スイッチ1982に送る。検出結果があらかじ
め設定したレベル以上の音声を検出したことを示す時、
音声スイッチ1982は、音声認識の開始命令を状態設
定部1981に送り、状態設定部1981に待機状態か
ら動作状態への切り替えを指示する。
【0221】音声検出部197による検出結果は、時限
スイッチ1983へも送られ、応じて、時限スイッチ1
983は、時間計測を開始する。動作状態においては、
音声検出部197がユーザ音声が入力されたか否かをチ
ェックし、音声が検出された時に、時限スイッチ198
3は、計測時間をリセットする(つまり計測時間を0に
戻す)。音声が検出されない状態が続き、時限スイッチ
1983の計測時間が定められた値を超えた時、時限ス
イッチ1983は、状態設定部1981に動作状態から
待機状態への切り替えを指示する。
【0222】上記の音声スイッチ1982が”ON”と
なる音声レベルは、時限スイッチ1983がリセットさ
れる音声レベルよりもかなり高く設定される。エコーキ
ャンセラ193の打ち消し効果がよくない待機状態で発
生する比較的大きなレベルの消し残しの反響音がユーザ
音声として誤検出され、それに伴って動作モードに移行
することがないようにするためである。
【0223】以上のように、本実施形態によれば、音声
認識機能の開始と終了を自動的に行えるようになる。
【図面の簡単な説明】
【図1】本発明が用いられるAV機器の構成の一例を示
すブロック図である。
【図2】本発明の第1の実施形態に係るAV機器用音声
認識装置の構成を示すブロック図である。
【図3】図1の音声認識装置7のハードウエア的な構成
を示すブロック図である。
【図4】図2の音声認識装置7において、各構成要素に
入力される、または各構成要素から出力される信号の時
間波形を示す図である。
【図5】本発明の第2の実施形態に係るAV機器用音声
認識装置の構成を示すブロック図である。
【図6】図5の音声認識装置7において、各構成要素に
入力される、または各構成要素から出力される信号の時
間波形を示す図である。
【図7】本発明の第3の実施形態に係るAV機器用音声
認識装置の構成を示すブロック図である。
【図8】図7の音声認識装置7において、各構成要素に
入力される、または各構成要素から出力される信号の時
間波形を示す図である。
【図9】本発明の第4の実施形態に係るAV機器用音声
認識装置の構成を示すブロック図である。
【図10】図9のモノラル度判定部76の詳細を示すブ
ロック図である。
【図11】図9の任意度モノラル化部77の詳細を示す
ブロック図である。
【図12】図11の処理強度決定部91が行うモノラル
化処理の強度、および図11の減衰器921〜924を
通じて実現される利得(減衰量)を示す図である。
【図13】本発明の第5の実施形態に係るAV機器用音
声認識装置の構成を示すブロック図である。
【図14】本発明の第6の実施形態に係るAV機器用音
声認識装置の構成を示すブロック図である。
【図15】本発明の第7の実施形態に係るAV機器用音
声認識装置の構成を示すブロック図である。
【図16】本発明の第8の実施形態に係るAV機器用音
声認識装置の構成を示すブロック図である。
【図17】本発明の第9の実施形態に係るAV機器用音
声認識装置の構成を示すブロック図である。
【図18】本発明の第10の実施形態に係るAV機器用
音声認識装置の構成を示すブロック図である。
【図19】図18の適応制御部1672が行う適応速度
制御処理の特性を示す図である。
【図20】本発明の第11の実施形態に係るAV機器用
音声認識装置の構成を示すブロック図である。
【図21】本発明の第12の実施形態に係るAV機器用
音声認識装置の構成を示すブロック図である。
【図22】本発明の第13の実施形態に係るAV機器用
音声認識装置の構成を示すブロック図である。
【図23】従来のAV機器用音声認識装置の構成を示す
ブロック図である。
【図24】図23の音声認識装置において、各構成要素
に入力される、または各構成要素から出力される信号の
時間波形を示す図である。
【図25】別の従来のAV機器用音声認識装置の構成を
示すブロック図である。
【符号の説明】
6…マイクロホン 7…AV機器用音声認識装置 9a〜9c…スピーカ 13,33他…モノラル化部 14,34他…エコーキャンセラ 14a,34a他…適応ディジタルフィルタ 14b,34b他…減算回路 15,35他…音声認識部 36,56他…切り替え部 37,117他…音声検出部 57,791他…状態設定部 581,792他…起動命令部 582,793他…終了命令部 75…完全モノラル化部 76,1671…モノラル度判定部 77…任意度モノラル化部 115…2チャンネル化部 126…適応音発生部 1373…減衰部 1371…打ち消し監視部 147,157,1672…適応制御部 177…不揮発メモリ 1882…ボタンスイッチ 1883,1983…時限スイッチ 1982…音声スイッチ
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.7 識別記号 FI テーマコート゛(参考) H04R 3/02 G10L 3/00 551G 3/12 551F // H04S 1/00 571K 3/02 301F (72)発明者 河村 岳 大阪府門真市大字門真1006番地 松下電器 産業株式会社内 (72)発明者 小田 幹夫 大阪府門真市大字門真1006番地 松下電器 産業株式会社内

Claims (18)

    【特許請求の範囲】
  1. 【請求項1】 複数のスピーカを通じてマルチチャンネ
    ル音響を出力するAV機器に用いられ、マイクロホンを
    通じて入力されるユーザ音声を認識して、当該AV機器
    に所定の処理動作を行わせるための音声認識装置であっ
    て、 前記複数のスピーカへ向かうマルチチャンネル信号をモ
    ノラル化するモノラル化手段、 前記マイクロホンの出力(以下、マイクロホン出力)
    と、前記モノラル化手段の出力(以下、モノラル化信
    号)とが与えられ、当該モノラル化信号に基づいて前記
    マルチチャンネル音響の反響音を推定して、当該マイク
    ロホン出力から当該反響音を除去する1つのエコーキャ
    ンセラ、 前記1つのエコーキャンセラの出力(以下、エコーキャ
    ンセラ出力)に基づいて前記ユーザ音声を認識する音声
    認識手段を備える、AV機器用音声認識装置。
  2. 【請求項2】 前記複数のスピーカへは、前記マルチチ
    ャンネル信号が入力されることを特徴とする、請求項1
    に記載のAV機器用音声認識装置。
  3. 【請求項3】 前記マルチチャンネル信号および前記モ
    ノラル化信号のいずれかを前記複数のスピーカへと入力
    するための切り替え手段をさらに備える、請求項1に記
    載のAV機器用音声認識装置。
  4. 【請求項4】 前記モノラル化信号と前記エコーキャン
    セラ出力とに基づいて前記ユーザ音声を検出する音声検
    出手段をさらに備え、 前記切り替え手段は、 前記音声検出手段によって前記ユーザ音声が検出されて
    いない時、前記マルチチャンネル信号を前記複数のスピ
    ーカへと入力し、 前記音声検出手段によって前記ユーザ音声が検出されて
    いる時、前記モノラル化信号を前記複数のスピーカへと
    入力することを特徴とする、請求項3に記載のAV機器
    用音声認識装置。
  5. 【請求項5】 音声認識動作の起動を命令する起動命令
    手段、 音声認識動作の終了を命令する終了命令手段、および前
    記起動命令手段および前記終了命令手段からの命令に応
    じて、前記音声認識手段を動作状態および待機状態のい
    ずれかに設定する状態設定手段をさらに備え、 前記切り替え手段は、 前記状態設定手段によって前記音声認識手段が待機状態
    に設定されている時、前記マルチチャンネル信号を前記
    複数のスピーカへと入力し、 前記状態設定手段によって前記音声認識手段が動作状態
    に設定されている時、前記モノラル化信号を前記複数の
    スピーカへと入力することを特徴とする、請求項3に記
    載のAV機器用音声認識装置。
  6. 【請求項6】 前記マルチチャンネル信号のモノラル度
    を判定するモノラル度判定手段、および前記マルチチャ
    ンネル信号を任意のモノラル度にモノラル化する任意度
    モノラル化手段をさらに備え、 前記モノラル化手段は、前記マルチチャンネル信号を完
    全にモノラル化し、 前記任意度モノラル化手段は、前記モノラル度判定手段
    の判定結果が予め定められたモノラル度よりも低い場
    合、前記マルチチャンネル信号を当該予め定められたモ
    ノラル度にモノラル化することを特徴とする、請求項5
    に記載のAV機器用音声認識装置。
  7. 【請求項7】 前記マルチチャンネル信号は、3チャン
    ネル以上の信号であり、 前記マルチチャンネル信号を2チャンネル化する2チャ
    ンネル化手段をさらに備え、 前記モノラル化手段は、前記2チャンネル化手段の出力
    (以下、2チャンネル化信号)をモノラル化し、 前記切り替え手段は、前記マルチチャンネル信号、前記
    2チャンネル化信号および前記モノラル化信号のいずれ
    かを前記複数のスピーカへと入力することを特徴とす
    る、請求項5に記載のAV機器用音声認識装置。
  8. 【請求項8】 前記モノラル化信号と前記エコーキャン
    セラ出力とに基づいて前記ユーザ音声を検出する音声検
    出手段をさらに備え、 前記切り替え手段は、 前記状態設定手段が前記音声認識手段を待機状態に設定
    している時には、前記マルチチャンネル信号を前記複数
    のスピーカへと入力し、 前記状態設定手段が前記音声認識手段を動作状態に設定
    しているが、前記音声検出手段によって前記ユーザ音声
    が検出されていない時には、前記2チャンネル化信号を
    前記複数のスピーカへと入力し、 前記音声検出手段によって前記ユーザ音声が検出されて
    いる時には、前記モノラル化信号を前記複数のスピーカ
    へと入力することを特徴とする、請求項7に記載のAV
    機器用音声認識装置。
  9. 【請求項9】 前記モノラル化信号と前記エコーキャン
    セラ出力とに基づいて、前記エコーキャンセラにおいて
    前記反響音が十分に打ち消されているかを監視する打ち
    消し監視手段、 前記モノラル化信号と前記エコーキャンセラ出力とに基
    づいて前記ユーザ音声を検出する音声検出手段、および
    前記マルチチャンネル信号を減衰させる減衰手段をさら
    に備え、 前記減衰手段は、前記打ち消し監視手段の監視結果が打
    ち消し不十分を示している状態において、前記音声検出
    手段がユーザ音声を検出した時、前記マルチチャンネル
    信号を減衰させることを特徴とする、請求項5に記載の
    AV機器用音声認識装置。
  10. 【請求項10】 前記エコーキャンセラは、 前記複数のスピーカと前記マイクロホンとの間の反響路
    のインパルスレスポンスを推定して、当該推定インパル
    スレスポンスと、前記モノラル化信号とから前記反響音
    を算出する適応ディジタルフィルタ、および前記マイク
    ロホン出力から、前記適応ディジタルフィルタの出力を
    減算する減算手段を含む、請求項5に記載のAV機器用
    音声認識装置。
  11. 【請求項11】 前記切り替え手段によって前記複数の
    スピーカへの入力が前記マルチチャンネル信号から前記
    モノラル化信号へと切り替えられる際に、前記適応ディ
    ジタルフィルタの適応を促進するためのモノラル適応音
    を発生する適応音発生手段をさらに備える、請求項10
    に記載のAV機器用音声認識装置。
  12. 【請求項12】 前記適応ディジタルフィルタの適応速
    度を制御する適応制御手段をさらに備え、 前記適応制御手段は、モノラル用の速い適応速度と、マ
    ルチチャンネル用の遅い適応速度とを持ち、前記状態設
    定手段が前記音声認識手段を動作状態に設定している時
    には速い適応速度を選択し、待機状態に設定している時
    には遅い適応速度を選択することを特徴とする、請求項
    10に記載のAV機器用音声認識装置。
  13. 【請求項13】 前記適応制御手段へは、前記複数のス
    ピーカに入力される信号がマルチチャンネル信号かモノ
    ラル信号かを示す識別信号が与えられ、 前記適応制御手段は、前記識別信号がモノラルを示す場
    合、前記状態設定手段が前記音声認識手段を動作状態に
    設定しているか待機状態に設定しているかに関わらず、
    前記速い適応速度を選択することを特徴とする、請求項
    12に記載のAV機器用音声認識装置。
  14. 【請求項14】 前記マルチチャンネル信号のモノラル
    度を判定するモノラル度判定手段、および前記モノラル
    度判定手段の判定結果に基づいて、前記適応ディジタル
    フィルタの適応速度を制御する適応制御手段をさらに備
    える、請求項10に記載のAV機器用音声認識装置。
  15. 【請求項15】 前記適応制御手段は、前記マルチチャ
    ンネル信号のモノラル度が高いほど、前記適応ディジタ
    ルフィルタの適応速度を速くすることを特徴とする、請
    求項14に記載のAV機器用音声認識装置。
  16. 【請求項16】 不揮発メモリをさらに備え、 前記不揮発メモリは、 電源が”OFF”される時、前記適応ディジタルフィル
    タによって推定されたインパルスレスポンスを取得して
    記憶し、 電源が”ON”される時、記憶している電源”OFF”
    時の推定インパルスレスポンスを前記適応ディジタルフ
    ィルタに与え、 前記適応ディジタルフィルタは、前記不揮発メモリから
    与えられた電源”OFF”時の推定インパルスレスポン
    スを初期値として、インパルスレスポンスの推定を開始
    することを特徴とする、請求項10に記載のAV機器用
    音声認識装置。
  17. 【請求項17】 前記モノラル化信号と前記エコーキャ
    ンセラ出力とに基づいて前記ユーザ音声を検出する音声
    検出手段をさらに備え、 前記起動命令手段は、ボタンが押されると、前記状態設
    定手段へ起動命令を発するようなボタンスイッチであ
    り、 前記終了命令手段は、前記音声検出手段がユーザ音声を
    検出しない状態が予め定められた時間以上継続すると、
    前記状態設定手段へ終了命令を発する時限スイッチであ
    ることを特徴とする、請求項5に記載のAV機器用音声
    認識装置。
  18. 【請求項18】 前記モノラル化信号と前記エコーキャ
    ンセラ出力とに基づいて前記ユーザ音声を検出する音声
    検出手段をさらに備え、 前記起動命令手段は、前記音声検出手段がユーザ音声を
    検出すると、前記状態設定手段へ起動命令を発する音声
    スイッチであり、 前記終了命令手段は、前記音声検出手段がユーザ音声を
    検出しない状態が予め定められた時間以上継続すると、
    前記状態設定手段へ終了命令を発する時限スイッチであ
    ることを特徴とする、請求項5に記載のAV機器用音声
    認識装置。
JP2000227787A 1999-07-28 2000-07-27 Av機器用音声認識装置 Expired - Lifetime JP4554044B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000227787A JP4554044B2 (ja) 1999-07-28 2000-07-27 Av機器用音声認識装置

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP21327699 1999-07-28
JP11-213276 1999-07-28
JP2000227787A JP4554044B2 (ja) 1999-07-28 2000-07-27 Av機器用音声認識装置

Publications (3)

Publication Number Publication Date
JP2001100785A true JP2001100785A (ja) 2001-04-13
JP2001100785A5 JP2001100785A5 (ja) 2007-07-12
JP4554044B2 JP4554044B2 (ja) 2010-09-29

Family

ID=26519703

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000227787A Expired - Lifetime JP4554044B2 (ja) 1999-07-28 2000-07-27 Av機器用音声認識装置

Country Status (1)

Country Link
JP (1) JP4554044B2 (ja)

Cited By (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20040048435A (ko) * 2002-12-03 2004-06-10 조미화 음성 제어 텔레비젼 수상기 및 음성 제어 방법
FR2864860A1 (fr) * 2004-01-07 2005-07-08 Denso Corp Systeme d'annulation de bruit, systeme de reconnaissance vocale et systeme de navigation d'automobile
KR100552468B1 (ko) * 2001-07-19 2006-02-15 삼성전자주식회사 음성인식에 따른 오동작을 방지 및 음성인식율을 향상 할수 있는 전자기기 및 방법
JP2006314051A (ja) * 2005-05-09 2006-11-16 Mitsubishi Electric Corp エコー消去装置
KR100647286B1 (ko) 2004-08-14 2006-11-23 삼성전자주식회사 교차채널 간섭을 제거하기 위한 후처리장치 및 방법과이를 이용한 다채널 음원 분리장치 및 방법
JP2008526162A (ja) * 2004-12-29 2008-07-17 タンドベルク・テレコム・エイ・エス 音響的エコー消去用オーディオシステムと方法
JP2009268137A (ja) * 2003-12-29 2009-11-12 Tandberg Telecom As 強調された主観的ステレオオーディオのためのシステムと方法
WO2009150776A1 (ja) * 2008-06-11 2009-12-17 三菱電機株式会社 エコーキャンセラ
US7769593B2 (en) 2006-09-28 2010-08-03 Sri International Method and apparatus for active noise cancellation
KR20130083371A (ko) * 2012-01-09 2013-07-22 삼성전자주식회사 영상장치 및 그 제어방법
WO2014103099A1 (ja) * 2012-12-28 2014-07-03 パナソニック株式会社 音声認識付き機器及び音声認識方法
KR20150065643A (ko) * 2012-01-09 2015-06-15 삼성전자주식회사 표시 장치 및 그 제어방법
US9161132B2 (en) 2011-01-18 2015-10-13 Onkyo Corporation Audio processing apparatus with selection to and from multi-room mode
JP2017123648A (ja) * 2016-12-20 2017-07-13 ソニー株式会社 オーディオ機器
US9818426B2 (en) 2014-08-13 2017-11-14 Mitsubishi Electric Corporation Echo canceller
CN108320755A (zh) * 2018-04-28 2018-07-24 子歌教育机器人(深圳)有限公司 一种机器人的语音采集电路
US10148823B2 (en) 2015-03-20 2018-12-04 Samsung Electronics Co., Ltd. Method of cancelling echo and electronic device thereof
US10339951B2 (en) 2015-11-10 2019-07-02 Volkswagen Aktiengesellschaft Audio signal processing in a vehicle
CN112420064A (zh) * 2020-10-21 2021-02-26 深圳创维-Rgb电子有限公司 无线音箱设备语音回声消除处理方法、装置及智能终端
US12033635B2 (en) 2012-01-09 2024-07-09 Samsung Electronics Co., Ltd. Image display apparatus and method of controlling the same

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS57208596A (en) * 1981-06-18 1982-12-21 Hitachi Ltd Voice recognition circuit
JPH02244099A (ja) * 1989-03-16 1990-09-28 Aisin Seiki Co Ltd 音声信号処理装置
JPH0764598A (ja) * 1993-07-26 1995-03-10 Philips Electron Nv 音声信号弁別装置及びオーディオ装置
JPH08213861A (ja) * 1995-10-12 1996-08-20 Mitsubishi Electric Corp 車載音響再生機器
JPH09218687A (ja) * 1996-02-14 1997-08-19 Shinko Electric Co Ltd 消音装置
JPH09326844A (ja) * 1996-06-03 1997-12-16 Mitsubishi Electric Corp 騒音低減通話装置及び騒音低減通話方法
JPH1039891A (ja) * 1996-07-19 1998-02-13 Ricoh Co Ltd 音声認識装置
JPH10178324A (ja) * 1996-12-19 1998-06-30 Matsushita Electric Ind Co Ltd 音声操作装置
JPH10257583A (ja) * 1997-03-06 1998-09-25 Asahi Chem Ind Co Ltd 音声処理装置およびその音声処理方法
JPH1115490A (ja) * 1997-06-23 1999-01-22 Hitachi Microcomput Syst Ltd マイクロフォン装置および音声認識システム

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS57208596A (en) * 1981-06-18 1982-12-21 Hitachi Ltd Voice recognition circuit
JPH02244099A (ja) * 1989-03-16 1990-09-28 Aisin Seiki Co Ltd 音声信号処理装置
JPH0764598A (ja) * 1993-07-26 1995-03-10 Philips Electron Nv 音声信号弁別装置及びオーディオ装置
JPH08213861A (ja) * 1995-10-12 1996-08-20 Mitsubishi Electric Corp 車載音響再生機器
JPH09218687A (ja) * 1996-02-14 1997-08-19 Shinko Electric Co Ltd 消音装置
JPH09326844A (ja) * 1996-06-03 1997-12-16 Mitsubishi Electric Corp 騒音低減通話装置及び騒音低減通話方法
JPH1039891A (ja) * 1996-07-19 1998-02-13 Ricoh Co Ltd 音声認識装置
JPH10178324A (ja) * 1996-12-19 1998-06-30 Matsushita Electric Ind Co Ltd 音声操作装置
JPH10257583A (ja) * 1997-03-06 1998-09-25 Asahi Chem Ind Co Ltd 音声処理装置およびその音声処理方法
JPH1115490A (ja) * 1997-06-23 1999-01-22 Hitachi Microcomput Syst Ltd マイクロフォン装置および音声認識システム

Cited By (39)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100552468B1 (ko) * 2001-07-19 2006-02-15 삼성전자주식회사 음성인식에 따른 오동작을 방지 및 음성인식율을 향상 할수 있는 전자기기 및 방법
KR20040048435A (ko) * 2002-12-03 2004-06-10 조미화 음성 제어 텔레비젼 수상기 및 음성 제어 방법
JP2009268137A (ja) * 2003-12-29 2009-11-12 Tandberg Telecom As 強調された主観的ステレオオーディオのためのシステムと方法
FR2864860A1 (fr) * 2004-01-07 2005-07-08 Denso Corp Systeme d'annulation de bruit, systeme de reconnaissance vocale et systeme de navigation d'automobile
US8010354B2 (en) 2004-01-07 2011-08-30 Denso Corporation Noise cancellation system, speech recognition system, and car navigation system
CN1637857B (zh) * 2004-01-07 2010-05-26 株式会社电装 噪音消除系统、语音识别系统以及汽车导航系统
KR100647286B1 (ko) 2004-08-14 2006-11-23 삼성전자주식회사 교차채널 간섭을 제거하기 위한 후처리장치 및 방법과이를 이용한 다채널 음원 분리장치 및 방법
JP2008526162A (ja) * 2004-12-29 2008-07-17 タンドベルク・テレコム・エイ・エス 音響的エコー消去用オーディオシステムと方法
JP4644715B2 (ja) * 2004-12-29 2011-03-02 タンドベルク・テレコム・エイ・エス 音響的エコー消去用オーディオシステムと方法
JP4652116B2 (ja) * 2005-05-09 2011-03-16 三菱電機株式会社 エコー消去装置
JP2006314051A (ja) * 2005-05-09 2006-11-16 Mitsubishi Electric Corp エコー消去装置
US7769593B2 (en) 2006-09-28 2010-08-03 Sri International Method and apparatus for active noise cancellation
WO2009150776A1 (ja) * 2008-06-11 2009-12-17 三菱電機株式会社 エコーキャンセラ
DE112009001303T5 (de) 2008-06-11 2011-05-12 Mitsubishi Electric Corp. Echokompensator
CN103152498B (zh) * 2008-06-11 2014-12-31 三菱电机株式会社 回声消除器
US8130941B2 (en) 2008-06-11 2012-03-06 Mitsubishi Electric Corporation Echo canceler
US8644494B2 (en) 2008-06-11 2014-02-04 Mitsubishi Electric Corporation Echo canceler
US8644495B2 (en) 2008-06-11 2014-02-04 Mitsubishi Electric Corporation Echo canceler
US9161132B2 (en) 2011-01-18 2015-10-13 Onkyo Corporation Audio processing apparatus with selection to and from multi-room mode
US9786278B2 (en) 2012-01-09 2017-10-10 Samsung Electronics Co., Ltd. Image display apparatus and method of controlling the same
US10957323B2 (en) 2012-01-09 2021-03-23 Samsung Electronics Co., Ltd. Image display apparatus and method of controlling the same
US12033635B2 (en) 2012-01-09 2024-07-09 Samsung Electronics Co., Ltd. Image display apparatus and method of controlling the same
KR101590332B1 (ko) 2012-01-09 2016-02-18 삼성전자주식회사 영상장치 및 그 제어방법
KR101631594B1 (ko) 2012-01-09 2016-06-24 삼성전자주식회사 표시 장치 및 그 제어방법
US9401149B2 (en) 2012-01-09 2016-07-26 Samsung Electronics Co., Ltd. Image display apparatus and method of controlling the same
US9530418B2 (en) 2012-01-09 2016-12-27 Samsung Electronics Co., Ltd. Image display apparatus and method of controlling the same
US11763812B2 (en) 2012-01-09 2023-09-19 Samsung Electronics Co., Ltd. Image display apparatus and method of controlling the same
KR20130083371A (ko) * 2012-01-09 2013-07-22 삼성전자주식회사 영상장치 및 그 제어방법
KR20150065643A (ko) * 2012-01-09 2015-06-15 삼성전자주식회사 표시 장치 및 그 제어방법
US9792902B2 (en) 2012-12-28 2017-10-17 Socionext Inc. Device including speech recognition function and method of recognizing speech
US10262653B2 (en) 2012-12-28 2019-04-16 Socionext Inc. Device including speech recognition function and method of recognizing speech
WO2014103099A1 (ja) * 2012-12-28 2014-07-03 パナソニック株式会社 音声認識付き機器及び音声認識方法
US9818426B2 (en) 2014-08-13 2017-11-14 Mitsubishi Electric Corporation Echo canceller
US10148823B2 (en) 2015-03-20 2018-12-04 Samsung Electronics Co., Ltd. Method of cancelling echo and electronic device thereof
US10339951B2 (en) 2015-11-10 2019-07-02 Volkswagen Aktiengesellschaft Audio signal processing in a vehicle
JP2017123648A (ja) * 2016-12-20 2017-07-13 ソニー株式会社 オーディオ機器
CN108320755A (zh) * 2018-04-28 2018-07-24 子歌教育机器人(深圳)有限公司 一种机器人的语音采集电路
CN112420064A (zh) * 2020-10-21 2021-02-26 深圳创维-Rgb电子有限公司 无线音箱设备语音回声消除处理方法、装置及智能终端
CN112420064B (zh) * 2020-10-21 2024-04-02 深圳创维-Rgb电子有限公司 无线音箱设备语音回声消除处理方法、装置及智能终端

Also Published As

Publication number Publication date
JP4554044B2 (ja) 2010-09-29

Similar Documents

Publication Publication Date Title
JP4554044B2 (ja) Av機器用音声認識装置
US6665645B1 (en) Speech recognition apparatus for AV equipment
JP3306600B2 (ja) 自動音量調整装置
JP2522529B2 (ja) 音響効果装置
JP5499633B2 (ja) 再生装置、ヘッドホン及び再生方法
KR20180132521A (ko) 빔 형성 라우드스피커 어레이를 통해 생성된 오디오의 공간적 더킹
JPH10282993A (ja) 機器の音声作動式遠隔制御システム
TWI413421B (zh) 音頻訊號之處理方法及其裝置
JP2010164970A (ja) オーディオシステム及びその出力制御方法
JP2006067218A (ja) オーディオ再生装置
WO2006033058A1 (en) A system and a method of processing audio data, a program element and a computer-readable medium
CN101009954A (zh) 音频再现设备及其方法
EP1463379A2 (en) Sound-field setting system
JP2961952B2 (ja) 音楽音声判別装置
JP2003533110A (ja) オーディオシステム
JP4529780B2 (ja) 拡声システム
JPH08179786A (ja) 車載用ステレオ再生装置
JP2009159020A (ja) 信号処理装置、信号処理方法、プログラム
JP5067240B2 (ja) 遅延制御装置
JPH02127808A (ja) 車載音響装置における自動音量調整装置
JPH03285500A (ja) 音響装置
JP2014181988A (ja) オーディオ装置
JP7105320B2 (ja) 音声認識装置、音声認識装置の制御方法、コンテンツ再生装置、及びコンテンツ送受信システム
JP7158480B2 (ja) 音声信号処理システム、及び音声信号処理装置
JPH06326622A (ja) 音声信号処理装置

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070525

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070525

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20100405

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100412

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100608

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100623

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100714

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130723

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4554044

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

EXPY Cancellation because of completion of term