JP2020008300A

JP2020008300A - 移動体検出装置、および、音声認識スピーカー装置

Info

Publication number: JP2020008300A
Application number: JP2018126569A
Authority: JP
Inventors: 範匡北川; Norimasa Kitagawa; 芳徳中西; Yoshinori Nakanishi; 川口　剛; Takeshi Kawaguchi; 剛川口; 弘貴黒崎; Hirotaka Kurosaki
Original assignee: Onkyo Corp
Current assignee: Onkyo Corp
Priority date: 2018-07-03
Filing date: 2018-07-03
Publication date: 2020-01-16

Abstract

【課題】音声認識スピーカー装置が備えるような音声再生用のスピーカーおよびマイクロホンを利用して移動体検出装置を構成し、大音量再生時にも遠隔操作を可能にする音声認識スピーカー装置を提供する。【解決手段】移動体検出装置は、第１周波数の正弦波を含む第１音声信号および第２周波数の正弦波を含む第２音声信号を出力する音声出力回路と、第１音声信号／第１音声信号を音波に変換して被検出音場に放射する第１スピーカー／第２スピーカーと、被検出音場の音波を収音音声信号に変換して出力するマイクロホンと、収音音声信号に含まれる第１周波数と第２周波数の間の帯域の周波数成分の音圧レベルを測定する測定回路と、測定回路が出力する測定信号により被検出音場における移動体の存否を検出する検出回路と、を備える。【選択図】図１

Description

本発明は、移動体検出装置、および、これを含む音声認識スピーカー装置に関する。

従来から、人体などの移動を検出する検出装置として、ドップラー効果を利用した反射式の移動体検出装置がある。移動体検出装置は、可聴音域を超えた超音波またはマイクロ波を被検出物に当てて、反射してきたマイクロ波の周波数を監視することによって物体の動きを検出する。被検出物が動いている場合にはドップラー効果により反射波の周波数が変化するので、この周波数変化を検出すれば、移動体を検出することができる（特許文献１、２）。

また、操作キーなどの従来からのユーザー操作に代えて、ユーザーとの対話型の音声操作に対応した音声認識機能、ＡＩ（人工知能）アシスタント機能などを利用可能な音声認識スピーカー装置が従来から存在する。このような音声認識スピーカー装置は、サーバーなどが接続されているクラウド・サービスにネットワーク接続して、ユーザーから発せられる音声を収音して音声認識し、かつ、その音声操作または質問に対応して音声の応答をスピーカーにより返すように動作する。

このような音声認識スピーカー装置は、音声を再生する動電型スピーカーと音声を収音するマイクロホンとが一つのキャビネットに取り付けられる音声再生収音装置である場合がある。音声再生収音装置において、同一のキャビネットに動電型スピーカーとマイクロホンとが取り付けられる場合には、動電型スピーカーから再生される音声は、マイクロホンから収音されるのが避けられない。すなわち、音声再生収音装置では、動電型スピーカーから音声再生している際にマイクロホンでユーザーの操作音声を収音しようとすると、動電型スピーカーからの再生音声が大きく操作音声に重畳した収音音声となり、収音音声からその操作音声を音声認識できない場合が出てきてしまう問題がある。

そこで、音声再生収音装置では、マイクロホンが収音する収音音声信号から動電型スピーカーに入力する再生音声信号を減算処理して、外部空間から外来する操作音声の成分を相対的に大きくした収音音声信号を出力するエコーキャンセル回路を備えることが必要になる（特許文献３、４）。しかし、動電型スピーカーが再生する音声の音圧レベルが高い場合、または、動電型スピーカーとマイクロホンとが接近して配置されている場合には、エコーキャンセル回路だけでは動電型スピーカーが再生する音声を十分に打ち消すことが出来ずに、結果的に操作音声を音声認識できない場合が発生する問題がある。

そこで、天板付近に取り付けるマイクロホンと、下向きにベース付近に取り付けるスピーカーを離して、スピーカーをマイクロホンに向けないように配置する、などの対策が必要になる（特許文献３）。なお、動電型スピーカーとマイクロホンとを備える拡声電話機用送受話ユニットなどの音声再生収音装置において、動電型スピーカーとマイクロホンとの音響的な結合を小さくしようとする技術思想は、周知であり、様々な構成または方法が提案されている（特許文献４、５）。

一方で、小型軽量な音声再生収音装置が求められる場合には、動電型スピーカーとマイクロホンとを取り付けるキャビネットが小さくなるので、結果的に動電型スピーカーとマイクロホンとが互いに近くに配置されてしまい、音響的な結合が大きくなってしまうという問題がある。つまり、音声認識スピーカー装置が再生する音声の音圧レベルをある程度高くするような大音量再生時には、操作音声を音声認識できなくなり、実質的に音声による遠隔操作ができなくなるという問題がある。例えば、大音量再生時には、音声認識スピーカー装置に対して操作音声によりボリュームを下げるように発声しても、音声認識スピーカー装置がボリュームを下げる動作を行わない、という不具合を生じる。

使用者が操作するスイッチ、リモコン、使用者を認識するセンサー、カメラ、等の使用者を認識する他の手段をさらに音声認識スピーカー装置に備えさせることで、大音量再生時の問題を解決しようとすることも想定される。しかし、そのような場合には、使用者を認識する他の手段をさらに音声認識スピーカー装置に備えさせると、装置全体が大掛かりになってコスト面で不利になるという面がある。

音声認識スピーカー装置は、予めスピーカーおよびマイクロホンを備えているので、これらを利用すればドップラー効果を利用した反射式の移動体検出装置を構成することができる可能性がある。しかし、音声認識スピーカー装置が備えるような音声再生用のスピーカーおよびマイクロホンを利用して移動体検出装置を構成するには、従来の移動体検出装置と同様の方法、手段を採用できない場合があるという問題がある。例えば、音声再生用のスピーカーは、ドップラー装置のスピーカーまたはアンテナに比較して、超音波またはマイクロ波の再生をするのには適さない一面を含むからである。

特開平９−１８９７６３号公報特許第５２８８４１６号公報米国特許第９，０６０，２２４号公報特許第４６４０２０９号公報特開昭５８−５６５６３号公報

本発明は、上記の従来技術が有する問題を解決するためになされたものであり、その目的は、移動体検出装置、および、音声認識スピーカー装置に関し、音声認識スピーカー装置が備えるような音声再生用のスピーカーおよびマイクロホンを利用して移動体検出装置を構成し、大音量再生時にも遠隔操作を可能にする音声認識スピーカー装置を提供することにある。

本発明の移動体検出装置は、第１周波数の正弦波を含む第１音声信号および第１周波数とは異なる第２周波数の正弦波を含む第２音声信号をそれぞれ出力する音声出力回路と、第１音声信号を音波に変換して被検出音場に放射する第１スピーカーと、第２音声信号を音波に変換して被検出音場に放射する第２スピーカーと、被検出音場の音波を収音音声信号に変換して出力するマイクロホンと、収音音声信号に含まれる第１周波数と第２周波数の間の帯域の周波数成分の音圧レベルを測定する測定回路と、測定回路が出力する測定信号により被検出音場における移動体の存否を検出する検出回路と、を備え、検出回路が、測定信号が所定値よりも小さい場合に移動体が無いと検出し、測定信号が所定値以上に大きい場合に移動体が在ると検出する。

好ましくは、本発明の移動体検出装置は、第１スピーカーおよび第２スピーカーがそれぞれ、振動板と、振動板に取り付けられるボイスコイルと、ボイスコイルのコイルが磁気空隙に配置される磁気回路と、を少なくとも有し、１５ｋＨｚ以上５０ｋＨｚ以下の第１周波数または第２周波数の音波を被検出音場に放射する動電型スピーカーであり、音声出力回路が、第１音声信号における第１周波数および第２音声信号における第２周波数を、それらの差の絶対値が１０Ｈｚ以上１００Ｈｚ以下となるように設定する。

また、本発明の音声認識スピーカー装置は、上記の移動体検出装置を含む音声認識スピーカー装置であって、音声出力回路が、第１音声信号と第２音声信号とにそれぞれ他の第３音声信号または第４音声信号を含める加算回路を含み、収音音声信号に含まれる第１スピーカー並びに第２スピーカーから再生される第３音声信号の成分および第４音声信号の成分を減算処理して、被検出音場に外来する他の音声の成分を相対的に大きくした収音音声信号を出力するエコーキャンセル回路と、エコーキャンセル回路から出力される収音音声信号が入力されて他の音声の成分に含まれる音声命令を認識する音声認識回路と、をさらに備える。

また、本発明の音声認識スピーカー装置は、エコーキャンセル回路から出力される収音音声信号、または、音声認識回路から出力される音声命令を外部の音声認識装置との間で通信して、音声命令を確定するとともに第３音声信号および第４音声信号を制御する通信制御回路をさらに含む。

また、本発明の音声認識スピーカー装置は、第１音声信号並びに第２音声信号の音量レベルが所定値以上になり、かつ、検出回路が、被検出音場に移動体が在ると検出する場合に、移動体検出装置の音声出力回路が、第１スピーカー並びに第２スピーカーから再生される第３音声信号の成分および第４音声信号の成分の相対レベルを小さくするように音量制御する乗算器をさらに含む。

以下、本発明の作用について説明する。

本発明の移動体検出装置は、第１周波数の正弦波を含む第１音声信号および第１周波数とは異なる第２周波数の正弦波を含む第２音声信号をそれぞれ出力する音声出力回路と、第１音声信号を音波に変換して被検出音場に放射する第１スピーカーと、第２音声信号を音波に変換して被検出音場に放射する第２スピーカーと、被検出音場の音波を収音音声信号に変換して出力するマイクロホンと、収音音声信号に含まれる第１周波数と第２周波数の間の帯域の周波数成分の音圧レベルを測定する測定回路と、測定回路が出力する測定信号により被検出音場における移動体の存否を検出する検出回路と、を備える。

移動体検出装置は、第１スピーカーおよび第２スピーカーをそれぞれ、振動板と、振動板に取り付けられるボイスコイルと、ボイスコイルのコイルが磁気空隙に配置される磁気回路と、を少なくとも有する動電型スピーカーにすればよい。例えば、第１周波数および第２周波数を、高い周波数である１５ｋＨｚ以上５０ｋＨｚ以下に選び、それらの差の絶対値が１０Ｈｚ以上１００Ｈｚ以下となるように設定すれば、マイクロホンが収音する収音音声信号に含まれる第１周波数と第２周波数の間の帯域の周波数成分の音圧レベルを測定すれば、移動体検出装置の検出回路によって、測定信号が所定値よりも小さい場合に移動体が無いと検出し、測定信号が所定値以上に大きい場合に移動体が在ると検出することができる。

収音音声信号に含まれる第１周波数と第２周波数の間の帯域の周波数成分の音圧レベルを測定するようにしているので、第１周波数および第２周波数の信号レベルを著しく大きくしなくても、被検出音場における移動体の存否を検出することができる。また、第１周波数および第２周波数を単一の電機音響変換器で再生する場合に、発生しやすい混変調歪みによる差周波数成分の影響を避けることができ、移動体検出装置または音声認識スピーカー装置を構成することができる利点がある。

また、音声認識スピーカー装置は、音声出力回路が、第１音声信号と第２音声信号とにそれぞれ他の第３音声信号または第４音声信号を含める加算回路を含み、収音音声信号に含まれる第１スピーカー並びに第２スピーカーから再生される第３音声信号の成分および第４音声信号の成分を減算処理して、被検出音場に外来する他の音声の成分を相対的に大きくした収音音声信号を出力するエコーキャンセル回路と、エコーキャンセル回路から出力される収音音声信号が入力されて他の音声の成分に含まれる音声命令を認識する音声認識回路と、をさらに備えるようにして、移動体検出装置を含むようにすればよい。

例えば、ステレオ左右音声信号である第３音声信号または第４音声信号を音声再生する音声認識スピーカー装置について、音声による遠隔操作が可能になる。エコーキャンセル回路から出力される収音音声信号、または、音声認識回路から出力される音声命令を外部の音声認識装置との間で通信して、音声命令を確定するとともに第３音声信号および第４音声信号を制御する通信制御回路をさらに含むようにすれば、サーバーなどが接続されているクラウド・サービスにネットワーク接続して、ユーザーから発せられる音声を収音して音声認識し、かつ、その音声操作または質問に対応して音声の応答をスピーカーにより返すように動作することができる。

さらに、音声認識スピーカー装置は、第１音声信号並びに第２音声信号の音量レベルが所定値以上になり、かつ、検出回路が、被検出音場に移動体が在ると検出する場合に、移動体検出装置の音声出力回路が、第１スピーカー並びに第２スピーカーから再生される第３音声信号の成分および第４音声信号の成分の相対レベルを小さくするように音量制御する乗算器をさらに含むようにすればよい。第３音声信号または第４音声信号を音声再生する音声認識スピーカー装置について、大音量再生時に音声による遠隔操作ができなくても、移動体検出により使用者による操作が伝えられるので、信号の相対レベルを小さくするように音量制御して、音声による遠隔操作を行うことができる。

本発明の移動体検出装置、および、音声認識スピーカー装置は、音声認識スピーカー装置が備えるような音声再生用のスピーカーおよびマイクロホンを利用して移動体検出装置を構成し、大音量再生時にも遠隔操作を可能にする音声認識スピーカー装置を提供することができる。

本発明の好ましい実施形態による移動体検出装置を含む音声認識スピーカー装置について説明するブロックダイアグラムである。（実施例１）本発明の好ましい実施形態による移動体検出装置の動作について説明するグラフである。（実施例１）

以下、本発明の好ましい実施形態による移動体検出装置、および、音声認識スピーカー装置について説明するが、本発明はこれらの実施形態には限定されない。

図１は、本発明の好ましい実施形態による音声認識スピーカー装置１について説明する図である。具体的には、図１は移動体検出装置を含む音声認識スピーカー装置１の構成を示すブロックダイアグラムである。なお、以下において、本発明の説明に不要な音声認識スピーカー装置１の一部の構造や、内部構造等は、図示並びに説明を省略する。

図１に示すように、音声認識スピーカー装置１は、音声を再生する複数の動電型スピーカー２および３と、音場Ｓでの音声を収音するマイクロホン４とが、キャビネット５に取り付けられている。音声認識スピーカー装置１は、クラウド・サービス３０から供給される再生音声信号などを、増幅回路６または７で電力増幅して動電型スピーカー２並びに３に供給し、動電型スピーカー２および３が入力音声信号を音波に電気音響変換して音声を再生する。

例えば、クラウド・サービス３０から左音声信号Ｌおよび右音声信号Ｒを含むステレオ音声信号が供給される場合には、音声認識スピーカー装置１は、動電型スピーカー２および３によりステレオ音声再生に対応可能になる。なお、本実施例の動電型スピーカー２および３は、同一型の動電型スピーカーを２つ用いてステレオ音声信号（左音声信号Ｌ、右音声信号Ｒ）に対応可能にしているが、もちろんモノラル音声信号にも対応可能である。

音声認識スピーカー装置１のキャビネット５は、略直方体形状の天面に、動電型スピーカー２および３が取り付けられている。動電型スピーカー２および３は、それぞれ振動板と、振動板に連結するボイスコイルと、ボイスコイルのコイルが配置される磁気空隙を有する磁気回路と、振動板およびボイスコイルを振動可能に支持するエッジおよび磁気回路が連結するフレームと、を備える。動電型スピーカー２および３の振動板の一方面は、外部空間側に露出しており、振動板の他方面は、キャビネット５が規定する内部空間に臨んでいる。

したがって、ボイスコイルのコイルに音声信号電流が供給されると、振動板およびボイスコイルに駆動力が働いて振動し、振動板から音波がその前後方向に逆位相の関係で放射される。動電型スピーカー２および３は、少なくとも人間の聴覚の可聴周波数の上限である約２０ｋＨｚよりも低い周波数である１５ｋＨｚ以上が再生可能なフルレンジ（全帯域）スピーカーであればよい。なお、動電型スピーカー２および３は、複数の再生帯域に分かれた複数のスピーカーから構成されるマルチウェイスピーカーシステムであって、好ましくは５０ｋＨｚ程度までは再生可能な高音域の再生に適するツィーターを含む構成であってもよい。

また、音声認識スピーカー装置１において、再生音声信号は、マイクロホン４が接続されるエコーキャンセル回路２２に入力される。マイクロホン４は、外部空間におけるキャビネット５の取付位置での音場Ｓの音声を収音し、電気音響変換してその音圧レベルに応じた収音音声信号を、後述する測定回路２１とエコーキャンセル回路２２とに出力する。

エコーキャンセル回路２２は、マイクロホン４が収音する収音音声信号から動電型スピーカー２および３に入力する再生音声信号を減算処理する。減算処理では、動電型スピーカー２および３からマイクロホン４への伝達関数が考慮される。その結果、音声認識スピーカー装置１が動電型スピーカー２および３によりステレオ音声を音声再生している場合には、エコーキャンセル回路２２は、外部空間から外来する操作音声などの他の音声の成分を相対的に大きくした収音音声信号を、制御回路２０に出力する。

制御回路２０は、音声認識スピーカー装置１の動作を制御する。制御回路２０は、エコーキャンセル回路２２から出力される収音音声信号が入力されて他の音声の成分に含まれる音声命令を認識する（図示しない）音声認識回路と、被検出音場における移動体Ｍの存否を検出する（図示しない後述する）検出回路と、を含む。また、制御回路２０は、クラウド・サービス３０に接続する通信制御回路２３と接続する。音声認識スピーカー装置１は、さらに（図示しない）電源部、等を含んで構成される。

音声認識スピーカー装置１は、ユーザーから発せられる音声をマイクロホン４で収音して音声認識し、かつ、その音声操作または質問に対応して音声の応答を動電型スピーカー２および３により再生して返すように動作する。つまり、音声認識スピーカー装置１は、エコーキャンセル回路２２を動作させて音声命令を認識する音声認識回路を含む制御回路２０を含むので、動電型スピーカー２および３により音声再生している場合であっても、ユーザーの操作音声を相対的に大きくした収音音声信号を得ることができて、音声認識に基づく音声操作を実現することができる。

音声認識スピーカー装置１は、通信制御回路２３を介して接続するクラウド・サービス３０において、音声命令を認識する音声認識を動作させてもよい。その場合には、音声認識スピーカー装置１の制御回路２０は、エコーキャンセル回路２２から出力される収音音声信号か、制御回路２０の音声認識回路から出力される音声命令か、のいずれかを外部の音声認識装置であるクラウド・サービス３０に伝送するように通信する。通信制御回路２３および制御回路２０は、クラウド・サービス３０から供給される命令、並びに、音声信号に基づいて、音声認識スピーカー装置１の動作を制御する。

音声認識スピーカー装置１は、動電型スピーカー２および３が音声再生する音場Ｓに移動体Ｍが存在するか、否かを検出する移動体検出装置を含んで構成されている。すなわち、移動体検出装置は、音声認識スピーカー装置１が予め備えている動電型スピーカー２および３とマイクロホン４とを活用して、ドップラー効果を利用した反射式の移動体検出を実現する。マイクロホン４は、動電型スピーカー２および３から放射されてそのまま到来する直接音だけでなく、音場Ｓにおける移動体Ｍを含むあらゆる反射物により反射して到来する反射音を含めて収音するからである。移動体Ｍとは、例えば音声認識スピーカー装置１を利用するユーザー自身であり、ユーザーが歩いて移動するという場合のみならず、身体の一部を動かすような場合をも含む。

音声認識スピーカー装置１は、第１周波数ｆ１の正弦波を含む第１音声信号および第１周波数ｆ１とは異なる第２周波数ｆ２の正弦波を含む第２音声信号をそれぞれ出力する音声出力回路１０を含む。音声出力回路１０は、第１周波数ｆ１の正弦波を出力する発振回路１１と、第２周波数ｆ２の正弦波を出力する発振回路１２と、を含む。第１周波数ｆ１または第２周波数ｆ２は、人間の聴覚での感度が低下する高い周波数帯域である１５ｋＨｚ以上５０ｋＨｚ以下から、それらの差の絶対値が１０Ｈｚ以上１００Ｈｚ以下となるように、制御回路２０が設定する。例えば、第１周波数ｆ１を１７５００Ｈｚと設定する場合に、第２周波数ｆ２を１７５５０Ｈｚと設定することができる。

音声出力回路１０は、発振回路１１からの出力である第１周波数ｆ１の正弦波と、通信制御回路２３からの出力である（他の第３音声信号としての）左音声信号Ｌと、を加算して第１音声信号として動電型スピーカー２に接続する増幅器６に出力する加算回路１３を含む。同様に、音声出力回路１０は、発振回路１２からの出力である第２周波数ｆ２の正弦波と、通信制御回路２３からの出力である（他の第４音声信号としての）右音声信号Ｒと、を加算して第２音声信号として動電型スピーカー３に接続する増幅器７に出力する加算回路１４を含む。したがって、動電型スピーカー２から第１周波数ｆ１の正弦波が音場Ｓに再生され、動電型スピーカー３から第２周波数ｆ２の正弦波が音場Ｓに再生される。

また、音声出力回路１０は、通信制御回路２３から出力される左音声信号Ｌおよび右音声信号Ｒについて、それぞれ信号レベルを調整するように所定の係数値を乗算して加算回路１３または１４に出力する乗算器１５または１６を含む。乗算器１５は、動電型スピーカー２から再生される音声に含まれる左音声信号Ｌの成分の相対レベルを音量制御することができる。また、乗算器１６は、動電型スピーカー３から再生される音声に含まれる右音声信号Ｒの成分の相対レベルを音量制御することができる。

図２は、この音声認識スピーカー装置１の移動体検出装置の動作について説明するグラフである。具体的には、マイクロホン４が収音した被検出音場Ｓの音波の音圧レベル周波数特性を模式的に示すグラフであり、グラフの横軸は周波数を示し、縦軸は音圧レベル（ＳＰＬ）を示す。図２のグラフの横軸の周波数は、第１周波数ｆ１および第２周波数ｆ２の付近の高い周波数帯域に限って表示しており、また、グラフの縦軸の１区間Ｄの幅が１０ｄＢとなるように基準化して表示している。

図２（ａ）は、音場Ｓに移動体Ｍが存在しない場合（つまり、移動する反射物が存在しない場合）のマイクロホン４が収音した被検出音場Ｓの音波の音圧レベル周波数特性である。図２（ａ）のグラフでは、発振回路１１および１２からそれぞれ出力される第１周波数ｆ１の正弦波と第２周波数ｆ２の正弦波の信号レベルを、ほぼ同一に調整しているので、第１周波数ｆ１と第２周波数ｆ２とにそれぞれほぼ同じ高い音圧レベルのピークが出現している。その一方で、それらの間の（ｆ１〜ｆ２）帯域に深いディップが出現し、この（ｆ１〜ｆ２）帯域の周波数成分の音圧レベルが十分に低くなっていることがわかる。

これに対して、図２（ｂ）は、音場Ｓに移動体Ｍが存在する場合（つまり、移動する反射物が存在する場合）のマイクロホン４が収音した被検出音場Ｓの音波の音圧レベル周波数特性である。図２（ａ）のグラフの場合との相違点は、音場Ｓに移動体Ｍが存在する点のみである。第１周波数ｆ１と第２周波数ｆ２とにそれぞれほぼ同じ高い音圧レベルのピークが出現しているものの、移動体Ｍによるドップラー効果により、第１周波数ｆ１と第２周波数ｆ２が変調される結果、第１周波数ｆ１と第２周波数ｆ２の間の（ｆ１〜ｆ２）帯域にも高い音圧レベルの音波が出現していることがわかる。つまり、移動体Ｍが存在しない場合に観測できる（ｆ１〜ｆ２）帯域の深いディップが、音場Ｓに移動体Ｍが存在する場合には消失することがわかる。

音声認識スピーカー装置１の移動体検出装置は、上記の現象を利用して音場Ｓに移動体Ｍが存在するか否かを検出する。具体的には、音声認識スピーカー装置１の移動体検出装置は、マイクロホン４が収音する収音音声信号に含まれる第１周波数ｆ１と第２周波数ｆ２の間の（ｆ１〜ｆ２）帯域の周波数成分の音圧レベルを測定する測定回路２１と、測定回路２１が出力する測定信号により被検出音場Ｓにおける移動体Ｍの存否を検出する制御回路２０に含まれる検出回路と、を備える。制御回路２０に含まれる検出回路は、測定回路２１が出力する測定信号により収音音声信号に含まれる（ｆ１〜ｆ２）帯域の周波数成分の音圧レベルが分かるので、測定信号が所定値よりも小さい場合に移動体Ｍが無いと検出し、測定信号が所定値以上に大きい場合に移動体Ｍが在ると検出する。

例えば、第１周波数ｆ１を１７５００Ｈｚと設定し、第２周波数ｆ２を１７５５０Ｈｚと設定する場合に、１７５００Ｈｚ〜１７５５０Ｈｚの帯域レベルが所定値よりも大きければ、移動体Ｍが在ると検出できる。第１周波数ｆ１と第２周波数ｆ２との差周波数が５０Ｈｚである場合に、１７５００Ｈｚ〜１７５５０Ｈｚの周波数帯域には、変調された周波数成分が観測できるようになるからである。正弦波の第１周波数ｆ１および第２周波数ｆ２を、動電型スピーカー２並びに３によって再生可能であり、かつ、マイクロホン４によって収音可能な上記の様な周波数に選ぶことで、移動体Ｍが存在するか否かを検出する移動体検出装置を、音声認識スピーカー装置１に組み入れることができる。

なお、仮に動電型スピーカー２並びに３のいずれか一方のみに、第１周波数ｆ１の正弦波を含む第１音声信号と第２周波数ｆ２の正弦波を含む第２音声信号を加算した信号を供給して音声再生した場合には、動電型スピーカーで発生する混変調歪みの影響を受けてしまうので、同様に（ｆ１〜ｆ２）帯域の周波数成分の音圧レベルを検出しても、移動体Ｍの有無を検出するのは困難である。一つの動電型スピーカーに第１周波数ｆ１と第２周波数ｆ２の正弦波を加算して入力すると、移動体Ｍの有無に係わらず、図２（ｂ）のグラフに似て、（ｆ１〜ｆ２）帯域の周波数成分の音圧レベルが混変調の影響を受けて出現するからである。本実施例のように、第１周波数ｆ１または第２周波数ｆ２の正弦波を、それぞれ別の電機音響変換器である動電型スピーカー２並びに３により再生することで、動電型スピーカーで発生する混変調歪みの影響を避けることができる。

音声認識スピーカー装置１は、予め動電型スピーカー２並びに３およびマイクロホン４を備えているので、ユーザーが操作するスイッチ、リモコン、使用者を認識するセンサー、カメラ、等の使用者を認識する他の手段をさらに備える必要が無く、装置全体が大掛かりにならずにコスト面で有利になるという利点がある。

本実施例では、音声認識スピーカー装置１に移動体検出装置が含まれているが、単独の移動体検出装置として構成してもよい。移動体検出装置は、少なくとも音声出力回路１０と、動電型スピーカー２並びに３と、マイクロホン４と、測定回路２１と、検出回路を構成する制御回路２０と、を含んでいればよい。移動体検出装置は、音場Ｓに移動体Ｍが存在するか否かを収音音声信号に含まれる（ｆ１〜ｆ２）帯域の周波数成分の音圧レベルにより検出することができる。また、移動体検出装置は、検出回路を構成する制御回路２０が、通信制御回路２３を介して接続するクラウド・サービス３０と通信して、音場Ｓに移動体Ｍが存在するか否かを検出するように動作してもよい。

制御回路２０に含まれる検出回路は、測定回路２１が出力する測定信号が所定値よりも小さい場合に移動体Ｍが無いと検出し、測定信号が所定値以上に大きい場合に移動体Ｍが在ると検出する。したがって、移動体Ｍがマイクロホン４に対して相対的に近い場合には、検出回路は、収音音声信号に含まれる（ｆ１〜ｆ２）帯域の反射音が相対的に大きくなる良好に検出が可能になる。一方、移動体Ｍがマイクロホン４に対して相対的に遠い場合には、収音音声信号に含まれる（ｆ１〜ｆ２）帯域の反射音が相対的に小さくなるので、移動体Ｍの検出が困難になる場合がある。測定回路２１および検出回路の設定により、音声認識スピーカー装置１の周囲のある程度近い範囲に移動体Ｍが在るか無いかを検出することができる。

制御回路２０は、音場Ｓに移動体Ｍが存在するか否かを判断し、その判断に応じて音声認識スピーカー装置１の動作を異ならせるように制御することができる。例えば、音場Ｓに移動体Ｍが存在するか否かに応じて、クラウド・サービス３０から供給される再生音声信号の音量制御が可能になる。

例えば、音声認識スピーカー装置１は、クラウド・サービス３０から供給される再生音声信号を動電型スピーカー２並びに３から再生する場合に、ユーザーが腕を振るなどの動作をすれば、音場Ｓに移動体Ｍが存在することを検出して、クラウド・サービス３０からの左音声信号Ｌおよび右音声信号Ｒを含むステレオ音声信号の音量レベルを、音声出力回路１０の乗算器１５または１６により小さくするように音量制御するなど、遠隔操作を可能にできる。

音場Ｓにおけるステレオ音声信号の再生音量レベルが低くなれば、マイクロホン４から見て動電型スピーカー２および３との音響的な結合が小さくなるので、結果的に音声認識回路での音声命令を認識する動作を確実にすることができる。ステレオ音声信号の再生音量レベルが低くなれば、エコーキャンセル回路２２における減算処理が確実になり、操作音声などの他の音声の成分を相対的に大きくした収音音声信号を制御回路２０に出力することができるからである。なお、音量レベルを小さくする動作は、音量レベルをほぼゼロにするミュート、または、クラウド・サービス３０から供給される再生音声信号の停止あるいは一時停止、で置き換えてもよい。

一方で、音場Ｓにおけるステレオ音声信号の再生音量レベルが高くなれば、制御回路２０は、音声命令を認識することができなくなる場合がある。音場Ｓにおける音声命令の相対的な音量レベルが小さくなるからである。ただし、本実施例の音声認識スピーカー装置１は、音場Ｓに移動体Ｍが存在するか否かを検出できるので、例えば、再生音量レベルが所定以上に高く、かつ、移動体Ｍが在ると検出する場合には、一時的にクラウド・サービス３０から供給されるステレオ音声信号の音量レベルを小さくするように音量制御することができる。音場Ｓにおけるステレオ音声信号の再生音量レベルが低くなれば、ユーザーは遠隔からの音声認識に基づく音声操作を実現することができる。

その結果、この移動体検出装置を含んで構成される音声認識スピーカー装置１は、ユーザーから発せられる操作音声をマイクロホン４で収音して音声認識する際に、動電型スピーカー２および３により音声再生している場合であっても、音声認識できない場合が発生するのを防ぐことができる。筐体であるキャビネット５が比較的に小さいような場合には、動電型スピーカー２および３とマイクロホン４との音響的な結合が大きくなりやすいが、移動体検出装置により音場Ｓに移動体Ｍが存在するか否かを検出できるので、エコーキャンセル回路２２をたとえ備えていても、再生する音声の音圧レベルが高くなると発生しやすくなる音声認識できない場合を、抑制することができる。

上記実施例の音声認識スピーカー装置１は、比較的に小型のキャビネット５を備える場合であるが、キャビネット５は密閉型のキャビネットであればよく、また、位相反転型のキャビネットを構成するものであれば、バスレフダクト１３、または、パッシブラジエーター１６などを備えていてもよい。例えば、位相反転型のキャビネットは、ダブルバスレフ型、ケルトン型、バックロードホーン型、等の他のキャビネット構成であっても採用可能である。

また、音声認識スピーカー装置１は、上記のような直方体状のキャビネット５を備える場合に限られない。音声認識スピーカー装置１は、音声認識スピーカー装置のように動作して、ユーザーの頭部に載置して使用するヘッドホン、耳部に装着するイヤホン、首に掛けて使用する首掛け型スピーカー装置、等の音声再生収音装置を含み得るような電子機器に適用するように、キャビネット５を変形することができる。

本発明の音声再生収音装置および音声認識スピーカー装置は、家庭用のステレオ再生、もしくは電話通信に限られず、車載用のオーディオ機器や、映画館等の音響再生設備にも適用が可能である。

１音声認識スピーカー装置
２、３動電型スピーカー
４マイクロホン
５キャビネット
１０音声出力回路
１１、１２発振回路
１３、１４加算回路
１５、１６乗算器
２０制御回路
２１測定回路
２２エコーキャンセル回路
２３通信制御回路
３０クラウド・サービス

Claims

第１周波数の正弦波を含む第１音声信号および該第１周波数とは異なる第２周波数の正弦波を含む第２音声信号をそれぞれ出力する音声出力回路と、該第１音声信号を音波に変換して被検出音場に放射する第１スピーカーと、該第２音声信号を音波に変換して該被検出音場に放射する第２スピーカーと、該被検出音場の音波を収音音声信号に変換して出力するマイクロホンと、該収音音声信号に含まれる該第１周波数と該第２周波数の間の帯域の周波数成分の音圧レベルを測定する測定回路と、該測定回路が出力する測定信号により該被検出音場における移動体の存否を検出する検出回路と、を備え、
該検出回路が、該測定信号が所定値よりも小さい場合に該移動体が無いと検出し、該測定信号が該所定値以上に大きい場合に該移動体が在ると検出する、
移動体検出装置。
前記第１スピーカーおよび前記第２スピーカーがそれぞれ、振動板と、該振動板に取り付けられるボイスコイルと、該ボイスコイルのコイルが磁気空隙に配置される磁気回路と、を少なくとも有し、１５ｋＨｚ以上５０ｋＨｚ以下の前記第１周波数または前記第２周波数の前記音波を前記被検出音場に放射する動電型スピーカーであり、
前記音声出力回路が、該第１周波数および該第２周波数を、それらの差の絶対値が１０Ｈｚ以上１００Ｈｚ以下となるように設定する、
請求項１に記載の移動体検出装置。
請求項１または２に記載の移動体検出装置を含む音声認識スピーカー装置であって、
前記音声出力回路が、前記第１音声信号と前記第２音声信号とにそれぞれ他の第３音声信号または第４音声信号を含める加算回路を含み、
前記収音音声信号に含まれる前記第１スピーカー並びに前記第２スピーカーから再生される該第３音声信号の成分および該第４音声信号の成分を減算処理して、前記被検出音場に外来する他の音声の成分を相対的に大きくした該収音音声信号を出力するエコーキャンセル回路と、
該エコーキャンセル回路から出力される該収音音声信号が入力されて該他の音声の成分に含まれる音声命令を認識する音声認識回路と、をさらに備える、
音声認識スピーカー装置。
前記エコーキャンセル回路から出力される前記収音音声信号、または、前記音声認識回路から出力される前記音声命令を外部の音声認識装置との間で通信して、該音声命令を確定するとともに前記第３音声信号および前記第４音声信号を制御する通信制御回路をさらに含む、
請求項３に記載の音声認識スピーカー装置。
前記第１音声信号並びに前記第２音声信号の音量レベルが所定値以上になり、かつ、前記検出回路が、前記被検出音場に前記移動体が在ると検出する場合に、前記移動体検出装置の前記音声出力回路が、前記第１スピーカー並びに前記第２スピーカーから再生される前記第３音声信号の成分および前記第４音声信号の成分の相対レベルを小さくするように音量制御する乗算器をさらに含む、
請求項３または４に記載の音声認識スピーカー装置。