JP2020008300A - 移動体検出装置、および、音声認識スピーカー装置 - Google Patents

移動体検出装置、および、音声認識スピーカー装置 Download PDF

Info

Publication number
JP2020008300A
JP2020008300A JP2018126569A JP2018126569A JP2020008300A JP 2020008300 A JP2020008300 A JP 2020008300A JP 2018126569 A JP2018126569 A JP 2018126569A JP 2018126569 A JP2018126569 A JP 2018126569A JP 2020008300 A JP2020008300 A JP 2020008300A
Authority
JP
Japan
Prior art keywords
sound
frequency
circuit
speaker
signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2018126569A
Other languages
English (en)
Inventor
範匡 北川
Norimasa Kitagawa
範匡 北川
芳徳 中西
Yoshinori Nakanishi
芳徳 中西
川口 剛
Takeshi Kawaguchi
剛 川口
弘貴 黒崎
Hirotaka Kurosaki
弘貴 黒崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Onkyo Corp
Original Assignee
Onkyo Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Onkyo Corp filed Critical Onkyo Corp
Priority to JP2018126569A priority Critical patent/JP2020008300A/ja
Publication of JP2020008300A publication Critical patent/JP2020008300A/ja
Pending legal-status Critical Current

Links

Abstract

【課題】 音声認識スピーカー装置が備えるような音声再生用のスピーカーおよびマイクロホンを利用して移動体検出装置を構成し、大音量再生時にも遠隔操作を可能にする音声認識スピーカー装置を提供する。【解決手段】 移動体検出装置は、第1周波数の正弦波を含む第1音声信号および第2周波数の正弦波を含む第2音声信号を出力する音声出力回路と、第1音声信号/第1音声信号を音波に変換して被検出音場に放射する第1スピーカー/第2スピーカーと、被検出音場の音波を収音音声信号に変換して出力するマイクロホンと、収音音声信号に含まれる第1周波数と第2周波数の間の帯域の周波数成分の音圧レベルを測定する測定回路と、測定回路が出力する測定信号により被検出音場における移動体の存否を検出する検出回路と、を備える。【選択図】 図1

Description

本発明は、移動体検出装置、および、これを含む音声認識スピーカー装置に関する。
従来から、人体などの移動を検出する検出装置として、ドップラー効果を利用した反射式の移動体検出装置がある。移動体検出装置は、可聴音域を超えた超音波またはマイクロ波を被検出物に当てて、反射してきたマイクロ波の周波数を監視することによって物体の動きを検出する。被検出物が動いている場合にはドップラー効果により反射波の周波数が変化するので、この周波数変化を検出すれば、移動体を検出することができる(特許文献1、2)。
また、操作キーなどの従来からのユーザー操作に代えて、ユーザーとの対話型の音声操作に対応した音声認識機能、AI(人工知能)アシスタント機能などを利用可能な音声認識スピーカー装置が従来から存在する。このような音声認識スピーカー装置は、サーバーなどが接続されているクラウド・サービスにネットワーク接続して、ユーザーから発せられる音声を収音して音声認識し、かつ、その音声操作または質問に対応して音声の応答をスピーカーにより返すように動作する。
このような音声認識スピーカー装置は、音声を再生する動電型スピーカーと音声を収音するマイクロホンとが一つのキャビネットに取り付けられる音声再生収音装置である場合がある。音声再生収音装置において、同一のキャビネットに動電型スピーカーとマイクロホンとが取り付けられる場合には、動電型スピーカーから再生される音声は、マイクロホンから収音されるのが避けられない。すなわち、音声再生収音装置では、動電型スピーカーから音声再生している際にマイクロホンでユーザーの操作音声を収音しようとすると、動電型スピーカーからの再生音声が大きく操作音声に重畳した収音音声となり、収音音声からその操作音声を音声認識できない場合が出てきてしまう問題がある。
そこで、音声再生収音装置では、マイクロホンが収音する収音音声信号から動電型スピーカーに入力する再生音声信号を減算処理して、外部空間から外来する操作音声の成分を相対的に大きくした収音音声信号を出力するエコーキャンセル回路を備えることが必要になる(特許文献3、4)。しかし、動電型スピーカーが再生する音声の音圧レベルが高い場合、または、動電型スピーカーとマイクロホンとが接近して配置されている場合には、エコーキャンセル回路だけでは動電型スピーカーが再生する音声を十分に打ち消すことが出来ずに、結果的に操作音声を音声認識できない場合が発生する問題がある。
そこで、天板付近に取り付けるマイクロホンと、下向きにベース付近に取り付けるスピーカーを離して、スピーカーをマイクロホンに向けないように配置する、などの対策が必要になる(特許文献3)。なお、動電型スピーカーとマイクロホンとを備える拡声電話機用送受話ユニットなどの音声再生収音装置において、動電型スピーカーとマイクロホンとの音響的な結合を小さくしようとする技術思想は、周知であり、様々な構成または方法が提案されている(特許文献4、5)。
一方で、小型軽量な音声再生収音装置が求められる場合には、動電型スピーカーとマイクロホンとを取り付けるキャビネットが小さくなるので、結果的に動電型スピーカーとマイクロホンとが互いに近くに配置されてしまい、音響的な結合が大きくなってしまうという問題がある。つまり、音声認識スピーカー装置が再生する音声の音圧レベルをある程度高くするような大音量再生時には、操作音声を音声認識できなくなり、実質的に音声による遠隔操作ができなくなるという問題がある。例えば、大音量再生時には、音声認識スピーカー装置に対して操作音声によりボリュームを下げるように発声しても、音声認識スピーカー装置がボリュームを下げる動作を行わない、という不具合を生じる。
使用者が操作するスイッチ、リモコン、使用者を認識するセンサー、カメラ、等の使用者を認識する他の手段をさらに音声認識スピーカー装置に備えさせることで、大音量再生時の問題を解決しようとすることも想定される。しかし、そのような場合には、使用者を認識する他の手段をさらに音声認識スピーカー装置に備えさせると、装置全体が大掛かりになってコスト面で不利になるという面がある。
音声認識スピーカー装置は、予めスピーカーおよびマイクロホンを備えているので、これらを利用すればドップラー効果を利用した反射式の移動体検出装置を構成することができる可能性がある。しかし、音声認識スピーカー装置が備えるような音声再生用のスピーカーおよびマイクロホンを利用して移動体検出装置を構成するには、従来の移動体検出装置と同様の方法、手段を採用できない場合があるという問題がある。例えば、音声再生用のスピーカーは、ドップラー装置のスピーカーまたはアンテナに比較して、超音波またはマイクロ波の再生をするのには適さない一面を含むからである。
特開平9−189763号公報 特許第5288416号公報 米国特許第9,060,224号公報 特許第4640209号公報 特開昭58−56563号公報
本発明は、上記の従来技術が有する問題を解決するためになされたものであり、その目的は、移動体検出装置、および、音声認識スピーカー装置に関し、音声認識スピーカー装置が備えるような音声再生用のスピーカーおよびマイクロホンを利用して移動体検出装置を構成し、大音量再生時にも遠隔操作を可能にする音声認識スピーカー装置を提供することにある。
本発明の移動体検出装置は、第1周波数の正弦波を含む第1音声信号および第1周波数とは異なる第2周波数の正弦波を含む第2音声信号をそれぞれ出力する音声出力回路と、第1音声信号を音波に変換して被検出音場に放射する第1スピーカーと、第2音声信号を音波に変換して被検出音場に放射する第2スピーカーと、被検出音場の音波を収音音声信号に変換して出力するマイクロホンと、収音音声信号に含まれる第1周波数と第2周波数の間の帯域の周波数成分の音圧レベルを測定する測定回路と、測定回路が出力する測定信号により被検出音場における移動体の存否を検出する検出回路と、を備え、検出回路が、測定信号が所定値よりも小さい場合に移動体が無いと検出し、測定信号が所定値以上に大きい場合に移動体が在ると検出する。
好ましくは、本発明の移動体検出装置は、第1スピーカーおよび第2スピーカーがそれぞれ、振動板と、振動板に取り付けられるボイスコイルと、ボイスコイルのコイルが磁気空隙に配置される磁気回路と、を少なくとも有し、15kHz以上50kHz以下の第1周波数または第2周波数の音波を被検出音場に放射する動電型スピーカーであり、音声出力回路が、第1音声信号における第1周波数および第2音声信号における第2周波数を、それらの差の絶対値が10Hz以上100Hz以下となるように設定する。
また、本発明の音声認識スピーカー装置は、上記の移動体検出装置を含む音声認識スピーカー装置であって、音声出力回路が、第1音声信号と第2音声信号とにそれぞれ他の第3音声信号または第4音声信号を含める加算回路を含み、収音音声信号に含まれる第1スピーカー並びに第2スピーカーから再生される第3音声信号の成分および第4音声信号の成分を減算処理して、被検出音場に外来する他の音声の成分を相対的に大きくした収音音声信号を出力するエコーキャンセル回路と、エコーキャンセル回路から出力される収音音声信号が入力されて他の音声の成分に含まれる音声命令を認識する音声認識回路と、をさらに備える。
また、本発明の音声認識スピーカー装置は、エコーキャンセル回路から出力される収音音声信号、または、音声認識回路から出力される音声命令を外部の音声認識装置との間で通信して、音声命令を確定するとともに第3音声信号および第4音声信号を制御する通信制御回路をさらに含む。
また、本発明の音声認識スピーカー装置は、第1音声信号並びに第2音声信号の音量レベルが所定値以上になり、かつ、検出回路が、被検出音場に移動体が在ると検出する場合に、移動体検出装置の音声出力回路が、第1スピーカー並びに第2スピーカーから再生される第3音声信号の成分および第4音声信号の成分の相対レベルを小さくするように音量制御する乗算器をさらに含む。
以下、本発明の作用について説明する。
本発明の移動体検出装置は、第1周波数の正弦波を含む第1音声信号および第1周波数とは異なる第2周波数の正弦波を含む第2音声信号をそれぞれ出力する音声出力回路と、第1音声信号を音波に変換して被検出音場に放射する第1スピーカーと、第2音声信号を音波に変換して被検出音場に放射する第2スピーカーと、被検出音場の音波を収音音声信号に変換して出力するマイクロホンと、収音音声信号に含まれる第1周波数と第2周波数の間の帯域の周波数成分の音圧レベルを測定する測定回路と、測定回路が出力する測定信号により被検出音場における移動体の存否を検出する検出回路と、を備える。
移動体検出装置は、第1スピーカーおよび第2スピーカーをそれぞれ、振動板と、振動板に取り付けられるボイスコイルと、ボイスコイルのコイルが磁気空隙に配置される磁気回路と、を少なくとも有する動電型スピーカーにすればよい。例えば、第1周波数および第2周波数を、高い周波数である15kHz以上50kHz以下に選び、それらの差の絶対値が10Hz以上100Hz以下となるように設定すれば、マイクロホンが収音する収音音声信号に含まれる第1周波数と第2周波数の間の帯域の周波数成分の音圧レベルを測定すれば、移動体検出装置の検出回路によって、測定信号が所定値よりも小さい場合に移動体が無いと検出し、測定信号が所定値以上に大きい場合に移動体が在ると検出することができる。
収音音声信号に含まれる第1周波数と第2周波数の間の帯域の周波数成分の音圧レベルを測定するようにしているので、第1周波数および第2周波数の信号レベルを著しく大きくしなくても、被検出音場における移動体の存否を検出することができる。また、第1周波数および第2周波数を単一の電機音響変換器で再生する場合に、発生しやすい混変調歪みによる差周波数成分の影響を避けることができ、移動体検出装置または音声認識スピーカー装置を構成することができる利点がある。
また、音声認識スピーカー装置は、音声出力回路が、第1音声信号と第2音声信号とにそれぞれ他の第3音声信号または第4音声信号を含める加算回路を含み、収音音声信号に含まれる第1スピーカー並びに第2スピーカーから再生される第3音声信号の成分および第4音声信号の成分を減算処理して、被検出音場に外来する他の音声の成分を相対的に大きくした収音音声信号を出力するエコーキャンセル回路と、エコーキャンセル回路から出力される収音音声信号が入力されて他の音声の成分に含まれる音声命令を認識する音声認識回路と、をさらに備えるようにして、移動体検出装置を含むようにすればよい。
例えば、ステレオ左右音声信号である第3音声信号または第4音声信号を音声再生する音声認識スピーカー装置について、音声による遠隔操作が可能になる。エコーキャンセル回路から出力される収音音声信号、または、音声認識回路から出力される音声命令を外部の音声認識装置との間で通信して、音声命令を確定するとともに第3音声信号および第4音声信号を制御する通信制御回路をさらに含むようにすれば、サーバーなどが接続されているクラウド・サービスにネットワーク接続して、ユーザーから発せられる音声を収音して音声認識し、かつ、その音声操作または質問に対応して音声の応答をスピーカーにより返すように動作することができる。
さらに、音声認識スピーカー装置は、第1音声信号並びに第2音声信号の音量レベルが所定値以上になり、かつ、検出回路が、被検出音場に移動体が在ると検出する場合に、移動体検出装置の音声出力回路が、第1スピーカー並びに第2スピーカーから再生される第3音声信号の成分および第4音声信号の成分の相対レベルを小さくするように音量制御する乗算器をさらに含むようにすればよい。第3音声信号または第4音声信号を音声再生する音声認識スピーカー装置について、大音量再生時に音声による遠隔操作ができなくても、移動体検出により使用者による操作が伝えられるので、信号の相対レベルを小さくするように音量制御して、音声による遠隔操作を行うことができる。
本発明の移動体検出装置、および、音声認識スピーカー装置は、音声認識スピーカー装置が備えるような音声再生用のスピーカーおよびマイクロホンを利用して移動体検出装置を構成し、大音量再生時にも遠隔操作を可能にする音声認識スピーカー装置を提供することができる。
本発明の好ましい実施形態による移動体検出装置を含む音声認識スピーカー装置について説明するブロックダイアグラムである。(実施例1) 本発明の好ましい実施形態による移動体検出装置の動作について説明するグラフである。(実施例1)
以下、本発明の好ましい実施形態による移動体検出装置、および、音声認識スピーカー装置について説明するが、本発明はこれらの実施形態には限定されない。
図1は、本発明の好ましい実施形態による音声認識スピーカー装置1について説明する図である。具体的には、図1は移動体検出装置を含む音声認識スピーカー装置1の構成を示すブロックダイアグラムである。なお、以下において、本発明の説明に不要な音声認識スピーカー装置1の一部の構造や、内部構造等は、図示並びに説明を省略する。
図1に示すように、音声認識スピーカー装置1は、音声を再生する複数の動電型スピーカー2および3と、音場Sでの音声を収音するマイクロホン4とが、キャビネット5に取り付けられている。音声認識スピーカー装置1は、クラウド・サービス30から供給される再生音声信号などを、増幅回路6または7で電力増幅して動電型スピーカー2並びに3に供給し、動電型スピーカー2および3が入力音声信号を音波に電気音響変換して音声を再生する。
例えば、クラウド・サービス30から左音声信号Lおよび右音声信号Rを含むステレオ音声信号が供給される場合には、音声認識スピーカー装置1は、動電型スピーカー2および3によりステレオ音声再生に対応可能になる。なお、本実施例の動電型スピーカー2および3は、同一型の動電型スピーカーを2つ用いてステレオ音声信号(左音声信号L、右音声信号R)に対応可能にしているが、もちろんモノラル音声信号にも対応可能である。
音声認識スピーカー装置1のキャビネット5は、略直方体形状の天面に、動電型スピーカー2および3が取り付けられている。動電型スピーカー2および3は、それぞれ振動板と、振動板に連結するボイスコイルと、ボイスコイルのコイルが配置される磁気空隙を有する磁気回路と、振動板およびボイスコイルを振動可能に支持するエッジおよび磁気回路が連結するフレームと、を備える。動電型スピーカー2および3の振動板の一方面は、外部空間側に露出しており、振動板の他方面は、キャビネット5が規定する内部空間に臨んでいる。
したがって、ボイスコイルのコイルに音声信号電流が供給されると、振動板およびボイスコイルに駆動力が働いて振動し、振動板から音波がその前後方向に逆位相の関係で放射される。動電型スピーカー2および3は、少なくとも人間の聴覚の可聴周波数の上限である約20kHzよりも低い周波数である15kHz以上が再生可能なフルレンジ(全帯域)スピーカーであればよい。なお、動電型スピーカー2および3は、複数の再生帯域に分かれた複数のスピーカーから構成されるマルチウェイスピーカーシステムであって、好ましくは50kHz程度までは再生可能な高音域の再生に適するツィーターを含む構成であってもよい。
また、音声認識スピーカー装置1において、再生音声信号は、マイクロホン4が接続されるエコーキャンセル回路22に入力される。マイクロホン4は、外部空間におけるキャビネット5の取付位置での音場Sの音声を収音し、電気音響変換してその音圧レベルに応じた収音音声信号を、後述する測定回路21とエコーキャンセル回路22とに出力する。
エコーキャンセル回路22は、マイクロホン4が収音する収音音声信号から動電型スピーカー2および3に入力する再生音声信号を減算処理する。減算処理では、動電型スピーカー2および3からマイクロホン4への伝達関数が考慮される。その結果、音声認識スピーカー装置1が動電型スピーカー2および3によりステレオ音声を音声再生している場合には、エコーキャンセル回路22は、外部空間から外来する操作音声などの他の音声の成分を相対的に大きくした収音音声信号を、制御回路20に出力する。
制御回路20は、音声認識スピーカー装置1の動作を制御する。制御回路20は、エコーキャンセル回路22から出力される収音音声信号が入力されて他の音声の成分に含まれる音声命令を認識する(図示しない)音声認識回路と、被検出音場における移動体Mの存否を検出する(図示しない後述する)検出回路と、を含む。また、制御回路20は、クラウド・サービス30に接続する通信制御回路23と接続する。音声認識スピーカー装置1は、さらに(図示しない)電源部、等を含んで構成される。
音声認識スピーカー装置1は、ユーザーから発せられる音声をマイクロホン4で収音して音声認識し、かつ、その音声操作または質問に対応して音声の応答を動電型スピーカー2および3により再生して返すように動作する。つまり、音声認識スピーカー装置1は、エコーキャンセル回路22を動作させて音声命令を認識する音声認識回路を含む制御回路20を含むので、動電型スピーカー2および3により音声再生している場合であっても、ユーザーの操作音声を相対的に大きくした収音音声信号を得ることができて、音声認識に基づく音声操作を実現することができる。
音声認識スピーカー装置1は、通信制御回路23を介して接続するクラウド・サービス30において、音声命令を認識する音声認識を動作させてもよい。その場合には、音声認識スピーカー装置1の制御回路20は、エコーキャンセル回路22から出力される収音音声信号か、制御回路20の音声認識回路から出力される音声命令か、のいずれかを外部の音声認識装置であるクラウド・サービス30に伝送するように通信する。通信制御回路23および制御回路20は、クラウド・サービス30から供給される命令、並びに、音声信号に基づいて、音声認識スピーカー装置1の動作を制御する。
音声認識スピーカー装置1は、動電型スピーカー2および3が音声再生する音場Sに移動体Mが存在するか、否かを検出する移動体検出装置を含んで構成されている。すなわち、移動体検出装置は、音声認識スピーカー装置1が予め備えている動電型スピーカー2および3とマイクロホン4とを活用して、ドップラー効果を利用した反射式の移動体検出を実現する。マイクロホン4は、動電型スピーカー2および3から放射されてそのまま到来する直接音だけでなく、音場Sにおける移動体Mを含むあらゆる反射物により反射して到来する反射音を含めて収音するからである。移動体Mとは、例えば音声認識スピーカー装置1を利用するユーザー自身であり、ユーザーが歩いて移動するという場合のみならず、身体の一部を動かすような場合をも含む。
音声認識スピーカー装置1は、第1周波数f1の正弦波を含む第1音声信号および第1周波数f1とは異なる第2周波数f2の正弦波を含む第2音声信号をそれぞれ出力する音声出力回路10を含む。音声出力回路10は、第1周波数f1の正弦波を出力する発振回路11と、第2周波数f2の正弦波を出力する発振回路12と、を含む。第1周波数f1または第2周波数f2は、人間の聴覚での感度が低下する高い周波数帯域である15kHz以上50kHz以下から、それらの差の絶対値が10Hz以上100Hz以下となるように、制御回路20が設定する。例えば、第1周波数f1を17500Hzと設定する場合に、第2周波数f2を17550Hzと設定することができる。
音声出力回路10は、発振回路11からの出力である第1周波数f1の正弦波と、通信制御回路23からの出力である(他の第3音声信号としての)左音声信号Lと、を加算して第1音声信号として動電型スピーカー2に接続する増幅器6に出力する加算回路13を含む。同様に、音声出力回路10は、発振回路12からの出力である第2周波数f2の正弦波と、通信制御回路23からの出力である(他の第4音声信号としての)右音声信号Rと、を加算して第2音声信号として動電型スピーカー3に接続する増幅器7に出力する加算回路14を含む。したがって、動電型スピーカー2から第1周波数f1の正弦波が音場Sに再生され、動電型スピーカー3から第2周波数f2の正弦波が音場Sに再生される。
また、音声出力回路10は、通信制御回路23から出力される左音声信号Lおよび右音声信号Rについて、それぞれ信号レベルを調整するように所定の係数値を乗算して加算回路13または14に出力する乗算器15または16を含む。乗算器15は、動電型スピーカー2から再生される音声に含まれる左音声信号Lの成分の相対レベルを音量制御することができる。また、乗算器16は、動電型スピーカー3から再生される音声に含まれる右音声信号Rの成分の相対レベルを音量制御することができる。
図2は、この音声認識スピーカー装置1の移動体検出装置の動作について説明するグラフである。具体的には、マイクロホン4が収音した被検出音場Sの音波の音圧レベル周波数特性を模式的に示すグラフであり、グラフの横軸は周波数を示し、縦軸は音圧レベル(SPL)を示す。図2のグラフの横軸の周波数は、第1周波数f1および第2周波数f2の付近の高い周波数帯域に限って表示しており、また、グラフの縦軸の1区間Dの幅が10dBとなるように基準化して表示している。
図2(a)は、音場Sに移動体Mが存在しない場合(つまり、移動する反射物が存在しない場合)のマイクロホン4が収音した被検出音場Sの音波の音圧レベル周波数特性である。図2(a)のグラフでは、発振回路11および12からそれぞれ出力される第1周波数f1の正弦波と第2周波数f2の正弦波の信号レベルを、ほぼ同一に調整しているので、第1周波数f1と第2周波数f2とにそれぞれほぼ同じ高い音圧レベルのピークが出現している。その一方で、それらの間の(f1〜f2)帯域に深いディップが出現し、この(f1〜f2)帯域の周波数成分の音圧レベルが十分に低くなっていることがわかる。
これに対して、図2(b)は、音場Sに移動体Mが存在する場合(つまり、移動する反射物が存在する場合)のマイクロホン4が収音した被検出音場Sの音波の音圧レベル周波数特性である。図2(a)のグラフの場合との相違点は、音場Sに移動体Mが存在する点のみである。第1周波数f1と第2周波数f2とにそれぞれほぼ同じ高い音圧レベルのピークが出現しているものの、移動体Mによるドップラー効果により、第1周波数f1と第2周波数f2が変調される結果、第1周波数f1と第2周波数f2の間の(f1〜f2)帯域にも高い音圧レベルの音波が出現していることがわかる。つまり、移動体Mが存在しない場合に観測できる(f1〜f2)帯域の深いディップが、音場Sに移動体Mが存在する場合には消失することがわかる。
音声認識スピーカー装置1の移動体検出装置は、上記の現象を利用して音場Sに移動体Mが存在するか否かを検出する。具体的には、音声認識スピーカー装置1の移動体検出装置は、マイクロホン4が収音する収音音声信号に含まれる第1周波数f1と第2周波数f2の間の(f1〜f2)帯域の周波数成分の音圧レベルを測定する測定回路21と、測定回路21が出力する測定信号により被検出音場Sにおける移動体Mの存否を検出する制御回路20に含まれる検出回路と、を備える。制御回路20に含まれる検出回路は、測定回路21が出力する測定信号により収音音声信号に含まれる(f1〜f2)帯域の周波数成分の音圧レベルが分かるので、測定信号が所定値よりも小さい場合に移動体Mが無いと検出し、測定信号が所定値以上に大きい場合に移動体Mが在ると検出する。
例えば、第1周波数f1を17500Hzと設定し、第2周波数f2を17550Hzと設定する場合に、17500Hz〜17550Hzの帯域レベルが所定値よりも大きければ、移動体Mが在ると検出できる。第1周波数f1と第2周波数f2との差周波数が50Hzである場合に、17500Hz〜17550Hzの周波数帯域には、変調された周波数成分が観測できるようになるからである。正弦波の第1周波数f1および第2周波数f2を、動電型スピーカー2並びに3によって再生可能であり、かつ、マイクロホン4によって収音可能な上記の様な周波数に選ぶことで、移動体Mが存在するか否かを検出する移動体検出装置を、音声認識スピーカー装置1に組み入れることができる。
なお、仮に動電型スピーカー2並びに3のいずれか一方のみに、第1周波数f1の正弦波を含む第1音声信号と第2周波数f2の正弦波を含む第2音声信号を加算した信号を供給して音声再生した場合には、動電型スピーカーで発生する混変調歪みの影響を受けてしまうので、同様に(f1〜f2)帯域の周波数成分の音圧レベルを検出しても、移動体Mの有無を検出するのは困難である。一つの動電型スピーカーに第1周波数f1と第2周波数f2の正弦波を加算して入力すると、移動体Mの有無に係わらず、図2(b)のグラフに似て、(f1〜f2)帯域の周波数成分の音圧レベルが混変調の影響を受けて出現するからである。本実施例のように、第1周波数f1または第2周波数f2の正弦波を、それぞれ別の電機音響変換器である動電型スピーカー2並びに3により再生することで、動電型スピーカーで発生する混変調歪みの影響を避けることができる。
音声認識スピーカー装置1は、予め動電型スピーカー2並びに3およびマイクロホン4を備えているので、ユーザーが操作するスイッチ、リモコン、使用者を認識するセンサー、カメラ、等の使用者を認識する他の手段をさらに備える必要が無く、装置全体が大掛かりにならずにコスト面で有利になるという利点がある。
本実施例では、音声認識スピーカー装置1に移動体検出装置が含まれているが、単独の移動体検出装置として構成してもよい。移動体検出装置は、少なくとも音声出力回路10と、動電型スピーカー2並びに3と、マイクロホン4と、測定回路21と、検出回路を構成する制御回路20と、を含んでいればよい。移動体検出装置は、音場Sに移動体Mが存在するか否かを収音音声信号に含まれる(f1〜f2)帯域の周波数成分の音圧レベルにより検出することができる。また、移動体検出装置は、検出回路を構成する制御回路20が、通信制御回路23を介して接続するクラウド・サービス30と通信して、音場Sに移動体Mが存在するか否かを検出するように動作してもよい。
制御回路20に含まれる検出回路は、測定回路21が出力する測定信号が所定値よりも小さい場合に移動体Mが無いと検出し、測定信号が所定値以上に大きい場合に移動体Mが在ると検出する。したがって、移動体Mがマイクロホン4に対して相対的に近い場合には、検出回路は、収音音声信号に含まれる(f1〜f2)帯域の反射音が相対的に大きくなる良好に検出が可能になる。一方、移動体Mがマイクロホン4に対して相対的に遠い場合には、収音音声信号に含まれる(f1〜f2)帯域の反射音が相対的に小さくなるので、移動体Mの検出が困難になる場合がある。測定回路21および検出回路の設定により、音声認識スピーカー装置1の周囲のある程度近い範囲に移動体Mが在るか無いかを検出することができる。
制御回路20は、音場Sに移動体Mが存在するか否かを判断し、その判断に応じて音声認識スピーカー装置1の動作を異ならせるように制御することができる。例えば、音場Sに移動体Mが存在するか否かに応じて、クラウド・サービス30から供給される再生音声信号の音量制御が可能になる。
例えば、音声認識スピーカー装置1は、クラウド・サービス30から供給される再生音声信号を動電型スピーカー2並びに3から再生する場合に、ユーザーが腕を振るなどの動作をすれば、音場Sに移動体Mが存在することを検出して、クラウド・サービス30からの左音声信号Lおよび右音声信号Rを含むステレオ音声信号の音量レベルを、音声出力回路10の乗算器15または16により小さくするように音量制御するなど、遠隔操作を可能にできる。
音場Sにおけるステレオ音声信号の再生音量レベルが低くなれば、マイクロホン4から見て動電型スピーカー2および3との音響的な結合が小さくなるので、結果的に音声認識回路での音声命令を認識する動作を確実にすることができる。ステレオ音声信号の再生音量レベルが低くなれば、エコーキャンセル回路22における減算処理が確実になり、操作音声などの他の音声の成分を相対的に大きくした収音音声信号を制御回路20に出力することができるからである。なお、音量レベルを小さくする動作は、音量レベルをほぼゼロにするミュート、または、クラウド・サービス30から供給される再生音声信号の停止あるいは一時停止、で置き換えてもよい。
一方で、音場Sにおけるステレオ音声信号の再生音量レベルが高くなれば、制御回路20は、音声命令を認識することができなくなる場合がある。音場Sにおける音声命令の相対的な音量レベルが小さくなるからである。ただし、本実施例の音声認識スピーカー装置1は、音場Sに移動体Mが存在するか否かを検出できるので、例えば、再生音量レベルが所定以上に高く、かつ、移動体Mが在ると検出する場合には、一時的にクラウド・サービス30から供給されるステレオ音声信号の音量レベルを小さくするように音量制御することができる。音場Sにおけるステレオ音声信号の再生音量レベルが低くなれば、ユーザーは遠隔からの音声認識に基づく音声操作を実現することができる。
その結果、この移動体検出装置を含んで構成される音声認識スピーカー装置1は、ユーザーから発せられる操作音声をマイクロホン4で収音して音声認識する際に、動電型スピーカー2および3により音声再生している場合であっても、音声認識できない場合が発生するのを防ぐことができる。筐体であるキャビネット5が比較的に小さいような場合には、動電型スピーカー2および3とマイクロホン4との音響的な結合が大きくなりやすいが、移動体検出装置により音場Sに移動体Mが存在するか否かを検出できるので、エコーキャンセル回路22をたとえ備えていても、再生する音声の音圧レベルが高くなると発生しやすくなる音声認識できない場合を、抑制することができる。
上記実施例の音声認識スピーカー装置1は、比較的に小型のキャビネット5を備える場合であるが、キャビネット5は密閉型のキャビネットであればよく、また、位相反転型のキャビネットを構成するものであれば、バスレフダクト13、または、パッシブラジエーター16などを備えていてもよい。例えば、位相反転型のキャビネットは、ダブルバスレフ型、ケルトン型、バックロードホーン型、等の他のキャビネット構成であっても採用可能である。
また、音声認識スピーカー装置1は、上記のような直方体状のキャビネット5を備える場合に限られない。音声認識スピーカー装置1は、音声認識スピーカー装置のように動作して、ユーザーの頭部に載置して使用するヘッドホン、耳部に装着するイヤホン、首に掛けて使用する首掛け型スピーカー装置、等の音声再生収音装置を含み得るような電子機器に適用するように、キャビネット5を変形することができる。
本発明の音声再生収音装置および音声認識スピーカー装置は、家庭用のステレオ再生、もしくは電話通信に限られず、車載用のオーディオ機器や、映画館等の音響再生設備にも適用が可能である。
1 音声認識スピーカー装置
2、3 動電型スピーカー
4 マイクロホン
5 キャビネット
10 音声出力回路
11、12 発振回路
13、14 加算回路
15、16 乗算器
20 制御回路
21 測定回路
22 エコーキャンセル回路
23 通信制御回路
30 クラウド・サービス

Claims (5)

  1. 第1周波数の正弦波を含む第1音声信号および該第1周波数とは異なる第2周波数の正弦波を含む第2音声信号をそれぞれ出力する音声出力回路と、該第1音声信号を音波に変換して被検出音場に放射する第1スピーカーと、該第2音声信号を音波に変換して該被検出音場に放射する第2スピーカーと、該被検出音場の音波を収音音声信号に変換して出力するマイクロホンと、該収音音声信号に含まれる該第1周波数と該第2周波数の間の帯域の周波数成分の音圧レベルを測定する測定回路と、該測定回路が出力する測定信号により該被検出音場における移動体の存否を検出する検出回路と、を備え、
    該検出回路が、該測定信号が所定値よりも小さい場合に該移動体が無いと検出し、該測定信号が該所定値以上に大きい場合に該移動体が在ると検出する、
    移動体検出装置。
  2. 前記第1スピーカーおよび前記第2スピーカーがそれぞれ、振動板と、該振動板に取り付けられるボイスコイルと、該ボイスコイルのコイルが磁気空隙に配置される磁気回路と、を少なくとも有し、15kHz以上50kHz以下の前記第1周波数または前記第2周波数の前記音波を前記被検出音場に放射する動電型スピーカーであり、
    前記音声出力回路が、該第1周波数および該第2周波数を、それらの差の絶対値が10Hz以上100Hz以下となるように設定する、
    請求項1に記載の移動体検出装置。
  3. 請求項1または2に記載の移動体検出装置を含む音声認識スピーカー装置であって、
    前記音声出力回路が、前記第1音声信号と前記第2音声信号とにそれぞれ他の第3音声信号または第4音声信号を含める加算回路を含み、
    前記収音音声信号に含まれる前記第1スピーカー並びに前記第2スピーカーから再生される該第3音声信号の成分および該第4音声信号の成分を減算処理して、前記被検出音場に外来する他の音声の成分を相対的に大きくした該収音音声信号を出力するエコーキャンセル回路と、
    該エコーキャンセル回路から出力される該収音音声信号が入力されて該他の音声の成分に含まれる音声命令を認識する音声認識回路と、をさらに備える、
    音声認識スピーカー装置。
  4. 前記エコーキャンセル回路から出力される前記収音音声信号、または、前記音声認識回路から出力される前記音声命令を外部の音声認識装置との間で通信して、該音声命令を確定するとともに前記第3音声信号および前記第4音声信号を制御する通信制御回路をさらに含む、
    請求項3に記載の音声認識スピーカー装置。
  5. 前記第1音声信号並びに前記第2音声信号の音量レベルが所定値以上になり、かつ、前記検出回路が、前記被検出音場に前記移動体が在ると検出する場合に、前記移動体検出装置の前記音声出力回路が、前記第1スピーカー並びに前記第2スピーカーから再生される前記第3音声信号の成分および前記第4音声信号の成分の相対レベルを小さくするように音量制御する乗算器をさらに含む、
    請求項3または4に記載の音声認識スピーカー装置。
JP2018126569A 2018-07-03 2018-07-03 移動体検出装置、および、音声認識スピーカー装置 Pending JP2020008300A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2018126569A JP2020008300A (ja) 2018-07-03 2018-07-03 移動体検出装置、および、音声認識スピーカー装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018126569A JP2020008300A (ja) 2018-07-03 2018-07-03 移動体検出装置、および、音声認識スピーカー装置

Publications (1)

Publication Number Publication Date
JP2020008300A true JP2020008300A (ja) 2020-01-16

Family

ID=69151175

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018126569A Pending JP2020008300A (ja) 2018-07-03 2018-07-03 移動体検出装置、および、音声認識スピーカー装置

Country Status (1)

Country Link
JP (1) JP2020008300A (ja)

Similar Documents

Publication Publication Date Title
US9307321B1 (en) Speaker distortion reduction
EP2202998B1 (en) A device for and a method of processing audio data
US20070154049A1 (en) Transducer, headphone and method for reducing noise
US9628904B2 (en) Voltage control device for ear microphone
US10165364B2 (en) Linear resonant actuator controller
EP2545716B1 (en) Apparatus, method and computer program for controlling an acoustic signal
CN107005763A (zh) 用于非线性和时变回波消除的参考麦克风
US20080247560A1 (en) Audio output device
KR101092958B1 (ko) 이어셋
WO2018010375A1 (zh) 一种通过耳机实现卡拉ok功能的方法、装置及耳机
CN109067998B (zh) 声音调节方法、终端设备和具有存储功能的装置
US9374637B2 (en) Electronic system and electronic device thereof
WO2016083970A1 (en) Versatile electroacoustic diffuser-absorber
US11303758B2 (en) System and method for generating an improved reference signal for acoustic echo cancellation
EP3840402B1 (en) Wearable electronic device with low frequency noise reduction
US20230027782A1 (en) Hearing aid comprising an ite-part adapted to be located in an ear canal of a user
US11862138B2 (en) Hearing device comprising an active emission canceller
WO2023070786A1 (zh) 一种音频降噪方法及音频监控装置
US20220394397A1 (en) Low latency hearing aid
JP2020008300A (ja) 移動体検出装置、および、音声認識スピーカー装置
KR102392460B1 (ko) 소음 제거 장치 및 방법
US9679551B1 (en) Noise reduction headphone with two differently configured speakers
JP2012015717A (ja) スピーカー駆動制御システム
JP2022543404A (ja) 騒音除去装置および方法
JP2011009990A (ja) スピーカ装置