JP6250297B2 - 音声入力装置、および画像表示装置 - Google Patents

音声入力装置、および画像表示装置 Download PDF

Info

Publication number
JP6250297B2
JP6250297B2 JP2013084503A JP2013084503A JP6250297B2 JP 6250297 B2 JP6250297 B2 JP 6250297B2 JP 2013084503 A JP2013084503 A JP 2013084503A JP 2013084503 A JP2013084503 A JP 2013084503A JP 6250297 B2 JP6250297 B2 JP 6250297B2
Authority
JP
Japan
Prior art keywords
user
voice
information
microphone
microphone array
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2013084503A
Other languages
English (en)
Other versions
JP2014207589A5 (ja
JP2014207589A (ja
Inventor
徳井 圭
圭 徳井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP2013084503A priority Critical patent/JP6250297B2/ja
Publication of JP2014207589A publication Critical patent/JP2014207589A/ja
Publication of JP2014207589A5 publication Critical patent/JP2014207589A5/ja
Application granted granted Critical
Publication of JP6250297B2 publication Critical patent/JP6250297B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Studio Devices (AREA)
  • Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)
  • Circuit For Audible Band Transducer (AREA)

Description

本発明は音声入力装置、および画像表示装置に関する技術であり、特に、音声情報を取得する複数のマイクロフォンと、画像情報を取得する撮像素子とを備え、取得される音声情報のノイズ低減技術に関する。
複数のマイクロフォンを備えるマイクアレイを使用して、特定方向からの音声情報を強調し、かつ、特定方向以外からの音声情報を抑制することにより、特定方向からの音声情報を取得する音声入力装置が開発されている。これは、複数のマイクロフォンから取得される音声情報から音源定位を行い、音源が存在する方向の音声情報を入力音声情報とすることで、特定方向の音声情報を入力音声情報として取得するものである。これにより、ユーザが発話した音声情報を取得することができる。
しかし、音声情報を取得する方向を音声情報のみにより制御するため、ユーザ以外の音源が存在する場合、ユーザ以外の音源の方向を特定方向として制御してしまうと、ユーザが意図しない音声情報が入力音声情報として取得されてしまう。
そこで、撮像素子で撮影された画像からユーザの方向を検出し、音声情報を取得する特定方向を検出したユーザの方向になるように制御し、ユーザの音声情報を取得する方法が提案されている。
例えば、特許文献1には、カメラにより撮影された撮影画像を用いて、発話者の体格や着座位置などにより変化する話者方向を特定し、マイクロフォンの指向性方向を適切に制御することで音声認識の精度を向上させる音声処理装置が開示されている。
特開2009−225379号公報
しかしながら特許文献1のように、カメラにより撮影された撮影画像に基づいてマイクロフォンの指向性方向を制御する方法は、以下のような課題を有する。
ユーザが存在する方向と同一の方向に他の音源が存在している場合、ユーザからの音声情報と他の音源からの音声情報を分離して取得することができない。例えば、ユーザの背面に他の人物が存在する場合、撮像素子で撮影された画像からユーザの方向を特定するが、他の人物も同一方向にいるため、他の人物が発話した音声情報として取得してしまう。
また、複数のユーザが存在する場合、音声情報を取得する方向を適切に設定しないと、複数のユーザの音声情報がお互いにノイズとして含まれてしまい、各ユーザからの音声情報を取得することができない。
そこで本発明は、上記課題に鑑みてなされたものであり、ノイズである他の音源から発せられる音声情報を低減し、ユーザから発話される音声情報を取得する音声入力装置、および画像表示装置を提供する。
本発明の音声入力装置は、画像情報を取得する撮像素子と、音声情報を取得する複数のマイクロフォンを備え、撮像素子が取得した画像情報からユーザを検出するユーザ検出部と、マイクロフォンが取得した音声情報のうち、特定方向の音声情報を出力音声情報とするユーザ音声取得部とを備え、ユーザ音声取得部が、特定方向の基準とするマイクロフォンの位置を、ユーザ検出部で検出されるユーザの位置に基づいて変化させることを特徴とする。
さらに、本発明の音声入力装置は、ユーザ音声取得部が、ユーザ検出部で検出されたユーザの人数によって、特定方向の基準とするマイクロフォンの位置を変化させると好適である。
さらに、本発明の音声入力装置は、ユーザ音声取得部が、撮像素子を基準としたユーザの方向と、複数のマイクロフォンの中心を基準としたユーザの方向とがなす角より、撮像素子を基準としたユーザの方向と、特定方向とがなす角が大きくなるように、特定方向の基準を設定すると好適である。
さらに、本発明の音声入力装置は、ユーザ音声取得部が、撮像素子を基準としたユーザの方向と、複数のマイクロフォンの中心を基準としたユーザの方向とがなす角より、撮像素子を基準としたユーザの方向と、特定方向とがなす角が小さくなるように、特定方向の基準とするマイクロフォンの位置を設定すると好適である。
また、本発明の画像表示装置は、上記の音声入力装置と、音声入力装置が出力する音声情報を認識する音声認識部と、音声認識部で認識された結果に基づいて所定の制御を行う制御部を備えることを特徴とする。
本発明の音声入力装置によれば、マイクアレイで特定方向の音声情報を取得するときに、方向の基準となる基準マイクの位置を適切に設定することで、ノイズとなる他の音源から発せられる音声情報を低減することが可能となる。
また、本発明の画像表示装置では、ノイズとなる音声情報を低減できる音声入力装置を備えることにより、認識率の高い音声入力が可能な画像表示装置を実現することできる。
本発明の音声入力装置の構成例を示す図である。 撮像素子により撮影された画像情報の例を示す図である。 カメラ基準ユーザ角度を示す図である。 カメラ基準ユーザ角度、カメラ基準ユーザ距離、およびマイクアレイ基準ユーザ角度の関係を示す図である。 カメラ基準ユーザ角度とマイクアレイ基準ユーザ角度の例を示す図である。 カメラ基準ユーザ角度とマイクアレイ基準ユーザ角度の他の例を示す図である。 カメラ基準ユーザ角度とマイクアレイ基準ユーザ角度の更に他の例を示す図である。 カメラ基準ユーザ角度とマイクアレイ基準ユーザ角度の更に他の例を示す図である。 カメラ基準ユーザ角度とマイクアレイ基準ユーザ角度の更に他の例を示す図である。 カメラ基準ユーザ角度とマイクアレイ基準ユーザ角度の更に他の例を示す図である。 カメラ基準ユーザ角度とマイクアレイ基準ユーザ角度の更に他の例を示す図である。 カメラ基準ユーザ角度とマイクアレイ基準ユーザ角度の更に他の例を示す図である。 本発明の音声入力装置の他の構成例を示す図である。 本発明の音声入力装置の更に他の構成例を示す図である。 カメラ基準ユーザ角度とマイクアレイ基準ユーザ角度の更に他の例を示す図である。 カメラ基準ユーザ角度とマイクアレイ基準ユーザ角度の更に他の例を示す図である。 カメラ基準ユーザ角度とマイクアレイ基準ユーザ角度の更に他の例を示す図である。 カメラ基準ユーザ角度とマイクアレイ基準ユーザ角度の更に他の例を示す図である。 カメラ基準ユーザ角度とマイクアレイ基準ユーザ角度の更に他の例を示す図である。 カメラ基準ユーザ角度とマイクアレイ基準ユーザ角度の更に他の例を示す図である。 カメラ基準ユーザ角度とマイクアレイ基準ユーザ角度の更に他の例を示す図である。 カメラ基準ユーザ角度とマイクアレイ基準ユーザ角度の更に他の例を示す図である。 本発明の画像表示装置の構成例を示す図である。 本発明の音声入力装置を備えた音声情報記録装置の構成例を示す図である。
以下、図面を使って本発明の実施の形態を詳細に説明する。なお、各図における表現は理解しやすいように誇張して記載しており、実際のものとは異なる場合がある。
(実施形態1)
図1は、本実施形態の構成を示す図である。本実施形態の音声入力装置100は、撮像素子101、ユーザ検出部102、カメラ基準ユーザ角度算出部103、カメラ基準ユーザ距離算出部104、マイクアレイ基準ユーザ角度算出部105、マイクアレイ106、ユーザ音声取得部107を備える。
撮像素子101は画像情報を取得するもので、CCD(Charge Coupled Device)やCMOS(Complementary Metal Oxide Semiconductor)センサといった固体撮像素子とレンズなどにより構成される。
撮像素子101で取得した画像情報はユーザ検出部102に伝達され、画像情報内のユーザの情報が検出される。カメラ基準ユーザ角度算出部103、およびカメラ基準ユーザ距離算出部104は、ユーザ検出部102で検出されたユーザ情報に基づいて、撮像素子101で撮影された画像情報を基準としたユーザがいる方向(カメラ基準ユーザ方向)、および、ユーザまでの距離(カメラ基準ユーザ距離)を各々算出する。算出された情報はマイクアレイ基準ユーザ角度算出部105に伝達する。
マイクアレイ基準ユーザ角度算出部105では、伝達されたカメラ基準ユーザ方向とカメラ基準ユーザ距離とから、マイクアレイを基準としたユーザの方向(マイクアレイ基準ユーザ方向)を算出する。算出した情報はユーザ音声取得部107に伝達する。
マイクアレイ106は複数のマイクロフォンを備え、所定の間隔で配置される。例えば、一定間隔で一列に配置する。マイクロフォンは周囲の音声情報を取得し、各マイクロフォンで取得された音声情報はユーザ音声取得部107に伝達する。
ユーザ音声取得部107は、マイクアレイ基準ユーザ方向に基づいて、マイクアレイ106から伝達された入力音声情報から、ユーザ音声を取得して音声情報を出力する。
ここで、ユーザ検出部102、カメラ基準ユーザ角度算出部103、カメラ基準ユーザ距離算出部104、マイクアレイ基準ユーザ角度算出部105、およびユーザ音声取得部107は、CPU(Central Processing Unit)やGPU(Graphics Processing Unit)によるソフトウエア処理、ASIC(Application Specific Integrated Circuit)やFPGA(Field Programmable Gate Array)によるハードウエア処理によって実現することができる。
図2は、撮像素子で取得した撮影画像の画像情報から顔領域を検出する例を説明するための図である。本実施例では、ユーザ検出部102におけるユーザ検出を顔検出によって行う。顔検出は一般に使用されている方法を使用することができる。例えば、多数の顔画像から算出した標準的な顔画像を参照データとして保有しておき、その参照データとの相関値から顔を検出する方法がある。顔検出により、入力された撮影画像200から、ユーザ201の顔検出領域210を検出する。これにより、撮影画像200における顔検出領域210の位置や大きさを検出することができる。
カメラ基準ユーザ距離算出部104では、顔検出領域210の大きさに基づいてユーザ201までの距離を算出する。ユーザ201までの距離が遠ければ顔検出領域210は小さくなり、ユーザ201までの距離が近ければ顔検出領域210は大きくなる。ユーザ201までの距離は、顔検出領域210の大きさと距離との関係をLUT(Look Up Table)などに記憶しておくことで算出することができる。
ここで、ユーザ検出部102において顔検出を行うときに、年齢や性別といった情報も算出しておき、顔検出領域210の大きさから算出される距離を補正すると良い。例えば、大人よりも子供の方が顔は小さいので、大人と子供で顔検出領域210が同じ大きさであった場合、子供の方が撮像素子101に近い位置にいることになる。また、距離の補正は、共通のLUTを利用して、年齢などの情報により増減させる方法や、年齢などのグループごとにLUTを保有するようにしても良い。
カメラ基準ユーザ角度算出部103では、顔検出領域210の位置に基づいてユーザ201の方向を示すカメラ基準ユーザ角度θを算出する。図3は、図2のシーンをユーザ上方から見たときを示す。ユーザ201の移動は、図3のような地面に対して水平方向に行われるため、本実施形態のカメラ基準ユーザ角度θは、撮像素子101の光軸であるカメラ基準軸10からの水平方向への角度とする。カメラ基準ユーザ角度θは、撮像素子101の焦点距離、解像度などの既知の値と、ユーザの顔検出領域の位置から算出することが可能である。
図4は、カメラ基準ユーザ角度θ、およびカメラ基準ユーザ距離Lとマイクアレイ基準ユーザ角度φとの関係を示す図である。本実施形態のマイクアレイ106は、撮像素子101から水平方向にマイクロフォンが離間するように配置され、カメラ基準軸10とマイクアレイ基準軸20とが間隔Wだけ離間して配置している。カメラ基準軸10は、撮像素子101の光軸に一致する軸であり、マイクアレイ基準軸20は、マイクアレイ106のうちの特定のマイクロフォンを通りカメラ基準軸10に平行な軸である。
カメラ基準ユーザ角度θは、カメラ基準ユーザ角度算出部103により算出されている。また、カメラ基準ユーザ距離Lは、カメラ基準ユーザ距離算出部104により算出される。カメラ基準ユーザ距離Lは、カメラ基準軸10方向における撮像素子101からユーザ201までの距離であり、カメラ基準ユーザ距離算出部104が算出した撮像素子101からユーザ201までの距離と、カメラ基準ユーザ角度算出部103が算出したカメラ基準ユーザ角度θから算出することができる。
撮像素子101(カメラ基準軸10)とマイクアレイ106(マイクアレイ基準軸20)との距離である間隔Wは、音声入力装置が備えるものであり既知である。したがって、カメラ基準ユーザ角度θ、カメラ基準ユーザ距離L、間隔Wからマイクアレイ基準ユーザ角度φを算出することができる。
ここではカメラ基準軸10からユーザ方向にカメラ基準ユーザ角度θだけ傾いた方向をカメラ基準ユーザ方向11とし、マイクアレイ基準軸20からユーザ方向にマイクアレイ基準ユーザ角度φだけ傾いた方向をマイクアレイ基準ユーザ方向21とする。また、カメラ基準ユーザ方向11とマイクアレイ基準ユーザ方向21とのなす角度をαで表す。このときの角度αは、カメラ基準ユーザ方向11とマイクアレイ基準ユーザ方向21とのなす角度のうち、カメラ基準ユーザ方向11とマイクアレイ基準ユーザ方向21との交点、撮像素子101、及びマイクアレイ基準軸20を設定したマイクロフォンの3点を頂点とする3角形の内角側の角度を示すものとする。
ユーザ音声取得部107は、マイクアレイ106から取得された入力音声情報から、マイクアレイ基準ユーザ角度算出部105で算出されたマイクアレイ基準ユーザ角度φに基づき、マイクアレイ基準ユーザ方向21からの音声情報を取得する。このとき音声情報を取得する基準となるマイクロフォンは、マイクアレイ基準軸20を設定したマイクロフォンとする。そしてマイクアレイ基準軸20を設定したマイクロフォンを基準として、マイクアレイ基準ユーザ方向21を特定方向とし、その特定方向からの音声情報を取得する。特定方向から音声情報を取得する角度範囲は、マイクアレイ基準ユーザ方向21を含む一定の範囲を設定することができる。
特定の角度の音声取得は一般的な方法を使用することができ、例えば、マイクアレイ106の各マイクロフォンに到達する音声の時間差や音量差と、各マイクロフォンの音声取得特性と、各マイクロフォンの位置関係とから計算する。
時間差を使用する場合には、音源から遠いマイクロフォンは他のマイクロフォンに比べ遅延が大きくなる。また、音量を使用する場合には、音源から遠いマイクロフォンは他のマイクロフォンに比べ音量が小さくなる。このようにして、特定方向からの音声情報がどのようにマイクロフォンに到達するかを推定して音声情報を取得する。取得された音声情報は出力音声情報として出力する。
ここで、図4では、マイクアレイ基準軸20をマイクアレイ106の一番右側のマイクロフォンに設定しているが、適切に設定することで、ユーザ以外が発した音声情報であるノイズを低減することができる。ノイズとなる音声情報は、画像情報から検出されたユーザの背後に存在するかもしれない他の人物から発生してしまう。画像情報は透視投影などで取得した2次元の画像情報であり、ユーザの背後の音源についての情報までは取得することができない。したがって、他の人物が発話した音声情報はノイズとなり、音声入力装置の出力音声情報で音声認識を行った場合誤動作をする可能性がある。
図5は、撮像素子101がマイクアレイ106の中央のマイクロフォン位置に配置され、マイクロフォンの配列方向において、マイクアレイ106の右端のマイクロフォンに近い位置にユーザが検出された場合を示す図である。マイクアレイ基準軸20は、撮像素子101に対してユーザが検出された側と反対側で撮像素子101から最も遠いマイクロフォンに設定されている。一方、図6は、図5と同じ環境でマイクアレイ基準軸20が、撮像素子101に対してユーザが検出された側で撮像素子101から最も遠いマイクロフォンに設定されている。
マイクアレイ106から特定方向の音声情報を取得する場合、マイクアレイ基準ユーザ方向21を含む所定の角度幅の音声情報を取得する。例えば、マイクアレイ基準ユーザ角度φ±10度の角度幅とする。このとき、撮像素子101で撮影された画像情報の周辺で歪が生じている場合などは、画像情報周辺ではユーザ検出部102でのユーザの位置検出精度が低下する可能性があるため、角度θの絶対値が大きくなるほど音声情報を取得する角度幅を大きくすると、ユーザの音声情報が取得できないなどの不具合を低減することができ好適である。
また、ユーザ検出部102でのユーザの顔領域が小さい場合、ユーザ位置の検出精度が低下する可能性があるため、カメラ基準ユーザ距離Lが大きくなるほど音声情報を取得する角度幅を大きくすると、ユーザの音声情報が取得できないなどの不具合を低減することができ好適である。
図5および図6において、撮像素子101によりユーザ201が撮影される範囲をユーザ撮影範囲12とし、マイクアレイ106の特定のマイクロフォンを基準としてユーザ201による音声を取得できる範囲をユーザ音声取得範囲22とする。ユーザ音声取得範囲22は、マイクアレイ106による所定の角度幅の音声情報の取得範囲ではなく、ユーザ201による音声が取得できる範囲を示している。
撮像素子101からユーザ201の方向を見たとき、ユーザ201の背後領域にユーザ以外の人物が存在するかなどの情報は画像情報からは取得できない。つまり、ユーザ撮影範囲12内でユーザ201の背後領域にいる他の人物は、画像情報からは認識することができない。
一方、マイクアレイ106のマイクアレイ基準軸20を設定したマイクロフォンでは、そのマイクロフォンを基準としてユーザ201の方向からの音声を取得するが、このとき、ユーザ音声取得範囲22内でユーザ201の背後に別の人物がいた場合、その別の人物からの音声も取得するため、ユーザ201からの音声情報と他の人物による音源からの音声情報を分離して取得することができずにノイズとなってしまう。
マイクアレイ106が音声情報を取得する特定方向の領域は、カメラ基準軸10とマイクアレイ基準軸20が異なると、撮像素子101からユーザ201の方向を見たときのユーザ領域とは異なる。つまり、マイクアレイ基準軸20を設定する位置により、カメラから見たユーザ背後領域とマイクアレイ106による音声情報取得領域との重なりが変化する。
このときに、ユーザ撮影範囲12内でユーザ201の背後の領域は、他のユーザが存在しているかもしれないため、この領域からは音声を取得しないようにすることが好ましい。このためには、ユーザ撮影範囲12内のユーザ201の背後の領域と、ユーザ音声取得範囲22とが重なる領域を最も小さくすることが好ましい。これにより、撮影画像からは認識できないユーザ201の背後のユーザからの音声取得をできる限り回避し、ノイズを低減させることができる。
図5と図6において、ユーザ撮影範囲12内のユーザ201の背後の領域と、マイクアレイ基準軸20を設定したマイクロフォンによるユーザ音声取得範囲22との重なり領域(図中斜線で示す領域)Sの大きさは、図5よりも図6の場合の方が狭くなっている。これは、マイクアレイ基準軸20の設定により、カメラ基準ユーザ方向11とマイクアレイ基準ユーザ方向21とがなす角度αが変化するためである。図5に比べ図6では、カメラ基準ユーザ方向11とマイクアレイ基準ユーザ方向21とがなす角度αが大きくなっており、図6の方が、撮影画像におけるユーザ背後領域からの音声取得領域(重なり領域S)が狭くなっている。これにより、ユーザ背後領域に他の人物が存在しても、音声情報として取得してしまう可能性を低減することができる。
撮像素子101とマイクアレイ106との配置が変化しても同様に効果を得ることができる。図7から図12は、撮像素子101の片側にマイクロフォンが配置されている場合を示した図である。
図7および図8は、マイクロフォンの配列方向において撮像素子101とマイクアレイ106との間にユーザ201が検出された場合で、撮像素子101、検出されたユーザ201、マイクアレイ106の順で位置している。
図7では、マイクアレイ基準軸20が撮像素子101に最も近いマイクロフォンに設定されており、図8では、マイクアレイ基準軸20が撮像素子101から最も遠いマイクロフォンに設定されている。図7におけるカメラ基準ユーザ方向11とマイクアレイ基準ユーザ方向21とがなす角αよりも、図8におけるカメラ基準ユーザ方向11とマイクアレイ基準ユーザ方向21とがなす角αの方が大きくなっており、ユーザ撮影範囲12内のユーザ201の背後の領域と、マイクアレイ基準軸20を設定したマイクロフォンによるユーザ音声取得範囲22との重なり領域(図中斜線で示す領域)Sは、図8の方が小さくなっている。これにより、ユーザの背後領域に存在するかもしれない他の人物からの音声情報を、ノイズとして取得することを低減できる。
撮像素子101とマイクアレイ106の配置が同様の状態で、ユーザの位置が変化しても同様の効果が得られる。図9および図10は、マイクロフォンの配列方向において、検出されたユーザ201、撮像素子101、マイクアレイ106の順で位置している。図9ではマイクアレイ基準軸20が撮像素子101に最も近いマイクロフォンに設定されており、図10ではマイクアレイ基準軸20が撮像素子101から最も遠いマイクロフォンに設定されている。
図9におけるカメラ基準ユーザ方向11とマイクアレイ基準ユーザ方向21とがなす角αよりも、図10におけるカメラ基準ユーザ方向11とマイクアレイ基準ユーザ方向21とがなす角αの方が大きくなっており、ユーザ撮影範囲12内のユーザ201の背後の領域と、マイクアレイ基準軸20を設定したマイクロフォンによるユーザ音声取得範囲22との重なり領域(図中斜線で示す領域)Sは、図10の方が小さくなっている。これにより、ユーザの背後領域に存在するかもしれない他の人物からの音声情報を、ノイズとして取得することを低減できる。
また、図11および図12は、マイクロフォンの配列方向において、撮像素子101、マイクアレイ106、検出されたユーザ201の順で位置している。図11ではマイクアレイ基準軸20が撮像素子101に最も近いマイクロフォンに設定されており、図12ではマイクアレイ基準軸20が撮像素子101から最も遠いマイクロフォンに設定されている。図11におけるカメラ基準ユーザ方向11とマイクアレイ基準ユーザ方向21とがなす角αよりも、図12におけるカメラ基準ユーザ方向11とマイクアレイ基準ユーザ方向21とがなす角αの方が大きくなっており、ユーザ撮影範囲12内のユーザ201の背後の領域と、マイクアレイ基準軸20を設定したマイクロフォンによるユーザ音声取得範囲22との重なり領域(図中斜線で示す領域)Sは、図12の方が小さくなっている。これにより、ユーザの背後領域に存在するかもしれない他の人物からの音声情報を、ノイズとして取得することを低減できる。
以上で説明したように、カメラ基準ユーザ方向11とマイクアレイ基準ユーザ方向21とがなす角αが、大きくなるようにマイクアレイ基準軸20を設定することで、ユーザの背後領域に存在するかもしれない他の人物からの音声情報を、ノイズとして取得することを低減できる。
ここでは初期設定としてマイクアレイ106の中央のマイクロフォンにマイクアレイ基準軸20を設定しておき、初期設定よりカメラ基準ユーザ方向11とマイクアレイ基準ユーザ方向21とがなす角αが大きくなるようにマイクアレイ基準軸20を設定することでノイズの低減を実現できる。
また、本実施形態では実在するマイクロフォンにマイクアレイ基準軸20を設定するように説明をしたが、仮想的なマイクロフォンにマイクアレイ基準軸20を設定しても良い。例えば、マイクロフォンAとマイクロフォンBの間に仮想マイクロフォンが存在すると仮定し、各マイクロフォンで取得された複数の音声情報から、仮想マイクロフォンにおける特定方向からの音声情報算出結果を推定する。これは、各マイクロフォンからの相対的な距離が分かっているため、音声情報の遅延量や音量などを推定することで実現できる。
ここで、ユーザ201の位置のみでマイクアレイ基準軸20を再設定すると、ユーザ201が動きながら発話する場合、ユーザ201が発話した単語の途中で音声情報の取得結果が変化してしまい、音声認識などが正常に動作しない可能性がある。そこで、取得される音声情報が0に近づいたとき、すなわち、ユーザ201の発話が無い状態のときに、マイクアレイ基準軸20を再設定することで、発話した音声情報に切れ目が生じていない音声情報を取得することが可能になり好適である。
上述した実施形態では、検出された顔の大きさからユーザまでの距離を算出する方法を説明したが、他の方法で距離を算出しても同様の効果を得ることができる。例えば、図13のように、撮像素子108と距離算出部109とを備える方法が有る。撮像素子108は撮像素子101と同様に、固体撮像素子とレンズなどを備える。距離算出部109は、撮像素子101と撮像素子108とで取得される2つの画像情報の視差を算出し、ユーザ検出部と同様に各種のハードウエアやソフトウエアによって処理が実現される。
視差は一般に使用される方法が適用でき、例えば、2つの画像のブロックマッチングにより実現でき、撮像素子101で取得される画像情報に基準探索窓を設定し、撮像素子108で取得される画像情報に参照探索窓を設定し、参照探索窓を移動していく。ブロックマッチングは、SAD(Sum of Absolute Difference)やSSD(Sum of Squared Difference)などにより類似度または相違度を評価することで行われる。算出された視差Dから距離を算出することができ、距離ZはZ=B×f/Dにより算出される。ここで、Bは2つの撮像素子間の距離である基線長であり、fは撮像素子の焦点距離である。
距離算出部109で算出された視差情報は、カメラ基準ユーザ距離算出部104に伝達され、ユーザ検出部102で検出されたユーザの画像内の位置に対応した距離情報を取得する。このようにして、2つの撮像素子から距離情報を算出しても良い。また、上記では画像情報全体の視差情報を算出する方法を説明したが、ユーザ検出部102で検出されたユーザの位置に基づいて、ユーザの顔領域に対してブロックマッチングを行うと、処理量を削減でき好適である。
また、図14のように測距素子110を備え、測距素子110から距離情報を取得しても同様の効果を得ることができる。測距素子110には一般に使用される測距素子が適用でき、例えば、赤外線を照射して反射されてくるまでの時間により距離を計測するTOF(Time Of Flight)センサなどがある。また、照射する赤外線を2次元のパターンとし、その形状の変化から距離を取得するセンサもある。
測距素子110で取得された距離情報はカメラ基準ユーザ距離算出部104に伝達され、ユーザ検出部102で検出されたユーザの位置に対応した距離情報を取得してユーザまでの距離とする。以上の方法により、測距素子110から距離情報を取得しても同様の効果を得ることができる。
(実施形態2)
実施形態1では、ユーザ検出部102で検出されるユーザ201が1名である場合であったが、本実施形態2では複数人の人物が検出された場合の実施形態を説明する。本実施形態における音声入力装置100の構成は、実施形態1と同様で図1、図13、図14に示す構成を有するものであり、共通する各部の詳細な説明は省略する。
図15は、ユーザが第1のユーザ201および第2のユーザ202の2名であった場合で、ユーザ検出部102で検出されるユーザは第1のユーザ201および第2のユーザ202の2名となり、検出されるユーザの情報も第1のユーザ201および第2のユーザ202の2名分となる。
図15では、検出された第1のユーザ201に対してマイクアレイ基準軸20を撮像素子101から最も遠いマイクロフォンに設定している。このとき、カメラ基準ユーザ方向11とマイクアレイ基準ユーザ方向21とがなす角αが大きくなるようにマイクアレイ基準軸20を設定しているが、音声情報を取得する領域に第2のユーザ202が存在するため、第1のユーザ201から取得したい音声情報に、第2のユーザ202から発せられた音声情報が含まれてしまう可能性がある。
この場合、第2のユーザ202から発せられた音声情報はノイズとなる。同様に、カメラ基準ユーザ方向11とマイクアレイ基準ユーザ方向21とがなす角αが大きくなるようにマイクアレイ基準軸20を設定して、第2のユーザ202の音声情報を取得しようとすると、第1のユーザ201から発せられた音声情報が含まれてしまう可能性がある。
図16では、ユーザ検出部102で検出された第2のユーザ202の位置が図15と異なっている。同様に、カメラ基準ユーザ方向11とマイクアレイ基準ユーザ方向21とがなす角αが大きくなるようにマイクアレイ基準軸20を設定すると、第1のユーザ201から取得する音声情報には第2のユーザ202が発した音声情報が含まれる可能性があり、第2のユーザ202から取得する音声情報には第1のユーザ201が発した音声情報が含まれる可能性がある。したがって、所望とするユーザからの音声情報にノイズが含まれる可能性がある。
そこで、カメラ基準ユーザ方向11とマイクアレイ基準ユーザ方向21とがなす角αが小さくなるように、マイクアレイ基準軸20を設定して取得する音声情報のノイズを低減する。図17は図15と同じようにユーザ検出部102で第1のユーザ201および第2のユーザ202が検出された場合を示す。マイクアレイ基準軸20は、カメラ基準ユーザ方向11とマイクアレイ基準ユーザ方向21とがなす角αが小さくなるように、撮像素子101に近いマイクロフォンに設定されている。カメラ基準ユーザ方向11とマイクアレイ基準ユーザ方向21とがなす角αが小さくなるように、マイクアレイ基準軸20を設定することにより、第1のユーザ201の音声情報を取得する領域から第2のユーザ202が離れるため、第1のユーザ201から取得される音声情報から第2のユーザ202で発せられる音声情報を低減することができる。すなわち、第1のユーザ201から取得される音声情報のノイズを低減することが可能となる。
図18は図16と同じようにユーザ検出部102で第1のユーザ201および第2のユーザ202が検出された場合を示す。マイクアレイ基準軸20は、カメラ基準ユーザ方向11とマイクアレイ基準ユーザ方向21とがなす角αが小さくなるように、撮像素子101に近いマイクロフォンに設定されている。このときも図17の場合と同様に、カメラ基準ユーザ方向11とマイクアレイ基準ユーザ方向21とがなす角αが小さくなるように、マイクアレイ基準軸20を設定することにより、第1のユーザ201の音声情報を取得する領域から第2のユーザ202が離れるため、第1のユーザ201から取得される音声情報における、第2のユーザ202で発せられる音声情報を低減することができる。すなわち、第1のユーザ201から取得される音声情報のノイズを低減することが可能となる。
また、図17および図18において、第2のユーザ202に対する音声情報の取得も可能で、各々図19と図20に対応する。第2のユーザ202の音声情報を取得するときのマイクアレイ基準軸20は、第1のユーザ201の音声情報を取得するときのマイクアレイ基準軸20と同じにしている。このとき、カメラ基準ユーザ方向11とマイクアレイ基準ユーザ方向21とがなす角αが小さくなるように、マイクアレイ基準軸20は設定されており、第2のユーザ202から取得される音声情報における、第1のユーザ201で発せられる音声情報を低減することができる。すなわち、第2のユーザ202から取得される音声情報のノイズを低減することが可能となる。
ここで、音声情報を取得する方向は、マイクアレイ基準ユーザ方向21に対して一定の角度幅を設定することができるため、図21のように、マイクロフォンにより音声情報を取得する音声取得範囲23が重複する可能性がある。図21に示す音声取得角度範囲23は、これまで示したようなマイクロフォンによりユーザの音声情が取得されるユーザ音声取得範囲22ではなく、マイクアレイ106により取得する特定方向の音声情報の取得角度範囲を示すものであり、ユーザの大きさに関わりなく、例えばマイクアレイ基準ユーザ角度φ±10度の範囲で設定されるものである。
音声取得角度範囲23が重複すると、第1のユーザ201から取得される音声情報には第2のユーザ202が発した音声情報が含まれてしまい、第2のユーザ202から取得される音声情報には第1のユーザ201が発した音声情報が含まれてしまう可能性がある。
そこで、第1のユーザ201の音声取得角度範囲23と第2のユーザ202の音声取得角度範囲23とが重複しないように、音声情報を取得する範囲を変化させる。図22に示すように、第1のユーザ201と第2のユーザ202の間に共通の角度範囲の境界Bを設定する。これにより、第1のユーザ201および第2のユーザ202から各々ノイズを低減した音声情報を取得できるため好適である。
音声情報を取得する音声取得角度範囲23の制御を行う場合、マイクアレイ基準ユーザ方向21に対する角度幅は変化させないで、マイクアレイ基準ユーザ方向21を音声取得角度範囲23が重複しないように補正する方法がある。また、マイクアレイ基準ユーザ方向21を変化させないで、マイクアレイ基準ユーザ方向21に対しての角度幅を音声取得角度範囲23が重複しないように補正する方法でも良い。このとき、角度幅の補正は片方でも両方でも良いが、音声情報の取得角度範囲が極端に小さくならないようにするため、重複する側の片方を補正すると好適である。
以上により、カメラ基準ユーザ方向11とマイクアレイ基準ユーザ方向21とがなす角が小さくなるように、マイクアレイ基準軸20を設定することにより、第1のユーザ201の音声情報を取得する領域から第2のユーザ202が離れるため、第1のユーザ201から取得される音声情報における、第2のユーザ202で発せられる音声情報を低減することが可能となる。
上記の実施形態では、ユーザ検出部102で検出されるユーザの人数が2名の場合で説明したが、本発明に係る実施形態は、3名以上の場合にも適用することが可能である。また、ユーザ検出部102で検出されるユーザの人数が変化して、検出されたユーザが2名から1名になった場合には、実施形態1で説明した制御にすることで、シーンに合わせてノイズを低減した音声情報を取得できる。すなわち、ユーザ検出部102で検出されるユーザに基づいて、マイクアレイ基準軸20の設定方法を切り換えると、シーンに合わせてノイズを低減した音声情報を取得できるため好適である。
以上で説明したように、複数のユーザが検出されたときに、カメラ基準ユーザ方向11とマイクアレイ基準ユーザ方向21とがなす角αが、小さくなるようにマイクアレイ基準軸20を設定することで、複数のユーザの音声情報を取得することによるノイズを低減できる。
ここでは初期設定としてマイクアレイ106の中央のマイクロフォンにマイクアレイ基準軸20を設定しておき、初期設定よりカメラ基準ユーザ方向11とマイクアレイ基準ユーザ方向21とがなす角αが小さくなるようにマイクアレイ基準軸20を設定することでノイズの低減を実現できる。
(実施形態3)
実施形態3は、実施形態1および実施形態2で説明した音声入力装置を備える画像表示装置である。本実施形態における音声入力装置の構成は、実施形態1および実施形態2と同様であるため、共通する各部の詳細な説明は省略する。
図23は本実施形態の構成を示す図である。画像表示装置300は、音声入力装置100、音声認識部301、制御部302、画像表示部303、音声出力部304を備える。音声認識部301は、音声入力装置100から出力された音声情報を認識する。音声情報を認識する方法は一般的な方法を使用することができる。例えば、単語の音声データを保有しておき、そのデータと入力された音声情報を比較して、その類似度により認識を行う方法がある。
音声認識部301で認識された音声認識結果は制御部302に伝達される。制御部302では音声認識結果に基づいて画像表示部303や音声出力部304などを制御する。ここで、音声認識部301や制御部302は、CPUでのソフトウエア処理、ASICでのハードウエア処理により実現できる。また、画像表示部303は、画像情報が表示可能な表示デバイスなどから構成され、例えば、液晶パネルとバックライト、有機EL(Electro Luminescence)パネルなどである。音声出力部304はスピーカなどにより構成されている。
制御部302による画像表示部303の制御としては、例えば、テレビ放送のチャンネル変更、画面の明るさ増減、などがある。音声入力装置100からの音声認識結果が「明るく」であれば、画像表示部303の画面の明るさを高くし、音声認識結果が「暗く」であれば、画像表示部303の画面の明るさを低くする。また、音声出力部304の制御としては、例えば、テレビ放送の音量の増減がある。音声入力装置100からの音声認識結果が「大きく」であれば、音声出力部304の音量を大きくし、音声認識結果が「低く」であれば、音声出力部304の音量を小さくする。
ここで、音声入力装置100から出力される音声情報にノイズが多く含まれていると、音声認識部301での認識率の低下や誤認識が発生してしまう。つまり、制御部302が動作しなかったり、意図しない動作したりすることになる。したがって、実施形態1や実施形態2で説明したノイズを低減した音声情報が取得できる音声入力装置100を備えることにより、音声入力操作による認識率を高め、誤動作を低減することが可能な画像表示装置200を実現することが可能になる。
以上の説明では、制御部302による制御は画像表示部303と音声出力部304とで説明したが、他の機能を制御することも可能である。例えば、電源のOFF、インターネットへの接続、選択肢の選択および決定などがある。さらに、画像表示装置300の制御だけでなく、画像表示装置300に接続される機器などの制御も可能で、例えば、録画機への録画、エアコンの温度設定、照明器具のON/OFFなどがある。
ここで、上記で説明した音声入力装置100を使用した音声情報による制御は、複数のユーザにより同時に操作しようとすると、相反する制御が同時に発生する場合がある。例えば、異なる放送番組への切り替え、音量の増加と減少などである。そこで、音声入力装置100のユーザ検出部102において、操作の権利を特定のユーザのみに与えるようにすると好適である。例えば、画像表示装置300からの距離、撮像素子で撮影されている時間などの評価基準を設定して、その基準に合わせて操作可能なユーザを決定する。
また、ジェスチャなどと組み合わせると、操作可能なユーザの切り換えが容易となり好適である。例えば、ユーザの顔の下の領域に手の平を配置するジェスチャを最も先に行ったユーザを音声による操作が可能なユーザとする。さらに、上記ジェスチャを行っている間だけ音声入力が可能としておくことで、意図しない音声情報が入力されて誤動作が発生しないようにできるため好適である。このとき、音声による操作が可能であることをユーザに通知するように、LED(Light Emitting Diode)を点灯したり、画像表示部に音声入力可能であることを表示したりすると、ユーザのジェスチャが認識されていることが確認できるため好適である。
(実施形態4)
実施形態4は、実施形態1および実施形態2で説明した音声入力装置を備える音声情報記録装置である。本実施形態における音声入力装置の構成は、実施形態1および実施形態2と同様であるため、共通する各部の詳細な説明は省略する。
図24は本実施形態の構成を示す図である。音声情報記録装置400は、音声入力装置100、音声認識部301、記録部401を備える。本実施形態の音声入力装置100は、ユーザ検出部102において、検出されたユーザが誰であるかの認識を行う。これは、人物画像と人物名とをあらかじめ登録しておくことで実現できる。音声入力装置100は、ユーザ情報と音声情報とを関連付けて音声認識部301に伝達する。音声認識結果はテキストデータとしてユーザ情報と関連付けて記録部401に伝達される。
記録部401では、音声認識結果とユーザ情報とをデータとして記録する。これにより、発話したユーザの情報と、発話内容とを関連付けて記録できるようになる。ここで、音声入力装置100は、ノイズを低減した音声情報を取得できるため、音声認識部301での認識率が向上し、ユーザの発話内容を精度良く記録することが可能になる。例えば、ユーザ情報と音声認識結果とを合わせて記録することにより、会議で誰がどんな発言をしたかなど、自動で会議の議事録を作成することも可能となる。
以上説明したように、本発明の音声入力装置は、画像情報を取得する撮像素子と、音声情報を取得する複数のマイクロフォンとを備えた音声入力装置であって、撮像素子が取得した画像情報からユーザを検出するユーザ検出部と、マイクロフォンが取得した音声情報から音源定位を行い、音源が存在する特定方向から取得した音声情報を出力音声情報とするユーザ音声取得部とを備え、ユーザ音声取得部は、特定方向の基準とするマイクロフォンの位置を、ユーザ検出部で検出されるユーザの位置に基づいて変化させる。これにより、ノイズである他の音源から発せられる音声情報を低減し、ユーザから発話される音声情報を取得することができる。
また、本発明の音声入力装置は、ユーザ音声取得部が、撮像素子を基準としたユーザの方向と、複数のマイクロフォンの中心を基準としたユーザの方向とがなす角より、撮像素子を基準としたユーザの方向と、特定方向とがなす角が大きくなるように、特定方向の基準とするマイクロフォンの位置を設定する。これにより、ユーザ背後領域に他の人物が存在しても、音声情報として取得してしまう可能性を低減することができる。
また、本発明の音声入力装置は、ユーザ音声取得部が、ユーザ検出部で検出されたユーザの人数によって、特定方向の基準とするマイクロフォンの位置を変化させる。これによりユーザの人数に応じて最適な音声情報取得制御を行うことができる。
また、本発明の音声入力装置は、ユーザ音声取得部が、ユーザ検出部で複数のユーザが検出された場合、撮像素子を基準としたユーザの方向と、複数のマイクロフォンの中心を基準としたユーザの方向とがなす角より、撮像素子を基準としたユーザの方向と、特定方向とがなす角が小さくなるように、特定方向の基準とするマイクロフォンの位置を設定する。これにより、複数のユーザが検出されたときにユーザ背後領域に他の人物が存在しても、音声情報として取得してしまう可能性を低減することができる。
また、本発明の画像表示装置は、上記の音声入力装置と、音声入力装置が出力する音声情報を認識する音声認識部と、音声認識部で認識された結果に基づいて所定の制御を行う制御部と、を備える。これにより、ノイズである他の音源からの発せられる音声情報を低減し、ユーザから発話される音声情報を取得し、これに基づいて制御を行う画像表示装置が得られる。
また、本発明の音声入力装置を備える音声情報記録装置は、上記の音声入力装置と、音声入力装置が出力する音声情報を認識する音声認識部とを備え、音声入力装置のユーザ検出部で検出されたユーザ情報と、音声入力装置の音声認識部で認識された結果を関連付けて記録する記録部を備える。これにより、ノイズである他の音源からの発せられる音声情報を低減し、ユーザから発話される音声情報を取得し、音声情報により認識された結果とユーザ情報とを関連付けて記憶できる音声情報記録装置が得られる。
10…カメラ基準軸、11…カメラ基準ユーザ方向、12…ユーザ撮影範囲、20…マイクアレイ基準軸、21…マイクアレイ基準ユーザ方向、22…ユーザ音声取得範囲、23…音声取得角度範囲、100…音声入力装置、101…撮像素子、102…ユーザ検出部、103…カメラ基準ユーザ角度算出部、104…カメラ基準ユーザ距離算出部、105…マイクアレイ基準ユーザ角度算出部、106…マイクアレイ、107…ユーザ音声取得部、108…撮像素子、109…距離算出部、110…測距素子、200…撮影画像、201…ユーザ、202…ユーザ、210…顔検出領域、300…画像表示装置、301…音声認識部、302…制御部、303…画像表示部、304…音声出力部、401…記録部。

Claims (5)

  1. 画像情報を取得する撮像素子と、音声情報を取得する複数のマイクロフォンとを備えた音声入力装置であって、
    前記撮像素子が取得した画像情報からユーザを検出するユーザ検出部と、
    ユーザの方向の音声情報を取得するユーザ音声取得部とを備え、
    前記ユーザ音声取得部は、検出されたユーザ位置に基づいて音声情報を取得する際の基準となるマイクロフォンを設定し、
    前記ユーザ音声取得部は、任意の、検出されたユーザの位置に対して、前記撮像素子を基準としたユーザの方向と、前記複数のマイクロフォンのうちの中央のマイクロフォンを基準としたユーザの方向とがなす角より、前記撮像素子を基準としたユーザの方向と、前記基準となるマイクロフォンを基準としたユーザの方向とがなす角が大きくなるように、前記基準となるマイクロフォンを設定することを特徴とする音声入力装置。
  2. 画像情報を取得する撮像素子と、音声情報を取得する複数のマイクロフォンとを備えた音声入力装置であって、
    前記撮像素子が取得した画像情報からユーザを検出するユーザ検出部と、
    ユーザの方向の音声情報を取得するユーザ音声取得部とを備え、
    前記ユーザ音声取得部は、検出されたユーザの位置に基づいて音声情報を取得する際の基準となるマイクロフォンを設定し、
    前記ユーザ音声取得部は、任意の、検出されたユーザの位置に対して、前記撮像素子を基準としたユーザの方向と、前記複数のマイクロフォンのうちの中央のマイクロフォンを基準としたユーザの方向とがなす角より、前記撮像素子を基準としたユーザの方向と、前記基準となるマイクロフォンを基準としたユーザの方向とがなす角が小さくなるように、前記基準となるマイクロフォンを設定することを特徴とする音声入力装置。
  3. 画像情報を取得する撮像素子と、音声情報を取得する複数のマイクロフォンとを備えた音声入力装置であって、
    前記撮像素子が取得した画像情報からユーザを検出するユーザ検出部と、
    ユーザの方向の音声情報を取得するユーザ音声取得部とを備え、
    前記ユーザ音声取得部は、検出されたユーザの位置に基づいて音声情報を取得する際の基準となるマイクロフォンを設定し、
    前記ユーザ音声取得部は、
    (i)任意の、検出されたユーザの位置に対して、前記撮像素子を基準としたユーザの方向と、前記複数のマイクロフォンのうちの中央のマイクロフォンを基準としたユーザの方向とがなす角より、前記撮像素子を基準としたユーザの方向と、前記基準となるマイクロフォンを基準としたユーザの方向とがなす角が大きくなるように、前記基準となるマイクロフォンを設定する第一のモードと、
    (ii)任意の、検出されたユーザの位置に対して、前記撮像素子を基準としたユーザの方向と、前記複数のマイクロフォンのうちの中央のマイクロフォンを基準としたユーザの方向とがなす角より、前記撮像素子を基準としたユーザの方向と、前記基準となるマイクロフォンを基準としたユーザの方向とがなす角が小さくなるように、前記基準となるマイクロフォンを設定する第二のモードと、
    を切り替える、ことを特徴とする音声入力装置。
  4. 前記ユーザ音声取得部は、前記第一のモードと前記第二のモードとを、前記ユーザ検出部で検出されたユーザの人数に基づいて切り換えることを特徴とする、請求項に記載の音声入力装置。
  5. 請求項1〜4のいずれか1項に記載の音声入力装置と、該音声入力装置が出力する音声情報を認識する音声認識部と、前記音声認識部で認識された結果に基づいて出力音声の制御を行う制御部と、前記音声情報に関連付けられた画像を表示する表示部と、を備えることを特徴とする画像表示装置。
JP2013084503A 2013-04-15 2013-04-15 音声入力装置、および画像表示装置 Expired - Fee Related JP6250297B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013084503A JP6250297B2 (ja) 2013-04-15 2013-04-15 音声入力装置、および画像表示装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013084503A JP6250297B2 (ja) 2013-04-15 2013-04-15 音声入力装置、および画像表示装置

Publications (3)

Publication Number Publication Date
JP2014207589A JP2014207589A (ja) 2014-10-30
JP2014207589A5 JP2014207589A5 (ja) 2016-06-09
JP6250297B2 true JP6250297B2 (ja) 2017-12-20

Family

ID=52120820

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013084503A Expired - Fee Related JP6250297B2 (ja) 2013-04-15 2013-04-15 音声入力装置、および画像表示装置

Country Status (1)

Country Link
JP (1) JP6250297B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108877787A (zh) * 2018-06-29 2018-11-23 北京智能管家科技有限公司 语音识别方法、装置、服务器及存储介质

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017138343A (ja) * 2016-02-01 2017-08-10 カシオ計算機株式会社 感情推定装置、感情推定方法及びプログラム
CN109313904B (zh) 2016-05-30 2023-12-08 索尼公司 视频音频处理设备和方法以及存储介质
JP6686977B2 (ja) * 2017-06-23 2020-04-22 カシオ計算機株式会社 音源分離情報検出装置、ロボット、音源分離情報検出方法及びプログラム
DE102017214919A1 (de) * 2017-08-25 2019-02-28 Siemens Healthcare Gmbh Bildgebende medizinische Einrichtung und Verfahren zum Betrieb einer bildgebenden medizinischen Einrichtung
US10524048B2 (en) * 2018-04-13 2019-12-31 Bose Corporation Intelligent beam steering in microphone array
JP7200772B2 (ja) * 2019-03-18 2023-01-10 コニカミノルタ株式会社 画像形成装置、画像形成装置の制御方法、および画像形成装置の制御プログラム
CN111522074B (zh) * 2020-05-29 2023-04-25 深圳市燕麦科技股份有限公司 麦克风检测设备及麦克风检测方法
CN111815958B (zh) * 2020-06-18 2022-11-29 安徽超清科技股份有限公司 一种交通电子警察抓拍控制装置及方法

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005159731A (ja) * 2003-11-26 2005-06-16 Canon Inc 撮像装置
JP2007302155A (ja) * 2006-05-12 2007-11-22 Matsushita Electric Ind Co Ltd 車載用マイクロホン装置及びその指向性制御方法
JP5564873B2 (ja) * 2009-09-25 2014-08-06 富士通株式会社 収音処理装置、収音処理方法、及びプログラム
JP5022461B2 (ja) * 2010-03-12 2012-09-12 株式会社半導体理工学研究センター マイクアレイ・ネットワークシステムおよび該システムを用いた音源定位方法
JP2012186551A (ja) * 2011-03-03 2012-09-27 Hitachi Ltd 制御装置、制御システムと制御方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108877787A (zh) * 2018-06-29 2018-11-23 北京智能管家科技有限公司 语音识别方法、装置、服务器及存储介质

Also Published As

Publication number Publication date
JP2014207589A (ja) 2014-10-30

Similar Documents

Publication Publication Date Title
JP6250297B2 (ja) 音声入力装置、および画像表示装置
US9852339B2 (en) Method for recognizing iris and electronic device thereof
JP6219017B2 (ja) 光検出機能を備えるoledディスプレイ装置
US20170061210A1 (en) Infrared lamp control for use with iris recognition authentication
US9900500B2 (en) Method and apparatus for auto-focusing of an photographing device
WO2018068689A1 (zh) 音量调节方法及装置
US20140223548A1 (en) Adapting content and monitoring user behavior based on facial recognition
US11234074B2 (en) Sound pickup device, sound pickup system, sound pickup method, program, and calibration method
WO2015184724A1 (zh) 一种选座的提示方法及装置
CN106709954B (zh) 在投影区域遮罩人脸的方法
JPWO2018025458A1 (ja) 情報処理装置、情報処理方法、およびプログラム
KR20140125183A (ko) 프로젝터 장착 안경 및 그 제어 방법
US20140204260A1 (en) Apparatus and method for controlling display of mobile terminal
TW201801516A (zh) 影像擷取裝置及其攝影構圖的方法
JP2013055424A (ja) 撮影装置、パターン検出装置、および電子機器
KR20200101230A (ko) 구도를 추천하기 위한 전자 장치 및 그의 동작 방법
JP2015023512A (ja) 撮影装置、撮影方法及び撮影装置の撮影プログラム
KR101982075B1 (ko) Tv 장치
KR20180023785A (ko) 복수의 발광소자를 포함하는 전자 장치 및 전자 장치의 동작 방법
US20200349714A1 (en) Projection apparatus and operation method thereof
KR20140047620A (ko) 입체적 효과 조정을 위한 상호적인 사용자 인터페이스
TWI485505B (zh) 數位相機及數位相機之影像擷取方法
JP2015166854A (ja) 投影装置の投影制御装置、投影装置の投影制御方法、投影システム、投影システムの投影制御方法及びプログラム
JP2015171116A (ja) カメラの表示装置
JP2018085579A (ja) 撮像装置、制御方法、及び情報処理プログラム

Legal Events

Date Code Title Description
RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20150909

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20150911

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20150915

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20150915

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160411

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160411

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20170217

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170314

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170512

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20171024

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20171122

R150 Certificate of patent or registration of utility model

Ref document number: 6250297

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees