JP2019103011A - 変換装置、変換方法、およびプログラム - Google Patents
変換装置、変換方法、およびプログラム Download PDFInfo
- Publication number
- JP2019103011A JP2019103011A JP2017233062A JP2017233062A JP2019103011A JP 2019103011 A JP2019103011 A JP 2019103011A JP 2017233062 A JP2017233062 A JP 2017233062A JP 2017233062 A JP2017233062 A JP 2017233062A JP 2019103011 A JP2019103011 A JP 2019103011A
- Authority
- JP
- Japan
- Prior art keywords
- speaker
- speakers
- camera
- unit
- image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Studio Devices (AREA)
- Circuit For Audible Band Transducer (AREA)
Abstract
Description
第一実施形態の話者方向決定装置は、対話ロボットなどが話者の方向を推定して指向性集音を実施する際に、雑音源などで方向推定を誤動作させないために、到来方向推定結果に基づき画像認識を実施することで、目的話者方向を決定する装置である。
〔参考文献1〕新井啓之、伊藤直己、片岡香織、谷口行信、“画像処理による広告効果測定技術−人数計測技術・顔画像技術の応用”、NTT技術ジャーナル 2013.1、vol. 25、pp. 61-64、2013年
〔参考文献2〕特開2009−44588号公報
第一実施形態の話者方向決定装置1から測定座標補正部12の処理のみを取り出した独立の変換装置を構成してもよい。変形例の変換装置100は、図6に示すように、変換部10を備える。この変換装置100が、図7に例示する各ステップの処理を行うことにより変形例の変換方法が実現される。
第二実施形態の話者方向決定装置2は、図8に示すように、第一実施形態と同様に到来方向推定部11と測定座標補正部12と画像認識部13と話者方向推定部14とを備え、さらに音声認識部21を備える。この話者方向決定装置2が、図9に例示する各ステップの処理を行うことにより第二実施形態の話者方向決定方法が実現される。
上記の実施形態では、予め用意された変換行列Kを用いて、音の到来方向をカメラの座標に変換していた。第三実施形態では変換行列Kを取得するために最適な校正用スピーカの配置を求める最適配置取得装置を説明する。校正用スピーカの配置を最適化することにより、カメラ側にとっては一般的にレンズ歪みや収差、交差ずれなどの影響を軽減することができるという効果がある。マイクロホン側にとっては各マイクロホンの感度誤差などの影響を軽減するために可能な範囲で多様な位置と角度に設置することが望ましいため、そうなるような配置を最適配置として求める。
上記実施形態で説明した各装置における各種の処理機能をコンピュータによって実現する場合、各装置が有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、上記各装置における各種の処理機能がコンピュータ上で実現される。
3 最適配置取得装置
8 指向性集音部
11 到来方向推定部
12 測定座標補正部
13 画像認識部
14 話者方向推定部
21 音声認識部
31 第一角度差取得部
32 第二角度差取得部
33 距離取得部
34 最適配置計算部
35 最適配置表示部
91 方向別前処理部
92 方向別パワー算出部
93 到来方向選択部
Claims (7)
- 複数のマイクロホンにより収音された音響信号から推定された前記マイクロホンアレイを基準とした所望の音源の方向であるマイクロホン方向を、カメラにより撮影された画像における座標であるカメラ座標に変換する変換装置であって、
前記マイクロホン方向を変換規則により前記カメラ座標に変換する変換部を含み、
前記変換規則は、
少なくとも3個のスピーカからなる放音部から発せられ、前記少なくとも3個のスピーカのうちいずれのスピーカから発せられたか識別できるよう設定された音響信号と、
前記少なくとも3個のスピーカの個々の位置を検知できるよう前記放音部が撮影された画像と、
を関連付けることで得られたものである、
変換装置。 - 請求項1に記載の変換装置であって、
前記変換規則は、前記スピーカが発した音響信号から推定された到来方向の二次元角度スペクトルと、前記カメラにより撮影された前記スピーカの画像上の座標とを関連付けることで得られたものである、
変換装置。 - 請求項1に記載の変換装置であって、
前記スピーカ間の距離、前記カメラから見た各スピーカの角度差、および前記マイクロホンアレイから見た各スピーカの角度差を最大化する各スピーカの位置を最適配置として求める最適配置計算部をさらに含む、
変換装置。 - 請求項4に記載の変換装置であって、
前記カメラにより撮影された画像に各スピーカの現実の配置および各スピーカの前記最適配置を重ね合わせて表示する最適配置表示部をさらに含む、
変換装置。 - 複数のマイクロホンにより収音された音響信号から推定された前記マイクロホンアレイを基準とした所望の音源の方向であるマイクロホン方向を、カメラにより撮影された画像における座標であるカメラ座標に変換する変換装置が実行する変換方法であって、
変換部が、前記マイクロホン方向を変換規則により前記カメラ座標に変換し、
前記変換規則は、
少なくとも3個のスピーカからなる放音部から発せられ、前記少なくとも3個のスピーカのうちいずれのスピーカから発せられたか識別できるよう設定された音響信号と、
前記少なくとも3個のスピーカの個々の位置を検知できるよう前記放音部が撮影された画像と、
を関連付けることで得られたものである、
変換方法。 - 請求項1から5のいずれかに記載の変換装置としてコンピュータを機能させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017233062A JP6881267B2 (ja) | 2017-12-05 | 2017-12-05 | 制御装置、変換装置、制御方法、変換方法、およびプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017233062A JP6881267B2 (ja) | 2017-12-05 | 2017-12-05 | 制御装置、変換装置、制御方法、変換方法、およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019103011A true JP2019103011A (ja) | 2019-06-24 |
JP6881267B2 JP6881267B2 (ja) | 2021-06-02 |
Family
ID=66974311
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017233062A Active JP6881267B2 (ja) | 2017-12-05 | 2017-12-05 | 制御装置、変換装置、制御方法、変換方法、およびプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6881267B2 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021029294A1 (ja) * | 2019-08-15 | 2021-02-18 | 富士フイルム株式会社 | データ作成方法及びデータ作成プログラム |
CN116736227A (zh) * | 2023-08-15 | 2023-09-12 | 无锡聚诚智能科技有限公司 | 一种麦克风阵列和摄像头联合标定声源位置的方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009239348A (ja) * | 2008-03-25 | 2009-10-15 | Yamaha Corp | 撮影装置 |
JP2013106298A (ja) * | 2011-11-16 | 2013-05-30 | Sony Corp | 撮像制御装置、撮像制御方法、撮像制御方法のプログラムおよび撮像装置 |
WO2014125835A1 (ja) * | 2013-02-15 | 2014-08-21 | パナソニック株式会社 | 指向性制御システム、キャリブレーション方法、水平偏差角算出方法及び指向性制御方法 |
JP2015161659A (ja) * | 2014-02-28 | 2015-09-07 | 株式会社熊谷組 | 音源方向推定装置、及び、音源推定用画像の表示装置 |
JP2019095699A (ja) * | 2017-11-27 | 2019-06-20 | 日本電信電話株式会社 | 話者方向推定装置、話者方向推定方法、およびプログラム |
-
2017
- 2017-12-05 JP JP2017233062A patent/JP6881267B2/ja active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009239348A (ja) * | 2008-03-25 | 2009-10-15 | Yamaha Corp | 撮影装置 |
JP2013106298A (ja) * | 2011-11-16 | 2013-05-30 | Sony Corp | 撮像制御装置、撮像制御方法、撮像制御方法のプログラムおよび撮像装置 |
WO2014125835A1 (ja) * | 2013-02-15 | 2014-08-21 | パナソニック株式会社 | 指向性制御システム、キャリブレーション方法、水平偏差角算出方法及び指向性制御方法 |
JP2015161659A (ja) * | 2014-02-28 | 2015-09-07 | 株式会社熊谷組 | 音源方向推定装置、及び、音源推定用画像の表示装置 |
JP2019095699A (ja) * | 2017-11-27 | 2019-06-20 | 日本電信電話株式会社 | 話者方向推定装置、話者方向推定方法、およびプログラム |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021029294A1 (ja) * | 2019-08-15 | 2021-02-18 | 富士フイルム株式会社 | データ作成方法及びデータ作成プログラム |
CN114467293A (zh) * | 2019-08-15 | 2022-05-10 | 富士胶片株式会社 | 数据创建方法及数据创建程序 |
JP7397084B2 (ja) | 2019-08-15 | 2023-12-12 | 富士フイルム株式会社 | データ作成方法及びデータ作成プログラム |
CN116736227A (zh) * | 2023-08-15 | 2023-09-12 | 无锡聚诚智能科技有限公司 | 一种麦克风阵列和摄像头联合标定声源位置的方法 |
CN116736227B (zh) * | 2023-08-15 | 2023-10-27 | 无锡聚诚智能科技有限公司 | 一种麦克风阵列和摄像头联合标定声源位置的方法 |
Also Published As
Publication number | Publication date |
---|---|
JP6881267B2 (ja) | 2021-06-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107534725B (zh) | 一种语音信号处理方法及装置 | |
CN106679651B (zh) | 声源定位方法、装置和电子设备 | |
US20150022636A1 (en) | Method and system for voice capture using face detection in noisy environments | |
Aarabi et al. | Robust sound localization using multi-source audiovisual information fusion | |
JP6467736B2 (ja) | 音源位置推定装置、音源位置推定方法および音源位置推定プログラム | |
KR20170066258A (ko) | 정보 처리 장치, 정보 처리 방법 및 기록 매체 | |
JP7194897B2 (ja) | 信号処理装置及び信号処理方法 | |
US10235010B2 (en) | Information processing apparatus configured to generate an audio signal corresponding to a virtual viewpoint image, information processing system, information processing method, and non-transitory computer-readable storage medium | |
CN108877787A (zh) | 语音识别方法、装置、服务器及存储介质 | |
JP2005274707A (ja) | 情報処理装置および方法、プログラム、並びに記録媒体 | |
JP6410769B2 (ja) | 情報処理システム及びその制御方法、コンピュータプログラム | |
JP2007235334A (ja) | オーディオ装置及び指向音生成方法 | |
JP6881267B2 (ja) | 制御装置、変換装置、制御方法、変換方法、およびプログラム | |
RU174044U1 (ru) | Аудиовизуальный многоканальный детектор наличия голоса | |
WO2011108377A1 (ja) | 連携動作機器、連携動作方法、連携動作制御プログラム及び機器連携システム | |
KR20190016683A (ko) | 마이크로폰 어레이를 이용한 회의록 자동작성장치 | |
JP2010191544A (ja) | 映像音声処理装置、映像音声処理方法、映像音声処理プログラム | |
JP2018019295A (ja) | 情報処理システム及びその制御方法、コンピュータプログラム | |
WO2023056905A1 (zh) | 声源定位方法、装置及设备 | |
CN116405774A (zh) | 视频处理方法与电子设备 | |
Goseki et al. | Combination of microphone array processing and camera image processing for visualizing sound pressure distribution | |
CN114422743A (zh) | 视频流显示方法、装置、计算机设备和存储介质 | |
JP2017108240A (ja) | 情報処理装置、及び情報処理方法 | |
CN113824916A (zh) | 图像显示方法、装置、设备及存储介质 | |
JP2019033497A (ja) | 情報処理システム及びその制御方法、コンピュータプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20191219 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20200806 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20200818 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20201009 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20201208 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210309 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210324 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210406 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210419 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6881267 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |