JP2021076866A - 収音制御システム及び収音制御システムの制御方法 - Google Patents
収音制御システム及び収音制御システムの制御方法 Download PDFInfo
- Publication number
- JP2021076866A JP2021076866A JP2021016613A JP2021016613A JP2021076866A JP 2021076866 A JP2021076866 A JP 2021076866A JP 2021016613 A JP2021016613 A JP 2021016613A JP 2021016613 A JP2021016613 A JP 2021016613A JP 2021076866 A JP2021076866 A JP 2021076866A
- Authority
- JP
- Japan
- Prior art keywords
- image
- sound source
- sound
- unit
- speaker
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title description 29
- 230000005236 sound signal Effects 0.000 claims abstract description 50
- 239000000284 extract Substances 0.000 claims 1
- 238000004148 unit process Methods 0.000 claims 1
- 230000000052 comparative effect Effects 0.000 abstract 1
- 230000007274 generation of a signal involved in cell-cell signaling Effects 0.000 description 28
- 238000004364 calculation method Methods 0.000 description 23
- 238000004891 communication Methods 0.000 description 19
- 238000010586 diagram Methods 0.000 description 12
- 230000005540 biological transmission Effects 0.000 description 6
- 230000006870 function Effects 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000009434 installation Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000008929 regeneration Effects 0.000 description 1
- 238000011069 regeneration method Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
Images
Landscapes
- Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)
- Circuit For Audible Band Transducer (AREA)
- Image Analysis (AREA)
Abstract
Description
第1の実施形態について、図面を用いて以下に説明する。
図1は、本実施形態に係る収音制御システム100のブロック図である。収音制御システム100は、図1に示すように、撮影収音装置10と、ネットワーク20を介して撮影収音装置10と接続される操作用装置30と、操作用装置30の指示に従って再生を行う再生装置40とを含む。なお、再生装置40は、操作用装置30に外部接続されてもよく、操作用装置30に内蔵されていてもよい。
図2は、本実施形態に係る撮影収音装置10のブロック図である。撮影収音装置10は、図2に示すように、音声の入力を受け付け、複数の音声信号51を生成する収音部11と、複数の参加者が表示された参加者画像を撮影する撮影部12と、複数の音声信号51の位相差と、参加者画像に対する顔認識を用いて音源位置を特定する音源位置情報を生成する音源位置情報生成部13と、音源位置情報を用いて、推定話者に関する推定話者画像52を生成し、操作用装置30に送信する推定話者画像生成部14と、を含む。
本実施形態において、収音部11は、複数のマイクロホンを含むアレイマイクにより構成する。収音部11は、撮影収音装置10が配置された会場の音を収音する。収音部11は、図3に示した撮影部12を含む同一筐体内に配置されていてもよく、会場前方の天井に設置された他の筐体内に配置されていてもよい。
撮影部12は、少なくとも一つのカメラを有し、複数の参加者が表示された参加者画像60を撮影する。本実施形態においては、撮影部12は一つのカメラを有し、このカメラにより、会場内にいる参加者全体を前方から撮影した画像を撮影する。
上述したとおり、収音部11は、複数のマイクロホンにより収音された音声信号51を、マイクロホンの数に応じて生成し、音源位置情報生成部13に送信している。この複数の音声信号51を受信した音源位置情報生成部13は、この複数の音声信号51の比較情報である位相差から、図3に示す、音源位置が含まれる第1の範囲71、第2の範囲72を特定する。
推定話者画像生成部14は、音源位置情報生成部13から送信された音源位置情報と、撮影部12から送信された参加者画像60を受信し、推定話者に関する推定話者画像52を生成する。
操作用装置入力部15は、操作用装置30から送信された指向性制御信号を受信し、指向性演算部16に送信する。指向性制御信号とは、推定話者画像52に関連付けられた音源位置情報に基づき、収音部11からの音声信号51の出力を制御する情報である。
指向性演算部16は、指向性制御信号53を操作用装置入力部15より取得し、収音部11より音声信号51を取得する。指向性演算部16は、この指向性制御信号53に基づき、収音部11からの音声信号51を制御して出力する。
図7は、本実施形態に係る操作用装置30のブロック図である。操作用装置30は、図7に示すように、撮影収音装置10により生成された少なくとも一つの推定話者画像52を受信する通信部31と、少なくとも一つの推定話者画像52を表示装置33に表示させる表示処理部32と、少なくとも一つの推定話者画像52の中から一つの推定話者画像52の選択を受け付ける選択受付部34と、選択された推定話者画像52に関する指向性制御信号53を生成する指向性制御信号生成部35と、撮影収音装置10より音声信号を受信し、音声信号51の再生を再生装置40に指示する再生処理部36とを、を含む。
通信部31は、無線LAN、有線LAN、WAN、赤外線、電波、Bluetooth(登録商標)などに対応しており、ネットワーク20を介して、撮影収音装置10との信号伝達を行う。
表示処理部32は、少なくとも一つの推定話者画像52を表示装置33に表示させる。即ち、複数の推定話者画像52を取得している場合には、複数の推定話者画像52を表示装置33に表示させ、唯一の推定話者画像52を取得している場合には、その唯一の推定話者画像52を表示装置33に表示させる。
表示装置33は、操作用装置30に内蔵された、あるいは外部接続された表示装置であり、表示処理部32の指示に基づき、推定話者画像52等を表示する。
選択受付部34は、少なくとも一つの推定話者画像52の中から一つの推定話者画像52の選択を受け付ける。即ち、選択受付部34が複数の推定話者画像52を取得している場合、操作者の操作により、その複数の推定話者画像52の中から一つの推定話者画像52の選択を受けつける。選択受付部34が唯一の推定話者画像52を取得している場合は、操作者は、この唯一の推定話者画像52に含まれる話者の音声を強調して聞くか否かを選択し、選択受付部34は、その操作者による選択を受け付ける。
指向性制御信号生成部35は、選択された推定話者画像52に関する指向性制御信号53を生成する。
再生処理部36は、撮影収音装置10より通信部31を介して音声信号51を受信し、この音声信号51の再生を再生装置40に指示する。
図10は、本実施形態に係る撮影収音装置10の制御方法を示すフローチャートである。以下、図10を用いて、本実施形態に係る撮影収音装置10の制御方法について説明する。
撮影収音装置10の収音部11は、複数の音声信号を生成する音声信号生成ステップS101を実施する。
撮影収音装置10の撮影部12は、複数の参加者が表示された参加者画像60を撮影する参加者画像撮影ステップS102を実施する。
撮影収音装置10の音源位置情報生成部13は、複数の音声信号51の位相差から音源位置を推定する音源位置情報を生成する音源位置情報生成ステップS103を実施する。
撮影収音装置10の推定話者画像生成部14は、推定話者に関する推定話者画像を生成する推定話者画像生成ステップS104を実施する。
撮影収音装置10の推定話者画像生成部14は、生成した推定話者画像52を操作用装置30に送信する推定話者画像送信ステップS105を実施する。
指向性制御信号受信ステップS106は、後述する操作用装置30の制御方法において、推定話者画像受信ステップS201、表示処理ステップS202、選択受付ステップS203、指向性制御信号生成ステップS204が実施された後に、撮影収音装置10において実施されるステップである。
撮影収音装置10の指向性演算部16は、指向性制御信号53に基づき音声信号51を制御して出力する指向性演算ステップS107を実施する。
図11は、本実施形態に係る操作用装置30の制御方法を示すフローチャートである。以下、図11を用いて、本実施形態に係る操作用装置30の制御方法について説明する。
推定話者画像受信ステップS201は、上述した撮影収音装置10の制御方法において、音声信号生成ステップS101、参加者画像撮影ステップS102、音源位置情報生成ステップS103、推定話者画像生成ステップS104、推定話者画像送信ステップS105が実施された後に、操作用装置30において実施されるステップである。
操作用装置30の表示処理部32は、少なくとも一つの推定話者画像52を表示装置33に表示させる表示処理ステップS202を実施する。即ち、表示処理部32は、複数の推定話者画像52を取得している場合は、複数の推定話者画像52を表示装置33に表示させ、唯一の推定話者画像52を取得している場合は、この唯一の推定話者画像52を表示装置33に表示させる。
操作用装置30の選択受付部34は、少なくとも一つの推定話者画像52の中から一つの推定話者画像52の選択を受け付ける選択受付ステップS203を実施する。即ち、選択受付部34が、複数の推定話者画像52を取得している場合は、この複数の推定話者画像52の中から、操作者の操作により、一つの推定話者画像52の選択を受け付ける。選択受付部34が、唯一の推定話者画像52を取得している場合は、操作者はその唯一の推定話者画像52に含まれる話者の声を強調して聞くか否かを判断し、選択受付部34は、その操作者の判断に基づく選択操作を受け付ける。
操作用装置30の指向性制御信号生成部35は、選択された推定話者画像52に関する指向性制御信号53を生成する指向性制御信号生成ステップS204を実施する。
音声信号受信ステップS205は、上述した撮影収音装置10の制御方法において、指向性制御信号受信ステップS106、指向性演算ステップS107が実施された後に、操作用装置30において実施されるステップである。
操作用装置30の再生処理部36は、通信部31から音声信号51を取得し、音声信号51の再生を再生装置40に指示する再生処理ステップS206を実施する。
図12は、本実施形態に係る収音制御システム100の制御方法を示すフローチャートである。なお、各ステップについては、撮影収音装置10の制御方法、操作用装置30の制御方法において上述した通りであるため、その説明を省略する。
Claims (13)
- 音声の入力を受け付け、複数の音声信号を生成する収音部と、
前記複数の音声信号と、複数の参加者が表示された参加者の画像と、を取得し、複数の前記音声信号の間の比較情報を用いて第1の音源の位置を特定し、前記参加者の画像に対して前記第1の音源の位置を含む範囲に顔認識を実行することで第2の音源の位置を特定し、該第2の音源の位置を表す位置情報を生成する位置情報生成部と、
前記位置情報を用いて、話者に関する画像を生成する画像生成部と、
少なくとも一つの前記話者に関する画像を表示装置に表示させる表示処理部と、
少なくとも一つの前記話者に関する画像の中から一つの画像の選択を受け付ける選択受付部と、
を含む、収音制御システム。 - 前記比較情報は、複数の前記音声信号の位相差である、
請求項1に記載の収音制御システム。 - 前記比較情報は、複数の前記音声信号のパワー比である、
請求項1に記載の収音制御システム。 - 前記画像生成部は、前記話者に関する画像として、前記参加者の画像を加工して前記話者に関する切り出し画像を生成する、
請求項1に記載の収音制御システム。 - 前記位置情報生成部により生成された前記位置情報に基づき、前記第2の音源の位置の方向の画像を撮影する撮影部を更に含み、
前記画像生成部が、前記第2の音源の位置の方向の画像を前記話者に関する画像として取得する、
請求項1乃至4のいずれか一つに記載の収音制御システム。 - 前記位置情報生成部は、前記音声信号を時間領域から周波数領域にフーリエ変換し、前記音声信号の内、人の音声に関する周波数領域に含まれる前記音声信号を抽出することで前記第1の音源の位置を特定する、
請求項1乃至5のいずれか一つに記載の収音制御システム。 - 前記位置情報生成部は、0.2kHzから4kHzまでの前記周波数領域に含まれる前記音声信号を抽出することで前記第1の音源の位置を特定する、
請求項6に記載の収音制御システム。 - 前記画像生成部は、前記位置情報と前記話者に関する画像とを関連付けて、操作用装置に送信する、
請求項1乃至7のいずれか一つに記載の収音制御システム。 - 前記収音部は、複数のマイクロホンを有するアレイマイクを含む、
請求項1乃至8のいずれか一つに記載の収音制御システム。 - 前記参加者の画像を撮影する撮影部を更に備えた、
請求項1に記載の収音制御システム。 - 前記画像生成部は、前記参加者の画像における前記話者に関する画像に対応する位置情報と、前記話者に関する画像と、を関連付けて、操作用装置に送信する、
請求項1に記載の収音制御システム。 - 前記画像生成部は、前記位置情報を用いて、複数の話者に関する複数の画像を生成する、
請求項1に記載の収音制御システム。 - 音声の入力を受け付け、複数の音声信号を生成し、
前記複数の音声信号と、複数の参加者が表示された参加者の画像と、を取得し、複数の前記音声信号の間の比較情報を用いて第1の音源の位置を特定し、前記参加者の画像に対して前記第1の音源の位置を含む範囲に顔認識を実行することで第2の音源の位置を特定し、該第2の音源の位置を表す位置情報を生成し、
前記位置情報を用いて、話者に関する画像を生成し、
少なくとも一つの前記話者に関する画像を表示装置に表示させ、
少なくとも一つの前記話者に関する画像の中から一つの画像の選択を受け付ける、
収音制御システムの制御方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021016613A JP7111202B2 (ja) | 2021-02-04 | 2021-02-04 | 収音制御システム及び収音制御システムの制御方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021016613A JP7111202B2 (ja) | 2021-02-04 | 2021-02-04 | 収音制御システム及び収音制御システムの制御方法 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019506784A Division JP6835205B2 (ja) | 2017-03-22 | 2017-03-22 | 撮影収音装置、収音制御システム、撮影収音装置の制御方法、及び収音制御システムの制御方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021076866A true JP2021076866A (ja) | 2021-05-20 |
JP7111202B2 JP7111202B2 (ja) | 2022-08-02 |
Family
ID=75900047
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021016613A Active JP7111202B2 (ja) | 2021-02-04 | 2021-02-04 | 収音制御システム及び収音制御システムの制御方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7111202B2 (ja) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007150921A (ja) * | 2005-11-29 | 2007-06-14 | Kyocera Corp | 通信端末および通信システム、並びに通信端末の表示方法 |
JP2008236679A (ja) * | 2007-03-23 | 2008-10-02 | Sony Corp | テレビ会議装置、制御方法、およびプログラム |
JP2008262416A (ja) * | 2007-04-12 | 2008-10-30 | Olympus Imaging Corp | 画像再生装置、画像再生プログラム、記録媒体、画像再生方法 |
JP2009086055A (ja) * | 2007-09-27 | 2009-04-23 | Sony Corp | 音源方向検出装置、音源方向検出方法及び音源方向検出カメラ |
JP2010251916A (ja) * | 2009-04-13 | 2010-11-04 | Nec Casio Mobile Communications Ltd | 音データ処理装置、及び、プログラム |
JP2016146547A (ja) * | 2015-02-06 | 2016-08-12 | パナソニックIpマネジメント株式会社 | 収音システム及び収音方法 |
-
2021
- 2021-02-04 JP JP2021016613A patent/JP7111202B2/ja active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007150921A (ja) * | 2005-11-29 | 2007-06-14 | Kyocera Corp | 通信端末および通信システム、並びに通信端末の表示方法 |
JP2008236679A (ja) * | 2007-03-23 | 2008-10-02 | Sony Corp | テレビ会議装置、制御方法、およびプログラム |
JP2008262416A (ja) * | 2007-04-12 | 2008-10-30 | Olympus Imaging Corp | 画像再生装置、画像再生プログラム、記録媒体、画像再生方法 |
JP2009086055A (ja) * | 2007-09-27 | 2009-04-23 | Sony Corp | 音源方向検出装置、音源方向検出方法及び音源方向検出カメラ |
JP2010251916A (ja) * | 2009-04-13 | 2010-11-04 | Nec Casio Mobile Communications Ltd | 音データ処理装置、及び、プログラム |
JP2016146547A (ja) * | 2015-02-06 | 2016-08-12 | パナソニックIpマネジメント株式会社 | 収音システム及び収音方法 |
Non-Patent Citations (1)
Title |
---|
冨野剛他: "多人数参加型テレビ会議システムにおける発言者拡大映像の作成", 情報処理学会論文誌, vol. 第47巻第7号, JPN6021046735, 15 July 2006 (2006-07-15), JP, pages 2091 - 2098, ISSN: 0004650950 * |
Also Published As
Publication number | Publication date |
---|---|
JP7111202B2 (ja) | 2022-08-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2015139162A (ja) | 音響信号処理装置、動画撮影装置およびそれらの制御方法 | |
JP2016146547A (ja) | 収音システム及び収音方法 | |
JP2013106298A (ja) | 撮像制御装置、撮像制御方法、撮像制御方法のプログラムおよび撮像装置 | |
JP6493860B2 (ja) | 監視制御システム及び監視制御方法 | |
CN114827517A (zh) | 一种投影视频会议系统及视频投影方法 | |
JP5939341B1 (ja) | モニタリングシステム及びモニタリング方法 | |
JP2019220848A (ja) | データ処理装置、データ処理方法及びプログラム | |
JP6835205B2 (ja) | 撮影収音装置、収音制御システム、撮影収音装置の制御方法、及び収音制御システムの制御方法 | |
CN110868561A (zh) | 视频通话方法、视频通话装置及计算机可读存储介质 | |
JP4933337B2 (ja) | 動画撮影装置、動画再生装置、動画配信システム、制御方法、制御プログラム、および、記録媒体 | |
KR101976937B1 (ko) | 마이크로폰 어레이를 이용한 회의록 자동작성장치 | |
WO2011108377A1 (ja) | 連携動作機器、連携動作方法、連携動作制御プログラム及び機器連携システム | |
JP2009239348A (ja) | 撮影装置 | |
US20110043598A1 (en) | Remote communication apparatus and method of estimating a distance between an imaging device and a user image-captured | |
US11665391B2 (en) | Signal processing device and signal processing system | |
JP2021076866A (ja) | 収音制御システム及び収音制御システムの制御方法 | |
JP2014072835A (ja) | 会議装置 | |
JP2017103641A (ja) | 情報処理装置、会議システム、情報処理方法およびプログラム | |
JP2013168878A (ja) | 録音機器 | |
JP2007251355A (ja) | 対話システム用中継装置、対話システム、対話方法 | |
JP2011114720A (ja) | 外部異常検知機能を有するインターホンシステム | |
CN115118913A (zh) | 一种投影视频会议系统及投影视频方法 | |
JP2013183280A (ja) | 情報処理装置、撮像装置、及びプログラム | |
WO2020006664A1 (zh) | 拍摄装置的控制方法、拍摄装置、拍摄系统和存储介质 | |
JP2021197658A (ja) | 収音装置、収音システム及び収音方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210208 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20211117 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20211130 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220125 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220621 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220704 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 7111202 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |