JP6727106B2 - 画像音響処理装置および画像音響処理方法、プログラム - Google Patents
画像音響処理装置および画像音響処理方法、プログラム Download PDFInfo
- Publication number
- JP6727106B2 JP6727106B2 JP2016233499A JP2016233499A JP6727106B2 JP 6727106 B2 JP6727106 B2 JP 6727106B2 JP 2016233499 A JP2016233499 A JP 2016233499A JP 2016233499 A JP2016233499 A JP 2016233499A JP 6727106 B2 JP6727106 B2 JP 6727106B2
- Authority
- JP
- Japan
- Prior art keywords
- sound
- image
- content
- data
- virtual viewpoint
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012545 processing Methods 0.000 title claims description 51
- 238000003672 processing method Methods 0.000 title claims description 5
- 230000008859 change Effects 0.000 claims description 4
- 238000003384 imaging method Methods 0.000 claims description 3
- 230000004044 response Effects 0.000 claims description 2
- 238000000034 method Methods 0.000 description 58
- 230000008569 process Effects 0.000 description 32
- 238000010586 diagram Methods 0.000 description 6
- 230000033001 locomotion Effects 0.000 description 6
- 238000009434 installation Methods 0.000 description 4
- 230000035807 sensation Effects 0.000 description 3
- 230000006870 function Effects 0.000 description 2
- 238000010187 selection method Methods 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 238000009825 accumulation Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000013481 data capture Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N5/00—Details of television systems
- H04N5/44—Receiver circuitry for the reception of television signals according to analogue transmission standards
- H04N5/60—Receiver circuitry for the reception of television signals according to analogue transmission standards for the sound signals
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N23/00—Cameras or camera modules comprising electronic image sensors; Control thereof
- H04N23/60—Control of cameras or camera modules
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N23/00—Cameras or camera modules comprising electronic image sensors; Control thereof
- H04N23/90—Arrangement of cameras or camera modules, e.g. multiple cameras in TV studios or sports stadiums
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N5/00—Details of television systems
- H04N5/04—Synchronising
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N5/00—Details of television systems
- H04N5/222—Studio circuitry; Studio devices; Studio equipment
- H04N5/262—Studio circuits, e.g. for mixing, switching-over, change of character of image, other special effects ; Cameras specially adapted for the electronic generation of special effects
- H04N5/268—Signal distribution or switching
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Television Signal Processing For Recording (AREA)
- Studio Devices (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
Description
1以上のマイクロフォンによる収音に基づく収音データであって、複数の撮影装置によりそれぞれ異なる方向から撮影される領域内の音を含む収音データを取得する取得手段と、
前記複数の撮影装置により取得される複数の撮影画像に基づいて生成される仮想視点画像であって、同一の時点において変化させた視点から前記領域を見た場合の光景を表す動画像である仮想視点画像と共に再生される音響データとして、前記時点以前の収音期間に対応する音響データを、前記取得手段により取得された収音データに基づいて生成する生成手段とを有する。
第一実施形態では、音響コンテンツを生成する場合に、どの時刻の音響を利用するかと、どの処理を実施するかの判断を行う動作について説明する。第一実施形態では、生成可能な画像コンテンツの種別を、静止画仮想視点コンテンツ、動画仮想視点コンテンツ、ライブ画像コンテンツの3つとする。ライブ画像コンテンツは、ライブ放送で使用する画像コンテンツであり、且つ、各時刻において、複数のカメラのうち、選択した1つのカメラ画像を使用する画像コンテンツである。動画仮想視点コンテンツは、複数のカメラにより取得された所定期間の多視点画像に基づいて生成される、任意視点からの動画である。静止画仮想視点コンテンツは、複数のカメラにより取得されたある時点の多視点画像に基づいて生成される、複数の任意視点からの静止画である。
図1Aは、第一実施形態による映像処理システムの機器構成例を示すブロック図である。映像処理システムは、画像音響処理装置100、カメラ群101、マイクロフォン群102、時刻生成サーバ103、映像配信機器104を備える。画像音響処理装置100は、カメラ群101からカメラの台数に応じた数の画像データと、マイクロフォン群102からマイクロフォンの台数に応じた数の音響データを受信する。
以上のような構成を備えた画像音響処理装置100の動作について説明する。図2は、第一実施形態に係る、画像音響処理を説明するフローチャートである。本実施形態では、音響データのうちの、画像データに基づいて生成される仮想視点の画像コンテンツに対応する撮影時刻よりも前の時刻に集音された音響データであるところの以前の音響データを用いて、画像コンテンツと共に再生される音響コンテンツが生成される。なお、本実施形態において、以前の音響データを用いて生成された音響コンテンツが関連付けられる仮想視点の画像コンテンツとは、静止画仮想視点コンテンツである。
次に、音響データ114を再利用すると判断し、静止画仮想視点コンテンツを閲覧中に仮想サラウンドコンテンツを視聴した場合のデータ推移を、図4を用いて説明する。図4は、時刻T0から時刻T3の間に音響コンテンツ及び画像コンテンツを再生する場合を示している。
第一実施形態では、静止画仮想視点コンテンツの生成時の音響コンテンツを生成するために、静止画仮想視点コンテンツの生成開始時における視点に近いマイクロフォンからの音響データを用いる構成を説明した。しかしながら、静止画仮想視点コンテンツの生成時における音響データの選択方法は、これに限られるものではない。第二の実施形態では、静止画仮想視点コンテンツに対応する仮想サラウンドコンテンツを生成する場合に、被写体の位置に基づいて音響データを選択する構成について説明する。なお、映像処理システムおよび画像音響処理装置100の構成は第一実施形態(図1A、図1B)と同様である。
図5は、競技場でのカメラ及びマイクロフォンの設置例である。競技場500は、スタンド501、フィールド502、実況室503を有している。また、フィールド502を点線で示す4つの領域に分割した場合の第一象限を分割エリア560、第二象限を分割エリア561、第三象限を分割エリア562、第四象限を分割エリア563と称する。マイクロフォン510〜517はフィールド502の内部に設置されたマイクロフォンである。図5の例では、分割エリア560〜563毎に2本ずつのマイクロフォンが設置されている。マイクロフォン520〜523はスタンド501に設置されたマイクロフォンである。マイクロフォン530は実況室503に設置されたマイクロフォンである。マイクロフォン510〜517、520〜523は、マイクロフォン群102を構成している。カメラ540〜557はスタンド501に設置されたカメラである。カメラ540〜557はカメラ群101を構成している。
図6は、蓄積部112に蓄積される音響データ114の内部構造を示す図である。音響データ114はマイクロフォン510〜517が集音したフィールド音響60と、マイクロフォン520〜523が集音したスタンド音響61と、マイクロフォン530が集音した実況音響62の複数のカテゴリを含む。フィールド音響60は競技場のフィールドで集音された音響データである。スタンド音響61は競技場のスタンドで集音された音響データである。実況音響62は実況者の音声を集音することにより得られた音響データである。音響制御部117は、動画コンテンツのタイムスタンプや視点に基づいて音響データ114から必要なフィールド音響60、スタンド音響61、実況音響62の少なくとも何れかを選択して蓄積部112から読み出す。音響制御部117は、仮想サラウンドコンテンツ生成部122とライブ音響コンテンツ生成部123のうち読み出した音響データの送信先を、生成中の動画コンテンツの種別に応じて決定する。音響制御部117は、読み出した音響データを決定されたコンテンツ生成部へ送る。
音響制御部117が、静止画仮想視点コンテンツのための音響コンテンツの生成に用いる音響データを音響データ114から選択する処理について、図7のフローチャートを用いて説明する。図7のフローチャートにより示される処理は、図2のステップS25,S26の処理の詳細の一例である。
以下、図5に示した競技場500の設置例と図6に示した音響データ114の構成例を用いて、音響制御部117による音響データの選択の処理(ステップS73)の例を示す。生成される画像コンテンツは静止画仮想視点コンテンツであり、被写体は分割エリア561に存在するものとする。静止画仮想視点コンテンツの場合には対応する音響データが無いため、仮想サラウンドが生成される。
第一実施形態では、仮想視点の位置に基づいて音響データして音響コンテンツを生成する構成を、第二実施形態では、静止画仮想視点コンテンツの被写体の位置に基づいて音響データを選択して音響コンテンツを生成する構成を示した。第三実施形態では、第一実施形態と同様に静止画仮想視点コンテンツの仮想視点に基づいて音響コンテンツを生成する構成を説明する。但し、第三実施形態では、仮想視点の位置を用いた音響コンテンツの生成方法として、複数の方法を切り替え可能な構成について説明する。特に生成方法の一つとして、仮想視点の移動に応じて音響が移動(たとえば回転)するように仮想サラウンドコンテンツを生成する方法が含まれる場合について説明する。なお、音響が移動するとは、仮想の集音位置が移動することである。映像処理システムおよび画像音響処理装置100の構成は第一実施形態(図1A、図1B)と同様である。
本実施形態では、仮想サラウンドの生成方法として3種類の生成方法を有する構成を説明する。1つ目の生成方法は、撮影座標基準による生成方法であり、被写体を撮影するカメラ、すなわち仮想視点の位置(以下、撮影座標)の移動に基づいて音響コンテンツの集音位置を移動(回転)する。撮影座標基準では複数の撮影座標を取得する必要がある。2つ目の生成方法は、終了基準による生成方法であり、静止画仮想視点コンテンツにおける最後の撮影座標に基づいて音響コンテンツを生成する。3つ目の生成方法は、開始基準による生成方法であり、静止画仮想視点コンテンツにおける最初の撮影座標に基づいて音響コンテンツを生成する。
図8は、第三実施形態による、静止画仮想視点コンテンツのための仮想サラウンドの生成に必要な音響データを蓄積部112に蓄積されている音響データ114の中から選択する処理を示すフローチャートである。
本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサーがプログラムを読出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。
Claims (20)
- 1以上のマイクロフォンによる収音に基づく収音データであって、複数の撮影装置によりそれぞれ異なる方向から撮影される領域内の音を含む収音データを取得する取得手段と、
前記複数の撮影装置により取得される複数の撮影画像に基づいて生成される仮想視点画像であって、同一の時点において変化させた視点から前記領域を見た場合の光景を表す動画像である仮想視点画像と共に再生される音響データとして、前記時点以前の収音期間に対応する音響データを、前記取得手段により取得された収音データに基づいて生成する生成手段とを有することを特徴とする音響処理装置。 - 前記収音期間は前記時点を含むことを特徴とする請求項1に記載の音響処理装置。
- 前記収音期間の開始時点は前記時点より前であり、
前記収音期間の終了時点は前記時点と一致することを特徴とする請求項1又は2に記載の音響処理装置。 - 前記収音期間の長さは前記仮想視点画像の再生期間の長さと一致することを特徴とする請求項3に記載の音響処理装置。
- 前記仮想視点画像は、前記時点において撮影された複数の撮影画像に基づいて生成されることを特徴とする請求項1乃至4の何れか1項に記載の音響処理装置。
- 前記仮想視点画像は、撮影時刻の進行が停止した状態で視点が変化する動画像であることを特徴とする請求項1乃至5の何れか1項に記載の音響処理装置。
- 前記音響データは、前記仮想視点画像における視点の変化に対応して仮想聴取点が変化する音のデータであることを特徴とする請求項1乃至6の何れか1項に記載の音響処理装置。
- 前記時点と前記仮想視点画像の再生期間の長さとに基づいて前記収音期間を決定する決定手段を有することを特徴とする請求項1乃至7の何れか1項に記載の音響処理装置。
- 前記仮想視点画像を取得する画像取得手段と、
前記生成手段により生成された前記音響データを、前記画像取得手段により取得された前記仮想視点画像と共に出力する出力手段とを有することを特徴とする請求項1乃至8の何れか1項に記載の音響処理装置。 - 前記生成手段により生成された音響データを含む音響コンテンツを、前記音響コンテンツと共に再生される画像コンテンツであって前記仮想視点画像を含む画像コンテンツと共に出力する出力手段を有することを特徴とする請求項1乃至8の何れか1項に記載の音響処理装置。
- 前記画像コンテンツは、前記仮想視点画像と、終了時点が前記時点に一致する撮影期間に対応する動画像とを含み、
前記音響コンテンツは、前記仮想視点画像と共に再生される第1の音響データと、前記撮影期間に対応する動画像と共に再生される第2の音響データとを含むことを特徴とする請求項10に記載の音響処理装置。 - 前記第1の音響データに対応する収音期間と前記第2の音響データに対応する収音期間とは不連続であることを特徴とする請求項11に記載の音響処理装置。
- 前記画像コンテンツは、前記仮想視点画像と、開始時点が前記時点に一致する撮影期間に対応する動画像とを含み、
前記音響コンテンツは、前記仮想視点画像と共に再生される第1の音響データと、前記撮影期間に対応する動画像と共に再生される第2の音響データとを含むことを特徴とする請求項10に記載の音響処理装置。 - 前記第1の音響データに対応する収音期間と前記第2の音響データに対応する収音期間とは連続することを特徴とする請求項13に記載の音響処理装置。
- 前記撮影期間に対応する動画像は、撮影装置により撮影された画像であることを特徴とする請求項11乃至14の何れか1項に記載の音響処理装置。
- 前記撮影期間に対応する動画像は、前記撮影期間内の複数の時点に撮影された複数の撮影画像に基づいて生成された仮想視点画像であることを特徴とする請求項11乃至14の何れか1項に記載の音響処理装置。
- 1以上のマイクロフォンによる収音に基づく収音データであって、複数の撮影装置によりそれぞれ異なる方向から撮影される領域内の音を含む収音データを取得する取得工程と、
前記複数の撮影装置により取得される複数の撮影画像に基づいて生成される仮想視点画像であって、同一の時点において変化させた視点から前記領域を見た場合の光景を表す動画像である仮想視点画像と共に再生される音響データとして、前記時点以前の収音期間に対応する音響データを、前記取得工程において取得された収音データに基づいて生成する生成工程とを有することを特徴とする音響処理方法。 - 前記収音期間の開始時点は前記時点より前であり、
前記収音期間の終了時点は前記時点と一致することを特徴とする請求項17に記載の音響処理方法。 - 前記時点と前記仮想視点画像の再生期間の長さとに基づいて前記収音期間を決定する決定工程を有することを特徴とする請求項17又は18に記載の音響処理方法。
- コンピュータを、請求項1乃至16の何れか1項に記載の音響処理装置の各手段として機能させるためのプログラム。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016233499A JP6727106B2 (ja) | 2016-11-30 | 2016-11-30 | 画像音響処理装置および画像音響処理方法、プログラム |
US15/826,038 US10291875B2 (en) | 2016-11-30 | 2017-11-29 | Signal processing apparatus and method of generating audio signal |
US16/382,246 US10708536B2 (en) | 2016-11-30 | 2019-04-12 | Signal processing apparatus and method of generating audio signal |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016233499A JP6727106B2 (ja) | 2016-11-30 | 2016-11-30 | 画像音響処理装置および画像音響処理方法、プログラム |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2018093312A JP2018093312A (ja) | 2018-06-14 |
JP2018093312A5 JP2018093312A5 (ja) | 2019-07-04 |
JP6727106B2 true JP6727106B2 (ja) | 2020-07-22 |
Family
ID=62190586
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016233499A Active JP6727106B2 (ja) | 2016-11-30 | 2016-11-30 | 画像音響処理装置および画像音響処理方法、プログラム |
Country Status (2)
Country | Link |
---|---|
US (2) | US10291875B2 (ja) |
JP (1) | JP6727106B2 (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10600245B1 (en) * | 2014-05-28 | 2020-03-24 | Lucasfilm Entertainment Company Ltd. | Navigating a virtual environment of a media content item |
JP7146472B2 (ja) * | 2018-06-18 | 2022-10-04 | キヤノン株式会社 | 情報処理装置、情報処理方法及びプログラム |
JP7229040B2 (ja) | 2019-02-15 | 2023-02-27 | キヤノン株式会社 | 情報処理装置及びその制御方法、プログラム |
JP7458889B2 (ja) * | 2020-05-08 | 2024-04-01 | キヤノン株式会社 | 画像表示装置、制御方法、およびプログラム |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8591332B1 (en) * | 2008-05-05 | 2013-11-26 | Activision Publishing, Inc. | Video game video editor |
JP5858380B2 (ja) * | 2010-12-03 | 2016-02-10 | 国立大学法人名古屋大学 | 仮想視点画像合成方法及び仮想視点画像合成システム |
US8970666B2 (en) * | 2011-09-16 | 2015-03-03 | Disney Enterprises, Inc. | Low scale production system and method |
US9437247B2 (en) * | 2011-11-14 | 2016-09-06 | Apple Inc. | Preview display for multi-camera media clips |
JP2013135465A (ja) * | 2011-12-27 | 2013-07-08 | Sony Corp | 音響信号処理装置、音響信号処理方法、プログラムおよび信号処理システム |
EP2860699A1 (en) * | 2013-10-11 | 2015-04-15 | Telefonaktiebolaget L M Ericsson (Publ) | Technique for view synthesis |
WO2015162947A1 (ja) * | 2014-04-22 | 2015-10-29 | ソニー株式会社 | 情報再生装置及び情報再生方法、並びに情報記録装置及び情報記録方法 |
JP2016025633A (ja) | 2014-07-24 | 2016-02-08 | ソニー株式会社 | 情報処理装置、管理装置、情報処理方法、およびプログラム |
-
2016
- 2016-11-30 JP JP2016233499A patent/JP6727106B2/ja active Active
-
2017
- 2017-11-29 US US15/826,038 patent/US10291875B2/en active Active
-
2019
- 2019-04-12 US US16/382,246 patent/US10708536B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
US10708536B2 (en) | 2020-07-07 |
JP2018093312A (ja) | 2018-06-14 |
US20180152660A1 (en) | 2018-05-31 |
US20190238789A1 (en) | 2019-08-01 |
US10291875B2 (en) | 2019-05-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
RU2745414C2 (ru) | Устройство обработки информации, способ генерации изображения, способ управления и носитель данных | |
JP6727106B2 (ja) | 画像音響処理装置および画像音響処理方法、プログラム | |
US20230402067A1 (en) | Integration of audio into a multi-view interactive digital media representation | |
JP4148671B2 (ja) | 表示画像制御処理装置、動画像情報送受信システム、および表示画像制御処理方法、動画像情報送受信方法、並びにコンピュータ・プログラム | |
CN101807393B (zh) | Ktv系统及其实现方法、电视机 | |
JP2022536182A (ja) | データストリームを同期させるシステム及び方法 | |
JP2008312061A (ja) | 画像処理装置、その処理方法およびプログラム | |
JP6882057B2 (ja) | 信号処理装置、信号処理方法、およびプログラム | |
KR20100017242A (ko) | 파노라마식 사운드 이미지를 생성하고 재생하는 방법과, 그러한 이미지를 재생하기 위한 장치 | |
JP2006041886A (ja) | 情報処理装置および方法、記録媒体、並びにプログラム | |
JP6812181B2 (ja) | 画像処理装置、画像処理方法、及び、プログラム | |
JP2010258768A (ja) | 画像表示装置及びその制御方法、並びにプログラム及び記憶媒体 | |
KR20180080642A (ko) | 음원과 동기화되는 동영상을 편집하는 방법 | |
JP5115799B2 (ja) | 画像処理装置および方法、並びにプログラム | |
KR101752691B1 (ko) | 시점 선택이 가능한 3차원 가상 콘텐츠 동영상을 제공하는 장치 및 그 방법 | |
JP2016513390A (ja) | 2d−3d複合次元コンテンツファイルを用いた複合次元コンテンツサービス提供システム、そのサービス提供方法及びその複合次元コンテンツファイル | |
JP7524907B2 (ja) | 情報処理装置、提案装置、情報処理方法および提案方法 | |
JP7065708B2 (ja) | 録画再生装置及びプログラム | |
JP6110731B2 (ja) | ジェスチャーによるコマンド入力識別システム | |
CN112995692A (zh) | 互动数据处理方法、装置、设备及介质 | |
EP4350626A1 (en) | Image processing system, method for controlling the same, and program | |
KR20140104121A (ko) | 복합 차원 콘텐츠 제공 시스템, 그 제공 방법 및 복합 차원 콘텐츠 파일 | |
JP5687961B2 (ja) | 同期再生装置及び同期再生方法 | |
WO2022269788A1 (ja) | 伝送システム、送信システム、受信システム及び伝送方法 | |
KR102625045B1 (ko) | 영상 편집 장치, 영상 편집 방법 및 컴퓨터 프로그램 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190528 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190528 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20200124 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20200217 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20200403 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200513 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20200601 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20200630 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 6727106 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |