JP5618043B2 - 映像音響処理システム、映像音響処理方法及びプログラム - Google Patents
映像音響処理システム、映像音響処理方法及びプログラム Download PDFInfo
- Publication number
- JP5618043B2 JP5618043B2 JP2009220199A JP2009220199A JP5618043B2 JP 5618043 B2 JP5618043 B2 JP 5618043B2 JP 2009220199 A JP2009220199 A JP 2009220199A JP 2009220199 A JP2009220199 A JP 2009220199A JP 5618043 B2 JP5618043 B2 JP 5618043B2
- Authority
- JP
- Japan
- Prior art keywords
- video
- sound source
- audio
- signal
- dimensional space
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S5/00—Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation
- H04S5/02—Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation of the pseudo four-channel type, e.g. in which rear channel signals are derived from two-channel stereo signals
Landscapes
- Stereophonic System (AREA)
- Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
Description
そこで、本発明は上記課題に鑑みて発明されたものであって、映像中の注目領域に対する注目処理を行う際、違和感のない音響を再生する映像音響処理システム、映像音響処理方法及びプログラムを提供することにある。
<第1の実施の形態>
第1の実施の形態を説明する。
<第2の実施の形態>
第2の実施の形態を説明する。
<第3の実施の形態>
第3の実施の形態を説明する。
<第4の実施の形態>
第4の実施の形態を説明する。
<第5の実施の形態>
第5の実施の形態を説明する。
<第6の実施の形態>
第6の実施の形態を説明する。
<第7の実施の形態>
第7の実施の形態を説明する。
2 マイク
3 映像データ記憶部
4 注目領域指定部
5 音源位置推定部
6 仮想視聴点算出部
7 映像注目部
8 音響合成部
9 映像音響処理部
11 伝送部
21 音源位置推定部
22 ビデオオブジェクト分離部
23 オーディオオブジェクト分離部
24 統合部
25 AV対応付け部
26 3次元位置推定部
31 音源位置推定部
32 ビデオオブジェクト分離部
33 オーディオオブジェクト分離部
34 映像種類判別部
35 音響種類判別部
36 AV種類照合部
37 3次元位置推定部
41 音源位置推定部
42 ビデオオブジェクト分離部
43 オーディオオブジェクト分離部
44 映像種類判別部
45 3次元位置推定部
51 音源位置推定部
52 オーディオオブジェクト分離部
53 ビデオオブジェクト分離部
54 音響種類判別部
55 3次元位置推定部
61 音源位置推定部
62 オーディオオブジェクト分離部
63 人物検出部
64 動き検出部
65 AV相関照合部
66 3次元位置推定部
67 音声区間検出部
Claims (13)
- コンテンツのオーディオ信号からオーディオオブジェクトを分離し、前記コンテンツの映像信号からビデオオブジェクトを分離し、前記ビデオオブジェクトと前記オーディオオブジェクトとを対応付け、音源となるビデオオブジェクトの3次元空間の位置を算出することにより、音源の音源位置と前記音源位置に対応した音源信号とを算出する音源位置推定部と、
前記映像中の指定した注目領域に視聴者が注目した場合における視聴者の仮想視聴位置を算出する仮想視聴点算出部と、
前記音源位置と前記音源信号とに基づいて、前記仮想視聴位置を聴点位置とする音響信号を合成する音響合成部と
を有し、
前記仮想視聴点算出部は、前記映像中の各ビデオオブジェクトの原視聴位置からの距離のうち、前記原視聴位置から最も近い距離に、前記注目領域が存在する仮想平面を想定し、原視聴位置を中心とする3次元空間における前記仮想視聴位置の位置を算出する
映像音響処理システム。 - 前記音源位置推定部は、
映像信号からビデオオブジェクトを分離するビデオオブジェクト分離部と、
オーディオ信号からオーディオオブジェクトを分離するオーディオオブジェクト分離部と、
前記ビデオオブジェクトと前記オーディオオブジェクトとを対応付け、前記ビデオオブジェクトと対応する前記オーディオオブジェクトの信号を音源信号として出力する対応付け部と、
前記対応付けされたビデオオブジェクトの3次元空間の位置を算出し、算出されたビデオオブジェクトの3次元空間の位置に基づいて、前記ビデオオブジェクトに対応するオーディオオブジェクトの3次元位置を算出し、この位置を音源位置として出力する3次元位置推定部と
を有する請求項1に記載の映像音響処理システム。 - 前記音源位置推定部は、
映像信号からビデオオブジェクトを分離するビデオオブジェクト分離部と、
オーディオ信号からオーディオオブジェクトを分離するオーディオオブジェクト分離部と、
前記分離されたビデオオブジェクトの種類を判別する映像判別部と、
前記分離されたオーディオオブジェクトの種類を判別する音響種類判別部と、
前記ビデオオブジェクトの種類と前記オーディオオブジェクトの種類とを照合して対応付けを行い、前記ビデオオブジェクトと対応する前記オーディオオブジェクトの信号を音源信号として出力するAV種類照合部と、
前記照合されたビデオオブジェクトの3次元空間内の位置を算出し、算出されたビデオオブジェクトの3次元空間の位置に基づいて、前記ビデオオブジェクトに対応するオーディオオブジェクトの3次元空間の位置を算出し、この位置を音源位置として出力する3次元位置推定部と
を有する請求項1に記載の映像音響処理システム。 - 前記音源位置推定部は、
映像信号からビデオオブジェクトを分離するビデオオブジェクト分離部と、
前記分離されたビデオオブジェクトの種類を判別し、音源となりうるビデオオブジェクトを判別する映像判別部と、
前記音源となりうるビデオオブジェクトの3次元空間の位置を算出し、この3次元空間内の位置をオーディオオブジェクトの3次元空間の位置として算出し、この位置を音源位置として出力する3次元位置推定部と、
オーディオ信号と、前記音源となりうるビデオオブジェクトの3次元空間の位置とを用いて、オーディオオブジェクトを分離し、分離したオーディオオブジェクトの信号を音源信号として出力するオーディオオブジェクト分離部と
を有する請求項1に記載の映像音響処理システム。 - 前記音源位置推定部は、
オーディオ信号からオーディオオブジェクトを分離するオーディオオブジェクト分離部と、
前記オーディオオブジェクトの種類を判別する音響種類判別部と、
ビデオ信号と前記オーディオオブジェクトの種類とを用いて、ビデオオブジェクトを分離するビデオオブジェクト分離部と、
前記ビデオオブジェクトの3次元空間の位置を算出し、この3次元空間内の位置をオーディオオブジェクトの3次元空間の位置として算出し、この位置を音源位置として出力する3次元位置推定部と
を有する請求項1に記載の映像音響処理システム。 - 前記音源位置推定部は、
オーディオ信号からオーディオオブジェクトを分離するオーディオオブジェクト分離部と、
前記オーディオオブジェクト信号から音声区間を検出する音声区間検出部と、
ビデオ信号からビデオオブジェクトとして人物領域を検出する人物検出部と、
前記人物領域内の動き量を算出する動き検出部と、
前記音声区間と、前記動き量との相関を用いてオーディオオブジェクトとビデオオブジェクトとを照合して対応付し、対応付けられたオーディオオブジェクトの信号を音源信号として出力するAV相関照合部と、
前記ビデオオブジェクトの3次元空間の位置を算出し、この3次元空間内の位置をオーディオオブジェクトの3次元空間の位置として算出し、この位置を音源位置として出力する3次元位置推定部と
を有する請求項1に記載の映像音響処理システム。 - 映像中の前記注目領域を指定する注目領域指定部を有する請求項1から請求項6のいずれかに記載の映像音響処理システム。
- コンテンツのオーディオ信号からオーディオオブジェクトを分離し、前記コンテンツの映像信号からビデオオブジェクトを分離し、前記ビデオオブジェクトと前記オーディオオブジェクトとを対応付け、音源となるビデオオブジェクトの3次元空間の位置を算出することにより、音源の音源位置と前記音源位置に対応する音源信号とを算出し、
前記映像中の指定した注目領域に視聴者が注目した場合における視聴者の仮想視聴位置を算出し、
前記音源位置と前記音源信号とに基づいて、前記仮想視聴位置を聴点位置とする音響信号を合成し、
前記仮想視聴点の算出は、前記映像中の各ビデオオブジェクトの原視聴位置からの距離のうち、前記原視聴位置から最も近い距離に、前記注目領域が存在する仮想平面を想定し、原視聴位置を中心とする3次元空間における前記仮想視聴位置の位置を算出する
映像音響処理方法。 - 前記音源位置の推定は、
映像信号からビデオオブジェクトを分離し、
オーディオ信号からオーディオオブジェクトを分離し、
前記ビデオオブジェクトと前記オーディオオブジェクトとを対応付け、前記ビデオオブジェクトと対応する前記オーディオオブジェクトの信号を音源信号として算出し、
前記対応付けされたビデオオブジェクトの3次元空間の位置を算出し、算出されたビデオオブジェクトの3次元空間の位置に基づいて、前記ビデオオブジェクトに対応するオーディオオブジェクトの3次元位置を算出し、この位置を音源位置とする
請求項8に記載の映像音響処理方法。 - 前記音源位置の推定は、
映像信号からビデオオブジェクトを分離し、
オーディオ信号からオーディオオブジェクトを分離し、
前記分離されたビデオオブジェクトの種類を判別し、
前記分離されたオーディオオブジェクトの種類を判別し、
前記ビデオオブジェクトの種類と前記オーディオオブジェクトの種類とを照合して対応付けを行い、前記ビデオオブジェクトと対応する前記オーディオオブジェクトの信号を音源信号とし、
前記照合されたビデオオブジェクトの3次元空間内の位置を算出し、算出されたビデオオブジェクトの3次元空間の位置に基づいて、前記ビデオオブジェクトに対応するオーディオオブジェクトの3次元空間の位置を算出し、この位置を音源位置とする
請求項8に記載の映像音響処理方法。 - 前記音源位置の推定は、
映像信号からビデオオブジェクトを分離し、
前記分離されたビデオオブジェクトの種類を判別し、音源となりうるビデオオブジェクトを判別し、
前記音源となりうるビデオオブジェクトの3次元空間の位置を算出し、この3次元空間内の位置をオーディオオブジェクトの3次元空間の位置として算出し、この位置を音源位置とし、
オーディオ信号と、前記音源となりうるビデオオブジェクトの3次元空間の位置とを用いて、オーディオオブジェクトを分離し、分離したオーディオオブジェクトの信号を音源信号とする
請求項8に記載の映像音響処理方法。 - 前記音源位置の推定は、
オーディオ信号からオーディオオブジェクトを分離し、
前記オーディオオブジェクトの種類を判別し、
ビデオ信号と前記オーディオオブジェクトの種類とを用いて、ビデオオブジェクトを分離し、
前記ビデオオブジェクトの3次元空間の位置を算出し、この3次元空間内の位置をオーディオオブジェクトの3次元空間の位置として算出し、この位置を音源位置とする
請求項8に記載の映像音響処理方法。 - 前記音源位置の推定は、
オーディオ信号からオーディオオブジェクトを分離し、
前記オーディオオブジェクト信号から音声区間を検出し、
ビデオ信号からビデオオブジェクトとして人物領域を検出し、
前記人物領域内の動き量を算出し、
前記音声区間と、前記動き量との相関を用いてオーディオオブジェクトとビデオオブジェクトとを照合して対応付し、対応付けられたオーディオオブジェクトの信号を音源信号として算出し、
前記ビデオオブジェクトの3次元空間の位置を算出し、この3次元空間内の位置をオーディオオブジェクトの3次元空間の位置として算出し、この位置を音源位置とする
請求項8に記載の映像音響処理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009220199A JP5618043B2 (ja) | 2009-09-25 | 2009-09-25 | 映像音響処理システム、映像音響処理方法及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009220199A JP5618043B2 (ja) | 2009-09-25 | 2009-09-25 | 映像音響処理システム、映像音響処理方法及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2011071685A JP2011071685A (ja) | 2011-04-07 |
JP5618043B2 true JP5618043B2 (ja) | 2014-11-05 |
Family
ID=44016535
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009220199A Active JP5618043B2 (ja) | 2009-09-25 | 2009-09-25 | 映像音響処理システム、映像音響処理方法及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5618043B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP4080907A4 (en) * | 2019-12-18 | 2023-06-21 | Sony Group Corporation | INFORMATION PROCESSING DEVICE AND INFORMATION PROCESSING METHOD |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2012143745A1 (en) * | 2011-04-21 | 2012-10-26 | Sony Ericsson Mobile Communications Ab | Method and system for providing an improved audio experience for viewers of video |
CN104025188B (zh) * | 2011-12-29 | 2016-09-07 | 英特尔公司 | 声学信号修改 |
KR101674187B1 (ko) * | 2015-06-11 | 2016-11-09 | 서울과학기술대학교 산학협력단 | 광대역 보간법을 위한 입체음향 획득 장치 및 그 방법 |
JP6507946B2 (ja) | 2015-08-31 | 2019-05-08 | 富士通株式会社 | 映像音声再生装置、映像音声再生方法、及びプログラム |
US10235010B2 (en) | 2016-07-28 | 2019-03-19 | Canon Kabushiki Kaisha | Information processing apparatus configured to generate an audio signal corresponding to a virtual viewpoint image, information processing system, information processing method, and non-transitory computer-readable storage medium |
JP6664456B2 (ja) * | 2018-09-20 | 2020-03-13 | キヤノン株式会社 | 情報処理システム及びその制御方法、コンピュータプログラム |
JP7116424B2 (ja) * | 2019-03-06 | 2022-08-10 | Kddi株式会社 | 画像に応じて音オブジェクトを混合するプログラム、装置及び方法 |
WO2022065981A1 (ko) * | 2020-09-28 | 2022-03-31 | 삼성전자 주식회사 | 동영상 처리 장치 및 방법 |
Family Cites Families (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002369129A (ja) * | 2001-06-06 | 2002-12-20 | Canon Inc | 画像処理装置、画像処理方法、画像処理プログラム及び画像処理プログラムが記憶されたコンピュータにより読み取り可能な記憶媒体 |
JP2003032776A (ja) * | 2001-07-17 | 2003-01-31 | Matsushita Electric Ind Co Ltd | 再生システム |
JP2003284196A (ja) * | 2002-03-20 | 2003-10-03 | Sony Corp | 音像定位信号処理装置および音像定位信号処理方法 |
JP4295470B2 (ja) * | 2002-05-08 | 2009-07-15 | 日本放送協会 | コンテンツ提供システム、コンテンツ受信装置、コンテンツ提供方法、コンテンツ受信方法、コンテンツ提供プログラムおよびコンテンツ受信プログラム |
JP2003348700A (ja) * | 2002-05-28 | 2003-12-05 | Victor Co Of Japan Ltd | 臨場感信号の生成方法、及び臨場感信号生成装置 |
JP2005005949A (ja) * | 2003-06-11 | 2005-01-06 | Matsushita Electric Ind Co Ltd | 伝達関数補間方法 |
JP2005295181A (ja) * | 2004-03-31 | 2005-10-20 | Victor Co Of Japan Ltd | 音声情報生成装置 |
JP2006128818A (ja) * | 2004-10-26 | 2006-05-18 | Victor Co Of Japan Ltd | 立体映像・立体音響対応記録プログラム、再生プログラム、記録装置、再生装置及び記録メディア |
JP4853149B2 (ja) * | 2005-09-14 | 2012-01-11 | ソニー株式会社 | 画像処理装置、画像表示装置、画像処理方法、プログラムおよび記録媒体 |
JP4940671B2 (ja) * | 2006-01-26 | 2012-05-30 | ソニー株式会社 | オーディオ信号処理装置、オーディオ信号処理方法及びオーディオ信号処理プログラム |
JP2007266967A (ja) * | 2006-03-28 | 2007-10-11 | Yamaha Corp | 音像定位装置およびマルチチャンネルオーディオ再生装置 |
JP5230096B2 (ja) * | 2006-12-27 | 2013-07-10 | キヤノン株式会社 | 映像音声出力装置及び映像音声出力方法 |
JP2009038605A (ja) * | 2007-08-01 | 2009-02-19 | Sony Corp | 音声信号生成装置、音声信号生成方法、音声信号生成プログラム並びに音声信号を記録した記録媒体 |
-
2009
- 2009-09-25 JP JP2009220199A patent/JP5618043B2/ja active Active
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP4080907A4 (en) * | 2019-12-18 | 2023-06-21 | Sony Group Corporation | INFORMATION PROCESSING DEVICE AND INFORMATION PROCESSING METHOD |
Also Published As
Publication number | Publication date |
---|---|
JP2011071685A (ja) | 2011-04-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5618043B2 (ja) | 映像音響処理システム、映像音響処理方法及びプログラム | |
US9749738B1 (en) | Synthesizing audio corresponding to a virtual microphone location | |
US10045120B2 (en) | Associating audio with three-dimensional objects in videos | |
US10074012B2 (en) | Sound and video object tracking | |
CN109313904B (zh) | 视频音频处理设备和方法以及存储介质 | |
JP6464449B2 (ja) | 音源分離装置、及び音源分離方法 | |
JP4973188B2 (ja) | 映像分類装置、映像分類プログラム、映像検索装置、および映像検索プログラム | |
US20180295463A1 (en) | Distributed Audio Capture and Mixing | |
JP7347597B2 (ja) | 動画編集装置、動画編集方法及びプログラム | |
GB2414369A (en) | Processing audio data | |
TWI588590B (zh) | 影像產生系統及影像產生方法 | |
Oldfield et al. | Object-based audio for interactive football broadcast | |
JP7469235B2 (ja) | 音源の位置特定 | |
US20190155483A1 (en) | Information processing apparatus, configured to generate an audio signal corresponding to a virtual viewpoint image, information processing system, information processing method, and non-transitory computer-readable storage medium | |
JP2011205599A (ja) | 信号処理装置 | |
KR101244789B1 (ko) | 3차원 재구성을 이용한 디지털 만화 콘텐츠 생성 방법 | |
CN108781310A (zh) | 使用视频的图像来选择要增强的视频的音频流 | |
JP2008197650A (ja) | 音データ記録再生装置および音データ記録再生方法 | |
JP5435221B2 (ja) | 音源信号分離装置、音源信号分離方法及びプログラム | |
Arnaud et al. | The CAVA corpus: synchronised stereoscopic and binaural datasets with head movements | |
JP6016277B2 (ja) | 映像音響処理システム、映像音響処理方法及びプログラム | |
JP2005295181A (ja) | 音声情報生成装置 | |
EP4080907A1 (en) | Information processing device and information processing method | |
JP6456171B2 (ja) | 情報処理装置、情報処理方法及びプログラム | |
JP2008090570A (ja) | 情報処理装置及び情報処理方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20120806 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20131004 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20131016 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20131212 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140604 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140731 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140820 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140902 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5618043 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |