JP5198530B2 - 音声付き動画像呈示装置、方法およびプログラム - Google Patents
音声付き動画像呈示装置、方法およびプログラム Download PDFInfo
- Publication number
- JP5198530B2 JP5198530B2 JP2010217568A JP2010217568A JP5198530B2 JP 5198530 B2 JP5198530 B2 JP 5198530B2 JP 2010217568 A JP2010217568 A JP 2010217568A JP 2010217568 A JP2010217568 A JP 2010217568A JP 5198530 B2 JP5198530 B2 JP 5198530B2
- Authority
- JP
- Japan
- Prior art keywords
- sound
- moving image
- unit
- time difference
- arrival time
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S7/00—Indicating arrangements; Control arrangements, e.g. balance control
- H04S7/30—Control circuits for electronic adaptation of the sound field
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2430/00—Signal processing covered by H04R, not provided for in its groups
- H04R2430/20—Processing of the output signals of the acoustic transducers of an array for obtaining a desired directivity characteristic
- H04R2430/23—Direction finding using a sum-delay beam-former
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2499/00—Aspects covered by H04R or H04S not otherwise provided for in their subgroups
- H04R2499/10—General applications
- H04R2499/15—Transducers incorporated in visual displaying devices, e.g. televisions, computer displays, laptops
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R29/00—Monitoring arrangements; Testing arrangements
- H04R29/004—Monitoring arrangements; Testing arrangements for microphones
- H04R29/005—Microphone arrays
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
- H04S2400/11—Positioning of individual sound objects, e.g. moving airplane, within a sound field
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
- H04S2400/15—Aspects of sound capture and related signal processing for recording or reproduction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2420/00—Techniques used stereophonic systems covered by H04S but not provided for in its groups
- H04S2420/01—Enhancing the perception of the sound image or of the spatial distribution using head related transfer functions [HRTF's] or equivalents thereof, e.g. interaural time difference [ITD] or interaural level difference [ILD]
Description
φx=tan−1(x1/f) ・・・(1)
φy=tan−1(y1/f) ・・・(2)
φ=sin−1(T・Vs/d)
→ T=d・sin(φ)/Vs ・・・(3)
Tm=d/Vs ・・・(4)
y2+z2=x2・tan2(φ):面(音源存在範囲)111の式
z=f’:撮像面105上にあるという拘束条件
→ y2=x2・tan2(φ)−f2 ・・・(5)
以上のような仮定に基づいて構成された第1の実施形態の音声付き動画像呈示装置の機能ブロック構成を図4に示す。本実施形態の音声付き動画像呈示装置は、図4に示すように、入力部1と、設定部2と、主ビームフォーマ部3と、出力制御部4とを備える。また、本実施形態の音声付き動画像呈示装置には、動画像を表示するための表示部12と、利用者24の操作入力を受け付けるタッチパネル13とが設けられている。
Tm’=d’/Vs ・・・(6)
φ’=sin−1(T・Vs/d’) ・・・(7)
α=T/Tm’=T・Vs/d’ ・・・(8)
φ’=sin−1(α) ・・・(9)
T=α・Tm’=α・d’/Vs ・・・(10)
T=d’・sin(φ’)/Vs ・・・(11)
次に、第2の実施形態の音声付き動画像呈示装置について説明する。本実施形態の音声付き動画像呈示装置には、指向性音声Sbとともに出力される動画像の中で、利用者24が強調された音声の発生源として指定した対象の位置座標と、設定部2が設定した到達時間差Tとの関係を定めるキャリブレーションパラメータを計算する機能が設けられている。
f’=x1/tan(φx)=x1/tan(sin−1(T・Vs/d’)) ・・・(12)
f’2=x12・tan2(φ’)−y12
=x12・tan2(sin−1(T・Vs/d’))−y12 ・・・(13)
次に、第3の実施形態の音声付き動画像呈示装置について説明する。本実施形態の音声付き動画像呈示装置には、利用者24が指定した音響指向性中心の向いている対象(被写体)を動画像中で追跡し、仮想的な焦点距離f’(キャリブレーションパラメータ)を用いて、音響指向性中心をこの利用者24が指定した対象に向け続けるように到達時間差Tを変更する機能が設けられている。
次に、第4の実施形態の音声付き動画像呈示装置について説明する。本実施形態の音声付き動画像呈示装置には、音声付き動画像の撮影時におけるズーム変化を音響的に検知してこれに対処する機能が設けられている。
次に、第5の実施形態の音声付き動画像呈示装置について説明する。本実施形態の音声付き動画像呈示装置には、主ビームフォーマ部3により生成される指向性音声Sbと元のステレオ音声Sl,Srを混合し、このときの指向性音声Sbとステレオ音声Sl,Srの混合比(すなわち指向性音声Sbを強調する程度)を利用者24が調整できる機能が設けられている。
Ol=β・Sb+(1−β)・Sl ・・・(14)
Or=β・Sb+(1−β)・Sr ・・・(15)
以上、第1乃至第5の実施形態の音声付き動画像呈示装置について説明したが、利用者24が到達時間差Tの設定や、動画像中の対象(被写体)の指定、強調の程度の設定などを行うためのユーザインタフェースは、上述した各実施形態にて例示したものに限定されるものではない。また、上述した各実施形態の音声付き動画像呈示装置は、利用者24が音声付き動画像の再生(視聴)を指示するための再生ボタン、再生を一時的に停止するための一時停止ボタン、再生を停止するための停止ボタン、早送りするための早送りボタン、巻き戻しするための巻き戻しボタン、音量を調節するための音量つまみなど、音声付き動画像を視聴する際に利用者24が操作する一通りの操作部が必要であり、これら操作部と一体となったユーザインタフェースを設けることが望ましい。以下では、上述した各実施形態の音声付き動画像呈示装置のユーザインタフェースとして好適なユーザインタフェース画面の具体例について説明する。
なお、上述した各実施形態の音声付き動画像呈示装置は、汎用的なコンピュータシステムに、上述した各部(入力部1、設定部2、主ビームフォーマ部3、出力制御部4など)の処理を実行する機能を実現するための音声付き動画像呈示プログラムを実装することで実現することも可能である。この場合のコンピュータシステムの構成例を図22に示す。
なお、上述した各実施形態の音声付き動画像呈示装置は、同時に収録された複数チャンネルの音声から、例えば選択された2チャンネルの音声を処理することで指向性音声Sbを生成して動画像とともに視聴できるようにした例であったが、nチャンネルの同時収録音声に対して、基準となる1つのチャンネルに対する他のn−1個のチャンネルの到達時間差T1〜Tn−1を、利用者24の操作に応じて設定部2が設定するようにすることで、3チャンネル以上の同時に収録された音声から所望の指向性音声Sbを生成して、動画像とともに呈示する構成とすることも可能である。
2 設定部
3 主ビームフォーマ部
4 出力制御部
5 取得部
6 キャリブレーション部
7 対象追跡部
8,9 副ビームフォーマ部
10 再キャリブレーション部
116 音響指向性中心マーク
T 到達時間差
Sl,Sr ステレオ音声
Sb 指向性音声
f’ キャリブレーションパラメータ
Claims (10)
- 複数チャンネルの音声と動画像とを含む音声付き動画像データを入力する入力部と、
利用者の操作に応じて、所望の方向から到達する音声の複数チャンネル間における時間差である到達時間差を設定する設定部と、
前記設定部が設定した到達時間差に基づいて複数チャンネルの音声の遅延量を設定し、前記到達時間差を持つ方向の音声を強調した音声である指向性音声を、前記音声付き動画像データに含まれる複数チャンネルの音声から生成する主ビームフォーマ部と、
前記指向性音声を前記動画像とともに出力する出力制御部と、を備えることを特徴とする音声付き動画像呈示装置。 - 前記指向性音声とともに出力される動画像の中で、強調された音声の発生源として指定された対象の位置座標を取得する取得部と、
前記取得部が取得した位置座標と、前記設定部が設定した到達時間差との関係を定めるキャリブレーションパラメータを計算するキャリブレーション部と、をさらに備えることを特徴とする請求項1に記載の音声付き動画像呈示装置。 - 前記対象を前記動画像中で追跡し、前記キャリブレーションパラメータを用いて、音声を強調する方向を前記対象に向け続けるように前記到達時間差を変更する対象追跡部をさらに備えることを特徴とする請求項2に記載の音声付き動画像呈示装置。
- 前記主ビームフォーマ部が強調する音声の方向に対して所定量ずれた方向の音声を強調した音声を生成する副ビームフォーマ部と、
前記指向性音声の出力パワーと前記副ビームフォーマ部が生成する音声の出力パワーとを比較して、前記副ビームフォーマ部が生成する音声の出力パワーが前記指向性音声の出力パワーよりも優位になった場合に、前記主ビームフォーマ部が強調する音声の方向を前記所定量シフトさせるとともに、前記キャリブレーションパラメータを再計算する再キャリブレーション部と、をさらに備えることを特徴とする請求項2または3に記載の音声付き動画像呈示装置。 - 前記出力制御部は、前記主ビームフォーマ部が強調する音声の方向の範囲を示すマークを、前記動画像上に重ねて出力することを特徴とする請求項2〜4のいずれか一項に記載の音声付き動画像呈示装置。
- 前記動画像とともに表示される第1スライドバーに対する前記利用者の操作を受け付けるタッチパネルをさらに備え、
前記設定部は、前記利用者による前記第1スライドバーの操作に応じて、前記到達時間差を設定することを特徴とする請求項1〜5のいずれか一項に記載の音声付き動画像呈示装置。 - 前記タッチパネルは、前記動画像とともに表示される第2スライドバーに対する前記利用者の操作をさらに受け付け、
前記設定部は、前記利用者による前記第2スライドバーの操作に応じて、前記指向性音声の程度をさらに設定することを特徴とする請求項6に記載の音声付き動画像呈示装置。 - 前記キャリブレーション部で計算されたキャリブレーションパラメータは、仮想的なマイク間距離に対応する仮想的な焦点距離を含み、
前記仮想的なマイク間距離および前記仮想的な焦点距離を記録する記録部をさらに備えることを特徴とする請求項2に記載の音声付き動画像呈示装置。 - 複数チャンネルの音声と動画像とを含む音声付き動画像データを入力するステップと、
利用者の操作に応じて、所望の方向から到達する音声の複数チャンネル間における時間差である到達時間差を設定するステップと、
設定した到達時間差に基づいて複数チャンネルの音声の遅延量を設定し、前記到達時間差を持つ方向の音声を強調した音声である指向性音声を、前記音声付き動画像データに含まれる複数チャンネルの音声から生成するステップと、
前記指向性音声を前記動画像とともに出力するステップと、を含むことを特徴とする音声付き動画像呈示方法。 - コンピュータに、
複数チャンネルの音声と動画像とを含む音声付き動画像データを入力する機能と、
利用者の操作に応じて、所望の方向から到達する音声の複数チャンネル間における時間差である到達時間差を設定する機能と、
設定した到達時間差に基づいて複数チャンネルの音声の遅延量を設定し、前記到達時間差を持つ方向の音声を強調した音声である指向性音声を、前記音声付き動画像データに含まれる複数チャンネルの音声から生成する機能と、
前記指向性音声を前記動画像とともに出力する機能と、を実現させるための音声付き動画像呈示プログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010217568A JP5198530B2 (ja) | 2010-09-28 | 2010-09-28 | 音声付き動画像呈示装置、方法およびプログラム |
US13/189,657 US8837747B2 (en) | 2010-09-28 | 2011-07-25 | Apparatus, method, and program product for presenting moving image with sound |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010217568A JP5198530B2 (ja) | 2010-09-28 | 2010-09-28 | 音声付き動画像呈示装置、方法およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012074880A JP2012074880A (ja) | 2012-04-12 |
JP5198530B2 true JP5198530B2 (ja) | 2013-05-15 |
Family
ID=45870677
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010217568A Expired - Fee Related JP5198530B2 (ja) | 2010-09-28 | 2010-09-28 | 音声付き動画像呈示装置、方法およびプログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US8837747B2 (ja) |
JP (1) | JP5198530B2 (ja) |
Families Citing this family (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10154361B2 (en) * | 2011-12-22 | 2018-12-11 | Nokia Technologies Oy | Spatial audio processing apparatus |
EP2825898A4 (en) * | 2012-03-12 | 2015-12-09 | Nokia Technologies Oy | TREATMENT OF A SOUND SOURCE |
CN104412616B (zh) * | 2012-04-27 | 2018-01-16 | 索尼移动通讯有限公司 | 基于麦克风阵列中的声音的相关性的噪声抑制 |
KR101969802B1 (ko) * | 2012-06-25 | 2019-04-17 | 엘지전자 주식회사 | 이동 단말기 및 재생 영상의 오디오 줌잉 방법 |
EP2680616A1 (en) | 2012-06-25 | 2014-01-01 | LG Electronics Inc. | Mobile terminal and audio zooming method thereof |
WO2014080074A1 (en) * | 2012-11-20 | 2014-05-30 | Nokia Corporation | Spatial audio enhancement apparatus |
JP5866504B2 (ja) * | 2012-12-27 | 2016-02-17 | パナソニックIpマネジメント株式会社 | 音声処理システム及び音声処理方法 |
EP2958339B1 (en) * | 2013-02-15 | 2019-09-18 | Panasonic Intellectual Property Management Co., Ltd. | Directionality control system and directionality control method |
DE102013105375A1 (de) | 2013-05-24 | 2014-11-27 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Tonsignalerzeuger, Verfahren und Computerprogramm zum Bereitstellen eines Tonsignals |
KR102150013B1 (ko) | 2013-06-11 | 2020-08-31 | 삼성전자주식회사 | 음향신호를 위한 빔포밍 방법 및 장치 |
GB2516056B (en) * | 2013-07-09 | 2021-06-30 | Nokia Technologies Oy | Audio processing apparatus |
US9596437B2 (en) * | 2013-08-21 | 2017-03-14 | Microsoft Technology Licensing, Llc | Audio focusing via multiple microphones |
US9402095B2 (en) * | 2013-11-19 | 2016-07-26 | Nokia Technologies Oy | Method and apparatus for calibrating an audio playback system |
US9271077B2 (en) * | 2013-12-17 | 2016-02-23 | Personics Holdings, Llc | Method and system for directional enhancement of sound using small microphone arrays |
TWI494680B (zh) * | 2014-01-28 | 2015-08-01 | Altek Semiconductor Corp | 影像擷取裝置及其影像形變校正方法 |
KR102154528B1 (ko) * | 2014-02-03 | 2020-09-10 | 엘지전자 주식회사 | 이동 단말기 및 그 제어 방법 |
EP2942975A1 (en) * | 2014-05-08 | 2015-11-11 | Panasonic Corporation | Directivity control apparatus, directivity control method, storage medium and directivity control system |
US9414153B2 (en) * | 2014-05-08 | 2016-08-09 | Panasonic Intellectual Property Management Co., Ltd. | Directivity control apparatus, directivity control method, storage medium and directivity control system |
GB2549922A (en) * | 2016-01-27 | 2017-11-08 | Nokia Technologies Oy | Apparatus, methods and computer computer programs for encoding and decoding audio signals |
EP3209033B1 (en) | 2016-02-19 | 2019-12-11 | Nokia Technologies Oy | Controlling audio rendering |
KR102465227B1 (ko) | 2016-05-30 | 2022-11-10 | 소니그룹주식회사 | 영상 음향 처리 장치 및 방법, 및 프로그램이 저장된 컴퓨터 판독 가능한 기록 매체 |
GB2591066A (en) * | 2018-08-24 | 2021-07-21 | Nokia Technologies Oy | Spatial audio processing |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3302300B2 (ja) * | 1997-07-18 | 2002-07-15 | 株式会社東芝 | 信号処理装置および信号処理方法 |
JP4269883B2 (ja) | 2003-10-20 | 2009-05-27 | ソニー株式会社 | マイクロホン装置、再生装置及び撮像装置 |
JP4934968B2 (ja) * | 2005-02-09 | 2012-05-23 | カシオ計算機株式会社 | カメラ装置、カメラ制御プログラム及び記録音声制御方法 |
JP3906230B2 (ja) | 2005-03-11 | 2007-04-18 | 株式会社東芝 | 音響信号処理装置、音響信号処理方法、音響信号処理プログラム、及び音響信号処理プログラムを記録したコンピュータ読み取り可能な記録媒体 |
JP4247195B2 (ja) | 2005-03-23 | 2009-04-02 | 株式会社東芝 | 音響信号処理装置、音響信号処理方法、音響信号処理プログラム、及び音響信号処理プログラムを記録した記録媒体 |
JP2006287544A (ja) * | 2005-03-31 | 2006-10-19 | Canon Inc | 映像音声記録再生装置 |
JP4234746B2 (ja) | 2006-09-25 | 2009-03-04 | 株式会社東芝 | 音響信号処理装置、音響信号処理方法及び音響信号処理プログラム |
JP2009156888A (ja) * | 2007-12-25 | 2009-07-16 | Sanyo Electric Co Ltd | 音声補正装置及びそれを備えた撮像装置並びに音声補正方法 |
JP2010154259A (ja) * | 2008-12-25 | 2010-07-08 | Victor Co Of Japan Ltd | 画像音声処理装置 |
WO2010149823A1 (en) * | 2009-06-23 | 2010-12-29 | Nokia Corporation | Method and apparatus for processing audio signals |
US8638951B2 (en) * | 2010-07-15 | 2014-01-28 | Motorola Mobility Llc | Electronic apparatus for generating modified wideband audio signals based on two or more wideband microphone signals |
-
2010
- 2010-09-28 JP JP2010217568A patent/JP5198530B2/ja not_active Expired - Fee Related
-
2011
- 2011-07-25 US US13/189,657 patent/US8837747B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2012074880A (ja) | 2012-04-12 |
US20120076304A1 (en) | 2012-03-29 |
US8837747B2 (en) | 2014-09-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5198530B2 (ja) | 音声付き動画像呈示装置、方法およびプログラム | |
US20230315380A1 (en) | Devices with enhanced audio | |
JP6961007B2 (ja) | 複合現実デバイスにおける仮想および実オブジェクトの記録 | |
US8213648B2 (en) | Audio signal processing apparatus, audio signal processing method, and audio signal processing program | |
KR101703388B1 (ko) | 오디오 프로세싱 장치 | |
US10635383B2 (en) | Visual audio processing apparatus | |
JP6289121B2 (ja) | 音響信号処理装置、動画撮影装置およびそれらの制御方法 | |
US5548346A (en) | Apparatus for integrally controlling audio and video signals in real time and multi-site communication control method | |
US20190139312A1 (en) | An apparatus and associated methods | |
WO2013105413A1 (ja) | 音場制御装置、音場制御方法、プログラム、音場制御システム及びサーバ | |
US20100302401A1 (en) | Image Audio Processing Apparatus And Image Sensing Apparatus | |
JP2008042721A (ja) | 音声信号処理装置、音声信号処理方法および音声信号処理プログラム | |
JP2022065175A (ja) | 音響処理装置および方法、並びにプログラム | |
US20150271618A1 (en) | Device and method for playing sound | |
JP2013062640A (ja) | 信号処理装置、信号処理方法、およびプログラム | |
JP6456171B2 (ja) | 情報処理装置、情報処理方法及びプログラム | |
EP3503579A1 (en) | Multi-camera device | |
JP2016109971A (ja) | 信号処理装置および信号処理装置の制御方法 | |
KR101391942B1 (ko) | 오디오 스티어링 동영상 시스템 및 그 제공방법 | |
JP2009159073A (ja) | 音響再生装置および音響再生方法 | |
WO2018155352A1 (ja) | 電子機器の制御方法、電子機器、電子機器の制御システム、及び、プログラム | |
US11487496B2 (en) | Controlling audio processing | |
JP2023104156A (ja) | 音編集システム、音編集方法および音編集プログラム | |
EP3358852A1 (en) | Interactive media content items | |
JP2013030967A (ja) | 音声信号再生装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20120905 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120911 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20121112 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130115 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130206 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20160215 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20160215 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |