JP6289121B2 - 音響信号処理装置、動画撮影装置およびそれらの制御方法 - Google Patents

音響信号処理装置、動画撮影装置およびそれらの制御方法 Download PDF

Info

Publication number
JP6289121B2
JP6289121B2 JP2014010731A JP2014010731A JP6289121B2 JP 6289121 B2 JP6289121 B2 JP 6289121B2 JP 2014010731 A JP2014010731 A JP 2014010731A JP 2014010731 A JP2014010731 A JP 2014010731A JP 6289121 B2 JP6289121 B2 JP 6289121B2
Authority
JP
Japan
Prior art keywords
sound
acoustic signal
signal
specific
photographer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2014010731A
Other languages
English (en)
Other versions
JP2015139162A (ja
Inventor
船越 正伸
正伸 船越
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2014010731A priority Critical patent/JP6289121B2/ja
Priority to US14/601,739 priority patent/US9622012B2/en
Publication of JP2015139162A publication Critical patent/JP2015139162A/ja
Application granted granted Critical
Publication of JP6289121B2 publication Critical patent/JP6289121B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/44Receiver circuitry for the reception of television signals according to analogue transmission standards
    • H04N5/60Receiver circuitry for the reception of television signals according to analogue transmission standards for the sound signals
    • H04N5/602Receiver circuitry for the reception of television signals according to analogue transmission standards for the sound signals for digital sound signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L2021/02087Noise filtering the noise being separate speech, e.g. cocktail party
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2499/00Aspects covered by H04R or H04S not otherwise provided for in their subgroups
    • H04R2499/10General applications
    • H04R2499/11Transducers incorporated or for use in hand-held devices, e.g. mobile phones, PDA's, camera's
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/11Positioning of individual sound objects, e.g. moving airplane, within a sound field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/15Aspects of sound capture and related signal processing for recording or reproduction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/07Synergistic effects of band splitting and sub-band processing

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Quality & Reliability (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Human Computer Interaction (AREA)
  • Stereophonic System (AREA)
  • Stereophonic Arrangements (AREA)
  • Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Studio Devices (AREA)
  • Details Of Audible-Bandwidth Transducers (AREA)

Description

本発明は、サラウンド音響信号の収音のための音響信号処理装置と、該音響信号処理装置を有する動画撮影装置、およびそれらの制御方法に関する。
近年、DVD、Blu−ray(TM)ディスクなどのデジタルメディアやネットワーク映像配信、デジタルTV放送などの普及に従って、家庭においてもサラウンド音響を伴う映像コンテンツを容易に入手することが可能となった。それにより、一般家庭においてサラウンド音響信号を再生する環境が広く普及している。このような状況において、カムコーダーやデジタルカメラなどの一般家庭向けの動画撮影装置においても、サラウンド音響の収音、再生が可能なものが市場に登場している。
このような動画撮影装置には、3個以上の複数のマイクロフォンを幾何学的に近接配置し、主に水平面上の全方向からの音を捉えるようにする収音部を筐体の上部に設けたものがある。また、外付けのマイクロフォンアレイを収音に利用できるものもある。これらの収音部で収音された複数チャンネルの音響信号は、適宜音響処理が施されて5.1chフォーマットなどのサラウンド音響信号に変換される。
このような収音部を利用してサラウンド音響信号を収音すると、撮影者の音声が、全てのマイクユニットで収音されるため、上、もしくは後方から聴こえるような再生音場になる。また、距離が近いために撮影者の音声が大きな音圧で収音されてしまい、場合によってはわずらわしく感じるような再生音場になってしまうことがある。
サラウンド収音機能の有無によらず、一般向けのカムコーダー等では、撮影者とカムコーダーに内蔵されるマイクロフォンの距離が近いことから、撮影者の音声レベルが被写体よりも大きく録音される傾向がある。そのため、このような特性を考慮することによって使用者が意図する音声を録音できるようにするための工夫が従来からなされてきた。
例えば、特許文献1では、収音した音声に対して音声認識を行い、その結果を利用して処理を行うことが開示されている。具体的には、撮影者の声が認識された場合は、音量を下げる、あるいはフィルタリング処理を行う、あるいは、マイクロフォンの指向性を制御するなどして特定の音声の音量が制御される。
また、特許文献2には、サラウンド収音可能なビデオカメラにおいて、撮影モードに応じてサラウンド収音時の指向性、収音レベル、周波数特性、遅延特性などを変化させ、映像に応じたサラウンド音場を収音する構成が開示されている。ここで、撮影モードの一例であるナレーションモードでは、後方の2chの信号の音量を持ち上げるとともに、後方の指向性を強めることによって撮影者の音声を強めることで、撮影者の音声が主要な音声として収音される。
特開2009−122370号公報 特開2007−005849号公報
しかしながら、特許文献1では、撮影者の音声を認識することが前提となるため、音声認識装置や音声データベースなどの構成要素が増え、処理も複雑で重くなってしまう。また、特許文献1ではマイクアンプのゲインや指向性操作によって撮影者の音声を抑制するものであり、撮影者の音声に対応する音像の位置に関して考慮されていない。そのため、サラウンド収音機能を想定すると、撮影者の音声は後方側になってしまい、サラウンド音場における音像調整は困難である。また、特許文献2では、撮影者の音声を強調する撮影モードを用意しているが、この場合も、撮影者の音声はサラウンド音場において後方に位置し、さらにそれが強調されてしまうため、不自然な音場に感じる場合がある。
本発明は上述した従来技術の課題に鑑みてなされたものであり、収音された音響信号のうちの特定の音響信号(たとえば、撮影者の音声)が任意位置に配置されたサラウンド音響信号を生成することを可能とすることを目的とする。
上記目的を達成するための本発明の一態様による音響信号処理装置は以下の構成を備える。すなわち、
複数のマイクロフォンによ収音に基づく数チャンネルの音響信号のうち少なくとも一つのチャンネルの音響信号に基づいて特定の音響信号を取得する取得手段と、
前記複数のマイクロフォンによる収音に基づく再生用音響信号の生成に用いられるチャンネルの音響信号に対して、前記特定の音響信号に対応する特定の音を抑制するための抑制処理を行う抑制手段と、
前記特定の音を定位させる位置及び方向の少なくとも何れかを指定するためのユーザによる操作を受け付ける受付手段と、
前記取得手段により取得される前記特定の音響信号と、前記抑制手段により前記抑制処理が行われた音響信号とを用いて、前記特定の音が前記受付手段により受け付けられた前記操作に応じた方向に定位するように前記再生用音響信号を生成する生成手段と、を備える。
本発明によれば、収音された音響信号のうちの特定の音響信号(たとえば、撮影者の音声)が任意位置に配置されたサラウンド音響信号を生成することが可能となる。
第1実施形態の動画撮影装置の外観を示す模式図。 第1実施形態の収音部の構成例を示す模式図。 第1実施形態による動画撮影装置の構成例を示すブロック図。 第1実施形態による音像位置の指定のためのGUIを示す図。 第2実施形態による動画撮影装置の構成例を示すブロック図。 第1実施形態による動画撮影処理を示すフローチャート。 第1実施形態による音声切出処理を示すフローチャート。 第1実施形態による音声キャンセル処理を示すフローチャート。 第1実施形態による音響信号生成処理を示すフローチャート。 音像配置のための音声信号の配分計算を説明する図。 収音モードと撮影者音声のチャンネル配分を登録したテーブルを示す図。 第2実施形態による動画撮影処理を示すフローチャート。 第2実施形態による位置検知処理を示すフローチャート。 第2実施形態による音声切出処理を示すフローチャート。 動画撮影装置の収音モードリストを示す図。 第3実施形態による動画撮影装置の外観の模式図。 第3実施形態による動画撮影装置の構成例を示すブロック図。
以下、添付の図面を参照して、本発明をその好適な実施形態に基づいて詳細に説明する。なお、以下の実施形態において示す構成は一例に過ぎず、本発明は図示された構成に限定されるものではない。
<第1実施形態>
図1は、第1実施形態による動画撮影装置の外観の一例を示す模式図である。図1において、動画撮影装置は、光学系、映像信号や音響信号の処理部、記録部などを内蔵する筐体本体1を有する。筐体本体1の内部の詳細構成は図3を用いて後述する。収音部2は、複数のマクロフォンを有し、複数の収音チャンネルの音響信号を収音する。本実施形態では、収音部2は筐体本体1の上部に設置される。収音部2の詳細な構造は図2を用いて後述する。モニター3は、液晶パネルなどの表示器とタッチパネルなどのタッチセンサ機能とを具備したタッチパネル表示器である。モニター3では、撮影した映像を表示するとともに、表示されるアイコンや図を直接指で触れることにより、各設定指示や操作指示等を行うことが可能である。
図2は、第1実施形態による収音部2の一構成例を示す模式図である。図2では、収音部2を筐体本体1の上方から見たときの平面図を示している。図2に示されるように、収音部2は、複数の無指向性のマイクロフォンユニット100を有する。本構成例では、収音部2は、前(F)後(B)左(L)右(R)に向けてひし形に配置された4つのマイクロフォンユニット100を有し、水平面360度の音響信号を4つの収音チャンネルで収音することができる。なお、その他のマイクロフォン配置構成によっても同様な機能を実現することが可能であり、趣旨逸脱することがない限り本発明はその他のマイクロフォン配置構成によっても実施することが可能である。
図3は、第1実施形態による動画撮影装置の筐体本体1の内部構成例を示すブロック図である。収音部2は、上述のように4つのマイクロフォンユニット100を有しており、それぞれがマイクロフォンアンプ101に接続されている。マイクロフォンアンプ101は、収音部2の4つのマイクロフォンユニット100により収音された4つの収音チャンネル(F、L,R,B)のアナログ音響信号を適宜増幅する。アナログデジタル変換器102(以下、ADC102)は、マイクロフォンアンプ101で増幅されたアナログ音響信号をデジタル音響信号(以下、単に音響信号という)に変換して出力する。遅延器103は、後述の音声切出器104が撮影者音声を切り出す処理を行う時間と同じ時間だけ入力された音響信号を遅延させる。すなわち、遅延器103はBチャンネルの音響信号に遅延処理を施すことで、Bチャンネルの音響信号とその他のチャンネル(F,L,R)の音響信号との同期を取る。
音声切出器104は、制御器112から送信される制御信号に従って、入力された音響信号から、特定の音響信号として撮影者音声データ105を切り出して出力する。撮影者音声データ105は音声切出器104によって切り出された撮影者音声信号であり、構成要素ではないが、説明のため図3において明示している。なお、本実施形態では、一般的な撮影時の使用者の状態を考慮して、撮影者が動画撮影装置の後方に位置することを想定しており、光学系113の撮影レンズから最も遠い位置にあるBチャンネルの音響信号から撮影者音声データを切り出す構成としている。但し、本発明はこのような構成に限られるものではなく、全ての収音チャンネルの信号に基づいて撮影者音声を切り出すことも可能である。そのような構成例は、第2実施形態として後述する。
音声キャンセル器106は、ADC102から入力されるデジタル音響信号に音声切出器104から出力される撮影者音声データ105の逆位相信号を合成することで、音響信号から撮影者音声(撮影者音声データ105に対応する信号)をキャンセルする。音響信号生成器107は、撮影者音声がキャンセルされた4チャンネルの音響信号に適宜信号処理を行って5.1chサラウンド音響信号を生成する。さらに、音響信号生成器107は、制御器112から送信される収音モードと配置位置情報に従って、撮影者音声データ105の音源をサラウンド音場の指定された位置に配置する処理を行う。その結果、撮影者音声データの音源が指定された位置に配置されたサラウンド音響信号が生成され、出力される。音響符号化器108は、入力されたサラウンド音響信号を、AACやAC−3などの適宜既定のサラウンド音響符号化信号に圧縮符号化する。
混合器109(以下、MUX109)は、音響符号化器108から出力された符号化音響信号と映像符号化器117から出力された符号化映像信号を適宜既定のストリーム形式に合致するように混合して出力する。動画データ記憶器110は、撮影した動画データを順次記憶する。操作器111は、撮影開始、一時停止、撮影終了などのユーザーの指示を受け付け、制御器112へ送信する。制御器112は、操作器111やモニター3で受け付けたユーザーの操作指示に従って、筐体本体1に内蔵される各構成要素を適宜動作指示するための制御信号を各構成要素に送信する。
光学系113は、撮影する被写体の光を捉え、撮像器114へ送る。撮像器114は、光学系113で捉えた被写体の光をCMOS等の受光素子で捉え、受光素子ごとの出力アナログ信号を映像用アナログ−デジタル変換器115(以下、映像ADC115)に送信する。映像ADC115は、撮像器114が出力したアナログ映像信号を画素ごとにデジタル映像信号に変換する。映像信号処理器116は、制御器112から入力される指示に従って、映像ADC115から入力されるデジタル映像信号に対して、解像度変換、フレームレート変換、手ぶれ補正処理などの映像信号処理を行う。そして、処理結果を映像符号化器117や制御器112へ出力する。映像符号化器117は、入力されたデジタル映像信号をMPEG−4 AVCなどの既定の映像符号化信号に圧縮符号化し、符号化映像信号として出力する。以上の光学系113から映像符号化器117により動画像の撮影が行われ、その符号化映像信号と符号化音響信号とがMUX109において混合され、音声つきの動画データが生成される。
以下、第1実施形態の動画撮影装置における、動画撮影装置の音響信号処理及び映像信号処理を図6のフローチャートを参照して説明する。図6は、第1実施形態による動画撮影装置の動画撮影処理全体を示すフローチャートである。
まず、S1において、制御器112は、モニター3に収音モードをリスト表示し、使用者に収音モードを選択させる。収音モードとは、サラウンド音場における撮影者音声の音源の方向を規定するものであり、図15に、本実施形態における収音モードの一例を示す。本実施形態では、5.1chサラウンド音場が想定されており、例えば「センターモード」では、センターchから撮影者音声が出力される。使用者による操作器111やモニター3への収音モードの選択入力を受け付けると、S2へ処理が進む。S2において、制御器112は、S1で使用者により指定されたモードが任意配置モードであるかどうかを判定する。指定されたモードが任意配置モードであった場合はS3へ処理が進み、指定されたモードがそれ以外の場合はS5へ処理が進む。
任意配置モードが指定された場合、S3において、制御器112は、音像配置位置指定用のGUIをモニター3に表示し、使用者により撮影者音声の音像を配置する位置をタッチによって指定させる。このときモニター3に表示するGUIの例を図4に示す。図4に示すように、本実施形態では、サラウンドスピーカー配置図が描画されたGUIを提示して、ユーザに撮影者音声の位置を指定させる。そのようなGUIが表示されたモニター3において、使用者がサラウンドスピーカー配置図上の配置円内の任意の位置をタッチすると、撮影者音声の配置位置(方向)が配置円上のアイコン「●」によって表示される。その後、使用者がGUIの決定ボタンをタッチすることによって、「●」が表示された配置位置が指示された位置として決定される。指示された位置は、配置方向を示す正面からの角度に変換される。本実施形態では、聴取者の正面を0°とし、正面方向から右回りに真後ろまでを正の角度、左回りに真後ろまでを負の角度で示す。例えば、図4に図示した配置の場合、撮影者音声の配置方向を示す角度は60°となる。
次に、S4において、制御器112は、S3で指定された音像の配置位置を示す角度から、サラウンド音響の5chへの撮影者音声の信号配分を算出する。本実施形態における任意配置モードにおいて、5.1chサラウンド音場における撮影者音声の音像は、音像を配置する方向の両側に隣接する二つのチャンネルに撮影者音声を配分することによって生成する。これは、音像を配置する方向と、隣接する二つのチャンネルの方向とのなす角に基づいて撮影者音声の信号配分を決定することによって実現できる。この計算の詳細を、図10を用いて以下説明する。
図10は、本実施形態における任意の音像配置位置に対する5ch信号配分を説明する模式図である。図10のチャンネル配置は、ITU−R BS.775−2によって国際規格化されている5.1chサラウンドスピーカー標準配置に準じている。ITU−R規格によれば、5.1chサラウンド音響において、LFE(Low Frequency Effect)を除く他の5チャンネルは聴取者位置より等距離、つまり、聴取者位置を中心とする円上に配置される。センタースピーカー(C)は0°、前部左右スピーカー(FL,FR)は±30°、サラウンド左右スピーカー(SL,SR)は±100°〜120°の間に配置すると規定されている。なお、本実施形態では、サラウンド左右チャンネルは±110°に配置されるものとする。
図10において、S3で指定された配置位置の角度が60°である場合、図示したように、音像配置位置はFR(右前)チャンネルとSR(サラウンド右)チャンネルの間に位置する。そこで、FRとSRに撮影者音声を配分し、音像配置位置に仮想音像ができるように信号を配分する。本実施形態では、この配分を代表的な振幅パンニング法として知られているタンジェント則で計算する。信号が配分される2つのチャンネルの中心線1001から各チャンネル方向への角度をφoとし、中心線1001と音源配置位置のなす角をφとする。さらに、各隣接チャンネルへの振幅の重みをそれぞれwFR、wSRとし、(1)式の関係に従って各チャンネルの振幅重みを定める。
tanφ/tanφo=(wSR−wFR)/(wSR+wFR) …(1)
図10に示した例の場合、FRとSRのなす角は110°−30°=80°であるので、φo=40°である。また、2つのチャンネルの中心線1001の角度は70°であるので、中心線1001の角度と音源配置位置のなす角は、φ=60°−70°=−10°となる。さらに
wFR+wSR=1 …(2)
とすると、(1)式より、wFR=0.605、wSR=0.395と計算される。
以上のようにして制御器112によって算出された信号配分は、音響信号生成器107に送信され、音響信号生成器107内のメモリーに格納されている音声信号配分テーブルの所定領域に保存される。図11は、音声信号配分テーブルのデータ構成例を示す図である。図11に示したように、音声信号配分テーブルには、図10に示した収音モードの各々に応じた撮影者の音声の信号配分が定義されている。S4において制御器112が算出した信号配分は、音声信号配分テーブル中の「任意配置モード」の行に保存される。以上の処理を終えると、S5へ処理が進む。
S5において、制御器112は、S1で指定された収音モードを音声切出器104と音響信号生成器107に送信する。音声切出器104と音響信号生成器107は、それぞれ受信した収音モードを内部のメモリーに保存する。次に、S6において、制御器112は、撮影開始が指示されたか否かを判定する。この判定は、たとえば、使用者からの撮影開始指示が操作器111内部の入力バッファにあるかどうかを確認することにより行われる。撮影開始指示があった場合は、S7とS11へ処理が進み、映像信号や音響信号の処理が開始する。本実施形態において、S7からS10までの処理フローで示される音響処理と、S11からS12までの処理フローで示される映像処理は実質的に同時に並列で実行される。撮影開始指示がない場合は、撮影開始指示があるまで待ち続ける。
S7において、音声切出器104は、後方(B)チャンネルで収音された音響信号から、撮影者の音声を切り出す。この処理の詳細は図7のフローチャートの参照により後述する。音声切出器104により切り出された撮影者音声データ105は各収音チャンネルの音声キャンセル器106へ出力される。次に、S8において、各収音チャンネルの音声キャンセル器106は、入力された音響信号から、S7で切り出された撮影者音声データ105に相関する信号成分をキャンセルする処理を行う。この処理により、収音チャンネルごとに撮影者音声がキャンセルされた音響信号が生成される。なお、この処理の詳細は図8のフローチャートの参照により後述する。
S9において、音響信号生成器107は、S8で撮影者音声がキャンセルされた各音響信号から5.1chサラウンド音響信号を生成する。さらに、音響信号生成器107は、S7で切り出された撮影者音声データ105を、音声信号配分テーブルを参照して内部メモリーに保存されている収音モードに応じた信号配分を取得し、取得した信号配分に応じてチャンネルに配分する。この処理により、サラウンド音場における、収音モードによって指定された音像配置位置に、撮影者の音声が配置される。この処理の詳細については図9のフローチャートを参照して後述する。
S10において、音響符号化器108は、S9で生成された5.1chサラウンド音響信号を、AACやAC−3などの適宜既定の圧縮符号化方式に符号化する。なお、この処理は既存の動画撮影装置において一般的に行われており、本実施形態においてもそのような公知の技術を適用することができる。
他方、S11において、映像信号処理器116は、撮像器114から出力される画素ごとのアナログ信号を映像ADC115がデジタル化することにより得られたデジタル画素信号を処理して映像信号を作成する。映像信号の作成において、映像信号処理器116は制御器112が出力する制御信号に従って、解像度変換、フレームレート変換、インターレース−プログレッシブ変換、ガンマ補正、手ぶれ補正、映像加工などの様々な映像信号処理を行う。なお、これらの処理は動画撮影装置において一般に行われているものであり、本実施形態においてもそのような公知の技術を適用することができる。
S12において、映像符号化器117は、映像信号処理器116が出力した映像信号処理後のデジタル映像信号を、MPEG−2やMPEG−4 AVCなどの適宜既定の符号化方式で符号化する。このような処理は動画撮影装置において一般的に行われており、本実施形態においてもそのような公知の技術を適用することができる。
S13において、MUX109は、S10で符号化された音響信号と、S12で符号化された映像信号を、たとえばAVCHDなどの映像ストリームフォーマットに合致するように混合し、動画データ記憶器110に格納する。このような処理は動画撮影装置において一般的に行われており、本実施形態においてもそのような公知の技術を用いることができる。
S14において、制御器112は、操作器111の入力バッファ内に撮影終了指示があるかどうか確認を行う処理である。撮影終了指示がある場合は、制御器112は、撮影、収音を終了する制御信号を各構成要素に送信し、動画撮影処理を終了する。撮影終了指示がない場合は、制御器112はS7、S11へ処理を戻し、動画撮影処理を続行する。
次に、S7における、音声切出器104による撮影者音声の切出処理について説明する。図7は、撮影者音声の切出処理の詳細を示すフローチャートである。
まず、S101において、音声切出器104は、制御器112によって指示された収音モードがナチュラルモードであるかどうかを判定する。収音モードとしてナチュラルモードが指定されている場合は、撮影者音声の音像に関する調整を行わないので、そのまま本処理を終了してリターンする。収音モードがナチュラルモードではない場合は、処理はS102へ進む。
後方(B)チャンネルのマイクロフォンユニット100で捉えられたアナログ音響信号はマイクロフォンアンプ101で増幅され、ADC102でデジタル信号へ変換されてデジタルの音響信号が作成される。S102において、音声切出器104は、作成された音響信号の振幅レベルが、予め既定された閾値よりも大きいかどうかを判定する。ここで、既定の閾値は予め音声切出器104内部のメモリーに記録されている。一般に、撮影者が動画撮影装置を構えた状態で発声を行うと、その音声の音圧レベル、すなわち振幅レベルがある一定のレベルよりも大きくなる。S102の処理では、後方チャンネル(Bチャンネル)で収音された音響信号の振幅レベルがその一定のレベルに達しているかどうかが判定される。音響信号の振幅レベルが閾値に達している場合は、処理はS103へ進む。他方、音響信号の振幅レベルが閾値に達していない場合は、撮影者の音声信号が存在しないものと判断され、音声切出し処理は何も出力せずに終了する。
S103において、音声切出器104は、入力された後方チャンネルのデジタル音響信号に対してFFTを行い、周波数領域信号に変換する。このような処理は音響信号処理において一般的に行われており、本実施形態においてもそのような公知の技術を用いることができる。
S104は、音声切出器104において、S103で周波数領域に変換した音響信号のスペクトル形状が、音声のパターンであるかどうかを調査する処理である。これは、例えば、スペクトルの慨形をメル周波数ケプストラム係数で表現し、予め学習した統計モデルと比較して尤度を算出し、この尤度に基づいて音声であるか判定する。このような処理は音声認識の分野で一般的に行われており、本実施形態においてもそのような公知の技術を適用することができる。この調査の結果、音声であると判定された場合は、S105へ進む。音声でないと判定された場合は、撮影者音声切出処理を終了する。
S105は、音声切出器104において、周波数領域の音響信号に含まれる音声の周波数帯域を決定し、バンドパスフィルタで該周波数帯の音響信号を撮影者音声データ105として抽出する。音声の周波数帯域(音声が含まれている帯域)の決定は、例えば、線スペクトルの時間変化から音声帯域を推定する、もしくは、基本周波数を基準とする調波構造を検出する、などの方法によって行われる。このような処理は音声認識の分野で一般的に行われており、本実施形態においてもそのような公知の技術を適用することができる。次に、S106において、音声切出器104は、S105で抽出した撮影者音声データ105を、各入力チャンネルの音声キャンセル器106に出力する。以上の処理を終えると、撮影者音声切出処理を終了し、リターンする。
次に、音声キャンセル器106による、撮影者音声のキャンセル処理を説明する。図8は、S7における撮影者音声のキャンセル処理を詳細に示すフローチャートである。この処理は、各収音チャンネルの音声キャンセル器106において、同時かつ個別に行われる。
まず、S201において、音声切出器104は、撮影者音声データ105が出力されているかどうかを判定する。音声切出器104から出力された撮影者音声データ105が存在する場合は、処理はS202へ進む。撮影者音声データ105が存在しない場合は、そのまま撮影者音声のキャンセル処理を終了し、リターンする。
S202において、音声キャンセル器106は、撮影者音声データ105と収音チャンネルの音響信号との相互相関を計算する。各収音チャンネルの音響信号に撮影者音声が含まれている場合、撮影者音声データ105と音響信号との間に強い相互相関信号が検出される。S203において、音声キャンセル器106は、S202で計算された相互相関信号から、最も振幅が大きい相関信号を検出し、それに基づいて各入力チャンネル音響信号に撮影者音声が含まれている信号レベルと、切出した撮影者音声との遅延を算出する。
S204において、音声キャンセル器106は、撮影者音声の逆位相信号を作成し、S203で算出された信号レベルに合致するようにレベル調整を行い、S203で算出された遅延によって時間調整することにより、撮影者音声キャンセル信号を生成する。S205において、音声キャンセル器106は、S204で生成した撮影者音声キャンセル信号を収音チャンネルの音響信号に加算する。この処理によって、最も相関が大きい撮影者音声、つまり、各チャンネルのマイクロフォンユニット100により直接音として捉えられた撮影者音声のキャンセルが実行される。以上の処理を終えると、撮影者音声キャンセル処理を終了し、リターンする。
上述の撮影者音声のキャンセル処理は収音チャンネルごとに個別に行われるため、各マイクロフォンユニットの配置によって変化する撮影者音声のレベルや遅延の補正を個別に行うことができる。そのため、より確実に、各収音チャンネルの音響信号から撮影者音声をキャンセルすることができる。
次に、音響信号生成器107によるサラウンド音響信号の生成処理を説明する。図9は、S8において音響信号生成器107が行うサラウンド音響信号の生成処理の詳細を示すフローチャートである。
まず、S301において、音響信号生成器107は、音声キャンセル器106から出力された各収音チャンネルの音響信号を、遮断周波数が約100Hz前後であるLPFに通して100Hz以下の低域成分を抽出する。さらに、収音チャンネルの音響信号の4ch分の低域信号を、LPFにより抽出された低域成分に加算することによって、LFE信号を作成する。この処理はサラウンド音響処理分野において一般的に行われている処理であり、本実施形態においてもそのような公知の技術を適用することができる。
S302にいおいて、音響信号生成器107は、各収音チャンネルの音響信号を既定の割合で一時結合することによって、5chサラウンド音響信号を合成する。例えば、以下の(3)式のように4ch音響信号から5chサラウンド音響信号を合成することができる。
C=F
FL=0.7×L+0.3×F
FR=0.7×R+0.3×F
SL=0.3×L+0.7×B
SR=0.3×R+0.7×B …(3)
このようなチャンネルミックスアップ処理はサラウンド音響信号処理の分野において一般的であり、本実施形態においてもそのような公知の技術を適用することができる。以上の処理を終えると、処理はS303へ進む。
S303において、音響信号生成器107は、S4において制御器112から指示された収音モードがナチュラルモードであるかどうかを確認する。前述したように、収音モードは音響信号生成器107内部のメモリー上に保存されているので、その値を確認すればよい。収音モードがナチュラルモードである場合は、処理はS305へ進み、収音モードがナチュラルモードでない場合は、処理はS304へ進む。
S304において、音響信号生成器107は、S7で切り出した撮影者音声データ105を、収音モードに応じた配分に従ってサラウンド音響信号の5chに配分し、加算する。前述したように、収音モードと、収音モードに応じた撮影者音声のチャンネル配分(図11の音声信号配分テーブル)は、音響信号生成器107内部のメモリーに保存されている。音響信号生成器107は、収音モードに対応する撮影者音声のチャンネル配分を音声信号配分テーブルから取得し、撮影者音声の各チャンネルへの音声配分を決定し、各チャンネルの音響信号に加算する。例えば、収音モードが任意配置モードである場合は、FRに60.5%の振幅レベル、SRに39.5%の振幅レベルの撮影者音声データ105がそれぞれ加算される。
S305において、音響信号生成器107は、S302、S304によって生成された5ch信号に、S301で生成されたLFE信号を加えたサラウンド音響信号をMUX109に出力する。以上の処理を終えると、サラウンド音響信号生成処理を終了し、リターンする。
以上説明したように、第1実施形態の動画撮影装置によれば、入力音響信号から適切に撮影者の音声を切り出すことができる。さらに、切り出した音声を利用して各入力音響信号チャンネルから撮影者音声をキャンセルし、撮影者音声がないサラウンド音場を整えることができる。その後に、収音モードに応じてサラウンド音場に切り出した撮影者音像を配置して収音するため、使用者が所望する位置に撮影者音像を再現することができる。また、任意配置モードでは、撮影者が指定した任意位置に撮影者音像を配置することができる。よって、面倒な操作を使用者に強いることなく、使用者の所望する位置に撮影者音像を適切に配置して収音することができる。
また、上記実施形態によれば、撮影者の声を分離して、任意の位置に配置することができるため、周囲音や被写体の音声を撮影者の音声が邪魔することがない好ましいサラウンド音響再生を行うことができる。また、複数の収音モードのうちから好みのモードを選択すればよいので、わずらわしい設定をしなくても好みの位置に撮影者の音声を配置することができる。
<第2実施形態>
第1実施形態では、撮影者が動画撮影装置に対して後方に位置することを想定して、後方チャンネル(Bチャンネル)のマイクロフォンユニット100から得られた音響信号から撮影者音声データを抽出するように構成した。第2実施形態では、収音部2の複数のマイクロフォンユニットから得られる音響信号に基づいて撮影者の位置を検出することにより、動画撮影装置に対して任意の方向に撮影者が位置する場合にも、各収音モードの実行を可能とする。
図5は、第2実施形態における動画撮影装置の一構成例の構成を示すブロック図である。図5において図3に示した構成要素と同じ機能を持つ構成要素は同じ符号で示している。
重畳器201は、撮影者位置データ202と各収音チャンネルの音響信号を収音するマイクロフォンとの位置関係に基づいて、筐体形状などによる周波数特性の変化を補正するための補正伝達関数を決定する。重畳器201は、決定した補正伝達関数を撮影者音声データ105に重畳し、得られた撮影者音声データを音声キャンセル器106へ出力する。撮影者位置データ202は、位置検出器203によって算出される撮影者位置を示す情報である。したがって撮影者位置データ202は構成要素ではないが、説明をわかりやすくするために図示してある。位置検出器203は、各収音チャンネルの音響信号の振幅レベルや相関などから撮影者の位置を検出する。音声切出器204は、全ての収音チャンネルの音響信号に基づいて撮影者の音声を切り出す。
以下、第2実施形態による動画撮影装置の音響信号処理及び映像信号処理について、図12のフローチャートを参照して説明する。図12は、第2実施形態による動画撮影装置の動画撮影処理全体を示すフローチャートである。図12に示されるフローチャートは図6に示されるフローチャートの一部を図5の構成に応じて変更したものである。図12において、図6と同じ処理を行うステップには図6と同じステップ番号を付してある。なお、第2実施形態において、S401からS10までの音響信号処理とS11からS12までの映像信号処理は同時に並列で実行される。
S401において、位置検出器203は、全ての収音チャンネルの音響信号を分析して撮影者の位置を検出し、出力する。この処理の詳細は図13のフローを用いて後述する。次に、S402において、音声切出器204は、S401で検出した撮影者位置データ202に基づいて音響チャンネル信号から撮影者音声データ105を切り出す。この処理の詳細は図14のフローを用いて後述する。
S403において、重畳器201は、撮影者位置データ202に基づいて、各収音チャンネルのマイクロフォン位置に応じた伝達関数補正信号を作成し、これを撮影者音声データ105に重畳して補正する。各収音チャンネルにおける、撮影者位置に対する音響信号の補正伝達関数は、重畳器201内部のメモリーにテーブルとして予め記憶されている。たとえば、図2の前方向から30度ごとに区切って、補正伝達関数が登録されており、撮影者位置データ202をキーとしてこのテーブルを検索することにより、補正伝達関数が選択される。次に、重畳器201は、選択された補正伝達関数を撮影者音声データ105に重畳し、音声キャンセル器106に出力する。この処理によって、各収音チャンネルの音声キャンセル器106に入力される撮影者音声データ105には、撮影者位置による影響が考慮された補正が行われることになる。そのため、S8における影者音声のキャンセル処理において、より精密に音響信号から撮影者音声をキャンセルすることが可能となる。
図13は、第2実施形態における撮影者音声の位置検知処理(S401)を詳細に示したフローチャートである。このフローチャートにより示される処理は位置検出器203によって実行される。
S501において、位置検出器203は、内部メモリーに格納されている収音モードがナチュラルモードであるかどうかを確認する。なお、収音モードは図12のステップS5において予め位置検出器203の内部メモリーに保存されているものとする。確認の結果、収音モードがナチュラルモードである場合は、そのまま撮影者音声位置検知処理を終了し、リターンする。一方、収音モードがナチュラルモードでない場合は、処理はS502へ進む。
S502において、位置検出器203は、4つの収音チャンネルの音響信号から、信号レベルが高い順に3つのチャンネル信号を選択する。S503において、位置検出器203は、S502で選択した3つのチャンネルの入力信号から、2つずつの組み合わせを3組作り、それらの3組それぞれに対して相互相関を計算する。S504において、位置検出器203は、S503で計算した3つの相互相関信号おのおのにおいて、最も大きいレベルの相関信号を抽出し、これに基づいて選択した3つのチャンネル間の遅延差を計算する。なお、このような処理は音源探索処理において一般的に行われている処理であり、本実施形態においてもそのような公知の技術を適用することができる。
S505において、位置検出器203は、S504で計算した遅延差と、選択した3つのチャンネルの音響信号を収音したマイクロフォンユニットの配置位置から、音源の方向を算出する。このような処理は音源探索処理において一般的に行われており、本実施形態においてもそのような公知の技術を適用することができる。算出された方向情報は、撮影者位置データ202として出力される。処理を終えると、撮影者音声の位置検知処理を終了し、リターンする。
図14は、第2実施形態における撮影者音声の切出処理(S402)の詳細を示すフローチャートである。このフローチャートで示される処理は音声切出器204によって実行される。なお、図14に示されるフローチャートは、第1実施形態で示した撮影者音声の切出処理(図7)の一部を変更したものであり、図14において図7と同じ処理を行うステップ(S103以降のステップ)には同じステップ番号を付してある。
S601において、音声切出器204は、位置検出器203から撮影者位置データ202が出力されているかどうか、すなわちS403で撮影者位置データ202が出力されたかどうかを確認する。撮影者位置データ202が出力されている場合は、処理はS602へ進む。撮影者位置データ202が出力されていない場合は、そのまま音声切出処理を終えてリターンする。
S602において、音声切出器204は、撮影者位置データ202が示す方向や距離に基づき、撮影者音声を強めるように、4つの収音チャンネルの音響信号を合成する。例えば、撮影者音声の方向に基づいて、その方向に指向性を強めるように4チャンネルの音響信号の振幅レベルが調整される。これに加えて、あるいはこれに代えて、たとえば、撮影者音声の各チャンネルのマイクロフォンユニットからの距離に応じて、4つのチャンネルの音響信号の撮影者音声に関わる遅延が一致するように遅延調整が行われる。以上のような調整を行ってから、4つのチャンネルの音響信号を加算することによって、撮影者音声を強調するように信号を合成できる。なお、このような処理は音源抽出の分野において一般的に行われており、本実施形態においてもそのような公知の技術を適用することができる。
S603において、音声切出器204は、S602で合成した音響信号の振幅レベルが、予め定められた振幅レベル閾値よりも大きいかどうかを確認する。振幅レベル閾値は、予め音声切出器204の内部メモリーの所定領域に格納されている。合成した音響信号の振幅レベルが閾値よりも大きい場合は、処理はS103へ進む。それ以外の場合は、撮影者音声が収音されていないとみなし、撮影者音声の切出処理を終了してリターンする。
以上説明したように、第2実施形態においては、動画撮影装置に対して、撮影者が後方に位置せず、任意方向に位置する場合でも、撮影者の方向や距離を自動的に検出し、それに基づいて適切に撮影者音声を切出すことができる。
また、第2実施形態においては、撮影者の方向に応じて伝達関数を補正した撮影者音声に基づいて、撮影者音声キャンセル処理を行うため、より高精度に撮影者音声をキャンセルした理想的なサラウンド音場の下地を生成することができる。また、その上に撮影者音声を使用者の任意配置することによってより理想的なサラウンド音場の再生が実現できる。なお、第1実施形態の構成に補正伝達関数を重畳する構成を付加してもよいことは明らかである。その場合、各収音チャンネルの補正伝達関数は、動画撮影装置の後方に位置する撮影者と各マイクロフォンとの位置関係に基づいて設定された固定の関数となる。
<第3実施形態>
上述の第1、第2実施形態例では、撮影者音声は筐体の上部に設けられた収音部2で収音された音響信号から切り出す例を示したが、これに限られるものではない。第3実施形態では、そのような変形の一例として、筐体本体1の後部に撮影者音声を主に収音するための単一指向性マイクロフォンユニットを設け、このマイクロフォンユニットで収音した信号から撮影者音声を切り出す構成を説明する。図16に、第3実施形態による動画撮影装置の外観の模式図を示す。図16において、マイクロフォン4は、撮影者音声収音用の単一指向性のマイクロフォンである。また、図17は、第3実施形態による撮影装置の構成例を示すブロック図である。なお、第3実施形態による動画撮影装置の各処理は第1実施形態と同様であるが、後ろチャンネル(Bチャンネル)の音響信号から撮影者音声が切り出されるのではなく、マイクロフォン4により得られた音響信号から撮影者音声が切り出される。さらに、マイクロフォン4により得られた音響信号は、音響信号生成器107によるサラウンド音響の生成には用いられない。
<他の実施形態>
上記各実施形態において収音部2は4chマイクロフォン構成としているが、例えば、サラウンド音響における5chをミキシングせずにそのまま収音できる5chマイクロフォン構成としても同様に実施することができる。
また、上記各実施形態においては、全ての収音モードにおいて撮影者音声をサラウンド音場に配置しているがこれに価値がれるものではない。たとえば、撮影者音声のキャンセルを行い、サラウンド音場に再配置しない収音モード(撮影者音声キャンセルモード)を設けるようにしてもよい。
また、本発明は例えば、システム、装置、方法、プログラム若しくは記録媒体(記憶媒体)等としての実施態様をとることが可能である。具体的には、複数の機器(例えば、ホストコンピュータ、インタフェース機器、撮像装置、webアプリケーション等)から構成されるシステムに適用しても良いし、また、一つの機器からなる装置に適用しても良い。
また、本発明は、以下の処理を実行することによっても実現される。即ち、上述した実施形態の機能を実現するソフトウェア(プログラム)を、ネットワーク又は各種記憶媒体を介してシステム或いは装置に供給し、そのシステム或いは装置のコンピュータ(またはCPUやMPU等)がプログラムを読み出して実行する処理である。

Claims (17)

  1. 複数のマイクロフォンによ収音に基づく数チャンネルの音響信号のうち少なくとも一つのチャンネルの音響信号に基づいて特定の音響信号を取得する取得手段と、
    前記複数のマイクロフォンによる収音に基づく再生用音響信号の生成に用いられるチャンネルの音響信号に対して、前記特定の音響信号に対応する特定の音を抑制するための抑制処理を行う抑制手段と、
    前記特定の音を定位させる位置及び方向の少なくとも何れかを指定するためのユーザによる操作を受け付ける受付手段と、
    前記取得手段により取得される前記特定の音響信号と、前記抑制手段により前記抑制処理が行われた音響信号とを用いて、前記特定の音が前記受付手段により受け付けられた前記操作に応じた方向に定位するように前記再生用音響信号を生成する生成手段と、を備えることを特徴とする音響信号処理装置。
  2. 前記取得手段は、前記複数チャンネルの音響信号のうちの特定のチャンネルの音響信号の音圧レベルとスペクトル形状に基づいて、前記特定の音響信号を取得することを特徴とする請求項1に記載の音響信号処理装置。
  3. 前記特定のチャンネルは前記再生用音響信号の生成に用いられるチャンネルの一つであることを特徴とする請求項2に記載の音響信号処理装置。
  4. 前記特定のチャンネルは、前記再生用音響信号の生成に用いられるチャンネルとは別のチャンネルであることを特徴とする請求項2に記載の音響信号処理装置。
  5. 前記再生用音響信号の生成に用いられるチャンネルに対応するマイクロフォンは無指向性であり、前記特定のチャンネルに対応するマイクロフォンは単一指向性を有することを特徴とする請求項4に記載の音響信号処理装置。
  6. 前記受付手段は、前記特定の音を定位させる所定の位置または方向が定義された複数のモードの一つを選前記操作を受け付けることを特徴とする請求項1乃至のいずれか1項に記載の音響信号処理装置。
  7. 前記受付手段は、表示部に表示されたスピーカー配置図上における位置を指定する前記操作を受け付けることを特徴とする請求項1乃至5のいずれか1項に記載の音響信号処理装置。
  8. 前記複数のマイクロフォンと、
    前記複数のマイクロフォンによる収音とともに撮影する撮影手段と、
    前記撮影手段によ撮影に基づく映像信号と、前記生成手段により生成された前記再生用音響信号とを用いて、音声つきの動画データを生成する手段とを備えることを特徴とする請求項1乃至7のいずれか1項に記載の音響信号処理装置
  9. 複数のマイクロフォンにより収音された複数の収音チャンネルの音響信号の少なくとも一つに基づいて特定の音響信号を取得する取得手段と、
    前記特定の音響信号に対応する信号を、サラウンド音響信号の生成に用いられる収音チャンネルの各々の音響信号から抑制する抑制手段と、
    前記特定の音響信号と、前記抑制手段により前記特定の音響信号に対応する信号が抑制された音響信号とを用いて、前記特定の音響信号の音源がサラウンド音場の指定された方向に配置されるようにサラウンド音響信号を生成する生成手段と、
    前記複数の収音チャンネルの音響信号に基づいて前記特定の音響信号の音源の位置を判定する判定手段と、
    前記判定手段により判定された前記音源の位置の方向の音響信号が強調されるように前記複数の収音チャンネルの音響信号を合成する合成手段と、を備え、
    前記取得手段は、前記合成手段により合成された音響信号から前記特定の音響信号を取得することを特徴とする音響信号処理装置。
  10. 前記取得手段は、前記合成された音響信号の音圧レベルとスペクトル形状に基づいて、前記合成された音響信号から前記特定の音響信号を取得することを特徴とする請求項に記載の音響信号処理装置。
  11. 前記抑制手段は、前記サラウンド音響信号の生成に用いられる収音チャンネルのそれぞれに対応するマイクロフォンの位置と前記特定の音響信号の音源の位置との関係に基づいて、収音チャンネルごとに前記特定の音響信号を補正することを特徴とする請求項9または10に記載の音響信号処理装置。
  12. 前記サラウンド音響信号における前記特定の音響信号の音源の位置または方向をユーザーに指定させる指定手段をさらに備え、
    前記生成手段は、前記特定の音響信号の音源がサラウンド音場の前記指定された位置または方向に配置されるようにサラウンド音響信号を生成することを特徴とする請求項乃至11のいずれか1項に記載の音響信号処理装置。
  13. 動画撮影装置であって、
    撮影手段による撮影期間におけるマイクロフォンによる収音に基づく音響信号を取得する取得手段と、
    前記取得手段により取得される音響信号に基づく再生用音響信号が再生される場合に前記撮影期間における特定の音が何れの方向から聞こえるようにするかを指定するためのユーザ操作を受け付ける受付手段と、
    前記取得手段により取得される音響信号に対して、前記受付手段により受け付けられるユーザ操作に応じた処理を行うことで、前記再生用音響信号を生成する生成手段とを有することを特徴とする動画撮影装置。
  14. 前記特定の音は、前記撮影手段による撮影を行う撮影者の声であることを特徴とする請求項13に記載の動画撮影装置。
  15. 複数のマイクロフォンによ収音に基づく数チャンネルの音響信号のうち少なくとも一つのチャンネルの音響信号に基づいて特定の音響信号を取得する取得工程と、
    前記複数のマイクロフォンによる収音に基づく再生用音響信号の生成に用いられるチャンネルの音響信号に対して、前記特定の音響信号に対応する特定の音抑制するための抑制処理を行う抑制工程と、
    前記特定の音を定位させる位置及び方向の少なくとも何れかを指定するためのユーザによる操作を受け付ける受付工程と、
    前記取得工程において取得される前記特定の音響信号と、前記抑制工程で前記抑制処理が行われた音響信号とを用いて、前記特定の音が前記受付工程において受け付けられた前記操作に応じた方向に定位するように前記再生用音響信号を生成する生成工程と、を有することを特徴とする音響信号処理方法。
  16. 複数のマイクロフォンにより収音された複数の収音チャンネルの音響信号の少なくとも一つに基づいて特定の音響信号を取得する取得工程と、
    前記特定の音響信号に対応する信号を、サラウンド音響信号の生成に用いられる収音チャンネルの各々の音響信号から抑制する抑制工程と、
    前記特定の音響信号と、前記抑制工程で前記特定の音響信号に対応する信号が抑制された音響信号とを用いて、前記特定の音響信号の音源がサラウンド音場の指定された方向に配置されるようにサラウンド音響信号を生成する生成工程と、
    前記複数の収音チャンネルの音響信号に基づいて前記特定の音響信号の音源の位置を判定する判定工程と、
    前記判定工程により判定された前記音源の位置の方向の音響信号が強調されるように前記複数の収音チャンネルの音響信号を合成する合成工程と、を有し、
    前記取得工程は、前記合成工程により合成された音響信号から前記特定の音響信号を取得することを特徴とする音響信号処理方法。
  17. コンピュータを、請求項1乃至12のいずれか1項に記載された音響信号処理装置の各手段として機能させるためのプログラム。
JP2014010731A 2014-01-23 2014-01-23 音響信号処理装置、動画撮影装置およびそれらの制御方法 Active JP6289121B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2014010731A JP6289121B2 (ja) 2014-01-23 2014-01-23 音響信号処理装置、動画撮影装置およびそれらの制御方法
US14/601,739 US9622012B2 (en) 2014-01-23 2015-01-21 Audio signal processing apparatus, movie capturing apparatus, and control method for the same

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014010731A JP6289121B2 (ja) 2014-01-23 2014-01-23 音響信号処理装置、動画撮影装置およびそれらの制御方法

Publications (2)

Publication Number Publication Date
JP2015139162A JP2015139162A (ja) 2015-07-30
JP6289121B2 true JP6289121B2 (ja) 2018-03-07

Family

ID=53545972

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014010731A Active JP6289121B2 (ja) 2014-01-23 2014-01-23 音響信号処理装置、動画撮影装置およびそれらの制御方法

Country Status (2)

Country Link
US (1) US9622012B2 (ja)
JP (1) JP6289121B2 (ja)

Families Citing this family (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9565493B2 (en) 2015-04-30 2017-02-07 Shure Acquisition Holdings, Inc. Array microphone system and method of assembling the same
US9554207B2 (en) 2015-04-30 2017-01-24 Shure Acquisition Holdings, Inc. Offset cartridge microphones
US9940948B2 (en) * 2015-08-02 2018-04-10 Resonance Software Llc Systems and methods for enabling information exchanges between devices
US9818427B2 (en) * 2015-12-22 2017-11-14 Intel Corporation Automatic self-utterance removal from multimedia files
US10367948B2 (en) 2017-01-13 2019-07-30 Shure Acquisition Holdings, Inc. Post-mixing acoustic echo cancellation systems and methods
JP2018157314A (ja) * 2017-03-16 2018-10-04 株式会社リコー 情報処理システム、情報処理方法及びプログラム
JP7140542B2 (ja) 2018-05-09 2022-09-21 キヤノン株式会社 信号処理装置、信号処理方法、およびプログラム
EP3804356A1 (en) 2018-06-01 2021-04-14 Shure Acquisition Holdings, Inc. Pattern-forming microphone array
US11297423B2 (en) 2018-06-15 2022-04-05 Shure Acquisition Holdings, Inc. Endfire linear array microphone
WO2020061353A1 (en) 2018-09-20 2020-03-26 Shure Acquisition Holdings, Inc. Adjustable lobe shape for array microphones
EP3651448B1 (en) 2018-11-07 2023-06-28 Nokia Technologies Oy Panoramas
KR102664399B1 (ko) * 2018-12-20 2024-05-14 삼성전자주식회사 공간 음향 녹음 소자, 공간 음향 녹음 방법 및 공간 음향 녹음 소자를 포함하는 전자 장치
EP3942842A1 (en) 2019-03-21 2022-01-26 Shure Acquisition Holdings, Inc. Housings and associated design features for ceiling array microphones
US11558693B2 (en) 2019-03-21 2023-01-17 Shure Acquisition Holdings, Inc. Auto focus, auto focus within regions, and auto placement of beamformed microphone lobes with inhibition and voice activity detection functionality
CN113841421A (zh) 2019-03-21 2021-12-24 舒尔获得控股公司 具有抑制功能的波束形成麦克风瓣的自动对焦、区域内自动对焦、及自动配置
EP3973716A1 (en) 2019-05-23 2022-03-30 Shure Acquisition Holdings, Inc. Steerable speaker array, system, and method for the same
JP2022535229A (ja) 2019-05-31 2022-08-05 シュアー アクイジッション ホールディングス インコーポレイテッド 音声およびノイズアクティビティ検出と統合された低レイテンシオートミキサー
CN110366091B (zh) * 2019-08-07 2021-11-02 武汉轻工大学 基于声压的声场重建方法、设备、存储介质及装置
EP4018680A1 (en) 2019-08-23 2022-06-29 Shure Acquisition Holdings, Inc. Two-dimensional microphone array with improved directivity
WO2021095563A1 (ja) * 2019-11-13 2021-05-20 ソニーグループ株式会社 信号処理装置および方法、並びにプログラム
US11552611B2 (en) 2020-02-07 2023-01-10 Shure Acquisition Holdings, Inc. System and method for automatic adjustment of reference gain
JP7405660B2 (ja) * 2020-03-19 2023-12-26 Lineヤフー株式会社 出力装置、出力方法及び出力プログラム
US11706562B2 (en) 2020-05-29 2023-07-18 Shure Acquisition Holdings, Inc. Transducer steering and configuration systems and methods using a local positioning system
CN112398455B (zh) * 2020-10-21 2022-09-27 头领科技(昆山)有限公司 一种自适应功率放大器芯片及其自适应控制方法
US11785380B2 (en) 2021-01-28 2023-10-10 Shure Acquisition Holdings, Inc. Hybrid audio beamforming system

Family Cites Families (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4885792A (en) * 1988-10-27 1989-12-05 The Grass Valley Group, Inc. Audio mixer architecture using virtual gain control and switching
JP2687712B2 (ja) * 1990-07-26 1997-12-08 三菱電機株式会社 一体型ビデオカメラ
JPH07203600A (ja) * 1993-12-27 1995-08-04 Toa Corp 音像移動装置
JP3789685B2 (ja) * 1999-07-02 2006-06-28 富士通株式会社 マイクロホンアレイ装置
JP4363004B2 (ja) * 2002-05-24 2009-11-11 ソニー株式会社 音響提示装置と音響提示方法
JP2004064363A (ja) * 2002-07-29 2004-02-26 Sony Corp デジタルオーディオ処理方法、デジタルオーディオ処理装置およびデジタルオーディオ記録媒体
JP2005328314A (ja) * 2004-05-14 2005-11-24 Sony Corp マイクロホン
JP2005341073A (ja) * 2004-05-26 2005-12-08 Sony Corp マイクロホン
JP2006314078A (ja) * 2005-04-06 2006-11-16 Sony Corp 撮像装置、音声記録装置および音声記録方法
JP4943670B2 (ja) * 2005-06-09 2012-05-30 ヤマハ株式会社 ミキサ装置及びミキサにおけるチャンネルパラメータ設定変更プログラム
JP4692095B2 (ja) 2005-06-21 2011-06-01 ソニー株式会社 記録装置、記録方法、再生装置、再生方法、記録方法のプログラムおよび記録方法のプログラムを記録した記録媒体
JP2007089058A (ja) * 2005-09-26 2007-04-05 Yamaha Corp マイクアレイ制御装置
JP4345784B2 (ja) * 2006-08-21 2009-10-14 ソニー株式会社 音響収音装置及び音響収音方法
JP4850628B2 (ja) * 2006-08-28 2012-01-11 キヤノン株式会社 記録装置
JP2008193196A (ja) * 2007-02-01 2008-08-21 Casio Comput Co Ltd 撮像装置および指定音声出力方法
JP2009122370A (ja) 2007-11-14 2009-06-04 Canon Inc 音声入出力装置
KR101238362B1 (ko) * 2007-12-03 2013-02-28 삼성전자주식회사 음원 거리에 따라 음원 신호를 여과하는 방법 및 장치
JP2010263611A (ja) * 2009-04-07 2010-11-18 Panasonic Corp 映像撮影装置
JP5246790B2 (ja) * 2009-04-13 2013-07-24 Necカシオモバイルコミュニケーションズ株式会社 音データ処理装置、及び、プログラム
JP5711555B2 (ja) * 2010-02-15 2015-05-07 クラリオン株式会社 音像定位制御装置
JP2012238964A (ja) * 2011-05-10 2012-12-06 Funai Electric Co Ltd 音分離装置、及び、それを備えたカメラユニット
US9071900B2 (en) * 2012-08-20 2015-06-30 Nokia Technologies Oy Multi-channel recording

Also Published As

Publication number Publication date
US9622012B2 (en) 2017-04-11
US20150208171A1 (en) 2015-07-23
JP2015139162A (ja) 2015-07-30

Similar Documents

Publication Publication Date Title
JP6289121B2 (ja) 音響信号処理装置、動画撮影装置およびそれらの制御方法
JP6984596B2 (ja) 映像音響処理装置および方法、並びにプログラム
JP5801026B2 (ja) 画像音響処理装置及び撮像装置
JP4557035B2 (ja) 情報処理装置、情報処理方法、プログラム及び記録媒体
KR101753715B1 (ko) 촬영장치 및 이를 이용한 촬영방법
JP2013106298A (ja) 撮像制御装置、撮像制御方法、撮像制御方法のプログラムおよび撮像装置
JP2016146547A (ja) 収音システム及び収音方法
US20100254543A1 (en) Conference microphone system
KR20080017259A (ko) 음향 수음장치 및 음향 수음방법
JP6882057B2 (ja) 信号処理装置、信号処理方法、およびプログラム
JP2009147768A (ja) 映像音声記録装置および映像音声再生装置
JP5939444B2 (ja) 撮像装置
US10397723B2 (en) Apparatus, system, and method of processing data, and recording medium
JP6835205B2 (ja) 撮影収音装置、収音制御システム、撮影収音装置の制御方法、及び収音制御システムの制御方法
JP2010093603A (ja) カメラ、再生装置、および再生方法
JP2014072835A (ja) 会議装置
JP2013168878A (ja) 録音機器
JP6569853B2 (ja) 指向性制御システム及び音声出力制御方法
JP6456171B2 (ja) 情報処理装置、情報処理方法及びプログラム
JP2011234139A (ja) 3次元音声信号生成装置
JP5979843B2 (ja) 音声信号処理装置、音声信号処理方法及びプログラム
JP6634976B2 (ja) 情報処理装置、及びプログラム
JP2013176049A (ja) カメラ、再生装置、および再生方法
JP2003264897A (ja) 音響提示システムと音響取得装置と音響再生装置及びその方法並びにコンピュータ読み取り可能な記録媒体と音響提示プログラム
JP2021076866A (ja) 収音制御システム及び収音制御システムの制御方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20170111

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20171013

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20171020

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20171215

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180109

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20180206

R151 Written notification of patent or utility model registration

Ref document number: 6289121

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151