JP2016146547A - 収音システム及び収音方法 - Google Patents

収音システム及び収音方法 Download PDF

Info

Publication number
JP2016146547A
JP2016146547A JP2015022423A JP2015022423A JP2016146547A JP 2016146547 A JP2016146547 A JP 2016146547A JP 2015022423 A JP2015022423 A JP 2015022423A JP 2015022423 A JP2015022423 A JP 2015022423A JP 2016146547 A JP2016146547 A JP 2016146547A
Authority
JP
Japan
Prior art keywords
sound
sound source
unit
directivity
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2015022423A
Other languages
English (en)
Other versions
JP2016146547A5 (ja
Inventor
宏之 松本
Hiroyuki Matsumoto
宏之 松本
渡辺 周一
Shuichi Watanabe
周一 渡辺
寿嗣 辻
Toshitsugu Tsuji
寿嗣 辻
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Intellectual Property Management Co Ltd
Original Assignee
Panasonic Intellectual Property Management Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Intellectual Property Management Co Ltd filed Critical Panasonic Intellectual Property Management Co Ltd
Priority to JP2015022423A priority Critical patent/JP2016146547A/ja
Priority to US15/001,634 priority patent/US10206030B2/en
Publication of JP2016146547A publication Critical patent/JP2016146547A/ja
Publication of JP2016146547A5 publication Critical patent/JP2016146547A5/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R1/00Details of transducers, loudspeakers or microphones
    • H04R1/20Arrangements for obtaining desired frequency or directional characteristics
    • H04R1/32Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only
    • H04R1/40Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers
    • H04R1/406Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers microphones
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01SRADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
    • G01S5/00Position-fixing by co-ordinating two or more direction or position line determinations; Position-fixing by co-ordinating two or more distance determinations
    • G01S5/18Position-fixing by co-ordinating two or more direction or position line determinations; Position-fixing by co-ordinating two or more distance determinations using ultrasonic, sonic, or infrasonic waves
    • G01S5/20Position of source determined by a plurality of spaced direction-finders
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/63Control of cameras or camera modules by using electronic viewfinders
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2201/00Details of transducers, loudspeakers or microphones covered by H04R1/00 but not provided for in any of its subgroups
    • H04R2201/40Details of arrangements for obtaining desired directional characteristic by combining a number of identical transducers covered by H04R1/40 but not provided for in any of its subgroups
    • H04R2201/4012D or 3D arrays of transducers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2430/00Signal processing covered by H04R, not provided for in its groups
    • H04R2430/20Processing of the output signals of the acoustic transducers of an array for obtaining a desired directivity characteristic
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R29/00Monitoring arrangements; Testing arrangements
    • H04R29/008Visual indication of individual signal levels
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/005Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones

Abstract

【課題】収音システムにおいて、対象領域内の所望の音源からの音を収音する際の利便性を向上させる。
【解決手段】対象空間の映像を撮像するカメラと、複数のマイクロホンを用いて音声を収音するマイクアレイと、収音された音声データに基づき音源位置を算出する音源解析部55と、撮像された対象空間の映像と音源位置を示す音源位置表示とを含む画像データをディスプレイ53に表示させる画像表示処理部52と、ディスプレイ53に表示された対象空間画像における指定箇所の指示を受け付けるユーザ入力装置と、収音された音声データを基に、マイクアレイから指定箇所に向かう方向に収音の指向性を形成し、指向性を有する方向の音声を強調した音声データを生成する指向性演算部57と、指向性処理後の音声データをスピーカに出力して再生させる音声出力部58と、を備える。
【選択図】図1

Description

本発明は、対象領域内の所望の音源からの音を収音する収音システム及び収音方法に関する。
例えば、講演会場又は大講義室など、多数の聴衆者に対して講演又は講義を行う大きな会場においては、講演者又は講義者の声が会場内に広く届くように拡声するが、聴衆者の中から質問などの発言を受け付ける場合、同様に聴衆者が発する声を拡声する必要がある。このような場合、聴衆者が発する声をマイクロホンによって収音して再生し、講演者又は講義者が聴衆者の発言を容易に聞き取れるようにしたり、会場内の他の聴衆者が両者の発言内容をモニタできるようにしている。
大きな会場内の任意の位置にいる発言者からの声を収音するためには、多数のマイクロホンを会場全体に渡って配置し、発言者の近くのマイクロホンに切り替えて収音する、或いは、マイクロホンを発言者まで移動させて収音する、などの方法が用いられる。この種の用途に利用可能な収音システムとしては、例えば特許文献1、2に開示されているものがある。特許文献1には、複数の赤外線式マイクロホンを備え、これらのマイクロホンからの赤外線信号を切り替えて受信し、複数の位置における収音が可能な赤外線受信装置が開示されている。特許文献2には、共通のネットワークにリンクされたアンテナのアレイに関連付けられたワイヤレスマイクロホンを有し、1又は複数のオーディオソースからの音を収音可能なオーディオシステムが開示されている。
特開2004−080121号公報 特開2014−110640号公報
大きな会場において、任意の位置にいる発言者からの声を収音する場合、多数のマイクロホンを配置して切り替える構成では、システムが大型化、複雑化し、多大なコストを要するという課題がある。また、マイクロホンを発言者まで移動させて収音する構成では、会場係が手持ちで運ぶなど、マイクロホンの移動に手間及び時間を要し、運用時に多くの労力がかかる課題がある。
本発明は、上述した課題を解決するために、対象領域内の所望の音源からの音を収音する際の利便性を向上できる収音システム及び収音方法を提供することを目的とする。
本発明は、対象空間の映像を撮像する撮像部と、前記撮像部により撮像された画像データを表示する表示部と、複数のマイクロホンを含み、前記マイクロホンを用いて音声を収音する収音部と、前記収音部により収音された音声データを再生出力する音声再生部と、前記音声データに基づき音源位置を算出する音源解析部と、前記撮像された対象空間の映像と前記音源位置を示す音源位置表示とを含む画像データを前記表示部に表示させる画像表示処理部と、前記表示部に表示された前記画像データにおける指定箇所の指示を受け付ける指示入力部と、前記音声データを基に、前記収音部から、指定された前記画像データの指定箇所に対応する位置に向かう方向に、収音の指向性を形成し、前記指向性を有する方向の音声を強調した音声データを生成又は合成する指向性演算部と、前記指向性に関する処理後の音声データを前記音声再生部に出力して再生させる音声出力部と、を備える収音システムを提供する。
本発明は、撮像部において対象空間の映像を撮像するステップと、複数のマイクロホンを含む収音部において音声を収音するステップと、前記収音された音声データに基づき音源位置を算出するステップと、前記撮像された対象空間の映像と前記音源位置を示す音源位置表示とを含む画像データを表示部に表示させるステップと、前記表示された前記画像データにおける指定箇所の指示を受け付けるステップと、前記音声データを基に、前記収音部から、指定された前記画像データの指定箇所に対応する位置に向かう方向に、収音の指向性を形成し、前記指向性を有する方向の音声を強調した音声データを生成又は合成するステップと、前記指向性に関する処理後の音声データを音声再生部に出力して再生させるステップと、を有する、収音方法を提供する。
本発明によれば、対象領域内の所望の音源からの音を収音する際の利便性を向上させることができる。
本実施形態に係る収音システムの構成を示すブロック図 カメラの外観構成の一例を示す斜視図 (A)マイクアレイの外観構成の一例を示す斜視図、(B)マイクアレイの構成の一例を示す斜視図 マイクアレイの内部構成を示すブロック図 画像表示装置の構成を示すブロック図 収音システムの使用形態の一例を示す模式図 収音システムの使用時の状態の一例を示す模式図 収音システムの動作手順の第1例を示すフローチャート 収音システムの動作手順の第2例を示すフローチャート
以下、本発明に係る収音システム及び収音方法の実施形態(以下、「本実施形態」という)について、図面を参照して説明する。本実施形態の収音システムは、例えば、講演会場、大講義室、株主総会会場、議会場等の大きな室内空間を有する施設、観光バス等の乗り物の車内、或いは、その他の多数の発言者が存在し得る場所に設置される音響システムに適用される。
図1は、本実施形態に係る収音システムの構成を示すブロック図である。収音システムは、カメラ10、マイクアレイ20、スピーカ30、ユーザ入力装置40、画像表示装置50を含む構成である。カメラ10と、マイクアレイ20と、スピーカ30と、ユーザ入力装置40と、画像表示装置50とは、ネットワーク60を介して相互に接続されている。
撮像部の一例としてのカメラ10は、例えば講演会場に用いられるホール等の室内の天井に設置され、対象空間の映像を撮像する。図2は、カメラ10の外観構成の一例を示す斜視図である。図2では、室内の空間を360°の全方位に渡って撮像可能な全方位カメラの例を示している。カメラ10は、撮像レンズと、CCD(Charge Coupled Device)型イメージセンサ又はCMOS(Complementary Metal Oxide Semiconductor)型イメージセンサ等による固体撮像素子とを内蔵した撮像デバイス11を有する。カメラ10は、撮像した対象の画像データを出力し、ネットワーク60を介して画像表示装置50に送信する。
収音部の一例としてのマイクアレイ20は、例えば講演会場に用いられるホール等の室内の天井に設置され、対象空間の音を収音する。図3は、マイクアレイ20の構成例を示す図であり、(A)はマイクアレイ20の外観構成の一例を示す斜視図、(B)はマイクアレイ20の構成の一例を示す斜視図である。
マイクアレイ20は、筐体21に複数のマイクロホン22が一様に配置されたマイクロホンの集合体である。図3(B)では、複数のマイクロホン22を、円盤状の筐体21の一面に設け、筐体21と同一の中心を有する小さい円状及び大きい円状の2個の同心円状に沿って配置した例を示している。ここで、小さな円状に沿って配置された複数のマイクロホン22Aは、互いの間隔が狭く、高い音域に適した特性を有する。また、大きな円状に沿って配置された複数のマイクロホン22Bは、直径が大きく、低い音域に適した特性を有する。マイクアレイ20は、各々のマイクロホン22を用いて、対象地点(場所)の周囲の音を収音し、収音した音声データを出力し、ネットワーク60を介して画像表示装置50に送信する。
なお、カメラ10とマイクアレイ20とは、上記例のように別体に設ける構成に限定されず、1つの筐体にカメラ10及びマイクアレイ20を設けた一体的な構成としてもよい。
図4は、マイクアレイ20の信号処理部の機能構成の一例を示すブロック図である。マイクアレイ20は、複数のマイクロホン22、複数の増幅器(AMP)23、複数のA/D変換器24、符号化部25、送信部26を含む構成であり、複数のマイクロホン22のそれぞれに対して、増幅器23、A/D変換器24が設けられる。増幅器23は、マイクロホン22にて収音した音声信号を増幅する。A/D変換器24は、増幅器23の出力の音声信号をディジタルの音声データに変換する。符号化部25は、複数のA/D変換器24の出力の音声データを符号化し、複数のマイクロホン22にて収音した音声データを含む符号化音声データとして出力する。送信部26は、符号化部25にて符号化した音声データをネットワーク60を介して画像表示装置50に送信する。
画像表示装置50は、カメラ10にて撮像した画像データを処理する機能と、画像データを表示する機能と、マイクアレイ20にて収音した音声データを処理する機能とを有する。
図5は、画像表示装置50の機能構成の一例を示すブロック図である。画像表示装置50は、画像受信部51、画像表示処理部52、ディスプレイ53、音声受信部54、音源解析部55、ユーザ入力受信部56、指向性演算部57、音声出力部58を含む構成である。画像データ処理機能を実現する構成要素として、画像受信部51、画像表示処理部52を有する。画像データ表示機能を実現する構成要素として、ディスプレイ53を有する。音声データ処理機能を実現する構成要素として、音声受信部54、音源解析部55、指向性演算部57、音声出力部58を有する。
画像受信部51は、カメラ10にて撮像した画像データを受信し、画像表示処理部52に出力する。音声受信部54は、マイクアレイ20にて収音した音声データを受信し、音源解析部55及び指向性演算部57に出力する。ユーザ入力受信部56は、ユーザ入力装置40から送られるユーザ指示入力を受信し、指向性演算部57に出力する。音源解析部55は、マイクアレイ20にて収音した音声データに基づいて音が到来する方向を解析して音源の位置を算出し、音源位置データを画像表示処理部52に出力する。この際、音源解析部55は、マイクアレイ20の各マイクロホン22にて収音した複数の音声データの位相差から音源の方向及び音源までの距離を推定し、音源位置を求める。
画像表示処理部52は、画像データと音源位置データとに基づき、対象空間の映像を示す対象空間画像を生成する。この対象空間画像は、対象空間における音源位置を示す音源位置表示を含む。表示部の一例としてのディスプレイ53は、例えば液晶表示パネル等の表示装置により構成され、画像表示処理部52から出力される対象空間画像データを入力し、対象空間画像を表示する。本実施形態では、音源位置表示を対象空間画像中に表示することによって、収音した音声データにおける音源の位置を視覚化する。
指向性演算部57は、マイクアレイ20にて収音した音声データに対して、特定方向への強調処理を行って収音の指向性を形成する。この際、指向性演算部57は、ユーザ指示入力に基づき、マイクアレイ20の各マイクロホン22の位置からユーザ指示がなされた指定箇所に向かう方向の音声(音量レベル)を強調(増幅)するために、ユーザの指定方向への収音の指向性を形成した音声データを生成又は合成する。音声出力部58は、指向性を形成した音声データをアナログの音声再生信号に変換して出力する。
音声再生部の一例としてのスピーカ30は、画像表示装置50の近傍に配置され、画像表示装置50から出力される指向性に関する処理後の音声再生信号を入力し、画像表示装置50を使用するユーザとしての講演者又は講義者等に対して、音声再生信号を音声出力する。これにより、画像表示装置50のユーザは、指定位置の音を強調した音声を聴取できる。なお、スピーカ30は、カメラ10及びマイクアレイ20により撮像及び収音する対象空間内など、ホール等の会場の室内の任意の位置に配置し、聴衆者等の画像表示装置50のユーザ以外の人が聴取できるようにしてもよい。また、音声再生部として、スピーカだけでなく、音声信号に関する各種処理を行う音声処理装置、音声信号を増幅するアンプなど、他の音声再生装置を備えていてもよい。
指示入力部の一例としてのユーザ入力装置40は、例えばディスプレイ53の画面に対応して配置され、ユーザの指又はスタイラスペン等によって入力操作が可能なタッチパネル又はタッチパッドを用いて構成される。ユーザ入力装置40は、ユーザの操作に応じて、音声データの音量レベルの強調を所望する1つ以上の指定箇所の座標データをユーザ指示入力として画像表示装置50に出力する。なお、ユーザ入力装置40は、マウス又はキーボード等のポインティングデバイスを用いて構成されてもよい。
ここで、本実施形態における指向性に関する処理(以下、「指向性処理」と記載)について説明する。本実施形態では、例えば遅延和方式を用いた指向性処理によって、ユーザ指示がなされた指定箇所の方向への音声の強調処理を行う。指向性演算部57は、遅延器及び加算器を有し、各マイクロホン22にて収音した音声データについて、それぞれ所定の遅延時間を与えて加算する。具体的には、指向性演算部57は、それぞれの音声データに対して遅延器によって各マイクロホン22の位置における音波の到達時間差に対応する遅延時間を与えて位相を揃えた後、加算器によって遅延処理後の音声データを加算する。このとき、指向性演算部57は、それぞれの遅延器の遅延時間を変更することによって、任意の方向の音量レベルを強調した音声データを生成することができる。
図6は、本実施形態の収音システムの使用形態の一例を示す模式図である。図6では、本実施形態の収音システムを講演会場において使用する場合の例を示している。この場合、収音システムのユーザとして、例えば講演者が使用する形態が想定される。講演会場に用いられるホール等の室内の天井75には、1台のカメラ10と1台のマイクアレイ20とが離れた位置に設置されている。室内の床に並べて配置された複数の席にはそれぞれ聴衆者が座っており、講演者85による講演を聴取している。そして、複数の聴衆者の中から、2人の聴衆者が発言者81、82としてほぼ同じタイミングで質問を発言した状態を想定する。
この場合、講演者85が、カメラ10にて撮像され画像表示装置50に表示される対象空間画像を見ながら、画像中の所望の位置をユーザ入力装置40により指定することによって、スピーカ30から指定位置の方向への音が強調された音声が再生出力される。例えば、講演者85が発言者81の位置を指定すると、発言者81の方向にマイクアレイ20の指向性が形成され、発言者81からの音を強調した音声データが生成され、スピーカ30より再生される。このとき、画像表示装置50の指向性演算部57は、マイクアレイ20の各マイクロホン22が収音した音声データを用いて、各マイクロホン22の位置から指定位置に対応する音声位置に向かう指向方向の音(音量レベル)を強調(増幅)した音声データを生成する。これにより、ユーザとしての講演者85は、対象空間画像中の所望位置を指示するだけの簡単な操作によって、指定位置にいる発言者81の発言を良好に聴取できる。
図7は、本実施形態の収音システムの使用時の状態の一例を示す模式図である。画像表示装置50のディスプレイ53には、カメラ10により複数の聴衆者が存在する領域を撮像した対象空間画像90が表示される。このとき、カメラ10にて撮像した画像データに基づいて、画像表示装置50の画像表示処理部52によって対象空間画像データが生成され、ディスプレイ53に出力される。
また、マイクアレイ20により収音した音声データを用いて、画像表示装置50の音源解析部55によって音源位置が算出され、画像表示処理部52では、算出した音源位置データに基づいて音源位置表示の画像データが生成される。これにより、対象空間画像90には、音源位置を示す音源位置表示91、92が重畳されて表示される。音源位置表示91、92は、それぞれ発言者81、82の位置(すなわち音源位置)に対応している。ユーザとしての講演者85は、音源位置表示91、92によって音源となる発言者の位置を容易に直感的に認識可能である。
ディスプレイ53上には、ユーザ入力装置40としてのタッチパネルが配置され、ユーザである講演者85が指又はスタイラスペン等によって対象空間画像90中の所望位置を指定することによって指示入力操作が可能になっている。講演者85は、対象空間画像90の音源位置表示91、92を見て、所望の発言者の位置を指定する。例えば、講演者85が図中左側の発言者81に対応する音源位置表示91の位置を指定したとする。講演者85による指示入力操作に対応して、対象空間画像90中の指定箇所の座標データがユーザ指示入力として画像表示装置50に入力される。そして、画像表示装置50の指向性演算部57により、マイクアレイ20の各マイクロホン22にて収音した音声データに対して、指定位置(音源位置表示91の位置)に対する方向への指向性処理が実行され、指定位置の方向から到来する音を強調した音声データが生成される。
ユーザである講演者85には、スピーカ30から再生出力される指向性処理後の音声によって、指定位置からの音、すなわち所望の音源(発言者81)からの音を明瞭に聴き分けることが可能である。また、スピーカ30を聴衆者がいる客席にも配置することにより、講演者85によって指定された位置からの音(発言者81の音声)を強調した状態で他の聴衆者が聴取できる。
図8は、本実施形態の収音システムの動作手順の第1例を示すフローチャートである。ここでは、画像表示装置50の動作を中心に説明する。画像表示装置50は、カメラ10にて撮像した画像データ(カメラ画像)を画像受信部51にて受信する(ステップS11)。そして、画像表示装置50は、画像表示処理部52にて画像データを処理し、ディスプレイ53に対象空間画像90を表示する(ステップS12)。
また、画像表示装置50は、マイクアレイ20にて収音した音声データ(マイク音声)を音声受信部54にて受信する(ステップS13)。そして、画像表示装置50は、音源解析部55によって音声データから音源位置を解析し、音源位置データを算出する(ステップS14)。続いて、画像表示装置50は、画像表示処理部52によって音源位置データに基づいて音源位置を示す画像データを生成し、音源位置表示91、92を対象空間画像90に表示する(ステップS15)。なお、音源位置を表示する場合、対象空間画像90として、音源位置表示91、92の近傍を拡大した(ズームした)画像を表示してもよい。
次に、画像表示装置50は、ユーザ入力受信部56におけるユーザ指示入力の受信を監視し、ユーザ入力を検出する(ステップS16)。このユーザ入力検出処理において、ユーザ指示入力の受信によるユーザ入力の有無を判定する(ステップS17)。ステップS17においてユーザ入力有りと判定された場合、画像表示装置50は、指向性演算部57によって指向性処理を行い、ユーザ指示入力に対応する指定位置の方向への指向性を形成し、この指定方向に強調処理した音声データを生成する(ステップS18)。そして、画像表示装置50は、音声出力部58により指向性処理後の音声データを出力し、スピーカ30より指定箇所からの音を強調した音声再生信号を音声出力させる(ステップS19)。
このように、本実施形態では、カメラ10で撮像した対象空間画像において、マイクアレイ20で収音した音声の音源位置を可視化できる。また、可視化した音源位置表示を目安にして、ユーザが聴取したい所望の音源位置を指定し、指定方向に指向性を形成した音声データを再生できる。
図9は、本実施形態の収音システムの動作手順の第2例を示すフローチャートである。第2例は、ユーザによる指定箇所が実際の音源位置とずれている場合の動作を示すものである。
ステップS11〜S17までの動作は上述した第1例と同様であり、カメラ10にて撮像した画像データに基づく対象空間画像90の表示、マイクアレイ20にて収音した音声データに基づく音源解析及び音源位置表示91、92の表示が実行される。
ステップS17においてユーザ入力有りと判定された場合、画像表示装置50は、指向性演算部57によって指向性処理を行い、ユーザ指示入力に対応する指定位置の方向への指向性を形成し、この指定方向に強調処理した音声データを生成する(ステップS18)。次に、画像表示装置50は、指向性演算部57による指向性処理後の音声データの音量レベルを参照し、指定方向の音量が所定のしきい値以上かどうかを判定する(ステップS21)。
ステップS21において指定方向の音量がしきい値未満である場合、画像表示装置50は、音源位置指定の再入力を促す通知を行う(ステップS22)。通知としては、例えば、画像表示処理部52によって表示用のメッセージの画像データを生成し、対象空間画像90上に再入力を促すメッセージを表示する。なお、メッセージの表示に限らず、音声による通知など、他の各種通知手段を用いることが可能である。そして、ステップS16、S17に戻り、ユーザ入力検出処理及びユーザ入力判定処理を実行する。
ステップS21において指定方向の音量がしきい値以上である場合、画像表示装置50は、音声出力部58により指向性処理後の音声データを出力し、スピーカ30より指定位置からの音を強調した音声再生信号を音声出力させる(ステップS19)。
第2例では、指定方向に指向性を形成した音声データの音量レベルが小さい場合に、音源位置指定を再度実行させ、指定方向に指向性を形成した音声データを良好に再生できる。なお、ユーザによる指定位置の入力を再度実行させる代わりに、指定位置を少しずつ移動させて音声データの音量レベルが大きくなる方向に指向性を調整し、指向性処理後の音声データとして所定値以上の音量レベルが得られるようにする機能を持たせることも可能である。
従来では、講演会等の会場において、任意の位置にいる発言者からの声を収音する場合、マイクロホンを発言者まで移動させて収音するなど、マイクロホンの移動に手間及び時間を要し、運用時に多くの労力がかかる課題があった。また、マイクロホンを移動させる時にマイクロホンが破損したり、マイクロホンが壊されてしまう課題も生じていた。これに対し、本実施形態では、撮像した対象空間画像中に音源位置を視覚化して表示し、講演者等のユーザが音源位置表示を確認して所望の発言者の位置を指定することにより、収音した音声データにおいて、所望の指定位置からの音を強調した音声を再生できる。これによって、対象領域内の所望の発言者からの音を簡便に収音して再生でき、ユーザの利便性を向上できる。
次に、本実施形態の他の適用例を示す。本実施形態の収音システムは、観光バスの車内など、乗り物の室内に設けることも可能である。この場合、収音システムのユーザとして、例えばバスガイドが使用する形態が想定される。本例では、天井等に配置したカメラによって車内全体を撮像し、ユーザであるバスガイドの近傍に配置したディスプレイに対象空間画像を表示する。また、天井等に配置したマイクアレイによって車内の音を収音し、収音した音声データを基に音源位置を算出して、ディスプレイの対象空間画像中に音源位置表示を表示する。
ここで、ユーザであるバスガイドが所望の位置を指定すると、指定箇所を示すユーザ指示入力に応じて、指定箇所の位置(音源位置など)に向かう方向に指向性を形成し、指向方向の音声を強調した音声データを生成する。そして、指向性処理後の音声データを車内に配置したスピーカに出力し、指定箇所の方向に指向性を持たせた収音音声を再生する。これにより、ユーザであるバスガイドが対象空間画像中の所望位置を指示するだけの簡単な操作によって、指定した位置にいる乗客が発した音声を明瞭に再生して聴取できる。また、スピーカを車内の任意の位置に複数箇所配置することにより、車内にいるバスガイド及び乗客が指定位置からの音を強調した状態で聴取できる。
従来では、観光バスの車内において収音して再生する場合、マイクロホンを発言者まで手渡しで移動させて収音するなど、マイクロホンの移動に手間及び時間を要し、不便であるという課題があった。また、マイクロホンを移動させる時に落下などによりマイクロホンが破損する課題もあった。これに対し、本実施形態では、撮像した対象空間画像中に音源位置を視覚化して表示し、バスガイド等のユーザが音源位置表示を確認して所望の発言者の位置を指定することにより、収音した車内の音声データにおいて、所望の指定位置からの音を強調した音声を再生できる。これによって、対象領域内の所望の発言者からの音を簡便に収音して再生でき、ユーザの利便性を向上できる。
なお、ディスプレイに表示した対象空間画像中に音源位置表示を表示する場合、音源自体の位置を示す音源位置表示に限定されない。音源位置表示の他の例として、音源位置に対して音量レベルが所定値以下の小さい領域を示す静音領域表示を生成し、対象空間画像中に表示するものであってもよい。対象空間内の注目すべき場所としては、音源位置はもちろん、音源位置とは反対に誰も発言していない場所、静かな場所などを表示して、ユーザに認識させることも可能である。この場合、例えば音源位置を含む音量レベルが所定値以上の領域を除外し、消去法によって静音領域を算出可能である。また、時間軸上の音量レベルの統計値に基づいて静音領域を算出することも可能である。本例によれば、音量レベルが小さい領域を視覚化でき、ユーザに容易に認識させることができる。
以上のように、本実施形態の収音システムは、対象空間の映像を撮像するカメラ10と、カメラ10により撮像された画像データを表示するディスプレイ53と、複数のマイクロホン22を含み、マイクロホン22を用いて音声を収音するマイクアレイ20と、マイクアレイ20により収音された音声データを再生出力するスピーカ30と、音声データに基づき音源位置を算出する音源解析部55と、撮像された対象空間画像90と音源位置を示す音源位置表示91、92とを含む画像データをディスプレイ53に表示させる画像表示処理部52と、ディスプレイ53に表示された画像データにおける指定箇所の指示を受け付けるユーザ入力装置40と、音声データを基に、マイクアレイ20から指定箇所に対応する位置に向かう方向に、収音の指向性を形成し、指向性を有する方向の音声を強調した音声データを生成又は合成する指向性演算部57と、指向性処理後の音声データをスピーカ30に出力して再生させる音声出力部58と、を備える。
このように、撮像した対象空間の映像とともに音源位置を示す音源位置表示を表示することによって、音源位置を可視化でき、ユーザが容易に音源の位置を認識できる。また、指定箇所の指示入力に応じて収音の指向性を形成し、指向性を有する方向の音声を強調した音声データを生成又は合成することによって、ユーザが所望の音源位置を指定し、指定方向に指向性を形成した音声データを再生できる。これによって、対象領域内の所望の位置の音源からの音を簡便に収音して再生でき、ユーザの利便性を向上できる。
また、本実施形態の収音システムでは、音源解析部55により算出された音源位置が複数ある場合に、画像表示処理部52は、複数の音源位置のそれぞれに対応する音源位置表示91、92を生成してディスプレイ53に表示させる。
これにより、ユーザが音源位置表示によって複数の音源のそれぞれの音源位置を容易に認識できる。
また、本実施形態の収音システムでは、ユーザ入力装置40により複数の音源位置のうちの1つの音源位置に対応する指定箇所の指示を受け付けた場合、指向性演算部57は、指定箇所の音源位置に向かう方向の音声を強調した音声データを生成又は合成する。
これにより、ユーザが指定した指定箇所に対応する方向への指向性を形成し、指定された音源位置からの音を明瞭に再生できる。
また、本実施形態の収音システムでは、画像表示処理部52は、音源位置表示として、音源位置に対して所定値以下の音量レベルが小さい領域を示す静音領域表示を生成してディスプレイ53に表示させる。
これにより、対象空間において音量レベルが小さい領域を視覚化でき、ユーザに容易に認識させることができる。
また、本実施形態の収音方法は、カメラ10において対象空間の映像を撮像するステップと、複数のマイクロホン22を含むマイクアレイ20において音声を収音するステップと、収音された音声データに基づき音源位置を算出するステップと、撮像された対象空間画像90と音源位置を示す音源位置表示91、92とを含む画像データをディスプレイ53に表示させるステップと、表示された画像データにおける指定箇所の指示を受け付けるステップと、音声データを基に、マイクアレイ20から指定箇所に対応する位置に向かう方向に、収音の指向性を形成し、指向性を有する方向の音声を強調した音声データを生成又は合成するステップと、指向性処理後の音声データをスピーカ30に出力して再生させるステップと、を有する。
以上、図面を参照しながら各種の実施形態について説明したが、本発明はかかる例に限定されないことは言うまでもない。当業者であれば、特許請求の範囲に記載された範疇内において、各種の変更例又は修正例に想到し得ることは明らかであり、それらについても当然に本発明の技術的範囲に属するものと了解される。また、本発明の趣旨を逸脱しない範囲において、上記実施形態における各構成要素を任意に組み合わせてもよい。
本発明は、対象領域内の所望の音源からの音を収音する際の利便性を向上できる収音システム及び収音方法等として有用である。
10 カメラ
11 撮像デバイス
20 マイクアレイ
22、22A、22B マイクロホン
23 増幅器
24 A/D変換器
25 符号化部
26 送信部
30 スピーカ
40 ユーザ入力装置
50 画像表示装置
51 画像受信部
52 画像表示処理部
53 ディスプレイ
54 音声受信部
55 音源解析部
56 ユーザ入力受信部
57 指向性演算部
58 音声出力部
60 ネットワーク
81、82 発言者
85 講演者
90 対象空間画像
91、92 音源位置表示

Claims (5)

  1. 対象空間の映像を撮像する撮像部と、
    前記撮像部により撮像された画像データを表示する表示部と、
    複数のマイクロホンを含み、前記マイクロホンを用いて音声を収音する収音部と、
    前記収音部により収音された音声データを再生出力する音声再生部と、
    前記音声データに基づき音源位置を算出する音源解析部と、
    前記撮像された対象空間の映像と前記音源位置を示す音源位置表示とを含む画像データを前記表示部に表示させる画像表示処理部と、
    前記表示部に表示された前記画像データにおける指定箇所の指示を受け付ける指示入力部と、
    前記音声データを基に、前記収音部から、指定された前記画像データの指定箇所に対応する位置に向かう方向に、収音の指向性を形成し、前記指向性を有する方向の音声を強調した音声データを生成又は合成する指向性演算部と、
    前記指向性に関する処理後の音声データを前記音声再生部に出力して再生させる音声出力部と、
    を備える、収音システム。
  2. 請求項1に記載の収音システムであって、
    前記音源解析部により算出された音源位置が複数ある場合に、前記画像表示処理部は、複数の音源位置のそれぞれに対応する前記音源位置表示を生成して前記表示部に表示させる、収音システム。
  3. 請求項2に記載の収音システムであって、
    前記指示入力部により複数の音源位置のうちの1つの音源位置に対応する指定箇所の指示を受け付けた場合、前記指向性演算部は、前記指定箇所の音源位置に向かう方向の音声を強調した音声データを生成又は合成する、収音システム。
  4. 請求項1に記載の収音システムであって、
    前記画像表示処理部は、前記音源位置表示として、前記音源位置に対して所定値以下の音量レベルが小さい領域を示す静音領域表示を生成して前記表示部に表示させる、収音システム。
  5. 撮像部において対象空間の映像を撮像するステップと、
    複数のマイクロホンを含む収音部において音声を収音するステップと、
    前記収音された音声データに基づき音源位置を算出するステップと、
    前記撮像された対象空間の映像と前記音源位置を示す音源位置表示とを含む画像データを表示部に表示させるステップと、
    前記表示された前記画像データにおける指定箇所の指示を受け付けるステップと、
    前記音声データを基に、前記収音部から、指定された前記画像データの指定箇所に対応する位置に向かう方向に、収音の指向性を形成し、前記指向性を有する方向の音声を強調した音声データを生成又は合成するステップと、
    前記指向性に関する処理後の音声データを音声再生部に出力して再生させるステップと、
    を有する、収音方法。
JP2015022423A 2015-02-06 2015-02-06 収音システム及び収音方法 Pending JP2016146547A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2015022423A JP2016146547A (ja) 2015-02-06 2015-02-06 収音システム及び収音方法
US15/001,634 US10206030B2 (en) 2015-02-06 2016-01-20 Microphone array system and microphone array control method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015022423A JP2016146547A (ja) 2015-02-06 2015-02-06 収音システム及び収音方法

Publications (2)

Publication Number Publication Date
JP2016146547A true JP2016146547A (ja) 2016-08-12
JP2016146547A5 JP2016146547A5 (ja) 2018-03-01

Family

ID=56566295

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015022423A Pending JP2016146547A (ja) 2015-02-06 2015-02-06 収音システム及び収音方法

Country Status (2)

Country Link
US (1) US10206030B2 (ja)
JP (1) JP2016146547A (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018173139A1 (ja) * 2017-03-22 2018-09-27 ヤマハ株式会社 撮影収音装置、収音制御システム、撮影収音装置の制御方法、及び収音制御システムの制御方法
WO2019003716A1 (ja) * 2017-06-27 2019-01-03 共栄エンジニアリング株式会社 集音装置、指向性制御装置及び指向性制御方法
JP2021076866A (ja) * 2021-02-04 2021-05-20 ヤマハ株式会社 収音制御システム及び収音制御システムの制御方法
US11234074B2 (en) 2017-09-08 2022-01-25 Panasonic Intellectual Property Management Co., Ltd. Sound pickup device, sound pickup system, sound pickup method, program, and calibration method
JP2022533755A (ja) * 2019-05-20 2022-07-25 ノキア テクノロジーズ オサケユイチア 空間オーディオをキャプチャする装置および関連する方法
JP7324224B2 (ja) 2018-11-01 2023-08-09 株式会社新日本科学 会議支援システム

Families Citing this family (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9565493B2 (en) 2015-04-30 2017-02-07 Shure Acquisition Holdings, Inc. Array microphone system and method of assembling the same
US9554207B2 (en) 2015-04-30 2017-01-24 Shure Acquisition Holdings, Inc. Offset cartridge microphones
KR102465227B1 (ko) 2016-05-30 2022-11-10 소니그룹주식회사 영상 음향 처리 장치 및 방법, 및 프로그램이 저장된 컴퓨터 판독 가능한 기록 매체
US10367948B2 (en) 2017-01-13 2019-07-30 Shure Acquisition Holdings, Inc. Post-mixing acoustic echo cancellation systems and methods
US10558421B2 (en) * 2017-05-22 2020-02-11 International Business Machines Corporation Context based identification of non-relevant verbal communications
CN108200515B (zh) * 2017-12-29 2021-01-22 苏州科达科技股份有限公司 多波束会议拾音系统及方法
EP3804356A1 (en) 2018-06-01 2021-04-14 Shure Acquisition Holdings, Inc. Pattern-forming microphone array
US11297423B2 (en) 2018-06-15 2022-04-05 Shure Acquisition Holdings, Inc. Endfire linear array microphone
US10939030B2 (en) * 2018-09-07 2021-03-02 Canon Kabushiki Kaisha Video audio processing system and method of controlling the video audio processing system
CN112889296A (zh) 2018-09-20 2021-06-01 舒尔获得控股公司 用于阵列麦克风的可调整的波瓣形状
JP2022526761A (ja) 2019-03-21 2022-05-26 シュアー アクイジッション ホールディングス インコーポレイテッド 阻止機能を伴うビーム形成マイクロフォンローブの自動集束、領域内自動集束、および自動配置
US11558693B2 (en) 2019-03-21 2023-01-17 Shure Acquisition Holdings, Inc. Auto focus, auto focus within regions, and auto placement of beamformed microphone lobes with inhibition and voice activity detection functionality
EP3942842A1 (en) 2019-03-21 2022-01-26 Shure Acquisition Holdings, Inc. Housings and associated design features for ceiling array microphones
US11445294B2 (en) 2019-05-23 2022-09-13 Shure Acquisition Holdings, Inc. Steerable speaker array, system, and method for the same
EP3977449A1 (en) 2019-05-31 2022-04-06 Shure Acquisition Holdings, Inc. Low latency automixer integrated with voice and noise activity detection
KR102181643B1 (ko) * 2019-08-19 2020-11-23 엘지전자 주식회사 마이크의 배치 적합도를 결정하는 방법 및 이를 위한 장치
WO2021041275A1 (en) 2019-08-23 2021-03-04 Shore Acquisition Holdings, Inc. Two-dimensional microphone array with improved directivity
CN110769358B (zh) * 2019-09-25 2021-04-13 云知声智能科技股份有限公司 麦克风监控方法及装置
US11552611B2 (en) 2020-02-07 2023-01-10 Shure Acquisition Holdings, Inc. System and method for automatic adjustment of reference gain
USD944776S1 (en) 2020-05-05 2022-03-01 Shure Acquisition Holdings, Inc. Audio device
US11706562B2 (en) 2020-05-29 2023-07-18 Shure Acquisition Holdings, Inc. Transducer steering and configuration systems and methods using a local positioning system
CN111880146B (zh) * 2020-06-30 2023-08-18 海尔优家智能科技(北京)有限公司 声源定向方法和装置及存储介质
JP2024505068A (ja) 2021-01-28 2024-02-02 シュアー アクイジッション ホールディングス インコーポレイテッド ハイブリッドオーディオビーム形成システム
CN116419118A (zh) * 2021-12-31 2023-07-11 华为技术有限公司 一种输入检测装置、系统及其相关设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100254543A1 (en) * 2009-02-03 2010-10-07 Squarehead Technology As Conference microphone system
JP2012129873A (ja) * 2010-12-16 2012-07-05 Chubu Electric Power Co Inc 指定領域からの伝播音の再生方法とその装置
JP2012133250A (ja) * 2010-12-24 2012-07-12 Sony Corp 音情報表示装置、音情報表示方法およびプログラム
JP2012147420A (ja) * 2010-12-22 2012-08-02 Ricoh Co Ltd 画像処理装置、及び画像処理システム

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6529234B2 (en) * 1996-10-15 2003-03-04 Canon Kabushiki Kaisha Camera control system, camera server, camera client, control method, and storage medium
JP2004080121A (ja) 2002-08-12 2004-03-11 Audio Technica Corp 赤外線受信装置
JP4269883B2 (ja) * 2003-10-20 2009-05-27 ソニー株式会社 マイクロホン装置、再生装置及び撮像装置
US8965270B2 (en) 2012-12-04 2015-02-24 Revolabs, Inc. Audio system with centralized audio signal processing
JP5958833B2 (ja) * 2013-06-24 2016-08-02 パナソニックIpマネジメント株式会社 指向性制御システム
EP2879047A3 (en) * 2013-11-28 2015-12-16 LG Electronics Inc. Mobile terminal and controlling method thereof

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100254543A1 (en) * 2009-02-03 2010-10-07 Squarehead Technology As Conference microphone system
JP2012129873A (ja) * 2010-12-16 2012-07-05 Chubu Electric Power Co Inc 指定領域からの伝播音の再生方法とその装置
JP2012147420A (ja) * 2010-12-22 2012-08-02 Ricoh Co Ltd 画像処理装置、及び画像処理システム
JP2012133250A (ja) * 2010-12-24 2012-07-12 Sony Corp 音情報表示装置、音情報表示方法およびプログラム

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018173139A1 (ja) * 2017-03-22 2018-09-27 ヤマハ株式会社 撮影収音装置、収音制御システム、撮影収音装置の制御方法、及び収音制御システムの制御方法
JPWO2018173139A1 (ja) * 2017-03-22 2019-11-07 ヤマハ株式会社 撮影収音装置、収音制御システム、撮影収音装置の制御方法、及び収音制御システムの制御方法
US11227423B2 (en) 2017-03-22 2022-01-18 Yamaha Corporation Image and sound pickup device, sound pickup control system, method of controlling image and sound pickup device, and method of controlling sound pickup control system
WO2019003716A1 (ja) * 2017-06-27 2019-01-03 共栄エンジニアリング株式会社 集音装置、指向性制御装置及び指向性制御方法
JPWO2019003716A1 (ja) * 2017-06-27 2020-07-30 シーイヤー株式会社 集音装置、指向性制御装置及び指向性制御方法
JP7152786B2 (ja) 2017-06-27 2022-10-13 シーイヤー株式会社 集音装置、指向性制御装置及び指向性制御方法
US11234074B2 (en) 2017-09-08 2022-01-25 Panasonic Intellectual Property Management Co., Ltd. Sound pickup device, sound pickup system, sound pickup method, program, and calibration method
JP7324224B2 (ja) 2018-11-01 2023-08-09 株式会社新日本科学 会議支援システム
JP2022533755A (ja) * 2019-05-20 2022-07-25 ノキア テクノロジーズ オサケユイチア 空間オーディオをキャプチャする装置および関連する方法
JP7439131B2 (ja) 2019-05-20 2024-02-27 ノキア テクノロジーズ オサケユイチア 空間オーディオをキャプチャする装置および関連する方法
JP2021076866A (ja) * 2021-02-04 2021-05-20 ヤマハ株式会社 収音制御システム及び収音制御システムの制御方法
JP7111202B2 (ja) 2021-02-04 2022-08-02 ヤマハ株式会社 収音制御システム及び収音制御システムの制御方法

Also Published As

Publication number Publication date
US20160234593A1 (en) 2016-08-11
US10206030B2 (en) 2019-02-12

Similar Documents

Publication Publication Date Title
JP2016146547A (ja) 収音システム及び収音方法
US10924850B2 (en) Apparatus and method for audio processing based on directional ranges
EP3627860A1 (en) Audio conferencing using a distributed array of smartphones
JP5857674B2 (ja) 画像処理装置、及び画像処理システム
US10257611B2 (en) Stereo separation and directional suppression with omni-directional microphones
JP6289121B2 (ja) 音響信号処理装置、動画撮影装置およびそれらの制御方法
EP3304548B1 (en) Electronic device and method of audio processing thereof
JP6248930B2 (ja) 情報処理システムおよびプログラム
US20100254543A1 (en) Conference microphone system
US10497356B2 (en) Directionality control system and sound output control method
CN106960670B (zh) 一种录音方法和电子设备
JP6834971B2 (ja) 信号処理装置、信号処理方法、並びにプログラム
CN106790940B (zh) 录音方法、录音播放方法、装置及终端
CN106716526A (zh) 用于增强声源的方法和装置
US10200787B2 (en) Mixing microphone signals based on distance between microphones
WO2006057131A1 (ja) 音響再生装置、音響再生システム
JP2006211156A (ja) 音響装置
JP6835205B2 (ja) 撮影収音装置、収音制御システム、撮影収音装置の制御方法、及び収音制御システムの制御方法
Lin et al. Development of novel hearing aids by using image recognition technology
WO2018198790A1 (ja) コミュニケーション装置、コミュニケーション方法、プログラム、およびテレプレゼンスシステム
JP7361460B2 (ja) コミュニケーション装置、コミュニケーションプログラム、及びコミュニケーション方法
JP2016219965A (ja) 指向性制御システム及び音声出力制御方法
JP7111202B2 (ja) 収音制御システム及び収音制御システムの制御方法
JP2007180953A (ja) 携帯型音源捜索装置
JP3598384B2 (ja) 三者会話データ収録装置

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180115

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180115

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20181109

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20181120

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20181225

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20190319