JP7230427B2 - 音信号処理装置、ミキサ、および音信号処理方法 - Google Patents

音信号処理装置、ミキサ、および音信号処理方法 Download PDF

Info

Publication number
JP7230427B2
JP7230427B2 JP2018200308A JP2018200308A JP7230427B2 JP 7230427 B2 JP7230427 B2 JP 7230427B2 JP 2018200308 A JP2018200308 A JP 2018200308A JP 2018200308 A JP2018200308 A JP 2018200308A JP 7230427 B2 JP7230427 B2 JP 7230427B2
Authority
JP
Japan
Prior art keywords
sound
sound signal
channels
signal processing
beams
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2018200308A
Other languages
English (en)
Other versions
JP2020068466A (ja
Inventor
祐治 池ヶ谷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yamaha Corp
Original Assignee
Yamaha Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yamaha Corp filed Critical Yamaha Corp
Priority to JP2018200308A priority Critical patent/JP7230427B2/ja
Priority to US16/658,545 priority patent/US11102605B2/en
Priority to EP19204530.0A priority patent/EP3644588B1/en
Publication of JP2020068466A publication Critical patent/JP2020068466A/ja
Application granted granted Critical
Publication of JP7230427B2 publication Critical patent/JP7230427B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • H04S7/307Frequency adjustment, e.g. tone control
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/005Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/56Arrangements for connecting several subscribers to a common circuit, i.e. affording conference facilities
    • H04M3/568Arrangements for connecting several subscribers to a common circuit, i.e. affording conference facilities audio processing specific to telephonic conferencing, e.g. spatial distribution, mixing of participants
    • H04M3/569Arrangements for connecting several subscribers to a common circuit, i.e. affording conference facilities audio processing specific to telephonic conferencing, e.g. spatial distribution, mixing of participants using the instant speaker's algorithm
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R1/00Details of transducers, loudspeakers or microphones
    • H04R1/20Arrangements for obtaining desired frequency or directional characteristics
    • H04R1/32Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only
    • H04R1/40Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers
    • H04R1/406Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers microphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/04Circuits for transducers, loudspeakers or microphones for correcting frequency response
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R5/00Stereophonic arrangements
    • H04R5/04Circuit arrangements, e.g. for selective connection of amplifier inputs/outputs to loudspeakers, for loudspeaker detection, or for adaptation of settings to personal preferences or hearing impairments
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2203/00Aspects of automatic or semi-automatic exchanges
    • H04M2203/50Aspects of automatic or semi-automatic exchanges related to audio conference
    • H04M2203/509Microphone arrays
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2430/00Signal processing covered by H04R, not provided for in its groups
    • H04R2430/01Aspects of volume control, not necessarily automatic, in sound systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2430/00Signal processing covered by H04R, not provided for in its groups
    • H04R2430/20Processing of the output signals of the acoustic transducers of an array for obtaining a desired directivity characteristic
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/01Multi-channel, i.e. more than two input channels, sound reproduction with two speakers wherein the multi-channel information is substantially preserved
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/13Aspects of volume control, not necessarily automatic, in stereophonic sound systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Health & Medical Sciences (AREA)
  • Otolaryngology (AREA)
  • General Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)

Description

本発明の一実施形態は、音信号を処理する音信号処理装置、ミキサ、および音信号処理方法に関する。
特許文献1、特許文献2および非特許文献1には、音信号を処理する装置の一例として、オートマチックミキサが開示されている。非特許文献1に記載されている様に、オートマチックミキサにおけるゲイン制御の手法は、主にゲートタイプとゲインシェアリングタイプとの2種類存在する。ゲートタイプのゲイン制御は、複数の音信号のうち話者に対応する音信号を通過させ、他の音信号を遮断する。ゲインシェアリングタイプは、各音信号のレベルに応じたゲインを設定する。
特開2016-126136号公報 米国特許第3992584号公報
"Automatic Microphone Mixer"、[online]、平成25年4、[平成30年9月12日検索]、インターネット<URL:https://jp.yamaha.com/files/download/other_assets/8/329528/Automixer_WhitePaper_ja.pdf>
ゲートタイプのゲイン制御は、話者が変更されてから話者のマイクのゲインが上がるまでに時間差が生じる。そのため、新たな話者の発言の冒頭を収音することができない場合がある。
一方で、ゲインシェアリングタイプのゲイン制御は、話者の音声が複数のマイクに漏れて収音されると、最も話者に近いマイク以外のゲインが高くなるため、明瞭度が低下する。
そこで、本発明の一実施形態の目的は、発言の冒頭を適切に収音することができ、かつ明瞭度の低下も防止する音信号処理装置、ミキサおよび音信号処理方法を提供することにある。
本発明の一実施形態に係る音信号処理装置は、3チャンネル以上の音信号のうち2以上の一部チャンネルを所定の基準に基づき選択する選択手段と、前記選択手段で選択した前記一部チャンネルのうちそれぞれのチャンネルの音信号のゲインを、前記それぞれのチャンネルの音信号のレベルに応じて制御するゲイン制御部と、を備えている。
本発明の一実施形態によれば、発言の冒頭を適切に収音することができ、かつ明瞭度の低下も防止することができる。
アレイマイクロフォン1が設置された室内の立面図である。 アレイマイクロフォン1が設置された室内の平面図である。 アレイマイクロフォン1の構成を示すブロック図である。 アレイマイクロフォン1の下面図である。 AUTOMIX31の機能的構成を示すブロック図である。 AUTOMIX31の動作を示すフローチャートである。 アレイマイクロフォン1の動作を示すフローチャートである。 ビーム形成部21の機能的構成を示すブロック図である。 アレイマイクロフォン1が設置された室内の平面図である。 アレイマイクロフォン1が設置された室内の平面図である。 アレイマイクロフォン1が設置された室内の平面図である。 アレイマイクロフォン1Aの構成を示すブロック図である。 話者毎に設けられた複数のマイクの収音信号を入力する場合のアレイマイクロフォン1の構成を示すブロック図である。
本実施形態の音信号処理装置は、3チャンネル以上の音信号のうち2以上の一部チャンネルを所定の基準に基づき選択する選択手段と、前記選択手段で選択した前記一部チャンネルのうちそれぞれのチャンネルの音信号のゲインを、前記それぞれのチャンネルの音信号のレベルに応じて制御するゲイン制御部と、を備えている。
この様に、本実施形態の音信号処理装置は、まずゲートタイプのゲイン制御でチャンネル数を絞り込み、その後にゲインシェアリングタイプのゲイン制御を行なう。仮に、話者の音声が複数のマイクに漏れていたとしても、本実施形態のミキサは、ゲートタイプのゲイン制御でチャンネル数を絞り込むため、明瞭度の低下を防止することができる。また、本実施形態のミキサは、ゲインシェアリングタイプのゲイン制御を行なうため、発言の冒頭を適切に収音することができる。
なお、選択手段は、各チャンネルのレベルに基づいて、前記選択を行なうことが好ましい。選択手段は、例えば、最も高レベルの2つのチャンネルを選択する。これにより、チャンネルは、話者の音声を適切に収音しているマイクに絞り込まれるため、発言の冒頭を適切に収音することができ、かつ明瞭度の低下も防止することができる。
なお、ミキサは、複数のマイクと、前記複数のマイクの収音信号を用いて、3つ以上の収音ビームを形成し、前記3チャンネル以上の音信号として出力するビーム形成手段と、を備えていてもよい。
複数の収音ビームを形成する場合、ある程度の収音領域を有する。したがって、話者の音声は、複数の収音ビームのそれぞれに収音される可能性がある。そこで、本実施形態のミキサは、ゲートタイプのオートマチックミキサでビーム数を絞り込むため、明瞭度の低下を防止することができる。
特に、話者の音声は、隣接する複数の収音ビームのそれぞれに収音される可能性がある。そこで、選択手段は、前記3つ以上の収音ビームのうち、収音方向が互いに隣接する収音ビームは同時に選択しないことが好ましい。
以下、本実施形態の具体的構成について説明する。図1は、アレイマイクロフォン1が設置された室内の立面図であり、図2は平面図である。
アレイマイクロフォン1は、室内の天井に設置されている。アレイマイクロフォン1の直下には、会議机Tが設置されている。図1および図2の例では、会議机Tの周囲には、複数のユーザ(話者)h1、ユーザh2、ユーザh3およびユーザh4がいる。アレイマイクロフォン1は、厚みの薄い直方体形状の筐体を有する。図1の例では、アレイマイクロフォン1の上面が天井に設置されている。なお、アレイマイクロフォン1は、例えば天井に吊り下げられていてもよい。また、アレイマイクロフォン1は、天井タイルとして設置されてもよい。また、アレイマイクロフォン1は、室内の設備として備え付けられていてもよいが、交換可能に構成されていてもよい。アレイマイクロフォン1が天井タイルとして設置される場合、当該天井タイルが交換可能に構成される。また、本実施形態のアレイマイクロフォン1は、天井に設置される態様であるが、必ずしも天井に設置される必要はない。例えば、アレイマイクロフォン1は、壁面、机上、あるいは床面等に設置されていてもよい。
図3は、アレイマイクロフォン1の構成を示すブロック図である。アレイマイクロフォン1は、複数のマイク11-1乃至マイク11-n、ビーム形成部21、オートミキサ(AUTOMIX)31、インタフェース(I/F)41、および音源方向推定部25を備えている。図4は、アレイマイクロフォン1の動作を示すフローチャートである。
ビーム形成部21、AUTOMIX31、および音源方向推定部25は、それぞれハードウェアにより構成されてもよいが、ソフトウェアにより構成されていてもよい。ソフトウェアにより構成される場合、CPU等のプロセッサ(不図示)が、メモリ等の記憶媒体(不図示)に記憶されたソフトウェアを読み出して実行することでビーム形成部21、AUTOMIX31、および音源方向推定部25を構成する。なお、ソフトウェアは、アレイマイクロフォン1のメモリ等に記憶しておく必要はなく、サーバ等の他装置から都度ダウンロードして実行してもよい。
複数のマイク11-1乃至マイク11-nは、アレイマイクロフォン1の筐体の下面に配置されている。複数のマイク11-1乃至マイク11-nの収音方向は、アレイマイクロフォン1の下面に向けられている。
図4は、アレイマイクロフォン1を下面から見た図である。図4に示す多数の円は、複数のマイク11-1乃至マイク11-nを表す。複数のマイク11-1乃至マイク11-nは、図4に示す様に、平面配置されたアレイマイクを構成する。ただし、複数のマイク11-1乃至マイク11-nの配置は、図4に示す例に限るものではない。なお、複数のマイク11-1乃至マイク11-nは、無指向性マイクでも指向性マイクでもよい。
図3に示す様に、複数のマイク11-1乃至マイク11-nでそれぞれ収音した音信号(以下、収音信号と称する。)は、ビーム形成部21に入力される。ビーム形成部21は、複数のマイク11-1乃至マイク11-nの収音信号を所定の遅延量で遅延して合成する。これにより、ビーム形成部21は、所定の方向に強い感度を有する収音ビームを形成し、それぞれ異なるチャンネルの収音信号として出力する。ビーム形成部21は、複数の収音ビームを形成することができる。本実施形態の例では、最大で4つの収音ビーム(第1収音ビームb1、第2収音ビームb2、第3収音ビームb3、および第4収音ビームb4)を形成し、4チャンネルの収音信号を出力する。収音ビームの数、および各収音ビームの方向は、音源方向推定部25で推定した音源方向に基づいて決定される。
4つの収音ビームに係る4チャンネルの収音信号は、それぞれAUTOMIX31に入力される。AUTOMIX31は、本発明のミキサに相当する。
図5は、AUTOMIX31の機能的構成を示すブロック図である。図6は、AUTOMIX31の動作を示すフローチャートである。AUTOMIX31は、レベル検出部301、ゲート処理部302、およびゲインシェアリング処理部303を備えている。
レベル検出部301およびゲート処理部302は、4つの収音ビーム(第1収音ビームb1、第2収音ビームb2、第3収音ビームb3、および第4収音ビームb4)に係る4チャンネルの収音信号を入力する(S1)。
レベル検出部301は、各チャンネルの収音信号のレベルを検出する(S2)。レベル検出部301は、検出した各チャンネルの収音信号のレベルを比較する(S3)。この例では、レベル検出部301は、高レベルの収音信号2つを選択する。
ゲート処理部302は、選択手段に対応し、レベル検出部301で選択した2つのチャンネルの収音信号を通過させ、他のチャンネルの収音信号を遮断する、ゲート処理を行なう(S4)。ゲート処理部302は、ゲインシェアリング処理部303に、4つのチャンネルの収音信号のうち高レベルの2つチャンネルの収音信号のみ出力する。
ゲインシェアリング処理部303は、レベル検出部301から、各チャンネルの収音信号のレベルを示す情報を受信する。ゲインシェアリング処理部303は、機能的にゲイン制御部313と、ミキシング処理部323と、を備えている。ゲイン制御部313は、各チャンネルのレベルに応じて、それぞれのチャンネルの音信号のゲインを制御する(S5)。ミキシング処理部323は、音信号をミキシングする(S6)。具体的には、ミキシング処理部323は、ゲイン制御部313でゲイン調整されたそれぞれのチャンネルの音信号をミキシングする。このようにして、ゲインシェアリング処理部303は、各チャンネルのレベルに応じたゲインで収音信号をミキシングする、ゲインシェアリング処理を行なう。これにより、2つの収音ビームのうち高レベルの収音ビームが強調されるため、現在の話者の音声を明瞭に取得することができる。なお、ミキシング処理部323によるミキシング処理は本発明において必須ではない。ゲインシェアリング処理部303は、ゲイン制御部313でゲイン調整されたそれぞれのチャンネルの音信号をI/F41に出力してもよい。この場合、例えば、遠隔地の装置において、ゲイン調整されたそれぞれのチャンネルの音信号をミキシングしてもよい。
図2に示した様に、4つの収音ビームは、それぞれ異なる方向に向けられている。しかし、各収音ビームは、それぞれある程度の収音領域を有する。したがって、話者の音声は、各収音ビームのそれぞれに漏れて収音される可能性がある。特に、低音域の音は高音域の音よりも回り込み易い。したがって、4つの収音ビームの全ての信号でゲインシェアリング処理を行なうと、低音域が強調されやすくなり、こもった様な音になる可能性がある。一方で、仮にゲート処理部302が1つの収音ビームに絞り込むと、話者が変更された場合に、新たな話者に切り替わるまで時間差が生じる。そのため、新たな話者の発言の冒頭を収音することができない場合がある。
これに対して、本実施形態のAUTOMIX31は、まずゲート処理部302において4つの収音ビームを2つの収音ビームに絞り込む。これにより、ゲインシェアリング処理部303に入力される収音信号の数が絞り込まれる。よって、AUTOMIX31は、4つの収音ビームの全ての信号でゲインシェアリング処理を行なうよりも、明瞭度が向上する。また、AUTOMIX31は、最も高レベルの収音ビームだけでなく、次に高レベルの収音ビームの収音信号も用いてゲインシェアリング処理を行なう。他の収音ビームに係る収音信号もゲインシェアリング処理部303に入力されているため、話者が変更された場合でも新たな話者の発言の冒頭を適切に収音することができる。なお、上記例では、ゲート処理部302は、4つの収音ビームのうち高レベルの2つの収音ビームを選択した。しかし、選択する収音ビームの数は、2つではなく、3つでもよい。また、収音ビームの数は3つでもよいし、5つ以上でもよい。つまり、ゲート処理部302は、3チャンネル以上の音信号のうち2以上の一部チャンネルを選択すればよい。
なお、上記の例では、ゲート処理部302は、各チャンネルのレベルに基づいて、選択を行なった。しかし、ゲート処理部302は、後述する音源方向推定部25による推定結果を用いて、収音ビームを選択してもよい。
AUTOMIX31でミキシングされた収音信号は、I/F41に入力される。I/F41は、例えばUSB等の通信I/Fである。I/F41は、入力された収音信号を所定のデータ形式にエンコードし、パーソナルコンピュータ等の他装置に送信する。これにより、アレイマイクロフォン1は、収音した音声を遠隔地の装置に送信することができ、遠隔会議を実現することができる。なお、I/F41は、遠隔地の装置から音信号を受信してもよい。I/F41は、受信した音信号を不図示のスピーカに出力する。これにより、会議参加者は、遠隔地の音声を聞くことができる。
音源方向推定部25は、複数のマイクの収音信号を用いて音源方向を推定する(図7のフローチャートに示すS11)。音源方向推定部25は、例えば複数のマイクの収音信号の相互相関を算出することにより、音源方向を推定する。音源方向推定部25は、例えばある2つのマイクの収音信号の相互相関のピークを求めることで、これら2つのマイクに対する音源の方向を求めることができる。さらに、音源方向推定部25は、別の2つのマイクの収音信号の相互相関のピークを求めることで、これら別の2つのマイクに対する音源の方向を求めることができる。音源方向推定部25は、この様にして算出した複数の相互相関のピークに基づいて、音源方向を推定する。
2つのマイクによる音源方向の推定だけでは、1次元の方向(例えば平面方向または立面方向)しか推定できない。または、1次元の方向および音源との距離しか推定できない。しかし、音源方向推定部25は、平面配置されたアレイマイクから、2組以上の複数のマイクを選択して、複数の相互相関のピークを求める。これにより、音源方向推定部25は、2次元の方向(平面方向および立面方向)を推定する。また、音源方向推定部25は、2次元の方向に加えて、音源との距離も推定することができる。
また、推定する音源の数および精度は、マイクの数および算出する相互相関の数が多いほど向上する。本実施形態の音源方向推定部25は、2つの音源方向を推定する。すなわち、音源方向推定部25は、各相互相関についてさらに2つのピーク(レベルの大きい側から2つのピーク)を求めることで、2つの音源方向を推定する。
なお、音源方向の推定手法は、上記の例に限らない。音源方向推定部25は、例えば、ビーム形成部21で形成された複数方向の収音ビームのレベルを比較することでも、音源方向を推定することができる。この場合、ビーム形成部21は、予め室内の複数方向(例えば1000方向)に収音ビームを形成する。音源方向推定部25は、これら複数方向の収音ビームのレベルをそれぞれ求める。音源方向推定部25は、これら複数方向の収音ビームの空間的なレベル分布を求める。音源方向推定部25は、レベル分布に基づいて、音源の方向を複数推定する。
ただし、上述の様に多数(例えば1000方向)の収音ビームを形成し、空間的なレベル分布を求める場合、演算量が非常に大きい。また、相互相関のピークに基づいて音源方向を推定する場合、多数の音源方向を推定することが困難である。そこで、本実施形態のアレイマイクロフォン1は、演算量を抑えるために、音源方向の推定数を抑えながら、音源方向の推定数よりも収音ビームの数を多くして、多数の音源に対応する。
ビーム形成部21は、音源方向推定部25が推定した音源方向に基づいて収音ビームの数および方向を制御する。図8は、ビーム形成部21の機能的構成を示すブロック図である。
ビーム形成部21は、機能的に、比較器201、遅延計算部202、遅延部203-1、遅延部203-2、遅延部203-3、および遅延部203-4を備えている。遅延部203-1は、遅延器251-1乃至遅延器251-nおよび加算器255を備えている。遅延部203-1、遅延部203-2、遅延部203-3、および遅延部203-4は、それぞれ同じ構成を有する。
ビーム形成部21の各機能的構成は、ビーム形成部21を構成する不図示のCPUまたはDSP等のハードウェアがメモリからプログラムを読み出して実行することにより実現される。
比較器201は、音源方向推定部25が推定した音源方向の情報を入力する。この例では、比較器201は、第1の音源方向d1を示す情報および第2の音源方向d2を示す情報を入力する。第1の音源方向d1を示す情報は、平面方向を示す鉛直軸回りの角度θ1、および立面方向を示す水平軸回りの角度φ1、が含まれている。第2の音源方向d2を示す情報は、鉛直軸回りの角度θ2および水平軸回りの角度φ2が含まれている。鉛直軸回りの角度は、図2に示すように、アレイマイクロフォン1の筐体を平面視した所定方向(図2では右方向)を基準とした相対角度で表される。水平軸回りの角度は、図1に示すように、アレイマイクロフォン1の筐体を立面視した所定方向(図1では右方向)を基準とした相対角度で表される。
比較器201は、音源方向推定部25から入力された第1の音源方向d1および第2の音源方向d2に基づいて、収音ビームの数および方向を決定する。本実施形態では、最大で4つの収音ビームを形成する。したがって、比較器201は、第1収音ビームb1の方向を角度θ’1および角度φ’1に設定し、第2収音ビームb2の方向を角度θ’2および角度φ’2に設定し、第3収音ビームb3の方向を角度θ’3および角度φ’3に設定し、第4収音ビームb4の方向を角度θ’4および角度φ’4に設定する。
比較器201は、設定した各収音ビームの角度情報を、遅延計算部202に送信する。遅延計算部202は、受信した各収音ビームの角度情報に基づいて、遅延部203-1、遅延部203-2、遅延部203-3、および遅延部203-4における各遅延器251-1乃至遅延器251-nの遅延量を計算する。そして、遅延計算部202は、遅延部203-1、遅延部203-2、遅延部203-3、および遅延部203-4における各遅延器251-1乃至遅延器251-nの遅延量を設定する。遅延部203-1、遅延部203-2、遅延部203-3、および遅延部203-4における各遅延器251-1乃至遅延器251-nは、入力された収音信号を遅延して加算器255に出力する。加算器255は、これら収音信号を合成することで収音ビームを形成する。形成された収音ビームは、AUTOMIX31に出力される。
比較器201は、現在の各収音ビームの角度情報を、メモリ(不図示)に記憶している。比較器201は、第1の音源方向d1および第2の音源方向d2の角度と、現在の各収音ビームの角度と、を比較する(図7のフローチャートに示すS12)。
比較器201は、第1の音源方向d1および第2の音源方向d2のそれぞれについて、所定角度範囲内に収音ビームが存在するか否かを判断する(S13)。比較器201は、例えば角度θ1±5度および角度φ1±5度の範囲内に収音ビームが存在するか否かを判断する。比較器201は、第1の音源方向d1および第2の音源方向d2の両方について、所定角度範囲内に収音ビームが存在すると判断した場合、以後の処理をスキップする。これにより、現在の収音ビームの設定は保持される。
比較器201は、第1の音源方向d1または第2の音源方向d2のいずれかについて、所定角度範囲内に収音ビームが存在しないと判断した場合、現在のビーム数が最大数に達しているか否かを判断する(S14)。この例では、収音ビームの最大数は4である。したがって、比較器201は、現在、4つの収音ビームを形成しているか否かを判断する。
比較器201は、現在3つ以下の収音ビームを形成していると判断した場合、新たな収音ビームを形成する(S15)。比較器201は、新たな収音ビームの方向を、第1の音源方向d1または第2の音源方向d2に設定する。例えば、比較器201は、現在の収音ビームの数が3つである場合において、角度θ1±5度および角度φ1±5度の範囲内に収音ビームが存在しないと判断した場合に、第4収音ビームb4の角度θ’4および角度φ’4を、角度θ1および角度φ1に設定する。これにより、新たな第4収音ビームb4が音源方向に向けられる。
また、比較器201は、現在4つの収音ビームを形成していると判断した場合、最も過去に更新した収音ビームの角度を更新する(S16)。
図9および図10の平面図は、一例として、話者h1が発言を終了し、話者h2および新たな話者h5が発言を行なう場合を説明する図である。
この場合、音源方向推定部25は、話者h5の方向に第1の音源方向d1を推定する。また、音源方向推定部25は、話者h2の方向に第2の音源方向d2を推定する。この場合、比較器201は、第1の音源方向の所定角度範囲内(例えば角度θ1±5度および角度φ1±5度の範囲内)に収音ビームが存在しないと判断する。そして、図10の平面図に示す様に、比較器201は、例えば、最も過去に更新した収音ビームが第3収音ビームである場合に、第3収音ビームb3の角度θ’3および角度φ’3を、角度θ1および角度φ1に設定する。これにより、話者h5の方向に第3収音ビームb3が向けられる。
そして、仮に話者h5が発言を終了し、話者h1が発言を再開した場合でも、第1収音ビームb1が話者h1の方向に向けられているため、アレイマイクロフォン1は、話者h1の発言の冒頭を欠くこと無く収音することができる。また、ゲート処理部302において、第1収音ビームb1および第3収音ビームb3が選択されていれば、高い明瞭度で発言の冒頭を適切に収音することができる。
この様に、アレイマイクロフォン1は、音源方向の推定数よりも収音ビームの数を多くして、現在推定している音源方向以外にも収音ビームを向けている。したがって、アレイマイクロフォン1は、話者が変更された場合でも、既に他の方向に向けられた収音ビームで新たな話者の発言を収音することができる。よって、アレイマイクロフォン1は、演算量を抑えながらも、新たな話者の発言の冒頭を収音することができる。また、AUTOMIX31は、4つの収音ビームの全ての信号でゲインシェアリング処理を行なうよりも明瞭度が向上する。AUTOMIX31は、最も高レベルの収音ビームだけでなく、次に高レベルの収音ビームの収音信号も用いてゲインシェアリング処理を行なう。他の収音ビームに係る収音信号もゲインシェアリング処理部303に入力されているため、話者が変更された場合でも新たな話者の発言の冒頭を適切に収音することができる。
なお、更新対象の収音ビームは、最も過去に更新した収音ビームに限らない。例えば、比較器201は、推定した音源方向に角度が最も近い収音ビームを更新の対象としてもよい。
また、上述の様に、ゲート処理部302は、音源方向推定部25による推定結果を用いて、収音ビームを選択してもよい。つまり、ゲート処理部302は、音源方向推定部25が推定した音源方向に対応する収音ビームを選択する。この場合も、AUTOMIX31は、3チャンネル以上の音信号のうち2以上の一部チャンネルを選択してゲインシェアリング処理を行なうため、明瞭度が向上し、かつ話者が変更された場合でも新たな話者の発言の冒頭を適切に収音することができる。
なお、比較器201は、収音ビーム毎に担当するエリアを定めていてもよい。例えば、図11に示す様に、比較器201は、室内を平面視して、4つのエリアを設定する。そして、比較器201は、第1収音ビームの担当エリア(Area1)、第2収音ビームの担当エリア(Area2)、第3収音ビームの担当エリア(Area3)、および第4収音ビームの担当エリア(Area4)に設定する。そして、比較器201は、推定した音源方向が属するエリアを判断し、対応する収音ビームの角度を更新する。
比較器201は、エリア毎の音源方向の推定頻度を記録し、推定頻度に応じて更新対象とする収音ビームを決定してもよい。例えば、Area1で音源方向の推定頻度が高く、Area3で音源方向の推定頻度が低い場合、比較器201は、Area3を担当する第3収音ビームの角度を、Area1の方向に向けるように設定してもよい。
また、複数の収音ビームのうち少なくとも1つの収音ビームの収音方向は固定されていてもよい。固定する収音ビームの方向は、利用者が手動で設定してもよい。例えば、議長席等の発言頻度の高い話者が存在することが予め分かっている場合に、利用者は、収音ビームの方向を議長席の方向に設定する。これにより、アレイマイクロフォン1は、演算量をさらに抑えながらも、発言の冒頭を適切に収音することができる。
また、ゲート処理部302は、収音方向が互いに隣接する収音ビームを同時に選択しないようにしてもよい。特に、話者の音声は、隣接する複数の収音ビームのそれぞれに収音される可能性がある。そこで、ゲート処理部302は、収音方向が互いに隣接する収音ビームは同時に選択しないことで、より明瞭度を向上させることができる。
次に、図12は、エコーキャンセラをさらに備えたアレイマイクロフォン1Aの構成を示すブロック図である。図3のアレイマイクロフォン1と共通する構成には、同一の符号を付し、説明を省略する。図12のアレイマイクロフォン1Aは、ビーム形成部21、およびAUTOMIX31に接続されるAEC(エコーキャンセラ)50-1、AEC50-2、AEC50-3、およびAEC50-4を備えている。また、アレイマイクロフォン1Aは、音源方向推定部25および複数のマイクのいずれかにそれぞれ接続されるAEC51-1、AEC51-2、AEC51-3、およびAEC51-4を備えている。I/F41は、遠隔地の装置から音信号を受信する。I/F41は、受信した音信号をAEC51-1、AEC51-2、AEC51-3、およびAEC51-4に出力する。また、I/F41は、受信した音信号をAEC50-1、AEC50-2、AEC50-3、およびAEC50-4に出力する。
AEC51-1、AEC51-2、AEC51-3、およびAEC51-4は、それぞれ対応するマイクの収音信号を入力し、エコー成分を除去する処理を行なう。具体的には、AEC51-1、AEC51-2、AEC51-3、およびAEC51-4は、それぞれ、デジタルフィルタからなる。AEC51-1、AEC51-2、AEC51-3、およびAEC51-4は、スピーカからマイクに至る伝達関数を模擬したフィルタ係数を有する。AEC51-1、AEC51-2、AEC51-3、およびAEC51-4は、遠隔地の装置から受信した音信号をフィルタ処理することでエコー成分を模擬した擬似エコー信号を生成する。AEC51-1、AEC51-2、AEC51-3、およびAEC51-4は、マイクの収音信号から擬似エコー信号を除去する。これにより、音源方向推定部25は、エコー成分が除去された後の収音信号で音源方向を推定することができる。
AEC50-1、AEC50-2、AEC50-3、およびAEC50-4は、それぞれ第1収音ビームb1、第2収音ビームb2、第3収音ビームb3、および第4収音ビームb4に係る収音信号を入力し、エコー成分を除去する処理を行なう。エコー成分を除去する処理は、AEC51-1、AEC51-2、AEC51-3、およびAEC51-4と同様である。この様に、アレイマイクロフォン1Aは、収音ビームに係る収音信号からエコー成分を除去することで、全てのマイクの収音信号からエコー成分を除去するよりも演算量を抑えることができる。
なお、本実施形態では、AUTOMIX31は、複数の収音ビームに係る収音信号を入力した。しかし、ビーム形成部21によるビーム形成および音源方向推定部25による音源方向の推定は、必須ではない。例えば、図13に示す様に、AUTOMIX31は、話者毎に設けられた複数のマイク11-1乃至11-nの収音信号を入力してもよい。この場合も、AUTOMIX31は、3チャンネル以上の音信号のうち2以上の一部チャンネルを選択して、選択した一部チャンネルの音信号のゲインを、それぞれのチャンネルの音信号のレベルに応じて制御してミキシングする。
最後に、本実施形態の説明は、すべての点で例示であって、制限的なものではないと考えられるべきである。本発明の範囲は、上述の実施形態ではなく、特許請求の範囲によって示される。さらに、本発明の範囲は、特許請求の範囲と均等の範囲を含む。
1…アレイマイクロフォン
11-1~11-n…マイク
21…ビーム形成部
25…音源方向推定部
31…AUTOMIX
41…I/F
201…比較器
202…遅延計算部
203-1,203-2,203-3,203-4…遅延部
251-1~251-n…遅延器
255…加算器
301…レベル検出部
302…ゲート処理部
303…ゲインシェアリング処理部

Claims (16)

  1. 複数のマイクと、
    前記複数のマイクの収音信号を用いて、3つ以上の収音ビームを形成し、前記3つ以上の収音ビームに一対一で対応する3チャンネル以上の音信号を出力するビーム形成手段と、
    前記ビーム形成手段によって、形成された前記3チャンネル以上の音信号のうち2以上の一部チャンネルを所定の基準に基づき選択する選択手段と、
    前記選択手段で選択した前記一部チャンネルのうちそれぞれのチャンネルの音信号のゲインを、前記それぞれのチャンネルの音信号のレベルに応じて制御するゲイン制御部と、
    備え
    前記選択手段は、前記3つ以上の収音ビームの収音方向が互いに隣接する収音ビームに対応するチャンネルを同時に選択しない、
    音信号処理装置。
  2. 前記音信号をミキシングするミキシング処理部を備えた
    請求項1に記載の音信号処理装置。
  3. 前記ミキシング処理部は、前記ゲイン制御部でゲイン調整された前記それぞれのチャンネルの音信号をミキシングする、
    請求項2に記載の音信号処理装置。
  4. 前記選択手段は、各チャンネルのレベルに基づいて、前記選択を行なう、
    請求項1乃至請求項3のいずれか1項に記載の音信号処理装置。
  5. 前記選択手段は、最も高レベルの2つのチャンネルを選択する、
    請求項4に記載の音信号処理装置。
  6. 前記ビーム形成手段は、所定のエリア毎に収音ビームを形成する、
    請求項1乃至請求項5のいずれか1項に記載の音信号処理装置。
  7. 前記複数のマイクは、天井タイルとして設置される、
    請求項乃至請求項のいずれか1項に記載の音信号処理装置。
  8. 前記天井タイルは、交換可能に構成されている、
    請求項に記載の音信号処理装置。
  9. 前記複数のマイクは、平面配列されているアレイマイクロフォンを構成する、
    請求項乃至請求項のいずれか1項に記載の音信号処理装置。
  10. 請求項1乃至請求項のいずれか1項に記載の音信号処理装置を備えたミキサ。
  11. 複数のマイクの収音信号を用いて、3つ以上の収音ビームを形成し、前記3つ以上の収音ビームに一対一で対応する3チャンネル以上の音信号を出力することと、
    前記3チャンネル以上の音信号のうち2以上の一部チャンネルを選択することと、
    選択した前記一部チャンネルのうちそれぞれのチャンネルの音信号のゲインを、前記それぞれのチャンネルの音信号のレベルに応じて制御することと、
    を備え
    前記3つ以上の収音ビームのうち、収音方向が互いに隣接する収音ビームに対応するチャンネルを同時に選択しない、音信号処理方法。
  12. 前記音信号をミキシングすること
    を備えた請求項11に記載の音信号処理方法。
  13. 前記ミキシングすることは、前記制御することでゲイン調整された前記それぞれのチャンネルの音信号をミキシングすることを含む、
    請求項12に記載の音信号処理方法。
  14. 各チャンネルのレベルに基づいて、前記選択を行なう、
    請求項11乃至請求項13のいずれか1項に記載の音信号処理方法。
  15. 最も高レベルの2つのチャンネルを選択する、
    請求項14に記載の音信号処理方法。
  16. 所定のエリア毎に収音ビームを形成する、
    請求項11乃至請求項15のいずれか1項に記載の音信号処理方法。
JP2018200308A 2018-10-24 2018-10-24 音信号処理装置、ミキサ、および音信号処理方法 Active JP7230427B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2018200308A JP7230427B2 (ja) 2018-10-24 2018-10-24 音信号処理装置、ミキサ、および音信号処理方法
US16/658,545 US11102605B2 (en) 2018-10-24 2019-10-21 Audio signal processing apparatus and audio signal processing method
EP19204530.0A EP3644588B1 (en) 2018-10-24 2019-10-22 Audio signal processing apparatus, mixer and audio signal processing method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018200308A JP7230427B2 (ja) 2018-10-24 2018-10-24 音信号処理装置、ミキサ、および音信号処理方法

Publications (2)

Publication Number Publication Date
JP2020068466A JP2020068466A (ja) 2020-04-30
JP7230427B2 true JP7230427B2 (ja) 2023-03-01

Family

ID=68296370

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018200308A Active JP7230427B2 (ja) 2018-10-24 2018-10-24 音信号処理装置、ミキサ、および音信号処理方法

Country Status (3)

Country Link
US (1) US11102605B2 (ja)
EP (1) EP3644588B1 (ja)
JP (1) JP7230427B2 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111615035B (zh) * 2020-05-22 2021-05-14 歌尔科技有限公司 一种波束形成方法、装置、设备和存储介质
CN111970625B (zh) * 2020-08-28 2022-03-22 Oppo广东移动通信有限公司 录音方法和装置、终端和存储介质
WO2022239650A1 (ja) * 2021-05-11 2022-11-17 ピクシーダストテクノロジーズ株式会社 情報処理装置、情報処理方法、およびプログラム
EP4413745A1 (en) * 2021-10-04 2024-08-14 Shure Acquisition Holdings, Inc. Networked automixer systems and methods

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007013400A (ja) 2005-06-29 2007-01-18 Yamaha Corp 集音装置
JP2015211303A (ja) 2014-04-25 2015-11-24 日本電信電話株式会社 音声収音システム、音声再生システム
JP2018515028A (ja) 2015-04-30 2018-06-07 シュアー アクイジッション ホールディングス インコーポレイテッドShure Acquisition Holdings,Inc. アレイマイクシステム、及びアレイマイクシステムの組み立て方法

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3992584A (en) 1975-05-09 1976-11-16 Dugan Daniel W Automatic microphone mixer
US4449238A (en) 1982-03-25 1984-05-15 Bell Telephone Laboratories, Incorporated Voice-actuated switching system
JP2008048342A (ja) 2006-08-21 2008-02-28 Yamaha Corp 収音装置
US10181328B2 (en) * 2014-10-21 2019-01-15 Oticon A/S Hearing system
JP6524463B2 (ja) 2014-12-26 2019-06-05 Kddi株式会社 自動ミキシング装置およびプログラム
US9894434B2 (en) * 2015-12-04 2018-02-13 Sennheiser Electronic Gmbh & Co. Kg Conference system with a microphone array system and a method of speech acquisition in a conference system
US10375474B2 (en) * 2017-06-12 2019-08-06 Cisco Technology, Inc. Hybrid horn microphone
JP6345327B1 (ja) * 2017-09-07 2018-06-20 ヤフー株式会社 音声抽出装置、音声抽出方法および音声抽出プログラム

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007013400A (ja) 2005-06-29 2007-01-18 Yamaha Corp 集音装置
JP2015211303A (ja) 2014-04-25 2015-11-24 日本電信電話株式会社 音声収音システム、音声再生システム
JP2018515028A (ja) 2015-04-30 2018-06-07 シュアー アクイジッション ホールディングス インコーポレイテッドShure Acquisition Holdings,Inc. アレイマイクシステム、及びアレイマイクシステムの組み立て方法

Also Published As

Publication number Publication date
US20200137510A1 (en) 2020-04-30
EP3644588B1 (en) 2024-05-01
JP2020068466A (ja) 2020-04-30
US11102605B2 (en) 2021-08-24
EP3644588A1 (en) 2020-04-29

Similar Documents

Publication Publication Date Title
JP7334406B2 (ja) アレイマイクロフォンおよび収音方法
JP7230427B2 (ja) 音信号処理装置、ミキサ、および音信号処理方法
EP3627860B1 (en) Audio conferencing using a distributed array of smartphones
US10972835B2 (en) Conference system with a microphone array system and a method of speech acquisition in a conference system
US10257611B2 (en) Stereo separation and directional suppression with omni-directional microphones
JP5855571B2 (ja) オーディオズーム
CN108141665A (zh) 信号处理装置、信号处理方法和程序
WO2013049741A2 (en) Processing audio signals
CN104735582B (zh) 一种声音信号处理方法、装置及设备
US10152985B2 (en) Method for recording in video chat, and terminal
CN107113499B (zh) 定向音频捕获
WO2021019844A1 (ja) 収音装置、記憶媒体、及び収音方法
CN113766394B (zh) 音信号处理方法、音信号处理装置及音信号处理程序
US12058509B1 (en) Multi-device localization
CN110753297B (zh) 一种音频信号的混合处理方法及处理装置
Comminiello et al. Advanced intelligent acoustic interfaces for multichannel audio reproduction
JP2023057964A (ja) ビームフォーミングマイクロホンシステムとビームフォーミングマイクロホンシステムの収音プログラムおよび設定プログラムとビームフォーミングマイクロホンの設定装置とビームフォーミングマイクロホンの設定方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210823

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20220615

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220719

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220914

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230117

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230130

R151 Written notification of patent or utility model registration

Ref document number: 7230427

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151