JP7176316B2 - SOUND COLLECTION DEVICE, PROGRAM AND METHOD - Google Patents

SOUND COLLECTION DEVICE, PROGRAM AND METHOD Download PDF

Info

Publication number
JP7176316B2
JP7176316B2 JP2018174097A JP2018174097A JP7176316B2 JP 7176316 B2 JP7176316 B2 JP 7176316B2 JP 2018174097 A JP2018174097 A JP 2018174097A JP 2018174097 A JP2018174097 A JP 2018174097A JP 7176316 B2 JP7176316 B2 JP 7176316B2
Authority
JP
Japan
Prior art keywords
area
sound
areas
sound pickup
partial
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2018174097A
Other languages
Japanese (ja)
Other versions
JP2020048038A (en
Inventor
隆 矢頭
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP2018174097A priority Critical patent/JP7176316B2/en
Publication of JP2020048038A publication Critical patent/JP2020048038A/en
Application granted granted Critical
Publication of JP7176316B2 publication Critical patent/JP7176316B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

この発明は、収音装置、プログラム及び方法に関し、例えば、雑音環境下で用いられる音声通信システム等に適用し得る。 The present invention relates to a sound collecting device, program and method, and can be applied, for example, to a speech communication system used in a noisy environment.

雑音環境下で音声通信システムや音声認識応用システムを利用する場合、必要な目的音声と同時に混入する周囲の雑音は、良好なコミュニケーションを阻害し、音声認識率の低下をもたらす厄介な存在である。従来、このような複数の音源が存在する環境下において、特定の方向の音のみ分離・収音することで不要音の混入を避け必要な目的音を得る技術として、マイクアレイを用いたビームフォーマ(Beam Former;以下「BF」とも呼ぶ;特許文献2、3参照)がある。BFとは各マイクロホンに到達する信号の時間差を利用して指向性を形成する技術である。しかしBFだけでは収音を目的とするエリア(以下、「目的エリア」と呼ぶ)の周囲に他の音源が存在する場合、目的エリア内に存在する音(以下、「目的エリア音」と呼ぶ)だけを収音することが難しい。そのため、従来、特許文献1等により、複数のマイクアレイを用いて目的エリアを収音するエリア収音方式が提案されている。 When using a speech communication system or a speech recognition application system in a noisy environment, ambient noise mixed in with the required target speech is a troublesome existence that hinders good communication and lowers the speech recognition rate. Conventionally, in an environment where multiple sound sources exist, a beamformer using a microphone array has been used as a technology that separates and collects only the sound from a specific direction to avoid mixing in unwanted sounds and obtain the necessary target sound. (Beam Former; hereinafter also referred to as “BF”; see Patent Documents 2 and 3). BF is a technique of forming directivity using the time difference between signals reaching each microphone. However, with only BF, if there are other sound sources around the area for which sound is to be collected (hereinafter referred to as "target area"), the sound existing in the target area (hereinafter referred to as "target area sound") It is difficult to capture only For this reason, conventionally, Japanese Patent Laid-Open No. 2002-200001 and the like propose an area sound pickup method that picks up sound in a target area using a plurality of microphone arrays.

図25は、2つのマイクアレイMA100、MA200を用いて、目的エリアの音源からの目的エリア音を収音する処理について示した説明図(グラフ)である。 FIG. 25 is an explanatory diagram (graph) showing processing for picking up target area sound from a sound source in the target area using two microphone arrays MA100 and MA200.

図25(a)は、各マイクアレイMA100、MA200の構成例について示した説明図である。図25(b)、図25(c)は、それぞれ図25(a)に示すマイクアレイMA100、MA200のBF出力について周波数領域で示した図(グラフ形式のイメージ図)である。図25において各マイクアレイMA100、MA200は、それぞれ2つのマイクロホンch1、ch2により構成されている。 FIG. 25(a) is an explanatory diagram showing a configuration example of each of the microphone arrays MA100 and MA200. FIGS. 25(b) and 25(c) are diagrams (image diagrams in graph form) showing in the frequency domain the BF outputs of the microphone arrays MA100 and MA200 shown in FIG. 25(a), respectively. In FIG. 25, each of the microphone arrays MA100 and MA200 is composed of two microphones ch1 and ch2.

従来のエリア収音では、図25(a)に示すように、マイクアレイMA100、MA200の指向性を別々の方向から収音したいエリア(目的エリア)で交差させて収音する。図25(a)の状態では、各マイクアレイMA100、MA200の指向性に目的エリア内に存在する音(目的エリア音)だけでなく、目的エリア方向の雑音(非目的エリア音)も含まれている。しかし、図25(b)、図25(c)に示すように、マイクアレイMA100、MA200の指向性を周波数領域で比較すると、目的エリア音成分はどちらの出力にも含まれるが、非目的エリア音成分は各マイクアレイで異なることになる。従来のエリア収音技術では、このような特性を利用し、2つのマイクアレイMA100、MA200のBF出力に、共通に含まれる成分以外を抑圧することで目的エリア音のみ抽出することができる。 In the conventional area sound pickup, as shown in FIG. 25(a), the directivity of the microphone arrays MA100 and MA200 is crossed in areas (target areas) where sound is to be picked up from different directions. In the state of FIG. 25(a), the directivity of each of the microphone arrays MA100 and MA200 includes not only the sound existing in the target area (target area sound) but also the noise in the direction of the target area (non-target area sound). there is However, as shown in FIGS. 25(b) and 25(c), when the directivity of the microphone arrays MA100 and MA200 is compared in the frequency domain, the target area sound component is included in both outputs, but the non-target area The sound component will be different for each microphone array. In the conventional area sound pickup technique, using such characteristics, it is possible to extract only the target area sound by suppressing components other than those commonly included in the BF outputs of the two microphone arrays MA100 and MA200.

特開2014-072708号公報JP 2014-072708 A 特開2005-195955号公報JP 2005-195955 A 特開2016-127457号公報JP 2016-127457 A

ところで、サイレンが鳴り響く火災現場や、救急現場から指令センタ(消防本部)への緊急連絡の手段として、緊急車両には連絡用のハンドセット(送受話器)が備えられている。従来の緊急車両に搭載されるハンドセットは、利用環境が大騒音下であるが故、現場からの連絡が周囲の騒音でかき消されて、本部(例えば、緊急車両の搭乗員を指揮する本部)に正確な情報を伝えられず誤った情報となり、的確な判断の阻害や、対応の遅れなどの問題が生じるおそれがある。そのため、これまでもハンドセットについて様々な雑音除去技術の活用が検討されてきたが、通話品質の確保、コスト増大など導入には多くの課題があった。このような利用環境において、上述のエリア収音技術は有効な解決策として期待される。例えば、ハンドセットの送話口周辺に2つのマイクアレイを設置し、当該2つのマイクアレイのそれぞれの指向性を、送話口の前で交差させエリア収音を機能させることにより、サイレン等の大騒音を排除し、消防隊員等の送話者の音声だけを本部他に正確に伝達することが可能になる。 By the way, emergency vehicles are equipped with handsets (transceivers) for communication as a means of emergency communication from a fire site where a siren sounds or an emergency site to a command center (fire department). Conventional handsets installed in emergency vehicles are used in a noisy environment, so communication from the site is drowned out by the surrounding noise, resulting in a lack of communication from the headquarters (for example, the headquarters that directs the crew of the emergency vehicle). Accurate information cannot be conveyed, resulting in erroneous information. For this reason, the use of various noise reduction technologies for handsets has been investigated, but many problems have been encountered in the introduction of such technologies, such as securing call quality and increasing costs. In such a usage environment, the area sound pickup technology described above is expected to be an effective solution. For example, two microphone arrays are installed around the mouthpiece of a handset, and the directivity of each of the two microphone arrays is crossed in front of the mouthpiece to function as area sound pickup, thereby enabling a loud sound such as a siren. It is possible to eliminate noise and to accurately transmit only the voice of the caller such as a firefighter to the headquarters or the like.

エリア収音を実現するためには、少なくても2つのマイクアレイが必要である。一方、ハンドセットにおいて送話口部分の大きさは外形で直径6cm程度と小さく、そこにエリア収音実現のために2つのマイクアレイを装着する場合、それぞれのマイクアレイを非常に近接した状態で設置する必要がある。その結果、当該ハンドセットを用いたエリア収音において、収音エリアは送話器直近の非常に狭いエリアに限定される。しかしながら、ハンドセットに、従来のエリア収音処理を適用する場合、利用者(話者)によってハンドセットの持ち方や顔の大きさが異なり、口元が上述の狭く限定された収音エリア(ハンドセットについて設定される収音エリア)からずれる可能性がある。この場合、ハンドセットの収音エリアから利用者(話者)の口元がずれると、収音した音声の歪や脱落が生じ、安定した収音ができないという問題があった。 At least two microphone arrays are required to achieve area sound pickup. On the other hand, the size of the mouthpiece of a handset is as small as 6 cm in diameter, and when two microphone arrays are attached to achieve area sound pickup, the two microphone arrays are placed very close to each other. There is a need to. As a result, in area sound pickup using the handset, the sound pickup area is limited to a very narrow area in the immediate vicinity of the transmitter. However, when conventional area sound pickup processing is applied to a handset, the way of holding the handset and the size of the face differ depending on the user (speaker), and the mouth area is narrowly limited as described above (set for the handset). sound pickup area). In this case, if the mouth of the user (speaker) deviates from the sound pickup area of the handset, there is a problem that the sound picked up is distorted or dropped, and the sound cannot be picked up stably.

そのため、効率良く、かつ安定的にエリア収音を行うことができる収音装置、プログラム及び方法が望まれている。 Therefore, there is a demand for a sound collecting device, program, and method capable of efficiently and stably performing area sound collection.

第1の本発明の収音装置は、(1)複数の異なる指向性のマイクアレイを形成可能なマイクアレイ部からの入力信号に基づいて、2パターン以上の前記マイクアレイの組み合わせに基づき複数の収音エリアのエリア収音成分を取得するエリア収音手段と、(2)前記エリア収音手段が取得した前記収音エリアの全てをカバーする全エリアから分けられる2以上の前記収音エリアが重複する部分エリアと、前記収音エリア同士で重複しない部分エリアのそれぞれのエリア収音成分について、前記エリア収音手段が取得した各パターンの前記収音エリアのエリア収音成分に基づいて取得する部分エリア成分算出手段と、(3)前記部分エリア成分算出手段が算出した部分エリアのエリア収音成分から、1又は複数の部分エリアのエリア収音成分を選択し、選択されたエリア収音成分に基づく収音結果を取得する部分エリア選択手段とを有し、(4)前記マイクアレイ部は、N角形(Nは3以上の整数)の各頂点の位置となるように配置されたN個のマイクロホン、又は、N角形の各頂点の位置となるように配置されたN組のマイクロホンアレイを有することすることを特徴とする。 A sound collecting device according to a first aspect of the present invention provides: (1) a plurality of microphone arrays based on a combination of two or more patterns based on an input signal from a microphone array section capable of forming a plurality of microphone arrays with different directivities; and (2) two or more of the sound collection areas divided from the whole area covering all of the sound collection areas acquired by the area sound collection means. Area sound pickup components of overlapping partial areas and non-overlapping partial areas between the sound pickup areas are acquired based on the area sound pickup components of the sound pickup areas of each pattern acquired by the area sound pickup means. (3) selecting area picked-up sound components of one or a plurality of partial areas from the area picked-up sound components of the partial areas calculated by the partial area component calculating means, and calculating the selected area picked-up sound components; (4) the microphone array unit includes N microphone array units arranged at the positions of the vertices of an N-sided polygon (N is an integer equal to or greater than 3); , or N sets of microphone arrays arranged so as to be at the positions of the vertices of the N-sided polygon .

第2の本発明の収音プログラムは、コンピュータを、(1)複数の異なる指向性のマイクアレイを形成可能なマイクアレイ部からの入力信号に基づいて、2パターン以上の前記マイクアレイの組み合わせに基づき複数の収音エリアのエリア収音成分を取得するエリア収音手段と、(2)前記エリア収音手段が取得した前記収音エリアの全てをカバーする全エリアから分けられる2以上の前記収音エリアが重複する部分エリアと、前記収音エリア同士で重複しない部分エリアのそれぞれのエリア収音成分について、前記エリア収音手段が取得した各パターンの前記収音エリアのエリア収音成分に基づいて取得する部分エリア成分算出手段と、(3)前記部分エリア成分算出手段が算出した部分エリアのエリア収音成分から、1又は複数の部分エリアのエリア収音成分を選択し、選択されたエリア収音成分に基づく収音結果を取得する部分エリア選択手段として機能させ、(4)前記マイクアレイ部は、N角形(Nは3以上の整数)の各頂点の位置となるように配置されたN個のマイクロホン、又は、N角形の各頂点の位置となるように配置されたN組のマイクロホンアレイを有することを特徴とする。 A program for collecting sound according to a second aspect of the present invention provides a computer with: (1) a combination of two or more patterns of microphone arrays based on an input signal from a microphone array unit capable of forming a plurality of microphone arrays with different directivities; (2) two or more areas divided from the total area covering all of the sound pickup areas acquired by the area sound pickup means; Based on the area sound pickup components of the sound pickup areas of each pattern acquired by the area sound pickup means, for each of the area sound pickup components of the partial areas where the sound areas overlap and the partial areas where the sound areas do not overlap. (3) selecting area picked-up sound components of one or a plurality of partial areas from the area picked-up sound components of the partial areas calculated by the partial area component calculating means; (4) the microphone array section is arranged so as to be positioned at each vertex of an N-sided polygon (N is an integer equal to or greater than 3); It is characterized by having N microphones or N sets of microphone arrays arranged so as to correspond to the positions of the vertices of an N-sided polygon .

第3の本発明は、収音装置が行う収音方法において、(1)エリア収音手段、部分エリア成分算出手段、及び部分エリア選択手段を備え、(2)前記エリア収音手段は、複数の異なる指向性のマイクアレイを形成可能なマイクアレイ部からの入力信号に基づいて、2パターン以上の前記マイクアレイの組み合わせに基づき複数の収音エリアのエリア収音成分を取得し、(3)前記部分エリア成分算出手段は、前記エリア収音手段が取得した前記収音エリアの全てをカバーする全エリアから分けられる2以上の前記収音エリアが重複する部分エリアと、前記収音エリア同士で重複しない部分エリアのそれぞれのエリア収音成分について、前記エリア収音手段が取得した各パターンの前記収音エリアのエリア収音成分に基づいて取得し、(4)前記部分エリア選択手段は、前記部分エリア成分算出手段が算出した部分エリアのエリア収音成分から、1又は複数の部分エリアのエリア収音成分を選択し、選択されたエリア収音成分に基づく収音結果を取得し、(5)前記マイクアレイ部は、N角形(Nは3以上の整数)の各頂点の位置となるように配置されたN個のマイクロホン、又は、N角形の各頂点の位置となるように配置されたN組のマイクロホンアレイを有することを特徴とする。 A third aspect of the present invention is a sound collection method performed by a sound collection device, comprising: (1) area sound collection means, partial area component calculation means, and partial area selection means; acquiring area sound components of a plurality of sound pickup areas based on a combination of two or more patterns of the microphone arrays, based on an input signal from a microphone array unit capable of forming microphone arrays with different directivities; The partial area component calculation means calculates a partial area in which two or more of the sound collection areas overlap, divided from the entire area covering all of the sound collection areas acquired by the area sound collection means, and a partial area in which the sound collection areas overlap each other. (4) the partial area selection means acquires area sound pickup components of each non-overlapping partial area based on the area sound pickup components of the sound pickup areas of each pattern acquired by the area sound pickup means; Selecting area picked-up sound components of one or more partial areas from the area picked-up sound components of the partial areas calculated by the partial area component calculation means, obtaining sound pickup results based on the selected area picked-up sound components , (5 ) The microphone array section includes N microphones arranged at the positions of the vertices of an N-sided polygon (N is an integer equal to or greater than 3), or arranged at the positions of the vertexes of the N-sided polygon. It is characterized by having N sets of microphone arrays .

本発明によれば、効率良く、かつ安定的にエリア収音を行う収音装置を提供することができる。 According to the present invention, it is possible to provide a sound collection device that efficiently and stably performs area sound collection.

第1の実施形態に係る各装置の構成(実施形態に係る収音部(収音装置)の機能的構成を含む)について示したブロック図である。2 is a block diagram showing the configuration of each device (including the functional configuration of a sound pickup unit (sound pickup device) according to the embodiment) according to the first embodiment; FIG. 第1の実施形態に係るハンドセットの使用状態について示した図(斜視図)である。1 is a diagram (perspective view) showing a usage state of a handset according to the first embodiment; FIG. 第1の実施形態に係るハンドセットの送話口部分を拡大して示した図である。2 is an enlarged view of the mouthpiece portion of the handset according to the first embodiment; FIG. 3個のマイクロホンにより形成されるマイクアレイの構成例について示した説明図(イメージ図)である。FIG. 3 is an explanatory diagram (image diagram) showing a configuration example of a microphone array formed by three microphones; 3個のマイクロホンにより形成されるマイクアレイの各組み合わせ(組み合わせのパターン)に対応するエリア収音処理について示した説明図(イメージ図)である。FIG. 4 is an explanatory diagram (image diagram) showing area sound pickup processing corresponding to each combination (combination pattern) of microphone arrays formed by three microphones; 2つのマイクアレイの指向性を交差させた場合におけるエリア収音の感度の分布(計算上の感度の分布)を示した図である。FIG. 10 is a diagram showing a distribution of area sound pickup sensitivities (distribution of calculated sensitivities) when the directivities of two microphone arrays are crossed; マイクロホン数が2個の場合の減算型BFに係る構成を示すブロック図である。FIG. 11 is a block diagram showing a configuration related to a subtractive BF when the number of microphones is two; 2個のマイクロホンを用いた減算型BFにより形成される指向特性を示す図である。FIG. 4 is a diagram showing directivity characteristics formed by a subtractive BF using two microphones; 第2の実施形態に関連する各装置の構成について示したブロック図である。8 is a block diagram showing the configuration of each device related to the second embodiment; FIG. 第2の実施形態に係るマイクアレイ部における6つのマイクロホンの配置及びマイクアレイの構成例について示した図である。FIG. 10 is a diagram showing an arrangement of six microphones in a microphone array section and a configuration example of the microphone array according to the second embodiment; 第2の実施形態に係る目的エリア音抽出部がエリア収音をおこなう収音エリアの分布について示した説明図である。FIG. 11 is an explanatory diagram showing the distribution of sound pickup areas where the target area sound extraction unit according to the second embodiment performs area sound pickup. 第2の実施形態に係る収音エリアにおいて、複数の収音エリアで重複しない独立エリアと、複数の収音エリアで重複する重複エリアについて示した説明図である。FIG. 11 is an explanatory diagram showing independent areas that do not overlap with a plurality of sound pickup areas and overlapping areas that overlap with a plurality of sound pickup areas in the sound pickup areas according to the second embodiment; 第2の実施形態に係る各収音エリアの組成イメージ(成分ごとのパワー)を棒グラフの形式で示した説明図である。FIG. 11 is an explanatory diagram showing, in the form of a bar graph, a composition image (power of each component) of each sound pickup area according to the second embodiment; 第2の実施形態に係る独立エリア成分算出部による処理(その1:独立エリアのエリア収音成分を取得する処理)の手順を示した説明図である。FIG. 11 is an explanatory diagram showing a procedure of processing (part 1: processing for acquiring area sound pickup components of an independent area) by an independent area component calculation unit according to the second embodiment; 第2の実施形態に係る独立エリア成分算出部による処理(その2:重複エリアのエリア収音成分を取得する処理)の手順を示した説明図である。FIG. 11 is an explanatory diagram showing a procedure of processing (part 2: processing for acquiring area sound pickup components of overlapping areas) by the independent area component calculation unit according to the second embodiment; 第3の実施形態に関連する各装置の構成について示したブロック図である。FIG. 11 is a block diagram showing the configuration of each device related to the third embodiment; FIG. 第3の実施形態に係る通信装置(スマートホン)の平面図について示した図である。FIG. 11 is a diagram showing a plan view of a communication device (smartphone) according to a third embodiment; 第3の実施形態に係る3つの収音エリアのイメージについて示した説明図である。FIG. 11 is an explanatory diagram showing an image of three sound pickup areas according to the third embodiment; 第3の実施形態に係る3つの収音エリアにおける組み合わせパターン(第1~第3の組み合わせパターン)の分解イメージについて示した説明図である。FIG. 11 is an explanatory diagram showing an exploded image of combination patterns (first to third combination patterns) in three sound pickup areas according to the third embodiment; 第3の実施形態に係るエリアA、Dで生じる独立部分のイメージについて示した説明図である。FIG. 11 is an explanatory diagram showing an image of independent portions generated in areas A and D according to the third embodiment; 第3の実施形態に係るエリアB、Eで生じる独立部分のイメージについて示した説明図である。FIG. 11 is an explanatory diagram showing an image of independent portions occurring in areas B and E according to the third embodiment; 第3の実施形態に係るエリアC、Fで生じる独立部分のイメージについて示した説明図である。FIG. 11 is an explanatory diagram showing an image of an independent portion generated in areas C and F according to the third embodiment; 第3の実施形態に係る3つのエリアの重複部分のイメージについて示した説明図である。FIG. 11 is an explanatory diagram showing an image of overlapping portions of three areas according to the third embodiment; 実施形態に係るマイクアレイ部のマイクロホンの数を4つとした場合の構成(実施形態に係る変形例の構成)について示した説明図である。FIG. 11 is an explanatory diagram showing a configuration (configuration of a modification according to the embodiment) when the number of microphones in the microphone array section according to the embodiment is four; 従来の収音装置において、2つのマイクアレイのビームフォーマ(BF)による指向性を別々の方向から目的エリアへ向けた場合の構成例について示した説明図である。FIG. 10 is an explanatory diagram showing a configuration example of a conventional sound collecting device in which directivity of beamformers (BF) of two microphone arrays is directed from different directions to a target area.

(A)第1の実施形態
以下、本発明による収音装置、プログラム及び方法の第1の実施形態を、図面を参照しながら詳述する。この実施形態では、本発明の収音装置、プログラム及び方法を収音部に適用した例について説明する。
(A) First Embodiment Hereinafter, a first embodiment of the sound collecting device, program and method according to the present invention will be described in detail with reference to the drawings. In this embodiment, an example in which the sound collecting device, program, and method of the present invention are applied to a sound collecting unit will be described.

まず、この実施形態におけるマイクアレイを用いたエリア収音処理の基本的な原理について図4~図6を用いて説明する。 First, the basic principle of area sound pickup processing using a microphone array in this embodiment will be described with reference to FIGS. 4 to 6. FIG.

多角形の各頂点の位置にマイクロホンを配置すると、多角形の中心方向に複数のエリア収音を構築することが出来る。 By arranging a microphone at each vertex of the polygon, it is possible to construct multiple area sound pickups toward the center of the polygon.

例えば、3個のマイクロホンを用いたエリア収音の構成を考えた場合、図4に示すように、マイクロホンの組み合わせによって最大3個のマイクアレイ(指向性の方向の異なる3個のマイクアレイ)を設定することができる。図4に示すように、3個のマイクロホンch1~ch3では、マイクロホンch1、ch2を対とするマイクアレイMA301、マイクロホンch2、ch3を対とするマイクアレイMA302、及びマイクロホンch3、ch1を対とするマイクアレイMA303を設定することができる。 For example, when considering an area sound pickup configuration using three microphones, as shown in Fig. 4, a maximum of three microphone arrays (three microphone arrays with different directivity directions) can be used depending on the combination of microphones. can be set. As shown in FIG. 4, three microphones ch1 to ch3 include a microphone array MA301 paired with microphones ch1 and ch2, a microphone array MA302 paired with microphones ch2 and ch3, and a microphone array MA302 paired with microphones ch3 and ch1. Array MA303 can be configured.

さらに、3個のマイクロホンch1~ch3の構成では、図5に示すように、3個のマイクアレイMA301、MA302、MA303の組み合わせ(3通りの組み合わせのパターン)に応じたエリア収音が可能となる。 Furthermore, in the configuration of three microphones ch1 to ch3, as shown in FIG. 5, it is possible to pick up sound in an area corresponding to the combination (three combination patterns) of the three microphone arrays MA301, MA302, and MA303. .

図5(a)では、マイクアレイMA301の指向性を一点鎖線で図示し、マイクアレイMA302の指向性を二点鎖線で図示している。また、図5(b)では、マイクアレイMA302の指向性を一点鎖線で図示し、マイクアレイMA303の指向性を二点鎖線で図示している。さらに、図5(c)では、マイクアレイMA301の指向性を一点鎖線で図示し、マイクアレイMA303の指向性を二点鎖線で図示している。さらにまた、図5(a)では、マイクアレイMA301、MA302の組み合わせ(パターン)に応じた収音エリアA301にハッチ(斜線)を付している。また、図5(b)では、マイクアレイMA302、MA303の組み合わせ(パターン)に応じた収音エリアA302にハッチ(斜線)を付している。さらに、図5(c)では、マイクアレイMA301、MA303の組み合わせ(パターン)に応じた収音エリアA303にハッチ(斜線)を付している。 In FIG. 5(a), the directivity of the microphone array MA301 is indicated by a one-dot chain line, and the directivity of the microphone array MA302 is indicated by a two-dot chain line. In FIG. 5(b), the directivity of the microphone array MA302 is indicated by a one-dot chain line, and the directivity of the microphone array MA303 is indicated by a two-dot chain line. Furthermore, in FIG. 5(c), the directivity of the microphone array MA301 is indicated by a one-dot chain line, and the directivity of the microphone array MA303 is indicated by a two-dot chain line. Furthermore, in FIG. 5A, the sound pickup area A301 corresponding to the combination (pattern) of the microphone arrays MA301 and MA302 is hatched (slanted lines). Also, in FIG. 5B, the sound pickup area A302 corresponding to the combination (pattern) of the microphone arrays MA302 and MA303 is hatched (slanted lines). Furthermore, in FIG. 5(c), the sound pickup area A303 corresponding to the combination (pattern) of the microphone arrays MA301 and MA303 is hatched (slanted lines).

図5に示すように、3個のマイクロホンch1~ch3の構成では、いずれのマイクアレイでも、マイクアレイ同士(マイクアレイを構成する2つのマイクロホンの位置を結ぶ線分同士)で角度を有することから、互いの指向性を交差させて、組み合わせ毎に異なるエリア収音(異なる領域のエリア収音)が実現可能である。 As shown in FIG. 5, in the configuration of three microphones ch1 to ch3, any microphone array has an angle between the microphone arrays (line segments connecting the positions of two microphones constituting the microphone array). , by crossing each other's directivities, different area sound pickup (area sound pickup in different regions) can be realized for each combination.

一方、マイクアレイを用いたエリア収音の収音エリアは、マイクアレイの前方(マイクアレイから遠い方)に拡がる性質がある。以下、その性質について図6を用いて説明する。 On the other hand, the sound pickup area of area sound pickup using a microphone array has the property of expanding in front of the microphone array (farther from the microphone array). The properties will be described below with reference to FIG.

図6は、2つのマイクアレイMA400、MA500の指向性を互いに直角を成すように交差させた場合におけるエリア収音の感度の分布(計算上の感度の分布)を示した図である。言い換えると、図6では、2つのマイクアレイMA400、MA500の指向性が交差する領域及びその周辺におけるエリア収音の感度を図示している。なお、図6では、マイクアレイMA400、MA500は、それぞれ2つのマイクロホンch1、ch2を備えている。また、図6では、エリア収音の感度を5段階(0~-5dB、-5~-10dB、-10~-15dB、-15~-20dB、-20~-25dB)に分けて、段階ごとに異なるパターン(模様)を付している。図6に示すように、マイクアレイMA400、MA500から遠い方(すなわち、右下方向)に向けて感度が高い領域が伸びている状態となることが分かる。 FIG. 6 is a diagram showing a sensitivity distribution (calculated sensitivity distribution) for area sound pickup when the directivities of the two microphone arrays MA400 and MA500 are crossed so as to form a right angle. In other words, FIG. 6 illustrates the area sound pick-up sensitivity in and around the area where the directivities of the two microphone arrays MA400 and MA500 intersect. In FIG. 6, the microphone arrays MA400 and MA500 each have two microphones ch1 and ch2. In addition, in FIG. 6, the sensitivity of area sound pickup is divided into five stages (0 to -5 dB, -5 to -10 dB, -10 to -15 dB, -15 to -20 dB, -20 to -25 dB), and each stage have different patterns. As shown in FIG. 6, it can be seen that the high-sensitivity region extends farther from the microphone arrays MA400 and MA500 (that is, toward the lower right).

したがって、図5(a)の組み合わせ(マイクアレイMA301、MA302の組み合わせ)、図5(b)の組み合わせ(マイクアレイMA302、MA303の組み合わせ)、図5(c)の組み合わせ(マイクアレイMA303、MA301の組み合わせ)によるエリア収音の収音エリア(エリア収音の感度の分布)は、それぞれマイクアレイの組み合わせ毎に異なり、重なる部分とそうでない部分(感度の分布が一致する部分と一致しない部分)が生じることになる。 Therefore, the combination of FIG. 5(a) (the combination of microphone arrays MA301 and MA302), the combination of FIG. 5(b) (the combination of microphone arrays MA302 and MA303), the combination of FIG. The area sound pickup area (sensitivity distribution of area sound pickup) differs for each combination of microphone arrays. will occur.

すなわち、図5に示すように、3個のマイクロホンch1~ch3の構成において、異なる2つないし3つのマイクアレイの組み合わせでエリア収音を行い、それぞれの収音結果を足し合わせれば、1つのマイクアレイの組合せで実現した収音エリアより広い範囲のエリア収音が可能になる。 That is, as shown in FIG. 5, in the configuration of three microphones ch1 to ch3, area sound pickup is performed by combining two or three different microphone arrays, and if the respective sound pickup results are added, one microphone It is possible to pick up sound in a wider range than the sound pickup area achieved by combining arrays.

そこで、この実施形態では、多角形(N角形;Nは3以上の整数)の角頂点の位置に配置されたマイクロホンで形成される複数のマイクアレイのうち、異なる複数のマイクアレイの組み合わせ(組み合わせのパターン)でエリア収音を行い、それぞれのエリア収音結果(エリア収音の出力)を加算又は加算平均した結果を、最終的な目的エリアの収音結果として取り扱う処理を行うものとする。これにより、この実施形態のエリア収音処理では、結果として話者の口元の位置(送話器から見た話者の口元の位置)の差異に対して、より頑健なエリア収音(より安定的なエリア収音)を行うことができる。 Therefore, in this embodiment, a combination (combination pattern), and the result of adding or averaging the area sound collection results (output of area sound collection) is treated as the final sound collection result of the target area. As a result, in the area sound pickup processing of this embodiment, area sound pickup is more robust (more stable) against the difference in the position of the speaker's mouth (the position of the speaker's mouth as seen from the transmitter). area sound pickup) can be performed.

(A-1)第1の実施形態の構成
図1は、この実施形態に関連する各装置の構成について示したブロック図である。
(A-1) Configuration of First Embodiment FIG. 1 is a block diagram showing the configuration of each device related to this embodiment.

図1では、この実施形態に係る収音部120を備える通信装置100と、通信装置200とを図示している。また、図1では、通信装置100、200間は、通信路Pにより通信可能な構成となっている。 FIG. 1 illustrates a communication device 100 including a sound pickup unit 120 and a communication device 200 according to this embodiment. In addition, in FIG. 1, the communication apparatuses 100 and 200 are configured to be able to communicate with each other through a communication path P. As shown in FIG.

通信装置100は、第1のユーザU1が発話した音声(音)を収音し、収音した音声の音声データを通信路Pを介して通信装置200に送信するとともに、通信装置200から受信した音声データに基づく音声(第2のユーザU2が発話した音声)を表音出力する装置である。また、通信装置200は、第2のユーザU2が発話した音声(音)を収音し、収音した音声の音声データを通信路Pを介して通信装置100に送信するとともに、通信装置100から受信した音声データに基づく音声(第1のユーザU1が発話した音声)を表音出力する装置である。 The communication device 100 picks up the voice (sound) uttered by the first user U1, transmits voice data of the picked-up voice to the communication device 200 via the communication path P, and receives the voice data from the communication device 200. It is a device that phonetically outputs voice (speech uttered by the second user U2) based on voice data. Further, the communication device 200 collects voice (sound) uttered by the second user U2, transmits audio data of the collected voice to the communication device 100 via the communication path P, It is a device that phonetically outputs voice (speech uttered by the first user U1) based on the received voice data.

第1のユーザU1は、例えば、救急車や消防車等の緊急車両に登場する搭乗員等が該当し、第2のユーザU2としては、例えば、遠隔地(例えば、緊急車両を指揮する司令センタ)の司令担当者等が該当する。 The first user U1 is, for example, a crew member appearing in an emergency vehicle such as an ambulance or a fire engine. This applies to the commanding officer, etc.

通信路Pは、有線・無線に限定されず種々の接続手段や接続構成(ネットワーク構成)を適用することができる。 The communication path P is not limited to wired or wireless, and various connection means and connection configurations (network configurations) can be applied.

次に、通信装置100の構成概要について図1を用いて説明する。 Next, an overview of the configuration of the communication device 100 will be described with reference to FIG.

通信装置100は、ハンドセット110、収音部120、通信部130、及び出力部140を有している。 Communication device 100 includes handset 110 , sound pickup section 120 , communication section 130 and output section 140 .

ハンドセット110は、3個のマイクロホンMC1~MC3(3chマイクロホン)により構成されるマイクアレイ部111とスピーカ112とを備えている。 The handset 110 has a microphone array section 111 and a speaker 112, which are composed of three microphones MC1 to MC3 (3ch microphones).

通信部130は、通信路Pを介して通信装置200と通信するための通信インタフェースである。 The communication unit 130 is a communication interface for communicating with the communication device 200 via the communication path P. FIG.

収音部120は、マイクアレイ部111で捕捉した音響信号に基づいて第1のユーザU1の発話した音声(音)を収音する。そして、通信部130は、収音部120が収音した音声の音声データを通信装置200側に送信する。 The sound pickup unit 120 picks up the voice (sound) uttered by the first user U1 based on the acoustic signal captured by the microphone array unit 111 . Then, the communication unit 130 transmits audio data of the sound collected by the sound pickup unit 120 to the communication device 200 side.

出力部140は、通信部130を介して通信装置200から音声データ(第2のユーザU2が発話した音声の音声データ)を取得し、当該音声データに基づく音響信号をスピーカ112に供給し、スピーカ112に当該音響信号を表音出力させる。 The output unit 140 acquires voice data (speech data of voice uttered by the second user U2) from the communication device 200 via the communication unit 130, and supplies an acoustic signal based on the voice data to the speaker 112. 112 to phonetically output the acoustic signal.

通信装置100のハードウェア的な構成については限定されないものであるが、この実施形態の例では、図1に示すように、通信装置100は、ハードウェア的にはハンドセット110を備える電話機の構成となっているものとする。なお、通信装置100は、必ずしもハンドセット110を備える必要はなく、スマートホンのように筐体(シャーシ)全体が、実質的にハンドセットとして機能する構成(例えば、スマートホンの筐体の一部に送話口が設定された構成)としてもよい。 Although the hardware configuration of the communication device 100 is not limited, in this embodiment, as shown in FIG. It is assumed that Note that the communication device 100 does not necessarily include the handset 110, and the entire housing (chassis), like a smartphone, has a configuration that substantially functions as a handset (for example, transmission to a part of the housing of the smartphone). A configuration in which a mouth is set) may be used.

次に、通信装置200の構成概要について図1を用いて説明する。 Next, an overview of the configuration of the communication device 200 will be described using FIG.

通信装置200は、スピーカ210、マイク220、通信部230、出力部240、及び収音部250を有している。通信装置200のハードウェア構成についても限定されないものであるが、例えば、種々の電話装置(例えば、スピーカホン等)を適用することができる。 The communication device 200 has a speaker 210 , a microphone 220 , a communication section 230 , an output section 240 and a sound pickup section 250 . The hardware configuration of the communication device 200 is also not limited, but for example, various telephone devices (eg, speakerphones, etc.) can be applied.

通信部230は、通信路Pを介して通信装置200と通信するための通信インタフェースである。 The communication unit 230 is a communication interface for communicating with the communication device 200 via the communication path P. FIG.

収音部250は、マイク220で捕捉した音響信号に基づいて第2のユーザU2の発話した音声(音)を収音する。そして、通信部230は、収音部250が収音した音声の音声データを通信装置100側に送信する。 The sound pickup unit 250 picks up the voice (sound) uttered by the second user U2 based on the acoustic signal captured by the microphone 220 . Then, the communication unit 230 transmits audio data of the sound collected by the sound pickup unit 250 to the communication device 100 side.

出力部240は、通信部230を介して通信装置100から音声データ(第1のユーザU1が発話した音声の音声データ)を取得し、当該音声データに基づく音響信号をスピーカ210に供給し、スピーカ210に当該音響信号を表音出力させる。 The output unit 240 acquires voice data (speech data of voice uttered by the first user U1) from the communication device 100 via the communication unit 230, and supplies an acoustic signal based on the voice data to the speaker 210. 210 to output the acoustic signal phonetically.

次に、収音部120の詳細構成について図1を用いて説明する。 Next, a detailed configuration of the sound pickup unit 120 will be described with reference to FIG.

収音部120は、信号入力部121、周波数変換部122、指向性形成部123、目的エリア音抽出部124及びエリア音加算部125を有している。 The sound pickup unit 120 has a signal input unit 121 , a frequency conversion unit 122 , a directivity formation unit 123 , a target area sound extraction unit 124 and an area sound addition unit 125 .

収音部120は、例えば、プロセッサやメモリ等を備えるコンピュータにプログラム(実施形態に係る収音プログラムを含む)を実行させるようにしてもよいが、その場合であっても、機能的には、図1のように示すことができる。収音部120の各構成要素の処理の詳細については後述する。 For example, the sound pickup unit 120 may cause a computer having a processor, memory, etc. to execute a program (including the sound pickup program according to the embodiment). It can be shown as in FIG. Details of the processing of each component of the sound pickup unit 120 will be described later.

次に、送受話器としてのハンドセット110の構成について図2、図3を用いて説明する。 Next, the configuration of handset 110 as a handset will be described with reference to FIGS. 2 and 3. FIG.

図2は、ハンドセット110が第1のユーザU1の手U1aで把持されている状態について示した斜視図である。 FIG. 2 is a perspective view showing a state in which handset 110 is held by hand U1a of first user U1.

図2に示すようにハンドセット110は、第1のユーザU1(手U1a)に把持させるための棒形状の把手部115と、把手部115の一端に設けられた送話口113(送話器)と、把手部115の他端に設けられた受話口114(受話器)とを有している。 As shown in FIG. 2, the handset 110 includes a bar-shaped handle portion 115 to be held by the first user U1 (hand U1a), and a mouthpiece 113 (transmitter) provided at one end of the handle portion 115. and an earpiece 114 (receiver) provided at the other end of the handle portion 115 .

図3は、ハンドセット110の送話口113の部分を拡大して示した図である。 FIG. 3 is an enlarged view of the mouthpiece 113 portion of the handset 110. As shown in FIG.

図2、に示すように、受話口114にはスピーカ112が配置されている。また、図2、図3に示すように、円形の面を備える送話口113には、マイクアレイ部111(マイクロホンMC1~MC3)が配置されている。 As shown in FIG. 2, a speaker 112 is arranged in the earpiece 114 . Also, as shown in FIGS. 2 and 3, a microphone array section 111 (microphones MC1 to MC3) is arranged in a mouthpiece 113 having a circular surface.

次に、マイクアレイ部111の構成について、図2、図3を用いて説明する。 Next, the configuration of the microphone array section 111 will be described with reference to FIGS. 2 and 3. FIG.

この実施形態の例では、マイクアレイ部111は、3個のマイクロホンMC1~MC3を有する構成であるものとする。 In the example of this embodiment, the microphone array section 111 is configured to have three microphones MC1 to MC3.

図2に示すように、第1のユーザU1が通信装置100を手U1aで把持し、耳にスピーカSPを押し付けた場合に、第1のユーザU1の口元が位置する送話口113の周囲(第1のユーザU1の口元と最も近接する部分の周囲)に3個のマイクロホンMC1~MC3が配置されている。 As shown in FIG. 2, when the first user U1 holds the communication device 100 with the hand U1a and presses the speaker SP against the ear, the circumference of the mouthpiece 113 where the mouth of the first user U1 is located ( Three microphones MC1 to MC3 are arranged around the part closest to the mouth of the first user U1.

図2、図3に示すハンドセット110では、上述の図4、図5に示す構成と同様に、マイクアレイ部111を構成する3個のマイクロホンMC1~MC3の各位置(各マイクロホンの中心位置)が、送話口113の周囲上で、正三角形の頂点となるように配置されている。図2、図3では、収音エリアの拡大を等方向とするため、マイクロホンMC1~MC3による三角形の各辺を同じ距離(マイクロホンMC1~MC3による三角形が正三角形)としているが、各辺の距離や各角の角度は全て同じでなくてもよい。 In the handset 110 shown in FIGS. 2 and 3, each position (center position of each microphone) of the three microphones MC1 to MC3 constituting the microphone array section 111 is the same as the configuration shown in FIGS. , are arranged on the periphery of the mouthpiece 113 so as to form vertices of an equilateral triangle. In FIGS. 2 and 3, each side of the triangle formed by the microphones MC1 to MC3 has the same distance (the triangle formed by the microphones MC1 to MC3 is an equilateral triangle) in order to expand the sound pickup area in an isotropic direction. and angles of each angle may not be the same.

なお、図3に示すように、以下では、マイクアレイ部111において、マイクロホンMC1、MC2を対とするマイクアレイをMA1、マイクロホンMC2、MC3を対とするマイクアレイをMA2、マイクロホンMC3、MC1を対とするマイクアレイをMA3と呼ぶものとする。 As shown in FIG. 3, in the microphone array unit 111, the microphone array paired with the microphones MC1 and MC2 is MA1, the microphone array paired with the microphones MC2 and MC3 is MA2, and the microphones MC3 and MC1 are paired. A microphone array with the following is called MA3.

(A-2)第1の実施形態の動作
次に、以上のような構成を有するこの実施形態の動作(実施形態に係る収音方法)を説明する。
(A-2) Operation of First Embodiment Next, the operation of this embodiment having the above configuration (sound pickup method according to the embodiment) will be described.

通信装置100では、収音部120が、マイクアレイ部111のマイクロホンMC1~MC3から供給される音響信号を用いて、目的エリアの目的エリア音を収音する目的エリア音収音処理を行う。 In the communication device 100, the sound pickup unit 120 uses acoustic signals supplied from the microphones MC1 to MC3 of the microphone array unit 111 to perform target area sound pickup processing for picking up the target area sound of the target area.

以下では、通信装置100を構成する収音部120内部の動作を中心に説明する。 The operation inside the sound pickup unit 120 constituting the communication device 100 will be mainly described below.

信号入力部121は、各マイクロホンMC1~MC3で収音した音響信号をアナログ信号からデジタル信号に変換し、周波数変換部122に供給する。その後、周波数変換部122では、例えば高速フーリエ変換を用いてマイク信号を時間領域から周波数領域へ変換する。指向性形成部123はBFにより指向性を形成する。 The signal input unit 121 converts the acoustic signals picked up by the microphones MC1 to MC3 from analog signals to digital signals, and supplies the digital signals to the frequency conversion unit 122 . After that, the frequency transform unit 122 transforms the microphone signal from the time domain to the frequency domain using, for example, fast Fourier transform. The directivity forming unit 123 forms directivity by BF.

ここで、図7、図8を用いてBFによる指向性形成について説明する。 Here, directivity formation by BF will be described with reference to FIGS. 7 and 8. FIG.

BFとは、マイクアレイにおいて各マイクロホンに到達する信号の時間差を利用して収音の指向性を形成する技術である(非特許文献1参照)。BFは加算型と減算型の大きく2つの種類に分けられが、ここでは少ないマイクロホン数で指向性を形成できる減算型BFについて説明する。 BF is a technique for forming the directivity of sound pickup using the time difference between signals reaching each microphone in a microphone array (see Non-Patent Document 1). BFs are broadly classified into two types: addition type and subtraction type. Here, a subtraction type BF capable of forming directivity with a small number of microphones will be described.

図7は、マイクロホン数が2個(MC1、MC2)の場合の減算型BF600に係る構成を示すブロック図である。 FIG. 7 is a block diagram showing the configuration of the subtractive BF 600 when the number of microphones is two (MC1, MC2).

図8は、2個のマイクロホンMC1、MC2を用いた減算型BF600により形成される指向特性を示す図である。 FIG. 8 is a diagram showing directivity characteristics formed by a subtractive BF 600 using two microphones MC1 and MC2.

減算型BF600は、まず遅延器610により目的とする方向に存在する音(以下、「目的音」と呼ぶ)が各マイクロホンMC1、MC2に到来する信号の時間差を算出し、遅延を加えることにより目的音の位相を合わせる。時間差は(1)式により算出される。ここで、dはマイクロホンMC1、MC2間の距離、cは音速、τは遅延量を示している。またθは、マイクロホンMC1、M2の位置を結んだ直線に対する垂直方向から目的方向への角度を示している。 The subtraction type BF 600 first calculates the time difference between the signals of the sound existing in the target direction (hereinafter referred to as the “target sound”) arriving at each of the microphones MC1 and MC2 using the delay device 610, and adds a delay to the target sound. Match the phase of the sound. The time difference is calculated by equation (1). Here, d is the distance between the microphones MC1 and MC2, c is the speed of sound, and τi is the amount of delay. θ L indicates the angle from the direction perpendicular to the straight line connecting the positions of the microphones MC1 and M2 to the target direction.

ここで、死角がマイクロホンMC1とマイクロホンMC2の中心に対し、マイクロホンMC1の方向に存在する場合、遅延器610は、マイクロホンMC1の入力信号x(t)に対し遅延処理を行う。その後、減算器620が、(2)式に従い減算処理を行う。減算器620では、この減算処理は周波数領域でも同様に行うことができ、その場合(2)式は(3)式のように変更される。

Figure 0007176316000001
Here, when a blind spot exists in the direction of the microphone MC1 with respect to the center of the microphone MC1 and the microphone MC2, the delay device 610 performs delay processing on the input signal x 1 (t) of the microphone MC1. After that, the subtractor 620 performs subtraction processing according to equation (2). In the subtractor 620, this subtraction process can be performed in the frequency domain as well, in which case equation (2) is changed to equation (3).
Figure 0007176316000001

ここでθ=±π/2の場合、形成される指向性は図8(a)に示すように、カージオイド型の単一指向性となり、θ=0,πの場合は、図8(b)のような8の字型の双指向性となる。また、減算器620では、スペクトル減算法(Spectral Subtraction)の処理(以下、単に「SS」とも呼ぶ)を用いることで、双指向性の死角に強い指向性を形成することもできる。SSによる指向性は、(4)式に従い全周波数、もしくは指定した周波数帯域で形成される。(4)式では、マイクロホンMC1の入力信号Xを用いているが、マイクロホンMC2の入力信号Xでも同様の効果を得ることができる。ここで、nはフレーム番号、βはSSの強度を調節するための係数を示している。減算器620では、減算時に値がマイナスなった場合は、0または元の値を小さくした値に置き換えるフロアリング処理を行うようにしてもよい。この方式では、双指向性の特性によって目的方向以外に存在する音(以下、「非目的音」と呼ぶ)を抽出し、抽出した非目的音の振幅スペクトルを入力信号の振幅スペクトルから減算することで、目的音を強調することができる。

Figure 0007176316000002
Here, when θ L =±π/2, the formed directivity is cardioid unidirectional as shown in FIG. 8(a ) . Figure 8 bi-directivity as shown in (b) is obtained. In addition, the subtractor 620 can also form strong directivity in bi-directional blind spots by using Spectral Subtraction processing (hereinafter also simply referred to as “SS”). Directivity by SS is formed in all frequencies or in a specified frequency band according to the equation (4). Although the input signal X1 of the microphone MC1 is used in the equation ( 4 ), the same effect can be obtained with the input signal X2 of the microphone MC2. Here, n indicates a frame number, and β indicates a coefficient for adjusting the strength of SS. In the subtractor 620, if the value becomes negative during subtraction, flooring processing may be performed in which the value is replaced with 0 or a smaller value than the original value. In this method, sound existing in directions other than the target direction (hereinafter referred to as "non-target sound") is extracted due to bidirectional characteristics, and the amplitude spectrum of the extracted non-target sound is subtracted from the amplitude spectrum of the input signal. can emphasize the target sound.
Figure 0007176316000002

ところで、ある特定の目的エリア内に存在する目的エリア音だけを収音したい場合、減算型BFを用いるだけでは、そのエリアと同一方向の線上に存在する音源(以下、「非目的エリア音」と呼ぶ)も収音してしまう。 By the way, when it is desired to pick up only the target area sound existing in a certain target area, only using the subtractive BF will not detect the sound source existing on the line in the same direction as the area (hereinafter referred to as "non-target area sound"). call) will also be picked up.

そこで、指向性形成部123では、特許文献1で提案されているエリア収音処理(複数のマイクアレイを用い、それぞれ別々の方向から目的エリアへ指向性を向け、指向性を目的エリアで交差させることで目的エリア音を収音する処理)を行うものとして説明する。具体的には、指向性形成部123は、以下のような処理によりエリア収音処理を行うようにしてもよい。 Therefore, in the directivity forming unit 123, the area sound pickup processing proposed in Patent Document 1 (using a plurality of microphone arrays, directing the directivity from each different direction to the target area, and making the directivity cross at the target area Processing for collecting the target area sound) will be described. Specifically, the directivity forming unit 123 may perform area sound pickup processing by the following processing.

指向性形成部123は、マイクアレイMA1~MA3のそれぞれについて、三角形(マイクロホンMC1~MC3により形成される三角形)の内側に向かってBFによって指向性を形成する。そして、指向性形成部123は、マイクアレイMA1、MA2、MA3の各BF出力Y(n)、Y(n)、Y(n)を、目的エリア音抽出部124に供給する。 The directivity forming unit 123 forms directivity by BF toward the inside of the triangle (the triangle formed by the microphones MC1 to MC3) for each of the microphone arrays MA1 to MA3. Then, directivity forming section 123 supplies BF outputs Y 1 (n), Y 2 (n), and Y 3 (n) of microphone arrays MA 1 , MA 2 , and MA 3 to target area sound extracting section 124 .

目的エリア音抽出部124は、指向性形成部123で形成したマイクアレイMA1、MA2、MA3のBF出力Y(n)、Y(n)、Y(n)を用いてエリア音を抽出する。上述の通り、各BF出力(Y(n)、Y(n)、Y(n))は、3角形(マイクロホンMC1~MC3により形成される三角形)の各辺から中心(三角形の内側方向)に向かう指向性を成したものである。したがって、各BF出力は、そのいずれの2つの組み合せ(組み合わせのパターン)においても2つの指向性が3角形の中心付近で交差するため、目的エリア音抽出部124は、以下に記すエリア収音方法によって、互いの指向性が交差したエリアの音を抽出することが出来る。ここでは、代表として、マイクアレイMA1のBF出力Y(n)と、マイクアレイMA2のBF出力Y(n)を用いた場合について説明する。目的エリア音抽出部124は、Y(n)、Y(n)を(5)、もしくは(6)式に従いSSし、目的エリア方向に存在する非目的エリア音N1-1(n)、N1-2(n)を抽出する。ここでα、αは、目的エリアと各マイクアレイの距離の違いによって生じる信号レベルの差を補正する補正係数であり、所定の処理によって逐一計算されるべきものであり、その手法は特許文献1にも記載されているが、ここでは簡単のため、目的エリアと各マイクアレイまでの距離は同一(α(n)=α(n)=1)とし、(5)、(6)式を(7)、(8)式に代える。

Figure 0007176316000003
The target area sound extraction unit 124 extracts the area sound using the BF outputs Y 1 (n), Y 2 (n), and Y 3 (n) of the microphone arrays MA1, MA2, and MA3 formed by the directivity formation unit 123. do. As described above, each BF output (Y 1 (n), Y 2 (n), Y 3 (n)) is generated from each side of the triangle (the triangle formed by microphones MC1-MC3) to the center (the inner side of the triangle). direction). Therefore, in each BF output, the two directivities intersect near the center of the triangle in any two combinations (combination patterns). can extract the sound in the area where the directivities intersect with each other. Here, as representatives, the case where the BF output Y 1 (n) of the microphone array MA1 and the BF output Y 2 (n) of the microphone array MA2 are used will be described. The target area sound extraction unit 124 performs SS on Y 1 (n) and Y 2 (n) according to formula (5) or (6), and extracts non-target area sounds N 1-1 (n) existing in the direction of the target area. , N 1-2 (n). Here, α 1 and α 2 are correction coefficients for correcting signal level differences caused by differences in distance between the target area and each microphone array, and should be calculated one by one by a predetermined process. Although described in Reference 1, here, for simplicity, the distances from the target area to each microphone array are assumed to be the same (α 1 (n)=α 2 (n)=1), and (5), (6) ) is replaced with equations (7) and (8).
Figure 0007176316000003

その後、目的エリア音抽出部124は、(9)、(10)式に従い、各BF出力から非目的エリア音をSSして目的エリア音を抽出する。ここで、γ(n)、γ(n)はSS時の強度を変更するための係数である。

Figure 0007176316000004
After that, the target area sound extraction unit 124 extracts the target area sound by SSing the non-target area sound from each BF output according to formulas (9) and (10). Here, γ 1 (n) and γ 2 (n) are coefficients for changing the intensity during SS.
Figure 0007176316000004

目的エリア音抽出部124において、強調音Z1-1(n)、Z1-2(n)のうちいずれを出力としても構わないが、ここではZ1-1(n)をマイクアレイMA1-マイクアレイMA2の組み合せ(組み合わせのパターン)によるエリア収音出力Z(n)として用いることとする。 In the target area sound extraction unit 124, any one of the emphasized sounds Z 1-1 (n) and Z 1-2 (n) may be output . It is used as the area sound pickup output Z 1 (n) by the combination (combination pattern) of the microphone array MA2.

同様にして目的エリア音抽出部124は、マイクアレイMA2-マイクアレイMA3の組み合せによるエリア収音出力Z(n)、及びマイクアレイMA3-マイクアレイMA1の組み合せによるエリア収音出力Z(n)を抽出し、エリア音加算部125へ供給する。 Similarly, the target area sound extraction unit 124 obtains an area picked-up sound output Z 2 (n) by the combination of the microphone array MA2 and the microphone array MA3, and an area picked-up sound output Z 3 (n) by the combination of the microphone array MA3 and the microphone array MA1. ) is extracted and supplied to the area sound addition unit 125 .

図2に示すように、マイクロホンMC1~MC3は、いずれもハンドセット110の送話口113における数センチ径の狭い範囲に装着されている。したがって、各マイクアレイMA1、MA2、MA3は、非常に近接(密集)した配置であり、それぞれの収音エリアも送話口113前の狭い範囲に限られる。しかし、上述の図6に示すように、エリア収音による収音エリアは、2つのマイクアレイの遠方方向に拡がる特性があることが判っている。したがって、それぞれ異なる3方向に拡がった収音エリア(Z(n)、Z(n)、Z(n)のそれぞれに対応する収音エリア)を重ね合わせれば、単独の収音エリア(Z(n)、Z(n)、Z(n)のうちいずれか1つに対応する収音エリア)に比べ、より広い範囲のエリア収音が可能になる。 As shown in FIG. 2, the microphones MC1 to MC3 are all mounted in a narrow range of several centimeters in diameter in the mouthpiece 113 of the handset 110. FIG. Therefore, the microphone arrays MA1, MA2, and MA3 are arranged very closely (densely), and their sound pickup areas are limited to a narrow range in front of the mouthpiece 113. FIG. However, as shown in FIG. 6 described above, it is known that the sound pickup area by area sound pickup has the characteristic of expanding in the far direction of the two microphone arrays. Therefore, if the sound pickup areas (sound pickup areas corresponding to Z 1 (n), Z 2 (n), and Z 3 (n)) extending in three different directions are overlapped, a single sound pickup area ( It is possible to pick up sound in a wider range than the sound pickup area corresponding to any one of Z 1 (n), Z 2 (n), and Z 3 (n).

そこで、エリア音加算部125では、3個のエリア収音の出力Z(n)、Z(n)、Z(n)を加算又は加算平均して最終出力(収音結果)W(n)を生成して収音部120の収音結果として出力する。エリア音加算部125は、当該加算処理においてはエリア同士が重なる部分があることを考慮し、3個のエリア収音の出力の加算値(Z(n)+Z(n)、+Z(n))を平均化、あるいは式(11)に示すようにゲイン調整の係数αを乗じてもよい。なお、エリア音加算部125は、3個のエリア収音の出力(Z(n)、Z(n)、Z(n))のうち、2以上の出力だけを加算(又は加算平均)する処理を行うようにしてもよい。例えば、エリア音加算部125は、3個のエリア収音の出力のうち、2つの出力だけを加算(又は加算平均)する処理を行うようにしてもよい。

Figure 0007176316000005
Therefore, the area sound adder 125 adds or averages the outputs Z 1 (n), Z 2 (n), and Z 3 (n) of the three area sound pickups to obtain a final output (sound pickup result) W( n) is generated and output as the sound pickup result of the sound pickup unit 120 . The area sound addition unit 125 considers that areas overlap each other in the addition process, and adds the outputs of the three area sound pickups (Z 1 (n) + Z 2 (n), +Z 3 ( n)) may be averaged or multiplied by a gain adjustment coefficient α as shown in equation (11). Note that the area sound addition unit 125 adds (or averages) only two or more of the three area sound outputs (Z 1 (n), Z 2 (n), Z 3 (n)). ) may be performed. For example, the area sound addition unit 125 may perform processing of adding (or averaging) only two outputs among the three area sound outputs.
Figure 0007176316000005

以上のように、収音部120は、拡大されたエリアから収音された目的音声として最終出力W(n)を出力する。このとき、収音部120は、W(n)を周波数-時間変換した音声データとして出力するようにしてもよい。 As described above, the sound pickup unit 120 outputs the final output W(n) as the target sound picked up from the enlarged area. At this time, the sound pickup unit 120 may output W(n) as sound data obtained by frequency-time conversion.

そして、通信部130は、最終出力W(n)に基づく音声データを、通信路Pを介して通信装置200に送信する。 The communication unit 130 then transmits the audio data based on the final output W(n) to the communication device 200 via the communication path P. FIG.

そして、通信装置200の通信部230は、通信装置100から受信した音声データ(W(n)に基づく音声データ)を出力部140に供給する。出力部140は、受信した音声データに基づく音響信号をスピーカ210に供給して表音出力(第2のユーザU2に向けて表音出力)させる。 Then, the communication unit 230 of the communication device 200 supplies the audio data (the audio data based on W(n)) received from the communication device 100 to the output unit 140 . The output unit 140 supplies an acoustic signal based on the received audio data to the speaker 210 to produce a phonetic output (a phonetic output toward the second user U2).

(A-3)第1の実施形態の効果
この実施形態によれば、以下のような効果を奏することができる。
(A-3) Effects of First Embodiment According to this embodiment, the following effects can be obtained.

この実施形態の収音部120では、別々の方向からエリア収音を行い、それらを足し合わせることで、従来の1組(2つ)のマイクアレイを用いたエリア収音よりも広く、等方向性をもった収音エリア(拡大した収音エリア)を形成することができる。これにより、収音部120では、ハンドセット110の送話口113に付けられたマイクロホンMC1~MC3を用いたエリア収音を行う際に、話者(第1のユーザU1)の口元と送話口113との相対的な位置がずれた場合でも安定した音声収音が可能となる。 The sound pickup unit 120 of this embodiment performs area sound pickup from different directions, and adds them together to obtain a wider and isotropic area sound pickup than the conventional one-pair (two) microphone array. It is possible to form a sound pickup area (enlarged sound pickup area) with a certain property. As a result, in the sound pickup unit 120, when performing area sound pickup using the microphones MC1 to MC3 attached to the mouthpiece 113 of the handset 110, the mouth of the speaker (first user U1) and the mouthpiece Even if the position relative to 113 is displaced, stable sound pickup is possible.

(B)第2の実施形態
以下、本発明による収音装置、プログラム及び方法の第2の実施形態を、図面を参照しながら詳述する。この実施形態では、本発明の収音装置、プログラム及び方法を収音部に適用した例について説明する。
(B) Second Embodiment Hereinafter, a second embodiment of the sound collecting device, program and method according to the present invention will be described in detail with reference to the drawings. In this embodiment, an example in which the sound collecting device, program, and method of the present invention are applied to a sound collecting unit will be described.

上述の通り、第1の実施形態の収音部120では、別々の方向からエリア収音を行い、それらを重ね合わせる(足し合わせる)ことで、従来の1組(2つ)のマイクアレイを用いたエリア収音よりも広く、等方向性をもった収音エリア(拡大した収音エリア)を形成している。 As described above, the sound pickup unit 120 of the first embodiment picks up area sounds from different directions and superimposes (adds) them, thereby using one set (two) of conventional microphone arrays. It forms an isotropic sound pickup area (enlarged sound pickup area) that is wider than the normal sound pickup area.

しかしながら、第1の実施形態の収音部120のように、収音エリアを拡げる試みは、一方で、特定のエリアのみの音を収音することで周辺の不要音を抑圧し、目的音を強調するというエリア収音本来の効果を減ずる恐れがある。 However, an attempt to expand the sound pickup area like the sound pickup unit 120 of the first embodiment, on the other hand, suppresses surrounding unwanted sounds by picking up sound only in a specific area, and suppresses the target sound. There is a risk that the original effect of area sound pickup, which is to emphasize, will be diminished.

そこで、第2の実施形態の収音部120Aでは、第1の実施形態における上述のような問題を解決するために収音可能エリアを拡げつつも目的音強調性能の劣化を抑制する構成となっている。 Therefore, in the sound pickup unit 120A of the second embodiment, the deterioration of the target sound enhancement performance is suppressed while expanding the sound pickup possible area in order to solve the above-described problem in the first embodiment. ing.

(B-1)第2の実施形態の構成
図9は、第2の実施形態に関連する各装置の構成について示したブロック図である。図9では、上述の図1と同一部分又は対応部分には、同一符号又は対応符号を付している。
(B-1) Configuration of Second Embodiment FIG. 9 is a block diagram showing the configuration of each device related to the second embodiment. In FIG. 9, the same reference numerals or corresponding reference numerals are assigned to the same or corresponding portions as those in FIG.

第2の実施形態では、通信装置100が通信装置100Aに置き換わっている。また、第2の実施形態の通信装置100Aでは、マイクアレイ部111と収音部120が、マイクアレイ部111Aと収音部120Aに置き換わっている。 In the second embodiment, the communication device 100 is replaced with a communication device 100A. Also, in the communication device 100A of the second embodiment, the microphone array section 111 and the sound pickup section 120 are replaced with a microphone array section 111A and a sound pickup section 120A.

次に、第2の実施形態における収音部120Aの内部構成について説明する。 Next, the internal configuration of the sound pickup section 120A in the second embodiment will be described.

次に、収音部120Aの内部構成について図9を用いて説明する。 Next, the internal configuration of the sound pickup section 120A will be described with reference to FIG.

収音部120Aでは、目的エリア音抽出部124が目的エリア音抽出部124Aに置き換わり、エリア音加算部125が除外されている点で第1の実施形態と異なっている。また、収音部120Aでは、部分エリア成分算出部126と部分エリア選択部127が追加されている点で第1の実施形態と異なっている。 The sound pickup unit 120A differs from the first embodiment in that the target area sound extraction unit 124 is replaced with a target area sound extraction unit 124A and the area sound addition unit 125 is omitted. Further, the sound pickup unit 120A differs from the first embodiment in that a partial area component calculation unit 126 and a partial area selection unit 127 are added.

次に、第2の実施形態のマイクアレイ部111Aの構成について説明する。 Next, the configuration of the microphone array section 111A of the second embodiment will be described.

図9に示すように、第2の実施形態において、マイクアレイ部111Aは、6つのマイクロホンMC1~MC6を有している。 As shown in FIG. 9, in the second embodiment, the microphone array section 111A has six microphones MC1 to MC6.

図10は、マイクアレイ部111Aにおける6つのマイクロホンMC1~MC6の配置及びマイクアレイの構成例について示した図である。 FIG. 10 is a diagram showing an arrangement of the six microphones MC1 to MC6 in the microphone array section 111A and a configuration example of the microphone array.

図10に示すように、マイクアレイ部111Aを構成する6つのマイクロホンMC1~MC6は、2つずつのマイクロホンを対として3つのマイクアレイMA1(マイクロホンMC1、MC2を対とするマイクアレイ)、MA2(マイクロホンMC3、MC4を対とするマイクアレイ)、MA3(マイクロホンMC5、MC6を対とするマイクアレイ)を構成している。 As shown in FIG. 10, the six microphones MC1 to MC6 that constitute the microphone array section 111A are divided into three microphone arrays MA1 (microphone array paired with microphones MC1 and MC2) and MA2 (microphone arrays paired with two microphones each). A microphone array paired with microphones MC3 and MC4) and MA3 (a microphone array paired with microphones MC5 and MC6).

分割数を増やしピンポイントのエリアから目的音を抽出する観点からは、3エリア以上の構成を有することが望ましいが、第2の実施形態では、本発明の原理を解り易く説明するため、重なりを持つ2つのエリアのエリア収音を行なう例について説明する。重なりを持つ3つのエリアによる構成については、後述する第3の実施形態で示す。 From the viewpoint of increasing the number of divisions and extracting the target sound from pinpoint areas, it is desirable to have a configuration of three or more areas. An example of area sound pickup in two areas will be described. A configuration of three overlapping areas will be described in a third embodiment, which will be described later.

(B-2)第2の実施形態の動作
次に、以上のような構成を有する第2の実施形態の動作(実施形態に係る収音方法)を説明する。
(B-2) Operation of Second Embodiment Next, the operation of the second embodiment having the above configuration (sound pickup method according to the embodiment) will be described.

信号入力部121は、6つのマイクロホンMC1~MC6で収音した音響信号を、それぞれアナログ信号からデジタル信号x~xに変換し、周波数変換部122に供給する。 The signal input unit 121 converts the acoustic signals picked up by the six microphones MC1 to MC6 from analog signals to digital signals x 1 to x 6 , respectively, and supplies the digital signals x 1 to x 6 to the frequency conversion unit 122 .

周波数変換部122では、例えば高速フーリエ変換を用いてマイクロホン信号x~xを、時間領域から周波数領域の信号X~Xへ変換する。 The frequency transform unit 122 transforms the microphone signals x 1 to x 6 from the time domain to signals X 1 to X 6 in the frequency domain using, for example, fast Fourier transform.

指向性形成部123は、周波数変換部122によって時間-周波数変換された各マイクロホンの入力信号を用いてBFにより指向性を形成する。第2の実施形態では、マイクアレイMA1によるBF出力をY、マイクアレイMA2によるBF出力をY、マイクアレイMA3によるBF出力をYとする。BF出力Y、Y、Yの指向性は図10に示す通りである。第2の実施形態では図10に示す通り、マイクアレイMA1~MA3が三角形の各頂点の位置に配置されており、BF出力Y、Y、Yの指向性(マイクアレイMA1~MA3の指向性)はそれぞれ三角形の内側を向けられている。 Directivity forming section 123 forms directivity by BF using the input signal of each microphone that has been time-frequency converted by frequency converting section 122 . In the second embodiment, the BF output from the microphone array MA1 is Y 1 , the BF output from the microphone array MA2 is Y 2 , and the BF output from the microphone array MA3 is Y 3 . The directivity of the BF outputs Y 1 , Y 2 and Y 3 are as shown in FIG. In the second embodiment, as shown in FIG. 10, the microphone arrays MA1 to MA3 are arranged at the positions of the vertices of the triangle, and the directivity of the BF outputs Y 1 , Y 2 and Y 3 (the directivity of the microphone arrays MA1 to MA3 directivity) are each oriented inward of the triangle.

目的エリア音抽出部124Aでは、指向性形成部123で生成されたBF出力を用いてエリア収音処理を行なう。エリア収音は、異なる方向からBFの指向性を向け、指向性が交差したエリアの成分(エリア音)を分離・抽出するものである。BF出力Y、Yの組み合わせ、およびBF出力Y、Yの組み合わせのそれぞれからエリア収音が実現できる。 The target area sound extraction unit 124A uses the BF output generated by the directivity formation unit 123 to perform area sound pickup processing. In the area sound pickup, the directivity of the BF is directed from different directions, and the components (area sound) of the areas where the directivities intersect are separated and extracted. Area sound pickup can be realized from each of the combination of BF outputs Y 1 and Y 2 and the combination of BF outputs Y 1 and Y 3 .

図11は、目的エリア音抽出部124Aがエリア収音をおこなう収音エリアの分布について示した説明図である。 FIG. 11 is an explanatory diagram showing the distribution of sound pickup areas where the target area sound extraction unit 124A performs area sound pickup.

上述の図6で示したように、エリア収音ではマイクアレイから遠い方向に収音エリアが広がる特性を持つ。そのため、マイクアレイMA1-MA2によるエリア収音領域(第2の実施形態では、「エリア1」又は「収音エリア1」と呼ぶ)と、マイクアレイMA2-MA3によるエリア収音領域(第2の実施形態では、「エリア2」又は「収音エリア2」と呼ぶ)は、図11のようなイメージになる。第2の実施形態では、収音エリア1のエリア収音成分(エリア収音出力)をZ、エリア2のエリア収音成分(エリア収音出力)をZとする。 As shown in FIG. 6, area sound pickup has the characteristic that the sound pickup area spreads in the direction far from the microphone array. Therefore, an area sound pickup area by the microphone arrays MA1-MA2 (referred to as "area 1" or "sound pickup area 1" in the second embodiment) and an area sound pickup area by the microphone arrays MA2-MA3 (second In the embodiment, the area is called "area 2" or "sound pickup area 2") has an image as shown in FIG. In the second embodiment, the area picked-up sound component (area picked-up sound output) of the sound pickup area 1 is Z 1 , and the area picked-up sound component (area picked-up sound output) of the area 2 is Z 2 .

それぞれの収音エリアは、図12のように2つの収音エリアが重複する部分と、重複しない独立した部分に分けられる。 Each sound pickup area is divided into a portion where two sound pickup areas overlap and an independent portion where two sound pickup areas do not overlap, as shown in FIG.

図12では、エリア1、2で重複する領域を重複エリア1∧2としている。また、図12では、エリア1内で、重複エリア1∧2を除く独立した領域(他の収音エリアと重複していない領域)を独立エリアAとしている。さらに、図12では、エリア2内で、重複エリア1∧2を除く独立した領域を独立エリアBとしている。なお、1つの収音エリアから派生する独立エリア(独立部分)は、図12に示すように複数の領域に分割される場合が有りえるが、本明細書では1つの収音エリアから発生した独立エリアについてはまとめて1つの符号で示すものとする。例えば、図12では、に独立エリアAは重複エリア1∧2により2つの領域に分割(分断)されているが、ここでは、この2つの領域をまとめて独立エリアAと呼ぶことになる。 In FIG. 12, the area where areas 1 and 2 overlap is defined as overlapping area 1∧2. In addition, in FIG. 12, an independent area (an area that does not overlap with other sound pickup areas) excluding the overlapping area 1∧2 in the area 1 is defined as an independent area A. In FIG. Furthermore, in FIG. 12, an independent area B is defined as an independent area within the area 2 except for the overlapping area 1∧2. An independent area (independent part) derived from one sound collecting area may be divided into a plurality of areas as shown in FIG. Areas are collectively indicated by one code. For example, in FIG. 12, the independent area A is divided (divided) into two areas by the overlapping area 1∧2.

以上により、エリア1は重複エリア1∧2と独立エリアA(エリア1から重複エリア1∧2を除いた領域)とから成り、エリア2は重複エリア1∧2と独立エリアB(エリア2から重複エリア1∧2を除いた領域)とから成る。エリア1のエリア収音出力Zと、エリア2のエリア収音出力Zを重ね合わせる(足し合わせる)と、広い範囲のエリアから収音できるが、重複エリア1∧2の成分が二重に加わることになり収音エリア全体として均一な収音特性は得られない。したがって、重複エリア1∧2と独立エリアA、Bの音源を個別に分離・抽出することができれば、それぞれのエリアを重複することなく統合することでエリア1、2の全範囲に亘って均一な収音特性が得られることになる。 As described above, area 1 consists of overlapping area 1 ∧ 2 and independent area A (area 1 minus overlapping area 1 ∧ 2), and area 2 consists of overlapping area 1 ∧ 2 and independent area B (overlapping from area 2). area 1 ∧ 2). By overlapping (adding) the area sound pickup output Z1 of area 1 and the area sound pickup output Z2 of area 2 , sound can be picked up from a wide range of areas, but the components of overlapping area 1 ∧ 2 are doubled. As a result, uniform sound pickup characteristics cannot be obtained for the entire sound pickup area. Therefore, if it is possible to separate and extract the sound sources of the overlapping area 1 ∧ 2 and the independent areas A and B individually, the areas 1 and 2 can be unified over the entire range by integrating the respective areas without overlapping. Sound pickup characteristics are obtained.

部分エリア成分算出部126は、重複エリア1∧2を有する2つのエリア収音成分(ここでは、エリア1、2のエリア収音成分)から、重複エリア1∧2の収音成分と、独立エリアのエリア収音成分(ここでは、独立エリアA、Bのエリア収音成分)を分離する。 The partial area component calculation unit 126 calculates the picked-up sound component of the overlapping area 1^2 and the independent area area sound components (here, area sound components of independent areas A and B) are separated.

図13は、図12に示す各エリアの組成イメージ(成分ごとのパワー)を棒グラフの形式で示した説明図である。 FIG. 13 is an explanatory diagram showing a composition image (power for each component) of each area shown in FIG. 12 in the form of a bar graph.

図13(a)は、エリア1のエリア収音成分Zの組成イメージ示し、図13(b)は、エリア2のエリア収音成分Zの組成イメージを示している。また、図13(c)は、図13(a)に示すエリア収音成分Zの組成イメージについて、重複エリア1∧2の成分にハッチ(斜線パターン)を付して示したものである。さらに、図13(d)は、図13(b)に示すエリア収音出力Zの組成イメージについて、重複エリア1∧2の成分にハッチ(斜線パターン)を付して示したものである。 13(a) shows a composition image of area picked-up sound component Z1 of area 1, and FIG. 13(b) shows a composition image of area picked-up sound component Z2 of area 2. FIG. FIG. 13(c) shows the composition image of the area sound pickup component Z1 shown in FIG. 13(a), with the components of the overlapping area 1∧2 hatched (diagonal line pattern). Further, FIG. 13(d) shows the composition image of the area sound pickup output Z2 shown in FIG . 13(b), with the components of the overlapping area 1∧2 hatched (diagonal line pattern).

エリア1とエリア2の重複エリア1∧2は、文字通り重複して共通であるから、ZとZの中にそれぞれ同一の成分として含まれている。そこで、目的エリア音抽出部124Aでは、エリア収音と同じ原理に基づき、スペクトル減算法(SS)を用いることで、それぞれの成分を分離する。 The overlapped area 1∧2 of area 1 and area 2 is literally overlapped and common, so it is included in Z1 and Z2 as the same component. Therefore, the target area sound extraction unit 124A separates each component by using the spectral subtraction method (SS) based on the same principle as for area sound pickup.

部分エリア成分算出部126は、エリア収音出力Zからエリア収音出力ZをSSする。部分エリア成分算出部126は、SSに際して負になる成分は0にクリッピングする。そうすることで、目的エリア音抽出部124Aでは、エリア収音出力Zから重複エリア1∧2のエリア収音成分が除かれ、独立エリアAのエリア収音成分(第1の実施形態では「V」と呼ぶ)が分離される。同様に、部分エリア成分算出部126は、エリア収音出力Zからエリア収音出力ZをSSすることで、独立エリアBのエリア収音成分(第1の実施形態では、「V」と呼ぶ)を分離することができる。 The partial area component calculator 126 SSs the area picked - up sound output Z1 to the area picked - up sound output Z2. The partial area component calculator 126 clips to 0 the component that becomes negative in SS. By doing so, in the target area sound extraction unit 124A, the area picked-up sound component of the overlapping area 1∧2 is removed from the area picked-up sound output Z1, and the area picked-up sound component of the independent area A (" V A ”) are isolated. Similarly, the partial area component calculation unit 126 calculates the area picked-up sound component (“V B ” in the first embodiment) of the independent area B by SSing the area picked-up sound output Z 1 from the area picked-up sound output Z 2 . ) can be separated.

図14は、部分エリア成分算出部126が独立エリアのエリア(独立エリアA、B)の収音成分(V、V)を算出する処理の手順を示した説明図である。 FIG. 14 is an explanatory diagram showing a procedure of processing for calculating sound pickup components (V A , V B ) of the areas of the independent area (independent areas A, B) by the partial area component calculation unit 126 .

図14(a)~図14(c)全体で、部分エリア成分算出部126が、エリア1のエリア収音出力Zから、エリア2のエリア収音出力ZをSSして独立エリアAのエリア収音成分Vを抽出する処理(以下の(21)式に相当する処理)について示し、図14(a)~図14(c)の個々のグラフは、それぞれエリア1のエリア収音成分Z、エリア2のエリア収音成分Z、及び独立エリアAのエリア収音成分Vの組成イメージを表している。 14(a) to 14(c), the partial area component calculation unit 126 SSs the area picked - up sound output Z2 of the area 2 from the area picked-up sound output Z1 of the area 1, and the independent area A The process of extracting the area picked-up sound component V A (the process corresponding to the following equation (21)) is shown, and the individual graphs in FIGS. A composition image of Z 1 , area picked-up sound component Z 2 of area 2, and area picked-up sound component VA of independent area A is shown.

同様に、図14(d)~図14(f)全体は、部分エリア成分算出部126が、エリア2のエリア収音成分Zから、エリア1のエリア収音成分ZをSSして独立エリアBのエリア収音成分Vを抽出する処理(以下の(22)式に相当する処理)について示し、図14(d)~図14(f)の個々のグラフは、それぞれエリア2のエリア収音成分Z、エリア1のエリア収音成分Z、及び独立エリアBのエリア収音成分Vの組成イメージを表している。 14(d) to 14(f), the partial area component calculator 126 SSs the area picked-up sound component Z1 of the area 1 from the area picked-up sound component Z2 of the area 2 to make it independent. The process of extracting the area picked-up component V B of the area B (the process corresponding to the following formula (22)) is shown, and the individual graphs in FIGS. A composition image of the collected sound component Z 2 , the area collected sound component Z 1 of the area 1, and the area collected sound component V B of the independent area B is shown.

なお、図14に示す各組成イメージでは、重複エリア1∧2のエリア収音成分と、独立エリアAのエリア収音成分Vと、独立エリアBのエリア収音成分Vとに、それぞれ異なるパターンを付して図示している。 In each composition image shown in FIG. 14, the area picked-up sound component of overlapping area 1 ∧ 2, the area picked-up sound component V A of independent area A, and the area picked-up sound component V B of independent area B are different. It is illustrated with a pattern attached.

部分エリア成分算出部126では、独立エリアAのエリア収音成分V又は独立エリアBのエリア収音成分Vに基づいて、重複エリア1∧2のエリア収音成分(以下、「V1∧2」と呼ぶ)を求めることができる。例えば、部分エリア成分算出部126は、エリア収音出力Zから独立エリアAのエリア収音成分VをSSする。部分エリア成分算出部126は、SSに際して負になる成分は0にクリッピングする。そうすることで、目的エリア音抽出部124Aでは、エリア収音出力Zから独立エリアAのエリア収音成分Vが除かれ、重複エリア1∧2のエリア収音成分V1∧2が分離される。同様に、部分エリア成分算出部126は、エリア収音出力Zから独立エリアBのエリア収音成分VをSSすることで、重複エリア1∧2のエリア収音成分V1∧2を分離することができる。 In the partial area component calculation unit 126, based on the area picked-up sound component V A of the independent area A or the area picked-up sound component V B of the independent area B, the area picked-up sound component of the overlapping area 1 2 (hereinafter referred to as "V 1 ∧ 2 ”) can be obtained. For example, the partial area component calculator 126 SSs the area picked-up sound component VA of the independent area A from the area picked-up sound output Z1. The partial area component calculator 126 clips to 0 the component that becomes negative in SS. By doing so, the target area sound extraction unit 124A removes the area picked-up sound component V A of the independent area A from the area picked-up sound output Z1 , and separates the area picked-up sound component V1^2 of the overlapping area 1^2. be done. Similarly, the partial area component calculation unit 126 separates the area picked-up sound component V1^2 of the overlapping area 1^2 by SSing the area picked-up sound component VB of the independent area B from the area picked - up sound output Z2. can do.

図15は、部分エリア成分算出部126が重複エリア1∧2のエリア収音成分V1∧2を算出する処理の手順を示した説明図である。 FIG. 15 is an explanatory diagram showing a procedure of processing for the partial area component calculator 126 to calculate the area picked-up sound component V 1 2 of the overlapping area 1 2 .

図15(a)、図15(b)、図15(e)は、部分エリア成分算出部126が、エリア収音出力Zから独立エリアAのエリア収音成分VをSSして重複エリア1∧2のエリア収音成分V1∧2を抽出する処理(以下の(23)式に相当する処理)について示している。図15(c)、図15(d)、図15(e)は、部分エリア成分算出部126が、エリア収音出力Zから独立エリアBのエリア収音成分VをSSして重複エリア1∧2のエリア収音成分V1∧2を抽出する処理(以下の(24)式に相当する処理)について示している。以上のように、部分エリア成分算出部126では、独立エリアAのエリア収音成分V、独立エリアBのエリア収音成分V、及び重複エリア1∧2のエリア収音成分V1∧2を分離・抽出することができる。

Figure 0007176316000006
15(a), 15(b), and 15(e), the partial area component calculator 126 SSs the area picked-up sound component V A of the independent area A from the area picked-up output Z 1 to obtain the overlapping area. The process of extracting the area picked-up sound component V 1̂2 of 1̂2 (the process corresponding to the following formula (23)) is shown. 15(c), 15(d), and 15(e), the partial area component calculator 126 SSs the area picked-up sound component V B of the independent area B from the area picked-up output Z 2 to obtain the overlapping area. It shows the processing (processing corresponding to the following equation (24)) for extracting the area picked-up sound component V 1̂2 of 1̂2. As described above, in the partial area component calculation unit 126, the area picked-up sound component V A of the independent area A, the area picked-up sound component V B of the independent area B, and the area picked-up sound component V 1 ^2 of the overlapping area 1 ^2 can be separated and extracted.
Figure 0007176316000006

部分エリア選択部127は、エリア収音成分Z、Zに加えて、分割された各部分エリアのエリア収音成分V1-2、V、Vのいずれかを選択して出力(最終的な収音結果Wとして出力)する。なお、部分エリア選択部127による選択処理方式については限定されないものである。 The partial area selection unit 127 selects and outputs any of the area picked-up sound components V 1-2 , V A , and V B of each divided partial area in addition to the area picked-up sound components Z 1 and Z 2 ( output as the final sound pickup result W). Note that the selection processing method by the partial area selection unit 127 is not limited.

以上のように、収音部120Aは、部分エリア選択部127により選択されたエリア収音成分を最終出力W(n)として出力する。 As described above, the sound pickup unit 120A outputs the area picked-up sound component selected by the partial area selection unit 127 as the final output W(n).

そして、通信部130は、最終出力W(n)に基づく音声データを、通信路Pを介して通信装置200に送信する。 The communication unit 130 then transmits the audio data based on the final output W(n) to the communication device 200 via the communication path P. FIG.

そして、通信装置200の通信部230は、通信装置100Aから受信した音声データ(W(n)に基づく音声データ)を出力部140に供給する。出力部140は、受信した音声データに基づく音響信号をスピーカ210に供給して表音出力(第2のユーザU2に向けて表音出力)させる。 Then, the communication unit 230 of the communication device 200 supplies the audio data (the audio data based on W(n)) received from the communication device 100A to the output unit 140 . The output unit 140 supplies an acoustic signal based on the received audio data to the speaker 210 to produce a phonetic output (a phonetic output toward the second user U2).

(B-3)第2の実施形態の効果
第2の実施形態によれば、第1の実施形態と比較して以下のような効果を奏することができる。
(B-3) Effects of Second Embodiment According to the second embodiment, the following effects can be obtained as compared with the first embodiment.

第2の実施形態の収音部120Aでは、重複エリアを有する2つのエリア収音出力に対し、エリア同士の重複を活用し、重複エリアと重複しない独立エリアの各々のエリア成分を分離・抽出することによって、エリア全体を複数の小エリアに分割する。そして、第2の実施形態の収音部120Aでは、分割された小エリアの中から目的音収音エリアとして最も相応しいエリアを選択することで、複数エリア収音によるエリア全体の範囲をカバーしつつ、目的音が含まれるピンポイントのエリアから強調音声を取り出すことが可能になる。 In the sound pickup unit 120A of the second embodiment, for two area sound pickup outputs having overlapping areas, the overlap between the areas is utilized, and the area components of each of the overlapping areas and the independent areas that do not overlap are separated and extracted. divides the whole area into a plurality of smaller areas. Then, in the sound pickup unit 120A of the second embodiment, by selecting an area most suitable as the target sound pickup area from among the divided small areas, the range of the entire area is covered by the multi-area sound pickup. , it becomes possible to extract the emphasized speech from the pinpoint area containing the target sound.

(C)第3の実施形態
以下、本発明による収音装置、プログラム及び方法の第の実施形態を、図面を参照しながら詳述する。この実施形態では、本発明の収音装置、プログラム及び方法を収音部に適用した例について説明する。
(C) Third Embodiment Hereinafter, a third embodiment of the sound collecting device, program and method according to the present invention will be described in detail with reference to the drawings. In this embodiment, an example in which the sound collecting device, program, and method of the present invention are applied to a sound collecting unit will be described.

(C-1)第3の実施形態の構成
図16は、第3の実施形態に関連する各装置の構成について示したブロック図である。
(C-1) Configuration of Third Embodiment FIG. 16 is a block diagram showing the configuration of each device related to the third embodiment.

図16では、上述のY1と同一部分又は対応部分には、同一符号又は対応符号を付している。以下では、第3の実施形態について、第2の実施形態との差異を中心に説明する。 In FIG. 16, the same reference numerals or corresponding reference numerals are given to the same or corresponding portions as Y1 described above. The third embodiment will be described below, focusing on differences from the second embodiment.

第3の実施形態では、通信装置100Aが通信装置100Bに置き換わっている点で第2の実施形態と異なっている。また、第3の実施形態の通信装置100Bでは、マイクアレイ部111Aがマイクアレイ部111Bに置き換わっている点で第2の実施形態と異なっている。さらに、第3の実施形態の通信装置100Bでは、収音部120Aが収音部120Bに置き換わっている点で第2の実施形態と異なっている。 The third embodiment differs from the second embodiment in that the communication device 100A is replaced with a communication device 100B. Further, the communication device 100B of the third embodiment differs from the second embodiment in that the microphone array section 111A is replaced with the microphone array section 111B. Furthermore, the communication device 100B of the third embodiment differs from the second embodiment in that the sound pickup unit 120A is replaced with the sound pickup unit 120B.

次に、第3の実施形態における収音部120Bの内部構成について説明する。 Next, the internal configuration of the sound pickup section 120B according to the third embodiment will be described.

第3の実施形態の収音部120Bでは、目的エリア音抽出部124Aと部分エリア成分算出部126と部分エリア選択部127とが、それぞれ目的エリア音抽出部124Bと部分エリア成分算出部126Bと部分エリア選択部127Bとに置き換わっている点で第2の実施形態と異なっている。 In the sound pickup unit 120B of the third embodiment, a target area sound extraction unit 124A, a partial area component calculation unit 126, and a partial area selection unit 127 are respectively composed of a target area sound extraction unit 124B, a partial area component calculation unit 126B, and a partial area sound extraction unit 126B. It differs from the second embodiment in that it is replaced with an area selection section 127B.

次に、マイクアレイ部111Bの構成について、図17を用いて説明する。 Next, the configuration of the microphone array section 111B will be described using FIG.

この実施形態の例では、図17に示すように、通信装置100Bは、ハードウェア的にはスマートホン(話者U1が所持するスマートホン)の構成となっているものとする。また、第3の実施形態の例では、マイクアレイ部1Bは、3つのマイクロホンMC1~MC3を有する構成であるものとする。 In the example of this embodiment, as shown in FIG. 17, the communication device 100B has a hardware configuration of a smart phone (a smart phone owned by the speaker U1). Also, in the example of the third embodiment, the microphone array section 1B is configured to have three microphones MC1 to MC3.

そして、図17に示すように、この実施形態の例では、通信装置100はスマートホンの構成であるため、この3つのマイクロホンMC1~MC3は、スマートホンにおいて通常送話口となる部分(スピーカSPが配置されている部分と反対側の端)の周囲に配置されることが望ましい。言い換えると、通信装置100において、3つのマイクロホンMC1~MC3は、通信装置100の使用時に話者U1の口元と対向する部分(話者U1の口元と最も近接する部分)の周囲に配置することが望ましい。図17では、話者U1が通信装置100を手で把持し、耳にスピーカSPを押し付けた場合に、話者U1の口元が位置する部分(図17の方向から見て下側の部分)の周囲(話者U1の口元と最も近接する部分の周囲)に3つのマイクロホンMC1~MC3が配置されている。 In addition, as shown in FIG. 17, in the example of this embodiment, the communication device 100 has the configuration of a smart phone, so these three microphones MC1 to MC3 are the parts (speaker SP is placed around the edge opposite to the part where the In other words, in the communication device 100, the three microphones MC1 to MC3 can be arranged around the portion facing the mouth of the speaker U1 (the portion closest to the mouth of the speaker U1) when the communication device 100 is used. desirable. In FIG. 17, when the speaker U1 holds the communication device 100 by hand and presses the speaker SP against the ear, the part where the mouth of the speaker U1 is located (the lower part when viewed from the direction of FIG. 17) is shown. Three microphones MC1 to MC3 are arranged around (around the part closest to the mouth of speaker U1).

図17に示す通信装置100(マイクアレイ部1)では、3個のマイクロホンMC1~MC3の各位置(各マイクロホンの中心位置)が正三角形の頂点となるように配置されている。この実施形態では、3つのマイクロホンMC1~MC3の組み合わせにより、3つのマイクアレイMA1~MA3が構成されるものとする。以下では、図17に示すように、マイクロホンMC1、MC2を対とするマイクアレイをMA1、マイクロホンMC2、MC3を対とするマイクアレイをMA2、マイクロホンMC3、MC1を対とするマイクアレイをMA3と呼ぶものとする。 In the communication device 100 (microphone array unit 1) shown in FIG. 17, each position (center position of each microphone) of the three microphones MC1 to MC3 is arranged so as to be a vertex of an equilateral triangle. In this embodiment, three microphone arrays MA1 to MA3 are configured by combining three microphones MC1 to MC3. Hereinafter, as shown in FIG. 17, a microphone array paired with microphones MC1 and MC2 is called MA1, a microphone array paired with microphones MC2 and MC3 is called MA2, and a microphone array paired with microphones MC3 and MC1 is called MA3. shall be

この実施形態では、エリアの拡大を等方向にするためマイクロホンMC1~MC3を正三角形に配置したが、必ずしも正三角形に限定されるものではない。すなわち、マイクロホンMC1~MC3による三角形の各辺の距離や各角の角度は全て同じでなくてもよい。 In this embodiment, the microphones MC1 to MC3 are arranged in an equilateral triangle in order to expand the area in the same direction, but the arrangement is not necessarily limited to an equilateral triangle. In other words, the distances of the sides of the triangle formed by the microphones MC1 to MC3 and the angles of the corners may not all be the same.

以上のように、第3の実施形態では、図18に示すように、3個のマイクロホン(MC1~MC3)から3個のマイクアレイ(MA1~MA3)を構成し、マイクアレイの組み合せによって3箇所のエリア収音を行なうものとする。 As described above, in the third embodiment, as shown in FIG. 18, three microphone arrays (MA1 to MA3) are configured from three microphones (MC1 to MC3). Area sound pickup shall be performed.

(C-2)第3の実施形態の動作
次に、以上のような構成を有する第3の実施形態の動作(実施形態に係る収音方法)を説明する。
(C-2) Operation of the Third Embodiment Next, the operation of the third embodiment (sound pickup method according to the embodiment) having the configuration as described above will be described.

信号入力部121は、3つのマイクロホンMC1~MC3で収音した音響信号をアナログ信号からデジタル信号x~xに変換し、周波数変換部122に供給する。 The signal input unit 121 converts the acoustic signals picked up by the three microphones MC1 to MC3 from analog signals to digital signals x 1 to x 3 and supplies the digital signals x 1 to x 3 to the frequency conversion unit 122 .

周波数変換部122では、例えば、高速フーリエ変換を用いてマイクロホン信号を時間領域から周波数領域の信号X~Xへ変換する。 The frequency transform unit 122 transforms the microphone signals from the time domain to signals X 1 to X 3 in the frequency domain using, for example, fast Fourier transform.

指向性形成部123は、周波数変換部122によって時間-周波数変換された各マイクロホンの入力信号を用いてBFにより指向性を形成する。第3の実施形態では、マイクアレイMA1によるBF出力をY、マイクアレイMA2によるBF出力をY、マイクアレイMA3によるBF出力をYとする。 Directivity forming section 123 forms directivity by BF using the input signal of each microphone that has been time-frequency converted by frequency converting section 122 . In the third embodiment, the BF output from the microphone array MA1 is Y1 , the BF output from the microphone array MA2 is Y2, and the BF output from the microphone array MA3 is Y3.

目的エリア音抽出部124では、指向性形成部123で形成したBF出力Y、Y、Y、を用い、Y-Y、Y-Y、Y-Yの組合せで、それぞれエリア収音処理を行なう。 The target area sound extraction unit 124 uses the BF outputs Y 1 , Y 2 , and Y 3 formed by the directivity formation unit 123, and the combinations of Y 1 -Y 2 , Y 2 -Y 3 , and Y 3 -Y 1 , perform area sound pickup processing respectively.

第3の実施形態では、Y-Yの組み合せによるエリア(収音エリア)を「1」、Y-Yの組み合せによるエリア(収音エリア)を2、Y-Yの組み合せによるエリア(収音エリア)を「3」と呼ぶものとする。 In the third embodiment, the area (sound pickup area) of the combination of Y 1 -Y 2 is "1", the area (sound pickup area) of the combination of Y 2 -Y 3 is 2, and the combination of Y 3 -Y 1 The area (sound pickup area) due to is called "3".

上述の図6で示したように、エリア収音ではマイクアレイから遠い方向に収音エリアが広がる特性を持つ。そのため、BF出力Y-Y(マイクアレイMA1-MA2)によるエリア1、BF出力Y-Y(マイクアレイMA2-MA3)によるエリア2、BF出力Y-Y(マイクアレイMA3-MA1)による収音エリアの分布は、図18のようなイメージになる。なお、第3の実施形態では、エリア1、2、3のそれぞれのエリア収音成分(エリア収音出力)をZ、Z、Zとする。 As shown in FIG. 6, area sound pickup has the characteristic that the sound pickup area spreads in the direction far from the microphone array. Therefore, area 1 by BF outputs Y 1 -Y 2 (microphone arrays MA1-MA2), area 2 by BF outputs Y 2 -Y 3 (microphone arrays MA2-MA3), BF outputs Y 3 -Y 1 (microphone arrays MA3- The distribution of the sound pickup area by MA1) is imaged as shown in FIG. In the third embodiment, area picked-up sound components (area picked-up sound outputs) of areas 1 , 2 , and 3 are Z1, Z2, and Z3, respectively.

部分エリア成分算出部126Bではエリア収音出力Z、Z、Zを用い、上記3つのエリアが重複する部分と、2つのエリアが重複する部分と、重複なく独立した部分とをそれぞれ算出する。第2の実施形態では2つの収音エリアの重複を考えたが、第3の実施形態では収音エリアが3つになるため、第2の実施形態と比較して重複のパターンがより複雑になる。3つの収音エリアの重なり合うエリアの各部分の算出は、エリア収音成分が既知の2つのエリア収音成分の組み合わせに分解することで、第2の実施形態と同じ手法(算出方法)が利用可能となる。 The partial area component calculator 126B uses the area picked-up outputs Z 1 , Z 2 , and Z 3 to calculate a portion where the three areas overlap, a portion where the two areas overlap, and an independent portion without overlap. do. In the second embodiment, two sound pickup areas overlap, but in the third embodiment, there are three sound pickup areas, so the overlapping pattern is more complicated than in the second embodiment. Become. The same method (calculation method) as in the second embodiment is used to calculate each portion of the overlapping area of the three sound pickup areas by decomposing into a combination of two area sound pickup components whose area sound pickup components are known. It becomes possible.

具体的には、部分エリア成分算出部126Bでは、各部分のエリア収音成分を算出する際に、2つの収音エリアの各組み合わせ(エリア1、2の組み合わせ、エリア2、3の組み合わせ、エリア3、1の組み合わせ)のパターン(以下、「組み合わせパターン」と呼ぶ)に分解することで、第2の実施形態と同じ手法が利用可能となる。すなわち、部分エリア成分算出部126Bにおいて、重複エリアを有する2つの収音エリアのエリア収音成分を、重複エリアの部分と、独立エリアの部分に分離する処理は第2の実施形態と同様である。 Specifically, the partial area component calculation unit 126B calculates each combination of two sound pickup areas (a combination of areas 1 and 2, a combination of areas 2 and 3, an area 3 and 1) (hereinafter referred to as "combination pattern"), the same method as in the second embodiment can be used. That is, in the partial area component calculation unit 126B, the process of separating the area sound pickup components of the two sound pickup areas having the overlapping area into the overlapping area portion and the independent area portion is the same as in the second embodiment. .

以下では、エリア1、2の組み合わせパターンを「第1の組み合わせパターン」と呼び、エリア2、3の組み合わせパターンを「第2の組み合わせパターン」と呼び、エリア3、1の組み合わせパターンを「第3の組み合わせパターン」と呼ぶものとする。 Hereinafter, the combination pattern of areas 1 and 2 will be referred to as a "first combination pattern", the combination pattern of areas 2 and 3 will be referred to as a "second combination pattern", and the combination pattern of areas 3 and 1 will be referred to as a "third combination pattern". shall be referred to as the "combination pattern of

図19は、3つのエリア1~3について2つの収音エリアの組み合わせパターン(第1~第3の組み合わせパターン)の分解イメージについて示した説明図(イメージ図)である。 FIG. 19 is an explanatory diagram (image diagram) showing an exploded image of combination patterns (first to third combination patterns) of two sound pickup areas for three areas 1 to 3. FIG.

図19(a)は、3つのエリア1~3を重ねて示した図となっている。図19(b)~図19(d)は、それぞれ第1~第3の組み合わせパターンに分解したイメージについて示した説明図である。 FIG. 19(a) is a diagram showing three areas 1 to 3 superimposed. FIGS. 19(b) to 19(d) are explanatory diagrams showing images decomposed into first to third combination patterns, respectively.

まず、図19(b)~図19(d)に示す3つの組み合わせパターンから、図19(b)に示す第1の組み合わせパターン(エリア1、2の組み合わせパターン)を代表例として説明する。 First, of the three combination patterns shown in FIGS. 19B to 19D, the first combination pattern (combination pattern of areas 1 and 2) shown in FIG. 19B will be described as a representative example.

部分エリア成分算出部126Bは、エリア収音出力Zからエリア収音出力ZをSSすることで、エリア1のエリア2に対して独立した部分(この実施形態では、「エリアA」と呼ぶものとする;図19(b)参照)のエリア収音成分(第3の実施形態では「V」と呼ぶ)を得る。また、部分エリア成分算出部126Bは、エリア収音出力Zからエリア収音出力ZをSSすることで、エリア2のエリア1に対して独立した部分(この実施形態では、「エリアB」と呼ぶものとする;図19(b)参照)のエリア収音成分(第3の実施形態では「V」と呼ぶ)を得ることができる。部分エリア成分算出部126Bでは、第2の実施形態と同様に、上記の(21)式、(22)式の計算式により、エリア収音成分V、Vを得ることができる。 The partial area component calculation unit 126B obtains an independent part of area 1 with respect to area 2 (referred to as "area A" in this embodiment) by SSing area picked-up sound output Z1 to area picked - up sound output Z2. ( refer to FIG. 19(b)) is obtained. In addition, the partial area component calculation unit 126B SSs the area picked - up sound output Z2 from the area picked - up sound output Z1, so that an independent portion of the area 2 with respect to the area 1 ("area B" in this embodiment) (refer to FIG. 19(b)) (referred to as “V B ” in the third embodiment) can be obtained. Similar to the second embodiment, the partial area component calculator 126B can obtain the area picked-up sound components V A and V B using the above equations (21) and (22).

部分エリア成分算出部126Bでは、第2の組み合わせパターン(エリア2、3の組み合わせパターン)についても同様に、エリア2のエリア3に対して独立した部分(この実施形態では、「エリアC」と呼ぶものとする;図19(c)参照)のエリア収音成分(第3の実施形態では「V」と呼ぶ)と、エリア3のエリア2に対して独立した部分(第3の実施形態では、「エリアD」と呼ぶものとする;図19(c)参照)のエリア収音成分(第3の実施形態では「V」と呼ぶ)を得ることができる。また、部分エリア成分算出部126Bでは、第3の組み合わせパターン(エリア3、1の組み合わせパターン)についても同様に、エリア3のエリア1に対して独立した部分(この実施形態では、「エリアE」と呼ぶものとする;図19(d)参照)のエリア収音成分(第3の実施形態では「V」と呼ぶ)と、エリア1のエリア3に対して独立した部分(この実施形態では、「エリアF」と呼ぶものとする;図19(d)参照)のエリア収音成分(第3の実施形態では「V」と呼ぶ)を得ることができる。 In the partial area component calculation unit 126B, similarly for the second combination pattern (combination pattern of areas 2 and 3), a portion of area 2 independent of area 3 (referred to as "area C" in this embodiment) 19(c)) (referred to as “V C ” in the third embodiment) and a portion of area 3 independent of area 2 (in the third embodiment, , “area D”; see FIG. 19(c)) can be obtained (referred to as “V D ” in the third embodiment). Similarly, in the partial area component calculation unit 126B, for the third combination pattern (combination pattern of areas 3 and 1), a portion of area 3 independent of area 1 ("area E" in this embodiment) (see FIG. 19(d)) and the area sound pickup component (referred to as “V E ” in the third embodiment) and the portion of area 1 independent of area 3 (in this embodiment, , “area F ”; see FIG. 19(d)) can be obtained.

部分エリア成分算出部126Bでは、以下の(31)式~(34)式の計算式により、エリア収音成分V、V、V、Vを得ることができる。

Figure 0007176316000007
The partial area component calculator 126B can obtain the area picked-up sound components V C , V D , V E and V F according to the following equations (31) to (34).
Figure 0007176316000007

部分エリア成分算出部126Bでは、エリアAのエリア収音成分V、又はエリアBのエリア収音成分Vが既知となると、エリア1、2が重複する部分(この実施形態では「重複エリア1∧2」と呼ぶ;図19(b)参照)のエリア収音成分(この実施形態では「V1∧2」と呼ぶ)を得ることができる。具体的には、部分エリア成分算出部126Bは、以下の(35)式に示すように、エリア収音出力ZからエリアAのエリア収音成分VをSSすることで、エリア1∧2のエリア収音成分を得ることができる。また、部分エリア成分算出部126Bは、以下の(36)式に示すように、エリア収音出力ZからエリアBのエリア収音成分VをSSすることでも、エリア1∧2のエリア収音成分を得ることができる。 In the partial area component calculation unit 126B, when the area picked-up sound component V A of the area A or the area picked-up sound component V B of the area B is known, the portion where the areas 1 and 2 overlap (in this embodiment, "overlapping area 1 2”; see FIG. 19B ) can be obtained (referred to as “V 1 2 ” in this embodiment). Specifically, the partial area component calculation unit 126B , as shown in the following equation (35), calculates the area 1 2 area sound components can be obtained. In addition, the partial area component calculation unit 126B also calculates the area collected sound component VB of area B from the collected area sound output Z2 as shown in the following equation (36). sound component can be obtained.

同様に、部分エリア成分算出部126Bでは、以下の(37)式、(38)式に示すように、エリアCのエリア収音成分V又はエリアDのエリア収音成分Vに基づいて、エリア2、3が重複するエリア(この実施形態では「重複エリア2∧3」と呼ぶ;図19(c)参照)のエリア収音成分(この実施形態では「V2∧3」と呼ぶ)を得ることができる。また、部分エリア成分算出部126Bでは、以下の(39)式、(40)式に示すように、エリアEのエリア収音成分V又はエリアFのエリア収音成分Vに基づいて、エリア3、1が重複するエリア(この実施形態では「重複エリア3∧1」と呼ぶ;図19(d)参照)のエリア収音成分(この実施形態では「V3∧1」と呼ぶ)を得ることができる。

Figure 0007176316000008
Similarly, in the partial area component calculation unit 126B, based on the area picked-up sound component V C of the area C or the area picked-up sound component V D of the area D, as shown in the following formulas (37) and (38), The area sound pickup component (referred to as "V 2∧3 " in this embodiment) of the area where areas 2 and 3 overlap (referred to as "overlapping area 2∧3" in this embodiment; see Fig. 19(c)) is Obtainable. Further, the partial area component calculation unit 126B calculates an area Obtain an area pickup component (referred to as “V 3 1 ” in this embodiment) of an area where 3 and 1 overlap (referred to as “overlapping area 3 1 ” in this embodiment; see FIG. 19(d)) be able to.
Figure 0007176316000008

部分エリア成分算出部126Bでは、エリア1、エリア2、エリア3の3つのエリアの中の2つのエリアの組み合せで生じる独立部分のエリア収音成分(V、V、V、V、V、V)と重複部分(V1∧2、V2∧3、V3∧1)のすべてが算出されると、それらのエリア収音成分を元に、3エリアを同時に重ねた場合の各部分エリアのエリア収音成分が算出できる。 In the partial area component calculation unit 126B, area picked-up sound components (V A , V B , V C , V D , V E , V F ) and overlapped portions (V 1 ∧ 2 , V 2 ∧ 3 , V 3 ∧ 1 ) are all calculated. can calculate the area pickup component of each partial area.

図20~図23は、エリア1、エリア2、エリア3の3つのエリアを同時に重ねた場合の各部分エリアについて示した説明図である。例えば、上記の計算で、エリアAのエリア収音成分Vと、エリアDのエリア収音成分Vが既知となっているため、部分エリア成分算出部126Bは、以下の(41)式に示すように、エリアAのエリア収音成分VからエリアDのエリア収音成分Vを、これまでと同様の計算によりSSすることで、エリアAの独立部分(以下、「エリアAd」と呼ぶ;図20参照)のエリア収音成分(以下、「VAd」と呼ぶ)を得ることができる。また、部分エリア成分算出部126Bは、以下の(42)式に示すように、エリアDのエリア収音成分VからエリアAのエリア収音成分Vを、これまでと同様の計算によりSSすることで、エリアDの独立部分(以下、「エリアDa」と呼ぶ;図20参照)のエリア収音成分(以下、「VDa」と呼ぶ)を得ることができる。 20 to 23 are explanatory diagrams showing each partial area when three areas, area 1, area 2, and area 3, are overlapped at the same time. For example, in the above calculation, the area picked-up sound component V A of area A and the area picked-up sound component V D of area D are already known, so the partial area component calculation unit 126B uses the following equation (41): As shown, by SSing the area picked-up sound component V A of the area A to the area picked-up sound component V D of the area D by the same calculation as before, the independent part of the area A (hereinafter referred to as "area Ad" 20) can be obtained (hereinafter referred to as “V Ad ”). Further, the partial area component calculation unit 126B calculates the area picked-up sound component V D of the area A from the area picked-up sound component V D of the area D as shown in the following equation (42) by the same calculation as before. By doing so, it is possible to obtain an area pickup component (hereinafter referred to as "V Da ") of an independent portion of area D (hereinafter referred to as "area Da"; see FIG. 20).

そして、部分エリア成分算出部126Bは、エリアAdのエリア収音成分VAd又はエリアDaのエリア収音成分VDaが得られると、エリアAとエリアDの重複部分(以下、「エリアA∧D」と呼ぶ;図20参照)のエリア収音成分(以下、「VA∧D」と呼ぶ)を算出することができる。 After obtaining the area picked-up sound component VAd of the area Ad or the area picked-up sound component VDa of the area Da , the partial area component calculation unit 126B obtains the overlapping portion of the area A and the area D (hereinafter referred to as “area A∧D ”; see FIG. 20) can be calculated.

具体的には、部分エリア成分算出部126Bは、以下の(43)式に示すように、エリアDのエリア収音出力VからエリアAdのエリア収音成分VAdを、これまでと同様の計算方法によりSSすることで、エリアA∧Dのエリア収音成分VA∧Dを算出することができる。また、部分エリア成分算出部126Bは、以下の(44)式に示すように、エリアAのエリア収音出力VからエリアDaのエリア収音成分VDaをSSすることでも、エリアA∧Dのエリア収音成分VA∧Dを算出することができる。

Figure 0007176316000009
Specifically, as shown in the following equation (43), the partial area component calculation unit 126B calculates the area picked-up sound component V Ad of the area Ad from the area picked-up sound output V D of the area D in the same manner as before. By performing SS according to the calculation method, it is possible to calculate the area picked-up sound component V A∧D of the area A∧D. In addition, the partial area component calculation unit 126B also calculates the area A ∧ D can be calculated .
Figure 0007176316000009

同様に、部分エリア成分算出部126Bでは、以下の(45)式、(47)式に示すように、エリアBの独立部分(以下、「エリアBe」と呼ぶ;図21参照)のエリア収音成分(以下、「VBe」と呼ぶ)と、エリアEの独立部分(以下、「エリアEb」と呼ぶ;図21参照)のエリア収音成分(以下、「VEb」と呼ぶ)を得ることができる。そして、部分エリア成分算出部126Bでは、以下の(46)式、(48)式に示すように、エリアBeのエリア収音成分VBe又はエリアEbのエリア収音成分VEbに基づいて、エリアBとエリアEの重複部分(以下、「エリアB∧E」と呼ぶ;図21参照)のエリア収音成分(以下、「VB∧E」と呼ぶ)を算出することができる。 Similarly, in the partial area component calculation unit 126B, as shown in the following equations (45) and (47), the independent part of the area B (hereinafter referred to as “area Be”; see FIG. 21) area sound pickup component (hereinafter referred to as “V Be ”) and an area pickup component (hereinafter referred to as “V Eb ”) of an independent portion of area E (hereinafter referred to as “area Eb”; see FIG. 21) can be done. Then, in the partial area component calculation unit 126B, based on the area collected sound component V Be of the area Be or the area collected sound component V Eb of the area Eb, the area It is possible to calculate an area picked-up component (hereinafter referred to as "V B∧E ") of the overlapping portion of B and area E (hereinafter referred to as "area B∧E"; see Fig. 21).

また、部分エリア成分算出部126Bでは、以下の(49)式、(51)式に示すように、エリアCの独立部分(以下、「エリアCf」と呼ぶ;図22参照)のエリア収音成分(以下、「VCf」と呼ぶ)と、エリアFの独立部分(以下、「エリアFc」と呼ぶ;図22参照)のエリア収音成分(以下、「VFc」と呼ぶ)を得ることができる。そして、部分エリア成分算出部126Bでは、以下の(50)式、(52)式に示すように、エリアCfのエリア収音成分VCf又はエリアFcのエリア収音成分VFcに基づいて、エリアCとエリアFの重複部分(以下、「エリアC∧F」と呼ぶ;図22参照)のエリア収音成分(以下、「VC∧F」と呼ぶ)を算出することができる。

Figure 0007176316000010
Further, in the partial area component calculation unit 126B, as shown in the following formulas (49) and (51), the area pickup component of the independent part of the area C (hereinafter referred to as "area Cf"; see FIG. 22) (hereinafter referred to as “V Cf ”) and an area pickup component (hereinafter referred to as “V Fc ”) of an independent portion of area F (hereinafter referred to as “area Fc”; see FIG. 22). can. Then, in the partial area component calculation unit 126B, based on the area picked-up sound component V Cf of the area Cf or the area picked-up sound component V Fc of the area Fc, the area It is possible to calculate an area sound pickup component (hereinafter referred to as "VCF") of the overlapping portion of C and area F (hereinafter referred to as "area C∧F "; see FIG. 22).
Figure 0007176316000010

そして、部分エリア成分算出部126Bでは、エリア収音成分V1∧2とエリア収音成分VC∧Fが既知になると、エリア1、エリア2、エリア3の3つのエリアの共通部分のエリア(以下、「エリア1∧2∧3」と呼ぶ;図23参照)のエリア収音成分(以下、「V1∧2∧3」と呼ぶ)を取得することができる。具体的には、部分エリア成分算出部126Bでは、以下の(53)式に示すように、エリア収音成分V1∧2からエリア収音成分VC∧Fをこれまでと同様の計算方法によりSSすることで、エリア1∧2∧3のエリア収音成分V1∧2∧3を得ることができる。 Then, in the partial area component calculation unit 126B, when the area picked-up sound component V 1 ∧ 2 and the area picked-up sound component V C ∧ F are known, the area ( Hereafter, it is possible to obtain an area pickup component (hereinafter referred to as "V 1 2 3 ") of the area 1 2 3; see FIG. 23). Specifically, in the partial area component calculation unit 126B, as shown in the following equation (53), the area picked-up sound component V C^ F is calculated from the area picked-up sound component V 1^2 by the same calculation method as before. By performing SS, it is possible to obtain the area picked -up sound component V 1 2 3 of the area 1 2 3 .

また、同様に、部分エリア成分算出部126Bでは、エリア収音成分V2∧3とエリア収音成分VB∧Eが既知になると、以下の(54)式により、エリア1∧2∧3のV1∧2∧3を取得することができる。さらに、部分エリア成分算出部126Bでは、エリア収音成分V3∧1とエリア収音成分VA∧Dが既知になると、以下の(55)式により、エリア1∧2∧3のV1∧2∧3を取得することができる。

Figure 0007176316000011
Similarly, in the partial area component calculation unit 126B, when the area picked-up sound component V2 ^3 and the area picked-up sound component VB^E are known, area 1^2^3 is obtained by the following equation (54). V 1 2 3 can be obtained. Furthermore, in the partial area component calculation unit 126B, when the area picked-up sound component V 3 ∧ 1 and the area picked-up sound component VA ∧ D are known, the area 1 ∧ 2 ∧ 3's V 1 ∧ 2∧3 can be obtained.
Figure 0007176316000011

以上の処理により、部分エリア成分算出部126Bでは、重複を含む3つのエリアのエリア収音により、3つのエリアが重複する部分のエリア収音成分(V1∧2∧3)と、3つのうち2つのエリアが重複する部分のエリア収音成分(VA∧D、VB∧E、VC∧F)と、3つのエリアの中で他のエリアとは重複無く独立した部分のエリア収音成分(VAd、VDa、VBe、VEb、VCf、VFc)が分離抽出することができる。 Through the above processing, the partial area component calculation unit 126B obtains the area picked-up sound component (V 1 2 3 ) of the portion where the three areas overlap, and Area sound components ( VA∧D , VB∧E , VC∧F ) in the portion where the two areas overlap, and area sound in the independent portion without overlapping with other areas among the three areas Components (V Ad , V Da , V Be , V Eb , V Cf , V Fc ) can be separated and extracted.

部分エリア選択部127Bでは、このように各部分に分解されたエリアのエリア収音成分の中から、最も目的音成分が多く含まれていると推定されるエリアのエリア収音成分を、収音結果Wとして選択(取得)する。以下では、部分エリア選択部127Bにおいて全エリア(エリア1、2、3がカバーする全エリア)から分けられた各エリアを「部分エリア」と呼ぶものとする。例えば、部分エリア選択部127Bでは、部分エリアとして、エリア1、2、3、A、B、C、D、E、F、1∧2、2∧3、3∧1、1∧2∧3、Ad、Da、A∧D、Be、Eb、B∧E、Cf、Fc、C∧Fのうち一部又は全部を設定するようにしてもよい。 The partial area selection unit 127B picks up the area pickup sound component of the area that is estimated to contain the most target sound component from among the area pickup sound components of the areas decomposed into each part in this way. Select (acquire) as result W. Hereinafter, each area divided from all areas (all areas covered by areas 1, 2, and 3) in partial area selection section 127B will be referred to as a "partial area". For example, the partial area selection unit 127B selects areas 1, 2, 3, A, B, C, D, E, F, 1^2, 2^3, 3^1, 1^2^3, Some or all of Ad, Da, A^D, Be, Eb, B^E, Cf, Fc, and C^F may be set.

部分エリア選択部127Bが、それぞれの部分エリア(エリア収音成分)からいずれかを選択する方式については限定されないものである。なお、以下では、部分エリア選択部127Bが選択した部分エリアを「選択エリア」とも呼ぶものとする。 The method by which the partial area selection unit 127B selects one of the partial areas (area-collected sound components) is not limited. In addition, below, the partial area selected by the partial area selection unit 127B is also referred to as a "selected area".

例えば、部分エリア選択部127Bは、最も大きなパワーの部分エリア(例えば、当該部分エリアのエリア収音成分を構成する各周波数成分を平均した平均パワースペクトルが最も大きいエリア)を選択するようにしてもよい。また、その際、部分エリア選択部127Bは、各部分エリアのパワーを面積で正規化して評価した評価値に基づいて、いずれかの部分エリアを選択するようにしてもよい。例えば、部分エリア選択部127Bは、各部分エリアについて、同じパワーでも面積が狭いエリアの方が評価が高くなるような評価値を算出し、最も評価(評価値)の高い部分エリアを選択するようにしてもよい。 For example, the partial area selection unit 127B may select a partial area with the largest power (for example, an area with the largest average power spectrum obtained by averaging each frequency component constituting the area sound pickup component of the partial area). good. Further, at that time, the partial area selection unit 127B may select one of the partial areas based on the evaluation value obtained by normalizing the power of each partial area by area. For example, the partial area selection unit 127B calculates an evaluation value for each partial area so that an area with the same power but a smaller area has a higher evaluation, and selects the partial area with the highest evaluation (evaluation value). can be

また、部分エリア選択部127Bは、部分エリアを選択する際に、全ての部分エリアを選択対象としなくてもよい。例えば、部分エリア選択部127Bは、領域(面積)が他の部分エリアに比して狭いエリアを選択対象から除外(例えば、一番大きい部分エリアと比較して3分の1以下の面積しかない部分エリアを選択対象から除外)し、残った部分エリア(除外されなかった部分エリア)から選択するようにしてもよい。 Moreover, when selecting a partial area, the partial area selection unit 127B does not have to select all the partial areas. For example, the partial area selection unit 127B excludes an area whose area (area) is smaller than the other partial areas from the selection targets (for example, an area that is less than one-third the area of the largest partial area). A partial area may be excluded from selection targets), and selection may be made from the remaining partial areas (partial areas not excluded).

さらに、部分エリア選択部127Bは、上記の方式により選択したエリアに隣接するエリア(境界を接するエリア)も含めて統合して1つの部分エリアとして選択するようにしてもよい。例えば、部分エリア選択部127Bは、最もパワーの大きいエリアと、当該エリアに隣接するエリアを選択するようにしてもよい。 Further, the partial area selection unit 127B may integrate areas adjacent to the area selected by the above method (areas bordering on each other) and select them as one partial area. For example, the partial area selection unit 127B may select an area with the highest power and an area adjacent to that area.

さらにまた、部分エリア選択部127Bが選択対象とする部分エリアは、必ずしも互いに独立である必要はない。例えば、部分エリア選択部127Bは、図20に示すエリアDとエリアAのように、互いに重複エリアを有する部分エリアを選択対象として選択するようにしてもよい。言い換えると、部分エリア選択部127Bでは、全体(エリア1、2、3がカバーする全領域)に比べて選択されるエリアが小さく、目的音を抽出する上で不要なエリアを含まないような部分エリアが選択されればよい。 Furthermore, the partial areas to be selected by partial area selection section 127B do not necessarily have to be independent of each other. For example, the partial area selection unit 127B may select partial areas having overlapping areas, such as area D and area A shown in FIG. 20, as selection targets. In other words, the partial area selection unit 127B selects an area that is smaller than the entire area (the entire area covered by areas 1, 2, and 3) and does not include areas unnecessary for extracting the target sound. An area should be selected.

そして、部分エリア選択部127Bは、以上の処理により選択された部分エリアのエリア収音成分を最終的な収音結果W(n)として取得する。なお、部分エリア選択部127Bにおける上記のような部分エリア(部分エリアのエリア収音成分)の選択方法は、第2の実施形態の部分エリア選択部127Aに適用するようにしてもよい。 Then, the partial area selection unit 127B acquires the area picked-up sound component of the partial area selected by the above processing as the final picked-up sound result W(n). The method of selecting partial areas (area picked-up sound components of partial areas) in the partial area selection section 127B as described above may be applied to the partial area selection section 127A of the second embodiment.

以上のように、収音部120Bは部分エリア選択部127Bにより選択されたエリア収音成分を最終出力W(n)として出力する。 As described above, the sound pickup unit 120B outputs the area picked-up sound component selected by the partial area selection unit 127B as the final output W(n).

そして、通信部130は、最終出力W(n)に基づく音声データを、通信路Pを介して通信装置200に送信する。 The communication unit 130 then transmits the audio data based on the final output W(n) to the communication device 200 via the communication path P. FIG.

そして、通信装置200の通信部230は、通信装置100Bから受信した音声データ(W(n)に基づく音声データ)を出力部140に供給する。出力部140は、受信した音声データに基づく音響信号をスピーカ210に供給して表音出力(第2のユーザU2に向けて表音出力)させる。 Then, the communication unit 230 of the communication device 200 supplies the audio data (the audio data based on W(n)) received from the communication device 100B to the output unit 140 . The output unit 140 supplies an acoustic signal based on the received audio data to the speaker 210 to produce a phonetic output (a phonetic output toward the second user U2).

(C-3)第3の実施形態の効果
第3の実施形態によれば、以下のような効果を奏することができる。
(C-3) Effects of Third Embodiment According to the third embodiment, the following effects can be obtained.

第3の実施形態の通信装置100B(収音部120B)では、重なりを持つ3つの収音エリアに対して、どこのエリアとも重複しない独立したエリアと、2つのエリアが重複したエリアと、3つのエリアすべてが重複したエリア、それぞれの部分の成分を算出している。そして、第3の実施形態の通信装置100B(収音部120B)では、分割されたエリアの中から目的音収音エリアとして最も相応しいエリアが選択し、選択されたエリアのエリア収音成分を最終的な収音結果として出力している。これにより、第3の実施形態の通信装置100B(収音部120B)では、複数のエリア収音結果によるエリア全体の範囲をカバーしつつ、選択エリアはエリア全体に比べ遥かに小さいエリアとなるため、不必要なエリア成分を含むことなく、目的音が含まれるピンポイントのエリアから強調音声を取り出すことが可能になる。 In the communication device 100B (sound pickup unit 120B) according to the third embodiment, three overlapping sound pickup areas include an independent area that does not overlap with any area, an area that overlaps two areas, and three overlapping areas. Areas where all three areas overlap, calculating the components of each part. Then, in the communication apparatus 100B (sound pickup unit 120B) of the third embodiment, an area most suitable as the target sound pickup area is selected from among the divided areas, and the area sound pickup component of the selected area is finalized. It is output as a typical sound collection result. As a result, in the communication apparatus 100B (sound pickup unit 120B) of the third embodiment, the selected area is much smaller than the entire area while covering the entire range of the multiple area sound pickup results. , it is possible to extract the emphasized speech from the pinpoint area containing the target sound without including unnecessary area components.

(D)他の実施形態
本発明は、上記の各実施形態に限定されるものではなく、以下に例示するような変形実施形態も挙げることができる。
(D) Other Embodiments The present invention is not limited to the above embodiments, and modified embodiments such as those exemplified below can be exemplified.

(D-1)上記の各実施形態では、収音部は通信装置の一部を構成するものとして説明したが、独立した装置として構成するようにしてもよい。また、上記の各実施形態では、収音部にマイクアレイ部は含まない構成として説明したが、収音部とマイクアレイ部を一体とした装置として構成するようにしてもよい。 (D-1) In each of the above-described embodiments, the sound pickup unit is a part of the communication device, but it may be constructed as an independent device. Further, in each of the above-described embodiments, the sound pickup unit does not include the microphone array unit, but the sound pickup unit and the microphone array unit may be integrated as a device.

(D-2)上記の各実施形態では、本発明の収音装置(収音部)をハンドセット等の手持ち型の送話器(送受話器)を備える装置等に適用する例について説明したが、本発明の収音装置は、ヘッドセットやウェアラブルデバイス(例えば、マイクロホン付きのヘッドマウントディスプレイ、マイクロホン付きのネックバンド型ヘッドホン等)に適用し、第1のユーザU1による装着時に第1のユーザU1の口元が位置する領域を目的エリアとし、その周囲(送話口)の多角形(N角形)の各頂点にマイクロホンを設置し、上記の実施形態と同様にエリア収音処理するようにしてもよい。 (D-2) In each of the above-described embodiments, an example in which the sound collecting device (sound collecting unit) of the present invention is applied to a device having a hand-held transmitter (transmitter/receiver) such as a handset has been described. The sound collecting device of the present invention is applied to a headset or a wearable device (for example, a head-mounted display with a microphone, a neckband type headphone with a microphone, etc.), and when worn by the first user U1, the first user U1 An area where the mouth is positioned may be set as a target area, microphones may be installed at each vertex of a polygon (N-sided polygon) around the area (mouthpiece), and area sound pickup processing may be performed in the same manner as in the above embodiment. .

(D-3)第1、第3の実施形態では、3個のマイクロホンMC1~MC3を用いたエリア収音の例について示したが、マイクアレイ部111に設置するマイクロホンの数(マイクロホンを配置する多角形の辺(角)の数)は限定されないものでる。例えば、3方向あるいは4方向からエリア収音を行なうようにしてもよい。例えば、第1、第3の実施形態において、4つのマイクロホンを四角形の角頂点に配置するようにしてもよい。 (D-3) In the first and third embodiments, an example of area sound pickup using three microphones MC1 to MC3 was shown, but the number of microphones installed in the microphone array unit 111 (the number of microphones The number of sides (corners) of the polygon is not limited. For example, area sound pickup may be performed from three or four directions. For example, in the first and third embodiments, four microphones may be arranged at the corner vertices of a quadrangle.

図24は、マイクアレイ部111のマイクロホンの数を4つとした場合の構成について示した説明図である。 FIG. 24 is an explanatory diagram showing a configuration when the number of microphones in the microphone array section 111 is four.

図24では、4つのマイクロホンMC1~MC4が四角形(正方形)の角頂点の位置に配置されている。4つのマイクロホンMC1~MC4は互いに隣り合うマイクロホン同士と組み合わされて、マイクロホンMC1、MC2の対により形成されるマイクアレイMA701と、マイクロホンMC2、MC3の対により形成されるマイクアレイMA702と、マイクロホンMC3、MC4の対により形成されるマイクアレイMA703と、マイクロホンMC4、MC1の対により形成されるマイクアレイMA704の4つが形成される。さらにこれらのマイクロアレイは隣り合うマイクアレイとの組み合わせ(一部のマイクロホンを共有するマイクアレイの組み合わせ)により4つのエリア収音が可能となる。例えば、マイクアレイ部111に、4つのマイクロホンMC1~MC4の構成を適用した場合、収音部120Bでは、マイクアレイMA701、MA702の組み合わせによるエリア収音と、マイクアレイMA702、MA703の組み合わせによるエリア収音と、マイクアレイMA703、MA704の組み合わせによるエリア収音と、マイクアレイMA704、MA701の組み合わせによるエリア収音の各出力(4つのエリア収音の出力)を取得することができる。そして、収音部120Bでは、上述の4つのエリア収音の出力に基づいた収音結果を取得することができる。 In FIG. 24, four microphones MC1 to MC4 are arranged at the corner vertices of a quadrangle (square). The four microphones MC1 to MC4 are combined with adjacent microphones to form a microphone array MA701 formed by a pair of microphones MC1 and MC2, a microphone array MA702 formed by a pair of microphones MC2 and MC3, a microphone MC3, A microphone array MA703 formed by a pair of MC4 and a microphone array MA704 formed by a pair of microphones MC4 and MC1 are formed. Further, these microarrays are combined with adjacent microphone arrays (combination of microphone arrays sharing some microphones) to enable sound pickup in four areas. For example, when the configuration of four microphones MC1 to MC4 is applied to the microphone array unit 111, the sound pickup unit 120B performs area sound pickup by the combination of the microphone arrays MA701 and MA702 and area pickup by the combination of the microphone arrays MA702 and MA703. It is possible to acquire each output of area sound pickup by combination of sound, microphone arrays MA703 and MA704, and area sound pickup output by combination of microphone arrays MA704 and MA701 (four area sound pickup outputs). Then, the sound pickup unit 120B can acquire a sound pickup result based on the outputs of the above four area sound pickups.

(D-4)第3の実施形態の収音部120B(部分エリア選択部127B)では、複数のエリアから目的音が最も多く含まれる1つのエリアを選択していたが、複数のエリアを選択するようにしてもよい。この場合、第3の実施形態の収音部120B(部分エリア選択部127B)では、選択した複数のエリアのエリア収音成分を統合(加算)して収音結果Wとして取得するようにしてもよい。ただし、この場合、第3の実施形態の収音部120B(部分エリア選択部127B)では、選択された複数のエリアは、互いに共通部分(重複部分)を有さないように、選択対象となるエリアを予め配慮しておく必要がある。 (D-4) In the sound pickup unit 120B (partial area selection unit 127B) of the third embodiment, one area containing the most target sound is selected from a plurality of areas. You may make it In this case, the sound pickup unit 120B (partial area selection unit 127B) of the third embodiment may integrate (add) area sound pickup components of a plurality of selected areas to obtain a sound pickup result W. good. However, in this case, in the sound pickup unit 120B (partial area selection unit 127B) of the third embodiment, the selected multiple areas are selected so as not to have common portions (overlapping portions). The area should be considered in advance.

100、100A、100B…通信装置、110…ハンドセット、111…マイクアレイ部、MC1~MC6…マイクロホン、112…スピーカ、113…送話口、114…受話口、115…把手部、120、120A、120B…収音部、121…信号入力部、122…周波数変換部、123…指向性形成部、124、124A、124B…目的エリア音抽出部、125…エリア音加算部、126、126B…部分エリア成分算出部、127、127B…部分エリア選択部、130…通信部、140…出力部、200…通信装置、210…スピーカ、220…マイク、230…通信部、240…出力部、250…収音部、U1…第1のユーザ、U1a…聴者の手、U2…第2のユーザ、P…通信路。 DESCRIPTION OF SYMBOLS 100, 100A, 100B... Communication apparatus 110... Handset 111... Microphone array part MC1-MC6... Microphone 112... Speaker 113... Mouthpiece 114... Earpiece 115... Handle part 120, 120A, 120B Sound pickup unit 121 Signal input unit 122 Frequency conversion unit 123 Directivity formation unit 124, 124A, 124B Target area sound extraction unit 125 Area sound addition unit 126, 126B Partial area components Calculation unit 127, 127B partial area selection unit 130 communication unit 140 output unit 200 communication device 210 speaker 220 microphone 230 communication unit 240 output unit 250 sound pickup unit , U1... first user, U1a... listener's hand, U2... second user, P... channel.

Claims (6)

複数の異なる指向性のマイクアレイを形成可能なマイクアレイ部からの入力信号に基づいて、2パターン以上の前記マイクアレイの組み合わせに基づき複数の収音エリアのエリア収音成分を取得するエリア収音手段と、
前記エリア収音手段が取得した前記収音エリアの全てをカバーする全エリアから分けられる2以上の前記収音エリアが重複する部分エリアと、前記収音エリア同士で重複しない部分エリアのそれぞれのエリア収音成分について、前記エリア収音手段が取得した各パターンの前記収音エリアのエリア収音成分に基づいて取得する部分エリア成分算出手段と、
前記部分エリア成分算出手段が算出した部分エリアのエリア収音成分から、1又は複数の部分エリアのエリア収音成分を選択し、選択されたエリア収音成分に基づく収音結果を取得する部分エリア選択手段とを有し、
前記マイクアレイ部は、N角形(Nは3以上の整数)の各頂点の位置となるように配置されたN個のマイクロホン、又は、N角形の各頂点の位置となるように配置されたN組のマイクロホンアレイを有すること
を特徴とする収音装置。
Area sound pickup for acquiring area sound components of a plurality of sound pickup areas based on a combination of two or more patterns of the microphone arrays based on an input signal from a microphone array section capable of forming a plurality of microphone arrays with different directivities. means and
A partial area where two or more of the sound pickup areas that are divided from the total area covering all of the sound pickup areas acquired by the area sound pickup means overlaps, and a partial area that does not overlap between the sound pickup areas. Partial area component calculation means for acquiring sound pickup components based on the area sound pickup components of the sound pickup areas of each pattern acquired by the area sound pickup means;
A partial area that selects area sound pickup components of one or more partial areas from the area sound pickup components of the partial areas calculated by the partial area component calculation means, and obtains a sound pickup result based on the selected area sound pickup components. a selection means ;
The microphone array unit includes N microphones arranged at positions of vertices of N polygons (N is an integer of 3 or more), or N microphones arranged at positions of vertices of N polygons. Having a pair of microphone arrays
A sound collecting device characterized by
前記部分エリア選択手段は、それぞれの部分エリアのエリア収音成分のパワーを比較した結果に基づいて、1又は複数の部分エリアのエリア収音成分を選択することを特徴とする請求項1に記載の収音装置。 2. The partial area selection means according to claim 1, wherein said partial area selection means selects the area picked-up sound component of one or a plurality of partial areas based on the result of comparing the power of the area picked-up sound component of each partial area. sound collection device. 前記部分エリア選択手段は、前記部分エリア成分算出手段が算出した部分エリアのエリア収音成分から、最もパワーの強いエリア収音成分を選択することを特徴とする請求項2に記載の収音装置。 3. The sound collecting device according to claim 2, wherein said partial area selection means selects an area picked-up sound component having the strongest power from the area picked-up sound components of the partial areas calculated by said partial area component calculation means. . 前記部分エリア選択手段は、複数の部分エリアのエリア収音成分を選択した場合、選択した複数のエリア収音成分を加算した結果を収音結果として取得することを特徴とする請求項1又は2に記載の収音装置。 3. The partial area selection means, when selecting area picked-up sound components of a plurality of partial areas, acquires a result of adding the selected plurality of area picked-up sound components as a picked-up result. The sound collecting device described in . コンピュータを、
複数の異なる指向性のマイクアレイを形成可能なマイクアレイ部からの入力信号に基づいて、2パターン以上の前記マイクアレイの組み合わせに基づき複数の収音エリアのエリア収音成分を取得するエリア収音手段と、
前記エリア収音手段が取得した前記収音エリアの全てをカバーする全エリアから分けられる2以上の前記収音エリアが重複する部分エリアと、前記収音エリア同士で重複しない部分エリアのそれぞれのエリア収音成分について、前記エリア収音手段が取得した各パターンの前記収音エリアのエリア収音成分に基づいて取得する部分エリア成分算出手段と、
前記部分エリア成分算出手段が算出した部分エリアのエリア収音成分から、1又は複数の部分エリアのエリア収音成分を選択し、選択されたエリア収音成分に基づく収音結果を取得する部分エリア選択手段として機能させ、
前記マイクアレイ部は、N角形(Nは3以上の整数)の各頂点の位置となるように配置されたN個のマイクロホン、又は、N角形の各頂点の位置となるように配置されたN組のマイクロホンアレイを有すること
を特徴とする収音プログラム。
the computer,
Area sound pickup for acquiring area sound components of a plurality of sound pickup areas based on a combination of two or more patterns of the microphone arrays based on an input signal from a microphone array section capable of forming a plurality of microphone arrays with different directivities. means and
A partial area where two or more of the sound pickup areas that are divided from the total area covering all of the sound pickup areas acquired by the area sound pickup means overlaps, and a partial area that does not overlap between the sound pickup areas. Partial area component calculation means for acquiring sound pickup components based on the area sound pickup components of the sound pickup areas of each pattern acquired by the area sound pickup means;
A partial area that selects area sound pickup components of one or more partial areas from the area sound pickup components of the partial areas calculated by the partial area component calculation means, and obtains a sound pickup result based on the selected area sound pickup components. act as a means of selection,
The microphone array unit includes N microphones arranged at positions of vertices of N polygons (N is an integer of 3 or more), or N microphones arranged at positions of vertices of N polygons. Having a pair of microphone arrays
Sound collection program characterized by.
収音装置が行う収音方法において、
エリア収音手段、部分エリア成分算出手段、及び部分エリア選択手段を備え、
前記エリア収音手段は、複数の異なる指向性のマイクアレイを形成可能なマイクアレイ部からの入力信号に基づいて、2パターン以上の前記マイクアレイの組み合わせに基づき複数の収音エリアのエリア収音成分を取得し、
前記部分エリア成分算出手段は、前記エリア収音手段が取得した前記収音エリアの全てをカバーする全エリアから分けられる2以上の前記収音エリアが重複する部分エリアと、前記収音エリア同士で重複しない部分エリアのそれぞれのエリア収音成分について、前記エリア収音手段が取得した各パターンの前記収音エリアのエリア収音成分に基づいて取得し、
前記部分エリア選択手段は、前記部分エリア成分算出手段が算出した部分エリアのエリア収音成分から、1又は複数の部分エリアのエリア収音成分を選択し、選択されたエリア収音成分に基づく収音結果を取得し、
前記マイクアレイ部は、N角形(Nは3以上の整数)の各頂点の位置となるように配置されたN個のマイクロホン、又は、N角形の各頂点の位置となるように配置されたN組のマイクロホンアレイを有すること
ことを特徴とする収音方法。
In the sound collection method performed by the sound collection device,
Area sound collection means, partial area component calculation means, and partial area selection means,
The area sound pickup means picks up sound in a plurality of sound pickup areas based on a combination of two or more patterns of the microphone arrays based on an input signal from a microphone array unit capable of forming a plurality of microphone arrays with different directivities. get the ingredients,
The partial area component calculation means calculates a partial area in which two or more of the sound collection areas overlap, divided from the entire area covering all of the sound collection areas acquired by the area sound collection means, and a partial area in which the sound collection areas overlap each other. Acquiring area sound components of each non-overlapping partial area based on the area sound components of the sound collecting areas of each pattern acquired by the area sound collecting means;
The partial area selecting means selects area picked-up sound components of one or a plurality of partial areas from the area picked-up sound components of the partial areas calculated by the partial area component calculating means, and picks up sound based on the selected area picked-up sound components. get the sound result,
The microphone array unit includes N microphones arranged at positions of vertices of N polygons (N is an integer of 3 or more), or N microphones arranged at positions of vertices of N polygons. Having a pair of microphone arrays
A sound collection method characterized by:
JP2018174097A 2018-09-18 2018-09-18 SOUND COLLECTION DEVICE, PROGRAM AND METHOD Active JP7176316B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2018174097A JP7176316B2 (en) 2018-09-18 2018-09-18 SOUND COLLECTION DEVICE, PROGRAM AND METHOD

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018174097A JP7176316B2 (en) 2018-09-18 2018-09-18 SOUND COLLECTION DEVICE, PROGRAM AND METHOD

Publications (2)

Publication Number Publication Date
JP2020048038A JP2020048038A (en) 2020-03-26
JP7176316B2 true JP7176316B2 (en) 2022-11-22

Family

ID=69901930

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018174097A Active JP7176316B2 (en) 2018-09-18 2018-09-18 SOUND COLLECTION DEVICE, PROGRAM AND METHOD

Country Status (1)

Country Link
JP (1) JP7176316B2 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20230054315A1 (en) 2020-03-18 2023-02-23 Rohm Co., Ltd. Semiconductor device and method for manufacturing the same

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001204092A (en) 2000-01-18 2001-07-27 Nippon Telegr & Teleph Corp <Ntt> Each zone sound collection device
US20150063590A1 (en) 2013-08-30 2015-03-05 Oki Electric Industry Co., Ltd. Sound source separating apparatus, sound source separating program, sound pickup apparatus, and sound pickup program
JP2016127457A (en) 2015-01-05 2016-07-11 沖電気工業株式会社 Sound pickup device, program and method

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001204092A (en) 2000-01-18 2001-07-27 Nippon Telegr & Teleph Corp <Ntt> Each zone sound collection device
US20150063590A1 (en) 2013-08-30 2015-03-05 Oki Electric Industry Co., Ltd. Sound source separating apparatus, sound source separating program, sound pickup apparatus, and sound pickup program
JP2015050558A (en) 2013-08-30 2015-03-16 沖電気工業株式会社 Sound source separating device, sound source separating program, sound collecting device, and sound collecting program
JP2016127457A (en) 2015-01-05 2016-07-11 沖電気工業株式会社 Sound pickup device, program and method

Also Published As

Publication number Publication date
JP2020048038A (en) 2020-03-26

Similar Documents

Publication Publication Date Title
JP4873913B2 (en) Sound source separation system, sound source separation method, and acoustic signal acquisition apparatus
US10097921B2 (en) Methods circuits devices systems and associated computer executable code for acquiring acoustic signals
US9197974B1 (en) Directional audio capture adaptation based on alternative sensory input
KR101456866B1 (en) Method and apparatus for extracting the target sound signal from the mixed sound
US8787587B1 (en) Selection of system parameters based on non-acoustic sensor information
JP6187626B1 (en) Sound collecting device and program
KR101449433B1 (en) Noise cancelling method and apparatus from the sound signal through the microphone
US9232309B2 (en) Microphone array processing system
US20120099732A1 (en) Systems, methods, apparatus, and computer-readable media for far-field multi-source tracking and separation
JP6789690B2 (en) Signal processing equipment, signal processing methods, and programs
KR20130055650A (en) Systems, methods, apparatus, and computer-readable media for multi-microphone location-selective processing
CN111078185A (en) Method and equipment for recording sound
JP7067146B2 (en) Sound collectors, programs and methods
JP6943120B2 (en) Sound collectors, programs and methods
JP7176316B2 (en) SOUND COLLECTION DEVICE, PROGRAM AND METHOD
JP5190859B2 (en) Sound source separation device, sound source separation method, sound source separation program, and recording medium
JP7067173B2 (en) Sound collectors, programs and methods
JP7176291B2 (en) SOUND COLLECTION DEVICE, PROGRAM AND METHOD
US8737652B2 (en) Method for operating a hearing device and hearing device with selectively adjusted signal weighing values
JP7040198B2 (en) Sound collectors, programs and methods
JP7175096B2 (en) SOUND COLLECTION DEVICE, PROGRAM AND METHOD
JP6973224B2 (en) Sound collectors, programs and methods
WO2011149969A2 (en) Separating voice from noise using a network of proximity filters
US20190306618A1 (en) Methods circuits devices systems and associated computer executable code for acquiring acoustic signals
CN115665606B (en) Sound reception method and sound reception device based on four microphones

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210507

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20220317

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220329

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220527

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20221011

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20221024

R150 Certificate of patent or registration of utility model

Ref document number: 7176316

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150