JP2017208682A - Target sound collection device, target sound collection method, program, and recording media - Google Patents
Target sound collection device, target sound collection method, program, and recording media Download PDFInfo
- Publication number
- JP2017208682A JP2017208682A JP2016099334A JP2016099334A JP2017208682A JP 2017208682 A JP2017208682 A JP 2017208682A JP 2016099334 A JP2016099334 A JP 2016099334A JP 2016099334 A JP2016099334 A JP 2016099334A JP 2017208682 A JP2017208682 A JP 2017208682A
- Authority
- JP
- Japan
- Prior art keywords
- sound
- sound collection
- unit
- unnecessary
- estimated
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Circuit For Audible Band Transducer (AREA)
Abstract
Description
本発明は、複数のマイクロホンを利用した集音技術に利用される目的音集音装置、目的音集音方法、プログラム、記録媒体に関する。 The present invention relates to a target sound collection device, a target sound collection method, a program, and a recording medium that are used in sound collection technology using a plurality of microphones.
図1、図2に特許文献1の目的音集音装置9の構成、および動作を模式的に示す。図1に示すように、特許文献1の目的音集音装置9は、方向推定部91、集音方向制御部92、指向性集音部93、記憶部94を含み、集音方向制御部92は、所望方向設定部922、集音方向決定部923を含む。方向推定部91は、複数のマイクロホン8−1、…、8−N(Nは2以上の整数)から集音した複数の音響信号に基づいて音源の方向を推定する(S91)。方向推定部91は、マイクロホン8−1、…、8−N間で発生する時間差や振幅差を手掛かりに音源の方向を推定する。所望方向設定部922は、集音を所望する方向(所望方向)、あるいは集音を所望する角度範囲(所望角度範囲)を予め設定する(S922)。集音方向決定部923は、ステップS91で推定された音源の方向が予め設定された所望方向(あるいは所望角度範囲)と合致する場合に、当該音源の方向を集音方向と決定する(S923)。指向性集音部93は、ステップS923で決定された集音方向の音を強調して指向性集音を実行する(S93)。ステップS93は、特許文献2などに開示された方法により実現できる。ステップS93で指向性集音された音響信号は、同図に示すように記憶部94に記憶する構成としてもよいし、この装置の外部に出力されてもよい。
FIG. 1 and FIG. 2 schematically show the configuration and operation of the target
特許文献1の方法は予め集音したい方向や角度範囲が決まっていれば有効である。一方、特許文献1の方法において予め集音したい方向や角度範囲が決まっていない場合、全方位が集音方向とされる。この場合、周囲に不要音を発するものや人がいる場合には、この音も必要な音として集音してしまうという問題がある。例えば、音声認識を用いて対話を行うロボットや、音声認識を用いて機器の操作を行うリモコンなどに特許文献1の方法を適用した場合、不要音に反応して音声認識が行われ、ロボットやリモコンが誤動作を起こす可能性がある。
The method of
そこで本発明では、不要音方向を推定し、不要音方向以外の方向を集音方向として指向性集音を実行することができる目的音集音装置を提供することを目的とする。 Therefore, an object of the present invention is to provide a target sound collecting device that can estimate a direction of unnecessary sound and execute directional sound collection using a direction other than the unnecessary sound direction as a sound collecting direction.
本発明の目的音集音装置は、方向推定部と、発音頻度計測部と、不要音方向推定部と、集音方向決定部と、指向性集音部を含む。 The target sound collection device of the present invention includes a direction estimation unit, a pronunciation frequency measurement unit, an unnecessary sound direction estimation unit, a sound collection direction determination unit, and a directional sound collection unit.
方向推定部は、複数のマイクロホンから集音した複数の音響信号に基づいて音源の方向を推定する。発音頻度計測部は、各方向について音源の方向として推定された頻度を計測する。不要音方向推定部は、各方向のうちの何れかの方向における頻度と予め定めた閾値との比較結果が所定の条件を充たす場合に、何れかの方向を不要音方向と推定する。集音方向決定部は、不要音方向と異なる方向が音源の方向と推定された場合に、不要音方向と異なる方向である音源の方向を集音方向と決定する。指向性集音部は、決定された集音方向の音を強調して集音する。 The direction estimation unit estimates the direction of the sound source based on a plurality of acoustic signals collected from a plurality of microphones. The pronunciation frequency measurement unit measures the frequency estimated as the direction of the sound source in each direction. The unnecessary sound direction estimation unit estimates any direction as an unnecessary sound direction when a comparison result between the frequency in any one of the directions and a predetermined threshold satisfies a predetermined condition. When the direction different from the unnecessary sound direction is estimated as the direction of the sound source, the sound collection direction determination unit determines the direction of the sound source that is different from the unnecessary sound direction as the sound collection direction. The directional sound collection unit collects sound by emphasizing the sound in the determined sound collection direction.
本発明の目的音集音装置によれば、不要音方向を推定し、不要音方向以外の方向を集音方向として指向性集音を実行することができる。 According to the target sound collecting device of the present invention, it is possible to estimate a direction of unnecessary sound and execute directional sound collection using a direction other than the unnecessary sound direction as a sound collecting direction.
以下、本発明の実施の形態について、詳細に説明する。なお、同じ機能を有する構成部には同じ番号を付し、重複説明を省略する。 Hereinafter, embodiments of the present invention will be described in detail. In addition, the same number is attached | subjected to the structure part which has the same function, and duplication description is abbreviate | omitted.
以下、図3、図4を参照して実施例1の目的音集音装置の構成、および動作を説明する。図3に示すように、本実施例の目的音集音装置1は、方向推定部91と、集音方向制御部12と、指向性集音部93と、記憶部94を含み、集音方向制御部12は、発音頻度計測部121と、不要音方向推定部122と、集音方向決定部123を含む。方向推定部91、指向性集音部93、記憶部94は、特許文献1の目的音集音装置9の同名、同番号の構成要件と同じ機能を有するため、説明を略する。
Hereinafter, the configuration and operation of the target sound collecting apparatus according to the first embodiment will be described with reference to FIGS. 3 and 4. As shown in FIG. 3, the target
発音頻度計測部121は、各方向について音源の方向として推定された頻度を計測する(S121)。すなわち、発音頻度計測部121は、一定時間内にどの方向からどのくらいの頻度で発音があったかを計測する。発音があったか否かについては、方向推定部91の出力から知ることができる。発音頻度計測部121は、例えば過去T秒の間に方向推定部91が推定した方向がθであった時間の合計をA(θ)秒とすれば、θ方向の発音頻度を、それらの比D(θ)=A(θ)/Tとして求めることができる。発音頻度計測部121は、この頻度を各方向についてすべて求める。例えば雑音源がテレビや音楽受聴用のスピーカであると想定した場合、これらは長時間の間ほとんど無音になることなく、マイクロホン8−1、…8−Nには同じ方向から音が到来し続けることとなる。このような雑音源がθ方向にあった場合、発音頻度D(θ)は1に近い大きな値をとることになる。
The pronunciation
不要音方向推定部122は、各方向のうちの何れかの方向における頻度と予め定めた閾値との比較結果が所定の条件を充たす場合に、何れかの方向を不要音方向と推定する(S122)。例えば不要音方向推定部122は、前述の発音頻度D(θ)が、予め設定した閾値E(0≦E≦1)を超える場合に、その方向を不要音方向として設定する。不要音方向推定部122は、すべての方向について同様の推定を行い、一方向、または複数の方向を不要音方向と推定する。不要音方向推定部122は、不要音方向として設定された方向θNに基づいて定まる所定の角度範囲内の全ての方向(例えばθN+Δθ〜θN−Δθの範囲内の全ての方向)を不要音方向としてもよい。Δθは予め設定された不要音方向の設定幅であり、方向推定の精度に基づいて設定される。例えば方向推定精度が10度であった場合に10度以上の値を設定することで、方向の推定誤差で不要音を必要な音として判定してしまうことがなくなる。
The unnecessary sound
集音方向決定部123は、不要音方向と異なる方向が音源の方向と推定された場合に、不要音方向と異なる方向である音源の方向を集音方向と決定する(S123)。
When the direction different from the unnecessary sound direction is estimated as the direction of the sound source, the sound collection
本実施例の目的音集音装置1によれば、音を継続的に発生している音源を不要音と推定し、それ以外の音源を目的音として取り扱うため、テレビや音楽受聴用のスピーカなどの雑音源が存在する場合でも、目的音を適切に判別し、目的音を強調して集音することができる。
According to the target
以下、図5、図6、図7を参照して実施例2の目的音集音装置の構成、および動作を説明する。図5に示すように、本実施例の目的音集音装置2は、方向推定部91と、集音方向制御部22と、指向性集音部93と、記憶部94と、発話制御部24と、音声合成部25を含み、集音方向制御部22は、発音頻度計測部221と、不要音方向推定部122と、集音方向決定部123を含む。発音頻度計測部221、発話制御部24、音声合成部25以外の構成要件については、実施例1の目的音集音装置1の同名、同番号の構成要件と同じ機能を有するため、説明を略する。本実施例の目的音集音装置2は、ユーザと対話を行う装置であることを想定し、発話制御部24と、音声合成部25を備えることにより、発話制御、音声合成機能を有している。発話制御部24は、発話を制御する(S24)。音声合成部25は、合成音声を生成して再生する(S25)。本実施例の発話頻度計測部221は、合成音声が再生されている時間に限り、頻度を計測する(S221)。
Hereinafter, the configuration and operation of the target sound collecting apparatus according to the second embodiment will be described with reference to FIGS. 5, 6, and 7. As shown in FIG. 5, the target
合成音声再生中は、対話相手であるユーザは相槌を打つ程度で、ユーザが頻繁に発話をする可能性は少ないものと想定される。従って合成音声再生中の発音頻度が高い場合、その音源はユーザでなく、雑音源である可能性が高い。本実施例の目的音集音装置2はこの想定に基づき、ユーザと対話を行う装置においても、実施例1と同様の効果を奏する。
During the synthetic voice playback, it is assumed that the user who is the other party of the conversation only has a chance to talk, and the user is unlikely to speak frequently. Therefore, when the pronunciation frequency is high during the reproduction of the synthesized speech, the sound source is likely not a user but a noise source. Based on this assumption, the target
<変形例1>
以下、図8、図9、図10を参照して、発話制御部24と、音声合成部25を発話検出部26aに代替し、発音頻度計測部221を発音頻度計測部221aに代替した変形例1の目的音集音装置2aの構成、および動作について説明する。
<
Hereinafter, with reference to FIG. 8, FIG. 9, and FIG. 10, a modification in which the
発話検出部26aは、スピーカ再生用音信号から発話を検出する(S26a)。発話検出部26aは、スピーカ再生用音信号のレベルとあらかじめ設定した閾値を比較し、スピーカ再生用音信号のレベルが閾値を超える場合に、発話ありとして発話を検出する。発話頻度計測部221aは、発話が検出されている時間に限り、頻度を計測する(S221a)。
The
以下、図11、図12を参照して実施例3の目的音集音装置の構成、および動作を説明する。図11に示すように、本実施例の目的音集音装置3は、方向推定部91と、集音方向制御部32と、指向性集音部93と、記憶部94と、発話制御部24と、音声合成部25を含み、集音方向制御部32は、発音頻度計測部221と、不要音方向推定部122と、集音方向決定部323と、発音タイミング計測部324を含む。集音方向決定部323、発音タイミング計測部324以外の構成要件については、実施例2の目的音集音装置2の同名、同番号の構成要件と同じ機能を有するため、説明を略する。
Hereinafter, the configuration and operation of the target sound collecting apparatus according to the third embodiment will be described with reference to FIGS. 11 and 12. As shown in FIG. 11, the target
発音タイミング計測部324は、合成音声の再生が休止している場合に、合成音声の再生が休止した直後から最初に音源の方向の推定がなされるまでの時間を計測する(S324)。
The pronunciation
集音方向決定部323は、最初に推定された音源の方向が不要音方向と異なる方向であって、ステップS324で計測された時間が予め定めた条件を充たす場合に、最初に推定された音源の方向を集音方向と決定する(S323)。具体的には、集音方向決定部323は、方向推定部91が推定した音源の方向が不要音方向推定部122において不要音方向と推定されていないという条件に加え、発音タイミング計測部324で計測された時間が、予め設定した最小値と最大値の間に入っている場合に、当該推定された方向を集音方向を決定する(S323)。ただし、最小値、最大値は負の値でも正の値でもよい。
The sound collection
本装置と対話を行っているユーザであれば、対話音声(合成音声)の再生が終わった直後に発話するのが自然であるものと想定される。本実施例の目的音集音装置3はこの想定に基づき、対話音声(合成音声)の再生が休止している場合に、対話音声(合成音声)の再生が休止した直後から短い時間以内に発音が開始されたか否かに注目することで音源がユーザであるか否かを判別することができる。
If the user is interacting with the apparatus, it is assumed that it is natural to utter immediately after the reproduction of the conversation voice (synthetic voice) ends. Based on this assumption, the target
<変形例2>
以下、図13、図14を参照して、発話制御部24と、音声合成部25を発話検出部26aに代替し、発音頻度計測部221を発音頻度計測部221aに代替し、発音タイミング計測部324を発音タイミング計測部324aに代替した変形例2の目的音集音装置3aの構成、および動作について説明する。発音タイミング計測部324aは、発話が検出されていない場合に、発話が検出されなくなった直後から、最初に音源の方向の推定がなされるまでの時間を計測する(S324a)。別の表現では、発音タイミング計測部324aは、発話検出部26aの出力が発話ありから発話なしに移行した時刻から、最初に音源の方向の推定がなされるまでの時間を計測する(S324a)。
<
Hereinafter, referring to FIG. 13 and FIG. 14, the
<補記>
本発明の装置は、例えば単一のハードウェアエンティティとして、キーボードなどが接続可能な入力部、液晶ディスプレイなどが接続可能な出力部、ハードウェアエンティティの外部に通信可能な通信装置(例えば通信ケーブル)が接続可能な通信部、CPU(Central Processing Unit、キャッシュメモリやレジスタなどを備えていてもよい)、メモリであるRAMやROM、ハードディスクである外部記憶装置並びにこれらの入力部、出力部、通信部、CPU、RAM、ROM、外部記憶装置の間のデータのやり取りが可能なように接続するバスを有している。また必要に応じて、ハードウェアエンティティに、CD−ROMなどの記録媒体を読み書きできる装置(ドライブ)などを設けることとしてもよい。このようなハードウェア資源を備えた物理的実体としては、汎用コンピュータなどがある。
<Supplementary note>
The apparatus of the present invention includes, for example, a single hardware entity as an input unit to which a keyboard or the like can be connected, an output unit to which a liquid crystal display or the like can be connected, and a communication device (for example, a communication cable) capable of communicating outside the hardware entity. Can be connected to a communication unit, a CPU (Central Processing Unit, may include a cache memory or a register), a RAM or ROM that is a memory, an external storage device that is a hard disk, and an input unit, an output unit, or a communication unit thereof , A CPU, a RAM, a ROM, and a bus connected so that data can be exchanged between the external storage devices. If necessary, the hardware entity may be provided with a device (drive) that can read and write a recording medium such as a CD-ROM. A physical entity having such hardware resources includes a general-purpose computer.
ハードウェアエンティティの外部記憶装置には、上述の機能を実現するために必要となるプログラムおよびこのプログラムの処理において必要となるデータなどが記憶されている(外部記憶装置に限らず、例えばプログラムを読み出し専用記憶装置であるROMに記憶させておくこととしてもよい)。また、これらのプログラムの処理によって得られるデータなどは、RAMや外部記憶装置などに適宜に記憶される。 The external storage device of the hardware entity stores a program necessary for realizing the above functions and data necessary for processing the program (not limited to the external storage device, for example, reading a program) It may be stored in a ROM that is a dedicated storage device). Data obtained by the processing of these programs is appropriately stored in a RAM or an external storage device.
ハードウェアエンティティでは、外部記憶装置(あるいはROMなど)に記憶された各プログラムとこの各プログラムの処理に必要なデータが必要に応じてメモリに読み込まれて、適宜にCPUで解釈実行・処理される。その結果、CPUが所定の機能(上記、…部、…手段などと表した各構成要件)を実現する。 In the hardware entity, each program stored in an external storage device (or ROM or the like) and data necessary for processing each program are read into a memory as necessary, and are interpreted and executed by a CPU as appropriate. . As a result, the CPU realizes a predetermined function (respective component requirements expressed as the above-described unit, unit, etc.).
本発明は上述の実施形態に限定されるものではなく、本発明の趣旨を逸脱しない範囲で適宜変更が可能である。また、上記実施形態において説明した処理は、記載の順に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されるとしてもよい。 The present invention is not limited to the above-described embodiment, and can be appropriately changed without departing from the spirit of the present invention. In addition, the processing described in the above embodiment may be executed not only in time series according to the order of description but also in parallel or individually as required by the processing capability of the apparatus that executes the processing. .
既述のように、上記実施形態において説明したハードウェアエンティティ(本発明の装置)における処理機能をコンピュータによって実現する場合、ハードウェアエンティティが有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、上記ハードウェアエンティティにおける処理機能がコンピュータ上で実現される。 As described above, when the processing functions in the hardware entity (the apparatus of the present invention) described in the above embodiments are realized by a computer, the processing contents of the functions that the hardware entity should have are described by a program. Then, by executing this program on a computer, the processing functions in the hardware entity are realized on the computer.
この処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、例えば、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等どのようなものでもよい。具体的には、例えば、磁気記録装置として、ハードディスク装置、フレキシブルディスク、磁気テープ等を、光ディスクとして、DVD(Digital Versatile Disc)、DVD−RAM(Random Access Memory)、CD−ROM(Compact Disc Read Only Memory)、CD−R(Recordable)/RW(ReWritable)等を、光磁気記録媒体として、MO(Magneto-Optical disc)等を、半導体メモリとしてEEP−ROM(Electronically Erasable and Programmable-Read Only Memory)等を用いることができる。 The program describing the processing contents can be recorded on a computer-readable recording medium. As the computer-readable recording medium, for example, any recording medium such as a magnetic recording device, an optical disk, a magneto-optical recording medium, and a semiconductor memory may be used. Specifically, for example, as a magnetic recording device, a hard disk device, a flexible disk, a magnetic tape or the like, and as an optical disk, a DVD (Digital Versatile Disc), a DVD-RAM (Random Access Memory), a CD-ROM (Compact Disc Read Only). Memory), CD-R (Recordable) / RW (ReWritable), etc., magneto-optical recording medium, MO (Magneto-Optical disc), etc., semiconductor memory, EEP-ROM (Electronically Erasable and Programmable-Read Only Memory), etc. Can be used.
また、このプログラムの流通は、例えば、そのプログラムを記録したDVD、CD−ROM等の可搬型記録媒体を販売、譲渡、貸与等することによって行う。さらに、このプログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することにより、このプログラムを流通させる構成としてもよい。 The program is distributed by selling, transferring, or lending a portable recording medium such as a DVD or CD-ROM in which the program is recorded. Furthermore, the program may be distributed by storing the program in a storage device of the server computer and transferring the program from the server computer to another computer via a network.
このようなプログラムを実行するコンピュータは、例えば、まず、可搬型記録媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、一旦、自己の記憶装置に格納する。そして、処理の実行時、このコンピュータは、自己の記録媒体に格納されたプログラムを読み取り、読み取ったプログラムに従った処理を実行する。また、このプログラムの別の実行形態として、コンピュータが可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することとしてもよく、さらに、このコンピュータにサーバコンピュータからプログラムが転送されるたびに、逐次、受け取ったプログラムに従った処理を実行することとしてもよい。また、サーバコンピュータから、このコンピュータへのプログラムの転送は行わず、その実行指示と結果取得のみによって処理機能を実現する、いわゆるASP(Application Service Provider)型のサービスによって、上述の処理を実行する構成としてもよい。なお、本形態におけるプログラムには、電子計算機による処理の用に供する情報であってプログラムに準ずるもの(コンピュータに対する直接の指令ではないがコンピュータの処理を規定する性質を有するデータ等)を含むものとする。 A computer that executes such a program first stores, for example, a program recorded on a portable recording medium or a program transferred from a server computer in its own storage device. When executing the process, the computer reads a program stored in its own recording medium and executes a process according to the read program. As another execution form of the program, the computer may directly read the program from a portable recording medium and execute processing according to the program, and the program is transferred from the server computer to the computer. Each time, the processing according to the received program may be executed sequentially. Also, the program is not transferred from the server computer to the computer, and the above-described processing is executed by a so-called ASP (Application Service Provider) type service that realizes the processing function only by the execution instruction and result acquisition. It is good. Note that the program in this embodiment includes information that is used for processing by an electronic computer and that conforms to the program (data that is not a direct command to the computer but has a property that defines the processing of the computer).
また、この形態では、コンピュータ上で所定のプログラムを実行させることにより、ハードウェアエンティティを構成することとしたが、これらの処理内容の少なくとも一部をハードウェア的に実現することとしてもよい。 In this embodiment, a hardware entity is configured by executing a predetermined program on a computer. However, at least a part of these processing contents may be realized by hardware.
Claims (8)
各方向について前記音源の方向として推定された頻度を計測する発音頻度計測部と、
前記各方向のうちの何れかの方向における前記頻度と予め定めた閾値との比較結果が所定の条件を充たす場合に、前記何れかの方向を不要音方向と推定する不要音方向推定部と、
前記不要音方向と異なる方向が前記音源の方向と推定された場合に、前記不要音方向と異なる方向である前記音源の方向を集音方向と決定する集音方向決定部と、
前記決定された集音方向の音を強調して集音する指向性集音部と、
を含む目的音集音装置。 A direction estimation unit that estimates the direction of a sound source based on a plurality of acoustic signals collected from a plurality of microphones;
A pronunciation frequency measuring unit that measures the frequency estimated as the direction of the sound source for each direction;
An unnecessary sound direction estimating unit that estimates any one of the directions as an unnecessary sound direction when a comparison result between the frequency in any one of the directions and a predetermined threshold satisfies a predetermined condition;
When the direction different from the unnecessary sound direction is estimated as the direction of the sound source, a sound collection direction determining unit that determines the direction of the sound source that is different from the unnecessary sound direction as the sound collection direction;
A directional sound collection unit that emphasizes and collects the sound in the determined sound collection direction;
A target sound collecting device.
合成音声を生成して再生する音声合成部をさらに含み、
前記発話頻度計測部は、
前記合成音声が再生されている時間に限り、前記頻度を計測する
目的音集音装置。 The target sound collecting device according to claim 1,
A speech synthesizer that generates and reproduces synthesized speech;
The speech frequency measurement unit
A target sound collecting device that measures the frequency only during the time that the synthesized speech is being reproduced.
所定の音信号から発話を検出する発話検出部をさらに含み、
前記発話頻度計測部は、
前記発話が検出されている時間に限り、前記頻度を計測する
目的音集音装置。 The target sound collecting device according to claim 1,
An utterance detection unit for detecting an utterance from a predetermined sound signal;
The speech frequency measurement unit
A target sound collecting device that measures the frequency only during the time when the utterance is detected.
前記合成音声の再生が休止している場合に、前記合成音声の再生が休止した直後から最初に音源の方向の推定がなされるまでの時間を計測する発音タイミング計測部をさらに含み、
前記集音方向決定部は、
前記最初に推定された音源の方向が不要音方向と異なる方向であって、前記計測された時間が予め定めた条件を充たす場合に、前記最初に推定された音源の方向を集音方向と決定する
目的音集音装置。 The target sound collecting device according to claim 2,
When the playback of the synthesized speech is paused, further includes a sounding timing measuring unit that measures a time from immediately after the playback of the synthesized speech pauses until the estimation of the direction of the sound source is first performed,
The sound collection direction determination unit
When the first estimated sound source direction is different from the unnecessary sound direction and the measured time satisfies a predetermined condition, the first estimated sound source direction is determined as the sound collection direction. Sound collecting device.
前記発話が検出されていない場合に、前記発話が検出されなくなった直後から最初に音源の方向の推定がなされるまでの時間を計測する発音タイミング計測部をさらに含み、
前記集音方向決定部は、
前記最初に推定された音源の方向が不要音方向と異なる方向であって、前記計測された時間が予め定めた条件を充たす場合に、前記最初に推定された音源の方向を集音方向と決定する
目的音集音装置。 The target sound collecting device according to claim 3,
When the utterance is not detected, it further includes a pronunciation timing measurement unit that measures the time from immediately after the utterance is no longer detected until the first direction of the sound source is estimated,
The sound collection direction determination unit
When the first estimated sound source direction is different from the unnecessary sound direction and the measured time satisfies a predetermined condition, the first estimated sound source direction is determined as the sound collection direction. Sound collecting device.
複数のマイクロホンから集音した複数の音響信号に基づいて音源の方向を推定するステップと、
各方向について前記音源の方向として推定された頻度を計測するステップと、
前記各方向のうちの何れかの方向における前記頻度と予め定めた閾値との比較結果が所定の条件を充たす場合に、前記何れかの方向を不要音方向と推定するステップと、
前記不要音方向と異なる方向が前記音源の方向と推定された場合に、前記不要音方向と異なる方向である前記音源の方向を集音方向と決定するステップと、
前記決定された集音方向の音を強調して集音するステップと、
を含む目的音集音方法。 A target sound collection method executed by the target sound collection device,
Estimating a direction of a sound source based on a plurality of acoustic signals collected from a plurality of microphones;
Measuring the frequency estimated as the direction of the sound source for each direction;
A step of estimating any one of the directions as an unnecessary sound direction when a comparison result between the frequency in any one of the directions and a predetermined threshold satisfies a predetermined condition;
Determining a direction of the sound source that is different from the unnecessary sound direction as a sound collection direction when a direction different from the unnecessary sound direction is estimated as the direction of the sound source;
Enhancing the sound in the determined sound collection direction and collecting the sound;
Purpose sound collection method including.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016099334A JP6538002B2 (en) | 2016-05-18 | 2016-05-18 | Target sound collection device, target sound collection method, program, recording medium |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016099334A JP6538002B2 (en) | 2016-05-18 | 2016-05-18 | Target sound collection device, target sound collection method, program, recording medium |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2017208682A true JP2017208682A (en) | 2017-11-24 |
JP6538002B2 JP6538002B2 (en) | 2019-07-03 |
Family
ID=60416632
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016099334A Active JP6538002B2 (en) | 2016-05-18 | 2016-05-18 | Target sound collection device, target sound collection method, program, recording medium |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6538002B2 (en) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003270034A (en) * | 2002-03-15 | 2003-09-25 | Nippon Telegr & Teleph Corp <Ntt> | Sound information analyzing method, apparatus, program, and recording medium |
JP2011071655A (en) * | 2009-09-24 | 2011-04-07 | Oki Electric Industry Co Ltd | Sound collecting device, acoustic communication system, and program |
JP2011080868A (en) * | 2009-10-07 | 2011-04-21 | Hitachi Ltd | Sound monitoring system, and speech collection system |
-
2016
- 2016-05-18 JP JP2016099334A patent/JP6538002B2/en active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003270034A (en) * | 2002-03-15 | 2003-09-25 | Nippon Telegr & Teleph Corp <Ntt> | Sound information analyzing method, apparatus, program, and recording medium |
JP2011071655A (en) * | 2009-09-24 | 2011-04-07 | Oki Electric Industry Co Ltd | Sound collecting device, acoustic communication system, and program |
JP2011080868A (en) * | 2009-10-07 | 2011-04-21 | Hitachi Ltd | Sound monitoring system, and speech collection system |
Also Published As
Publication number | Publication date |
---|---|
JP6538002B2 (en) | 2019-07-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20140337021A1 (en) | Systems and methods for noise characteristic dependent speech enhancement | |
GB2604747A (en) | Detection of replay attack | |
JP2020016875A (en) | Voice interaction method, device, equipment, computer storage medium, and computer program | |
JP2012027186A (en) | Sound signal processing apparatus, sound signal processing method and program | |
US8965766B1 (en) | Systems and methods for identifying music in a noisy environment | |
US20090232318A1 (en) | Output correcting device and method, and loudspeaker output correcting device and method | |
JP2009053694A (en) | Method and apparatus for modeling room impulse response | |
US11869536B2 (en) | Auto mute feature using a voice accelerometer and a microphone | |
JP2012155651A (en) | Signal processing device and method, and program | |
JP2006194700A (en) | Sound source direction estimation system, sound source direction estimation method and sound source direction estimation program | |
US20210382972A1 (en) | Biometric Authentication Using Voice Accelerometer | |
JP2013148576A (en) | Portable device performing position specification using modulated background sound, computer program, and method | |
EP2947659A1 (en) | Voice processing device and voice processing method | |
US10764682B2 (en) | Playback system, control device, control method, and program | |
WO2019001158A1 (en) | Method and apparatus for determining position of loudspeaker, and loudspeaker | |
JP2010175431A (en) | Device, method and program for estimating sound source direction | |
JP5134525B2 (en) | Direction information distribution estimation device, sound source number estimation device, sound source direction measurement device, sound source separation device, method thereof, program thereof | |
US20220390580A1 (en) | Audio-based method for determining device distance | |
JP6538002B2 (en) | Target sound collection device, target sound collection method, program, recording medium | |
CN108093356A (en) | One kind is uttered long and high-pitched sounds detection method and device | |
WO2019185015A1 (en) | Signal noise removal method utilizing piezoelectric transducer | |
JP2013170936A (en) | Sound source position determination device, sound source position determination method, and program | |
JP6235198B2 (en) | Audio signal processing method, audio signal processing apparatus, and program | |
JP6618885B2 (en) | Voice segment detection device, voice segment detection method, program | |
JP5199915B2 (en) | Sound field correction method and sound field correction apparatus |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20180626 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20190422 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20190604 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20190605 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6538002 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |