JP7285690B2 - Information processing method, information processing device and program - Google Patents
Information processing method, information processing device and program Download PDFInfo
- Publication number
- JP7285690B2 JP7285690B2 JP2019092403A JP2019092403A JP7285690B2 JP 7285690 B2 JP7285690 B2 JP 7285690B2 JP 2019092403 A JP2019092403 A JP 2019092403A JP 2019092403 A JP2019092403 A JP 2019092403A JP 7285690 B2 JP7285690 B2 JP 7285690B2
- Authority
- JP
- Japan
- Prior art keywords
- sound
- distance
- sound source
- information processing
- type
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Description
本開示は、情報処理方法、情報処理装置及びプログラムに関する。 The present disclosure relates to an information processing method, an information processing device, and a program.
音源の位置(特にマイクロホンと音源との距離)を推定する技術が開示されている。例えば、特許文献1では、複数の互いに異なる位置に設置した複数のマイクロホンを用いた三角測量によって音源の位置を推定する技術が開示されている。また、例えば、特許文献2では、空間における各位置に音源を置いたときにマイクロホンが集音する音をそれぞれ予めデータベース化しておくことで、音源の位置を推定する技術が開示されている。このような技術によって音源の位置を推定できることで、例えば、マイクロホンが設置された空間(原音場)における音の環境を別の場所で再現することができる。例えば、遠隔でテレビ会議等を行う際に、相手方があたかも同じ部屋で話しているかのような環境を作り出すことができる。その他、例えばパブリックビューイング又はオンラインゲーム等においても当該技術は有用となる。
Techniques for estimating the position of a sound source (especially the distance between a microphone and the sound source) have been disclosed. For example,
例えば、上記特許文献1に開示された技術では、複数の位置に集音装置(マイクロホン)を設置する必要がある。また、上記特許文献2に開示された技術では、上記データベースを予め作成しておく必要があり、さらに、当該データベースは空間ごとに固有のものとなるため、空間ごとに上記データベースを作成する必要がある。つまり、上記特許文献1、2に開示された技術では、集音装置と音源との距離を推定するのに手間がかかるという問題がある。
For example, in the technique disclosed in
そこで、本開示は、集音装置と音源との距離を容易に推定できる情報処理方法等を提供することを目的とする。 Therefore, an object of the present disclosure is to provide an information processing method and the like that can easily estimate the distance between the sound collector and the sound source.
本開示の一態様に係る情報処理方法は、集音装置が集音した音を示す音信号を取得し、取得した前記音信号から前記集音装置が集音した音の音量を計算し、取得した前記音信号から前記集音装置が集音した音の音源の種類を識別し、音源の種類と当該音源から所定距離における当該音源からの音の音量である標準音量とが予め対応付けられたデータベースにおける、識別した前記種類に対応する標準音量と、計算した前記音量とに基づいて、前記集音装置と前記集音装置が集音した音の音源との距離を推定し、推定結果を出力する。 An information processing method according to an aspect of the present disclosure acquires a sound signal indicating sound collected by a sound collector, calculates the volume of the sound collected by the sound collector from the acquired sound signal, and acquires The type of the sound source of the sound collected by the sound collecting device is identified from the sound signal obtained, and the type of the sound source is associated in advance with a standard volume, which is the volume of the sound from the sound source at a predetermined distance from the sound source. Based on the standard volume corresponding to the identified type and the calculated volume in the database, estimate the distance between the sound collector and the sound source of the sound collected by the sound collector, and output the estimation result. do.
なお、これらの包括的または具体的な側面は、システム、装置、方法、記録媒体、または、コンピュータプログラムで実現されてもよく、システム、装置、方法、記録媒体、および、コンピュータプログラムの任意な組み合わせで実現されてもよい。 It should be noted that these general or specific aspects may be realized by systems, devices, methods, recording media, or computer programs, and any combination of systems, devices, methods, recording media, and computer programs. may be implemented with
本開示に係る情報処理方法等によれば、集音装置と音源との距離を容易に推定できる。 According to the information processing method and the like according to the present disclosure, it is possible to easily estimate the distance between the sound collector and the sound source.
本開示の一態様に係る情報処理方法は、集音装置が集音した音を示す音信号を取得し、取得した前記音信号から前記集音装置が集音した音の音量を計算し、取得した前記音信号から前記集音装置が集音した音の音源の種類を識別し、音源の種類と当該音源から所定距離における当該音源からの音の音量である標準音量とが予め対応付けられたデータベースにおける、識別した前記種類に対応する標準音量と、計算した前記音量とに基づいて、前記集音装置と前記集音装置が集音した音の音源との距離を推定し、推定結果を出力する。 An information processing method according to an aspect of the present disclosure acquires a sound signal indicating sound collected by a sound collector, calculates the volume of the sound collected by the sound collector from the acquired sound signal, and acquires The type of the sound source of the sound collected by the sound collecting device is identified from the sound signal obtained, and the type of the sound source is associated in advance with a standard volume, which is the volume of the sound from the sound source at a predetermined distance from the sound source. Based on the standard volume corresponding to the identified type and the calculated volume in the database, estimate the distance between the sound collector and the sound source of the sound collected by the sound collector, and output the estimation result. do.
これによれば、様々な種類の音源の音について標準音量を測定して予めデータベースを生成しておけば、あとは、音源の距離の推定を行う空間において、集音装置が集音した音の音量を計算し、また、当該音の音源の種類を識別するだけで、集音装置と音源との距離を容易に推定できる。 According to this, if the standard volume is measured for sounds of various types of sound sources and a database is generated in advance, then the sound collected by the sound collecting device is generated in the space where the distance to the sound source is estimated. The distance between the sound collector and the sound source can be easily estimated simply by calculating the volume and identifying the type of sound source of the sound.
また、前記標準音量に対する計算した前記音量の減衰量と前記距離との予め定められた関係式に基づいて前記距離を推定してもよい。 Further, the distance may be estimated based on a predetermined relational expression between the calculated attenuation amount of the volume with respect to the standard volume and the distance.
これによれば、音量の減衰量と距離には関係性があるため、当該関係性を示す予め定められた関係式を用いることで、集音装置と音源との距離をより容易に推定できる。 According to this, since there is a relationship between the volume attenuation amount and the distance, the distance between the sound collector and the sound source can be more easily estimated by using a predetermined relational expression indicating the relationship.
また、任意の音を示す音信号を入力データとし、当該任意の音の音源の種類を正解データとして学習させた学習モデルと、取得した前記音信号とから前記集音装置が集音した音の音源の種類を識別してもよい。 Also, a sound signal indicating an arbitrary sound is used as input data, and the type of the sound source of the arbitrary sound is used as correct data to learn a learning model, and from the acquired sound signal, the sound collected by the sound collector. The type of sound source may be identified.
これによれば、機械学習された学習モデルを用いることで、集音装置が集音した音の音源の種類を容易に識別できる。 According to this, it is possible to easily identify the type of the sound source of the sound collected by the sound collector by using the machine-learned learning model.
また、取得した前記音信号から前記集音装置が集音した音の音源の種類を識別できない場合に、さらに、当該音信号の特徴量を算出し、前記集音装置と前記集音装置が集音した音の音源との距離を示す距離情報を取得し、算出した前記特徴量と、前記標準音量として、取得した前記距離情報が示す距離における計算した前記音量とを対応付けて前記データベースに登録してもよい。 Further, when the type of the sound source of the sound collected by the sound collecting device cannot be identified from the acquired sound signal, the feature amount of the sound signal is further calculated, and the sound collecting device and the sound collecting device collect the sound. Obtaining distance information indicating the distance from the sound source of the sounded sound, and registering in the database the calculated feature amount and the calculated volume at the distance indicated by the obtained distance information as the standard volume in association with each other. You may
これによれば、識別できなかった種類の音源について、当該音源の音の特徴量と標準音量とがデータベース化されるため、以降は、集音装置と当該特徴量を有する音の音源との距離を推定できるようになる。 According to this, for a sound source of a type that could not be identified, since the feature amount of the sound of the sound source and the standard volume are stored in a database, the distance between the sound collector and the sound source having the feature amount can be estimated.
また、取得した前記音信号が複数の音源からの音を示す場合、音源ごとに前記音信号を分離し、分離後の音信号のそれぞれについて、前記音量の計算、前記種類の識別、前記距離の推定、前記推定結果の出力を行ってもよい。 Further, when the acquired sound signals indicate sounds from a plurality of sound sources, the sound signals are separated for each sound source, and the volume is calculated, the type is identified, and the distance is calculated for each of the separated sound signals. Estimation and output of the estimation result may be performed.
これによれば、複数の音源のそれぞれについて、集音装置との距離を容易に推定できる。 According to this, the distance to the sound collector can be easily estimated for each of the plurality of sound sources.
また、前記識別した音源の種類が、可聴音を出力するものか非可聴音を出力するものかを判定し、当該判定結果にも応じて、前記距離を推定してもよい。具体的には、前記標準音量に対する計算した前記音量の減衰量と前記距離との予め定められた関係式に基づいて前記距離を推定し、前記関係式は、識別した前記種類が可聴音を出力するものである場合と、非可聴音を出力するものである場合とでそれぞれ予め定められていてもよい。 Further, it is possible to determine whether the type of the identified sound source outputs audible sound or non-audible sound, and estimate the distance according to the determination result. Specifically, the distance is estimated based on a predetermined relational expression between the attenuation amount of the volume calculated with respect to the standard volume and the distance, and the relational expression is such that the identified type outputs an audible sound. It may be determined in advance for the case of outputting an inaudible sound and the case of outputting an inaudible sound.
これによれば、集音装置と可聴音を出力する音源との距離、及び、集音装置と非可聴音を出力する音源との距離をそれぞれ推定できる。 According to this, it is possible to estimate the distance between the sound collector and the sound source that outputs audible sound, and the distance between the sound collector and the sound source that outputs inaudible sound.
また、前記集音装置は、複数のマイクロホンからなるマイクロホンアレイであり、さらに、前記複数のマイクロホンのそれぞれが集音した音の集音時間差に基づいて当該音の音源の前記集音装置に対する方向を推定してもよい。 Further, the sound collector is a microphone array composed of a plurality of microphones, and the direction of the sound source of the sound with respect to the sound collector is determined based on the sound collection time difference of the sound collected by each of the plurality of microphones. can be estimated.
これによれば、集音装置が集音した音の音源と集音装置との距離、及び、当該音源の集音装置に対する方向から当該音源の正確な位置を推定できる。 According to this, the accurate position of the sound source can be estimated from the distance between the sound source of the sound collected by the sound collector and the sound collector and the direction of the sound source with respect to the sound collector.
また、識別した音の音源の種類と、前記集音装置と当該音源との距離の推定結果との対応関係を、距離の推定を行うごとに蓄積し、蓄積した前記対応関係と、前記集音装置と前記集音装置が集音した音の音源との距離の推定結果と、に基づいて、当該音源の種類の識別の精度を判定し、前記判定の結果をフィードバックして、音源の種類の識別に用いてもよい。 Further, a correspondence relationship between the type of the identified sound source and the estimation result of the distance between the sound collector and the sound source is accumulated each time the distance is estimated, and the accumulated correspondence relationship and the sound collection are stored. Based on the estimation result of the distance between the device and the sound source of the sound collected by the sound collecting device, the accuracy of identifying the type of the sound source is determined, and the determination result is fed back to determine the type of the sound source. May be used for identification.
これによれば、音源の種類の識別の精度を向上させることができる。 According to this, it is possible to improve the accuracy of identifying the type of sound source.
本開示の一態様に係る情報処理装置は、集音装置が集音した音を示す音信号を取得する音信号取得部と、取得された前記音信号から前記集音装置が集音した音の音量を計算する計算部と、取得された前記音信号から前記集音装置が集音した音の音源の種類を識別する識別部と、音源の種類と当該音源から所定距離における当該音源からの音の音量である標準音量とが予め対応付けられたデータベースにおける、識別された前記種類に対応する標準音量と、計算された前記音量とに基づいて、前記集音装置と前記集音装置が集音した音の音源との距離を推定する推定部と、推定結果を出力する出力部と、を備える。 An information processing device according to an aspect of the present disclosure includes a sound signal acquisition unit that acquires a sound signal indicating sound collected by a sound collector, and a sound signal that is collected by the sound collector from the acquired sound signal. A calculation unit that calculates the volume, an identification unit that identifies the type of sound source of the sound collected by the sound collector from the acquired sound signal, and the type of the sound source and the sound from the sound source at a predetermined distance from the sound source. Based on the standard volume corresponding to the identified type and the calculated volume in a database in which the standard volume is associated in advance, the sound collector and the sound collector collect sound an estimating unit for estimating the distance to the sound source of the generated sound; and an output unit for outputting the estimation result.
これによれば、集音装置と音源との距離を容易に推定できる情報処理装置を提供できる。 According to this, it is possible to provide an information processing device capable of easily estimating the distance between the sound collector and the sound source.
本開示の一態様に係るプログラムは、上記の情報処理方法をコンピュータに実行させるプログラムである。 A program according to an aspect of the present disclosure is a program that causes a computer to execute the above information processing method.
これによれば、集音装置と音源との距離を容易に推定できるプログラムを提供できる。 According to this, it is possible to provide a program capable of easily estimating the distance between the sound collector and the sound source.
以下、実施の形態について、図面を参照しながら具体的に説明する。 Hereinafter, embodiments will be specifically described with reference to the drawings.
なお、以下で説明する実施の形態は、いずれも包括的または具体的な例を示すものである。以下の実施の形態で示される数値、形状、構成要素、構成要素の配置位置および接続形態、ステップ、ステップの順序などは、一例であり、本開示を限定する主旨ではない。また、以下の実施の形態における構成要素のうち、最上位概念を示す独立請求項に記載されていない構成要素については、任意の構成要素として説明される。 It should be noted that the embodiments described below are all comprehensive or specific examples. Numerical values, shapes, components, arrangement positions and connection forms of components, steps, order of steps, and the like shown in the following embodiments are examples and are not intended to limit the present disclosure. In addition, among the constituent elements in the following embodiments, constituent elements that are not described in independent claims representing the highest concept will be described as optional constituent elements.
(実施の形態1)
以下、図1から図3を用いて実施の形態1について説明する。
(Embodiment 1)
図1は、実施の形態1に係る情報処理装置1の構成の一例を示すブロック図である。なお、図1には、集音装置100と、集音装置100が設置された空間において、集音装置100とd[m]離れた位置で発生した音の音源200も示している。
FIG. 1 is a block diagram showing an example of the configuration of an
情報処理装置1は、集音装置100と集音装置100が集音した音の音源200との距離を推定するための装置である。情報処理装置1は、集音装置100が設けられた空間の周辺に設けられたコンピュータ、又は、当該空間とは異なる場所に設けられたサーバ装置等である。また、情報処理装置1は集音装置100と一体に設けられてもよく、例えば、ポータブル機器であってもよい。つまり、集音装置100と一体に設けられた情報処理装置1を持ち運びながら、集音装置100の位置つまり現在位置と音源200との距離の推定が行われてもよい。
The
集音装置100は、例えば、1つのマイクロホンである。集音装置100は、集音した音を音信号(電気信号)に変換して情報処理装置1へ出力する。集音装置100は、音源の距離の推定が行われる空間(部屋等)に設置される。集音装置100と情報処理装置1とは有線又は無線により接続される。
The
図1に示されるように、情報処理装置1は、音信号取得部10、計算部20、識別部30、学習モデル31、推定部40、データベース41及び出力部50を備える。情報処理装置1は、プロセッサ(マイクロプロセッサ)、ユーザインタフェース、通信インタフェース(図示しない通信回路等)及びメモリ等を含むコンピュータである。ユーザインタフェースは、例えば、LCD(Liquid Crystal Display)等のディスプレイ、又は、キーボード、タッチパネル等の入力装置を含む。メモリは、ROM、RAM等であり、プロセッサにより実行される制御プログラム(コンピュータプログラム)を記憶することができる。なお、情報処理装置1は、1つのメモリを有していてもよく、また、複数のメモリを有していてもよい。1つ又は複数のメモリには、後述する学習モデル31及びデータベース41が記憶される。
As shown in FIG. 1 , the
プロセッサが制御プログラムに従って動作することにより、プロセッサが有する機能構成要素である音信号取得部10、計算部20、識別部30、推定部40及び出力部50が実現される。また、プロセッサが、制御プログラムに従って動作することにより、通信インタフェース及びユーザインタフェース等を制御する処理が行われる。なお、後述する実施の形態2~5における音信号取得部10a、識別部30a、推定部40a、40b、算出部60、距離情報取得部70、登録部80、判定部90についても、プロセッサが制御プログラムに従って動作することにより実現される。
The sound
音信号取得部10、計算部20、識別部30、学習モデル31、推定部40、データベース41及び出力部50について、図2を用いて説明する。
The sound
図2は、実施の形態1に係る情報処理装置1の動作の一例を示すフローチャートである。
FIG. 2 is a flow chart showing an example of the operation of the
まず、音信号取得部10は、集音装置100が集音した音を示す音信号を取得する(ステップS11)。具体的には、情報処理装置1が備える通信インタフェースが集音装置100から出力(送信)された音信号を受信することで、音信号取得部10は、当該音信号を取得する。なお、集音装置100が集音した音は音源200からの音とする。
First, the sound
次に、計算部20は、音信号取得部10に取得された音信号から集音装置100が集音した音の音量を計算する(ステップS12)。音量の計算については、一般的になされていることであるため詳細な説明は省略するが、例えば、音信号(電気信号)が示す振幅等から計算することができる。
Next, the
次に、識別部30は、音信号取得部10に取得された音信号から集音装置100が集音した音の音源200の種類を識別する(ステップS13)。例えば、識別部30は、任意の音を示す音信号を入力データとし当該任意の音の音源の種類を正解データとして学習させた学習モデル31と、音信号取得部10に取得された音信号とから集音装置100が集音した音の音源200の種類を識別する。なお、音信号は周波数スペクトル等に変換されて入力データとして用いられてもよい。また、学習モデル31は、例えば、ニューラルネットワーク等である。以下、例えば、音源の種類として「男性の声」を学習させる場合について説明する。
Next, the identifying
まず、任意の音として男性の声を示すものとわかっている音信号を数多く準備する。そして、準備したこれらの男性の声を示す音信号を入力データとして学習モデル31に入力していき、正解が「男性の声」となるように学習モデル31に学習させる。これにより、学習が完了した学習モデル31に種類が未知である音信号を入力した場合に、当該種類が「男性の声」であるときには、学習モデル31から正解として「男性の声」が出力されるようになる。
First, a number of sound signals known to represent male voices are prepared as arbitrary sounds. Then, the prepared sound signals representing male voices are input to the
また、図2では、音量の計算が行われた後に音源200の種類の識別が行われるが、音源200の種類の識別が行われた後に音量の計算が行われてよい。つまり、ステップS12及びステップS13が行われる順序が逆であってもよい。また、音量の計算と音源200の種類の識別とが並行して行われてもよい。
Also, in FIG. 2, the type of
次に、推定部40は、音源の種類と当該音源から所定距離における当該音源からの音の音量である標準音量とが予め対応付けられたデータベース41における、識別部30に識別された種類に対応する標準音量と、計算部20に計算された音量とに基づいて、集音装置100と集音装置100が集音した音の音源200との距離を推定する(ステップS14)。ここで、データベース41について図3を用いて説明する。
Next, the
図3は、データベース41の一例を示す表である。
FIG. 3 is a table showing an example of the
一般的に、音源の種類によってその音の音量はある程度決まっている。そこで、様々な種類の音源について、音源から所定距離における当該音源からの音の音量を標準音量として測定する。これにより、様々な音源の種類と標準音量とが対応付けられたデータベース41を作成できる。図3には、所定距離を1mとしたときの、「男性の声」、「女性の声」、「車の騒音」、「掃除機の音」、「水の流れる音」の標準音量の一例が示されている。なお、人の声については、人によってその音量が異なるため、例えば、集音装置100が設置された空間を使用する人の声について標準音量が測定されることで、人ごとに声と標準音量とが対応付けられてデータベース化されてもよい。
Generally, the volume of sound is determined to some extent depending on the type of sound source. Therefore, for various types of sound sources, the volume of the sound from the sound source at a predetermined distance from the sound source is measured as the standard volume. This makes it possible to create a
推定部40は、具体的には、標準音量に対する計算部20に計算された音量の減衰量と、集音装置100と集音装置100が集音した音の音源との距離との予め定められた関係式に基づいて集音装置100と音源200との距離を推定する。当該関係式の一例を以下の式1に示す。
Specifically, the
式1において、d[m]は集音装置100と音源200との距離を示し、r[m]は所定距離を示し、A0[dB]は所定距離における標準音量を示し、A[dB]は計算部20に計算された音量を示す。また、式1では、音源200を点音源とみなしている。
In
例えば、識別部30に識別された、集音装置100が集音した音の音源200の種類が「男性の声」の場合、データベース41において、当該種類「男性の声」に対応する所定距離1mでの標準音量は55dBとなる。また、このとき計算部20に計算された音量が43dBだったとする。この場合、推定部40は、式1において、r=1、A0=55、A=43を代入することで、集音装置100と音源200との距離を約4mと推定する。
For example, when the type of the
そして、出力部50は、推定部40の推定結果を出力する(ステップS15)。例えば、出力部50は、情報処理装置1が備えるユーザインタフェース、又は、情報処理装置1と通信可能な携帯端末若しくはサーバ装置等の機器に推定結果を出力する。なお、出力部50は、推定結果として、集音装置100と音源200との距離だけでなく、音源の種類等も出力してもよい。
Then, the
以上説明したように、様々な種類の音源の音について標準音量を測定して予めデータベース41を生成しておけば、あとは、音源200の距離の推定を行う空間において、集音装置100が集音した音の音量を計算し、当該音の音源200の種類を識別するだけで、集音装置100と音源200との距離を容易に推定できる。具体的には、距離の推定をするのに、複数の位置に集音装置100を設置する手間がかからず、また、空間ごとに固有のデータベースを作成する手間がかからない。したがって、これまで手間がかかるために集音装置100と音源200との距離の推定が行われていなかった空間においても簡単に距離の推定を行うことができるようになり、距離の推定が行われる空間を増やすことができる。
As described above, if the standard volumes of sounds of various types of sound sources are measured and the
また、音量の減衰量と距離には関係性があるため、当該関係性を示す予め定められた関係式(例えば式1)を用いることで、集音装置100と音源200との距離をより容易に推定できる。
In addition, since there is a relationship between the volume attenuation amount and the distance, using a predetermined relational expression (for example, Equation 1) showing the relationship makes it easier to determine the distance between the
また、機械学習された学習モデル31を用いることで、集音装置100が集音した音の音源200の種類を容易に識別できる。
Further, by using the machine-learned
(実施の形態2)
次に、図4及び図5を用いて実施の形態2について説明する。
(Embodiment 2)
Next, Embodiment 2 will be described with reference to FIGS. 4 and 5. FIG.
図4は、実施の形態2に係る情報処理装置1aの構成の一例を示すブロック図である。 FIG. 4 is a block diagram showing an example of the configuration of an information processing device 1a according to the second embodiment.
実施の形態2に係る情報処理装置1aは、識別部30の代わりに識別部30aを備え、さらに、算出部60、距離情報取得部70及び登録部80を備える点が、実施の形態1に係る情報処理装置1と異なる。その他の点は、実施の形態1に係る情報処理装置1におけるものと同じであるため説明は省略し、図5を用いて上記異なる点を中心に説明する。
The information processing apparatus 1a according to Embodiment 2 is different from
なお、実施の形態2では、集音装置100が設置された空間において発生した音の音源201の種類を学習モデル31に学習させておらず、また、データベース41に音源201の種類及び当該種類に対応する標準音量が含まれていないとする。
In the second embodiment, the
図5は、実施の形態2に係る情報処理装置1aの動作の一例を示すフローチャートである。 FIG. 5 is a flow chart showing an example of the operation of the information processing device 1a according to the second embodiment.
識別部30aは、図2のステップS13と同じように、音信号取得部10に取得された音信号から集音装置100が集音した音の音源201の種類を識別する。このとき、例えば、識別部30aは、音源201の種類を識別できるか否かを判定する(ステップS21)。例えば、学習モデル31に、集音装置100が設置された空間において発生した音の音源201の種類を学習させている場合には、識別部30aは音源201の種類を識別でき、音源201の種類を学習させていない場合には、識別部30aは音源201の種類を識別できない。識別部30aが音源201の種類を識別できると判定した場合(ステップS21でYes)には、実施の形態1と同様にステップS14及びステップS15での処理が行われる。
The identifying unit 30a identifies the type of the
識別部30aが音源201の種類を識別できないと判定した場合(ステップS21でNo)、算出部60は、音信号取得部10に取得された音信号の特徴量を算出する。当該特徴量は、当該音信号の特徴を示すものであり、例えば周波数スペクトル等である。例えば、当該特徴量は学習モデル31が記憶されたメモリ等に記憶される。
When the identification unit 30 a determines that the type of the
次に、距離情報取得部70は、集音装置100と集音装置100が集音した音の音源201との距離を示す距離情報を取得する(ステップS23)。例えば、集音装置100が設置された空間において、ユーザが実際に集音装置100と音源201との距離を測定し、測定結果を情報処理装置1が備えるユーザインタフェースを介して入力したり、情報処理装置1と通信可能な携帯端末等を介して入力したりすることで、距離情報取得部70は距離情報を取得する。
Next, the distance
そして、登録部80は、算出部60に算出された特徴量と、標準音量として、距離情報取得部70に取得された距離情報が示す距離における計算部20に計算された音量とを対応付けてデータベース41に登録する(ステップS24)。上述したように、標準音量は、音源から所定距離における当該音源からの音の音量であるため、当該特徴量についての所定距離は、距離情報取得部70が取得した距離情報が示す距離となり、標準音量は計算部20に計算された音量となる。例えば、距離情報取得部70に取得された距離情報が示す距離が2mであり、計算部20に計算された音量が49dBであったとすると、データベース41において、算出部60に算出された特徴量と所定距離が2mでの標準音量49dBとが対応付けられる。
Then, the
以降、音源201と同じ種類の音源(つまり、同等な特徴量を有する音を発生する音源:同等音源と呼ぶ)と集音装置100との距離を推定できるようになる。具体的には、識別部30aは、音信号取得部10に取得された同等音源からの音を示す音信号の特徴量と同等な特徴量がメモリに記憶されていることを確認することで、当該音信号から集音装置100が集音した音の音源201の種類を識別できると判定する。つまり、学習モデル31に同等音源の種類を学習させていなくても、音源の種類を識別できない(つまり、ステップS21でNo)と判定されなくなり、距離の推定処理に進むことができる。
Henceforth, it becomes possible to estimate the distance between the
推定部40は、登録部80に登録された特徴量と距離情報取得部70に取得された距離情報が示す距離における標準音量とが対応付けられたデータベース41における、識別部30に識別された特徴量に対応する標準音量と、計算部20に計算された同等音源の音の音量とに基づいて、集音装置100と集音装置100が集音した音の音源201との距離を推定する。例えば、計算部20に計算された音量が43dBだったとする。この場合、上述したように所定距離2mでの標準音量が49dBであることから、推定部40は、式1において、r=2、A0=49、A=43を代入することで、集音装置100と同等音源との距離を約4mと推定する。
The
以上説明したように、識別できなかった種類の音源201について、音源201の音の特徴量と標準音量とがデータベース化されるため、以降は、集音装置100と当該特徴量を有する音の音源との距離を推定できるようになる。
As described above, for the
なお、音源201からの音を示す音信号を入力データとし、音源201の種類を正解データとして学習モデル31に学習させ、未知の音源201に対して対応できるように学習モデル31を更新してもよい。
The
(実施の形態3)
次に、図6を用いて実施の形態3について説明する。
(Embodiment 3)
Next, Embodiment 3 will be described with reference to FIG.
図6は、実施の形態3に係る情報処理装置1bの構成の一例を示すブロック図である。
FIG. 6 is a block diagram showing an example of the configuration of an
実施の形態3に係る情報処理装置1bは、音信号取得部10の代わりに音信号取得部10aを備える点が、実施の形態1に係る情報処理装置1と異なる。その他の点は、実施の形態1に係る情報処理装置1におけるものと同じであるため説明は省略し、上記異なる点を中心に説明する。
The
音信号取得部10aは、取得した音信号が複数の音源202及び203からの音を示す場合、音源202及び203ごとに音信号を分離する。複数の音源からの音の成分を含む音信号から、音源ごとの音信号を分離することは一般になされている技術であるため、ここでは詳細な説明は省略するが、分離する方法は特に限定されない。そして、分離後の音信号のそれぞれについて、計算部20は音量の計算を行い、識別部30は種類の識別を行い、推定部40は距離の推定を行い、出力部50は推定結果の出力を行う。つまり、音源202については距離d1が推定され、音源203については距離d2が推定される。
The sound
なお、情報処理装置1bは、計算部20、識別部30及び推定部40を複数組備えていてもよく、分離後の音信号のそれぞれについて、並列に上記各処理が行われてもよい。これにより、複数の音源202及び203の両方についてリアルタイムに距離d1及びd2の推定を行うことができる。
Note that the
以上説明したように、取得した音信号が複数の音源202及び203からの音を示す場合、音源202及び203ごとに音信号を分離することで、複数の音源202及び203のそれぞれについて、集音装置100との距離を容易に推定できる。
As described above, when the acquired sound signals indicate sounds from the plurality of
(実施の形態4)
次に、図7を用いて実施の形態4について説明する。
(Embodiment 4)
Next,
図7は、実施の形態4に係る情報処理装置1cの構成の一例を示すブロック図である。 FIG. 7 is a block diagram showing an example of the configuration of an information processing device 1c according to the fourth embodiment.
実施の形態4に係る情報処理装置1cは、推定部40の代わりに推定部40aを備え、さらに判定部90を備える点が、実施の形態1に係る情報処理装置1と異なる。その他の点は、実施の形態1に係る情報処理装置1におけるものと同じであるため説明は省略し、上記異なる点を中心に説明する。
The information processing apparatus 1c according to the fourth embodiment differs from the
判定部90は、識別部30に識別された音源200の種類が、可聴音を出力するものか非可聴音を出力するものかを判定する。例えば、判定部90は、音信号取得部10に取得された音信号の周波数スペクトル等から、識別部30に識別された音源200の種類が、可聴音を出力するものか非可聴音を出力するものかを判定できる。
The
そして、推定部40aは、判定部90の判定結果にも応じて、集音装置100と音源200との距離を推定する。具体的には、推定部40aは、推定部40と同じように、標準音量に対する計算部20に計算された音量の減衰量と、集音装置100と音源との距離との予め定められた関係式に基づいて集音装置100と音源200との距離を推定するが、当該関係式は、識別部30に識別された音源200の種類が可聴音を出力するものである場合と、非可聴音を出力するものである場合とでそれぞれ予め定められる。可聴音と非可聴音とでは、距離による音量の減衰量が異なるためである。例えば、音源200の種類が可聴音を出力するものである場合には、関係式は式1となる。一方で、音源200の種類が非可聴音を出力するものである場合には、関係式は式1とは異なる式となる。さらに、非可聴音には、超音波及び超低周波が含まれ、非可聴音の中でも超音波と超低周波とで関係式は互いに異なる式となる。
Then, the estimation unit 40 a estimates the distance between the
以上説明したように、集音装置100と可聴音を出力する音源200との距離、及び、集音装置100と非可聴音を出力する音源200との距離をそれぞれ推定できる。
As described above, the distance between the
例えば、非可聴音として超音波を出力する音源200と集音装置100との距離を推定できる。具体的には、機器に異常が発生した場合に機器の異常が発生した部分から超音波が発生することがあり、異常が発生した機器の特定が可能となる。また、異常の内容と超音波の周波数とは対応していることがあるため、推定結果とともに異常の内容も出力されてもよい。
For example, the distance between the
また、例えば、非可聴音として超低周波を出力する音源200と集音装置100との距離を推定できる。具体的には、竜巻が発生した場合に、竜巻から超低周波が発生し、竜巻が発生した場所までの距離を推定できる。なお、この場合には、集音装置100が設置される空間は、屋外も含めた数十kmスケールの空間となる。
Also, for example, the distance between the
(実施の形態5)
次に、図8を用いて実施の形態5について説明する。
(Embodiment 5)
Next, Embodiment 5 will be described with reference to FIG.
図8は、実施の形態5に係る情報処理装置1dの構成の一例を示すブロック図である。
FIG. 8 is a block diagram showing an example of the configuration of an
実施の形態5に係る情報処理装置1dは、推定部40の代わりに推定部40bを備える点が、実施の形態1に係る情報処理装置1と異なる。また、実施の形態5では、距離の推定が行われる空間に集音装置100の代わりに集音装置100aが設置される点が、実施の形態1と異なる。その他の点は、実施の形態1に係る情報処理装置1におけるものと同じであるため説明は省略し、上記異なる点を中心に説明する。
The
実施の形態5では、集音装置100aは、複数のマイクロホンからなるマイクロホンアレイである。複数のマイクロホンは、集音装置100a内においてそれぞれ異なる位置に配置される。これにより、音源200の音は、時間差をもって各マイクロホンに到達する。
In Embodiment 5, the sound collector 100a is a microphone array consisting of a plurality of microphones. The multiple microphones are arranged at different positions in the sound collector 100a. As a result, the sound from the
推定部40bは、推定部40と同じように、集音装置100aに含まれる複数のマイクロホンのうちのいずれかのマイクロホンが集音した音の音信号を用いて集音装置100aと音源200との距離を推定し、さらに、複数のマイクロホンのそれぞれが集音した音の集音時間差に基づいて当該音の音源200の集音装置100aに対する方向を推定する。推定部40bは、複数のマイクロホンの位置関係と、各マイクロホンが音源200からの音を集音した時間の時間差(集音時間差)とから音源200の集音装置100aに対する方向を推定できる。
As with the estimating
以上説明したように、さらに音源200の集音装置100aに対する方向も推定できるため、集音装置100aが集音した音の音源200と集音装置100aとの距離、及び、音源200の集音装置100aに対する方向から、音源200の正確な位置を推定できる。
As described above, the direction of the
(実施の形態6)
次に、図9を用いて実施の形態6について説明する。
(Embodiment 6)
Next, Embodiment 6 will be described with reference to FIG.
図9は、実施の形態6に係る情報処理装置1eの構成の一例を示すブロック図である。
FIG. 9 is a block diagram showing an example of the configuration of an
実施の形態6に係る情報処理装置1eは、さらに識別精度判定部42を備える点が、実施の形態1に係る情報処理装置1と異なる。また、実施の形態6では、推定部40の代わりに推定部40cを備え、データベース41の代わりにデータベース41aを備える点が、実施の形態1と異なる。その他の点は、実施の形態1に係る情報処理装置1におけるものと同じであるため説明は省略し、上記異なる点を中心に説明する。
The
推定部40cは、識別部30が識別した音の音源の種類と、集音装置100と当該音源との距離の推定結果との対応関係を、距離の推定を行うごとに例えばデータベース41aに蓄積する。なお、データベース41aは、このような対応関係が蓄積されること以外は、データベース41と同じである。また、例えば、データベース41とは別途、このような対応関係を蓄積するためのデータベースが設けられてもよい。
The estimating
例えば、特定の種類の音源から音が発生したときには、当該音源について距離の推定を行うごとに推定結果は同じ傾向となる場合がある。特定の種類の音源が、施設等に固定される音源である場合、当該音源からの音の音量は同じ傾向となり、音の音量から推定される距離の推定結果も同じ傾向となるためである。したがって、このような特定の種類の音源については、距離の推定結果の傾向から、集音装置100からの実際の距離をある程度特定することができる。
For example, when sound is generated from a specific type of sound source, the estimation results may tend to be the same each time the distance is estimated for the sound source. This is because when a specific type of sound source is a sound source that is fixed in a facility or the like, the volume of the sound from the sound source has the same tendency, and the estimation result of the distance estimated from the volume of the sound also has the same tendency. Therefore, for such a specific type of sound source, the actual distance from the
識別精度判定部42は、蓄積した上記対応関係と、集音装置100と集音装置100が集音した音の音源200との距離の推定結果と、に基づいて、当該音源200の種類の識別の精度を判定する。具体的には、識別部30で識別された音の種類についての推定結果が示す距離が、データベース41aに蓄積された対応関係において、当該種類に対応する距離の傾向とほぼ同じとなっていれば、推定部40cによる推定が精度良く行われており、すなわち、識別部30による音の種類の識別が精度良く行われていると判定できる。一方で、識別部30で識別された音の種類についての推定結果が示す距離が、データベース41aに蓄積された対応関係において、当該種類に対応する距離の傾向からずれていれば、推定部40cによる推定が精度良く行われておらず、すなわち、識別部30による音の種類の識別が精度良く行われていないと判定できる。
The identification
そして、識別精度判定部42は、判定の結果を識別部30にフィードバックして、識別部30は、上記判定の結果を音源の種類の識別に用いる。このようなフィードバックにより、音源の種類の識別の精度を向上させることができる。
Then, the identification
(その他の実施の形態)
以上、本開示の情報処理装置について、実施の形態に基づいて説明したが、本開示は、上記実施の形態に限定されるものではない。本開示の趣旨を逸脱しない限り、当業者が思いつく各種変形を本実施の形態に施したもの、および、異なる実施の形態における構成要素を組み合わせて構築される形態も、本開示の範囲内に含まれる。
(Other embodiments)
Although the information processing apparatus of the present disclosure has been described above based on the embodiments, the present disclosure is not limited to the above embodiments. As long as they do not deviate from the spirit of the present disclosure, modifications that can be made by those skilled in the art to the present embodiment, and forms constructed by combining the components of different embodiments are also included within the scope of the present disclosure. be
例えば、実施の形態3~6において、各情報処理装置は、実施の形態2における識別部30a、算出部60、距離情報取得部70及び登録部80に対応する機能を有していてもよい。つまり、実施の形態3~6において、各情報処理装置は、種類を識別できない音源について、その音の特徴量と標準音量とをデータベース41、41aに登録する機能を有していてもよい。
For example, in the third to sixth embodiments, each information processing apparatus may have functions corresponding to the identifying section 30a, the calculating
また、例えば、実施の形態2、4~6において、各情報処理装置は、実施の形態3における音信号取得部10aに対応する機能を有していてもよい。つまり、実施の形態2、4~6において、各情報処理装置は、複数の音源が存在する場合に、音源ごとに音信号を分離して、分離後の音信号のそれぞれについて、音量の計算、種類の識別、距離の推定、推定結果の出力を行う機能を有していてもよい。
Further, for example, in the second, fourth to sixth embodiments, each information processing apparatus may have a function corresponding to the sound
また、例えば、実施の形態2、3、5及び6において、各情報処理装置は、実施の形態4における推定部40a及び判定部90に対応する機能を有していてもよい。つまり、実施の形態2、3、5及び6において、各情報処理装置は、音源の種類が、可聴音を出力するものか非可聴音を出力するものかを判定し、当該判定結果にも応じて、距離を推定する機能を有していてもよい。
Further, for example, in the second, third, fifth and sixth embodiments, each information processing apparatus may have functions corresponding to the estimation unit 40a and the
また、例えば、実施の形態2~4及び6において、集音装置100は、複数のマイクロホンからなるマイクロホンアレイである集音装置100aであってもよく、各情報処理装置は、実施の形態5における推定部40bに対応する機能を有していてもよい。つまり、実施の形態2~4及び6において、各情報処理装置は、音源の集音装置100aに対する方向を推定する機能を有していてもよい。
Further, for example, in Embodiments 2 to 4 and 6, the
また、例えば、実施の形態2~5において、各情報処理装置は、実施の形態6における識別精度判定部42及び推定部40cに対応する機能を有していてもよい。つまり、実施の形態2~5において、各情報処理装置は、音源の種類の識別の精度を向上させるための機能を有していてもよい。
Further, for example, in the second to fifth embodiments, each information processing device may have functions corresponding to the identification
また、例えば、上記実施の形態では、識別部30、30aは学習モデル31を用いて音源の種類を識別したが、学習モデル31を用いなくてもよい。例えば、音信号が示す周波数スペクトル等には、音源の種類によってその特徴が異なってくるため、識別部30、30aは、周波数スペクトル等から音源の種類を推定することで、音源の種類を識別してもよい。
Further, for example, in the above embodiments, the
また、例えば、情報処理装置は、サーバ装置等により実現される場合に、情報処理装置が備える機能構成要素は、複数のサーバ装置に分散して配置されていてもよい。 Further, for example, when the information processing device is realized by a server device or the like, the functional components included in the information processing device may be distributed and arranged in a plurality of server devices.
また、本開示は、情報処理装置として実現できるだけでなく、情報処理装置を構成する各構成要素が行う処理のステップを含む情報処理方法として実現できる。 Further, the present disclosure can be realized not only as an information processing apparatus, but also as an information processing method including steps of processing performed by each component constituting the information processing apparatus.
具体的には、図2に示されるように、情報処理方法は、集音装置100が集音した音を示す音信号を取得し(ステップS11)、取得した音信号から集音装置100が集音した音の音量を計算し(ステップS12)、取得した音信号から集音装置100が集音した音の音源200の種類を識別し(ステップS13)、音源の種類と当該音源から所定距離における当該音源からの音の音量である標準音量とが予め対応付けられたデータベース41における、識別した種類に対応する標準音量と、計算した音量とに基づいて、集音装置100と集音装置100が集音した音の音源200との距離を推定し(ステップS14)、推定結果を出力する(ステップS15)。
Specifically, as shown in FIG. 2, the information processing method acquires a sound signal indicating the sound collected by the sound collector 100 (step S11), and the
また、例えば、それらのステップは、コンピュータ(コンピュータシステム)によって実行されてもよい。そして、本開示は、それらの方法に含まれるステップを、コンピュータに実行させるためのプログラムとして実現できる。さらに、本開示は、そのプログラムを記録したCD-ROM等である非一時的なコンピュータ読み取り可能な記録媒体として実現できる。 Also, for example, those steps may be executed by a computer (computer system). The present disclosure can be realized as a program for causing a computer to execute the steps included in those methods. Furthermore, the present disclosure can be implemented as a non-temporary computer-readable recording medium such as a CD-ROM recording the program.
例えば、本開示が、プログラムで実現される場合には、コンピュータのCPU、メモリおよび入出力回路等のハードウェア資源を利用してプログラムが実行されることによって、各ステップが実行される。つまり、CPUがデータをメモリまたは入出力回路等から取得して演算したり、演算結果をメモリまたは入出力回路等に出力したりすることによって、各ステップが実行される。 For example, when the present disclosure is implemented by a program, each step is executed by executing the program using hardware resources such as a computer's CPU, memory, and input/output circuits. That is, each step is executed by the CPU obtaining data from a memory, an input/output circuit, or the like, performing an operation, or outputting the operation result to the memory, an input/output circuit, or the like.
また、上記実施の形態の情報処理装置に含まれる複数の構成要素は、それぞれ、専用または汎用の回路として実現されてもよい。これらの構成要素は、1つの回路として実現されてもよいし、複数の回路として実現されてもよい。 Further, each of the plurality of components included in the information processing apparatus of the above embodiments may be implemented as a dedicated or general-purpose circuit. These components may be implemented as one circuit or as multiple circuits.
また、上記実施の形態の情報処理装置に含まれる複数の構成要素は、集積回路(IC:Integrated Circuit)であるLSI(Large Scale Integration)として実現されてもよい。これらの構成要素は、個別に1チップ化されてもよいし、一部または全てを含むように1チップ化されてもよい。LSIは、集積度の違いにより、システムLSI、スーパーLSIまたはウルトラLSIと呼称される場合がある。 Also, the plurality of components included in the information processing apparatus of the above embodiments may be implemented as an LSI (Large Scale Integration), which is an integrated circuit (IC). These components may be made into one chip individually, or may be made into one chip so as to include some or all of them. LSIs are sometimes called system LSIs, super LSIs, or ultra LSIs depending on the degree of integration.
また、集積回路はLSIに限られず、専用回路または汎用プロセッサで実現されてもよい。プログラム可能なFPGA(Field Programmable Gate Array)、または、LSI内部の回路セルの接続および設定が再構成可能なリコンフィギュラブル・プロセッサが、利用されてもよい。 Also, the integrated circuit is not limited to an LSI, and may be realized by a dedicated circuit or a general-purpose processor. A programmable FPGA (Field Programmable Gate Array) or a reconfigurable processor in which connection and setting of circuit cells inside the LSI can be reconfigured may be used.
さらに、半導体技術の進歩または派生する別技術によりLSIに置き換わる集積回路化の技術が登場すれば、当然、その技術を用いて、情報処理装置に含まれる各構成要素の集積回路化が行われてもよい。 Furthermore, if a technology for integrating circuits to replace LSIs emerges due to advances in semiconductor technology or another technology derived from it, it is natural that such technology will be used to integrate each component included in the information processing apparatus. good too.
その他、実施の形態に対して当業者が思いつく各種変形を施して得られる形態や、本開示の趣旨を逸脱しない範囲で各実施の形態における構成要素および機能を任意に組み合わせることで実現される形態も本開示に含まれる。 In addition, forms obtained by applying various modifications that a person skilled in the art can think of to the embodiments, and forms realized by arbitrarily combining the components and functions in each embodiment within the scope of the present disclosure are also included in this disclosure.
本開示の一態様は、例えば、音源の位置を特定するための装置に利用できる。 One aspect of the present disclosure can be used, for example, in a device for identifying the position of a sound source.
1、1a、1b、1c、1d、1e 情報処理装置
10、10a 音信号取得部
20 計算部
30、30a 識別部
31 学習モデル
40、40a、40b、40c 推定部
41、41a データベース
42 識別精度判定部
50 出力部
60 算出部
70 距離情報取得部
80 登録部
90 判定部
100、100a 集音装置
200、201、202、203 音源
1, 1a, 1b, 1c, 1d, 1e
Claims (9)
集音装置が集音した音を示す音信号を取得し、
取得した前記音信号から前記集音装置が集音した音の音量を計算し、
取得した前記音信号から前記集音装置が集音した音の音源の種類を識別し、
音源の種類と当該音源から所定距離における当該音源からの音の音量である標準音量とが予め対応付けられたデータベースにおける、識別した前記種類に対応する標準音量と、計算した前記音量とに基づいて、前記集音装置と前記集音装置が集音した音の音源との距離を推定し、
推定結果を出力する、
情報処理方法。 An information processing method executed by an information processing device,
Acquiring a sound signal indicating the sound collected by the sound collecting device,
calculating the volume of the sound collected by the sound collecting device from the acquired sound signal;
identifying the type of sound source of the sound collected by the sound collecting device from the acquired sound signal;
Based on the standard volume corresponding to the identified type and the calculated volume in a database in which the type of sound source and the standard volume, which is the volume of the sound from the sound source at a predetermined distance from the sound source, are associated in advance. , estimating the distance between the sound collector and the sound source of the sound collected by the sound collector;
output the estimation result,
Information processing methods.
請求項1に記載の情報処理方法。 estimating the distance based on a predetermined relational expression between the calculated attenuation amount of the volume with respect to the standard volume and the distance;
The information processing method according to claim 1.
請求項1又は2に記載の情報処理方法。 Using a sound signal representing an arbitrary sound as input data and the type of the sound source of the arbitrary sound as correct data, a learning model is trained, and from the acquired sound signal, the sound source of the sound collected by the sound collecting device. identify the type
The information processing method according to claim 1 or 2.
前記集音装置と前記集音装置が集音した音の音源との距離を示す距離情報を取得し、
算出した前記特徴量と、前記標準音量として、取得した前記距離情報が示す距離における計算した前記音量とを対応付けて前記データベースに登録する、
請求項1~3のいずれか1項に記載の情報処理方法。 When the type of the sound source of the sound collected by the sound collecting device cannot be identified from the acquired sound signal, further calculating a feature amount of the sound signal,
Acquiring distance information indicating the distance between the sound collector and a sound source of the sound collected by the sound collector;
registering the calculated feature amount and the calculated volume at the distance indicated by the acquired distance information as the standard volume in association with each other in the database;
The information processing method according to any one of claims 1 to 3.
分離後の音信号のそれぞれについて、前記音量の計算、前記種類の識別、前記距離の推定、前記推定結果の出力を行う、
請求項1~4のいずれか1項に記載の情報処理方法。 if the obtained sound signals represent sounds from different types of sound sources, separating the sound signals for each sound source;
calculating the volume, identifying the type, estimating the distance, and outputting the estimation result for each of the separated sound signals;
The information processing method according to any one of claims 1 to 4.
さらに、前記複数のマイクロホンのそれぞれが集音した音の集音時間差に基づいて当該音の音源の前記集音装置に対する方向を推定する、
請求項1~5のいずれか1項に記載の情報処理方法。 The sound collecting device is a microphone array consisting of a plurality of microphones,
Further, estimating the direction of the sound source of the sound with respect to the sound collector based on the sound collection time difference of the sound collected by each of the plurality of microphones.
The information processing method according to any one of claims 1 to 5 .
蓄積した前記対応関係と、前記集音装置と前記集音装置が集音した音の音源との距離の推定結果と、に基づいて、当該音源の種類の識別の精度を判定し、
前記判定の結果をフィードバックして、音源の種類の識別に用いる
請求項1~6のいずれか1項に記載の情報処理方法。 accumulating the correspondence relationship between the type of the identified sound source and the estimation result of the distance between the sound collector and the sound source each time the distance is estimated;
Determining the accuracy of identifying the type of sound source based on the accumulated correspondence relationship and the estimation result of the distance between the sound collector and the sound source of the sound collected by the sound collector,
The information processing method according to any one of claims 1 to 6 , wherein the determination result is fed back and used for identifying the type of sound source.
取得された前記音信号から前記集音装置が集音した音の音量を計算する計算部と、
取得された前記音信号から前記集音装置が集音した音の音源の種類を識別する識別部と、
音源の種類と当該音源から所定距離における当該音源からの音の音量である標準音量とが予め対応付けられたデータベースにおける、識別された前記種類に対応する標準音量と、計算された前記音量とに基づいて、前記集音装置と前記集音装置が集音した音の音源との距離を推定する推定部と、
推定結果を出力する出力部と、を備える、
情報処理装置。 a sound signal acquisition unit that acquires a sound signal indicating the sound collected by the sound collecting device;
a calculation unit that calculates the volume of the sound collected by the sound collecting device from the acquired sound signal;
an identification unit that identifies the type of sound source of the sound collected by the sound collecting device from the acquired sound signal;
The standard volume corresponding to the identified type and the calculated volume in a database in which the type of sound source and the standard volume, which is the volume of the sound from the sound source at a predetermined distance from the sound source, are associated in advance. an estimating unit for estimating the distance between the sound collector and the sound source of the sound collected by the sound collector, based on
and an output unit that outputs the estimation result,
Information processing equipment.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US16/541,801 US10834501B2 (en) | 2018-08-28 | 2019-08-15 | Information processing method, information processing device, and recording medium |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018159399 | 2018-08-28 | ||
JP2018159399 | 2018-08-28 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020034542A JP2020034542A (en) | 2020-03-05 |
JP7285690B2 true JP7285690B2 (en) | 2023-06-02 |
Family
ID=69667916
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019092403A Active JP7285690B2 (en) | 2018-08-28 | 2019-05-15 | Information processing method, information processing device and program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7285690B2 (en) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7363716B2 (en) * | 2020-08-25 | 2023-10-18 | トヨタ自動車株式会社 | Sound analysis system, sound analysis method, and program |
WO2022249252A1 (en) * | 2021-05-24 | 2022-12-01 | 日本電信電話株式会社 | Distance estimation device, distance estimation method, and program |
WO2023089892A1 (en) * | 2021-11-16 | 2023-05-25 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ | Estimation method, estimation system, and program |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005099418A (en) | 2003-09-25 | 2005-04-14 | Casio Comput Co Ltd | Object display device and program |
JP2006092482A (en) | 2004-09-27 | 2006-04-06 | Yamaha Corp | Sound recognition reporting apparatus |
JP2011250100A (en) | 2010-05-26 | 2011-12-08 | Sony Corp | Image processing system and method, and program |
US20160210834A1 (en) | 2015-01-21 | 2016-07-21 | Toyota Motor Engineering & Manufacturing North America, Inc. | Wearable smart device for hazard detection and warning based on image and audio data |
-
2019
- 2019-05-15 JP JP2019092403A patent/JP7285690B2/en active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005099418A (en) | 2003-09-25 | 2005-04-14 | Casio Comput Co Ltd | Object display device and program |
JP2006092482A (en) | 2004-09-27 | 2006-04-06 | Yamaha Corp | Sound recognition reporting apparatus |
JP2011250100A (en) | 2010-05-26 | 2011-12-08 | Sony Corp | Image processing system and method, and program |
US20160210834A1 (en) | 2015-01-21 | 2016-07-21 | Toyota Motor Engineering & Manufacturing North America, Inc. | Wearable smart device for hazard detection and warning based on image and audio data |
Also Published As
Publication number | Publication date |
---|---|
JP2020034542A (en) | 2020-03-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7285690B2 (en) | Information processing method, information processing device and program | |
US10834501B2 (en) | Information processing method, information processing device, and recording medium | |
CN110415681B (en) | Voice recognition effect testing method and system | |
WO2018068396A1 (en) | Voice quality evaluation method and apparatus | |
CN106465025B (en) | Crowdsourcing for hearing-aid device is recommended | |
US11941968B2 (en) | Systems and methods for identifying an acoustic source based on observed sound | |
CN107507625B (en) | Sound source distance determining method and device | |
JP2019191558A (en) | Method and apparatus for amplifying speech | |
CN111868823A (en) | Sound source separation method, device and equipment | |
KR102316671B1 (en) | Method for treating sound using cnn | |
CN111341333A (en) | Noise detection method, noise detection device, medium, and electronic apparatus | |
KR102254718B1 (en) | Mobile complaint processing system and method | |
CN107403629B (en) | Far-field pickup performance evaluation method and system, and electronic device | |
CN112382266A (en) | Voice synthesis method and device, electronic equipment and storage medium | |
JP5077847B2 (en) | Reverberation time estimation apparatus and reverberation time estimation method | |
EP2717263B1 (en) | Method, apparatus, and computer program product for categorical spatial analysis-synthesis on the spectrum of a multichannel audio signal | |
CN110867191A (en) | Voice processing method, information device and computer program product | |
CN103824556A (en) | Sound processing device, sound processing method, and program | |
CN106710602A (en) | Acoustic reverberation time estimation method and device | |
Ayu et al. | Audio detection (Audition): Android based sound detection application for hearing-impaired using AdaBoostM1 classifier with REPTree weaklearner | |
CN115588439B (en) | Fault detection method and device of voiceprint acquisition device based on deep learning | |
Zwan | Automatic sound recognition for security purposes | |
CN117041847B (en) | Adaptive microphone matching method and system for hearing aid | |
JP2019045527A (en) | Voice processing program, voice processing method and voice processing device | |
Mohan et al. | COVID-19 social distancing with speech-enabled online market place for farmers |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20211209 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20221031 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20221129 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230216 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230425 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230523 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7285690 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |