JP7025144B2 - Electronic melody identification device, program, and electronic melody identification method - Google Patents

Electronic melody identification device, program, and electronic melody identification method Download PDF

Info

Publication number
JP7025144B2
JP7025144B2 JP2017137296A JP2017137296A JP7025144B2 JP 7025144 B2 JP7025144 B2 JP 7025144B2 JP 2017137296 A JP2017137296 A JP 2017137296A JP 2017137296 A JP2017137296 A JP 2017137296A JP 7025144 B2 JP7025144 B2 JP 7025144B2
Authority
JP
Japan
Prior art keywords
pattern
spectrum
spectrum pattern
similarity
section
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2017137296A
Other languages
Japanese (ja)
Other versions
JP2019020527A (en
Inventor
寒達 陳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
MegaChips Corp
Original Assignee
MegaChips Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by MegaChips Corp filed Critical MegaChips Corp
Priority to JP2017137296A priority Critical patent/JP7025144B2/en
Publication of JP2019020527A publication Critical patent/JP2019020527A/en
Application granted granted Critical
Publication of JP7025144B2 publication Critical patent/JP7025144B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Auxiliary Devices For Music (AREA)

Description

本発明は、電子メロディ特定装置、プログラム、及び電子メロディ特定方法に関する。 The present invention relates to an electronic melody specifying device, a program, and an electronic melody specifying method.

下記特許文献1には、様々な音声の標準パターンを予め準備しておき、入力音声と標準パターンとのパターンマッチングを行うことによって入力音声を認識する音声認識装置が開示されている。 The following Patent Document 1 discloses a voice recognition device that recognizes input voice by preparing various voice standard patterns in advance and performing pattern matching between the input voice and the standard pattern.

特開昭62-111293号公報Japanese Unexamined Patent Publication No. 62-111293

人間が発声する音声は、たとえ同一の単語やフレーズであっても、性別、年齢、訛り、及び発声速度等の話者の個性に起因して、様々なスペクトル変動及び時間的変動が生じる。従って、不特定話者の音声を認識対象とする音声認識装置においては、話者の個性に起因するこれらの変動を補正すべく、複雑な正規化回路等を実装する必要がある。例えば上記特許文献1に開示された音声認識装置では、時間的変動を補正すべく、線形伸縮した入力音声を全区間で1フレームずつシフトしながら、標準パターンとのパターンマッチングが行われている。 Voices uttered by humans, even if they are the same word or phrase, have various spectral fluctuations and temporal fluctuations due to the individuality of the speaker such as gender, age, accent, and vocalization speed. Therefore, in a voice recognition device that recognizes the voice of an unspecified speaker, it is necessary to implement a complicated normalization circuit or the like in order to correct these fluctuations caused by the individuality of the speaker. For example, in the speech recognition device disclosed in Patent Document 1, pattern matching with a standard pattern is performed while shifting linearly expanded and contracted input speech by one frame in the entire section in order to correct temporal fluctuations.

一方、駅の発着メロディや店舗の入店メロディ等の電子メロディは、シンセサイザーによって作られた簡単な音楽であることが多く、人間が発声する音声と比較して、周波数バンドが狭くて周波数成分も少ない。しかも、人間が発声する音声とは異なり電子メロディは、録音された音源をスピーカーから再生するだけなので、話者の個性に起因するスペクトル変動や時間的変動が存在しない。 On the other hand, electronic melodies such as station arrival / departure melody and store entry melody are often simple music created by synthesizers, and the frequency band is narrower and the frequency component is also narrower than the voice uttered by humans. Few. Moreover, unlike the voice uttered by humans, the electronic melody only reproduces the recorded sound source from the speaker, so that there is no spectral fluctuation or temporal fluctuation due to the individuality of the speaker.

従って、電子メロディを特定対象とする電子メロディ特定装置において、音声認識装置と同等の複雑な機能を実装したのでは、オーバースペックとなって無駄にコストが上昇する。 Therefore, if an electronic melody specifying device for specifying an electronic melody is equipped with a complicated function equivalent to that of a voice recognition device, it will be over-engineered and the cost will increase unnecessarily.

本発明はかかる問題を解決するために成されたものであり、簡易な構成及び処理によって電子メロディを高精度に特定することが可能な、電子メロディ特定装置、プログラム、及び電子メロディ特定方法を得ることを目的とするものである。 The present invention has been made to solve such a problem, and obtains an electronic melody specifying device, a program, and an electronic melody specifying method capable of specifying an electronic melody with high accuracy by a simple configuration and processing. The purpose is to do that.

本発明の第1の態様に係る電子メロディ特定装置は、特定対象である電子メロディの時系列信号を取得する取得部と、前記取得部によって取得された電子メロディの時系列信号を、所定の第1区間単位で周波数解析することにより、第1区間毎の第1周波数スペクトルが複数配列された第1スペクトルパターンを生成する、第1のパターン生成部と、前記第1のパターン生成部によって生成された第1スペクトルパターンを、それぞれに複数の第1区間を包含するN個(Nは複数)の第2区間に分割し、各第2区間に包含される複数の第1区間に関する複数の第1周波数スペクトルを平均化することにより、第2区間毎の第2周波数スペクトルが複数配列された第2スペクトルパターンを生成する、第2のパターン生成部と、既知の複数の電子メロディの各々に関して予め生成され、N個の第2区間に分割された、第3スペクトルパターンを記憶する記憶部と、前記第2のパターン生成部によって生成された第2スペクトルパターンと、前記記憶部に記憶されている各第3スペクトルパターンとの類似度を算出する算出処理部と、前記算出処理部による類似度の算出結果に基づいて、前記取得部によって取得された電子メロディを特定する特定処理部と、を備え、前記第2のパターン生成部は、第2スペクトルパターンにおける周波数成分の分布に基づいて、各第2区間に包含される第1区間の個数を非均等に配分可能であることを特徴とするものである。 The electronic melody specifying device according to the first aspect of the present invention has an acquisition unit that acquires a time-series signal of an electronic melody to be specified, and a predetermined time-series signal of the electronic melody acquired by the acquisition unit. By frequency analysis in units of one section, a first pattern generation unit that generates a first spectrum pattern in which a plurality of first frequency spectra for each section are arranged is generated by the first pattern generation unit and the first pattern generation unit. The first spectral pattern is divided into N (multiple N) second sections, each of which contains a plurality of first sections, and a plurality of first sections relating to the plurality of first sections included in each second section. By averaging the frequency spectra, a second pattern generator that generates a second spectrum pattern in which a plurality of second frequency spectra for each second section are arranged is generated in advance for each of a plurality of known electronic melodies. A storage unit that stores a third spectrum pattern and is divided into N second sections, a second spectrum pattern generated by the second pattern generation unit, and each stored in the storage unit. A calculation processing unit for calculating the similarity with the third spectrum pattern and a specific processing unit for specifying the electronic melody acquired by the acquisition unit based on the calculation result of the similarity with the calculation processing unit are provided. The second pattern generation unit is characterized in that the number of first sections included in each second section can be non-uniformly distributed based on the distribution of frequency components in the second spectral pattern. be.

第1の態様に係る電子メロディ特定装置によれば、第2のパターン生成部は、各第2区間に包含される複数の第1区間に関する複数の第1周波数スペクトルを平均化することにより、第2区間毎の第2周波数スペクトルが複数配列された第2スペクトルパターンを生成する。そして、算出処理部は、第2のパターン生成部によって生成された第2スペクトルパターンと、記憶部に記憶されている各第3スペクトルパターンとの類似度を算出する。これにより、平均化前の第1スペクトルパターンを用いて類似度を算出する場合と比較して、演算量が削減されるため処理負荷を軽減することができる。また、第3スペクトルパターンを簡略化できるため、記憶部に必要な記憶容量を削減することができる。 According to the electronic melody specifying device according to the first aspect, the second pattern generation unit has a second pattern generation unit by averaging a plurality of first frequency spectra having a plurality of first sections included in each second section. A second spectrum pattern in which a plurality of second frequency spectra for each of two sections are arranged is generated. Then, the calculation processing unit calculates the degree of similarity between the second spectrum pattern generated by the second pattern generation unit and each third spectrum pattern stored in the storage unit. As a result, the amount of calculation is reduced as compared with the case where the similarity is calculated using the first spectral pattern before averaging, so that the processing load can be reduced. Further, since the third spectrum pattern can be simplified, the storage capacity required for the storage unit can be reduced.

しかも、第2のパターン生成部は、第2スペクトルパターンにおける周波数成分の分布に基づいて、各第2区間に包含される第1区間の個数を非均等に配分可能である。第2区間に包含される第1区間の個数に応じて解像度を調整できるため、重要な箇所の解像度を上げ、重要でない箇所の解像度を下げるような配分を行うことにより、処理負荷の増大を回避しつつ電子メロディの特定精度を向上することが可能となる。 Moreover, the second pattern generation unit can non-uniformly distribute the number of the first sections included in each second section based on the distribution of the frequency components in the second spectral pattern. Since the resolution can be adjusted according to the number of the first section included in the second section, the processing load is avoided by increasing the resolution of the important part and lowering the resolution of the unimportant part. However, it is possible to improve the identification accuracy of the electronic melody.

本発明の第2の態様に係る電子メロディ特定装置は、第1の態様に係る電子メロディ特定装置において特に、前記第2のパターン生成部は、均等配分した場合に第1の個数の周波数成分を含む第2周波数スペクトルに対応する第2区間に対しては第1の数の第1区間を配分し、均等配分した場合に第1の個数より少ない第2の個数の周波数成分を含む第2周波数スペクトルに対応する第2区間に対しては第1の数より多い第2の数の第1区間を配分することを特徴とするものである。 The electronic melody specifying device according to the second aspect of the present invention is the electronic melody specifying device according to the first aspect. The first section of the first number is allocated to the second section corresponding to the included second frequency spectrum, and when evenly distributed, the second frequency containing the second number of frequency components less than the first number. It is characterized in that the first section of the second number, which is larger than the first number , is allocated to the second section corresponding to the spectrum.

第2の態様に係る電子メロディ特定装置によれば、第2のパターン生成部は、比較的多数(第1の個数)の周波数成分を含む第2周波数スペクトルに対応する第2区間に対しては比較的少数(第1の数)の第1区間を配分し、比較的少数(第2の個数)の周波数成分を含む第2周波数スペクトルに対応する第2区間に対しては比較的多数(第2の数)の第1区間を配分する。比較的多数の周波数成分を含む第2周波数スペクトルは、電子メロディを特定するために重要な箇所であるため、そのような第2周波数スペクトルに対応する第2区間に対しては比較的少数の第1区間を配分することにより、解像度を上げることができ、その結果、電子メロディの特定精度を向上することが可能となる。一方、比較的少数の周波数成分を含む第2周波数スペクトルは、電子メロディを特定するために重要でない箇所であるため、そのような第2周波数スペクトルに対応する第2区間に対しては比較的多数の第1区間を配分することにより、処理負荷の増大を回避することが可能となる。 According to the electronic melody specifying device according to the second aspect, the second pattern generator is for the second section corresponding to the second frequency spectrum including a relatively large number (first number) of frequency components. A relatively small number (first number) of the first section is allocated, and a relatively large number (second number) is used for the second section corresponding to the second frequency spectrum containing a relatively small number (second number) of frequency components . Allocate the first section of (number of 2) . Since the second frequency spectrum containing a relatively large number of frequency components is an important part for identifying the electronic melody, a relatively small number of second intervals correspond to the second frequency spectrum corresponding to such a second frequency spectrum. By allocating one section, the resolution can be increased, and as a result, the accuracy of specifying the electronic melody can be improved. On the other hand, since the second frequency spectrum containing a relatively small number of frequency components is not important for identifying the electronic melody, it is relatively large for the second section corresponding to such a second frequency spectrum. By allocating the first section of the above, it is possible to avoid an increase in the processing load.

本発明の第3の態様に係る電子メロディ特定装置は、第1又は第2の態様に係る電子メロディ特定装置において特に、前記記憶部には、N個の第2区間の各々に包含される第1区間の個数が非均等に配分された第1グループの第3スペクトルパターンと、N個の第2区間の各々に包含される第1区間の個数が均等に配分された第2グループの第3スペクトルパターンと、が記憶されており、前記算出処理部は、前記第2のパターン生成部によって生成された第2スペクトルパターンにおいて、各第2区間に包含される第1区間の個数が非均等に配分されている場合は、当該第2スペクトルパターンと、前記記憶部に記憶されている第1グループの第3スペクトルパターンとの類似度を算出し、前記第2のパターン生成部によって生成された第2スペクトルパターンにおいて、各第2区間に包含される第1区間の個数が均等に配分されている場合は、当該第2スペクトルパターンと、前記記憶部に記憶されている第2グループの第3スペクトルパターンとの類似度を算出することを特徴とするものである。 The electronic melody specifying device according to the third aspect of the present invention is the electronic melody specifying device according to the first or second aspect, and in particular, the storage unit includes each of the N second sections. The third spectrum pattern of the first group in which the number of one section is unevenly distributed, and the third of the second group in which the number of the first sections included in each of the N second sections is evenly distributed. The spectrum pattern and the like are stored, and the calculation processing unit has a non-uniform number of first sections included in each second section in the second spectrum pattern generated by the second pattern generation unit. If it is distributed, the similarity between the second spectrum pattern and the third spectrum pattern of the first group stored in the storage unit is calculated, and the second pattern generation unit generates the second spectrum pattern. When the number of the first section included in each second section is evenly distributed in the two spectrum patterns, the second spectrum pattern and the third spectrum of the second group stored in the storage unit are used. It is characterized by calculating the degree of similarity with the pattern.

第3の態様に係る電子メロディ特定装置によれば、算出処理部は、各第2区間に包含される第1区間の個数が非均等に配分されている第2スペクトルパターンに関しては、第1グループの第3スペクトルパターンとの類似度を算出し、一方、各第2区間に包含される第1区間の個数が均等に配分されている第2スペクトルパターンに関しては、第2グループの第3スペクトルパターンとの類似度を算出する。このように、第3スペクトルパターンを予め第1グループと第2グループとに分類しておき、第2スペクトルパターンの種別に応じて比較対象の第3スペクトルパターンを選別することにより、電子メロディの特定精度の低下を抑制しつつ、処理負荷の軽減及び所要時間の短縮化を図ることが可能となる。 According to the electronic melody specifying device according to the third aspect, the calculation processing unit is in the first group with respect to the second spectrum pattern in which the number of the first sections included in each second section is unevenly distributed. On the other hand, for the second spectrum pattern in which the number of the first sections included in each second section is evenly distributed, the third spectrum pattern of the second group is calculated. Calculate the similarity with. In this way, the electronic melody is specified by classifying the third spectrum pattern into the first group and the second group in advance and selecting the third spectrum pattern to be compared according to the type of the second spectrum pattern. It is possible to reduce the processing load and the required time while suppressing the decrease in accuracy.

本発明の第4の態様に係る電子メロディ特定装置は、第3の態様に係る電子メロディ特定装置において特に、前記算出処理部は、前記第2のパターン生成部によって生成された第2スペクトルパターンと、前記記憶部に記憶されている第1グループの第3スペクトルパターンとの類似度が、所定のしきい値未満である場合には、さらに、当該第2スペクトルパターンと、前記記憶部に記憶されている第2グループの第3スペクトルパターンとの類似度を算出し、前記第2のパターン生成部によって生成された第2スペクトルパターンと、前記記憶部に記憶されている第2グループの第3スペクトルパターンとの類似度が、所定のしきい値未満である場合には、さらに、当該第2スペクトルパターンと、前記記憶部に記憶されている第1グループの第3スペクトルパターンとの類似度を算出することを特徴とするものである。 The electronic melody specifying device according to the fourth aspect of the present invention is the electronic melody specifying device according to the third aspect, and in particular, the calculation processing unit is the second spectrum pattern generated by the second pattern generation unit. When the similarity with the third spectrum pattern of the first group stored in the storage unit is less than a predetermined threshold value, the second spectrum pattern and the storage unit are further stored. The similarity with the third spectrum pattern of the second group is calculated, and the second spectrum pattern generated by the second pattern generation unit and the third spectrum of the second group stored in the storage unit are stored. When the similarity with the pattern is less than a predetermined threshold value, the similarity between the second spectrum pattern and the third spectrum pattern of the first group stored in the storage unit is further calculated. It is characterized by doing.

第4の態様に係る電子メロディ特定装置によれば、算出処理部は、各第2区間に包含される第1区間の個数が非均等に配分されている第2スペクトルパターンに関して、第1グループの第3スペクトルパターンとの類似度がしきい値未満である場合には、さらに、当該第2スペクトルパターンと第2グループの第3スペクトルパターンとの類似度を算出する。また、算出処理部は、各第2区間に包含される第1区間の個数が均等に配分されている第2スペクトルパターンに関して、第2グループの第3スペクトルパターンとの類似度がしきい値未満である場合には、さらに、当該第2スペクトルパターンと第1グループの第3スペクトルパターンとの類似度を算出する。このように、第1グループ及び第2グループの一方のグループの第3スペクトルパターンとの類似度がしきい値未満である場合には、他方のグループの第3スペクトルパターンとの類似度を算出することにより、類似度がしきい値以上の第3スペクトルパターンが発見される可能性があるため、電子メロディの特定精度を向上することが可能となる。 According to the electronic melody specifying device according to the fourth aspect, the calculation processing unit is of the first group with respect to the second spectrum pattern in which the number of the first sections included in each second section is unevenly distributed. When the similarity with the third spectrum pattern is less than the threshold value, the similarity between the second spectrum pattern and the third spectrum pattern of the second group is further calculated. Further, the calculation processing unit has a similarity with the third spectrum pattern of the second group of the second spectrum pattern in which the number of the first sections included in each second section is evenly distributed, which is less than the threshold value. In the case of, the similarity between the second spectrum pattern and the third spectrum pattern of the first group is further calculated. In this way, when the similarity with the third spectrum pattern of one of the first group and the second group is less than the threshold value, the similarity with the third spectrum pattern of the other group is calculated. As a result, there is a possibility that a third spectrum pattern having a similarity equal to or higher than the threshold value may be found, so that the accuracy of specifying the electronic melody can be improved.

本発明の第5の態様に係る電子メロディ特定装置は、第1~第4のいずれか一つの態様に係る電子メロディ特定装置において特に、前記算出処理部は、対応する第2区間毎に類似度を算出することによって得られるN個の類似度の代表値を、第2スペクトルパターンと第3スペクトルパターンとの類似度として算出することを特徴とするものである。 The electronic melody specifying device according to the fifth aspect of the present invention is the electronic melody specifying device according to any one of the first to fourth aspects, and in particular, the calculation processing unit has a degree of similarity for each corresponding second section. It is characterized in that the representative value of N similarity degree obtained by calculating is calculated as the similarity degree between the second spectrum pattern and the third spectrum pattern.

第5の態様に係る電子メロディ特定装置によれば、算出処理部は、第2スペクトルパターンと第3スペクトルパターンとで対応する第2区間毎に類似度を算出する。従って、第1区間毎に類似度を算出する場合と比較して、演算量が削減されるため処理負荷を軽減することが可能となる。 According to the electronic melody specifying device according to the fifth aspect, the calculation processing unit calculates the similarity for each second section corresponding to the second spectrum pattern and the third spectrum pattern. Therefore, as compared with the case where the similarity is calculated for each first section, the amount of calculation is reduced, so that the processing load can be reduced.

本発明の第6の態様に係る電子メロディ特定装置は、第5の態様に係る電子メロディ特定装置において特に、前記代表値は平均値であることを特徴とするものである。 The electronic melody specifying device according to the sixth aspect of the present invention is characterized in that, in particular, the representative value is an average value in the electronic melody specifying device according to the fifth aspect.

第6の態様に係る電子メロディ特定装置によれば、算出処理部は、対応する第2区間毎に類似度を算出することによって得られるN個の類似度の平均値を、第2スペクトルパターンと第3スペクトルパターンとの類似度として算出する。これにより、スペクトルパターンの全体領域における周波数成分の分布に基づいて、類似度を算出することが可能となる。 According to the electronic melody specifying device according to the sixth aspect, the calculation processing unit uses the average value of N similarities obtained by calculating the similarity for each corresponding second section as the second spectral pattern. It is calculated as the degree of similarity with the third spectrum pattern. This makes it possible to calculate the similarity based on the distribution of frequency components in the entire region of the spectral pattern.

本発明の第7の態様に係る電子メロディ特定装置は、第5の態様に係る電子メロディ特定装置において特に、前記代表値は最大値であることを特徴とするものである。 The electronic melody specifying device according to the seventh aspect of the present invention is characterized in that the representative value is the maximum value in particular in the electronic melody specifying device according to the fifth aspect.

第7の態様に係る電子メロディ特定装置によれば、算出処理部は、対応する第2区間毎に類似度を算出することによって得られるN個の類似度の最大値を、第2スペクトルパターンと第3スペクトルパターンとの類似度として算出する。これにより、特徴的部分を含む電子メロディに関して、その特徴的部分に対応する第2周波数スペクトルにおける周波数成分の分布に基づいて、類似度を算出することが可能となる。 According to the electronic melody specifying device according to the seventh aspect, the calculation processing unit sets the maximum value of N similarities obtained by calculating the similarity for each corresponding second section as the second spectral pattern. It is calculated as the degree of similarity with the third spectrum pattern. This makes it possible to calculate the similarity of the electronic melody including the characteristic portion based on the distribution of the frequency components in the second frequency spectrum corresponding to the characteristic portion.

本発明の第8の態様に係る電子メロディ特定装置は、第5~第7のいずれか一つの態様に係る電子メロディ特定装置において特に、前記算出処理部は、第1スペクトルパターンに基づいて生成された第2スペクトルパターンである基準第2スペクトルパターンと、基準第2スペクトルパターンに含まれるN個の第2区間の配列順序を循環シフトさせることによって得られる(N-1)個の擬似第2スペクトルパターンと、の各々に関して、第3スペクトルパターンとの類似度を算出することを特徴とするものである。 The electronic melody specifying device according to the eighth aspect of the present invention is particularly the electronic melody specifying device according to any one of the fifth to seventh aspects, and the calculation processing unit is generated based on the first spectrum pattern. (N-1) pseudo-second spectra obtained by cyclically shifting the arrangement order of the reference second spectrum pattern, which is the second spectrum pattern, and the N second sections included in the reference second spectrum pattern. It is characterized in that the similarity with the third spectrum pattern is calculated for each of the patterns.

第8の態様に係る電子メロディ特定装置によれば、算出処理部は、基準第2スペクトルパターンと、基準第2スペクトルパターンに含まれるN個の第2区間の配列順序を循環シフトさせることによって得られる(N-1)個の擬似第2スペクトルパターンと、の各々に関して、第3スペクトルパターンとの類似度を算出する。ユーザによる手動の録音操作によって取得部が電子メロディの時系列信号を取得する場合には、録音操作の開始タイミング及び終了タイミングのずれに起因して、第2スペクトルパターンと第3スペクトルパターンとで第2区間の位置ずれが生じ得る。従って、算出処理部が、基準第2スペクトルパターンのみならず擬似第2スペクトルパターンについても第3スペクトルパターンとの類似度を算出することにより、第2区間の位置ずれが生じている場合であっても、第2スペクトルパターンと第3スペクトルパターンとの類似度を適切に算出することが可能となる。 According to the electronic melody specifying device according to the eighth aspect, the calculation processing unit obtains by cyclically shifting the arrangement order of the reference second spectrum pattern and the N second sections included in the reference second spectrum pattern. For each of the (N-1) pseudo-second spectral patterns to be performed, the similarity with the third spectral pattern is calculated. When the acquisition unit acquires the time-series signal of the electronic melody by a manual recording operation by the user, the second spectrum pattern and the third spectrum pattern are the first due to the difference between the start timing and the end timing of the recording operation. Misalignment between the two sections can occur. Therefore, the calculation processing unit calculates the similarity of not only the reference second spectrum pattern but also the pseudo second spectrum pattern with the third spectrum pattern, so that the position shift of the second section occurs. Also, the degree of similarity between the second spectrum pattern and the third spectrum pattern can be appropriately calculated.

しかも、基準第2スペクトルパターンに含まれるN個の第2区間の配列順序を循環シフトさせることによって得られる(N-1)個の擬似第2スペクトルパターンが規定されるため、第2区間の位置ずれが大きい場合であっても、第2スペクトルパターンと第3スペクトルパターンとの類似度を適切に算出することが可能となる。 Moreover, since the (N-1) pseudo second spectrum pattern obtained by cyclically shifting the arrangement order of the N second sections included in the reference second spectrum pattern is defined, the position of the second section is defined. Even when the deviation is large, it is possible to appropriately calculate the degree of similarity between the second spectrum pattern and the third spectrum pattern.

本発明の第9の態様に係る電子メロディ特定装置は、第5~第7のいずれか一つの態様に係る電子メロディ特定装置において特に、前記算出処理部は、第1スペクトルパターンに基づいて生成された第2スペクトルパターンである基準第2スペクトルパターンと、基準第2スペクトルパターンに含まれるN個の第2区間の配列順序を前後方向に1区間ずつ循環シフトさせることによって得られる2個の擬似第2スペクトルパターンと、の各々に関して、第3スペクトルパターンとの類似度を算出することを特徴とするものである。 The electronic melody specifying device according to the ninth aspect of the present invention is particularly the electronic melody specifying device according to any one of the fifth to seventh aspects, and the calculation processing unit is generated based on the first spectrum pattern. Two pseudo-ths obtained by cyclically shifting the arrangement order of the reference second spectrum pattern, which is the second spectrum pattern, and the N second sections included in the reference second spectrum pattern, one section at a time in the front-back direction. It is characterized in that the similarity with the third spectrum pattern is calculated for each of the two spectrum patterns.

第9の態様に係る電子メロディ特定装置によれば、算出処理部は、基準第2スペクトルパターンと、基準第2スペクトルパターンに含まれるN個の第2区間の配列順序を前後方向に1区間ずつ循環シフトさせることによって得られる2個の擬似第2スペクトルパターンと、の各々に関して、第3スペクトルパターンとの類似度を算出する。これにより、第2区間の位置ずれが生じている場合であっても、第2スペクトルパターンと第3スペクトルパターンとの類似度を適切に算出することが可能となる。 According to the electronic melody specifying device according to the ninth aspect, the calculation processing unit arranges the reference second spectrum pattern and the N second sections included in the reference second spectrum pattern one section at a time in the front-back direction. For each of the two pseudo-second spectral patterns obtained by cyclic shifting, the similarity with the third spectral pattern is calculated. This makes it possible to appropriately calculate the degree of similarity between the second spectrum pattern and the third spectrum pattern even when the position of the second section is displaced.

しかも、基準第2スペクトルパターンに含まれるN個の第2区間の配列順序を前後方向に1区間ずつ循環シフトさせることによって得られる2個の擬似第2スペクトルパターンが規定されるため、全区間の循環シフトと比較して処理負荷の増大を抑制しつつ、第2スペクトルパターンと第3スペクトルパターンとの類似度を適切に算出することが可能となる。 Moreover, since the two pseudo second spectrum patterns obtained by cyclically shifting the arrangement order of the N second sections included in the reference second spectrum pattern one section at a time in the front-back direction are defined, the entire section is defined. It is possible to appropriately calculate the degree of similarity between the second spectral pattern and the third spectral pattern while suppressing an increase in the processing load as compared with the cyclic shift.

本発明の第10の態様に係る電子メロディ特定装置は、第5~第7のいずれか一つの態様に係る電子メロディ特定装置において特に、前記算出処理部は、第1スペクトルパターンに基づいて生成された第2スペクトルパターンに含まれるN個の第2区間のうち時系列順で先頭部分及び末尾部分の第2区間を除外することによって、(N-2)個の第2区間を含む擬似第2スペクトルパターンを規定し、当該擬似第2スペクトルパターンを先頭から順に1区間ずつ後方シフトさせることによって得られる3個の擬似第2スペクトルパターンの各々に関して、第3スペクトルパターンとの類似度を算出することを特徴とするものである。 The electronic melody specifying device according to the tenth aspect of the present invention is particularly the electronic melody specifying device according to any one of the fifth to seventh aspects, and the calculation processing unit is generated based on the first spectrum pattern. By excluding the second section of the head portion and the tail portion in chronological order from the N second sections included in the second spectrum pattern, a pseudo second section including (N-2) second sections is included. To calculate the similarity with the third spectrum pattern for each of the three pseudo second spectrum patterns obtained by defining the spectrum pattern and shifting the pseudo second spectrum pattern backward by one section in order from the beginning. It is characterized by.

第10の態様に係る電子メロディ特定装置によれば、算出処理部は、第2スペクトルパターンに含まれるN個の第2区間のうち時系列順で先頭部分及び末尾部分の第2区間を除外することによって、(N-2)個の第2区間を含む擬似第2スペクトルパターンを規定し、当該擬似第2スペクトルパターンを先頭から順に1区間ずつ後方シフトさせることによって得られる3個の擬似第2スペクトルパターンの各々に関して、第3スペクトルパターンとの類似度を算出する。これにより、第2区間の位置ずれが生じている場合であっても、第2スペクトルパターンと第3スペクトルパターンとの類似度を適切に算出することが可能となる。 According to the electronic melody specifying device according to the tenth aspect, the calculation processing unit excludes the second section of the head portion and the tail portion in the time series order from the N second sections included in the second spectrum pattern. Thereby, a pseudo second spectrum pattern including (N-2) second sections is defined, and the pseudo second spectrum pattern is shifted backward by one section in order from the beginning, and three pseudo second spectra are obtained. For each of the spectral patterns, the similarity with the third spectral pattern is calculated. This makes it possible to appropriately calculate the degree of similarity between the second spectrum pattern and the third spectrum pattern even when the position of the second section is displaced.

しかも、第2スペクトルパターンに含まれるN個の第2区間のうち時系列順で先頭部分及び末尾部分の第2区間を除外することによって擬似第2スペクトルパターンが規定されるため、全区間の循環シフトと比較して処理負荷の増大を抑制しつつ、ユーザによる録音操作のタイミングずれが最も反映されやすい先頭部分及び末尾部分の第2区間の影響を排除することが可能となる。 Moreover, since the pseudo second spectrum pattern is defined by excluding the second section of the head portion and the tail portion in the time series order from the N second sections included in the second spectrum pattern, the circulation of all sections. It is possible to suppress the increase in the processing load as compared with the shift, and to eliminate the influence of the second section of the head portion and the tail portion where the timing shift of the recording operation by the user is most likely to be reflected.

本発明の第11の態様に係る電子メロディ特定装置は、第5~第7のいずれか一つの態様に係る電子メロディ特定装置において特に、前記算出処理部は、第2スペクトルパターンに含まれるN個の第2区間のうち、時系列順で先頭部分及び末尾部分の第2区間に関しては、算出した類似度に1未満の重み係数を乗算することを特徴とするものである。 The electronic melody specifying device according to the eleventh aspect of the present invention is the electronic melody specifying device according to any one of the fifth to seventh aspects, and in particular, the calculation processing unit includes N elements included in the second spectrum pattern. Of the second section of the above, the second section of the head portion and the tail portion in chronological order is characterized in that the calculated similarity is multiplied by a weighting coefficient of less than 1.

第11の態様に係る電子メロディ特定装置によれば、算出処理部は、第2スペクトルパターンに含まれるN個の第2区間のうち、時系列順で先頭部分及び末尾部分の第2区間に関しては、算出した類似度に1未満の重み係数を乗算する。従って、ユーザによる録音操作のタイミングずれが最も反映されやすい先頭部分及び末尾部分の第2区間の影響を低減することが可能となる。 According to the electronic melody specifying device according to the eleventh aspect, the calculation processing unit refers to the second section of the head portion and the tail portion in the time series order among the N second sections included in the second spectrum pattern. , Multiply the calculated similarity by a weighting factor of less than 1. Therefore, it is possible to reduce the influence of the second section of the beginning portion and the ending portion where the timing deviation of the recording operation by the user is most likely to be reflected.

本発明の第12の態様に係る電子メロディ特定装置は、第1~第11のいずれか一つの態様に係る電子メロディ特定装置において特に、前記第1のパターン生成部は、高速フーリエ変換を用いた周波数解析によって第1周波数スペクトルを生成し、前記第2のパターン生成部は、複数の第1周波数スペクトルを平均化して第2周波数スペクトルを生成するにあたり、高速フーリエ変換における絶対値化前の複素信号に対して平均化を行うことを特徴とするものである。 The electronic melody specifying device according to the twelfth aspect of the present invention is the electronic melody specifying device according to any one of the first to eleventh aspects, and in particular, the first pattern generation unit uses a fast Fourier transform. The first frequency spectrum is generated by frequency analysis, and the second pattern generation unit averages a plurality of first frequency spectra to generate a second frequency spectrum, and is a complex signal before absolute value in the fast Fourier transform. It is characterized by averaging the frequencies.

第12の態様に係る電子メロディ特定装置によれば、第2のパターン生成部は、複数の第1周波数スペクトルを平均化して第2周波数スペクトルを生成するにあたり、高速フーリエ変換における絶対値化前の複素信号に対して平均化を行う。これにより、第1周波数スペクトルに混入したホワイトノイズの影響が第2周波数スペクトルでは低減されて信号対雑音比が向上するため、電子メロディの特定精度を向上することが可能となる。 According to the electronic melody specifying device according to the twelfth aspect, the second pattern generation unit averages a plurality of first frequency spectra to generate a second frequency spectrum before the absolute value in the fast Fourier transform. Perform averaging on complex signals. As a result, the influence of white noise mixed in the first frequency spectrum is reduced in the second frequency spectrum and the signal-to-noise ratio is improved, so that the accuracy of specifying the electronic melody can be improved.

本発明の第13の態様に係る電子メロディ特定装置は、第1~第12のいずれか一つの態様に係る電子メロディ特定装置において特に、前記第2のパターン生成部は、複数の第1周波数スペクトルの平均化により得られる周波数スペクトルに対して、所定のしきい値を用いた量子化を行うことによって、第2周波数スペクトルを生成することを特徴とするものである。 The electronic melody specifying device according to the thirteenth aspect of the present invention is the electronic melody specifying device according to any one of the first to twelfth aspects, and in particular, the second pattern generation unit has a plurality of first frequency spectra. It is characterized in that a second frequency spectrum is generated by performing quantization using a predetermined threshold value on the frequency spectrum obtained by averaging.

第13の態様に係る電子メロディ特定装置によれば、第2のパターン生成部は、複数の第1周波数スペクトルの平均化により得られる周波数スペクトルに対して、所定のしきい値を用いた量子化を行うことによって、第2周波数スペクトルを生成する。第2周波数スペクトルを量子化することによって第2スペクトルパターンを簡略化できるため、演算量を削減することができる。しかも、特定対象が電子メロディであるため、第2周波数スペクトルを量子化しても、特定精度が低下する影響は小さい。従って、電子メロディの特定精度の低下を抑制しつつ、演算量を削減することが可能となる。 According to the electronic melody specifying device according to the thirteenth aspect, the second pattern generator quantizes the frequency spectrum obtained by averaging the plurality of first frequency spectra using a predetermined threshold value. To generate a second frequency spectrum. Since the second spectrum pattern can be simplified by quantizing the second frequency spectrum, the amount of calculation can be reduced. Moreover, since the specific target is an electronic melody, even if the second frequency spectrum is quantized, the effect of reducing the specific accuracy is small. Therefore, it is possible to reduce the amount of calculation while suppressing the deterioration of the specific accuracy of the electronic melody.

本発明の第14の態様に係る電子メロディ特定装置は、第13の態様に係る電子メロディ特定装置において特に、前記記憶部には、第2周波数スペクトルと同様の平均化及び量子化が行われた第3スペクトルパターンが記憶されていることを特徴とするものである。 The electronic melody specifying device according to the fourteenth aspect of the present invention is the electronic melody specifying device according to the thirteenth aspect, and in particular, the storage unit is averaged and quantized in the same manner as in the second frequency spectrum. It is characterized in that the third spectrum pattern is stored.

第14の態様に係る電子メロディ特定装置によれば、記憶部には、第2周波数スペクトルと同様の平均化及び量子化が行われた第3スペクトルパターンが記憶されている。量子化によって第3スペクトルパターンをさらに簡略化できるため、記憶部に必要な記憶容量をさらに削減することが可能となる。 According to the electronic melody specifying device according to the fourteenth aspect, the storage unit stores a third spectrum pattern that has been averaged and quantized in the same manner as the second frequency spectrum. Since the third spectral pattern can be further simplified by quantization, the storage capacity required for the storage unit can be further reduced.

本発明の第15の態様に係るプログラムは、電子メロディ特定装置に搭載されるコンピュータを、特定対象である電子メロディの時系列信号を取得する取得手段と、前記取得手段によって取得された電子メロディの時系列信号を、所定の第1区間単位で周波数解析することにより、第1区間毎の第1周波数スペクトルが複数配列された第1スペクトルパターンを生成する、第1のパターン生成手段と、前記第1のパターン生成手段によって生成された第1スペクトルパターンを、それぞれに複数の第1区間を包含するN個(Nは複数)の第2区間に分割し、各第2区間に包含される複数の第1区間に関する複数の第1周波数スペクトルを平均化することにより、第2区間毎の第2周波数スペクトルが複数配列された第2スペクトルパターンを生成する、第2のパターン生成手段と、既知の複数の電子メロディの各々に関して予め生成され、N個の第2区間に分割された、第3スペクトルパターンを記憶する記憶手段と、前記第2のパターン生成手段によって生成された第2スペクトルパターンと、前記記憶手段に記憶されている各第3スペクトルパターンとの類似度を算出する算出処理手段と、前記算出処理手段による類似度の算出結果に基づいて、前記取得手段によって取得された電子メロディを特定する特定処理手段と、として機能させるためのプログラムであって、前記第2のパターン生成手段は、第2スペクトルパターンにおける周波数成分の分布に基づいて、各第2区間に包含される第1区間の個数を非均等に配分可能であることを特徴とするものである。 In the program according to the fifteenth aspect of the present invention, the computer mounted on the electronic melody specifying device has an acquisition means for acquiring a time-series signal of the electronic melody to be specified, and an electronic melody acquired by the acquisition means. A first pattern generation means for generating a first spectrum pattern in which a plurality of first frequency spectra for each first section are arranged by frequency analysis of a time-series signal in a predetermined first section unit, and the first. The first spectrum pattern generated by the pattern generation means of 1 is divided into N (multiple N) second sections, each of which contains a plurality of first sections, and a plurality of pieces included in each second section. A second pattern generation means for generating a second spectrum pattern in which a plurality of second frequency spectra for each second section are arranged by averaging a plurality of first frequency spectra for the first section, and a plurality of known patterns. A storage means for storing a third spectrum pattern, which is pre-generated for each of the electronic melody of the above and divided into N second sections, a second spectrum pattern generated by the second pattern generation means, and the above-mentioned. The electronic melody acquired by the acquisition means is specified based on the calculation processing means for calculating the similarity with each third spectrum pattern stored in the storage means and the calculation result of the similarity with the calculation processing means. A program for functioning as a specific processing means, wherein the second pattern generation means is the number of first sections included in each second section based on the distribution of frequency components in the second spectral pattern. Is characterized by being able to be distributed unevenly.

第15の態様に係るプログラムによれば、第2のパターン生成手段は、各第2区間に包含される複数の第1区間に関する複数の第1周波数スペクトルを平均化することにより、第2区間毎の第2周波数スペクトルが複数配列された第2スペクトルパターンを生成する。そして、算出処理手段は、第2のパターン生成手段によって生成された第2スペクトルパターンと、記憶手段に記憶されている各第3スペクトルパターンとの類似度を算出する。これにより、平均化前の第1スペクトルパターンを用いて類似度を算出する場合と比較して、演算量が削減されるため処理負荷を軽減することができる。また、第3スペクトルパターンを簡略化できるため、記憶手段に必要な記憶容量を削減することができる。 According to the program according to the fifteenth aspect, the second pattern generation means is performed for each second section by averaging a plurality of first frequency spectra for the plurality of first sections included in each second section. A second spectrum pattern in which a plurality of second frequency spectra of the above are arranged is generated. Then, the calculation processing means calculates the degree of similarity between the second spectrum pattern generated by the second pattern generation means and each third spectrum pattern stored in the storage means. As a result, the amount of calculation is reduced as compared with the case where the similarity is calculated using the first spectral pattern before averaging, so that the processing load can be reduced. Further, since the third spectrum pattern can be simplified, the storage capacity required for the storage means can be reduced.

しかも、第2のパターン生成手段は、第2スペクトルパターンにおける周波数成分の分布に基づいて、各第2区間に包含される第1区間の個数を非均等に配分可能である。第2区間に包含される第1区間の個数に応じて解像度を調整できるため、重要な箇所の解像度を上げ、重要でない箇所の解像度を下げるような配分を行うことにより、処理負荷の増大を回避しつつ電子メロディの特定精度を向上することが可能となる。 Moreover, the second pattern generation means can non-uniformly distribute the number of the first sections included in each second section based on the distribution of the frequency components in the second spectral pattern. Since the resolution can be adjusted according to the number of the first section included in the second section, the processing load is avoided by increasing the resolution of the important part and lowering the resolution of the unimportant part. However, it is possible to improve the identification accuracy of the electronic melody.

本発明の第16の態様に係る電子メロディ特定方法は、(A)特定対象である電子メロディの時系列信号を取得するステップと、(B)前記ステップ(A)によって取得された電子メロディの時系列信号を、所定の第1区間単位で周波数解析することにより、第1区間毎の第1周波数スペクトルが複数配列された第1スペクトルパターンを生成するステップと、(C)前記ステップ(B)によって生成された第1スペクトルパターンを、それぞれに複数の第1区間を包含するN個(Nは複数)の第2区間に分割し、各第2区間に包含される複数の第1区間に関する複数の第1周波数スペクトルを平均化することにより、第2区間毎の第2周波数スペクトルが複数配列された第2スペクトルパターンを生成するステップと、(D)既知の複数の電子メロディの各々に関して予め生成され、N個の第2区間に分割された、第3スペクトルパターンを記憶するステップと、(E)前記ステップ(C)によって生成された第2スペクトルパターンと、前記ステップ(D)によって記憶された各第3スペクトルパターンとの類似度を算出するステップと、(F)前記ステップ(E)による類似度の算出結果に基づいて、前記ステップ(A)によって取得された電子メロディを特定するステップと、を備え、前記ステップ(C)では、第2スペクトルパターンにおける周波数成分の分布に基づいて、各第2区間に包含される第1区間の個数を非均等に配分可能であることを特徴とするものである。 The method for specifying an electronic melody according to a sixteenth aspect of the present invention includes (A) a step of acquiring a time-series signal of the electronic melody to be specified, and (B) a time of the electronic melody acquired by the step (A). By frequency-analyzing the series signal in a predetermined first section unit, a step of generating a first spectrum pattern in which a plurality of first frequency spectra for each first section are arranged, and (C) the step (B). The generated first spectrum pattern is divided into N (multiple N) second sections, each of which contains a plurality of first sections, and a plurality of first sections are included in each second section. By averaging the first frequency spectra, a step of generating a second spectrum pattern in which a plurality of second frequency spectra are arranged for each second section, and (D) pre-generated for each of a plurality of known electronic melodies. , The step of storing the third spectrum pattern divided into N second sections, (E) the second spectrum pattern generated by the step (C), and each stored by the step (D). A step of calculating the similarity with the third spectrum pattern, and (F) a step of specifying the electronic melody acquired by the step (A) based on the calculation result of the similarity by the step (E). The step (C) is characterized in that the number of the first sections included in each second section can be distributed non-uniformly based on the distribution of the frequency components in the second spectral pattern. be.

第16の態様に係る電子メロディ特定方法によれば、ステップ(C)では、各第2区間に包含される複数の第1区間に関する複数の第1周波数スペクトルを平均化することにより、第2区間毎の第2周波数スペクトルが複数配列された第2スペクトルパターンが生成される。そして、ステップ(E)では、ステップ(C)によって生成された第2スペクトルパターンと、ステップ(D)によって記憶された各第3スペクトルパターンとの類似度が算出される。これにより、平均化前の第1スペクトルパターンを用いて類似度を算出する場合と比較して、演算量が削減されるため処理負荷を軽減することができる。また、第3スペクトルパターンを簡略化できるため、ステップ(D)での第3スペクトルパターンの記憶に必要な記憶容量を削減することができる。 According to the electronic melody identification method according to the sixteenth aspect, in step (C), the second section is obtained by averaging the plurality of first frequency spectra of the plurality of first sections included in each second section. A second spectrum pattern in which a plurality of second frequency spectra are arranged for each is generated. Then, in step (E), the similarity between the second spectrum pattern generated by step (C) and each third spectrum pattern stored by step (D) is calculated. As a result, the amount of calculation is reduced as compared with the case where the similarity is calculated using the first spectral pattern before averaging, so that the processing load can be reduced. Further, since the third spectrum pattern can be simplified, the storage capacity required for storing the third spectrum pattern in the step (D) can be reduced.

しかも、ステップ(C)では、第2スペクトルパターンにおける周波数成分の分布に基づいて、各第2区間に包含される第1区間の個数を非均等に配分可能である。第2区間に包含される第1区間の個数に応じて解像度を調整できるため、重要な箇所の解像度を上げ、重要でない箇所の解像度を下げるような配分を行うことにより、処理負荷の増大を回避しつつ電子メロディの特定精度を向上することが可能となる。 Moreover, in step (C), the number of first sections included in each second section can be non-uniformly distributed based on the distribution of frequency components in the second spectral pattern. Since the resolution can be adjusted according to the number of the first section included in the second section, the processing load is avoided by increasing the resolution of the important part and lowering the resolution of the unimportant part. However, it is possible to improve the identification accuracy of the electronic melody.

本発明によれば、簡易な構成及び処理によって電子メロディを高精度に特定することが可能となる。 According to the present invention, it is possible to specify an electronic melody with high accuracy by a simple configuration and processing.

本発明の実施の形態に係る電子メロディ特定装置の構成を示すブロック図である。It is a block diagram which shows the structure of the electronic melody specifying apparatus which concerns on embodiment of this invention. 電子メロディの時系列信号とフレームとの関係を示す図である。It is a figure which shows the relationship between the time-series signal of an electronic melody, and a frame. 周波数解析部によって生成されるスペクトルパターンの一例を模式的に示す図である。It is a figure which shows an example of the spectrum pattern generated by the frequency analysis part schematically. フレームとセグメントとの関係を示す図である。It is a figure which shows the relationship between a frame and a segment. パターン生成部によって生成されるスペクトルパターンの一例を模式的に示す図である。It is a figure which shows an example of the spectrum pattern generated by the pattern generation part schematically. パターン生成部によって生成されるスペクトルパターンの一例を模式的に示す図である。It is a figure which shows an example of the spectrum pattern generated by the pattern generation part schematically. 類似度算出部による類似度の算出手法を説明するための図である。It is a figure for demonstrating the calculation method of the similarity degree by the similarity degree calculation part. 電子メロディ特定装置をソフトウェアによって実現するための構成を示す図である。It is a figure which shows the structure for realizing the electronic melody identification apparatus by software. 均等配分によって生成されるスペクトルパターンの一例を示す図である。It is a figure which shows an example of the spectrum pattern generated by the even distribution. 非均等配分した場合のフレームとセグメントとの関係を示す図である。It is a figure which shows the relationship between a frame and a segment at the time of unequal distribution. 均等配分によって生成されるスペクトルパターンの他の例を示す図である。It is a figure which shows the other example of the spectral pattern generated by the even distribution. 記憶部に記憶されるスペクトルパターンを示す図である。It is a figure which shows the spectrum pattern which is stored in the storage part. 類似度算出部及び特定処理部の処理フローに関する第1の例を示すフローチャートである。It is a flowchart which shows 1st example about the processing flow of the similarity calculation unit and the specific processing unit. 類似度算出部及び特定処理部の処理フローに関する第2の例を示すフローチャートである。It is a flowchart which shows the 2nd example about the processing flow of the similarity calculation unit and the specific processing unit. 対応セグメントの位置ずれ対策についての第1の例を説明するための図である。It is a figure for demonstrating the 1st example about the position shift measure of the corresponding segment. 対応セグメントの位置ずれ対策についての第2の例を説明するための図である。It is a figure for demonstrating the 2nd example about the position shift measure of the corresponding segment. 対応セグメントの位置ずれ対策についての第3の例を説明するための図である。It is a figure for demonstrating the 3rd example about the position shift measure of the corresponding segment. 対応セグメントの位置ずれ対策についての第4の例を説明するための図である。It is a figure for demonstrating the 4th example about the position shift measure of the corresponding segment. 対応セグメントの位置ずれ対策についての第5の例を説明するための図である。It is a figure for demonstrating the 5th example about the position shift measure of the corresponding segment. 対応セグメントの位置ずれ対策についての第6の例を説明するための図である。It is a figure for demonstrating the sixth example about the position shift measure of the corresponding segment.

以下、本発明の実施の形態について、図面を用いて詳細に説明する。なお、異なる図面において同一の符号を付した要素は、同一又は相応する要素を示すものとする。 Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings. In addition, the elements with the same reference numerals in different drawings indicate the same or corresponding elements.

<基本構成>
図1は、本発明の実施の形態に係る電子メロディ特定装置1の構成を示すブロック図である。用途の一例として、電子メロディ特定装置1は、スマートフォンやゲーム機等の携帯端末に実装され、特定の駅や店舗に訪問したユーザが、訪問証明のために、その駅に特有の発着メロディやその店舗に特有の入店メロディ等を録音する用途で使用される。後述するように、電子メロディ特定装置1には、既知の様々な参照電子メロディに関する参照スペクトルパターンが予め記憶されており、取得した電子メロディのスペクトルパターンと参照スペクトルパターンとを比較することによって、取得した電子メロディがいずれの参照電子メロディに相当するかが特定される。
<Basic configuration>
FIG. 1 is a block diagram showing a configuration of an electronic melody specifying device 1 according to an embodiment of the present invention. As an example of the application, the electronic melody specifying device 1 is mounted on a mobile terminal such as a smartphone or a game machine, and a user who visits a specific station or store can use the arrival / departure melody peculiar to the station or the like for proof of visit. It is used to record store-specific entry melody. As will be described later, the electronic melody specifying device 1 stores in advance reference spectrum patterns relating to various known reference electronic melody, and obtains the acquired electronic melody by comparing the spectral pattern with the reference spectral pattern. It is specified which reference electronic melody corresponds to the electronic melody.

図1の接続関係で示すように、電子メロディ特定装置1は、マイク11、AD変換器(ADC)12、バッファ13,15、周波数解析部14、パターン生成部16、類似度算出部17、特定処理部18、及び記憶部19を備えて構成されている。マイク11、ADC12、及びバッファ13は、録音によって電子メロディを取得するための取得部10として機能する。電子メロディ特定装置1を構成する各要素は、ハードウェアによって構成しても良いし、ソフトウェアによって構成しても良い。あるいは、単純計算はハードウェアで行い、判定処理はソフトウェアで行うなど、ハードウェア及びソフトウェアの双方を用いて電子メロディ特定装置1を構成しても良い。 As shown in the connection relationship of FIG. 1, the electronic melody specifying device 1 includes a microphone 11, an AD converter (ADC) 12, buffers 13, 15, frequency analysis unit 14, pattern generation unit 16, similarity calculation unit 17, and identification. It is configured to include a processing unit 18 and a storage unit 19. The microphone 11, the ADC 12, and the buffer 13 function as an acquisition unit 10 for acquiring an electronic melody by recording. Each element constituting the electronic melody specifying device 1 may be configured by hardware or software. Alternatively, the electronic melody specifying device 1 may be configured by using both hardware and software, such as performing simple calculation by hardware and performing determination processing by software.

ユーザが携帯端末を操作することによって録音が開始されると、特定対象である電子メロディの時系列信号がマイク11からAD変換器12に入力され、AD変換器12によってディジタルデータに変換された後、バッファ13に一時的に格納される。 When recording is started by the user operating the mobile terminal, the time-series signal of the electronic melody to be specified is input from the microphone 11 to the AD converter 12, and after being converted into digital data by the AD converter 12. , Temporarily stored in the buffer 13.

周波数解析部14は、バッファ13から入力された電子メロディの時系列信号を、所定のフレーム単位で高速フーリエ変換(FFT)することによって、フレーム毎の周波数スペクトルが複数配列されたスペクトルパターンSP01を生成する。 The frequency analysis unit 14 generates a spectrum pattern SP01 in which a plurality of frequency spectra for each frame are arranged by performing a fast Fourier transform (FFT) on the time series signal of the electronic melody input from the buffer 13 in a predetermined frame unit. do.

図2は、電子メロディの時系列信号I0とフレームF01~F78との関係を示す図である。想定される電子メロディの長さを「Tm」、サンプリング周波数を「Fs」、FFT長を「Nf」とすると、フレーム数はTm×Fs/Nfの関係式によって定まる。一例として本実施の形態では、Tm=4.992(sec)、Fs=8(kHz)、Nf=512に設定されており、その結果、フレーム数は「78」となる。また、フレーム長は4.992/78=64(msec)となる。フレームは時系列順に配列され、図2に示すように、先頭がフレームF01であり、末尾がフレームF78である。 FIG. 2 is a diagram showing the relationship between the time-series signals I0 of the electronic melody and the frames F01 to F78. Assuming that the assumed electronic melody length is "Tm", the sampling frequency is "Fs", and the FFT length is "Nf", the number of frames is determined by the relational expression of Tm × Fs / Nf. As an example, in the present embodiment, Tm = 4.992 (sec), Fs = 8 (kHz), and Nf = 512 are set, and as a result, the number of frames is "78". The frame length is 4.992 / 78 = 64 (msec). The frames are arranged in chronological order, and as shown in FIG. 2, the head is the frame F01 and the end is the frame F78.

図3は、周波数解析部14によって生成されるスペクトルパターンSP01の一例を模式的に示す図である。電子メロディの時系列信号I0をフレーム単位で周波数解析することにより、各フレームF01~F78に対応する周波数スペクトルX01~X78がそれぞれ生成される。そして、周波数スペクトルX01~X78を時系列順に配列したものがスペクトルパターンSP01となる。図1を参照して、周波数解析部14によって生成されたスペクトルパターンSP01は、バッファ15に一時的に格納される。 FIG. 3 is a diagram schematically showing an example of the spectrum pattern SP01 generated by the frequency analysis unit 14. By frequency-analyzing the time-series signal I0 of the electronic melody in frame units, frequency spectra X01 to X78 corresponding to each frame F01 to F78 are generated. The spectrum pattern SP01 is obtained by arranging the frequency spectra X01 to X78 in chronological order. With reference to FIG. 1, the spectrum pattern SP01 generated by the frequency analysis unit 14 is temporarily stored in the buffer 15.

パターン生成部16は、バッファ15から入力されたスペクトルパターンSP01を、それぞれに複数のフレームを包含するN個(Nは複数)のセグメントに分割し、各セグメントに包含される複数のフレームに関する複数の周波数スペクトルを平均化することにより、スペクトルパターンSP02を生成する。セグメントの個数Nは、要求される特定精度や所要時間等に応じて最適な値が設定されており、本実施の形態の例ではN=6とする。 The pattern generation unit 16 divides the spectrum pattern SP01 input from the buffer 15 into N segments (N is plural) each containing a plurality of frames, and a plurality of frames relating to the plurality of frames included in each segment. The spectrum pattern SP02 is generated by averaging the frequency spectra. The number N of the segments is set to an optimum value according to the required specific accuracy, the required time, and the like, and in the example of this embodiment, N = 6.

図4は、フレーム(第1区間)F01~F78とセグメント(第2区間)S01~S06との関係を示す図である。セグメントは時系列順に配列され、図4に示すように、先頭がセグメントS01であり、末尾がセグメントS06である。本実施の形態の例ではフレーム数が「78」でセグメント数が「6」であるため、1セグメントには78/6=13個のフレームが包含される。例えば、セグメントS01にはフレームF01~F13が包含され、セグメントS02にはフレームF14~F26が包含される。 FIG. 4 is a diagram showing the relationship between the frame (first section) F01 to F78 and the segment (second section) S01 to S06. The segments are arranged in chronological order, and as shown in FIG. 4, the head is the segment S01 and the end is the segment S06. In the example of this embodiment, since the number of frames is "78" and the number of segments is "6", 78/6 = 13 frames are included in one segment. For example, the segment S01 includes frames F01 to F13, and the segment S02 includes frames F14 to F26.

図5は、パターン生成部16によって生成されるスペクトルパターンSP02の一例を模式的に示す図である。スペクトルパターンSP01に含まれる周波数スペクトルX01~X78をセグメント単位で平均化することにより、各セグメントS01~S06に対応する周波数スペクトルY01~Y06がそれぞれ生成される。例えば、セグメントS01に包含されるフレームF01~F13に関する周波数スペクトルX01~X13を平均化することによって、周波数スペクトルY01が生成される。そして、周波数スペクトルY01~Y06を時系列順に配列したものがスペクトルパターンSP02となる。なお、パターン生成部16は、周波数解析部14によるFFT直後の複素信号に対して平均化を行う。つまり、一般的な平均化手法のように複素信号を絶対値化してから平均化するのではなく、絶対値化前の複素信号の状態で平均化を行い、その後に絶対値化を行う。 FIG. 5 is a diagram schematically showing an example of the spectrum pattern SP02 generated by the pattern generation unit 16. By averaging the frequency spectra X01 to X78 included in the spectrum pattern SP01 in segment units, frequency spectra Y01 to Y06 corresponding to each segment S01 to S06 are generated, respectively. For example, the frequency spectrum Y01 is generated by averaging the frequency spectra X01 to X13 with respect to the frames F01 to F13 included in the segment S01. The spectrum pattern SP02 is obtained by arranging the frequency spectra Y01 to Y06 in chronological order. The pattern generation unit 16 averages the complex signal immediately after the FFT by the frequency analysis unit 14. That is, instead of averaging the complex signal after making it an absolute value as in a general averaging method, averaging is performed in the state of the complex signal before the absolute value, and then the absolute value is performed.

次にパターン生成部16は、スペクトルパターンSP02を量子化することによってスペクトルパターンSP02Aを生成する。なお、この処理はオプションであり、電子メロディ特定装置1の記憶容量や計算負荷に余裕がある場合にはこの処理は省略しても良い。 Next, the pattern generation unit 16 generates the spectrum pattern SP02A by quantizing the spectrum pattern SP02. This process is optional, and may be omitted if the storage capacity and calculation load of the electronic melody specifying device 1 are sufficient.

図6は、パターン生成部16によって生成されるスペクトルパターンSP02Aの一例を模式的に示す図である。図5に示した周波数スペクトルY01~Y06に対して、所定のしきい値V1を用いた1ビット量子化が行われることにより、周波数スペクトルY01A~Y06Aが生成される。つまり、周波数スペクトルY01~Y06においてしきい値V1未満の周波数成分は、周波数スペクトルY01A~Y06Aにおいて全て「0」とされ、また、周波数スペクトルY01~Y06においてしきい値V1以上の周波数成分は、周波数スペクトルY01A~Y06Aにおいて全て「1」とされる。そして、周波数スペクトルY01A~Y06Aを時系列順に配列したものがスペクトルパターンSP02Aとなる。 FIG. 6 is a diagram schematically showing an example of the spectrum pattern SP02A generated by the pattern generation unit 16. The frequency spectra Y01A to Y06A are generated by performing 1-bit quantization using a predetermined threshold value V1 on the frequency spectra Y01 to Y06 shown in FIG. That is, in the frequency spectra Y01 to Y06, the frequency components less than the threshold value V1 are all set to "0" in the frequency spectra Y01A to Y06A, and the frequency components having the threshold value V1 or more in the frequency spectra Y01 to Y06 are frequencies. All of the spectra Y01A to Y06A are set to "1". The spectrum pattern SP02A is obtained by arranging the frequency spectra Y01A to Y06A in chronological order.

図1を参照して、記憶部19には、既知の様々な電子メロディに関する複数のスペクトルパターンSP03が記憶されている。スペクトルパターンSP03は、上述したスペクトルパターンSP02Aと同様の処理(フレーム単位での周波数解析、セグメント単位での平均化、しきい値V1を用いた1ビット量子化)によって、予め生成されている。 With reference to FIG. 1, the storage unit 19 stores a plurality of spectral patterns SP03 relating to various known electronic melodies. The spectrum pattern SP03 is generated in advance by the same processing as the above-mentioned spectrum pattern SP02A (frequency analysis in frame units, averaging in segment units, 1-bit quantization using the threshold value V1).

類似度算出部17は、パターン生成部16によって生成されたスペクトルパターンSP02Aと、記憶部19に記憶されている各スペクトルパターンSP03との類似度を算出する。 The similarity calculation unit 17 calculates the similarity between the spectrum pattern SP02A generated by the pattern generation unit 16 and each spectrum pattern SP03 stored in the storage unit 19.

図7は、類似度算出部17による類似度の算出手法を説明するための図である。本実施の形態の例では、スペクトルパターンSP03,SP02Aは、いずれも6個のセグメントS01~S06に分割されている。類似度算出部17は、まず、類似度を求めるための任意の計算式を用いて、スペクトルパターンSP03,SP02A間で対応するセグメントS01~S06毎に、類似度K01~K06を算出する。次に、セグメントS01~S06毎に求めた6個の類似度K01~K06の代表値を、スペクトルパターンSP03とスペクトルパターンSP02Aとの類似度として算出する。代表値としては、例えば平均値を用いることができる。その場合、スペクトルパターンSP03とスペクトルパターンSP02Aとの類似度は、(K01+K02+K03+K04+K05+K06)/6となる。なお、代表値としては平均値のほかに最大値を用いることもでき、その場合、類似度K01~K06のうちの最大値が、スペクトルパターンSP03とスペクトルパターンSP02Aとの類似度となる。類似度算出部17は、記憶部19に記憶されている全てのスペクトルパターンSP03を順に読み出すことにより、各スペクトルパターンSP03とスペクトルパターンSP02Aとの類似度を順に算出する。 FIG. 7 is a diagram for explaining a similarity calculation method by the similarity calculation unit 17. In the example of this embodiment, the spectral patterns SP03 and SP02A are each divided into six segments S01 to S06. First, the similarity calculation unit 17 calculates the similarity K01 to K06 for each of the corresponding segments S01 to S06 between the spectral patterns SP03 and SP02A by using an arbitrary calculation formula for obtaining the similarity. Next, the representative values of the six similarity degrees K01 to K06 obtained for each of the segments S01 to S06 are calculated as the similarity between the spectrum pattern SP03 and the spectrum pattern SP02A. As the representative value, for example, an average value can be used. In that case, the similarity between the spectrum pattern SP03 and the spectrum pattern SP02A is (K01 + K02 + K03 + K04 + K05 + K06) / 6. In addition to the average value, the maximum value can be used as the representative value, and in that case, the maximum value among the similarity degrees K01 to K06 becomes the similarity degree between the spectrum pattern SP03 and the spectrum pattern SP02A. The similarity calculation unit 17 sequentially reads out all the spectrum patterns SP03 stored in the storage unit 19 to sequentially calculate the similarity between each spectrum pattern SP03 and the spectrum pattern SP02A.

図1を参照して、特定処理部18は、類似度算出部17による類似度の算出結果に基づいて、取得部10によって取得された電子メロディを特定する。つまり、記憶部19に記憶されている全てのスペクトルパターンSP03のうち、スペクトルパターンSP02Aとの類似度が最大となる一つのスペクトルパターンSP03を特定し、取得部10によって取得された電子メロディは当該スペクトルパターンSP03に対応する電子メロディであると特定する。 With reference to FIG. 1, the specific processing unit 18 identifies the electronic melody acquired by the acquisition unit 10 based on the calculation result of the similarity by the similarity calculation unit 17. That is, among all the spectrum patterns SP03 stored in the storage unit 19, one spectrum pattern SP03 having the maximum similarity with the spectrum pattern SP02A is specified, and the electronic melody acquired by the acquisition unit 10 is the spectrum. It is specified that it is an electronic melody corresponding to the pattern SP03.

このように本実施の形態に係る電子メロディ特定装置1によれば、周波数解析部14(第1のパターン生成部)は、取得部10によって取得された電子メロディの時系列信号I0を、フレーム(第1区間)単位で周波数解析することにより、フレーム毎の周波数スペクトルX(第1周波数スペクトル)が複数配列されたスペクトルパターンSP01(第1スペクトルパターン)を生成する。また、パターン生成部16(第2のパターン生成部)は、各セグメント(第2区間)に包含される複数のフレームに関する複数の周波数スペクトルXを平均化することにより、セグメント毎の周波数スペクトルY(第2周波数スペクトル)が複数配列されたスペクトルパターンY02A(第2スペクトルパターン)を生成する。そして、類似度算出部17(算出処理部)は、パターン生成部16によって生成されたスペクトルパターンY02Aと、記憶部19に記憶されている各スペクトルパターンSP03(第3スペクトルパターン)との類似度を算出する。これにより、平均化前のスペクトルパターンSP01を用いて類似度を算出する場合と比較して、演算量が削減されるため処理負荷を軽減することができる。また、スペクトルパターンSP03を簡略化できるため、記憶部19に必要な記憶容量を削減することができる。 As described above, according to the electronic melody specifying device 1 according to the present embodiment, the frequency analysis unit 14 (first pattern generation unit) sets the time series signal I0 of the electronic melody acquired by the acquisition unit 10 into a frame (1st pattern generation unit). By frequency analysis in units of (first section), a spectrum pattern SP01 (first spectrum pattern) in which a plurality of frequency spectra X (first frequency spectra) are arranged for each frame is generated. Further, the pattern generation unit 16 (second pattern generation unit) averages a plurality of frequency spectra X relating to a plurality of frames included in each segment (second section) to obtain a frequency spectrum Y (for each segment). A spectrum pattern Y02A (second spectrum pattern) in which a plurality of second frequency spectra) are arranged is generated. Then, the similarity calculation unit 17 (calculation processing unit) determines the similarity between the spectrum pattern Y02A generated by the pattern generation unit 16 and each spectrum pattern SP03 (third spectrum pattern) stored in the storage unit 19. calculate. As a result, the amount of calculation is reduced as compared with the case where the similarity is calculated using the spectrum pattern SP01 before averaging, so that the processing load can be reduced. Further, since the spectrum pattern SP03 can be simplified, the storage capacity required for the storage unit 19 can be reduced.

また、本実施の形態に係る電子メロディ特定装置1によれば、類似度算出部17は、スペクトルパターンSP02AとスペクトルパターンSP03とで対応するセグメント毎に類似度を算出することによって得られるN個の類似度の代表値を、スペクトルパターンSP02AとスペクトルパターンSP03との類似度として算出する。従って、フレーム毎に類似度を算出する場合と比較して、演算量が削減されるため処理負荷を軽減することが可能となる。 Further, according to the electronic melody specifying device 1 according to the present embodiment, the similarity calculation unit 17 obtains N pieces by calculating the similarity for each segment corresponding to the spectrum pattern SP02A and the spectrum pattern SP03. The representative value of the similarity is calculated as the similarity between the spectrum pattern SP02A and the spectrum pattern SP03. Therefore, as compared with the case where the similarity is calculated for each frame, the amount of calculation is reduced, so that the processing load can be reduced.

また、本実施の形態に係る電子メロディ特定装置1によれば、類似度算出部17は、対応するセグメント毎に類似度を算出することによって得られるN個の類似度の平均値を、スペクトルパターンSP02AとスペクトルパターンSP03との類似度として算出する。これにより、スペクトルパターンの全体領域における周波数成分の分布に基づいて、類似度を算出することが可能となる。 Further, according to the electronic melody specifying device 1 according to the present embodiment, the similarity calculation unit 17 sets the average value of N similarities obtained by calculating the similarity for each corresponding segment as a spectrum pattern. It is calculated as the degree of similarity between SP02A and the spectrum pattern SP03. This makes it possible to calculate the similarity based on the distribution of frequency components in the entire region of the spectral pattern.

また、本実施の形態に係る電子メロディ特定装置1によれば、類似度算出部17は、対応するセグメント毎に類似度を算出することによって得られるN個の類似度の最大値を、スペクトルパターンSP02とスペクトルパターンSP03との類似度として算出する。これにより、特徴的部分を含む電子メロディに関して、その特徴的部分に対応する周波数スペクトルSP02における周波数成分の分布に基づいて、類似度を算出することが可能となる。 Further, according to the electronic melody specifying device 1 according to the present embodiment, the similarity calculation unit 17 sets the maximum value of N similarities obtained by calculating the similarity for each corresponding segment as a spectrum pattern. It is calculated as the degree of similarity between SP02 and the spectrum pattern SP03. This makes it possible to calculate the similarity of the electronic melody including the characteristic portion based on the distribution of the frequency components in the frequency spectrum SP02 corresponding to the characteristic portion.

また、本実施の形態に係る電子メロディ特定装置1によれば、パターン生成部16は、複数の周波数スペクトルXを平均化して周波数スペクトルYを生成するにあたり、高速フーリエ変換における絶対値化前の複素信号に対して平均化を行う。これにより、周波数スペクトルXに混入したホワイトノイズの影響が周波数スペクトルYでは低減されて信号対雑音比が向上するため、電子メロディの特定精度を向上することが可能となる。 Further, according to the electronic melody specifying device 1 according to the present embodiment, the pattern generation unit 16 averages the plurality of frequency spectra X to generate the frequency spectrum Y, and the complex before the absolute value in the fast Fourier transform. Perform averaging on the signal. As a result, the influence of white noise mixed in the frequency spectrum X is reduced in the frequency spectrum Y and the signal-to-noise ratio is improved, so that the accuracy of specifying the electronic melody can be improved.

また、本実施の形態に係る電子メロディ特定装置1によれば、パターン生成部16は、周波数スペクトルY01~Y06に対してしきい値V1を用いた量子化を行うことによって、周波数スペクトルY01A~Y06Aを生成する。周波数スペクトルY01~Y06を量子化することによってスペクトルパターンSP02を簡略化できるため、演算量を削減することができる。しかも、特定対象が電子メロディであるため、周波数スペクトルY01~Y06を量子化しても、特定精度が低下する影響は小さい。従って、電子メロディの特定精度の低下を抑制しつつ、演算量を削減することが可能となる。 Further, according to the electronic melody specifying device 1 according to the present embodiment, the pattern generation unit 16 performs quantization using the threshold value V1 on the frequency spectra Y01 to Y06, thereby performing frequency spectra Y01A to Y06A. To generate. Since the spectrum pattern SP02 can be simplified by quantizing the frequency spectra Y01 to Y06, the amount of calculation can be reduced. Moreover, since the specific target is an electronic melody, even if the frequency spectra Y01 to Y06 are quantized, the effect of reducing the specific accuracy is small. Therefore, it is possible to reduce the amount of calculation while suppressing the deterioration of the specific accuracy of the electronic melody.

また、本実施の形態に係る電子メロディ特定装置1によれば、記憶部19には、周波数スペクトルY01A~Y06Aと同様の平均化及び量子化が行われたスペクトルパターンSP03が記憶されている。量子化によってスペクトルパターンSP03をさらに簡略化できるため、記憶部19に必要な記憶容量をさらに削減することが可能となる。 Further, according to the electronic melody specifying device 1 according to the present embodiment, the storage unit 19 stores the spectrum pattern SP03 that has been averaged and quantized in the same manner as the frequency spectra Y01A to Y06A. Since the spectral pattern SP03 can be further simplified by quantization, the storage capacity required for the storage unit 19 can be further reduced.

図8は、電子メロディ特定装置1をソフトウェアによって実現するための構成を示す図である。RAM21に読み出されたプログラム50をCPU20が実行することにより、上述した電子メロディ特定装置1の各機能がソフトウェア処理によって実現される。換言すれば、プログラム50は、電子メロディ特定装置1に搭載されるコンピュータを、特定対象である電子メロディの時系列信号I0を取得する取得手段と、取得された時系列信号I0をフレーム単位で周波数解析することによってスペクトルパターンSP01を生成する第1のパターン生成手段と、スペクトルパターンSP01をN個のセグメントに分割し、各セグメントに包含される複数の周波数スペクトルXを平均化することによってスペクトルパターンSP02Aを生成する第2のパターン生成手段と、スペクトルパターンSP03を記憶する記憶手段と、スペクトルパターンSP02AとスペクトルパターンSP03との類似度を算出する類似度算出手段と、類似度算出手段による類似度の算出結果に基づいて、取得手段によって取得された電子メロディを特定する特定処理手段と、として機能させるためのプログラムである。 FIG. 8 is a diagram showing a configuration for realizing the electronic melody specifying device 1 by software. When the CPU 20 executes the program 50 read out to the RAM 21, each function of the electronic melody specifying device 1 described above is realized by software processing. In other words, the program 50 uses the computer mounted on the electronic melody specifying device 1 as an acquisition means for acquiring the time-series signal I0 of the electronic melody to be specified, and the frequency of the acquired time-series signal I0 in frame units. The first pattern generation means for generating the spectrum pattern SP01 by analysis, and the spectrum pattern SP02A by dividing the spectrum pattern SP01 into N segments and averaging a plurality of frequency spectra X included in each segment. A second pattern generation means for generating the spectrum pattern SP03, a storage means for storing the spectrum pattern SP03, a similarity calculation means for calculating the similarity between the spectrum pattern SP02A and the spectrum pattern SP03, and a similarity calculation means for calculating the similarity. Based on the result, it is a program for functioning as a specific processing means for specifying the electronic melody acquired by the acquisition means.

以下、上記実施の形態に係る電子メロディ特定装置1に関する種々の変形例について説明する。以下で説明する変形例は適宜に組み合わせて適用することが可能である。 Hereinafter, various modifications of the electronic melody specifying device 1 according to the above embodiment will be described. The modifications described below can be applied in combination as appropriate.

<変形例1(特定精度の向上対策)>
上記実施の形態では、図4に示したように各セグメントS01~S06にフレームF01~F78を均等配分したが、スペクトルパターンSP02Aにおける周波数成分の分布に基づいて、各セグメントに包含されるフレームの個数を非均等配分しても良い。
<Modification example 1 (measures for improving specific accuracy)>
In the above embodiment, the frames F01 to F78 are evenly distributed in each of the segments S01 to S06 as shown in FIG. 4, but the number of frames included in each segment is based on the distribution of the frequency components in the spectrum pattern SP02A. May be unevenly distributed.

図9は、均等配分によって生成されるスペクトルパターンSP02Aの一例を示す図である。上記の例によると、フレーム総数は「78」であり、セグメント数は「6」であるため、均等配分した場合の1セグメントあたりのフレーム数は「13」である。 FIG. 9 is a diagram showing an example of the spectrum pattern SP02A generated by even distribution. According to the above example, the total number of frames is "78" and the number of segments is "6", so that the number of frames per segment when evenly distributed is "13".

パターン生成部16は、バッファ15に格納されているスペクトルパターンSP01を参照することにより、各周波数スペクトルX01~X78においてしきい値V1以上となる周波数成分の個数をカウントする。そして、均等配分したと仮定した場合に各セグメントS01~S06に含まれる周波数成分の個数を、セグメントS01~S06毎に集計する。図9に示した例では、セグメントS01~S06の順に「2」「6」「6」「2」「4」「6」となる。また、その総数は「26」となる。 The pattern generation unit 16 counts the number of frequency components having a threshold value V1 or more in each frequency spectrum X01 to X78 by referring to the spectrum pattern SP01 stored in the buffer 15. Then, assuming that the frequencies are evenly distributed, the number of frequency components included in each of the segments S01 to S06 is totaled for each of the segments S01 to S06. In the example shown in FIG. 9, the segments S01 to S06 are "2", "6", "6", "2", "4", and "6" in this order. The total number is "26".

次にパターン生成部16は、セグメント毎の周波数成分の個数を、全セグメントにおける周波数成分の総数で除算することにより、セグメント毎の周波数成分の割合を算出する。図9に示した例では、セグメントS01~S06の順に「1/13」「3/13」「3/13」「1/13」「2/13」「3/13」となる。 Next, the pattern generation unit 16 calculates the ratio of the frequency components for each segment by dividing the number of frequency components for each segment by the total number of frequency components in all the segments. In the example shown in FIG. 9, the segments S01 to S06 are "1/13", "3/13", "3/13", "1/13", "2/13", and "3/13" in this order.

次にパターン生成部16は、「均等配分した場合の1セグメントあたりのフレーム数」の2倍の値から、フレーム総数と上記「セグメント毎の周波数成分の割合」とを乗算した値を減算することにより、非均等配分する場合のセグメント毎のフレーム数を算出する。図9に示した例では、セグメントS01~S06の順に「20」「8」「8」「20」「14」「8」となる。 Next, the pattern generation unit 16 subtracts a value obtained by multiplying the total number of frames by the above-mentioned "ratio of frequency components for each segment" from a value twice the "number of frames per segment when evenly distributed". Calculates the number of frames for each segment in the case of non-equal distribution. In the example shown in FIG. 9, the segments S01 to S06 are "20", "8", "8", "20", "14", and "8" in this order.

図10は、非均等配分した場合のフレームF01~F78とセグメントS01~S06との関係を示す図である。図10に示すように、セグメントS01は20個のフレームF01~F20を包含し、セグメントS02は8個のフレームF21~F28を包含し、セグメントS03は8個のフレームF29~F36を包含し、セグメントS04は20個のフレームF37~F56を包含し、セグメントS05は14個のフレームF57~F70を包含し、セグメントS06は8個のフレームF71~F78を包含している。 FIG. 10 is a diagram showing the relationship between the frames F01 to F78 and the segments S01 to S06 in the case of non-uniform distribution. As shown in FIG. 10, the segment S01 includes 20 frames F01 to F20, the segment S02 contains 8 frames F21 to F28, and the segment S03 contains 8 frames F29 to F36. S04 includes 20 frames F37 to F56, segment S05 includes 14 frames F57 to F70, and segment S06 contains 8 frames F71 to F78.

図11は、均等配分によって生成されるスペクトルパターンSP02Aの他の例を示す図である。周波数スペクトルY01A~Y06Aは、しきい値V1以上となる周波数成分を1個ずつ含んでいる。パターン生成部16が非均等配分機能を有している場合であっても、図11に示したような均等な周波数成分分布を有する電子メロディが特定対象である場合には、パターン生成部16は均等配分を行うことになる。 FIG. 11 is a diagram showing another example of the spectral pattern SP02A generated by even distribution. The frequency spectra Y01A to Y06A include one frequency component having a threshold value V1 or higher. Even when the pattern generation unit 16 has a non-uniform distribution function, if the electronic melody having an even frequency component distribution as shown in FIG. 11 is a specific target, the pattern generation unit 16 may be used. It will be evenly distributed.

スペクトルパターンSP03を生成する場合も上記と同様に、仮に均等配分した場合のスペクトルパターンSP02Aにおける周波数成分分布に基づいて、各セグメントに包含されるフレームの個数が非均等に配分される。 Similarly to the above, when the spectrum pattern SP03 is generated, the number of frames included in each segment is unevenly distributed based on the frequency component distribution in the spectrum pattern SP02A when the spectrum pattern SP02A is evenly distributed.

図12は、記憶部19に記憶されるスペクトルパターンSP03を示す図である。スペクトルパターンSP03は、非均等配分によって生成されたスペクトルパターンSP03を集約する非均等グループG1と、均等配分によって生成されたスペクトルパターンSP03を集約する均等グループG2とに分類されて、記憶部19に記憶される。リファレンスとなる電子メロディが図9に示したような非均等な周波数成分分布を有する場合には、非均等配分が適用されるため、当該電子メロディに関するスペクトルパターンSP03は非均等グループG1に分類される。一方、リファレンスとなる電子メロディが図11に示したような均等な周波数成分分布を有する場合には、均等配分が適用されるため、当該電子メロディに関するスペクトルパターンSP03は均等グループG2に分類される。 FIG. 12 is a diagram showing a spectrum pattern SP03 stored in the storage unit 19. The spectrum pattern SP03 is classified into a non-uniform group G1 that aggregates the spectrum pattern SP03 generated by the non-uniform distribution and an equal group G2 that aggregates the spectrum pattern SP03 generated by the uniform distribution, and is stored in the storage unit 19. Will be done. When the reference electronic melody has a non-uniform frequency component distribution as shown in FIG. 9, since the non-uniform distribution is applied, the spectrum pattern SP03 related to the electronic melody is classified into the non-uniform group G1. .. On the other hand, when the reference electronic melody has an even frequency component distribution as shown in FIG. 11, since the equal distribution is applied, the spectrum pattern SP03 related to the electronic melody is classified into the equal group G2.

図13は、類似度算出部17及び特定処理部18の処理フローに関する第1の例を示すフローチャートである。 FIG. 13 is a flowchart showing a first example regarding the processing flow of the similarity calculation unit 17 and the specific processing unit 18.

まずステップR101において類似度算出部17は、パターン生成部16から入力されたスペクトルパターンSP02Aが非均等配分であるか否かを判定する。 First, in step R101, the similarity calculation unit 17 determines whether or not the spectrum pattern SP02A input from the pattern generation unit 16 has a non-uniform distribution.

非均等配分である場合は、次にステップR102において類似度算出部17は、非均等グループG1を探索することにより、非均等グループG1に属する各スペクトルパターンSP03とスペクトルパターンSP02Aとの類似度を順に算出する。そして、特定処理部18は、非均等グループG1に属する全てのスペクトルパターンSP03のうち、スペクトルパターンSP02Aとの類似度が最大となる一つのスペクトルパターンSP03を選出する。ここでは、スペクトルパターンE1が選出されたものとする。 In the case of non-uniform distribution, the similarity calculation unit 17 then searches for the non-uniform group G1 in step R102 to sequentially determine the similarity between each spectrum pattern SP03 and the spectrum pattern SP02A belonging to the non-uniform group G1. calculate. Then, the specific processing unit 18 selects one spectrum pattern SP03 having the maximum similarity with the spectrum pattern SP02A from all the spectrum patterns SP03 belonging to the non-uniform group G1. Here, it is assumed that the spectrum pattern E1 is selected.

次にステップR103において特定処理部18は、取得部10によって取得された電子メロディはスペクトルパターンE1に対応する電子メロディであると特定する。 Next, in step R103, the specific processing unit 18 identifies that the electronic melody acquired by the acquisition unit 10 is an electronic melody corresponding to the spectrum pattern E1.

ステップR101における判定の結果、均等配分である場合は、次にステップR104において類似度算出部17は、均等グループG2を探索することにより、均等グループG2に属する各スペクトルパターンSP03とスペクトルパターンSP02Aとの類似度を順に算出する。そして、特定処理部18は、均等グループG2に属する全てのスペクトルパターンSP03のうち、スペクトルパターンSP02Aとの類似度が最大となる一つのスペクトルパターンSP03を選出する。ここでは、スペクトルパターンE2が選出されたものとする。 If the result of the determination in step R101 is even distribution, then in step R104, the similarity calculation unit 17 searches for the equality group G2 to obtain the spectral patterns SP03 and the spectral patterns SP02A belonging to the equality group G2. Calculate the degree of similarity in order. Then, the specific processing unit 18 selects one spectrum pattern SP03 having the maximum similarity with the spectrum pattern SP02A from all the spectrum patterns SP03 belonging to the equality group G2. Here, it is assumed that the spectrum pattern E2 is selected.

次にステップR105において特定処理部18は、取得部10によって取得された電子メロディはスペクトルパターンE2に対応する電子メロディであると特定する。 Next, in step R105, the specific processing unit 18 identifies that the electronic melody acquired by the acquisition unit 10 is an electronic melody corresponding to the spectrum pattern E2.

図14は、類似度算出部17及び特定処理部18の処理フローに関する第2の例を示すフローチャートである。 FIG. 14 is a flowchart showing a second example regarding the processing flow of the similarity calculation unit 17 and the specific processing unit 18.

まずステップR201において類似度算出部17は、パターン生成部16から入力されたスペクトルパターンSP02Aが非均等配分であるか否かを判定する。 First, in step R201, the similarity calculation unit 17 determines whether or not the spectrum pattern SP02A input from the pattern generation unit 16 has a non-uniform distribution.

非均等配分である場合は、次にステップR202において類似度算出部17は、非均等グループG1を探索することにより、非均等グループG1に属する各スペクトルパターンSP03とスペクトルパターンSP02Aとの類似度を順に算出する。そして、特定処理部18は、非均等グループG1に属する全てのスペクトルパターンSP03のうち、スペクトルパターンSP02Aとの類似度が最大となる一つのスペクトルパターンSP03を選出する。ここでは、スペクトルパターンE1が選出されたものとする。 In the case of non-uniform distribution, the similarity calculation unit 17 then searches for the non-uniform group G1 in step R202 to sequentially determine the similarity between each spectrum pattern SP03 and the spectrum pattern SP02A belonging to the non-uniform group G1. calculate. Then, the specific processing unit 18 selects one spectrum pattern SP03 having the maximum similarity with the spectrum pattern SP02A from all the spectrum patterns SP03 belonging to the non-uniform group G1. Here, it is assumed that the spectrum pattern E1 is selected.

次にステップR203において特定処理部18は、スペクトルパターンE1とスペクトルパターンSP02Aとの類似度e1が所定のしきい値V2以上であるか否かを判定する。 Next, in step R203, the specific processing unit 18 determines whether or not the similarity e1 between the spectrum pattern E1 and the spectrum pattern SP02A is equal to or higher than the predetermined threshold value V2.

類似度e1がしきい値V2以上である場合は、次にステップR204において特定処理部18は、取得部10によって取得された電子メロディはスペクトルパターンE1に対応する電子メロディであると特定する。 When the similarity e1 is equal to or higher than the threshold value V2, then in step R204, the specific processing unit 18 identifies that the electronic melody acquired by the acquisition unit 10 is an electronic melody corresponding to the spectrum pattern E1.

ステップR203における判定の結果、類似度e1がしきい値V2未満である場合は、次にステップR205において類似度算出部17は、均等グループG2を探索することにより、均等グループG2に属する各スペクトルパターンSP03とスペクトルパターンSP02Aとの類似度を順に算出する。そして、特定処理部18は、均等グループG2に属する全てのスペクトルパターンSP03のうち、スペクトルパターンSP02Aとの類似度が最大となる一つのスペクトルパターンSP03を選出する。ここでは、スペクトルパターンE2が選出されたものとする。 If the similarity e1 is less than the threshold value V2 as a result of the determination in step R203, then in step R205, the similarity calculation unit 17 searches for the equality group G2 to search for each spectral pattern belonging to the equality group G2. The degree of similarity between SP03 and the spectral pattern SP02A is calculated in order. Then, the specific processing unit 18 selects one spectrum pattern SP03 having the maximum similarity with the spectrum pattern SP02A from all the spectrum patterns SP03 belonging to the equality group G2. Here, it is assumed that the spectrum pattern E2 is selected.

次にステップR206において特定処理部18は、スペクトルパターンE2とスペクトルパターンSP02Aとの類似度e2が類似度e1を超えるか否かを判定する。 Next, in step R206, the specific processing unit 18 determines whether or not the similarity e2 between the spectrum pattern E2 and the spectrum pattern SP02A exceeds the similarity e1.

類似度e2が類似度e1を超える場合は、次にステップR207において特定処理部18は、取得部10によって取得された電子メロディはスペクトルパターンE2に対応する電子メロディであると特定する。一方、類似度e2が類似度e1以下である場合は、次にステップR208において特定処理部18は、取得部10によって取得された電子メロディはスペクトルパターンE1に対応する電子メロディであると特定する。 If the similarity e2 exceeds the similarity e1, then in step R207, the specific processing unit 18 identifies that the electronic melody acquired by the acquisition unit 10 is an electronic melody corresponding to the spectrum pattern E2. On the other hand, when the similarity e2 is equal to or less than the similarity e1, then in step R208, the specific processing unit 18 identifies that the electronic melody acquired by the acquisition unit 10 is an electronic melody corresponding to the spectrum pattern E1.

ステップR201における判定の結果、均等配分である場合は、次にステップR209において類似度算出部17は、均等グループG2を探索することにより、均等グループG2に属する各スペクトルパターンSP03とスペクトルパターンSP02Aとの類似度を順に算出する。そして、特定処理部18は、均等グループG2に属する全てのスペクトルパターンSP03のうち、スペクトルパターンSP02Aとの類似度が最大となる一つのスペクトルパターンSP03を選出する。ここでは、スペクトルパターンE3が選出されたものとする。 If the result of the determination in step R201 is even distribution, then in step R209, the similarity calculation unit 17 searches for the equality group G2 to obtain the spectral patterns SP03 and the spectral patterns SP02A belonging to the equality group G2. Calculate the degree of similarity in order. Then, the specific processing unit 18 selects one spectrum pattern SP03 having the maximum similarity with the spectrum pattern SP02A from all the spectrum patterns SP03 belonging to the equality group G2. Here, it is assumed that the spectrum pattern E3 is selected.

次にステップR210において特定処理部18は、スペクトルパターンE3とスペクトルパターンSP02Aとの類似度e3が所定のしきい値V2以上であるか否かを判定する。 Next, in step R210, the specific processing unit 18 determines whether or not the similarity e3 between the spectrum pattern E3 and the spectrum pattern SP02A is equal to or higher than the predetermined threshold value V2.

類似度e3がしきい値V2以上である場合は、次にステップR211において特定処理部18は、取得部10によって取得された電子メロディはスペクトルパターンE3に対応する電子メロディであると特定する。 When the similarity e3 is equal to or higher than the threshold value V2, the specific processing unit 18 next in step R211 identifies that the electronic melody acquired by the acquisition unit 10 is an electronic melody corresponding to the spectrum pattern E3.

ステップR210における判定の結果、類似度e3がしきい値V2未満である場合は、次にステップR212において類似度算出部17は、非均等グループG1を探索することにより、非均等グループG1に属する各スペクトルパターンSP03とスペクトルパターンSP02Aとの類似度を順に算出する。そして、特定処理部18は、非均等グループG1に属する全てのスペクトルパターンSP03のうち、スペクトルパターンSP02Aとの類似度が最大となる一つのスペクトルパターンSP03を選出する。ここでは、スペクトルパターンE4が選出されたものとする。 If the similarity e3 is less than the threshold value V2 as a result of the determination in step R210, then in step R212, the similarity calculation unit 17 searches for the non-uniform group G1 to belong to each non-uniform group G1. The degree of similarity between the spectrum pattern SP03 and the spectrum pattern SP02A is calculated in order. Then, the specific processing unit 18 selects one spectrum pattern SP03 having the maximum similarity with the spectrum pattern SP02A from all the spectrum patterns SP03 belonging to the non-uniform group G1. Here, it is assumed that the spectrum pattern E4 is selected.

次にステップR213において特定処理部18は、スペクトルパターンE4とスペクトルパターンSP02Aとの類似度e4が類似度e3を超えるか否かを判定する。 Next, in step R213, the specific processing unit 18 determines whether or not the similarity e4 between the spectrum pattern E4 and the spectrum pattern SP02A exceeds the similarity e3.

類似度e4が類似度e3を超える場合は、次にステップR214において特定処理部18は、取得部10によって取得された電子メロディはスペクトルパターンE4に対応する電子メロディであると特定する。一方、類似度e4が類似度e3以下である場合は、次にステップR215において特定処理部18は、取得部10によって取得された電子メロディはスペクトルパターンE3に対応する電子メロディであると特定する。 If the similarity e4 exceeds the similarity e3, then in step R214, the specific processing unit 18 identifies that the electronic melody acquired by the acquisition unit 10 is an electronic melody corresponding to the spectrum pattern E4. On the other hand, when the similarity e4 is equal to or less than the similarity e3, the specific processing unit 18 next in step R215 identifies that the electronic melody acquired by the acquisition unit 10 is an electronic melody corresponding to the spectrum pattern E3.

本変形例に係る電子メロディ特定装置1によれば、パターン生成部16は、スペクトルパターンSP02Aにおける周波数成分の分布に基づいて、各セグメントに包含されるフレームの個数を非均等に配分可能である。セグメントに包含されるフレームの個数に応じて解像度を調整できるため、重要な箇所の解像度を上げ、重要でない箇所の解像度を下げるような配分を行うことにより、処理負荷の増大を回避しつつ電子メロディの特定精度を向上することが可能となる。 According to the electronic melody specifying device 1 according to the present modification, the pattern generation unit 16 can non-uniformly distribute the number of frames included in each segment based on the distribution of the frequency components in the spectrum pattern SP02A. Since the resolution can be adjusted according to the number of frames included in the segment, the electronic melody is distributed so as to increase the resolution of important parts and decrease the resolution of non-important parts while avoiding an increase in processing load. It is possible to improve the specific accuracy of.

また、本変形例に係る電子メロディ特定装置1によれば、パターン生成部16は、比較的多数の周波数成分を含む周波数スペクトルYに対応するセグメントに対しては比較的少数のフレームを配分し、比較的少数の周波数成分を含む周波数スペクトルYに対応するセグメントに対しては比較的多数のフレームを配分する。比較的多数の周波数成分を含む周波数スペクトルYは、電子メロディを特定するために重要な箇所であるため、そのような周波数スペクトルYに対応するセグメントに対しては比較的少数のフレームを配分することにより、解像度を上げることができ、その結果、電子メロディの特定精度を向上することが可能となる。一方、比較的少数の周波数成分を含む周波数スペクトルYは、電子メロディを特定するために重要でない箇所であるため、そのような周波数スペクトルYに対応するセグメントに対しては比較的多数のフレームを配分することにより、処理負荷の増大を回避することが可能となる。 Further, according to the electronic melody specifying device 1 according to the present modification, the pattern generation unit 16 allocates a relatively small number of frames to the segment corresponding to the frequency spectrum Y including a relatively large number of frequency components. A relatively large number of frames are allocated to the segment corresponding to the frequency spectrum Y containing a relatively small number of frequency components. Since the frequency spectrum Y containing a relatively large number of frequency components is an important part for identifying an electronic melody, a relatively small number of frames should be allocated to the segments corresponding to such a frequency spectrum Y. As a result, the resolution can be increased, and as a result, the accuracy of specifying the electronic melody can be improved. On the other hand, since the frequency spectrum Y containing a relatively small number of frequency components is not important for identifying the electronic melody, a relatively large number of frames are allocated to the segments corresponding to such a frequency spectrum Y. By doing so, it becomes possible to avoid an increase in the processing load.

また、本変形例に係る電子メロディ特定装置1によれば、類似度算出部17は、各セグメントに包含されるフレームの個数が非均等に配分されているスペクトルパターンSP02Aに関しては、非均等グループG1(第1グループ)のスペクトルパターンSP03との類似度を算出し、一方、各セグメントに包含されるフレームの個数が均等に配分されているスペクトルパターンSP02Aに関しては、均等グループG2(第2グループ)のスペクトルパターンSP03との類似度を算出する。このように、スペクトルパターンSP03を予め非均等グループG1と均等グループG2とに分類しておき、スペクトルパターンSP02Aの種別に応じて比較対象のスペクトルパターンSP03を選別することにより、電子メロディの特定精度の低下を抑制しつつ、処理負荷の軽減及び所要時間の短縮化を図ることが可能となる。 Further, according to the electronic melody specifying device 1 according to the present modification, the similarity calculation unit 17 has a non-uniform group G1 with respect to the spectrum pattern SP02A in which the number of frames included in each segment is non-uniformly distributed. The similarity with the spectrum pattern SP03 of (first group) is calculated, while the spectrum pattern SP02A in which the number of frames included in each segment is evenly distributed is the same group G2 (second group). The degree of similarity with the spectrum pattern SP03 is calculated. In this way, the spectrum pattern SP03 is classified into the non-uniform group G1 and the uniform group G2 in advance, and the spectrum pattern SP03 to be compared is selected according to the type of the spectrum pattern SP02A. It is possible to reduce the processing load and the required time while suppressing the decrease.

また、本変形例に係る電子メロディ特定装置1によれば、類似度算出部17は、各セグメントに包含されるフレームの個数が非均等に配分されているスペクトルパターンSP02Aに関して、非均等グループG1のスペクトルパターンSP03との類似度がしきい値V2未満である場合には、さらに、当該スペクトルパターンSP02Aと均等グループG2のスペクトルパターンSP03との類似度を算出する。また、類似度算出部17は、各セグメントに包含されるフレームの個数が均等に配分されているスペクトルパターンSP02Aに関して、均等グループG2のスペクトルパターンSP03との類似度がしきい値V2未満である場合には、さらに、当該スペクトルパターンSP02Aと非均等グループG1のスペクトルパターンSP03との類似度を算出する。このように、非均等グループG1及び均等グループG2の一方のグループのスペクトルパターンSP03との類似度がしきい値V2未満である場合には、他方のグループのスペクトルパターンSP03との類似度を算出することにより、類似度がしきい値V2以上のスペクトルパターンSP03が発見される可能性があるため、電子メロディの特定精度を向上することが可能となる。 Further, according to the electronic melody specifying device 1 according to the present modification, the similarity calculation unit 17 is in the non-uniform group G1 with respect to the spectrum pattern SP02A in which the number of frames included in each segment is non-uniformly distributed. When the similarity with the spectrum pattern SP03 is less than the threshold value V2, the similarity between the spectrum pattern SP02A and the spectrum pattern SP03 of the equal group G2 is further calculated. Further, the similarity calculation unit 17 determines that the similarity with the spectrum pattern SP03 of the equality group G2 is less than the threshold value V2 with respect to the spectrum pattern SP02A in which the number of frames included in each segment is evenly distributed. Further, the similarity between the spectrum pattern SP02A and the spectrum pattern SP03 of the non-uniform group G1 is calculated. As described above, when the similarity with the spectrum pattern SP03 of one group of the non-uniform group G1 and the equal group G2 is less than the threshold value V2, the similarity with the spectrum pattern SP03 of the other group is calculated. As a result, the spectrum pattern SP03 whose similarity is equal to or higher than the threshold value V2 may be discovered, so that the accuracy of specifying the electronic melody can be improved.

なお、以上の説明では計算量の増大を回避すべくセグメント数が固定値であることを前提として、各セグメントに包含されるフレーム数を配分する例について述べたが、計算量の増大が許容できる場合には、重要箇所に対応するセグメントを複数のセグメントに分割する(セグメント数は増える)ことによって、電子メロディの特定精度を向上することができる。 In the above description, an example of allocating the number of frames included in each segment is described on the premise that the number of segments is a fixed value in order to avoid an increase in the amount of calculation, but an increase in the amount of calculation is acceptable. In that case, the accuracy of specifying the electronic melody can be improved by dividing the segment corresponding to the important part into a plurality of segments (the number of segments increases).

<変形例2(位置ずれ対策1)>
ユーザによる手動の録音操作によって取得部10が電子メロディの時系列信号I0を取得する場合には、録音操作の開始タイミング及び終了タイミングのずれに起因して、スペクトルパターンSP02AとスペクトルパターンSP03とで対応セグメントの位置ずれが生じ得る。以下の変形例2~7では、セグメントの位置ずれが生じている場合であっても、その位置ずれに起因する影響を低減するための対策について説明する。
<Transformation example 2 (positional deviation countermeasure 1)>
When the acquisition unit 10 acquires the time-series signal I0 of the electronic melody by a manual recording operation by the user, the spectrum pattern SP02A and the spectrum pattern SP03 correspond to each other due to the difference between the start timing and the end timing of the recording operation. Segment misalignment can occur. In the following modification examples 2 to 7, even when the misalignment of the segment occurs, measures for reducing the influence caused by the misalignment will be described.

図15は、対応セグメントの位置ずれ対策についての第1の例を説明するための図である。まず類似度算出部17は、スペクトルパターンSP01に基づいて生成されたスペクトルパターンSP02Aを基準スペクトルパターンとして、上記実施の形態と同様に、スペクトルパターンSP03と基準スペクトルパターンSP02Aとの類似度を算出する。 FIG. 15 is a diagram for explaining a first example of measures against misalignment of corresponding segments. First, the similarity calculation unit 17 calculates the similarity between the spectrum pattern SP03 and the reference spectrum pattern SP02A, using the spectrum pattern SP02A generated based on the spectrum pattern SP01 as the reference spectrum pattern, as in the above embodiment.

次に類似度算出部17は、基準スペクトルパターンSP02Aを1セグメントだけ前方に循環シフト(前方に溢れたセグメントは末尾に循環)することにより、擬似スペクトルパターンSP02B1を規定する。そして、スペクトルパターンSP03と擬似スペクトルパターンSP02B1との類似度を算出する。 Next, the similarity calculation unit 17 defines the pseudo-spectral pattern SP02B1 by cyclically shifting the reference spectrum pattern SP02A forward by one segment (the segment overflowing forward is circulated at the end). Then, the degree of similarity between the spectrum pattern SP03 and the pseudo-spectral pattern SP02B1 is calculated.

次に類似度算出部17は、擬似スペクトルパターンSP02B1を1セグメントだけ前方に循環シフトすることにより、擬似スペクトルパターンSP02B2を規定する。そして、スペクトルパターンSP03と擬似スペクトルパターンSP02B2との類似度を算出する。 Next, the similarity calculation unit 17 defines the pseudo-spectral pattern SP02B2 by cyclically shifting the pseudo-spectral pattern SP02B1 forward by one segment. Then, the degree of similarity between the spectrum pattern SP03 and the pseudo-spectral pattern SP02B2 is calculated.

以降同様に類似度算出部17は、1セグメントずつ前方に循環シフトすることにより、擬似スペクトルパターンSP02B3~SP02B5を順に規定し、スペクトルパターンSP03と擬似スペクトルパターンSP02B3~SP02B5との類似度を順に算出する。 Hereinafter, similarly, the similarity calculation unit 17 defines the pseudo-spectral patterns SP02B3 to SP02B5 in order by cyclically shifting forward one segment at a time, and calculates the similarity between the spectrum pattern SP03 and the pseudo-spectral patterns SP02B3 to SP02B5 in order. ..

そして、このようにして算出した合計N個(この例では6個)の類似度のうちの最大の類似度を、スペクトルパターンSP03とスペクトルパターンSP02Aとの類似度として決定する。 Then, the maximum similarity among the total N (6 in this example) similarity calculated in this way is determined as the similarity between the spectrum pattern SP03 and the spectrum pattern SP02A.

本変形例に係る電子メロディ特定装置1によれば、類似度算出部17は、基準スペクトルパターンSP02Aと、基準スペクトルパターンSP02Aに含まれるN個のセグメントS01~S06の配列順序を循環シフトさせることによって得られる(N-1)個の擬似スペクトルパターンSP02B1~SP02B5と、の各々に関して、スペクトルパターンSP03との類似度を算出する。基準スペクトルパターンSP02Aに加えて、全区間に亘って1セグメントずつ循環シフトさせた(N-1)個の擬似スペクトルパターンSP02B1~SP02B5が規定されるため、セグメントの位置ずれが大きい場合であっても、スペクトルパターンSP02AとスペクトルパターンSP03との類似度を適切に算出することが可能となる。 According to the electronic melody specifying device 1 according to this modification, the similarity calculation unit 17 cyclically shifts the arrangement order of the reference spectrum pattern SP02A and the N segments S01 to S06 included in the reference spectrum pattern SP02A. For each of the obtained (N-1) pseudo-spectral patterns SP02B1 to SP02B5, the degree of similarity with the spectrum pattern SP03 is calculated. In addition to the reference spectrum pattern SP02A, (N-1) pseudo-spectral patterns SP02B1 to SP02B5 that are cyclically shifted by one segment over the entire section are defined, so that even if the segment misalignment is large. , The degree of similarity between the spectrum pattern SP02A and the spectrum pattern SP03 can be appropriately calculated.

<変形例3(位置ずれ対策2)>
図16は、対応セグメントの位置ずれ対策についての第2の例を説明するための図である。まず類似度算出部17は、スペクトルパターンSP01に基づいて生成されたスペクトルパターンSP02Aを基準スペクトルパターンとして、上記実施の形態と同様に、スペクトルパターンSP03と基準スペクトルパターンSP02Aとの類似度を算出する。
<Transformation example 3 (positional deviation countermeasure 2)>
FIG. 16 is a diagram for explaining a second example of measures against misalignment of the corresponding segment. First, the similarity calculation unit 17 calculates the similarity between the spectrum pattern SP03 and the reference spectrum pattern SP02A, using the spectrum pattern SP02A generated based on the spectrum pattern SP01 as the reference spectrum pattern, as in the above embodiment.

次に類似度算出部17は、基準スペクトルパターンSP02Aを1セグメントだけ前方に循環シフトすることにより、擬似スペクトルパターンSP02C1を規定する。そして、スペクトルパターンSP03と擬似スペクトルパターンSP02C1との類似度を算出する。 Next, the similarity calculation unit 17 defines the pseudo-spectral pattern SP02C1 by cyclically shifting the reference spectrum pattern SP02A forward by one segment. Then, the degree of similarity between the spectrum pattern SP03 and the pseudo-spectral pattern SP02C1 is calculated.

次に類似度算出部17は、基準スペクトルパターンSP02Aを1セグメントだけ後方に循環シフトすることにより、擬似スペクトルパターンSP02C2を規定する。そして、スペクトルパターンSP03と擬似スペクトルパターンSP02C2との類似度を算出する。 Next, the similarity calculation unit 17 defines the pseudo-spectral pattern SP02C2 by cyclically shifting the reference spectrum pattern SP02A backward by one segment. Then, the degree of similarity between the spectrum pattern SP03 and the pseudo-spectral pattern SP02C2 is calculated.

そして、このようにして算出した合計3個の類似度のうちの最大の類似度を、スペクトルパターンSP03とスペクトルパターンSP02Aとの類似度として決定する。 Then, the maximum similarity among the total of three similarity calculated in this way is determined as the similarity between the spectrum pattern SP03 and the spectrum pattern SP02A.

本変形例に係る電子メロディ特定装置1によれば、類似度算出部17は、基準スペクトルパターンSP02Aと、基準スペクトルパターンSP02Aに含まれるN個のセグメントS01~S06の配列順序を前後方向に1セグメントずつ循環シフトさせることによって得られる2個の擬似スペクトルパターンSP02C1,SP02C2と、の各々に関して、スペクトルパターンSP03との類似度を算出する。基準スペクトルパターンSP02Aに加えて、前後方向に1セグメントずつ循環シフトさせた2個の擬似スペクトルパターンSP02C1,SP02C2が規定されるため、全区間の循環シフト(図15)と比較して処理負荷の増大を抑制しつつ、スペクトルパターンSP02AとスペクトルパターンSP03との類似度を適切に算出することが可能となる。 According to the electronic melody specifying device 1 according to this modification, the similarity calculation unit 17 arranges the reference spectrum pattern SP02A and the N segments S01 to S06 included in the reference spectrum pattern SP02A in the front-back direction by one segment. For each of the two pseudo-spectral patterns SP02C1 and SP02C2 obtained by cyclically shifting, the degree of similarity with the spectral pattern SP03 is calculated. In addition to the reference spectrum pattern SP02A, two pseudo-spectral patterns SP02C1 and SP02C2 that are cyclically shifted one segment at a time in the front-back direction are defined, so that the processing load is increased as compared with the circulation shift of all sections (FIG. 15). It is possible to appropriately calculate the degree of similarity between the spectrum pattern SP02A and the spectrum pattern SP03 while suppressing the above.

<変形例4(位置ずれ対策3)>
図17は、対応セグメントの位置ずれ対策についての第3の例を説明するための図である。まず類似度算出部17は、スペクトルパターンSP01に基づいて生成されたスペクトルパターンSP02Aに含まれるN個のセグメントS01~S06のうち、時系列順で先頭部分及び末尾部分のセグメントS01,S06を除外することによって、(N-2)個のセグメントS02~S05を含む擬似スペクトルパターンを規定する。
<Transformation example 4 (positional deviation countermeasure 3)>
FIG. 17 is a diagram for explaining a third example of measures against misalignment of the corresponding segment. First, the similarity calculation unit 17 excludes the first and last segments S01 and S06 from the N segments S01 to S06 included in the spectrum pattern SP02A generated based on the spectrum pattern SP01 in chronological order. Thereby, a pseudo-spectral pattern including (N-2) segments S02 to S05 is defined.

次に類似度算出部17は、当該擬似スペクトルパターンをスペクトルパターンSP03の先頭から順に1セグメントずつ後方シフトさせることによって得られる3個の擬似スペクトルパターンSP02D1~SP02D3の各々に関して、スペクトルパターンSP03との類似度を順に算出する。 Next, the similarity calculation unit 17 is similar to the spectrum pattern SP03 with respect to each of the three pseudo-spectral patterns SP02D1 to SP02D3 obtained by shifting the pseudo-spectral pattern backward by one segment in order from the beginning of the spectrum pattern SP03. Calculate the degrees in order.

そして、このようにして算出した合計3個の類似度のうちの最大の類似度を、スペクトルパターンSP03とスペクトルパターンSP02Aとの類似度として決定する。 Then, the maximum similarity among the total of three similarity calculated in this way is determined as the similarity between the spectrum pattern SP03 and the spectrum pattern SP02A.

本変形例に係る電子メロディ特定装置1によれば、類似度算出部17は、スペクトルパターンSP02Aに含まれるN個のセグメントS01~S06のうち時系列順で先頭部分及び末尾部分のセグメントS01,S06を除外することによって、(N-2)個のセグメントS02~S05を含む擬似スペクトルパターンを規定する。そして、当該擬似スペクトルパターンをスペクトルパターンSP03の先頭から順に1セグメントずつ後方シフトさせることによって得られる3個の擬似スペクトルパターンSP02D1~SP02D3の各々に関して、スペクトルパターンSP03との類似度を算出する。スペクトルパターンSP02Aに含まれるN個のセグメントS01~S06のうち時系列順で先頭部分及び末尾部分のセグメントS01,S06を除外することによって擬似スペクトルパターンが規定されるため、全区間の循環シフト(図15)と比較して処理負荷の増大を抑制しつつ、ユーザによる録音操作のタイミングずれが最も反映されやすい先頭部分及び末尾部分のセグメントS01,S06の影響を排除することが可能となる。 According to the electronic melody specifying device 1 according to this modification, the similarity calculation unit 17 has the first and last segments S01 and S06 of the N segments S01 to S06 included in the spectrum pattern SP02A in chronological order. By excluding (N-2), a pseudo-spectral pattern including (N-2) segments S02 to S05 is defined. Then, the similarity with the spectrum pattern SP03 is calculated for each of the three pseudo spectrum patterns SP02D1 to SP02D3 obtained by shifting the pseudo-spectral pattern backward by one segment in order from the beginning of the spectrum pattern SP03. Since the pseudo-spectral pattern is defined by excluding the first and last segments S01 and S06 in chronological order from the N segments S01 to S06 included in the spectrum pattern SP02A, the cyclic shift of the entire section (Fig.) Compared with 15), it is possible to suppress the increase in the processing load and eliminate the influence of the segments S01 and S06 at the beginning and the end where the timing deviation of the recording operation by the user is most likely to be reflected.

<変形例5(位置ずれ対策4)>
図18は、対応セグメントの位置ずれ対策についての第4の例を説明するための図である。まず類似度算出部17は、スペクトルパターンSP01に基づいて生成されたスペクトルパターンSP02Aを基準スペクトルパターンとして、上記実施の形態と同様に、スペクトルパターンSP03と基準スペクトルパターンSP02Aとの類似度を算出する。
<Deformation example 5 (positional deviation countermeasure 4)>
FIG. 18 is a diagram for explaining a fourth example of measures against misalignment of the corresponding segment. First, the similarity calculation unit 17 calculates the similarity between the spectrum pattern SP03 and the reference spectrum pattern SP02A, using the spectrum pattern SP02A generated based on the spectrum pattern SP01 as the reference spectrum pattern, as in the above embodiment.

次に類似度算出部17は、基準スペクトルパターンSP02Aを1セグメントだけ前方にシフトアウト(前方に溢れたセグメントは削除)することにより、擬似スペクトルパターンSP02E1を規定する。そして、スペクトルパターンSP03と擬似スペクトルパターンSP02E1との類似度を算出する。 Next, the similarity calculation unit 17 defines the pseudo-spectral pattern SP02E1 by shifting out the reference spectrum pattern SP02A forward by one segment (the segment overflowing forward is deleted). Then, the degree of similarity between the spectrum pattern SP03 and the pseudo-spectral pattern SP02E1 is calculated.

次に類似度算出部17は、擬似スペクトルパターンSP02E1を1セグメントだけ前方にシフトアウトすることにより、擬似スペクトルパターンSP02E2を規定する。そして、スペクトルパターンSP03と擬似スペクトルパターンSP02E2との類似度を算出する。 Next, the similarity calculation unit 17 defines the pseudo-spectral pattern SP02E2 by shifting out the pseudo-spectral pattern SP02E1 forward by one segment. Then, the degree of similarity between the spectrum pattern SP03 and the pseudo-spectral pattern SP02E2 is calculated.

以降同様に類似度算出部17は、1セグメントずつ前方にシフトアウトすることにより、擬似スペクトルパターンSP02E3~SP02E5を順に規定し、スペクトルパターンSP03と擬似スペクトルパターンSP02E3~SP02E5との類似度を順に算出する。 Hereinafter, similarly, the similarity calculation unit 17 defines the pseudo-spectral patterns SP02E3 to SP02E5 in order by shifting out one segment at a time, and calculates the similarity between the spectrum pattern SP03 and the pseudo-spectral patterns SP02E3 to SP02E5 in order. ..

次に類似度算出部17は、基準スペクトルパターンSP02Aを1セグメントだけ後方にシフトアウト(後方に溢れたセグメントは削除)することにより、擬似スペクトルパターンSP02E6を規定する。そして、スペクトルパターンSP03と擬似スペクトルパターンSP02E6との類似度を算出する。 Next, the similarity calculation unit 17 defines the pseudo-spectral pattern SP02E6 by shifting out the reference spectrum pattern SP02A by one segment to the rear (the segment overflowing to the rear is deleted). Then, the degree of similarity between the spectrum pattern SP03 and the pseudo-spectral pattern SP02E6 is calculated.

次に類似度算出部17は、擬似スペクトルパターンSP02E6を1セグメントだけ後方にシフトアウトすることにより、擬似スペクトルパターンSP02E7を規定する。そして、スペクトルパターンSP03と擬似スペクトルパターンSP02E7との類似度を算出する。 Next, the similarity calculation unit 17 defines the pseudo-spectral pattern SP02E7 by shifting out the pseudo-spectral pattern SP02E6 by one segment backward. Then, the degree of similarity between the spectrum pattern SP03 and the pseudo-spectral pattern SP02E7 is calculated.

以降同様に類似度算出部17は、1セグメントずつ後方にシフトアウトすることにより、擬似スペクトルパターンSP02E8~SP02E10を順に規定し、スペクトルパターンSP03と擬似スペクトルパターンSP02E8~SP02E10との類似度を順に算出する。 Hereinafter, similarly, the similarity calculation unit 17 defines the pseudo-spectral patterns SP02E8 to SP02E10 in order by shifting out one segment at a time, and calculates the similarity between the spectrum pattern SP03 and the pseudo-spectral patterns SP02E8 to SP02E10 in order. ..

そして、このようにして算出した合計2N-1個(この例では11個)の類似度のうちの最大の類似度を、スペクトルパターンSP03とスペクトルパターンSP02Aとの類似度として決定する。 Then, the maximum similarity among the total 2N-1 similarity calculated in this way (11 in this example) is determined as the similarity between the spectrum pattern SP03 and the spectrum pattern SP02A.

<変形例6(位置ずれ対策5)>
図19は、対応セグメントの位置ずれ対策についての第5の例を説明するための図である。上記実施の形態で説明したように、類似度算出部17は、スペクトルパターンSP03とスペクトルパターンSP02Aとの類似度を算出するために、まず、スペクトルパターンSP03,SP02A間で対応するセグメントS01~S06毎に類似度K01~K06を算出する。次に、セグメントS01~S06毎に求めたN個の類似度K01~K06の代表値を、スペクトルパターンSP03とスペクトルパターンSP02Aとの類似度として算出する。
<Deformation example 6 (positional deviation countermeasure 5)>
FIG. 19 is a diagram for explaining a fifth example of measures against misalignment of the corresponding segment. As described in the above embodiment, in order to calculate the similarity between the spectrum pattern SP03 and the spectrum pattern SP02A, the similarity calculation unit 17 first, first, for each of the corresponding segments S01 to S06 between the spectrum patterns SP03 and SP02A. The similarity degrees K01 to K06 are calculated. Next, the representative values of the N similarity degrees K01 to K06 obtained for each of the segments S01 to S06 are calculated as the degree of similarity between the spectrum pattern SP03 and the spectrum pattern SP02A.

その際、本変形例に係る類似度算出部17は、N個のセグメントS01~S06のうち、時系列順で先頭部分及び末尾部分のセグメントS01,S06に関しては、算出した類似度K01,K06に1未満の重み係数W(例えば0.5)をそれぞれ乗算する。従って、代表値として平均値を用いる場合には、スペクトルパターンSP03とスペクトルパターンSP02Aとの類似度は、(W×K01+K02+K03+K04+K05+W×K06)/6となる。 At that time, the similarity calculation unit 17 according to this modification sets the calculated similarity K01 and K06 for the first and last segments S01 and S06 in chronological order among the N segments S01 to S06. Multiply each weight factor W (eg 0.5) less than 1. Therefore, when the average value is used as the representative value, the similarity between the spectrum pattern SP03 and the spectrum pattern SP02A is (W × K01 + K02 + K03 + K04 + K05 + W × K06) / 6.

本変形例に係る電子メロディ特定装置1によれば、類似度算出部17は、スペクトルパターンSP02Aに含まれるN個のセグメントS01~S06のうち、時系列順で先頭部分及び末尾部分のセグメントS01,S06に関しては、算出した類似度K01,K06に1未満の重み係数Wを乗算する。従って、ユーザによる録音操作のタイミングずれが最も反映されやすい先頭部分及び末尾部分のセグメントS01,S06の影響を低減することが可能となる。 According to the electronic melody specifying device 1 according to this modification, the similarity calculation unit 17 has the first and last segments S01 in chronological order among the N segments S01 to S06 included in the spectrum pattern SP02A. For S06, the calculated similarity K01 and K06 are multiplied by a weighting coefficient W less than 1. Therefore, it is possible to reduce the influence of the segments S01 and S06 at the beginning and the end where the timing deviation of the recording operation by the user is most likely to be reflected.

<変形例7(位置ずれ対策6)>
図20は、対応セグメントの位置ずれ対策についての第6の例を説明するための図である。上記実施の形態では、図4に示したように各セグメントS01~S06にフレームF01~F78を均等配分したが、本変形例に係るパターン生成部16は、スペクトルパターンSP02Aに含まれるN個のセグメントS01~S06のうち、時系列順で先頭部分及び末尾部分のセグメントS01,S06に関しては、中央部分のセグメントS02~S05に配分されるフレームの個数よりも少数のフレームを配分する。図20に示した例では、先頭部分及び末尾部分のセグメントS01,S06に関してはそれぞれ9個のフレームが配分され、中央部分のセグメントS02~S05に関してはそれぞれ15個のフレームが配分されている。
<Deformation example 7 (positional deviation countermeasure 6)>
FIG. 20 is a diagram for explaining a sixth example of measures against misalignment of the corresponding segment. In the above embodiment, the frames F01 to F78 are evenly distributed to the segments S01 to S06 as shown in FIG. 4, but the pattern generation unit 16 according to this modification is the N segments included in the spectrum pattern SP02A. Of S01 to S06, with respect to the head portion and end portion segments S01 and S06 in chronological order, a smaller number of frames are allocated than the number of frames allocated to the central portion segments S02 to S05. In the example shown in FIG. 20, 9 frames are allocated to each of the head portion and the tail portion segments S01 and S06, and 15 frames are allocated to each of the central portion segments S02 to S05.

本変形例に係る電子メロディ特定装置1によれば、パターン生成部16は、スペクトルパターンSP02Aに含まれるN個のセグメントS01~S06のうち、時系列順で先頭部分及び末尾部分のセグメントS01,S06に関しては、中央部分のセグメントS02~S05に配分されるフレームの個数よりも少数のフレームを配分する。従って、ユーザによる録音操作のタイミングずれが最も反映されやすい先頭部分及び末尾部分のセグメントの影響を低減することが可能となる。 According to the electronic melody specifying device 1 according to this modification, the pattern generation unit 16 has the first and last segments S01 and S06 of the N segments S01 to S06 included in the spectrum pattern SP02A in chronological order. With respect to, a smaller number of frames are allocated than the number of frames allocated to the segments S02 to S05 in the central portion. Therefore, it is possible to reduce the influence of the segment at the beginning and the end where the timing deviation of the recording operation by the user is most likely to be reflected.

1 電子メロディ特定装置
10 取得部
14 周波数解析部
16 パターン生成部
17 類似度算出部
18 特定処理部
19 記憶部
50 プログラム
1 Electronic melody identification device 10 Acquisition unit 14 Frequency analysis unit 16 Pattern generation unit 17 Similarity calculation unit 18 Specific processing unit 19 Storage unit 50 Program

Claims (16)

特定対象である電子メロディの時系列信号を取得する取得部と、
前記取得部によって取得された電子メロディの時系列信号を、所定の第1区間単位で周波数解析することにより、第1区間毎の第1周波数スペクトルが複数配列された第1スペクトルパターンを生成する、第1のパターン生成部と、
前記第1のパターン生成部によって生成された第1スペクトルパターンを、それぞれに複数の第1区間を包含するN個(Nは複数)の第2区間に分割し、各第2区間に包含される複数の第1区間に関する複数の第1周波数スペクトルを平均化することにより、第2区間毎の第2周波数スペクトルが複数配列された第2スペクトルパターンを生成する、第2のパターン生成部と、
既知の複数の電子メロディの各々に関して予め生成され、N個の第2区間に分割された、第3スペクトルパターンを記憶する記憶部と、
前記第2のパターン生成部によって生成された第2スペクトルパターンと、前記記憶部に記憶されている各第3スペクトルパターンとの類似度を算出する算出処理部と、
前記算出処理部による類似度の算出結果に基づいて、前記取得部によって取得された電子メロディを特定する特定処理部と、
を備え、
前記第2のパターン生成部は、第2スペクトルパターンにおける周波数成分の分布に基づいて、各第2区間に包含される第1区間の個数を非均等に配分可能である、電子メロディ特定装置。
An acquisition unit that acquires the time-series signal of the electronic melody that is the specific target,
By frequency-analyzing the time-series signal of the electronic melody acquired by the acquisition unit in a predetermined first section unit, a first spectrum pattern in which a plurality of first frequency spectra for each first section are arranged is generated. The first pattern generator and
The first spectrum pattern generated by the first pattern generation unit is divided into N (multiple N) second sections, each of which contains a plurality of first sections, and is included in each second section. A second pattern generation unit that generates a second spectrum pattern in which a plurality of second frequency spectra for each second section are arranged by averaging a plurality of first frequency spectra related to a plurality of first sections.
A storage unit that stores a third spectral pattern, which is generated in advance for each of a plurality of known electronic melodies and is divided into N second sections.
A calculation processing unit that calculates the degree of similarity between the second spectrum pattern generated by the second pattern generation unit and each third spectrum pattern stored in the storage unit.
Based on the calculation result of the similarity by the calculation processing unit, the specific processing unit that specifies the electronic melody acquired by the acquisition unit and the specific processing unit.
Equipped with
The second pattern generation unit is an electronic melody specifying device capable of unequally distributing the number of first sections included in each second section based on the distribution of frequency components in the second spectral pattern.
前記第2のパターン生成部は、均等配分した場合に第1の個数の周波数成分を含む第2周波数スペクトルに対応する第2区間に対しては第1の数の第1区間を配分し、均等配分した場合に第1の個数より少ない第2の個数の周波数成分を含む第2周波数スペクトルに対応する第2区間に対しては第1の数より多い第2の数の第1区間を配分する、請求項1に記載の電子メロディ特定装置。 The second pattern generation unit allocates the first section of the first number evenly to the second section corresponding to the second frequency spectrum including the first number of frequency components when evenly distributed . Allocate the first section of the second number more than the first number to the second section corresponding to the second frequency spectrum containing the second number of frequency components less than the first number when allocated. , The electronic melody specifying device according to claim 1. 前記記憶部には、N個の第2区間の各々に包含される第1区間の個数が非均等に配分された第1グループの第3スペクトルパターンと、N個の第2区間の各々に包含される第1区間の個数が均等に配分された第2グループの第3スペクトルパターンと、が記憶されており、
前記算出処理部は、
前記第2のパターン生成部によって生成された第2スペクトルパターンにおいて、各第2区間に包含される第1区間の個数が非均等に配分されている場合は、当該第2スペクトルパターンと、前記記憶部に記憶されている第1グループの第3スペクトルパターンとの類似度を算出し、
前記第2のパターン生成部によって生成された第2スペクトルパターンにおいて、各第2区間に包含される第1区間の個数が均等に配分されている場合は、当該第2スペクトルパターンと、前記記憶部に記憶されている第2グループの第3スペクトルパターンとの類似度を算出する、請求項1又は2に記載の電子メロディ特定装置。
The storage unit includes the third spectrum pattern of the first group in which the number of the first sections included in each of the N second sections is unevenly distributed, and each of the N second sections. The third spectrum pattern of the second group in which the number of the first sections to be formed is evenly distributed is stored.
The calculation processing unit
In the second spectrum pattern generated by the second pattern generation unit, when the number of the first sections included in each second section is unevenly distributed, the second spectrum pattern and the storage Calculate the similarity with the third spectral pattern of the first group stored in the unit,
In the second spectrum pattern generated by the second pattern generation unit, when the number of the first sections included in each second section is evenly distributed, the second spectrum pattern and the storage unit are used. The electronic melody specifying device according to claim 1 or 2, which calculates the degree of similarity with the third spectrum pattern of the second group stored in.
前記算出処理部は、
前記第2のパターン生成部によって生成された第2スペクトルパターンと、前記記憶部に記憶されている第1グループの第3スペクトルパターンとの類似度が、所定のしきい値未満である場合には、さらに、当該第2スペクトルパターンと、前記記憶部に記憶されている第2グループの第3スペクトルパターンとの類似度を算出し、
前記第2のパターン生成部によって生成された第2スペクトルパターンと、前記記憶部に記憶されている第2グループの第3スペクトルパターンとの類似度が、所定のしきい値未満である場合には、さらに、当該第2スペクトルパターンと、前記記憶部に記憶されている第1グループの第3スペクトルパターンとの類似度を算出する、請求項3に記載の電子メロディ特定装置。
The calculation processing unit
When the similarity between the second spectrum pattern generated by the second pattern generation unit and the third spectrum pattern of the first group stored in the storage unit is less than a predetermined threshold value. Further, the degree of similarity between the second spectrum pattern and the third spectrum pattern of the second group stored in the storage unit is calculated.
When the similarity between the second spectrum pattern generated by the second pattern generation unit and the third spectrum pattern of the second group stored in the storage unit is less than a predetermined threshold value. The electronic melody specifying device according to claim 3, further comprising calculating the degree of similarity between the second spectrum pattern and the third spectrum pattern of the first group stored in the storage unit.
前記算出処理部は、対応する第2区間毎に類似度を算出することによって得られるN個の類似度の代表値を、第2スペクトルパターンと第3スペクトルパターンとの類似度として算出する、請求項1~4のいずれか一つに記載の電子メロディ特定装置。 The calculation processing unit calculates the representative values of N similarities obtained by calculating the similarity for each corresponding second section as the similarity between the second spectrum pattern and the third spectrum pattern. Item 4. The electronic melody specifying device according to any one of Items 1 to 4. 前記代表値は平均値である、請求項5に記載の電子メロディ特定装置。 The electronic melody specifying device according to claim 5, wherein the representative value is an average value. 前記代表値は最大値である、請求項5に記載の電子メロディ特定装置。 The electronic melody specifying device according to claim 5, wherein the representative value is the maximum value. 前記算出処理部は、
第1スペクトルパターンに基づいて生成された第2スペクトルパターンである基準第2スペクトルパターンと、
基準第2スペクトルパターンに含まれるN個の第2区間の配列順序を循環シフトさせることによって得られる(N-1)個の擬似第2スペクトルパターンと、
の各々に関して、第3スペクトルパターンとの類似度を算出する、請求項5~7のいずれか一つに記載の電子メロディ特定装置。
The calculation processing unit
A reference second spectrum pattern, which is a second spectrum pattern generated based on the first spectrum pattern, and
(N-1) pseudo-second spectral patterns obtained by cyclically shifting the arrangement order of N second intervals included in the reference second spectral pattern, and
The electronic melody specifying device according to any one of claims 5 to 7, which calculates the similarity with the third spectrum pattern for each of the above.
前記算出処理部は、
第1スペクトルパターンに基づいて生成された第2スペクトルパターンである基準第2スペクトルパターンと、
基準第2スペクトルパターンに含まれるN個の第2区間の配列順序を前後方向に1区間ずつ循環シフトさせることによって得られる2個の擬似第2スペクトルパターンと、
の各々に関して、第3スペクトルパターンとの類似度を算出する、請求項5~7のいずれか一つに記載の電子メロディ特定装置。
The calculation processing unit
A reference second spectrum pattern, which is a second spectrum pattern generated based on the first spectrum pattern, and
Two pseudo second spectral patterns obtained by cyclically shifting the arrangement order of N second segments included in the reference second spectral pattern by one interval in the front-back direction, and
The electronic melody specifying device according to any one of claims 5 to 7, which calculates the similarity with the third spectrum pattern for each of the above.
前記算出処理部は、
第1スペクトルパターンに基づいて生成された第2スペクトルパターンに含まれるN個の第2区間のうち時系列順で先頭部分及び末尾部分の第2区間を除外することによって、(N-2)個の第2区間を含む擬似第2スペクトルパターンを規定し、
当該擬似第2スペクトルパターンを先頭から順に1区間ずつ後方シフトさせることによって得られる3個の擬似第2スペクトルパターンの各々に関して、第3スペクトルパターンとの類似度を算出する、請求項5~7のいずれか一つに記載の電子メロディ特定装置。
The calculation processing unit
By excluding the second section of the first part and the last part in chronological order from the N second sections included in the second spectrum pattern generated based on the first spectrum pattern, (N-2) pieces. A pseudo second spectral pattern including the second interval of
Claims 5 to 7 calculate the similarity with the third spectrum pattern for each of the three pseudo second spectrum patterns obtained by shifting the pseudo second spectrum pattern backward by one section in order from the beginning. The electronic melody specifying device described in any one of them.
前記算出処理部は、第2スペクトルパターンに含まれるN個の第2区間のうち、時系列順で先頭部分及び末尾部分の第2区間に関しては、算出した類似度に1未満の重み係数を乗算する、請求項5~7のいずれか一つに記載の電子メロディ特定装置。 The calculation processing unit multiplies the calculated similarity by a weighting coefficient of less than 1 for the second section of the head portion and the tail portion in chronological order among the N second sections included in the second spectrum pattern. The electronic melody specifying device according to any one of claims 5 to 7. 前記第1のパターン生成部は、高速フーリエ変換を用いた周波数解析によって第1周波数スペクトルを生成し、
前記第2のパターン生成部は、複数の第1周波数スペクトルを平均化して第2周波数スペクトルを生成するにあたり、高速フーリエ変換における絶対値化前の複素信号に対して平均化を行う、請求項1~11のいずれか一つに記載の電子メロディ特定装置。
The first pattern generation unit generates a first frequency spectrum by frequency analysis using a fast Fourier transform.
The second pattern generation unit averages a plurality of first frequency spectra to generate a second frequency spectrum, and averages the complex signal before the absolute value in the fast Fourier transform. The electronic melody specifying device according to any one of 11 to 11.
前記第2のパターン生成部は、複数の第1周波数スペクトルの平均化により得られる周波数スペクトルに対して、所定のしきい値を用いた量子化を行うことによって、第2周波数スペクトルを生成する、請求項1~12のいずれか一つに記載の電子メロディ特定装置。 The second pattern generation unit generates a second frequency spectrum by performing quantization using a predetermined threshold value on the frequency spectrum obtained by averaging a plurality of first frequency spectra. The electronic melody specifying device according to any one of claims 1 to 12. 前記記憶部には、第2周波数スペクトルと同様の平均化及び量子化が行われた第3スペクトルパターンが記憶されている、請求項13に記載の電子メロディ特定装置。 The electronic melody specifying device according to claim 13, wherein the storage unit stores a third spectrum pattern that has been averaged and quantized in the same manner as the second frequency spectrum. 電子メロディ特定装置に搭載されるコンピュータを、
特定対象である電子メロディの時系列信号を取得する取得手段と、
前記取得手段によって取得された電子メロディの時系列信号を、所定の第1区間単位で周波数解析することにより、第1区間毎の第1周波数スペクトルが複数配列された第1スペクトルパターンを生成する、第1のパターン生成手段と、
前記第1のパターン生成手段によって生成された第1スペクトルパターンを、それぞれに複数の第1区間を包含するN個(Nは複数)の第2区間に分割し、各第2区間に包含される複数の第1区間に関する複数の第1周波数スペクトルを平均化することにより、第2区間毎の第2周波数スペクトルが複数配列された第2スペクトルパターンを生成する、第2のパターン生成手段と、
既知の複数の電子メロディの各々に関して予め生成され、N個の第2区間に分割された、第3スペクトルパターンを記憶する記憶手段と、
前記第2のパターン生成手段によって生成された第2スペクトルパターンと、前記記憶手段に記憶されている各第3スペクトルパターンとの類似度を算出する算出処理手段と、
前記算出処理手段による類似度の算出結果に基づいて、前記取得手段によって取得された電子メロディを特定する特定処理手段と、
として機能させるためのプログラムであって、
前記第2のパターン生成手段は、第2スペクトルパターンにおける周波数成分の分布に基づいて、各第2区間に包含される第1区間の個数を非均等に配分可能である、プログラム。
The computer installed in the electronic melody identification device,
An acquisition method for acquiring a time-series signal of an electronic melody that is a specific target,
By frequency-analyzing the time-series signal of the electronic melody acquired by the acquisition means in a predetermined first section unit, a first spectrum pattern in which a plurality of first frequency spectra for each first section are arranged is generated. The first pattern generation means and
The first spectrum pattern generated by the first pattern generation means is divided into N (multiple N) second sections, each of which contains a plurality of first sections, and is included in each second section. A second pattern generation means for generating a second spectrum pattern in which a plurality of second frequency spectra for each second section are arranged by averaging a plurality of first frequency spectra for a plurality of first sections.
A storage means for storing a third spectral pattern, which is pregenerated for each of a plurality of known electronic melodies and divided into N second sections.
A calculation processing means for calculating the similarity between the second spectrum pattern generated by the second pattern generation means and each third spectrum pattern stored in the storage means.
Specific processing means for specifying the electronic melody acquired by the acquisition means based on the calculation result of the similarity by the calculation processing means, and
It is a program to function as
The second pattern generation means is a program capable of unequally distributing the number of first sections included in each second section based on the distribution of frequency components in the second spectral pattern.
(A)特定対象である電子メロディの時系列信号を取得するステップと、
(B)前記ステップ(A)によって取得された電子メロディの時系列信号を、所定の第1区間単位で周波数解析することにより、第1区間毎の第1周波数スペクトルが複数配列された第1スペクトルパターンを生成するステップと、
(C)前記ステップ(B)によって生成された第1スペクトルパターンを、それぞれに複数の第1区間を包含するN個(Nは複数)の第2区間に分割し、各第2区間に包含される複数の第1区間に関する複数の第1周波数スペクトルを平均化することにより、第2区間毎の第2周波数スペクトルが複数配列された第2スペクトルパターンを生成するステップと、
(D)既知の複数の電子メロディの各々に関して予め生成され、N個の第2区間に分割された、第3スペクトルパターンを記憶するステップと、
(E)前記ステップ(C)によって生成された第2スペクトルパターンと、前記ステップ(D)によって記憶された各第3スペクトルパターンとの類似度を算出するステップと、
(F)前記ステップ(E)による類似度の算出結果に基づいて、前記ステップ(A)によって取得された電子メロディを特定するステップと、
を備え、
前記ステップ(C)では、第2スペクトルパターンにおける周波数成分の分布に基づいて、各第2区間に包含される第1区間の個数を非均等に配分可能である、電子メロディ特定方法。
(A) A step of acquiring a time-series signal of an electronic melody to be specified, and
(B) The first spectrum in which a plurality of first frequency spectra for each first section are arranged by frequency-analyzing the time-series signal of the electronic melody acquired in the step (A) in a predetermined first section unit. The steps to generate the pattern and
(C) The first spectral pattern generated by the step (B) is divided into N (multiple N) second sections, each of which contains a plurality of first sections, and is included in each second section. A step of generating a second spectrum pattern in which a plurality of second frequency spectra for each second section are arranged by averaging a plurality of first frequency spectra related to the plurality of first sections.
(D) A step of storing a third spectral pattern, which is pregenerated for each of a plurality of known electronic melodies and divided into N second sections.
(E) A step of calculating the similarity between the second spectrum pattern generated by the step (C) and each third spectrum pattern stored by the step (D).
(F) A step of specifying the electronic melody acquired in the step (A) based on the calculation result of the similarity in the step (E), and
Equipped with
In step (C), an electronic melody specifying method capable of unequally distributing the number of first sections included in each second section based on the distribution of frequency components in the second spectral pattern.
JP2017137296A 2017-07-13 2017-07-13 Electronic melody identification device, program, and electronic melody identification method Active JP7025144B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2017137296A JP7025144B2 (en) 2017-07-13 2017-07-13 Electronic melody identification device, program, and electronic melody identification method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017137296A JP7025144B2 (en) 2017-07-13 2017-07-13 Electronic melody identification device, program, and electronic melody identification method

Publications (2)

Publication Number Publication Date
JP2019020527A JP2019020527A (en) 2019-02-07
JP7025144B2 true JP7025144B2 (en) 2022-02-24

Family

ID=65354094

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017137296A Active JP7025144B2 (en) 2017-07-13 2017-07-13 Electronic melody identification device, program, and electronic melody identification method

Country Status (1)

Country Link
JP (1) JP7025144B2 (en)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002116768A (en) 2000-10-05 2002-04-19 Sony Corp Portable telephone terminal, musical piece identification method and apparatus, musical piece identification delivery method and system
JP2007292827A (en) 2006-04-21 2007-11-08 Dainippon Printing Co Ltd Acoustic signal retrieving apparatus
JP2008304610A (en) 2007-06-06 2008-12-18 Nippon Telegr & Teleph Corp <Ntt> Signal feature extraction method, signal search method, signal feature extraction device, computer program and recording medium
WO2009038136A1 (en) 2007-09-19 2009-03-26 Nec Corporation Noise suppression device, its method, and program
JP2012098360A (en) 2010-10-29 2012-05-24 Sony Corp Signal processor, signal processing method, and program
JP2012226080A (en) 2011-04-19 2012-11-15 Sony Corp Music piece retrieval device and method, program, and recording medium
US20140310006A1 (en) 2011-08-29 2014-10-16 Telefonica, S.A. Method to generate audio fingerprints

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
IL249795B (en) * 2016-02-05 2020-01-30 Grifols Worldwide Operations Ltd Intradermal administration of immunoglobulin g preparation

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002116768A (en) 2000-10-05 2002-04-19 Sony Corp Portable telephone terminal, musical piece identification method and apparatus, musical piece identification delivery method and system
JP2007292827A (en) 2006-04-21 2007-11-08 Dainippon Printing Co Ltd Acoustic signal retrieving apparatus
JP2008304610A (en) 2007-06-06 2008-12-18 Nippon Telegr & Teleph Corp <Ntt> Signal feature extraction method, signal search method, signal feature extraction device, computer program and recording medium
WO2009038136A1 (en) 2007-09-19 2009-03-26 Nec Corporation Noise suppression device, its method, and program
JP2012098360A (en) 2010-10-29 2012-05-24 Sony Corp Signal processor, signal processing method, and program
JP2012226080A (en) 2011-04-19 2012-11-15 Sony Corp Music piece retrieval device and method, program, and recording medium
US20140310006A1 (en) 2011-08-29 2014-10-16 Telefonica, S.A. Method to generate audio fingerprints

Also Published As

Publication number Publication date
JP2019020527A (en) 2019-02-07

Similar Documents

Publication Publication Date Title
US10236015B2 (en) Encoding device and method, decoding device and method, and program
CN109661705B (en) Sound source separation device and method, and program
JP7109542B2 (en) AUDIO NOISE REDUCTION METHOD, APPARATUS, SERVER AND STORAGE MEDIUM
US9691410B2 (en) Frequency band extending device and method, encoding device and method, decoding device and method, and program
JP5942420B2 (en) Sound processing apparatus and sound processing method
JP5381982B2 (en) Voice detection device, voice detection method, voice detection program, and recording medium
KR101737824B1 (en) Method and Apparatus for removing a noise signal from input signal in a noisy environment
US20110178798A1 (en) Adaptive ambient sound suppression and speech tracking
JP6482173B2 (en) Acoustic signal processing apparatus and method
JP7025145B2 (en) Electronic melody identification device, program, and electronic melody identification method
JP6371516B2 (en) Acoustic signal processing apparatus and method
US20140177853A1 (en) Sound processing device, sound processing method, and program
US20150139445A1 (en) Information processing apparatus, information processing method, and computer-readable storage medium
JP7025144B2 (en) Electronic melody identification device, program, and electronic melody identification method
JP6544234B2 (en) Signal processing apparatus, signal processing method and signal processing program
ITMI20110103A1 (en) PROCEDURE AND MEANS OF SCANDING AND / OR SYNCHRONIZING AUDIO / VIDEO EVENTS
US8492639B2 (en) Audio processing apparatus and method
KR20220098747A (en) Fingerprinting method and apparatus of audio signal through exponential normalization
JP5377167B2 (en) Scream detection device and scream detection method
JP2006047639A (en) Noise eliminator
US10388264B2 (en) Audio signal processing apparatus, audio signal processing method, and audio signal processing program
JP2022038611A5 (en)
JP6729187B2 (en) Audio processing program, audio processing method, and audio processing apparatus
KR102386186B1 (en) Method and Device for Detecting Sound Source
JP5321171B2 (en) Sound processing apparatus and program

Legal Events

Date Code Title Description
RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20191029

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200605

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20210414

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210421

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210603

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210824

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220125

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220210

R150 Certificate of patent or registration of utility model

Ref document number: 7025144

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150