JP2000312343A - High speed signal searching method and device, and recording medium therefor - Google Patents

High speed signal searching method and device, and recording medium therefor

Info

Publication number
JP2000312343A
JP2000312343A JP11130630A JP13063099A JP2000312343A JP 2000312343 A JP2000312343 A JP 2000312343A JP 11130630 A JP11130630 A JP 11130630A JP 13063099 A JP13063099 A JP 13063099A JP 2000312343 A JP2000312343 A JP 2000312343A
Authority
JP
Japan
Prior art keywords
input signal
signal
window
feature
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP11130630A
Other languages
Japanese (ja)
Other versions
JP3065314B1 (en
Inventor
Kunio Kayano
邦夫 柏野
Hiroshi Murase
洋 村瀬
Smith Gabin
スミス ガビン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP11130630A priority Critical patent/JP3065314B1/en
Application granted granted Critical
Publication of JP3065314B1 publication Critical patent/JP3065314B1/en
Publication of JP2000312343A publication Critical patent/JP2000312343A/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Abstract

PROBLEM TO BE SOLVED: To provide a high speed signal searching method by which the same detection result as the case that an attentional window is minutely moved over entire areas of an input signal can be obtained even when the attentional window is not minutely moved over the entire areas, and to provide its device and its recording medium. SOLUTION: A characteristics template generating device 101 generates a feature quantity of a reference acoustic signal, and an acoustic signal detector 102 sets an attentional window to a received acoustic signal and detects a presence position of the acoustic signal similar to the reference acoustic signal. In this detection processing, the acoustic signal detector 102 repeats a process that generates a feature quantity series of the input acoustic signal in the attentional window, a process that calculates a similarity value between the feature quantity series of the reference acoustic signal and the generated feature quantity series from the input acoustic signal, a process that calculates a movement available quantity of the target window on the basis of the similarity value, and a process that sets the attentional window on the basis of the movement available quantity. Thus, the similarity value of the attentional window at each position is calculated and compared with a threshold value to discriminate the presence of a reference signal.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、信号系列の中か
ら、予め登録された信号と類似した信号の場所を探し出
す高速信号探索方法、装置および(該方法を記録した)
記録媒体に関するものである。該記録媒体は、上記高速
信号探索方法をコンピュータにより実行させるためのプ
ログラムを記録しており、かつ、コンピュータにより読
み取り可能である。本発明は、例えば、音響信号検出に
利用することができる。即ち、本発明は、放送の音響信
号の中から特定のコマーシャルが放映された時刻を検出
して自動記録したり、特定のテーマソングを検出してビ
デオ録画を開始したり停止したりすることを可能とする
信号検出技術に関連する。また、本発明は、放送におい
て、拍手音の発せられた時刻や、笑い声の発せられた時
刻などを、自動的に監視したり、特定のシーンを検索し
たりすることを可能とする技術にも関連する。さらに、
本発明は、音響信号だけではなく、一般の信号(映像信
号等)の検出にも適用可能である。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a high-speed signal search method and apparatus for searching a signal sequence for a location of a signal similar to a previously registered signal, and a method for recording the same.
It relates to a recording medium. The recording medium records a program for causing a computer to execute the high-speed signal search method, and is readable by a computer. The present invention can be used, for example, for sound signal detection. That is, the present invention detects the time at which a specific commercial is broadcast from the audio signal of the broadcast and automatically records the time, and detects or starts a video recording by detecting a specific theme song. Related to enabling signal detection technology. In addition, the present invention also relates to a technology that makes it possible to automatically monitor the time when a clapping sound is emitted, the time when a laughter is emitted, or search for a specific scene in broadcasting. Related. further,
The present invention is applicable not only to detection of audio signals but also to detection of general signals (such as video signals).

【0002】[0002]

【従来の技術】従来、目的とする信号(以下、「参照信
号」と称する)が存在する領域を信号系列中から検出す
る手法として、マッチトフィルターがある。マッチトフ
ィルターは、入力された信号の注目領域(以下、「注目
窓」と称する)における波形と参照信号の波形との間に
おける相関値を、該注目窓を移動させながら計算し、該
相関値がある一定値以上になると、「参照信号がその注
目窓内に存在する」と判断する手法である。
2. Description of the Related Art Conventionally, there is a matched filter as a technique for detecting, from a signal sequence, a region where a target signal (hereinafter referred to as a "reference signal") exists. The matched filter calculates a correlation value between a waveform in a region of interest (hereinafter, referred to as an “interest window”) of the input signal and a waveform of the reference signal while moving the window of interest, and calculates the correlation value. When a certain value or more is exceeded, it is a method of determining that “the reference signal exists within the window of interest”.

【0003】[0003]

【発明が解決しようとする課題】しかしながら、この手
法では、「入力信号の全領域に対して注目窓の位置を細
かく移動させながら相関値を計算する必要があるため
に、計算量が膨大になり、計算速度が遅くなる」という
課題があった。
However, in this method, it is necessary to calculate the correlation value while finely moving the position of the window of interest with respect to the entire region of the input signal. The calculation speed becomes slow. "

【0004】一方、入力信号波形と参照信号波形との相
関値を利用する代わりに、上記注目窓における入力信号
波形の特徴量を計算し、該特徴量と予め計算しておいた
参照信号波形の特徴量との相関値やユークリッド距離な
どを利用して、入力信号波形と参照信号波形との比較を
行う手法も考えられる。しかしながら、この手法におい
ても、同様に、「入力信号の全領域に対して注目窓の位
置を細かく移動させながら特徴量を計算する必要があ
り、かつ、該特徴量を比較する必要があるために、計算
量が膨大になり、計算速度が遅くなる」という課題があ
った。
On the other hand, instead of using the correlation value between the input signal waveform and the reference signal waveform, a characteristic amount of the input signal waveform in the window of interest is calculated, and the characteristic amount and the previously calculated reference signal waveform are calculated. A method of comparing an input signal waveform with a reference signal waveform using a correlation value with a feature amount, a Euclidean distance, or the like is also conceivable. However, in this method, similarly, it is necessary to calculate the feature value while moving the position of the window of interest finely with respect to the entire region of the input signal, and to compare the feature value. , The amount of calculation becomes enormous and the calculation speed becomes slow. "

【0005】本発明は、このような課題を解決するため
になされたものであり、その目的は、「入力信号の全領
域に対して注目窓を細かく移動させなくとも、全領域に
対して細かく移動させた場合と同等の検出結果を得るこ
とができる高速信号探索方法、装置およびその記録媒体
を提供すること」である。即ち、本出願は、精度を落と
すことなく速度を向上させることができる手法を提案す
る。
SUMMARY OF THE INVENTION The present invention has been made to solve such a problem, and an object of the present invention is to provide a method of finely controlling the entire area of an input signal without moving a window of interest finely. It is to provide a high-speed signal search method and apparatus capable of obtaining a detection result equivalent to the case of moving, and a recording medium thereof. " That is, the present application proposes a technique that can increase the speed without reducing the accuracy.

【0006】また、本発明の他の目的は、「雑音等によ
って信号が変動する場合や、平均的な特徴では信号を区
別し難い場合等であっても、より高い精度で信号を検出
できる高速信号探索方法、装置およびその記録媒体を提
供すること」である。さらに、本発明の他の目的は、
「多数の参照信号に基づいて信号を検出する場合であっ
ても、従来より少ない処理で信号を検出できる高速信号
探索方法、装置およびその記録媒体を提供すること」で
ある。
Another object of the present invention is to provide a high-speed signal detecting apparatus capable of detecting a signal with higher accuracy even when the signal fluctuates due to noise or the like, or when it is difficult to distinguish the signal with average characteristics. Providing a signal search method and apparatus and a recording medium thereof ”. Further, another object of the present invention is to provide
The object of the present invention is to provide a high-speed signal search method and apparatus capable of detecting a signal with less processing than before, even when a signal is detected based on a large number of reference signals, and a recording medium therefor.

【0007】[0007]

【課題を解決するための手段】請求項1記載の発明は、
予め登録された参照信号について特徴量系列を生成する
第1の過程と、入力された入力信号に対して、入力信号
注目窓を設定する第2の過程と、前記入力信号注目窓内
の入力信号について特徴量系列を生成する第3の過程
と、第1の過程で生成された特徴量系列と第3の過程で
生成された特徴量系列との類似度合いを示す入力信号類
似値を計算する第4の過程と、第4の過程で計算された
入力信号類似値に基づいて、入力信号注目窓を移動でき
る量を示す移動可能量を計算する第5の過程と、第5の
過程で計算された移動可能量に基づいて、入力信号注目
窓の位置を決定し、その位置に該入力信号注目窓を設定
する第6の過程とを具備し、前記第3の過程から前記第
6の過程を繰り返すことによって、入力信号注目窓の各
位置について、入力信号類似値を計算し、入力信号類似
値と予め設定された閾値との比較結果に基づいて、入力
信号上において入力信号注目窓が現在示す位置に参照信
号が存在するか否かを判定することを特徴としている。
According to the first aspect of the present invention,
A first step of generating a feature amount sequence for a pre-registered reference signal, a second step of setting an input signal attention window for the input signal, and an input signal within the input signal attention window And a third step of calculating an input signal similarity value indicating a degree of similarity between the feature amount sequence generated in the first step and the feature amount sequence generated in the third step. Step 5, a fifth step of calculating a movable amount indicating an amount by which the input signal attention window can be moved based on the input signal similarity value calculated in the fourth step, and a fifth step Determining the position of the input signal attention window based on the movable amount, and setting the input signal attention window at that position. By repeating, for each position of the input signal attention window, the input Calculating a signal similarity value and determining whether or not a reference signal is present at a position currently indicated by the input signal attention window on the input signal based on a comparison result between the input signal similarity value and a preset threshold value. It is characterized by.

【0008】請求項2記載の発明は、予め登録された参
照信号について特徴量系列を生成する第1の過程と、第
1の過程で生成された特徴量系列に対して、参照信号注
目窓を設定する第2の過程と、第2の過程で設定された
参照信号注目窓を、複数の参照信号分割注目窓に分割す
る第3の過程と、入力された入力信号について特徴量系
列を生成する第4の過程と、第4の過程で生成された特
徴量系列に対して、入力信号注目窓を設定する第5の過
程と、前記入力信号注目窓を、前記複数の参照信号分割
注目窓に対応する複数の入力信号分割注目窓に分割する
第6の過程と、各参照信号分割注目窓内の特徴量系列と
当該参照信号分割注目窓に対応する入力信号分割注目窓
内の特徴量系列との類似度合いを示す入力信号類似値を
計算する第7の過程と、第7の過程で計算された入力信
号類似値に基づいて、入力信号注目窓を移動できる量を
示す移動可能量を計算する第8の過程と、第8の過程で
計算された移動可能量に基づいて、入力信号注目窓の位
置を決定し、その位置に該入力信号注目窓を設定する第
9の過程とを具備し、前記第6の過程から前記第9の過
程を繰り返すことによって、入力信号注目窓の各位置に
ついて、入力信号類似値を計算し、入力信号類似値と予
め設定された閾値との比較結果に基づいて、入力信号注
目窓が現在示す位置に参照信号が存在するか否かを判定
することを特徴としている。
According to a second aspect of the present invention, a first step of generating a feature amount sequence for a reference signal registered in advance, and a reference signal attention window for the feature amount sequence generated in the first step are set. A second step of setting, a third step of dividing the reference signal attention window set in the second step into a plurality of reference signal division attention windows, and generating a feature amount sequence for the input signal input A fourth step, a fifth step of setting an input signal attention window for the feature amount series generated in the fourth step, and setting the input signal attention window to the plurality of reference signal division attention windows. A sixth process of dividing into a plurality of corresponding input signal division windows of interest, a feature value sequence in each reference signal division window of interest, and a feature value sequence in an input signal division window of interest corresponding to the reference signal division window of interest. The seventh step of calculating the input signal similarity value indicating the similarity degree of An eighth step of calculating a movable amount indicating an amount by which the input signal attention window can be moved based on the input signal similarity value calculated in the seventh step, and a movable amount calculated in the eighth step Ninth step of determining the position of the input signal attention window based on the quantity and setting the input signal attention window at that position, and repeating the ninth step from the sixth step. The input signal similarity value is calculated for each position of the input signal attention window, and the reference signal is present at the position indicated by the input signal attention window based on the comparison result between the input signal similarity value and a preset threshold value. Is determined.

【0009】請求項3記載の発明は、予め登録された複
数の参照信号について特徴量系列を生成する第1の過程
と、入力された入力信号について特徴量系列を生成する
第2の過程と、第2の過程で生成された特徴量系列に対
して、入力信号注目窓を設定する第3の過程と、前記複
数の参照信号のうちの2つの参照信号について、一方の
参照信号に関する特徴量系列と他方の参照信号に関する
特徴量系列との類似度合いを示す参照信号間類似値を計
算する第4の過程と、前記複数の参照信号のうちの各参
照信号について、第1の過程で生成された特徴量系列と
前記入力信号注目窓内の特徴量系列との類似度合いを示
す入力信号類似値を計算する第5の過程と、第4の過程
で計算された参照信号間類似値と第5の過程で計算され
た入力信号類似値とに基づいて、入力信号注目窓を移動
できる量を示す移動可能量を計算する第6の過程と、第
6の過程で計算された移動可能量に基づいて、入力信号
注目窓の位置を決定し、その位置に該入力信号注目窓を
設定する第7の過程とを具備し、前記第5の過程から前
記第7の過程を繰り返すことによって、入力信号注目窓
の各位置について、入力信号類似値を計算し、入力信号
類似値と予め設定された閾値との比較結果に基づいて、
入力信号注目窓が現在示す位置に参照信号が存在するか
否かを判定することを特徴としている。
According to a third aspect of the present invention, there is provided a first step of generating a feature amount sequence for a plurality of reference signals registered in advance, a second step of generating a feature amount sequence for an input signal input, A third step of setting an input signal attention window with respect to the feature amount sequence generated in the second step; and a feature amount sequence relating to one of the plurality of reference signals. A fourth step of calculating an inter-reference signal similarity value indicating a degree of similarity between the reference signal and the other reference signal, and each of the plurality of reference signals is generated in the first step. A fifth step of calculating an input signal similarity value indicating a degree of similarity between the feature amount series and the feature amount sequence in the input signal attention window; and a fifth step of calculating the similarity value between the reference signals calculated in the fourth step. Input signal similarity value calculated in the process And a position of the input signal attention window is determined on the basis of the movable amount calculated in the sixth step. And a seventh step of setting the input signal attention window at that position, and repeating the fifth to seventh steps to obtain an input signal similarity value for each position of the input signal attention window. Is calculated, based on a comparison result between the input signal similarity value and a preset threshold value,
It is characterized in that it is determined whether or not a reference signal exists at a position currently indicated by the input signal attention window.

【0010】請求項4記載の発明は、予め登録された複
数の参照信号について特徴量系列を生成する第1の過程
と、第1の過程で生成された各特徴量系列に対して、参
照信号注目窓を設定する第2の過程と、第2の過程で設
定された参照信号注目窓を、複数の参照信号分割注目窓
に分割する第3の過程と、入力された入力信号について
特徴量系列を生成する第4の過程と、第4の過程で生成
された特徴量系列に対して、入力信号注目窓を設定する
第5の過程と、前記入力信号注目窓を、前記複数の参照
信号分割注目窓に対応する複数の入力信号分割注目窓に
分割する第6の過程と、前記複数の参照信号のうちの2
つの参照信号について、一方の参照信号に関する特徴量
系列と他方の参照信号に関する特徴量系列との類似度合
いを示す類似値であって、かつ、前記2つの参照信号間
において互いに対応する各参照信号分割注目窓内の特徴
量系列間の類似度合いを示す類似値である参照信号間類
似値を計算する第7の過程と、複数の参照信号のうちの
各参照信号について、各参照信号分割注目窓内の特徴量
系列と当該参照信号分割注目窓に対応する入力信号分割
注目窓内の特徴量系列との類似度合いを示す入力信号類
似値を計算する第8の過程と、第7の過程で計算された
参照信号間類似値と第8の過程で計算された入力信号類
似値とに基づいて、入力信号注目窓を移動できる量を示
す移動可能量を計算する第9の過程と、第9の過程で計
算された移動可能量に基づいて、入力信号注目窓の位置
を決定し、その位置に該入力信号注目窓を設定する第1
0の過程とを具備し、前記第6の過程から前記第10の
過程を繰り返すことによって、入力信号注目窓の各位置
について、入力信号類似値を計算し、入力信号類似値と
予め設定された閾値との比較結果に基づいて、入力信号
注目窓が現在示す位置に参照信号が存在するか否かを判
定することを特徴としている。
According to a fourth aspect of the present invention, a first step of generating a feature sequence for a plurality of reference signals registered in advance, and a reference signal for each feature sequence generated in the first process. A second step of setting an attention window, a third step of dividing the reference signal attention window set in the second step into a plurality of reference signal division attention windows, and a feature amount sequence for the input signal input. A fourth step of generating an input signal attention window for the feature amount sequence generated in the fourth step, and dividing the input signal attention window by the plurality of reference signal divisions. A sixth step of dividing the input signal into windows of interest corresponding to the window of interest;
Each of the reference signal divisions is a similarity value indicating a degree of similarity between a feature value sequence related to one reference signal and a feature value sequence related to the other reference signal, and corresponds to each other between the two reference signals. A seventh process of calculating a similarity value between reference signals, which is a similarity value indicating a degree of similarity between feature amount sequences in the window of interest, and, for each reference signal of the plurality of reference signals, a reference signal division in each window of interest. An input signal similarity value indicating the degree of similarity between the feature amount sequence of the above and the feature amount sequence in the input signal division attention window corresponding to the reference signal division attention window is calculated in an eighth process and a seventh process. A ninth step of calculating a movable amount indicating an amount by which the input signal attention window can be moved, based on the similarity value between the reference signals and the input signal similarity value calculated in the eighth step; Movable calculated by Based on, to determine the position of the input signal of interest window, first setting the input signal of interest window in that position
0, and by repeating the sixth to the tenth steps, an input signal similarity value is calculated for each position of the input signal attention window, and the input signal similarity value is preset as the input signal similarity value. It is characterized in that it is determined whether or not a reference signal exists at a position currently indicated by an input signal attention window based on a result of comparison with a threshold value.

【0011】請求項5記載の発明は、請求項1〜4のい
ずれかの項記載の高速信号探索方法において、前記入力
信号の複数の箇所について、該入力信号と前記参照信号
との類似値を予め求める予備照合過程と、前記予備照合
過程で得られた複数の類似値について、該類似値の平均
値と標準偏差値とを求める予備照合類似値統計過程と、
前記予備照合類似値統計過程で得られた平均値と標準偏
差値とに基づいて、前記閾値を決定する閾値決定過程と
を具備することを特徴としている。
According to a fifth aspect of the present invention, in the high-speed signal search method according to any one of the first to fourth aspects, a similar value between the input signal and the reference signal is determined for a plurality of portions of the input signal. A preliminary matching process that is determined in advance, and a plurality of similar values obtained in the preliminary matching process, a preliminary matching similar value statistical process that determines an average value and a standard deviation value of the similar values;
A threshold value determining step of determining the threshold value based on the average value and the standard deviation value obtained in the preliminary matching similarity value statistical step.

【0012】請求項6記載の発明は、請求項1又は2記
載の高速信号探索方法において、前記入力信号類似値
は、重なり類似値であることを特徴としている。
According to a sixth aspect of the present invention, in the high-speed signal searching method according to the first or second aspect, the input signal similarity value is an overlap similarity value.

【0013】請求項7記載の発明は、請求項1又は3記
載の高速信号探索方法において、前記入力信号注目窓
は、時間軸方向において前記参照信号と同じ時間長を有
する注目窓であることを特徴としている。
According to a seventh aspect of the present invention, in the high-speed signal search method according to the first or third aspect, the input signal attention window is an attention window having the same time length as the reference signal in a time axis direction. Features.

【0014】請求項8記載の発明は、請求項1〜4のい
ずれかの項記載の高速信号探索方法において、前記移動
可能量は、θが前記閾値であり、Sが前記入力信号類似
値であり、Dが前記特徴量系列の総度数であり、flo
or{}が小数点以下の切り下げを表す場合、数1の式
によって計算されることを特徴としている。
According to an eighth aspect of the present invention, in the high-speed signal search method according to any one of the first to fourth aspects, the movable amount is such that θ is the threshold value and S is the input signal similarity value. And D is the total frequency of the feature amount series, and
When or {} represents rounding down to the decimal point, it is characterized by being calculated by the equation (1).

【0015】請求項9記載の発明は、請求項1〜4のい
ずれかの項記載の高速信号探索方法において、前記参照
信号および前記入力信号は、音響信号であることを特徴
としている。
According to a ninth aspect of the present invention, in the high-speed signal search method according to any one of the first to fourth aspects, the reference signal and the input signal are acoustic signals.

【0016】請求項10記載の発明は、請求項2又は4
記載の高速信号探索方法において、前記入力信号注目窓
および前記参照信号注目窓は、時間軸方向において前記
参照信号と同じ時間長を有する注目窓であることを特徴
としている。
The invention according to claim 10 is the invention according to claim 2 or 4.
In the high-speed signal search method described above, the input signal attention window and the reference signal attention window are attention windows having the same time length as the reference signal in a time axis direction.

【0017】請求項11記載の発明は、請求項3又は4
記載の高速信号探索方法において、前記参照信号間類似
値および前記入力信号類似値は、重なり類似値であるこ
とを特徴としている。
The invention according to claim 11 is the invention according to claim 3 or 4.
In the high-speed signal search method described above, the similarity value between the reference signals and the similarity value of the input signal are overlapped similarity values.

【0018】請求項12記載の発明は、予め登録された
参照信号について特徴量系列を生成する第1の過程と、
第1の過程で生成された特徴量系列についてヒストグラ
ムを作成する第2の過程と、入力された入力信号に対し
て、入力信号注目窓を設定する第3の過程と、前記入力
信号注目窓内の入力信号について特徴量系列を生成する
第4の過程と、第4の過程で生成された特徴量系列につ
いてヒストグラムを作成する第5の過程と、第2の過程
で作成されたヒストグラムと第5の過程で作成されたヒ
ストグラムとの類似度合いを示す入力信号類似値を計算
する第6の過程と、第6の過程で計算された入力信号類
似値に基づいて、入力信号注目窓を移動できる量を示す
移動可能量を計算する第7の過程と、第7の過程で計算
された移動可能量に基づいて、入力信号注目窓の位置を
決定し、その位置に該入力信号注目窓を設定する第8の
過程とを具備し、前記第4の過程から前記第8の過程を
繰り返すことによって、入力信号注目窓の各位置につい
て、入力信号類似値を計算し、入力信号類似値と予め設
定された閾値との比較結果に基づいて、入力信号上にお
いて入力信号注目窓が現在示す位置に参照信号が存在す
るか否かを判定することを特徴としている。
According to a twelfth aspect of the present invention, a first step of generating a feature amount sequence for a reference signal registered in advance,
A second step of creating a histogram for the feature amount sequence generated in the first step, a third step of setting an input signal attention window for an input signal input, A fourth step of generating a feature amount sequence for the input signal of step (a), a fifth step of creating a histogram for the feature amount sequence generated in the fourth step, and a histogram and a fifth step of forming a histogram of the second step. A sixth step of calculating an input signal similarity value indicating the degree of similarity with the histogram created in the step, and an amount by which the input signal attention window can be moved based on the input signal similarity value calculated in the sixth step And the position of the input signal attention window is determined based on the movement amount calculated in the seventh process, and the input signal attention window is set at that position. An eighth process, By repeating the fourth to eighth steps, an input signal similarity value is calculated for each position of the input signal attention window, and based on a comparison result between the input signal similarity value and a preset threshold value. It is characterized in that it is determined whether or not a reference signal exists at a position currently indicated by the input signal attention window on the input signal.

【0019】請求項13記載の発明は、予め登録された
参照信号について特徴量系列を生成する第1の過程と、
第1の過程で生成された特徴量系列に対して、参照信号
注目窓を設定する第2の過程と、第2の過程で設定され
た参照信号注目窓を、複数の参照信号分割注目窓に分割
する第3の過程と、入力された入力信号について特徴量
系列を生成する第4の過程と、第4の過程で生成された
特徴量系列に対して、入力信号注目窓を設定する第5の
過程と、前記入力信号注目窓を、前記複数の参照信号分
割注目窓に対応する複数の入力信号分割注目窓に分割す
る第6の過程と、各参照信号分割注目窓内の特徴量系列
についてヒストグラムを作成する第7の過程と、各入力
信号分割注目窓内の特徴量系列についてヒストグラムを
作成する第8の過程と、各参照信号分割注目窓内のヒス
トグラムと当該参照信号分割注目窓に対応する入力信号
分割注目窓内のヒストグラムとの類似度合いを示す入力
信号類似値を計算する第9の過程と、第9の過程で計算
された入力信号類似値に基づいて、入力信号注目窓を移
動できる量を示す移動可能量を計算する第10の過程
と、第10の過程で計算された移動可能量に基づいて、
入力信号注目窓の位置を決定し、その位置に該入力信号
注目窓を設定する第11の過程とを具備し、前記第6の
過程から前記第11の過程を繰り返すことによって、入
力信号注目窓の各位置について、入力信号類似値を計算
し、入力信号類似値と予め設定された閾値との比較結果
に基づいて、入力信号注目窓が現在示す位置に参照信号
が存在するか否かを判定することを特徴としている。
According to a thirteenth aspect of the present invention, a first step of generating a feature amount sequence for a reference signal registered in advance,
A second step of setting a reference signal attention window for the feature amount sequence generated in the first step, and a reference signal attention window set in the second step as a plurality of reference signal division attention windows. A third step of dividing, a fourth step of generating a feature value sequence for the input signal input, and a fifth step of setting an input signal attention window for the feature value sequence generated in the fourth process. And a sixth step of dividing the input signal attention window into a plurality of input signal division attention windows corresponding to the plurality of reference signal division attention windows, and a feature amount sequence in each reference signal division attention window. A seventh step of creating a histogram, an eighth step of creating a histogram for a feature amount sequence in each input signal division window of interest, and a histogram in each reference signal division window of interest and corresponding to the reference signal division window of interest. In the input signal division window of interest A ninth step of calculating an input signal similarity value indicating the degree of similarity with the togram, and a movable amount indicating an amount by which the input signal attention window can be moved based on the input signal similarity value calculated in the ninth step. Based on a tenth step of calculating and the movable amount calculated in the tenth step,
An eleventh step of determining the position of the input signal attention window and setting the input signal attention window at the position, and repeating the sixth to eleventh steps to obtain the input signal attention window. For each of the positions, the input signal similarity value is calculated, and based on the comparison result between the input signal similarity value and a preset threshold value, it is determined whether or not the reference signal is present at the position currently indicated by the input signal attention window. It is characterized by doing.

【0020】請求項14記載の発明は、予め登録された
複数の参照信号について特徴量系列を生成する第1の過
程と、第1の過程で生成された特徴量系列についてヒス
トグラムを作成する第2の過程と、入力された入力信号
について特徴量系列を生成する第3の過程と、第3の過
程で生成された特徴量系列に対して、入力信号注目窓を
設定する第4の過程と、前記入力信号注目窓内の特徴量
系列についてヒストグラムを作成する第5の過程と、前
記複数の参照信号のうちの2つの参照信号について、一
方の参照信号に関するヒストグラムと他方の参照信号に
関するヒストグラムとの類似度合いを示す参照信号間類
似値を計算する第6の過程と、前記複数の参照信号のう
ちの各参照信号について、第2の過程で生成されたヒス
トグラムと第5の過程で生成されたヒストグラムとの類
似度合いを示す入力信号類似値を計算する第7の過程
と、第6の過程で計算された参照信号間類似値と第7の
過程で計算された入力信号類似値とに基づいて、入力信
号注目窓を移動できる量を示す移動可能量を計算する第
8の過程と、第8の過程で計算された移動可能量に基づ
いて、入力信号注目窓の位置を決定し、その位置に該入
力信号注目窓を設定する第9の過程とを具備し、前記第
5の過程から前記第9の過程を繰り返すことによって、
入力信号注目窓の各位置について、入力信号類似値を計
算し、入力信号類似値と予め設定された閾値との比較結
果に基づいて、入力信号注目窓が現在示す位置に参照信
号が存在するか否かを判定することを特徴としている。
According to a fourteenth aspect of the present invention, a first step of generating a feature amount sequence for a plurality of reference signals registered in advance, and a second step of generating a histogram for the feature amount sequence generated in the first step. , A third step of generating a feature amount sequence for the input signal that has been input, a fourth step of setting an input signal attention window for the feature amount sequence generated in the third step, A fifth step of creating a histogram for the feature amount series in the input signal attention window, and, for two reference signals of the plurality of reference signals, a histogram of one reference signal and a histogram of the other reference signal. A sixth step of calculating a similarity value between reference signals indicating a degree of similarity, and a histogram generated in the second step and a fifth step for each of the plurality of reference signals. 7th step of calculating an input signal similarity value indicating the degree of similarity with the histogram generated in the step, and the similarity between the reference signals calculated in the sixth step and the input signal similarity calculated in the seventh step. An eighth step of calculating a movable amount indicating the amount by which the input signal attention window can be moved based on the value and the position of the input signal attention window based on the movable amount calculated in the eighth step. A ninth step of determining and setting the input signal attention window at that position, and repeating the ninth step from the fifth step,
An input signal similarity value is calculated for each position of the input signal attention window, and based on a comparison result between the input signal similarity value and a preset threshold, whether a reference signal is present at the position currently indicated by the input signal attention window. It is characterized in that it is determined whether or not it is.

【0021】請求項15記載の発明は、予め登録された
複数の参照信号について特徴量系列を生成する第1の過
程と、第1の過程で生成された各特徴量系列に対して、
参照信号注目窓を設定する第2の過程と、第2の過程で
設定された参照信号注目窓を、複数の参照信号分割注目
窓に分割する第3の過程と、入力された入力信号につい
て特徴量系列を生成する第4の過程と、第4の過程で生
成された特徴量系列に対して、入力信号注目窓を設定す
る第5の過程と、前記入力信号注目窓を、前記複数の参
照信号分割注目窓に対応する複数の入力信号分割注目窓
に分割する第6の過程と、各参照信号分割注目窓内の特
徴量系列についてヒストグラムを作成する第7の過程
と、各入力信号分割注目窓内の特徴量系列についてヒス
トグラムを作成する第8の過程と、前記複数の参照信号
のうちの2つの参照信号について、一方の参照信号に関
するヒストグラムと他方の参照信号に関するヒストグラ
ムとの類似度合いを示す類似値であって、かつ、前記2
つの参照信号間において互いに対応する各参照信号分割
注目窓内のヒストグラム間の類似度合いを示す類似値で
ある参照信号間類似値を計算する第9の過程と、複数の
参照信号のうちの各参照信号について、各参照信号分割
注目窓内のヒストグラムと当該参照信号分割注目窓に対
応する入力信号分割注目窓内のヒストグラムとの類似度
合いを示す入力信号類似値を計算する第10の過程と、
第9の過程で計算された参照信号間類似値と第10の過
程で計算された入力信号類似値とに基づいて、入力信号
注目窓を移動できる量を示す移動可能量を計算する第1
1の過程と、第11の過程で計算された移動可能量に基
づいて、入力信号注目窓の位置を決定し、その位置に該
入力信号注目窓を設定する第12の過程とを具備し、前
記第6の過程から前記第12の過程を繰り返すことによ
って、入力信号注目窓の各位置について、入力信号類似
値を計算し、入力信号類似値と予め設定された閾値との
比較結果に基づいて、入力信号注目窓が現在示す位置に
参照信号が存在するか否かを判定することを特徴として
いる。
According to a fifteenth aspect of the present invention, a first step of generating a feature value sequence for a plurality of reference signals registered in advance, and a feature value sequence generated in the first process,
A second step of setting a reference signal attention window, a third step of dividing the reference signal attention window set in the second step into a plurality of reference signal division attention windows, and a feature of the input signal. A fourth step of generating a quantity sequence; a fifth step of setting an input signal attention window for the feature quantity sequence generated in the fourth step; A sixth process of dividing into a plurality of input signal division windows of interest corresponding to the signal division window of interest, a seventh process of creating a histogram for a feature amount sequence in each reference signal division of window of interest, An eighth process of creating a histogram for the feature amount series in the window, and for two reference signals of the plurality of reference signals, determining the similarity between the histogram for one reference signal and the histogram for the other reference signal. A to similar values, and the two
A ninth step of calculating a similarity value between reference signals, which is a similarity value indicating a similarity degree between histograms in the reference signal division attention windows corresponding to each other between one reference signal, and each reference among a plurality of reference signals A tenth step of calculating, for the signal, an input signal similarity value indicating a degree of similarity between the histogram in each reference signal division window of interest and the histogram in the input signal division window of interest corresponding to the reference signal division window of interest;
Calculating a movable amount indicating an amount by which the input signal attention window can be moved, based on the reference signal similarity value calculated in the ninth process and the input signal similarity value calculated in the tenth process;
Step 1 and a twelfth step of determining the position of the input signal attention window based on the movable amount calculated in the eleventh step, and setting the input signal attention window at the position. By repeating the sixth to twelfth steps, an input signal similarity value is calculated for each position of the input signal attention window, and based on a comparison result between the input signal similarity value and a preset threshold value. It is characterized in that it is determined whether or not a reference signal is present at the position currently indicated by the input signal attention window.

【0022】請求項16記載の発明は、請求項12〜1
5のいずれかの項記載の高速信号探索方法において、前
記特徴量系列は、参照信号および入力信号の零交差数お
よびその微分値の系列であり、前記ヒストグラムは、前
記零交差数およびその微分値が取りうる値の範囲を複数
の区間に分割し、前記各区間に対応する特徴量系列を前
記零交差数およびその微分値に基づいて計数することに
よって作成されることを特徴としている。
The invention of claim 16 is the invention of claims 12 to 1.
5. The high-speed signal search method according to claim 5, wherein the feature amount sequence is a sequence of a number of zero crossings of a reference signal and an input signal and a derivative thereof, and the histogram is a sequence of the number of zero crossings and a derivative thereof. Is divided into a plurality of sections, and a feature amount series corresponding to each section is created by counting based on the number of zero crossings and its differential value.

【0023】請求項17記載の発明は、請求項12〜1
5のいずれかの項記載の高速信号探索方法において、前
記特徴量系列は、複数の周波数帯域の成分を要素とする
特徴ベクトルの系列であり、前記ヒストグラムは、前記
特徴ベクトルの各要素が取りうる値の範囲を複数の区間
に分割し、前記各区間に対応する特徴量系列を前記要素
の値に基づいて計数することによって作成されることを
特徴としている。
The invention according to claim 17 is the invention according to claims 12 to 1.
6. In the high-speed signal search method according to any one of the first to fifth aspects, the feature amount sequence is a sequence of feature vectors having components of a plurality of frequency bands as elements, and the histogram can take each element of the feature vector. It is characterized by being created by dividing a value range into a plurality of sections and counting a feature amount series corresponding to each section based on the value of the element.

【0024】請求項18記載の発明は、予め登録された
参照信号について特徴量系列を生成する参照信号特徴量
生成手段と、入力された入力信号について特徴量系列を
生成する入力信号特徴量生成手段と、入力信号特徴量生
成手段で生成された特徴量系列に対して、入力信号注目
窓を設定する入力信号注目窓設定手段と、参照信号特徴
量生成手段で生成された特徴量系列と前記入力信号注目
窓内の特徴量系列との類似度合いを示す入力信号類似値
を計算する入力信号類似値計算手段と、入力信号類似値
計算手段で計算された入力信号類似値に基づいて、入力
信号注目窓を移動できる量を示す移動可能量を計算する
移動可能量計算手段と、移動可能量計算手段で計算され
た移動可能量に基づいて、入力信号注目窓の位置を決定
し、その位置に該入力信号注目窓を設定する入力信号注
目窓位置決定手段と、入力信号類似値計算手段と移動可
能量計算手段と入力信号注目窓位置決定手段とに対し
て、それぞれの処理を繰り返し行わせることによって、
入力信号注目窓の各位置について、入力信号類似値を計
算させる繰返手段と、入力信号類似値と予め設定された
閾値との比較結果に基づいて、入力信号上において入力
信号注目窓が現在示す位置に参照信号が存在するか否か
を判定する判定手段とを具備することを特徴としてい
る。
The invention according to claim 18 is a reference signal feature value generating means for generating a feature value sequence for a reference signal registered in advance, and an input signal feature value generating means for generating a feature value sequence for an input signal inputted. Input signal attention window setting means for setting an input signal attention window for the feature value sequence generated by the input signal feature value generation means; and a feature value sequence generated by the reference signal feature value generation means; Input signal similarity value calculating means for calculating an input signal similarity value indicating a degree of similarity with the feature amount sequence in the signal attention window; and an input signal similarity value calculated based on the input signal similarity value calculated by the input signal similarity value calculating means. A movable amount calculating means for calculating a movable amount indicating an amount by which the window can be moved, and a position of the input signal attention window is determined based on the movable amount calculated by the movable amount calculating means. The input signal attention window position determination means for setting the force signal attention window, the input signal similarity value calculation means, the movable amount calculation means, and the input signal attention window position determination means are made to repeatedly perform the respective processes. ,
An iterative means for calculating the input signal similarity value for each position of the input signal attention window, and the input signal attention window currently indicating on the input signal based on the comparison result between the input signal similarity value and a preset threshold value Determining means for determining whether or not the reference signal exists at the position.

【0025】請求項19記載の発明は、請求項18記載
の高速信号探索装置と、ビデオ装置と、前記高速信号探
索装置の判定結果に基づいて、前記ビデオ装置の録画動
作を制御する制御手段とを具備することを特徴としてい
る。
According to a nineteenth aspect of the present invention, there is provided a high-speed signal search device according to the eighteenth aspect, a video device, and control means for controlling a recording operation of the video device based on a determination result of the high-speed signal search device. It is characterized by having.

【0026】請求項20記載の発明は、コンピュータ
を、予め登録された参照信号について特徴量系列を生成
する参照信号特徴量生成手段と、入力された入力信号に
ついて特徴量系列を生成する入力信号特徴量生成手段
と、入力信号特徴量生成手段で生成された特徴量系列に
対して、入力信号注目窓を設定する入力信号注目窓設定
手段と、参照信号特徴量生成手段で生成された特徴量系
列と前記入力信号注目窓内の特徴量系列との類似度合い
を示す入力信号類似値を計算する入力信号類似値計算手
段と、入力信号類似値計算手段で計算された入力信号類
似値に基づいて、入力信号注目窓を移動できる量を示す
移動可能量を計算する移動可能量計算手段と、移動可能
量計算手段で計算された移動可能量に基づいて、入力信
号注目窓の位置を決定し、その位置に該入力信号注目窓
を設定する入力信号注目窓位置決定手段と、入力信号類
似値計算手段と移動可能量計算手段と入力信号注目窓位
置決定手段とに対して、それぞれの処理を繰り返し行わ
せることによって、入力信号注目窓の各位置について、
入力信号類似値を計算させる繰返手段と、入力信号類似
値と予め設定された閾値との比較結果に基づいて、入力
信号上において入力信号注目窓が現在示す位置に参照信
号が存在するか否かを判定する判定手段として機能させ
るためのプログラムを記録した記録媒体である。
According to a twentieth aspect of the present invention, there is provided a computer, comprising: a reference signal generation means for generating a characteristic amount sequence for a reference signal registered in advance; and an input signal characteristic generating means for generating a characteristic amount sequence for an input signal inputted. Quantity generation means, input signal attention window setting means for setting an input signal attention window for the feature quantity sequence generated by the input signal feature quantity generation means, and feature quantity sequence generated by the reference signal feature quantity generation means And input signal similarity calculation means for calculating an input signal similarity value indicating the degree of similarity with the feature amount sequence in the input signal attention window, based on the input signal similarity value calculated by the input signal similarity value calculation means, A movable amount calculating means for calculating a movable amount indicating an amount capable of moving the input signal attention window, and a position of the input signal attention window is determined based on the movable amount calculated by the movable amount calculating means. The input signal attention window position determination means for setting the input signal attention window at the position, the input signal similarity value calculation means, the movable amount calculation means, and the input signal attention window position determination means perform the respective processing. By repeatedly performing, for each position of the input signal attention window,
An iterative means for calculating an input signal similarity value, and based on a result of comparison between the input signal similarity value and a preset threshold, whether or not a reference signal is present on the input signal at a position currently indicated by the input signal attention window. This is a recording medium on which a program for causing the program to function as a determination unit for determining whether or not the recording medium has been recorded.

【0027】[0027]

【発明の実施の形態】以下、図面を参照して、この発明
の実施形態について説明する。 §1.第1実施形態 まず、本発明の第1実施形態について図面を参照して説
明する。本発明では、様々な処理対象信号を用いること
ができるが、ここでは、該処理対象信号の一例として、
音響信号を用いる。また、本発明では、様々な特徴量お
よび様々な類似尺度を用いることができるが、ここで
は、該特徴量の一例として、(比較的効果が高いと考え
られる)零交差数のヒストグラム特徴を用い、該類似尺
度の一例として、正規化ヒストグラムの重なり類似値を
用いる。なお、ここにいう特徴量とは、処理対象信号の
一部分または全部の特徴を表す一つの数値あるいは二つ
以上の数値の組(例えばベクトル)を意味する。
Embodiments of the present invention will be described below with reference to the drawings. §1. First Embodiment First, a first embodiment of the present invention will be described with reference to the drawings. In the present invention, various processing target signals can be used, but here, as an example of the processing target signal,
Use acoustic signals. Further, in the present invention, various feature amounts and various similarity scales can be used. Here, as an example of the feature amount, a histogram feature of the number of zero crossings (which is considered to be relatively effective) is used. As an example of the similarity measure, an overlap similarity value of a normalized histogram is used. Here, the feature amount means one numerical value or a set of two or more numerical values (for example, a vector) representing a part or all of the characteristics of the signal to be processed.

【0028】図1は、本発明の第1実施形態による高速
信号探索方法を適用した高速信号探索装置の構成例を示
すブロック図である。また、図2は、同装置の動作例を
示すフローチャートである。本装置は、大きく分けて、
特徴テンプレート作成装置101と音響信号検出装置1
02とから構成される。
FIG. 1 is a block diagram showing a configuration example of a high-speed signal search device to which a high-speed signal search method according to a first embodiment of the present invention is applied. FIG. 2 is a flowchart showing an operation example of the device. This device is roughly divided into
Feature template creation device 101 and acoustic signal detection device 1
02.

【0029】ここで、図1に示される高速信号探索装置
は、具体的には、CPU(中央処理装置)およびその周
辺回路からなるコンピュータ装置で構成される。該コン
ピュータ装置は、所定の記録媒体(磁気ディスク、半導
体メモリ等)に記録された制御プログラムで制御される
ことによって、図1に示される各装置として機能する。
なお、上記制御プログラムは通信回線を介して頒布する
ことが可能である。
Here, the high-speed signal search device shown in FIG. 1 is specifically composed of a computer device comprising a CPU (central processing unit) and its peripheral circuits. The computer device functions as each device shown in FIG. 1 by being controlled by a control program recorded on a predetermined recording medium (magnetic disk, semiconductor memory, or the like).
The control program can be distributed via a communication line.

【0030】特徴テンプレート作成装置101は、参照
音響信号から辞書テンプレートを作成する(即ち、参照
音響信号の特徴量系列を生成する)装置である。該辞書
テンプレートは、入力音響信号の検出時に使用される。
以下、特徴テンプレート作成装置101の各部を説明す
る。音響信号入力装置103は、参照音響信号を学習デ
ータとして取り込み、取り込んだ参照音響信号を特徴抽
出装置104に供給する。例えば、特徴抽出装置104
以降の処理がディジタル的に行われるものであるなら
ば、音響信号入力装置103は、A/Dコンバーターな
どから構成される。特徴抽出装置104は、音響信号入
力装置103から供給された音響信号に基づいて、該音
響信号に関する特徴量(零交差数)を計算し(ステップ
S101)、該特徴量をヒストグラム作成装置105に
供給する。
The feature template creating apparatus 101 is an apparatus that creates a dictionary template from a reference audio signal (that is, generates a feature amount sequence of a reference audio signal). The dictionary template is used when detecting an input audio signal.
Hereinafter, each unit of the feature template creating apparatus 101 will be described. The sound signal input device 103 fetches the reference sound signal as learning data and supplies the fetched reference sound signal to the feature extraction device 104. For example, the feature extraction device 104
If the subsequent processing is performed digitally, the acoustic signal input device 103 includes an A / D converter and the like. The feature extraction device 104 calculates a feature amount (the number of zero crossings) related to the audio signal based on the audio signal supplied from the audio signal input device 103 (step S101), and supplies the feature amount to the histogram creation device 105. I do.

【0031】図3は、特徴抽出装置104の構成例を示
すブロック図である。この図において、フレーム分割器
113は、音響信号入力装置103から供給された音響
信号を一定時間(例えば11msec)間隔に分割し、該分割
された音響信号を零交差数計数器114と微分器115
とに供給する。ここでは、この一定時間を「フレーム」
と呼ぶ。零交差数計数器114は、供給された音響信号
(波形)が上記一定時間内に何回零レベルを交差するの
かを計数し、該計数結果を特徴抽出装置104の出力y1
として出力する。ここで、「零レベルを交差する」と
は、「信号レベルが正値から非正値に変化する場合」と
「信号レベルが非正値から正値に変化する場合」とを指
す。
FIG. 3 is a block diagram showing a configuration example of the feature extraction device 104. In this figure, a frame divider 113 divides an audio signal supplied from the audio signal input device 103 into fixed time intervals (for example, 11 msec), and divides the divided audio signal into a zero-crossing counter 114 and a differentiator 115.
And supply. Here, this fixed time is called “frame”
Call. The zero-crossing counter 114 counts how many times the supplied acoustic signal (waveform) crosses the zero level within the above-mentioned fixed time, and outputs the counted result to the output y1 of the feature extraction device 104.
Output as Here, “crossing the zero level” means “when the signal level changes from a positive value to a non-positive value” and “when the signal level changes from a non-positive value to a positive value”.

【0032】微分器115は、フレーム分割器113か
ら供給された音響信号を微分し、該微分結果を零交差数
計数器116と微分器117とに供給する。ここで、該
微分は、一例として、隣り合うサンプル値の間における
差分をとることによって行われる。零交差数計数器11
6は、零交差数計数器114と等価の構成であり、微分
器115から供給された信号が上記一定時間内に何回零
レベルを交差するのかを計数し、該計数結果を特徴抽出
装置104の出力y2として出力する。微分器117は、
微分器115と等価の構成であり、微分器115から供
給された信号を微分し、該微分結果を零交差数計数器1
18に供給する。零交差数計数器118は、零交差数計
数器114と等価の構成であり、微分器117から供給
された信号が上記一定時間内に何回零レベルを交差する
のかを計数し、該計数結果を特徴抽出装置104の出力
y3として出力する。以上、特徴抽出装置104の構成に
ついて説明したが、該特徴抽出装置104の構成はこの
ような構成に限定されることはなく、該特徴抽出装置1
04に供給された音響信号から該音響信号の特徴を抽出
する機能を有するものであれば、どのような構成であっ
てもよい。特徴は、例えばy1,y2,y3のようにいくつか
の特徴量を組にしたもので表現することができる。本出
願では、このようにいくつかの特徴量を組にしたものを
「特徴ベクトル」と称する。
The differentiator 115 differentiates the acoustic signal supplied from the frame divider 113 and supplies the result of the differentiation to a zero-crossing counter 116 and a differentiator 117. Here, the differentiation is performed, for example, by taking a difference between adjacent sample values. Zero-crossing counter 11
Numeral 6 denotes a configuration equivalent to the zero-crossing counter 114, which counts how many times the signal supplied from the differentiator 115 crosses the zero level within the above-mentioned fixed time, and outputs the count result to the feature extracting device 104. Is output as output y2. The differentiator 117 is
It has a configuration equivalent to the differentiator 115, differentiates the signal supplied from the differentiator 115, and compares the result of the differentiation with the zero-crossing number counter 1
18. The zero-crossing number counter 118 has a configuration equivalent to the zero-crossing number counter 114, counts how many times the signal supplied from the differentiator 117 crosses the zero level within the above-mentioned fixed time, and calculates the counting result. Of the feature extraction device 104
Output as y3. The configuration of the feature extraction device 104 has been described above, but the configuration of the feature extraction device 104 is not limited to such a configuration.
Any configuration may be used as long as it has a function of extracting characteristics of the audio signal from the audio signal supplied to the audio signal 04. A feature can be represented by a set of several feature values such as y1, y2, and y3. In the present application, such a set of some feature amounts is referred to as a “feature vector”.

【0033】ヒストグラム作成装置105は、特徴抽出
装置104から供給された各フレームごとの特徴ベクト
ルの系列から、その特徴ベクトルのヒストグラムを作成
する装置である(ステップS102)。特徴ベクトルの
ヒストグラムは、特徴ベクトルをいくつかのパターンに
分類し、各分類に属する特徴ベクトルの数を数えること
によって作成されることができる。特徴ベクトルをパタ
ーンに分類する方法は多数考えられるが、ヒストグラム
作成装置105は、例えば、上記特徴ベクトル(即ち、
各フレームにおける零交差数y1,y2,y3)が取りうる値
の範囲(最小値から最大値まで)を複数の区間に分割
し、各フレームにおける零交差数y1,y2,y3を(その値
に応じて)上記各区間のうちのいずれかに分類すること
によって、上記各区間の頻度を計数する。従って、この
例の場合には、各特徴量の区間数の積で与えられる数の
区間数をもつヒストグラムgを作成する。このように、
参照音響信号に対するヒストグラムを作成することによ
って学習段階は終了する。該ヒストグラムは、参照音響
信号のテンプレートとして、類似値計算装置110に供
給される。
The histogram creation device 105 is a device for creating a histogram of a feature vector from a series of feature vectors for each frame supplied from the feature extraction device 104 (step S102). A histogram of feature vectors can be created by classifying feature vectors into several patterns and counting the number of feature vectors belonging to each classification. There are many possible ways to classify feature vectors into patterns. The histogram creation device 105, for example, uses the feature vector (ie,
The range of values (from the minimum value to the maximum value) that can be taken by the number of zero crossings y1, y2, y3 in each frame is divided into multiple sections, and the number of zero crossings y1, y2, y3 in each frame is The frequency of each section is counted by categorizing it into any of the sections. Therefore, in the case of this example, a histogram g having the number of sections given by the product of the number of sections of each feature amount is created. in this way,
The learning phase ends by creating a histogram for the reference audio signal. The histogram is supplied to the similarity value calculation device 110 as a template of the reference sound signal.

【0034】音響信号検出装置102は、参照音響信号
に類似する音響信号が存在する位置を、入力音響信号系
列中から検出する。以下、音響信号検出装置102につ
いて具体的に説明する.
The acoustic signal detecting device 102 detects a position where an acoustic signal similar to the reference acoustic signal exists from the input acoustic signal sequence. Hereinafter, the acoustic signal detection device 102 will be specifically described.

【0035】音響信号入力装置106は、入力音響信号
を取り込む装置であり、音響信号入力装置103と等価
の構成である。音響信号入力装置106によって取り込
まれた音響信号は、注目領域走査抽出装置107に供給
される。注目領域走査抽出装置107は、音響信号入力
装置106から供給された音響信号から、入力信号注目
窓を用いて、該入力信号注目窓が示す部分的な注目領域
内の音響信号を抽出し(ステップS103)、該抽出さ
れた音響信号を特徴抽出装置108に供給する。注目領
域走査抽出装置107は、上記入力信号注目窓(即ち、
注目領域)の位置を順次移動させながら音響信号を抽出
していくが、この移動量は、上限値計算装置111によ
って計算される。なお、入力信号注目窓を順次移動させ
ていく間、該入力信号注目窓の大きさは一定である。
The sound signal input device 106 is a device for taking in an input sound signal, and has a configuration equivalent to the sound signal input device 103. The acoustic signal captured by the acoustic signal input device 106 is supplied to the attention area scanning / extracting device 107. The attention area scanning / extracting device 107 extracts an audio signal in a partial attention area indicated by the input signal attention window from the audio signal supplied from the audio signal input device 106 using the input signal attention window (step S103), supplying the extracted sound signal to the feature extraction device 108. The attention area scanning / extracting device 107 outputs the input signal attention window (ie,
The acoustic signal is extracted while sequentially moving the position of the region of interest, and the amount of movement is calculated by the upper limit value calculation device 111. Note that the size of the input signal attention window is constant while the input signal attention window is sequentially moved.

【0036】特徴抽出装置108は、特徴抽出装置10
4と等価の構成であり、その構成例は、図3に示される
ようなものである。特徴抽出装置108は、音響信号入
力装置107で抽出された音響信号に基づいて、該音響
信号に関する特徴量を計算する(ステップS104)。
特徴抽出装置108の出力は、ヒストグラム作成装置1
09に供給される。ヒストグラム作成装置109は、ヒ
ストグラム作成装置105と等価の構成であり、特徴抽
出装置108から供給された特徴量(即ち、各フレーム
における零交差数y1,y2,y3)について、零交差数の頻
度を計数することによって、該特徴量のヒストグラムh
を作成し(ステップS105)、該ヒストグラムhを類
似値計算装置110に供給する。
The feature extraction device 108 is a feature extraction device 10
4, and an example of the configuration is as shown in FIG. The feature extraction device 108 calculates a feature amount related to the sound signal based on the sound signal extracted by the sound signal input device 107 (step S104).
The output of the feature extraction device 108 is the histogram creation device 1
09. The histogram creation device 109 has a configuration equivalent to that of the histogram creation device 105, and determines the frequency of the number of zero crossings for the feature amount (that is, the number of zero crossings y1, y2, y3 in each frame) supplied from the feature extraction device 108. By counting, the histogram h of the feature amount is calculated.
Is created (step S105), and the histogram h is supplied to the similarity value calculation device 110.

【0037】類似値計算装置110は、ヒストグラム作
成装置109から供給された正規化ヒストグラムhと特
徴テンプレート作成装置101から供給された正規化ヒ
ストグラムgとの類似値を計算する(ステップS10
6)。類似値としては、さまざまな定義が可能である
が、ここでは、その一例として、以下の式で示される重
なり類似値を利用する。
The similarity calculator 110 calculates the similarity between the normalized histogram h supplied from the histogram generator 109 and the normalized histogram g supplied from the feature template generator 101 (step S10).
6). As the similarity value, various definitions are possible. Here, as an example, an overlap similarity value represented by the following expression is used.

【0038】[0038]

【数2】 (Equation 2)

【0039】ここで、Dはヒストグラムの総度数であ
り、Lはヒストグラムの区間数であり、gjはヒストグ
ラムgのj番目の区間の値であり、hjはヒストグラム
hのj番目の区間の値であり、min(gj,hj)はg
jとhjとにおける小さい方の値を示す。計算された類似
値は、上限値計算装置111と検出判定装置112とに
供給される。
Here, D is the total frequency of the histogram, L is the number of sections of the histogram, g j is the value of the j-th section of the histogram g, and h j is the value of the j-th section of the histogram h. Min (g j , h j ) is g
The smaller value of j and hj is shown. The calculated similarity value is supplied to the upper limit value calculation device 111 and the detection determination device 112.

【0040】なお、ヒストグラム間の相関の度合いを示
す類似尺度としては、上記重なり類似値に限らず、例え
ば、ヒストグラム間の距離に対応する値を用いてもよ
い。ここで、「ヒストグラム間の距離に対応する値」と
は、例えば、正規化ヒストグラムg,hにおいて互いに
対応する各区間の頻度の差の絶対値を全区間にわたって
合計した値(Σ|gj−hj|)である。
The similarity measure indicating the degree of correlation between histograms is not limited to the above-mentioned overlap similarity value, but may be, for example, a value corresponding to the distance between histograms. Here, the “value corresponding to the distance between the histograms” is, for example, a value obtained by summing the absolute values of the frequency differences between the corresponding sections in the normalized histograms g and h over all the sections (Σ | g j − h j |).

【0041】上限値計算装置111は、すでに得られた
類似値に基づいて、該類似値が得られた点の近傍の各点
について、該各点おける類似値の上限値を計算する。例
えば、ヒストグラムの重なり類似値の場合には、図4に
示されるように、(入力音響信号の時系列に対して設定
される)窓Aのヒストグラムと窓Bのヒストグラムとの
差異は、窓Aと窓Bとの非共通領域に含まれるサンプル
数に依存するだけである。つまり、重なり類似値のよう
に、正規化ヒストグラムにおいてフレーム単位で求めた
各区間毎の比較結果を全区間に対して累積した値に基づ
いて類似値が決定される場合、入力信号注目窓を移動し
た場合に生じる類似値の変化は、必ず、全サンプル数
(この場合は入力信号注目窓内のフレームの数)に対し
て移動前後の入力信号注目窓の間で非共通のサンプルの
数が占める割合に限られることになる。この性質を利用
すれば、ある入力信号注目窓内の入力音響信号の特徴量
とある参照信号の特徴量との類似値は、該入力信号注目
窓の近傍における(入力信号注目窓内の入力音響信号の
特徴量とある参照信号の特徴量との)類似値によって、
一定の上限値以下(距離の場合は下限値以上)に制限さ
れることになる。
The upper limit value calculating device 111 calculates the upper limit value of the similarity value at each point in the vicinity of the point at which the similarity value is obtained, based on the similarity value already obtained. For example, in the case of overlapping similar values of histograms, as shown in FIG. 4, the difference between the histogram of window A and the histogram of window B (set for the time series of the input audio signal) is It only depends on the number of samples included in the non-common area between the window and the window B. In other words, when the similarity value is determined based on a value obtained by accumulating the comparison results for each section obtained in the normalized histogram for each frame for all the sections, like the overlapping similarity value, the input signal attention window is moved. The change in the similarity value that occurs when the input signal attention window before and after the movement occupies the total number of samples (in this case, the number of frames in the input signal attention window). It will be limited to the ratio. By utilizing this property, the similarity value between the feature value of the input audio signal in a certain input signal attention window and the feature value of a certain reference signal can be calculated by using the (input audio signal in the input signal attention window) near the input signal attention window. By the similarity value between the signal features and the features of a reference signal,
The distance is limited to a certain upper limit or less (in the case of a distance, more than the lower limit).

【0042】例として、ある閾値以上の類似値の領域を
探し出す場合を考える。この場合、ある時点の入力音響
信号の特徴ヒストグラムと特徴テンプレート作成装置1
01によって作成されたヒストグラムとの類似値を求め
る(照合を行う)と、入力音響信号におけるその近傍の
時点における類似値の上限値は、実際にそれらの時点に
おいて特徴テンプレートのヒストグラムとの類似値を求
める(照合を行う)ことなく、計算によって求めること
ができる。即ち、類似値の上限値が閾値以下である区間
においては、類似値を求める操作は必要ないため、これ
を省略することができる。例えば、この例の場合には、
ある時刻における入力音響信号に対するヒストグラムh
と特徴テンプレート作成装置101によって作成された
ヒストグラムgとから求められた類似値をS(図2のス
テップS106、図4の処理31)とし、探索している
類似値の閾値をθとし、入力信号注目窓内のフレーム数
をDとすると、S<θの場合には、入力信号注目窓の移
動可能量はfloor{D(θ−S)}+1フレームと
計算することができる(図2のステップS107、図4
の処理32)。ここで、floor{}は小数点以下の
切り下げを表す。この移動可能量は、注目領域走査抽出
装置107に供給される。注目領域走査抽出装置107
は、この移動可能量に基づいて、入力信号注目窓を移動
させる(ステップS108)。
As an example, consider a case of searching for a region having a similar value equal to or greater than a certain threshold. In this case, the feature histogram of the input audio signal at a certain time and the feature template creating apparatus 1
When the similarity value with the histogram created in FIG. 01 is obtained (matching is performed), the upper limit value of the similarity value in the vicinity of the input audio signal at the time point near the actual value is the similarity value with the histogram of the feature template at those time points. It can be obtained by calculation without obtaining (checking). That is, in a section in which the upper limit value of the similarity value is equal to or less than the threshold value, the operation for obtaining the similarity value is not necessary, and thus can be omitted. For example, in this case,
Histogram h for an input sound signal at a certain time
The similarity value obtained from the histogram and the histogram g created by the feature template creation device 101 is represented by S (step S106 in FIG. 2, processing 31 in FIG. 4), the threshold of the similarity value being searched is represented by θ, and the input signal Assuming that the number of frames in the window of interest is D, if S <θ, the movable amount of the window of interest of the input signal can be calculated as floor {D (θ−S)} + 1 frames (step in FIG. 2). S107, FIG.
Processing 32). Here, floor $ represents rounding down to the decimal point. This movable amount is supplied to the attention area scanning / extracting device 107. Attention area scan extraction device 107
Moves the input signal attention window based on the movable amount (step S108).

【0043】なお、この処理では、適切な閾値θを設定
することが重要である。しかし、適切な閾値θは、入力
音響信号や参照音響信号によって、あるいは、探索のパ
ラメータによって異なるため、該閾値θを単一の固定値
とすることは得策ではない。そこで、ここでは、時間軸
方向に探索を行った際の類似値の平均mと分散vとに基
づいて、閾値θを、θ=m+cvと定める。ここで、m
とvとは、探索に先立って入力音響信号の特徴ベクトル
をサンプリングし、類似値の統計を取ることによって定
められる。また、cは所定のパラメータである。
In this process, it is important to set an appropriate threshold value θ. However, since the appropriate threshold value θ differs depending on the input audio signal or the reference audio signal or depending on the search parameters, it is not advisable to set the threshold value θ to a single fixed value. Therefore, here, the threshold θ is determined as θ = m + cv based on the average m and the variance v of the similarity values when the search is performed in the time axis direction. Where m
And v are determined by sampling the feature vector of the input audio signal prior to the search and taking statistics of similarity values. C is a predetermined parameter.

【0044】本装置は、このようにして、入力信号注目
窓を順次移動させていき、入力信号注目窓が入力音響信
号の終端を越えるまで、同様の処理を繰り返す。このと
き、検出判定装置112は、類似値計算装置110から
供給された類似値が上記閾値θを越えれば、「入力信号
注目窓内の音響信号は参照音響信号に等しい」と判断
し、該入力信号注目窓の位置(即ち、該音響信号の発生
時刻)を結果として出力する(ステップS109)。以
上の処理によって、入力音響信号中から参照音響信号の
位置(発生時刻)を検出することができる。
The apparatus sequentially moves the window of interest of the input signal in this way, and repeats the same processing until the window of interest of the input signal exceeds the end of the input audio signal. At this time, if the similarity value supplied from the similarity value calculation device 110 exceeds the threshold θ, the detection determination device 112 determines that “the acoustic signal in the input signal attention window is equal to the reference acoustic signal”, and The position of the signal attention window (that is, the generation time of the acoustic signal) is output as a result (step S109). Through the above processing, the position (occurrence time) of the reference sound signal can be detected from the input sound signal.

【0045】本実施形態を用いて、実際にテレビ放送か
ら録音した2分間の入力音響信号から、予め登録された
参照音響信号と類似した部分を検出する実験を行った。
なお登録データとして用いた参照音響信号は入力音響信
号の一部分を別に録音し入力したものを使用した。参照
音響信号として、その信号の長さを5.94秒、11.
89秒とし、各109個の異なる音響信号を用いて実験
を行った。その検出精度を図5に、総当たりでずらしな
がら照合を取る手法との照合回数の比較を図6に示す。
なお、図5において、「再現率」および「精度」は、以
下の式によって計算される。 (再現率)=(正しく検出された数)/(正しい箇所の
数) (精度)=(正しく検出された数)/(検出された総
数)
Using this embodiment, an experiment was performed to detect a part similar to a previously registered reference sound signal from a 2-minute input sound signal actually recorded from a television broadcast.
The reference sound signal used as the registration data was obtained by separately recording and inputting a part of the input sound signal. As a reference acoustic signal, the length of the signal is 5.94 seconds, and 11.
The experiment was performed with 89 seconds each using 109 different acoustic signals. FIG. 5 shows the detection accuracy, and FIG. 6 shows the comparison of the number of times of comparison with the method of performing matching while shifting in a round robin manner.
In FIG. 5, "recall" and "accuracy" are calculated by the following equations. (Recall) = (Number of correctly detected points) / (Number of correct points) (Accuracy) = (Number of correctly detected points) / (Total number of detected points)

【0046】§2.第2実施形態 次に、本発明の第2実施形態について図面を参照して説
明する。第1実施形態では、予め登録された参照信号に
類似した信号の位置を検出する方法として、参照信号と
入力信号との特徴量を計算して両者の類似値を判定する
方法が説明された。さらに、第1実施形態では、一定時
間長の窓(注目領域)を単位として、参照信号と入力信
号との特徴量の類似値を計算し、その類似値計算が行わ
れた注目領域の近傍の注目領域における類似値の上限値
に基づいて該注目領域の移動量を決定することにより、
計算量を減らして検索速度を高める方法が説明された。
§2. Second Embodiment Next, a second embodiment of the present invention will be described with reference to the drawings. In the first embodiment, as a method of detecting a position of a signal similar to a previously registered reference signal, a method of calculating a feature amount of a reference signal and an input signal and determining a similar value between the two has been described. Further, in the first embodiment, the similarity value of the feature amount between the reference signal and the input signal is calculated in units of a window (attention region) having a certain time length, and the similarity value calculation is performed in the vicinity of the attention region. By determining the movement amount of the attention area based on the upper limit of the similarity value in the attention area,
A method for reducing the amount of calculation and increasing the search speed has been described.

【0047】しかしながら、第1実施形態の方法には、
「雑音等によって信号が変動する場合や、(例えば、ア
ナウンスの音響信号のように)平均的な特徴では信号を
区別し難い場合等では、信号を十分に検出できない」と
いう課題がある。
However, in the method of the first embodiment,
There is a problem that the signal cannot be sufficiently detected when the signal fluctuates due to noise or the like, or when it is difficult to distinguish the signal with an average feature (such as an acoustic signal of an announcement).

【0048】そこで、第2実施形態では、雑音等によっ
て信号が変動する場合や、平均的な特徴では信号を区別
し難い場合等であっても、より高い精度で信号を検出で
きる高速信号探索方法について説明する。
Therefore, in the second embodiment, even when the signal fluctuates due to noise or the like, or when it is difficult to distinguish the signal with an average feature, a high-speed signal search method capable of detecting the signal with higher accuracy is provided. Will be described.

【0049】図7は、本発明の第2実施形態による高速
信号探索方法を適用した高速信号探索装置の構成例を示
すブロック図である。本発明では、様々な処理対象信号
を用いることができるが、ここでは、該処理対象信号の
一例として、音響信号を用いる。本装置は、参照特徴量
抽出手段201と入力特徴量抽出手段202と類似値計
算手段203と移動量計算手段204とによって構成さ
れる。本装置は、予め登録された参照音響信号(即ち、
見本となる検索したい音響信号)と入力音響信号(即
ち、検索される音響信号)とを入力とし、参照音響信号
と入力音響信号との類似値が所定の閾値θを越える箇所
を入力音響信号から検出する。
FIG. 7 is a block diagram showing a configuration example of a high-speed signal search device to which the high-speed signal search method according to the second embodiment of the present invention is applied. In the present invention, various signals to be processed can be used. Here, an acoustic signal is used as an example of the signal to be processed. This apparatus is composed of a reference feature amount extraction unit 201, an input feature amount extraction unit 202, a similar value calculation unit 203, and a movement amount calculation unit 204. The present device is provided with a pre-registered reference sound signal (ie,
A sample audio signal to be searched) and an input audio signal (that is, an audio signal to be searched) are input, and a portion where a similar value between the reference audio signal and the input audio signal exceeds a predetermined threshold θ is determined from the input audio signal. To detect.

【0050】ここで、図7に示される高速信号探索装置
は、具体的には、CPU(中央処理装置)およびその周
辺回路からなるコンピュータ装置で構成される。該コン
ピュータ装置は、所定の記録媒体(磁気ディスク、半導
体メモリ等)に記録された制御プログラムで制御される
ことによって、図7に示される各手段として機能する。
なお、上記制御プログラムは通信回線を介して頒布する
ことが可能である。
Here, the high-speed signal search device shown in FIG. 7 is specifically constituted by a computer device comprising a CPU (central processing unit) and its peripheral circuits. The computer device functions as each unit shown in FIG. 7 by being controlled by a control program recorded on a predetermined recording medium (magnetic disk, semiconductor memory, or the like).
The control program can be distributed via a communication line.

【0051】図7において、参照特徴量抽出手段201
は、参照音響信号から生成された特徴量系列上に注目窓
(以下、「参照信号注目窓」と称する)を設定し、該参
照信号注目窓を複数の注目窓(以下、「参照信号分割注
目窓」と称する)に分割し、各参照信号分割注目窓内の
特徴量系列を類似値計算手段203へ供給する。入力特
徴量抽出手段202は、入力音響信号から生成された特
徴量系列上に注目窓(以下、「入力信号注目窓」と称す
る)を設定し、該入力信号注目窓を複数の注目窓(以
下、「入力信号分割注目窓」と称する)に分割し、各入
力信号分割注目窓内の特徴量系列を類似値計算手段20
3へ供給する。
Referring to FIG. 7, reference feature amount extraction means 201
Sets a window of interest (hereinafter, referred to as a “reference signal window of interest”) on a feature amount sequence generated from a reference audio signal, and sets the reference signal window of interest to a plurality of windows of interest (hereinafter, “reference signal division window of interest”). , And supplies the feature value sequence in each reference signal division window of interest to the similarity value calculation means 203. The input feature extraction unit 202 sets a window of interest (hereinafter, referred to as an “input signal window of interest”) on a feature value sequence generated from the input audio signal, and sets the input signal window of interest to a plurality of windows of interest (hereinafter, referred to as “windows of interest”). , Referred to as “input signal division window of interest”), and the feature value sequence in each input signal division window of interest is calculated by the similarity value calculating unit 20.
Supply to 3.

【0052】類似値計算手段203は、参照特徴量抽出
手段201および入力特徴量抽出手段202から供給さ
れた特徴量系列に基づいて、各参照信号分割注目窓内の
特徴量系列と(該参照信号分割注目窓に対応する)各入
力信号分割注目窓内の特徴量系列との類似値(以下、
「入力信号類似値」と称する)を計算する。そして、類
似値計算手段203は、計算された入力信号類似値が閾
値θより大きいか否かに基づいて、入力信号注目窓が現
在示す位置に参照音響信号が存在するか否かを判定す
る。入力信号注目窓が現在示す位置に参照音響信号が存
在する場合、類似値計算手段203は、入力信号注目窓
が現在示す位置(時刻等)を信号検出結果として出力す
る。又、類似値計算手段203は、入力信号注目窓の移
動可能量を計算するために必要な類似値を、移動量計算
手段204へ供給する。
The similarity value calculating means 203 calculates a feature value sequence in each reference signal division window of interest based on the feature value sequences supplied from the reference feature value extracting means 201 and the input feature value extracting means 202 (the reference signal A similar value (hereinafter, referred to as a feature amount series) in each input signal divided window of interest corresponding to the divided window of interest.
(Referred to as "input signal similarity value"). Then, based on whether the calculated input signal similarity value is greater than the threshold value θ, the similarity value calculation unit 203 determines whether or not the reference sound signal exists at the position currently indicated by the input signal attention window. When the reference sound signal exists at the position currently indicated by the input signal attention window, the similarity value calculation unit 203 outputs the position (time or the like) currently indicated by the input signal attention window as a signal detection result. Further, the similarity value calculating means 203 supplies a similarity value necessary for calculating the movable amount of the input signal attention window to the moving amount calculating means 204.

【0053】移動量計算手段204は、類似値計算手段
203から供給された類似値に基づいて、該類似値に対
応する入力信号注目窓の近傍の入力信号注目窓に関する
類似値の上限値を計算する。そして、移動量計算手段2
04は、その上限値に基づいて、入力信号注目窓の移動
可能量を計算し、該移動可能量を入力特徴量抽出手段2
02へ供給する。これによって、入力特徴量抽出手段2
02は、入力信号注目窓の位置を、移動量計算手段20
4から供給された移動可能量だけ移動させる。このよう
に、本装置は、入力信号注目窓を順次移動させながら、
移動後の入力信号注目窓内の入力音響信号から生成され
る特徴量系列について、上記各処理を同様に繰り返す。
Based on the similarity value supplied from the similarity value calculating means 203, the movement amount calculating means 204 calculates the upper limit value of the similarity value for the input signal attention window near the input signal attention window corresponding to the similar value. I do. Then, the moving amount calculating means 2
04 calculates the amount of movement of the window of interest of the input signal based on the upper limit value and calculates the amount of movement as the input feature amount extraction means 2
02. As a result, the input feature amount extraction means 2
02 indicates the position of the input signal attention window,
4 is moved by the movable amount supplied from 4. In this way, the present apparatus moves the input signal attention window sequentially,
Each of the above-described processes is similarly repeated for a feature amount sequence generated from the input audio signal in the input signal attention window after the movement.

【0054】次に、図8および図9を参照して、本装置
の動作を具体的に説明する。参照特徴量抽出手段201
は、初めに、予め登録された参照音響信号を読み込む。
次に、参照特徴量抽出手段201は、読み込まれた参照
音響信号について、特徴量の抽出を行う(ステップS2
01)。本発明では、様々な特徴量を用いることができ
るが、ここでは、該特徴量の一例として、スペクトル特
徴を用いる。この場合、特徴量の抽出は、例えば、帯域
通過フィルタを用いて行うことができる。
Next, the operation of the present apparatus will be specifically described with reference to FIGS. Reference feature extraction means 201
First, a reference sound signal registered in advance is read.
Next, the reference feature extracting unit 201 extracts a feature from the read reference acoustic signal (step S2).
01). In the present invention, various feature values can be used. Here, a spectrum feature is used as an example of the feature value. In this case, the feature amount can be extracted using, for example, a band-pass filter.

【0055】特徴量抽出の具体例を以下に説明する。例
えば、テレビやラジオ等の放送信号から10秒程度の特
定の音響信号を検索したい場合、図10に示す装置で特
徴量を抽出すると、良い結果が得られる。即ち、7個の
帯域通過フィルタを該帯域通過フィルタの中心周波数が
対数軸上で等間隔になるように設定し、各帯域通過フィ
ルタの出力波形に対して60ミリ秒の時間窓を設定し、
その時間窓内における出力波形の自乗の平均値を計算す
る。このようにして得られた7個の平均値を一組にして
7次元特徴ベクトルとする。この時間窓を12ミリ秒ず
つずらしながら、順次特徴ベクトルの算出を行う。この
場合、特徴ベクトルは、12ミリ秒毎に1つずつ得られ
る。参照特徴量抽出手段201においては、このように
して、参照音響信号の各周波数帯域の成分を要素とする
特徴ベクトルが、時系列的に順次得られる。なお、上記
特徴量抽出方法としては、この他に、以下の方法も考え
られる。その方法とは、即ち、7個の帯域通過フィルタ
を該帯域通過フィルタの中心周波数が対数軸上で等間隔
になるように設定し、各帯域通過フィルタの出力を12
ミリ秒毎に60ミリ秒幅で取り出し、取り出された出力
とその直前に取り出された出力との差分を計算し、該差
分の自乗の平均値を計算し、得られた7個の平均値を一
組にして7次元特徴ベクトルとする方法である。
A specific example of feature value extraction will be described below. For example, when it is desired to search for a specific acoustic signal of about 10 seconds from a broadcast signal of a television or a radio, a good result can be obtained by extracting a feature amount using the apparatus shown in FIG. That is, seven band-pass filters are set such that the center frequencies of the band-pass filters are equally spaced on a logarithmic axis, and a time window of 60 ms is set for the output waveform of each band-pass filter.
The average value of the square of the output waveform within the time window is calculated. A set of the seven average values obtained in this way is defined as a seven-dimensional feature vector. The feature vectors are sequentially calculated while shifting the time window by 12 milliseconds. In this case, one feature vector is obtained every 12 milliseconds. In this way, the reference feature amount extracting means 201 sequentially obtains a feature vector having components of each frequency band of the reference acoustic signal as elements. In addition, as the above-mentioned feature amount extraction method, the following method is also conceivable. That is, seven band-pass filters are set such that the center frequencies of the band-pass filters are equally spaced on a logarithmic axis, and the output of each band-pass filter is set to 12
Takes out every 60 milliseconds every millisecond, calculates the difference between the taken out output and the just taken out output, calculates the average of the squares of the difference, and calculates the obtained seven averages. This is a method of forming a set as a seven-dimensional feature vector.

【0056】続いて、参照特徴量抽出手段201は、そ
れら特徴ベクトルの時系列に対して注目窓を設定する
(ステップS202)。参照特徴量抽出手段201は、
まず、参照音響信号全体に対して1つの注目窓(参照信
号注目窓)を設定する(図8中、参照特徴量抽出手段2
01内の“注目窓”参照)。尚、図8には、「参照信号
注目窓内の横方向が時間軸に相当し、該時間軸方向にお
いて特徴ベクトルが順次得られる」ことが模式的に示さ
れている。
Subsequently, the reference feature quantity extraction means 201 sets a window of interest for the time series of those feature vectors (step S202). The reference feature extraction means 201
First, one attention window (reference signal attention window) is set for the entire reference acoustic signal (see FIG. 8, reference feature extraction means 2).
01, see “note window”). FIG. 8 schematically shows that “the horizontal direction in the reference signal attention window corresponds to the time axis, and the feature vectors are sequentially obtained in the time axis direction”.

【0057】次に、参照特徴量抽出手段201は、参照
信号注目窓を、時間軸方向において、複数の参照信号分
割注目窓に分割する(ステップS203、図8の参照特
徴量抽出手段201内の“分割”参照)。尚、この分割
数は、処理対象とする信号の形態等に応じて適宜定めら
れ得るが、ここでは、例えば8分割とする。これによ
り、参照特徴量抽出手段201は、各参照信号分割注目
窓に含まれる特徴量(即ち、特徴ベクトルの時系列)
を、順次、類似値計算手段203へ供給する。
Next, the reference feature extraction means 201 divides the reference signal attention window into a plurality of reference signal division attention windows in the time axis direction (step S203, the reference feature extraction means 201 in FIG. 8). See “Split”). Note that the number of divisions can be determined as appropriate according to the form of the signal to be processed and the like, but here, for example, eight divisions. As a result, the reference feature value extraction unit 201 determines the feature value (ie, the time series of feature vectors) included in each reference signal division window of interest.
Are sequentially supplied to the similarity calculation means 203.

【0058】入力特徴量抽出手段202は、初めに、入
力音響信号を読み込む。次に、入力特徴量抽出手段20
2は、読み込まれた入力音響信号について、特徴量の抽
出を行う(ステップS204)。ここで、入力特徴量抽
出手段202は、参照特徴量抽出手段201と同じ方法
(図10参照)で、特徴量(即ち、7次元特徴ベクトル
の時系列)を抽出する。故に、ここでは、その説明を省
略する。
The input characteristic amount extracting means 202 first reads an input audio signal. Next, the input feature amount extraction means 20
2 extracts a feature amount from the read input audio signal (step S204). Here, the input feature amount extraction unit 202 extracts a feature amount (that is, a time series of seven-dimensional feature vectors) by the same method as the reference feature amount extraction unit 201 (see FIG. 10). Therefore, the description is omitted here.

【0059】続いて、入力特徴量抽出手段202は、そ
れら特徴ベクトルの時系列に対して注目窓を設定する
(ステップS205)。入力特徴量抽出手段202は、
まず、上記参照信号注目窓と同じ長さの注目窓(入力信
号注目窓)を入力音響信号に対して設定する(図8中、
入力特徴量抽出手段202内の“注目窓”参照)。尚、
図8には、「入力信号注目窓内の横方向が時間軸に相当
し、該時間軸方向において特徴ベクトルが順次得られ
る」ことが模式的に示されている。
Subsequently, the input feature quantity extracting means 202 sets a window of interest for the time series of those feature vectors (step S205). The input feature amount extraction means 202
First, an attention window (input signal attention window) having the same length as the reference signal attention window is set for the input audio signal (in FIG. 8,
(See "attention window" in the input feature amount extraction means 202). still,
FIG. 8 schematically illustrates that “the horizontal direction in the input signal attention window corresponds to the time axis, and the feature vectors are sequentially obtained in the time axis direction”.

【0060】尚、入力信号注目窓の位置は、処理開始当
初は、入力音響信号から作成された特徴量系列の先頭に
設定されるが、処理の進行と共に、後述する方法によっ
て、該特徴量系列上を時間軸方向に順次移動される。こ
の移動量は、移動量計算手段204によって計算され
る。
Note that the position of the input signal attention window is set at the beginning of the feature amount sequence created from the input audio signal at the beginning of the process. The upper part is sequentially moved in the time axis direction. This moving amount is calculated by the moving amount calculating means 204.

【0061】続いて、入力特徴量抽出手段202は、入
力信号注目窓を、時間軸方向において、複数の入力信号
分割注目窓に分割する(ステップS206、図8の入力
特徴量抽出手段202内の“分割”参照)。尚、入力信
号注目窓の分割数は、参照信号注目窓の分割数と等し
い。これにより、入力特徴量抽出手段202は、各入力
信号分割注目窓に含まれる特徴量(即ち、特徴ベクトル
の時系列)を、順次、類似値計算手段203へ出力す
る。
Subsequently, the input feature extraction unit 202 divides the input signal attention window into a plurality of input signal division attention windows in the time axis direction (step S206, the input feature extraction unit 202 in FIG. 8). See “Split”). Note that the number of divisions of the input signal attention window is equal to the number of divisions of the reference signal attention window. As a result, the input feature amount extraction unit 202 sequentially outputs the feature amounts (ie, time series of feature vectors) included in each input signal division window of interest to the similarity value calculation unit 203.

【0062】類似値計算手段203は、参照特徴量抽出
手段201から、参照信号分割注目窓で分割された特徴
ベクトルの時系列を順次読込み、かつ、入力特徴量抽出
手段202から、入力信号分割注目窓で分割された特徴
ベクトルの時系列を順次読込む。
The similarity value calculating means 203 sequentially reads the time series of the feature vectors divided by the reference signal dividing attention window from the reference feature extracting means 201, and reads the input signal dividing attention from the input feature extracting means 202. The time series of the feature vectors divided by the window is sequentially read.

【0063】次に、類似値計算手段203は、参照信号
分割注目窓内の特徴ベクトルの時系列に基づいて、該特
徴ベクトルのヒストグラムを作成し(ステップS20
7)、かつ、入力信号分割注目窓内の特徴ベクトルの時
系列に基づいて、該特徴ベクトルのヒストグラムを作成
する(ステップS208)。これらのヒストグラムは、
いずれも、特徴ベクトルの各要素が取りうる値の範囲
(最小値から最大値まで)を複数のビン(区間)に分割
することによって作成される。例えば、各要素が取りう
る値の範囲を3つの区間(仮に、「区間A,B,C」と
する)に分割し、かつ、各特徴ベクトルの要素数が7で
あるとすれば、7個の要素のそれぞれは区間A,B,C
のうちのいずれかに属することになる。従って、1つの
特徴ベクトルについて考えると、該特徴ベクトルの要素
の組み合わせとしては、7個の要素が全て区間Aに属す
ることを示す(A,A,A,A,A,A,A)から、7
個の要素が全て区間Cに属することを示す(C,C,
C,C,C,C,C)まで、合計で3の7乗通りの組み
合わせが考えられる。以上のことから、特徴ベクトルの
ヒストグラムの全体のビン数(即ち、ヒストグラムの横
軸に配置される区間の数)は3の7乗個となる。従っ
て、このようにヒストグラムの横軸を設定する場合に
は、各特徴ベクトルは、この3の7乗個の区間のうちの
どれか一つに分類されることとなる。
Next, the similarity value calculating means 203 creates a histogram of the feature vector based on the time series of the feature vector in the reference signal division window of interest (step S20).
7) A histogram of the feature vector is created based on the time series of the feature vector in the input signal division window of interest (step S208). These histograms are
Each of them is created by dividing the range of values (from the minimum value to the maximum value) that each element of the feature vector can take into a plurality of bins (sections). For example, if the range of values that each element can take is divided into three sections (tentatively, “sections A, B, and C”), and if the number of elements of each feature vector is 7, then 7 Each of the elements of section A, B, C
Will belong to any of the above. Therefore, when considering one feature vector, the combination of the elements of the feature vector indicates that all seven elements belong to the section A (A, A, A, A, A, A, A). 7
Elements belong to the section C (C, C,
Up to C, C, C, C, C), a total of 3 7 combinations are conceivable. From the above, the total number of bins of the histogram of the feature vector (that is, the number of sections arranged on the horizontal axis of the histogram) is 3 7. Therefore, when the horizontal axis of the histogram is set in this manner, each feature vector is classified into any one of the 3 7 sections.

【0064】以上述べた方法によって、類似値計算手段
203は、参照特徴量抽出手段201から供給された
(時間軸方向に分割された)特徴ベクトルと入力特徴量
抽出手段202から供給された(時間軸方向に分割され
た)特徴ベクトルとについて、それぞれヒストグラムを
作成する。ここでは、これらのヒストグラムを、G1
2,…,GnおよびH1,H2,…,Hnとする。ただ
し、nは元の注目窓(参照信号注目窓および入力信号注
目窓)の分割数であり(以下、1〜nを「分割番号」と
称する)、Gは参照音響信号の特徴ベクトルから作成さ
れたヒストグラム(以下、「参照信号ヒストグラム」と
称する)を示し、Hは入力音響信号の特徴ベクトルから
作成されたヒストグラム(以下、「入力信号ヒストグラ
ム」と称する)を示す。
According to the method described above, the similarity value calculating means 203 is supplied with the feature vector supplied from the reference feature value extracting means 201 (divided in the time axis direction) and the feature vector supplied from the input feature value extracting means 202 (time value). A histogram is created for each of the feature vectors (divided in the axial direction). Here, these histograms are represented by G 1 ,
G 2, ..., G n and H 1, H 2, ..., and H n. Here, n is the number of divisions of the original window of interest (the reference signal window of interest and the input signal window of interest) (hereinafter, 1 to n are referred to as “division numbers”), and G is created from the feature vector of the reference sound signal. H indicates a histogram (hereinafter, referred to as “reference signal histogram”), and H indicates a histogram created from the feature vector of the input audio signal (hereinafter, referred to as “input signal histogram”).

【0065】続いて、類似値計算手段203は、分割番
号が等しい参照信号ヒストグラムと入力信号ヒストグラ
ムとの類似値を計算する(ステップS209)。本発明
では、様々な類似値を用いることができるが、ここで
は、該類似値の一例として、重なり類似値を用いる。こ
こで、分割番号kにおける(参照信号ヒストグラムと入
力信号ヒストグラムとの)類似値Skは、以下の式によ
って定義される。
Subsequently, the similarity value calculating means 203 calculates the similarity value between the input signal histogram and the reference signal histogram having the same division number (step S209). In the present invention, various similar values can be used. Here, an overlapping similar value is used as an example of the similar value. Here, the similarity value S k (between the reference signal histogram and the input signal histogram) at the division number k is defined by the following equation.

【0066】[0066]

【数3】 (Equation 3)

【0067】ここで、Dkは分割番号kのヒストグラム
の総度数であり、Lはヒストグラムの区間数(上記の例
では3の7乗)であり、gk jはk番目のヒストグラムG
kのj番目の区間の値であり、hk jはk番目のヒストグ
ラムHkのj番目の区間の値であり、min(gk j,hk
j)はgk jとhk jとにおける小さい方の値を示す。
Here, D k is the total frequency of the histogram of the division number k, L is the number of sections of the histogram (3 to the seventh power in the above example), and g k j is the k-th histogram G
k is the value of the j-th section, h k j is the value of the j-th section of the k-th histogram H k , and min (g k j , h k
j ) indicates the smaller value of g k j and h k j .

【0068】また、注目窓全体における類似値(即ち、
参照信号注目窓と入力信号注目窓とにおける類似値)S
は、以下の式によって定義される(以下、該類似値Sを
「全体類似値」と称する)。
Also, the similarity value (ie, the entirety of the window of interest)
Similarity between reference signal attention window and input signal attention window) S
Is defined by the following equation (hereinafter, the similarity value S is referred to as “overall similarity value”).

【0069】[0069]

【数4】 (Equation 4)

【0070】ここで、min(S1,S2,…,Sn
は、S1,S2,…,Snのうちの最小値を表す。
Here, min (S 1 , S 2 ,..., S n )
Is, S 1, S 2, ... , represent the minimum value of S n.

【0071】類似値Skの計算は、1つずつ(例えば、
値kの小さい順に)行われる。もし、計算された類似値
kが閾値θ以下であれば、数4の式に基づいて、全体
類似値Sの最小値が閾値θ以下であることは明らかであ
るので、後続の類似値Sk+1,Sk+2,Sk+3……の計算
はもはや行われる必要がない。そして、類似値計算手段
203は、それまでに計算された類似値のうちの最小値
を、移動量計算手段204に供給する。
The calculation of the similarity value S k is performed one by one (for example,
(In ascending order of the value k). If the calculated similarity value Sk is equal to or smaller than the threshold value θ, it is apparent that the minimum value of the overall similarity value S is equal to or smaller than the threshold value θ based on the equation (4). The calculation of k + 1 , Sk + 2 , Sk + 3 ... no longer needs to be performed. Then, the similarity value calculation means 203 supplies the minimum value of the similarity values calculated so far to the movement amount calculation means 204.

【0072】一方、もし、すべての類似値S1〜Snが閾
値θより大であれば、全体類似値Sは閾値θより大とな
る。このことは、「入力音響信号(の特徴ベクトル)に
対する入力信号注目窓の現在位置に、参照音響信号が検
出された」ということを意味する。そこで、類似値計算
手段203は、この現在位置(時刻)を、信号検出結果
の一部として出力する。また、この場合も、類似値計算
手段203は、全体類似値Sを、移動量計算手段204
に供給する。
[0072] On the other hand, if, as long as all similarity values S 1 to S n is larger than the threshold value theta, overall similarity value S becomes larger than the threshold value theta. This means that “a reference audio signal has been detected at the current position of the input signal attention window for (the feature vector of) the input audio signal”. Therefore, the similarity value calculating means 203 outputs the current position (time) as a part of the signal detection result. Also in this case, the similarity value calculating means 203 converts the overall similarity value S into the moving amount calculating means 204.
To supply.

【0073】移動量計算手段204は、はじめに、類似
値計算手段203から供給された全体類似値Sを読み込
む。次に、移動量計算手段204は、移動可能量wを計
算する(ステップS210)。ここで、移動可能量w
は、以下の式によって求められる。
The movement amount calculating means 204 first reads the overall similarity value S supplied from the similarity value calculating means 203. Next, the movement amount calculation means 204 calculates the possible movement amount w (step S210). Here, the movable amount w
Is determined by the following equation.

【0074】[0074]

【数5】 (Equation 5)

【0075】ここで、移動可能量wの単位は、特徴ベク
トルの個数であり、floor()は、小数点以下の切り下
げを表し、Dは、S=Skを満たすk番目の分割注目窓
(参照信号分割注目窓および入力信号分割注目窓)内の
特徴ベクトルのヒストグラムの総度数であり、θは上記
閾値である。
Here, the unit of the movable amount w is the number of feature vectors, floor () represents rounding down below the decimal point, and D is the k-th divided window of interest (see S = S k ). Is the total frequency of the histogram of the feature vector in the signal division attention window and the input signal division attention window, and θ is the above threshold.

【0076】数5の式は、「現時点でS<θならば、特
徴ベクトル(w−1)個分だけ入力信号注目窓を移動さ
せても、全体類似値Sは決して閾値θを越えない」とい
うことを意味している。これは、入力信号注目窓を移動
させたときに、入力信号注目窓の外に出ていく特徴ベク
トルが全てヒストグラムの重なりに寄与していないもの
であり、かつ、入力信号注目窓の中に入ってくる特徴ベ
クトルが全てヒストグラムの重なりに寄与するものであ
る場合(即ち、全体類似値Sが最も早く閾値θに達する
場合)」を考えれば、容易に理解される。即ち、このよ
うな場合に類似値が最も増加するので、このような場合
を想定すると、入力信号注目窓を特徴ベクトル(w−
1)個分だけ移動させたときの全体類似値Sの上限値は
閾値θとなる。このことから、S<θならば、全体類似
値Sが閾値θを越える可能性がでてくる特徴ベクトルw
個分の移動量を移動可能量とするのである。
Equation 5 indicates that if S <θ at the present time, even if the input signal attention window is moved by (w−1) feature vectors, the overall similarity value S never exceeds the threshold value θ. It means that. This is because, when the input signal attention window is moved, all the feature vectors that go out of the input signal attention window do not contribute to the overlap of the histogram, and the feature vectors that enter the input signal attention window It can be easily understood by considering the case where all of the feature vectors that come are those that contribute to the overlap of the histograms (that is, the case where the overall similarity value S reaches the threshold value θ first). That is, since the similarity value increases most in such a case, assuming such a case, the input signal attention window is set to the feature vector (w−
1) The upper limit value of the overall similarity value S when moved by the number is the threshold value θ. From this, if S <θ, the feature vector w is likely to cause the overall similarity value S to exceed the threshold θ.
The movement amount for each piece is set as the movable amount.

【0077】一方、S≧θならば、類似値のローカルピ
ークを見い出すために、w=1とし、注目窓のスキップ
を行うことなく検索を行う。
On the other hand, if S ≧ θ, in order to find a local peak of a similar value, w = 1 is set, and the search is performed without skipping the window of interest.

【0078】移動量計算手段204から出力された移動
可能量wは、入力特徴量抽出手段202に供給される。
入力特徴量抽出手段202は、入力信号注目窓を、特徴
ベクトルw個分だけ移動させる(ステップS211、図
8の入力特徴量抽出手段202内の破線の注目窓参
照)。以後、本装置は、上述した処理(複数の分割注目
窓の設定、ヒストグラムの作成、類似値の計算、移動可
能量の計算等)を同様に繰り返す(ステップS21
2)。また、入力信号注目窓の移動によって、入力信号
注目窓が入力音響信号(の特徴ベクトルの時系列)の終
端を越えたならば、全入力音響信号を探索したことにな
るので、探索処理を終了する。
The movable amount w output from the moving amount calculating means 204 is supplied to the input feature amount extracting means 202.
The input feature amount extraction means 202 moves the input signal attention window by w feature vectors (step S211; see the dashed attention window in the input feature amount extraction means 202 in FIG. 8). Thereafter, the present apparatus similarly repeats the above-described processing (setting of a plurality of divided windows of interest, creation of a histogram, calculation of similarity values, calculation of a movable amount, and the like) (step S21).
2). If the input signal attention window moves beyond the end of the input audio signal (the time series of the feature vector) due to the movement of the input signal attention window, it means that all the input audio signals have been searched, and thus the search processing ends. I do.

【0079】次に、本実施形態による高速信号探索装置
の動作実験例を示す。本装置をワークステーション(S
GI社O2)に実装し、テレビ放送を題材として音響信
号の検出を行った結果を図11と図12に示す。いずれ
も、縦軸は類似値、横軸は時刻を示す。これらは、ある
コマーシャル(15秒間)を参照信号とし、実際のテレ
ビ放送の録音(1998年1月22日、18時22分か
ら6時間分)を入力信号として検出を行ったものであ
る。なお本実験では、サンプリング周波数=11.02
5kHz、特徴ベクトルの次元=7、各特徴ベクトルの
要素のビン数=3とした。
Next, an operation experiment example of the high-speed signal search device according to the present embodiment will be described. Connect this device to a workstation (S
FIG. 11 and FIG. 12 show the results of implementing an audio signal on a television broadcast as a subject, implemented in GI Company O 2 ). In each case, the vertical axis indicates a similar value, and the horizontal axis indicates time. These are those in which a commercial (15 seconds) is used as a reference signal and an actual recording of a television broadcast (January 22, 1998, 18: 22: 6 hours) is detected as an input signal. In this experiment, the sampling frequency = 11.02
5 kHz, the dimension of the feature vector = 7, and the number of bins of each feature vector element = 3.

【0080】図11は、注目窓を分割しなかった場合、
すなわち本方法を実行しなかった場合、図12は、本方
法を実行して注目窓を8分割した場合である。それぞれ
の図において、○印を付けた部分が本装置によって検索
された箇所を示す。人手によって確かめたところによれ
ば、本実験における正解は、 18:48,23:22,00:11 の3箇所であった。図11では、正解箇所の他に、3箇
所余分に検出しているのに対し、図12では、正しい検
出結果が得られている。
FIG. 11 shows a case where the window of interest is not divided.
That is, FIG. 12 shows a case where the present method is not executed, and FIG. In each of the drawings, a portion marked with a circle indicates a location searched by the apparatus. According to human confirmation, the correct answers in this experiment were 18:48, 23:22:00, and 00:11. In FIG. 11, three extra locations are detected in addition to the correct location, whereas in FIG. 12, correct detection results are obtained.

【0081】また、一般に、検索すべき箇所における類
似値と、検索されるべきでない箇所における類似値の比
が大きいほど、設定値の設定に対するマージンが大きく
なるため、安定した検索が可能である。本実験では、図
12の場合の方が、図11の場合に比べて前記比の値が
大きくなっており、注目窓の分割による効果が表れてい
ることが分かる。
In general, the larger the ratio of the similar value in the portion to be searched to the similar value in the portion not to be searched, the larger the margin for setting the set value, so that a stable search is possible. In this experiment, the value of the ratio is larger in the case of FIG. 12 than in the case of FIG. 11, and it can be seen that the effect of dividing the window of interest is exhibited.

【0082】また、画像パターンに対して信号検出を行
った結果を図13と図14に示す。いずれも、縦軸は類
似値、横軸は時刻を示す。これらは、図11および図1
2とは別のコマーシャル(15秒間)の画像から得た色
情報を参照信号とし、実際のテレビ放送を録画して得た
色情報(1998年1月22日、18時22分から6時
間分)を入力信号として検出を行ったものである。なお
本実験では、特徴ベクトルの次元=3、各特徴ベクトル
の要素のビン数=8とした。
FIGS. 13 and 14 show the results of signal detection on the image pattern. In each case, the vertical axis indicates a similar value, and the horizontal axis indicates time. These are shown in FIG. 11 and FIG.
Color information obtained by recording an actual television broadcast using color information obtained from an image of a commercial (15 seconds) different from 2 (6 hours from 18:22 on January 22, 1998) Is detected as an input signal. In this experiment, the dimension of the feature vector was set to 3, and the number of bins of each feature vector element was set to 8.

【0083】図13は、注目窓を分割しなかった場合
(即ち、本方法を実行しなかった場合)、図14は、本
方法を実行して注目窓を8分割した場合である。それぞ
れにおいて、○印を付けた部分が本装置によって検索さ
れた箇所を示す。人手によって確かめたところによれ
ば、本実験における正解は、 18:48,19:56,20:35,22:54 の4箇所であった。図13では、正解箇所のうちの一つ
(20:35)が検出できておらず、また、2箇所余分
に検出しているのに対し、図14では、正しい検出結果
が得られている。
FIG. 13 shows a case where the window of interest is not divided (that is, a case where the present method is not performed), and FIG. 14 shows a case where the window of interest is divided into eight by executing the present method. In each case, the portions marked with a circle indicate the locations searched by the apparatus. According to human confirmation, the correct answers in this experiment were 18:48, 19:56, 20:35, and 22:54. In FIG. 13, one (20:35) of the correct answer points has not been detected, and two extra points have been detected, whereas in FIG. 14, correct detection results have been obtained.

【0084】§3.第3実施形態 次に、本発明の第3実施形態について図面を参照して説
明する。
§3. Third Embodiment Next, a third embodiment of the present invention will be described with reference to the drawings.

【0085】第1実施形態および第2実施形態では、予
め登録された参照信号に類似した信号の位置を検出する
方法が説明された。しかしながら、これらの方法には、
「多数の参照信号に基づいて信号を検出する場合、参照
信号の数だけ検出処理を繰り返す必要があり、計算量が
増大して、検出速度が遅くなる」という課題がある。
In the first and second embodiments, the method of detecting the position of a signal similar to a previously registered reference signal has been described. However, these methods include:
There is a problem that "in the case of detecting signals based on a large number of reference signals, it is necessary to repeat the detection processing by the number of reference signals, which increases the amount of calculation and decreases the detection speed".

【0086】そこで、第3実施形態では、多数の参照信
号に基づいて信号を検出する場合であっても、従来より
少ない処理で信号を検出できる高速信号探索方法につい
て説明する。
Therefore, in the third embodiment, a description will be given of a high-speed signal search method capable of detecting a signal with less processing than in the related art even when a signal is detected based on a large number of reference signals.

【0087】図15は、本発明の第3実施形態による高
速信号探索方法を適用した高速信号探索装置の構成例を
示すブロック図である。本発明では、様々な処理対象信
号を用いることができるが、ここでは、該処理対象信号
の一例として、音響信号を用いる。図15において、本
装置1は、参照特徴量計算手段310と入力特徴量計算
手段312と参照信号間類似値計算手段314と類似値
計算手段316と移動可能量計算手段318とによって
構成される。
FIG. 15 is a block diagram showing a configuration example of a high-speed signal search device to which the high-speed signal search method according to the third embodiment of the present invention is applied. In the present invention, various signals to be processed can be used. Here, an acoustic signal is used as an example of the signal to be processed. In FIG. 15, the present apparatus 1 includes a reference feature value calculation unit 310, an input feature value calculation unit 312, a reference signal similarity value calculation unit 314, a similar value calculation unit 316, and a movable amount calculation unit 318.

【0088】ここで、図15に示される高速信号探索装
置は、具体的には、CPU(中央処理装置)およびその
周辺回路からなるコンピュータ装置で構成される。該コ
ンピュータ装置は、所定の記録媒体(磁気ディスク、半
導体メモリ等)に記録された制御プログラムで制御され
ることによって、図15に示される各手段として機能す
る。なお、上記制御プログラムは通信回線を介して頒布
することが可能である。
Here, the high-speed signal search device shown in FIG. 15 is specifically composed of a computer device comprising a CPU (central processing unit) and its peripheral circuits. The computer device functions as each unit shown in FIG. 15 by being controlled by a control program recorded on a predetermined recording medium (magnetic disk, semiconductor memory, or the like). The control program can be distributed via a communication line.

【0089】本装置1は、予め登録された参照音響信号
(即ち、見本となる検索したい音響信号)と入力音響信
号(即ち、検索される音響信号)とを入力とし、参照音
響信号と入力音響信号との類似値が所定の閾値θを越え
る箇所を入力音響信号から検出する。
The present apparatus 1 receives a reference audio signal (that is, an audio signal to be searched as a sample) and an input audio signal (that is, an audio signal to be searched) which are registered in advance, and inputs the reference audio signal and the input audio signal. A point where a similar value to the signal exceeds a predetermined threshold θ is detected from the input acoustic signal.

【0090】参照特徴量計算手段310は、複数の参照
音響信号について、特徴量系列を生成する。また、入力
特徴量計算手段312は、入力音響信号から特徴量系列
を生成し、該特徴量系列上に注目窓(以下、「入力信号
注目窓」と称する)を設定する。
The reference feature value calculating means 310 generates a feature value sequence for a plurality of reference sound signals. In addition, the input feature value calculation unit 312 generates a feature value sequence from the input audio signal, and sets a window of interest (hereinafter, referred to as an “input signal attention window”) on the feature value sequence.

【0091】参照信号間類似値計算手段314は、各参
照音響信号(の特徴量系列)同士の類似値(以下、「参
照信号間類似値」と称する)を計算する。類似値計算手
段316は、参照特徴量計算手段310で生成された特
徴量系列と入力特徴量計算手段312で設定された入力
信号注目窓内の特徴量系列との類似値(以下、「入力信
号類似値」と称する)を計算する。
The reference signal similarity value calculating means 314 calculates a similarity value (hereinafter referred to as “reference signal similarity value”) between (the characteristic amount series of) each reference audio signal. The similarity value calculating means 316 calculates a similarity value between the feature amount series generated by the reference feature amount calculating means 310 and the feature amount sequence in the input signal attention window set by the input feature amount calculating means 312 (hereinafter, “input signal "Similar value").

【0092】移動可能量計算手段318は、参照信号間
類似値計算手段314で計算された参照信号間類似値と
類似値計算手段316で計算された入力信号類似値とに
基づいて、該入力信号類似値に対応する入力信号注目窓
の近傍の入力信号注目窓における(入力音響信号と参照
音響信号との間の)入力信号類似値の範囲を規定するパ
ラメータ(例えば、類似値の上限値)を計算する。そし
て、移動可能量計算手段318は、該バラメータの値に
基づいて、入力信号注目窓の移動可能量を計算する。
The movable amount calculating means 318 calculates the input signal similarity value based on the reference signal similarity value calculated by the reference signal similarity value calculating means 314 and the input signal similarity value calculated by the similarity value calculating means 316. A parameter (for example, an upper limit of the similarity value) that defines the range of the input signal similarity value (between the input audio signal and the reference audio signal) in the input signal attentional window near the input signal attentional window corresponding to the similar value calculate. Then, the movable amount calculating means 318 calculates the movable amount of the input signal attention window based on the value of the parameter.

【0093】次に、図16を参照して、本装置の動作を
具体的に説明する。説明を簡明にするために、以下の説
明では、全ての参照音響信号の長さは等しいものとす
る。なお実際には、本発明は、必ずしも全ての参照音響
信号の長さが等しくない場合においても適用できる。
Next, the operation of the present apparatus will be specifically described with reference to FIG. For the sake of simplicity, in the following description, the lengths of all reference sound signals are assumed to be equal. In practice, the present invention can be applied even when the lengths of all the reference sound signals are not always equal.

【0094】参照特徴量計算手段310は、初めに、与
えられた全ての参照音響信号を読み込む。次に、参照特
徴量計算手段310は、読み込まれた参照音響信号につ
いて、特徴量の抽出を行う(ステップS301)。本発
明では、様々な特徴量を用いることができるが、ここで
は、該特徴量の一例として、スペクトル特徴を用いる。
この場合、参照特徴量計算手段310は、第2実施形態
の参照特徴量抽出手段201と同じ方法(図10参照)
で、特徴量(即ち、7次元特徴ベクトルの時系列)を抽
出する。故に、ここでは、その説明を省略する。
First, the reference feature value calculating means 310 reads all the given reference sound signals. Next, the reference feature value calculation means 310 extracts a feature value from the read reference sound signal (step S301). In the present invention, various feature values can be used. Here, a spectrum feature is used as an example of the feature value.
In this case, the reference feature value calculation means 310 is the same as the reference feature value extraction means 201 of the second embodiment (see FIG. 10).
Then, a feature amount (that is, a time series of seven-dimensional feature vectors) is extracted. Therefore, the description is omitted here.

【0095】次に、参照特徴量計算手段310は、上記
特徴ベクトルの時系列に基づいて、該特徴ベクトルのヒ
ストグラムを作成する(ステップS302)。ここで、
該ヒストグラムは、特徴ベクトルの各要素が取りうる値
の範囲(最小値から最大値まで)を複数のビン(区間)
に分割することによって作成される。参照特徴量計算手
段310は、類似値計算手段203(第2実施形態)と
同様の方法で、ヒストグラムを作成する。故に、ここで
は、その説明を省略する。
Next, the reference feature value calculating means 310 creates a histogram of the feature vector based on the time series of the feature vector (step S302). here,
The histogram indicates a range of values (from the minimum value to the maximum value) that each element of the feature vector can take, by a plurality of bins (sections).
Created by dividing into The reference feature value calculating means 310 creates a histogram in the same manner as the similar value calculating means 203 (second embodiment). Therefore, the description is omitted here.

【0096】なお、本実施形態では、1つの参照音響信
号(の特徴ベクトルの時系列)の全体についてヒストグ
ラムを作成しているが、この他にも、第2実施形態に示
されるように、参照音響信号(の特徴ベクトルの時系
列)を時間方向に分割し、分割後の各参照音響信号(の
特徴ベクトルの時系列)についてヒストグラムを作成し
てもよい。分割の数は、例えば4とすると良い。この場
合は、一つの参照音響信号について4つのヒストグラム
が作成されることになる。
In the present embodiment, a histogram is created for the entirety of one reference acoustic signal (a time series of feature vectors thereof). In addition, as shown in the second embodiment, a histogram is created. The audio signal (the time series of the feature vectors thereof) may be divided in the time direction, and a histogram may be created for each of the divided reference audio signals (the time series of the feature vectors thereof). The number of divisions may be, for example, four. In this case, four histograms are created for one reference sound signal.

【0097】入力特徴量計算手段312は、初めに、入
力音響信号を読み込む。次に、入力特徴量計算手段31
2は、読み込まれた入力音響信号について、特徴量の抽
出を行う(ステップS303)。ここで、入力特徴量計
算手段312は、参照特徴量計算手段310と同様の方
法で、特徴量を抽出する。
First, the input feature value calculation means 312 reads an input audio signal. Next, the input feature amount calculating means 31
2 extracts a feature amount from the read input audio signal (step S303). Here, the input feature value calculating means 312 extracts a feature value in the same manner as the reference feature value calculating means 310.

【0098】続いて、入力特徴量計算手段312は、参
照特徴量計算手段310に与えられた参照音響信号と同
じ長さの入力信号注目窓を、抽出された特徴量(特徴ベ
クトルの時系列)に対して設定する(ステップS30
4)。尚、入力信号注目窓の位置は、処理開始当初は、
入力音響信号から作成された特徴量系列の先頭に設定さ
れるが、処理の進行と共に、後述する方法によって、該
特徴量系列上を時間軸方向に順次移動される。この移動
可能量は、類似値計算手段316によって計算される。
Subsequently, the input feature value calculation means 312 sets an input signal attention window having the same length as the reference acoustic signal given to the reference feature value calculation means 310 to the extracted feature value (time series of feature vector). (Step S30)
4). Note that the position of the input signal attention window is initially set at the beginning of the process.
It is set at the beginning of the feature amount sequence created from the input audio signal, and is sequentially moved in the time axis direction on the feature amount sequence as the process proceeds, by a method described later. This movable amount is calculated by the similarity value calculation means 316.

【0099】次に、入力特徴量計算手段312は、入力
信号注目窓内の特徴ベクトルの時系列に基づいて、該特
徴ベクトルのヒストグラムを作成する(ステップS30
5)。ここで、該ヒストグラムは、特徴ベクトルの各要
素が取りうる値の範囲(最小値から最大値まで)を複数
のビン(区間)に分割することによって作成される。入
力特徴量計算手段312は、参照特徴量計算手段310
と同様の方法で、ヒストグラムを作成する。故に、ここ
では、その説明を省略する。
Next, the input feature quantity calculation means 312 creates a histogram of the feature vector based on the time series of the feature vector in the input signal attention window (step S30).
5). Here, the histogram is created by dividing the range of possible values (from the minimum value to the maximum value) of each element of the feature vector into a plurality of bins (sections). The input feature value calculation means 312 is a reference feature value calculation means 310.
A histogram is created in the same manner as described above. Therefore, the description is omitted here.

【0100】なお、参照特徴量計算手段310が(第2
実施形態と同様に)参照音響信号を時間軸方向に分割し
た場合、入力特徴量計算手段312も、同様に、入力信
号注目窓(内の特徴ベクトルの時系列)を時間軸方向に
分割する。この分割数は、参照特徴量計算手段l0にお
ける分割数と同じとする。従って、参照特徴量計算手段
310において1つの参照音響信号から作成されたのと
同数のヒストグラムが、入力信号注目窓内の入力音響信
号から作成される。
It should be noted that the reference feature value calculating means 310
When the reference acoustic signal is divided in the time axis direction (similar to the embodiment), the input feature amount calculating unit 312 also divides the input signal attention window (the time series of the feature vectors therein) in the time axis direction. The number of divisions is the same as the number of divisions in the reference feature value calculation means 10. Therefore, as many histograms as the number of histograms generated from one reference audio signal in the reference feature value calculating unit 310 are generated from the input audio signals in the input signal attention window.

【0101】参照信号間類似値計算手段314は、初め
に、参照特徴量計算手段310から供給されるヒストグ
ラム(各参照音響信号のヒストグラム)を読み込む。こ
こでは、説明を簡明にするため、参照音響信号が分割さ
れていない場合を考える(ただし、これは添字の扱いが
繁雑になることを防ぐためであり、本発明は、参照音響
信号が分割される場合に対しても適用可能である)。こ
こでは、参照特徴量計算手段310から供給されるヒス
トグラムを、G1,G2,…,GNとする。但し、Nは参
照音響信号の個数である。
The reference signal similarity value calculating means 314 first reads the histogram (histogram of each reference sound signal) supplied from the reference feature value calculating means 310. Here, for the sake of simplicity, consider the case where the reference audio signal is not divided (however, this is to prevent the handling of subscripts from becoming complicated. It is also applicable to cases where Here, it is assumed that the histogram supplied from the reference feature value calculating means 310 is G 1 , G 2 ,..., G N. Here, N is the number of reference sound signals.

【0102】参照信号間類似値計算手段314は、N個
の参照音響信号から2つの参照音響信号を取り出す全て
の組み合わせについて、取り出された2つの参照音響信
号間の類似値を計算する(ステップS306)。ここ
で、k番目の参照音響信号のヒストグラムgとm番目の
参照音響信号のヒストグラムhとの類似値S(g,h)
は、以下の式によって定義される。
The inter-reference-signal similarity value calculation means 314 calculates the similarity value between the two extracted reference audio signals for all combinations of extracting two reference audio signals from the N reference audio signals (step S306). ). Here, the similarity S (g, h) between the histogram g of the k-th reference audio signal and the histogram h of the m-th reference audio signal.
Is defined by the following equation:

【0103】[0103]

【数6】 (Equation 6)

【0104】ここで、Dはヒストグラムの総度数であ
り、Lはヒストグラムの区間数(上記の例では3の7
乗)であり、gjはヒストグラムgのj番目の区間の値
であり、hjはヒストグラムhのj番目の区間の値であ
り、min(gj,hj)はgjとh jとにおける小さい方
の値を示す。
Here, D is the total frequency of the histogram.
L is the number of sections of the histogram (3 in the above example is 7
) And gjIs the value of the j-th section of the histogram g
And hjIs the value of the j-th section of the histogram h
, Min (gj, Hj) Is gjAnd h jThe smaller of
Shows the value of

【0105】なお、参照特徴量計算手段310が(第2
実施形態と同様に)参照音響信号を時間軸方向に分割し
た場合、参照信号間類似値計算手段314は、2つの参
照音響信号の互いに対応する分割部分について類似値計
算を行う。該類似値計算の結果は、記憶手段(図示略)
に格納され、移動可能量計算手段318に供給される。
It should be noted that the reference feature value calculating means 310
When the reference audio signal is divided in the time axis direction (similar to the embodiment), the inter-reference-signal similarity value calculation unit 314 performs similarity calculation on divided portions of the two reference audio signals that correspond to each other. The result of the similar value calculation is stored in storage means (not shown).
And is supplied to the movable amount calculating means 318.

【0106】類似値計算手段316は、初めに、参照特
徴量計算手段310から供給されるヒストグラムと入力
特徴量計算手段312から供給されるヒストグラムとを
読み込む。ここでは、説明を簡明にするため、参照音響
信号および入力音響信号が分割されていない場合を考え
る(ただし、これは添字の扱いが繁雑になることを防ぐ
ためであり、本発明は、参照音響信号および入力音響信
号が分割される場合に対しても適用可能である)。ここ
では、参照特徴量計算手段310から供給されるヒスト
グラムを、G1,G2,……,GNとし、入力特徴量計算
手段312から供給されるヒストグラムをHとする。但
し、Nは参照音響信号の個数である。
The similarity value calculation means 316 first reads the histogram supplied from the reference feature value calculation means 310 and the histogram supplied from the input feature value calculation means 312. Here, for the sake of simplicity, consider a case where the reference audio signal and the input audio signal are not divided (however, this is to prevent the handling of the subscript from becoming complicated, and the present invention is applied to the case where the reference audio signal and the input audio signal are not divided). It is also applicable to a case where the signal and the input acoustic signal are divided.) Here, the histogram supplied from the reference feature amount calculating unit 310, G 1, G 2, ......, and G N, the histogram supplied from the input feature value calculating means 312 and H. Here, N is the number of reference sound signals.

【0107】続いて、類似値計算手段316は、参照音
響信号のヒストグラムを1つ選択し、選択されたヒスト
グラムと入力音響信号のヒストグラムとの類似値を計算
する(ステップS307)。参照音響信号のヒストグラ
ムgと入力音響信号のヒストグラムhとの類似値S
(g,h)は、以下の式によって定義される。
Subsequently, the similarity value calculating means 316 selects one histogram of the reference audio signal, and calculates a similarity value between the selected histogram and the histogram of the input audio signal (step S307). Similarity value S between histogram g of reference audio signal and histogram h of input audio signal
(G, h) is defined by the following equation.

【0108】[0108]

【数7】 (Equation 7)

【0109】ここで、Dはヒストグラムの総度数であ
り、Lはヒストグラムの区間数(上記の例では3の7
乗)であり、gjはヒストグラムgのj番目の区間の値
であり、hjはヒストグラムhのj番目の区間の値であ
り、min(gj,hj)はgjとh jとにおける小さい方
の値を示す。
Here, D is the total frequency of the histogram.
L is the number of sections of the histogram (3 in the above example is 7
) And gjIs the value of the j-th section of the histogram g
And hjIs the value of the j-th section of the histogram h
, Min (gj, Hj) Is gjAnd h jThe smaller of
Shows the value of

【0110】本実施形態では、N個の参照音響信号が入
力されるが、類似値の計算は、一度に、参照音響信号1
つだけに対して行われる。類似値の計算に使用される参
照音響信号の選択にあたっては、その時点における類似
値の上限値が閾値θを越える可能性がある参照音響信号
が選択される。どの参照音響信号がこれに該当するか
は、後に説明する移動可能量計算手段318において判
明するので、類似値計算手段316は、移動可能量計算
手段318から、その情報を取得する。
In the present embodiment, N reference sound signals are inputted, but the similarity is calculated at a time by one reference sound signal.
Done for only one. In selecting a reference sound signal used for calculating the similar value, a reference sound signal whose upper limit value of the similar value at that time may possibly exceed the threshold value θ is selected. Which reference sound signal corresponds to this can be determined by the movable amount calculating means 318 described later, and the similarity value calculating means 316 acquires the information from the movable amount calculating means 318.

【0111】なお、(第2実施形態と同様に)参照音響
信号および入力音響信号が時間軸方向に分割されている
場合には、類似値の計算は、(分割された)参照音響信
号および入力音響信号の1つの分割部分に対してだけ行
われる。
When the reference sound signal and the input sound signal are divided in the time axis direction (similar to the second embodiment), the calculation of the similarity value is performed based on the (divided) reference sound signal and the input sound signal. This is done only for one segment of the sound signal.

【0112】類似値計算手段316は、計算された類似
値を、移動可能量計算手段318に供給する。これに加
えて、もし、類似値が閾値θを越えている場合(参照音
響信号および入力音響信号が時間軸方向に分割されてい
る場合には、全ての分割分について、類似値が閾値θを
越えている場合)、このことは、「その参照音響信号が
入力音響信号中に存在している」ことを意味するので、
類似値計算手段316は、信号検出結果として、参照音
響信号の番号と入力信号注目窓の現在位置とを出力す
る。
The similarity value calculating means 316 supplies the calculated similarity value to the movable amount calculating means 318. In addition, if the similarity value exceeds the threshold θ (if the reference audio signal and the input audio signal are divided in the time axis direction, the similarity This means that the reference audio signal is present in the input audio signal,
The similarity value calculation means 316 outputs the number of the reference sound signal and the current position of the input signal attention window as the signal detection result.

【0113】移動可能量計算手段318は、初めに、入
力音響信号とk番目の参照音響信号との類似値Skを、
類似値計算手段316から読み込む。次に、移動可能量
計算手段318は、移動可能量wkを計算する(ステッ
プS308)。ここで、移動可能量wkは、以下の式に
よって求められる。
The movable amount calculating means 318 first calculates the similarity value S k between the input audio signal and the k-th reference audio signal,
It is read from the similarity value calculation means 316. Then, the movable amount calculating means 318 calculates the movable weight w k (step S308). Here, the movable amount w k is obtained by the following equation.

【0114】[0114]

【数8】 (Equation 8)

【0115】ここで、移動可能量wkの単位は、特徴ベ
クトルの個数であり、floor()は、小数点以下の切り
下げを表し、Dは、S=Skを満たすk番目の参照音響
信号の特徴ベクトルのヒストグラムの総度数であり、θ
は上記閾値である。
Here, the unit of the movable amount w k is the number of feature vectors, floor () represents rounding down below the decimal point, and D is the k-th reference sound signal satisfying S = S k . The total frequency of the histogram of the feature vector, θ
Is the above threshold value.

【0116】数8の式は、「現時点においてSk<θな
らば、特徴ベクトル(wk−1)個分だけ入力信号注目
窓を移動させても、類似値Skは決して閾値θを越えな
い」ということを意味している。これは、「入力信号注
目窓を移動させたときに、入力信号注目窓の外に出てい
く特徴ベクトルが全てヒストグラムの重なりに寄与して
いないものであり、かつ、入力信号注目窓の中に入って
くる特徴ベクトルが全てヒストグラムの重なりに寄与す
るものである場合(即ち、類似値Skが最も早く閾値θ
に達する場合)」を考えれば、容易に理解される。即
ち、このような場合に類似値が最も増加するので、この
ような場合を想定すると、入力信号注目窓を特徴ベクト
ル(wk−1)個分だけ移動させたときの類似値Skの上
限値は閾値θとなる。
Equation 8 indicates that if S k <θ at this time, even if the input signal attention window is moved by the amount of feature vectors (w k -1), the similarity value S k will never exceed the threshold θ. No. " This is because, when the input signal attention window is moved, all the feature vectors that go out of the input signal attention window do not contribute to the overlap of the histogram, and the input signal attention window If all incoming feature vectors contribute to the histogram overlap (ie, the similarity S k is the earliest threshold θ
Is reached)), it is easily understood. That is, since the similarity value in this case is most increased, assuming a case such, the upper limit of the similarity values S k when moving only the feature vector (w k -1) pieces worth an input signal of interest window The value becomes the threshold θ.

【0117】一方、Sk≧θならば、類似値のローカル
ピークを見い出すために、wk=1とし、注目窓のスキ
ップを行うことなく検索を行う。
On the other hand, if S k ≧ θ, w k = 1 is set and a search is performed without skipping the window of interest in order to find a local peak of a similar value.

【0118】上述した処理は、1つの(即ち、k番目
の)参照音響信号に対する処理である。参照音響信号が
多数存在する場合、従来の方法では、この処理を参照音
響信号の数だけ単純に繰り返すことによって、各参照音
響信号に関する移動可能量を求める(これを反復法と呼
ぶ)。これに対して、本発明は、k番目の参照音響信号
に関する類似値Skが得られると、該類似値Skに基づい
て、k番目以外の参照音響信号に関する移動可能量も求
めることを特徴とする。故に、本発明によれば、上記反
復法よりも類似値計算回数を削減することができる。
The above-described processing is processing for one (ie, k-th) reference sound signal. When there are a large number of reference audio signals, in the conventional method, this process is simply repeated by the number of reference audio signals, thereby obtaining a movable amount for each reference audio signal (this is called an iterative method). On the other hand, the present invention is characterized in that, when a similar value S k relating to a k-th reference acoustic signal is obtained, a movable amount relating to a reference acoustic signal other than the k-th is also calculated based on the similar value S k. And Therefore, according to the present invention, it is possible to reduce the number of times of calculating the similarity value as compared with the above iterative method.

【0119】類似値計算回数を削減する方法について以
下に説明する。2つの参照音響信号Rk,Rmからそれぞ
れヒストグラムGk,Gmが作成され、入力音響信号Iか
らヒストグラムHが作成されているとする。但し、ヒス
トグラムGk,Gmの総度数は等しく、かつ、参照音響信
号および入力音響信号は時間軸方向に分割されていない
ものとする。また、ヒストグラムG kとヒストグラムH
との入力信号類似値Skは既に得られているとする。
The method for reducing the number of times of calculating the similarity value is as follows.
This is described below. Two reference sound signals Rk, RmFrom each
H histogram Gk, GmIs created and the input sound signal I
It is assumed that a histogram H has been created. However, hiss
Togram Gk, GmAre equal and the reference audio signal
Signal and input audio signal are not divided in the time axis direction
Shall be. Also, the histogram G kAnd histogram H
Input signal similarity value SkHas already been obtained.

【0120】このとき、もし、ヒストグラムGkとヒス
トグラムGmとがよく似ているならば、ヒストグラムH
とヒストグラムGmとの入力信号類似値Smを計算するこ
となく、入力信号類似値Smの上限値が得られる。即
ち、ヒストグラムGkとヒストグラムGmとの参照信号間
類似値をSkmとすると、ヒストグラムGkとヒストグラ
ムG mとの全ての不一致部分が入力信号類似値Smの増加
に寄与する場合に、入力信号類似値Smはその上限値に
達する。このことは、以下の式によって表される。
At this time, if the histogram GkAnd hiss
Togram GmAre very similar, the histogram H
And histogram GmInput signal similarity value SmCalculate
The input signal similarity value SmIs obtained. Immediately
C, histogram GkAnd histogram GmBetween the reference signal and
The similarity value is SkmThen the histogram GkAnd histogra
Mu G mAre all input signal similarity values Smincrease of
, The input signal similarity value SmIs the upper limit
Reach. This is represented by the following equation:

【0121】[0121]

【数9】 (Equation 9)

【0122】但し、元々Sm≦1であるので、数9の式
は、Sk<Skmのときのみ有効である。
However, since S m ≦ 1 from the beginning, the expression of Expression 9 is valid only when S k <S km .

【0123】一方、もし、ヒストグラムGkとヒストグ
ラムHとがよく似ているならば、ヒストグラムGkとヒ
ストグラムHとの全ての不一致部分が入力信号類似値S
mの増加に寄与する場合に、入力信号類似値Smはその上
限値に達する。このことは、以下の式によって表され
る。
On the other hand, if the histogram G k and the histogram H are very similar, all the mismatched portions between the histogram G k and the histogram H are equal to the input signal similarity value S.
When contributing to an increase in m , the input signal similarity value S m reaches its upper limit. This is represented by the following equation:

【0124】[0124]

【数10】 (Equation 10)

【0125】但し、元々Sm≦1であるので、数10の
式は、Sk>Skmのときのみ有効である。数9の式と数
10の式とをまとめると、次式が得られる。
However, since S m ≦ 1 from the beginning, the equation (10) is valid only when S k > S km . When the expressions of Expression 9 and Expression 10 are put together, the following expression is obtained.

【0126】[0126]

【数11】 [Equation 11]

【0127】即ち、入力信号類似値Skと参照信号間類
似値Skmとの差が大きければ大きいほど、入力信号類似
値Smの上限値は小さくなる。このとき、移動可能量wm
は、以下の式によって計算される。
[0127] That is, the greater the difference between the reference signal between similar values S miles an input signal similarity value S k, the upper limit value of the input signal similarity value S m is smaller. At this time, the movable amount w m
Is calculated by the following equation.

【0128】[0128]

【数12】 (Equation 12)

【0129】即ち、入力信号類似値Smの上限値が小さ
ければ小さいほど、移動可能量wmは大きくなる。
[0129] That is, the smaller the upper limit value of the input signal similar value S m, movable amount w m increases.

【0130】以上述べたように、本発明によれば、2つ
の参照音響信号Rk,Rmの参照信号間類似値Skmが既知
である場合、参照音響信号Rkと入力音響信号Iとの入
力信号類似値Skが得られると、該入力信号類似値Sk
基づいて、参照音響信号Rkに関する移動可能量だけで
なく、参照音響信号Rmに関する移動可能量をも求める
ことができる。そこで、k番目の参照音響信号Rkと入
力音響信号Iとの入力信号類似値Skが(類似値計算手
段316において)得られる度に、移動可能量計算手段
318は、参照音響信号Rkと該参照音響信号Rk以外の
参照音響信号との参照信号間類似値を(参照信号間類似
値計算手段314から)取り出し、該参照信号間類似値
および数11,数12の式を用いて、(入力信号注目窓
の)移動可能量を、全ての参照音響信号に関して求め
る。そして、このようにして求められた移動可能量がそ
れ以前に求められた移動可能量よりも大きい場合、移動
可能量計算手段318は、移動可能量を更新する。
As described above, according to the present invention, when the reference signal similarity S km between two reference sound signals R k and R m is known, the reference sound signal R k and the input sound signal I When the input signal similarity value S k is obtained based on the input signal similarity values S k, not only the movable amount related reference acoustic signal R k, also be determined movable amount about the reference acoustic signal R m it can. Therefore, every time an input signal similarity value S k between the k-th reference audio signal R k and the input audio signal I is obtained (in the similarity value calculation means 316), the movable amount calculation means 318 outputs the reference audio signal R k to the reference acoustic signal a reference signal between similar values of the reference acoustic signal other than R k (from the reference signal between similar value calculating means 314) is taken out, the reference signal between similar values and number 11, using a number 12 expression , (The input signal attention window) are determined for all the reference sound signals. Then, when the movable amount obtained in this way is larger than the movable amount obtained before then, the movable amount calculating means 318 updates the movable amount.

【0131】類似値計算手段316は、更新された移動
可能量wi(i=l,…,N)を、入力特徴量計算手段
312に供給する。入力特徴量計算手段312は、移動
可能量wiのうちの最も小さい移動可能量だけ、入力信
号注目窓を移動させる(ステップS309)。以後、本
装置は、上述した処理(ヒストグラムの作成、類似値の
計算、移動可能量の計算等)を同様に繰り返す(ステッ
プS310)。また、入力信号注目窓の移動によって、
入力信号注目窓が入力音響信号(の特徴ベクトルの時系
列)の終端を越えたならば、入力音響信号の全体を探索
したことになるので、探索処理を終了する。
The similarity value calculation means 316 supplies the updated movable amount w i (i = 1,..., N) to the input feature value calculation means 312. The input feature value calculation means 312 moves the input signal attention window by the smallest movable amount of the movable amount w i (step S309). Thereafter, the present apparatus similarly repeats the above-described processing (creation of a histogram, calculation of a similar value, calculation of a movable amount, and the like) (step S310). Also, by moving the input signal attention window,
If the input signal attention window exceeds the end of (the time series of the feature vector of) the input audio signal, it means that the entire input audio signal has been searched, and the search processing ends.

【0132】次に、本実施形態による高速信号探索装置
の動作実験例を示す。本発明の効果を調べるため、6時
間分のテレビ放送の音響信号を入力信号とし、15秒間
のCMの音響信号を参照信号として探索実験を行った。
本装置は、精度に関しては参照信号を別々に照合した場
合と同一なので、照合回数のみを比較する。また、類似
値が閾値を上回る場合については必ず全探索を行うの
で、ここでは、類似値が閾値以下であった照合回数が、
参照信号を別々に照合した場合に比べてどのくらいの割
合であるか(本出願ではこれを照合回数比という)を調
べる。探索のパラメータは、サンプリング周波数=1
1.025kHz、帯域フィルタの数=7、周波数分析
の分析窓長=60ms、分析窓シフト=10ms、各特
徴次元におけるビン数=3,時間窓分割数=1,閾値θ
=0.8とした。探索結果の一例を図17に示す。縦軸
は類似値、横軸は時刻を示す。また、○印は検出箇所を
示し、破線は閾値θ(0.8)である。
Next, an operation example of the high-speed signal search apparatus according to the present embodiment will be described. In order to investigate the effect of the present invention, a search experiment was performed using a 6-hour TV broadcast sound signal as an input signal and a 15-second CM sound signal as a reference signal.
Since the present apparatus is the same in accuracy as when the reference signals are separately collated, only the number of collations is compared. In addition, since the full search is always performed when the similarity value exceeds the threshold value, the number of times the similarity value is equal to or less than the threshold value is
The ratio (referred to in the present application as the number of times of collation) is compared with the case where the reference signals are collated separately. The search parameter is sampling frequency = 1
1.025 kHz, number of band filters = 7, analysis window length of frequency analysis = 60 ms, analysis window shift = 10 ms, number of bins in each feature dimension = 3, number of time window division = 1, threshold value θ
= 0.8. FIG. 17 shows an example of the search result. The vertical axis indicates similar values, and the horizontal axis indicates time. In addition, a circle indicates a detection position, and a broken line indicates a threshold value θ (0.8).

【0133】図18に実験結果を示す。図18の実験例
(a)は、無作為に選択した異なる商品のCM3本を参
照信号とした場合、実験例(b)は、音が極めて類似し
ている同一商品のCM3本を参照信号とした場合の結果
である。参照信号間の類似値は、実験例(a)の場合
0.11,0.22,0.23、実験例(b)の場合
0.72,0.75,0.88であった。実験例(a)
の場合には、照合回数削減の効果は少ないが(照合回数
比99.9%)、実験例(b)の場合には、閾値以下の
類似値を与えた照合回数が2/3以下となっている(照
合回数比62.7%)。このように、本装置は、参照信
号どうしの類似値が高い場合に特に有効である。
FIG. 18 shows the experimental results. In the experimental example (a) of FIG. 18, when three CMs of different products selected at random are used as reference signals, in the experimental example (b), three CMs of the same product having extremely similar sounds are used as reference signals. This is the result of the case. The similarity values between the reference signals were 0.11, 0.22, and 0.23 in the experimental example (a), and 0.72, 0.75, and 0.88 in the experimental example (b). Experimental example (a)
In the case of (1), the effect of reducing the number of times of collation is small (99.9% of the number of times of collation). (62.7% of the number of times of collation). As described above, the present apparatus is particularly effective when the similarity between the reference signals is high.

【0134】§4.補足 以上、この発明の実施形態を図面を参照して詳述してき
たが、具体的な構成はこの実施形態に限られるものでは
なく、この発明の要旨を逸脱しない範囲の設計の変更等
があってもこの発明に含まれる。
§4. Supplement Although the embodiment of the present invention has been described in detail with reference to the drawings, the specific configuration is not limited to the embodiment, and there may be a design change or the like without departing from the gist of the present invention. Even this is included in the present invention.

【0135】例えば、上記第1〜3実施形態では、「ヒ
ストグラムを用いた類似値計算」と「類似値に基づく移
動可能量計算」とを特徴とする高速信号探索方法につい
て説明したが、本発明による高速信号探索方法は、必ず
しも、この2つの特徴を共に利用する必要は無く、いず
れか一方を利用するだけであっても、従来技術と比べ
て、格別な効果が得られる。
For example, in the first to third embodiments, the description has been given of the high-speed signal search method characterized by “similar value calculation using histogram” and “movable amount calculation based on similar value”. It is not always necessary to use both of these two features together, and even if only one of them is used, a special effect can be obtained as compared with the related art.

【0136】また、上記第1〜3実施形態では、処理対
象信号として音響信号を使用したが、図13,14に関
する実験例で述べたように、画像の色情報(R,G,B
等)を示す信号等を用いてもよい。
In the first to third embodiments, the acoustic signal is used as the processing target signal. However, as described in the experimental examples relating to FIGS. 13 and 14, the color information (R, G, B) of the image is used.
Etc.) may be used.

【0137】また、特徴量の一例として、第1実施形態
では零交差数を用い、第2,3実施形態ではスペクトル
特徴を用いたが、本発明で用いられる特徴量はこれらに
は限定されず、他の特徴量を用いることができる。
Further, as an example of the feature value, the zero crossing number is used in the first embodiment, and the spectrum feature is used in the second and third embodiments. However, the feature value used in the present invention is not limited to these. , Other feature values can be used.

【0138】また、上述した各実施形態では、ヒストグ
ラムの類似値に基づいて信号検出を行う場合について述
べてきたが、類似値の代わりに距離(ユークリッド距
離、L1距離など)を用いて信号検出を行ってもよい。
その場合は、類似値に基づく場合における値の大小関係
を反転すれば、同等の効果が得られることはいうまでも
ない。
Further, in each of the above-described embodiments, the case where signal detection is performed based on the similarity value of the histogram has been described. However, signal detection is performed using a distance (Euclidean distance, L1 distance, etc.) instead of the similarity value. May go.
In such a case, it is needless to say that the same effect can be obtained by inverting the magnitude relation of the values based on the similar value.

【0139】また、上述した各実施形態では、高速信号
探索装置を単体で示したが、該装置を利用してビデオ自
動制御装置を構成することもできる。即ち、本高速信号
探索装置をビデオ装置と組み合わせると共に、本高速信
号探索装置によって特定の音響信号(テーマソング等)
あるいは特定の画像パターン等の発生を検出し、その検
出結果に応じてビデオ装置の録画機能等を制御する制御
手段を設ける。これによって、特定の番組の開始と終了
等にあわせて自動的にビデオ録画機能を起動し、あるい
は録画機能を停止し、あるいはインデックス情報を記録
したりするビデオ自動制御装置を実現することができ
る。
In each of the embodiments described above, the high-speed signal search apparatus is shown as a single unit. However, the apparatus can be used to configure an automatic video control apparatus. That is, the present high-speed signal searching device is combined with a video device, and a specific sound signal (theme song, etc.)
Alternatively, control means for detecting the occurrence of a specific image pattern or the like and controlling the recording function or the like of the video device according to the detection result is provided. As a result, it is possible to realize an automatic video control device that automatically activates the video recording function, stops the recording function, or records index information at the start and end of a specific program.

【0140】さらに、これによって、放送の音響信号の
中から特定のコマーシャルの放映された時刻を検出して
自動記録をしたり、特定のテーマソングを検出してビデ
オ録画を開始したり停止したりすることが可能となる。
又、放送から拍手音の発せられた時刻や、笑い声の発せ
られた時刻などを自動的に監視したり、特定のシーンを
検索したりすることも可能となる。更に、これらの処理
は音響信号だけでなく、画像パターンなど一般の信号の
検出にも応用できる。
Further, this makes it possible to detect the time at which a specific commercial is broadcast out of the audio signal of the broadcast and perform automatic recording, or to detect or start a video recording by detecting a specific theme song. It is possible to do.
It is also possible to automatically monitor the time when a clapping sound is emitted from the broadcast, the time when a laughter is emitted, or search for a specific scene. Further, these processes can be applied not only to detection of an acoustic signal but also to detection of a general signal such as an image pattern.

【0141】[0141]

【発明の効果】以上説明したように、本発明によれば、
入力信号に注目窓を設定してその注目窓内の入力信号に
ついて特徴量系列を生成し、これとあらかじめ登録され
た参照信号の特徴量系列との類似値計算を行い、類似値
の値に基づいて注目窓の位置の移動量を効率良く変化さ
せながら上記特徴量系列生成と類似値計算の処理を繰り
返し、計算した類似値と閾値との比較によって入力信号
中の参照信号位置を検出することとしたので、入力信号
の全領域に対して注目窓を細かく移動させなくとも、全
領域に対して細かく移動させた場合と同等の検出結果を
高速で得ることができる。また、本発明によれば、放送
などの長時間にわたる信号の中から特定の音楽やコマー
シャルの出現時刻を検索することや、信号データベース
などから特定の信号を含む信号を検索することも可能と
なる。
As described above, according to the present invention,
A window of interest is set for an input signal, a feature sequence is generated for the input signal within the window of interest, and a similarity calculation is performed between the feature sequence and a feature sequence of a reference signal registered in advance. Repeating the processing of the feature amount series generation and the similarity value calculation while efficiently changing the movement amount of the position of the attention window, and detecting the reference signal position in the input signal by comparing the calculated similarity value with a threshold value Therefore, even if the window of interest is not finely moved over the entire region of the input signal, a detection result equivalent to that obtained by finely moving the window over the entire region can be obtained at high speed. Further, according to the present invention, it is possible to search for a specific music or commercial appearance time from a long-time signal such as a broadcast, and to search for a signal including a specific signal from a signal database or the like. .

【0142】また、本発明によれば、複数の注目窓内の
特徴量系列について、これらの特徴量系列間の(時間軸
上における)前後関係を考慮に入れて検索を行うことが
できる。これにより、雑音等によって信号が変動する場
合や、平均的な特徴では信号を区別し難い場合等であっ
ても、より高い精度で信号を検出できる。尚、上記「複
数の注目窓」の設定形態としては、例えば、もとの注目
窓を分割して複数の注目窓として設定すれば、時間の前
後関係を考慮に入れて検索を行うことができることにな
る。
Further, according to the present invention, it is possible to perform a search for a feature amount sequence in a plurality of attention windows, taking into account the context (on the time axis) between these feature amount sequences. This makes it possible to detect a signal with higher accuracy even when the signal fluctuates due to noise or the like, or when it is difficult to distinguish the signal with average characteristics. As the setting form of the “plurality of windows of interest”, for example, if the original window of interest is divided and set as a plurality of windows of interest, the search can be performed in consideration of the context of time. become.

【0143】さらに、本発明によれば、多数の参照信号
に基づいて信号を検出する場合であっても、より少ない
処理で信号を検出でき、信号検出処理における計算効率
の向上が図れる。なお、本発明の記録媒体に記録された
プログラムをコンピュータシステムに読み込ませ、実行
することによっても、より少ない処理で信号を検出して
信号検出処理における計算効率の向上を図ることができ
る。
Further, according to the present invention, even when a signal is detected based on a large number of reference signals, the signal can be detected with less processing, and the calculation efficiency in the signal detection processing can be improved. Note that, by reading and executing the program recorded on the recording medium of the present invention by a computer system, signals can be detected with less processing, and the calculation efficiency in the signal detection processing can be improved.

【図面の簡単な説明】[Brief description of the drawings]

【図1】 本発明の第1実施形態による高速信号探索装
置の構成例を示すブロック図である。
FIG. 1 is a block diagram illustrating a configuration example of a high-speed signal search device according to a first embodiment of the present invention.

【図2】 本発明の第1実施形態による高速信号探索装
置の動作例を示すフローチャートである。
FIG. 2 is a flowchart illustrating an operation example of the high-speed signal search device according to the first embodiment of the present invention.

【図3】 特徴抽出装置104の構成例を示すブロック
図である。
FIG. 3 is a block diagram illustrating a configuration example of a feature extraction device 104.

【図4】 窓の移動前後における類似値計算の一例を示
す説明図である。
FIG. 4 is an explanatory diagram showing an example of similarity value calculation before and after movement of a window.

【図5】 本発明の第1実施形態による高速信号探索装
置の検出精度の一例を示す図表である。
FIG. 5 is a table showing an example of detection accuracy of the high-speed signal search device according to the first embodiment of the present invention.

【図6】 本発明の第1実施形態による高速信号探索装
置の検出速度(総当たり法との速度比)の一例を示す図
表である。
FIG. 6 is a table showing an example of a detection speed (speed ratio with a brute force method) of the high-speed signal search device according to the first embodiment of the present invention.

【図7】 本発明の第2実施形態による高速信号探索装
置の構成例を示すブロック図である。
FIG. 7 is a block diagram illustrating a configuration example of a high-speed signal search device according to a second embodiment of the present invention.

【図8】 本発明の第2実施形態による高速信号探索装
置の処理例を示す説明図である。
FIG. 8 is an explanatory diagram illustrating a processing example of a high-speed signal search device according to a second embodiment of the present invention.

【図9】 本発明の第2実施形態による高速信号探索装
置の動作例を示すフローチャートである。
FIG. 9 is a flowchart illustrating an operation example of the high-speed signal search device according to the second embodiment of the present invention.

【図10】 スペクトル特徴を抽出するための構成例を
示すブロック図である。
FIG. 10 is a block diagram illustrating a configuration example for extracting a spectral feature.

【図11】 従来方法による音響信号検出結果の一例を
示すグラフである。
FIG. 11 is a graph showing an example of an acoustic signal detection result according to a conventional method.

【図12】 本発明の第2実施形態による音響信号検出
結果の一例を示すグラフである。
FIG. 12 is a graph showing an example of an acoustic signal detection result according to the second embodiment of the present invention.

【図13】 従来方法による画像パターン検出結果の一
例を示すグラフである。
FIG. 13 is a graph showing an example of an image pattern detection result according to a conventional method.

【図14】 本発明の第2実施形態による画像パターン
検出結果の一例を示すグラフである。
FIG. 14 is a graph showing an example of an image pattern detection result according to the second embodiment of the present invention.

【図15】 本発明の第3実施形態による高速信号探索
装置の構成例を示すブロック図である。
FIG. 15 is a block diagram illustrating a configuration example of a high-speed signal search device according to a third embodiment of the present invention.

【図16】 本発明の第3実施形態による高速信号探索
装置の動作例を示すフローチャートである。
FIG. 16 is a flowchart illustrating an operation example of the high-speed signal search device according to the third embodiment of the present invention.

【図17】 本発明の第3実施形態による音響信号検出
結果の一例を示すグラフである。
FIG. 17 is a graph showing an example of an acoustic signal detection result according to the third embodiment of the present invention.

【図18】 本発明の第3実施形態における参照信号同
士の類似値と照合回数の削減効果との関係例を示すグラ
フである。
FIG. 18 is a graph illustrating an example of a relationship between a similar value between reference signals and an effect of reducing the number of times of matching in the third embodiment of the present invention.

【符号の説明】[Explanation of symbols]

101 特徴テンプレート作成装置 102 音響信号検出装置 103 音響信号入力装置 104 特徴抽出装置 105 ヒストグラム作成装置 106 音響信号入力装置 107 注目領域走査抽出装置 108 特徴抽出装置 109 ヒストグラム作成装置 110 類似値計算装置 111 上限値計算装置 112 検出判定装置 113 フレーム分割器 114 零交差数計数器 115 微分器 116 零交差数計数器 117 微分器 118 零交差数計数器 201 参照特徴量抽出手段 202 入力特徴量抽出手段 203 類似値計算手段 204 移動量計算手段 301 信号検出装置 310 参照特徴量計算手段 312 入力特徴量計算手段 314 参照信号間類似値計算手段 316 類似値計算手段 318 移動可能量計算手段 101 Feature Template Creation Device 102 Acoustic Signal Detection Device 103 Acoustic Signal Input Device 104 Feature Extraction Device 105 Histogram Creation Device 106 Acoustic Signal Input Device 107 Attention Area Scanning Extraction Device 108 Feature Extraction Device 109 Histogram Creation Device 110 Similar Value Calculation Device 111 Upper Limit Calculation device 112 Detection / determination device 113 Frame divider 114 Zero-crossing number counter 115 Differentiator 116 Zero-crossing number counter 117 Differentiator 118 Zero-crossing number counter 201 Reference feature amount extraction means 202 Input feature amount extraction means 203 Similar value calculation Means 204 Movement amount calculation means 301 Signal detection device 310 Reference feature amount calculation means 312 Input feature amount calculation means 314 Reference signal similarity value calculation means 316 Similar value calculation means 318 Movable amount calculation means

─────────────────────────────────────────────────────
────────────────────────────────────────────────── ───

【手続補正書】[Procedure amendment]

【提出日】平成12年3月13日(2000.3.1
3)
[Submission date] March 13, 2000 (200.3.1)
3)

【手続補正1】[Procedure amendment 1]

【補正対象書類名】明細書[Document name to be amended] Statement

【補正対象項目名】特許請求の範囲[Correction target item name] Claims

【補正方法】変更[Correction method] Change

【補正内容】[Correction contents]

【特許請求の範囲】[Claims]

【請求項】 予め登録された参照信号について特徴量
系列を生成する第1の過程と、 第1の過程で生成された特徴量系列に対して、参照信号
注目窓を設定する第2の過程と、 第2の過程で設定された参照信号注目窓を、複数の参照
信号分割注目窓に分割する第3の過程と、 入力された入力信号について特徴量系列を生成する第4
の過程と、 第4の過程で生成された特徴量系列に対して、入力信号
注目窓を設定する第5の過程と、 前記入力信号注目窓を、前記複数の参照信号分割注目窓
に対応する複数の入力信号分割注目窓に分割する第6の
過程と、 各参照信号分割注目窓内の特徴量系列と当該参照信号分
割注目窓に対応する入力信号分割注目窓内の特徴量系列
との類似度合いを示す入力信号類似値を計算する第7の
過程と、 第7の過程で計算された入力信号類似値に基づいて、入
力信号注目窓を移動できる量を示す移動可能量を計算す
る第8の過程と、 第8の過程で計算された移動可能量に基づいて、入力信
号注目窓の位置を決定し、その位置に該入力信号注目窓
を設定する第9の過程とを具備し、 前記第6の過程から前記第9の過程を繰り返すことによ
って、入力信号注目窓の各位置について、入力信号類似
値を計算し、 入力信号類似値と予め設定された閾値との比較結果に基
づいて、入力信号注目窓が現在示す位置に参照信号が存
在するか否かを判定することを特徴とする高速信号探索
方法。
3. A first step of generating a feature sequence for a reference signal registered in advance, and a second process of setting a reference signal attention window for the feature sequence generated in the first process. A third step of dividing the reference signal attention window set in the second step into a plurality of reference signal division attention windows, and a fourth step of generating a feature amount sequence for the input signal input.
And a fifth step of setting an input signal attention window for the feature amount sequence generated in the fourth step. The input signal attention window corresponds to the plurality of reference signal division attention windows. A sixth process of dividing into a plurality of input signal division windows of interest, and a similarity between a feature sequence in each reference signal division window of interest and a feature sequence in the input signal division window of interest corresponding to the reference signal division window of interest. A seventh step of calculating an input signal similarity value indicating the degree; and an eighth step of calculating a movable amount indicating an amount by which the input signal attention window can be moved based on the input signal similarity value calculated in the seventh step. And a ninth step of determining the position of the input signal attention window based on the movable amount calculated in the eighth step, and setting the input signal attention window at that position. By repeating the ninth step from the sixth step, An input signal similarity value is calculated for each position of the signal attention window, and based on a comparison result between the input signal similarity value and a preset threshold, whether or not the reference signal is present at the position currently indicated by the input signal attention window A high-speed signal search method characterized by determining whether

【請求項】 予め登録された複数の参照信号について
特徴量系列を生成する第1の過程と、 入力された入力信号について特徴量系列を生成する第2
の過程と、 第2の過程で生成された特徴量系列に対して、入力信号
注目窓を設定する第3の過程と、 前記複数の参照信号のうちの2つの参照信号について、
一方の参照信号に関する特徴量系列と他方の参照信号に
関する特徴量系列との類似度合いを示す参照信号間類似
値を計算する第4の過程と、 前記複数の参照信号のうちの各参照信号について、第1
の過程で生成された特徴量系列と前記入力信号注目窓内
の特徴量系列との類似度合いを示す入力信号類似値を計
算する第5の過程と、 第4の過程で計算された参照信号間類似値と第5の過程
で計算された入力信号類似値とに基づいて、入力信号注
目窓を移動できる量を示す移動可能量を計算する第6の
過程と、 第6の過程で計算された移動可能量に基づいて、入力信
号注目窓の位置を決定し、その位置に該入力信号注目窓
を設定する第7の過程とを具備し、 前記第5の過程から前記第7の過程を繰り返すことによ
って、入力信号注目窓の各位置について、入力信号類似
値を計算し、 入力信号類似値と予め設定された閾値との比較結果に基
づいて、入力信号注目窓が現在示す位置に参照信号が存
在するか否かを判定することを特徴とする高速信号探索
方法。
4. A first step of generating a feature sequence for a plurality of reference signals registered in advance, and a second process of generating a feature sequence for an input signal.
And a third step of setting an input signal attention window for the feature amount sequence generated in the second step; and for two reference signals of the plurality of reference signals,
A fourth step of calculating a similarity value between reference signals indicating a degree of similarity between the feature quantity sequence for one reference signal and the feature quantity sequence for the other reference signal; and for each reference signal of the plurality of reference signals, First
A fifth step of calculating an input signal similarity value indicating a degree of similarity between the feature amount sequence generated in the step and the feature amount sequence in the input signal attention window; and a reference signal calculated in the fourth step. A sixth step of calculating a movable amount indicating an amount by which the input signal attention window can be moved based on the similarity value and the input signal similarity value calculated in the fifth step; and Determining a position of the input signal attention window based on the movable amount, and setting the input signal attention window at the position, and repeating the fifth to seventh steps. Accordingly, the input signal similarity value is calculated for each position of the input signal attention window, and the reference signal is set at the position indicated by the input signal attention window based on the comparison result between the input signal similarity value and a preset threshold value. High speed characterized by determining whether or not it exists Signal search method.

【請求項】 予め登録された複数の参照信号について
特徴量系列を生成する第1の過程と、 第1の過程で生成された各特徴量系列に対して、参照信
号注目窓を設定する第2の過程と、 第2の過程で設定された参照信号注目窓を、複数の参照
信号分割注目窓に分割する第3の過程と、 入力された入力信号について特徴量系列を生成する第4
の過程と、 第4の過程で生成された特徴量系列に対して、入力信号
注目窓を設定する第5の過程と、 前記入力信号注目窓を、前記複数の参照信号分割注目窓
に対応する複数の入力信号分割注目窓に分割する第6の
過程と、 前記複数の参照信号のうちの2つの参照信号について、
一方の参照信号に関する特徴量系列と他方の参照信号に
関する特徴量系列との類似度合いを示す類似値であっ
て、かつ、前記2つの参照信号間において互いに対応す
る各参照信号分割注目窓内の特徴量系列間の類似度合い
を示す類似値である参照信号間類似値を計算する第7の
過程と、 複数の参照信号のうちの各参照信号について、各参照信
号分割注目窓内の特徴量系列と当該参照信号分割注目窓
に対応する入力信号分割注目窓内の特徴量系列との類似
度合いを示す入力信号類似値を計算する第8の過程と、 第7の過程で計算された参照信号間類似値と第8の過程
で計算された入力信号類似値とに基づいて、入力信号注
目窓を移動できる量を示す移動可能量を計算する第9の
過程と、 第9の過程で計算された移動可能量に基づいて、入力信
号注目窓の位置を決定し、その位置に該入力信号注目窓
を設定する第10の過程とを具備し、 前記第6の過程から前記第10の過程を繰り返すことに
よって、入力信号注目窓の各位置について、入力信号類
似値を計算し、 入力信号類似値と予め設定された閾値との比較結果に基
づいて、入力信号注目窓が現在示す位置に参照信号が存
在するか否かを判定することを特徴とする高速信号探索
方法。
5. A first step of generating a feature value sequence for a plurality of reference signals registered in advance, and a second step of setting a reference signal attention window for each feature value sequence generated in the first process. A second step of dividing the reference signal attention window set in the second step into a plurality of reference signal division attention windows; and a fourth step of generating a feature amount sequence for the input signal input.
And a fifth step of setting an input signal attention window for the feature amount sequence generated in the fourth step. The input signal attention window corresponds to the plurality of reference signal division attention windows. A sixth step of dividing into a plurality of input signal division windows of interest; and two reference signals of the plurality of reference signals,
A similarity value indicating the degree of similarity between the feature amount sequence related to one reference signal and the feature amount sequence related to the other reference signal, and the feature in each reference signal division attention window corresponding to each other between the two reference signals. A seventh process of calculating a similarity value between reference signals, which is a similarity value indicating a degree of similarity between the quantity sequences, and a feature value sequence in each reference signal division attention window for each of the plurality of reference signals. Eighth step of calculating an input signal similarity value indicating the degree of similarity with the feature amount sequence in the input signal division attention window corresponding to the reference signal division attention window, and reference signal similarity calculated in the seventh step. A ninth step of calculating a movable amount indicating an amount by which the input signal attention window can be moved, based on the value and the input signal similarity value calculated in the eighth step; and a movement calculated in the ninth step. Based on the available Determining a position of the window of interest, and setting the window of interest of the input signal at that position, by repeating the tenth process from the sixth process, Calculating an input signal similarity value for the position and determining whether a reference signal is present at the position indicated by the input signal attention window based on a comparison result between the input signal similarity value and a preset threshold value; A high-speed signal search method characterized by the above-mentioned.

【請求項】 前記入力信号の複数の箇所について、該
入力信号と前記参照信号との類似値を予め求める予備照
合過程と、 前記予備照合過程で得られた複数の類似値について、該
類似値の平均値と標準偏差値とを求める予備照合類似値
統計過程と、 前記予備照合類似値統計過程で得られた平均値と標準偏
差値とに基づいて、前記閾値を決定する閾値決定過程と
を具備することを特徴とする請求項1〜のいずれかの
項記載の高速信号探索方法。
For a plurality of locations wherein said input signal, and the preliminary matching process of obtaining the similarity values between the reference signal and the input signal in advance, a plurality of similarity values obtained by the preliminary verification process, the similarity value A preliminary matching similarity value statistical process for obtaining an average value and a standard deviation value, and a threshold value determining process for determining the threshold value based on the average value and the standard deviation value obtained in the preliminary matching similarity value statistical process. The high-speed signal search method according to any one of claims 1 to 5 , further comprising:

【請求項】 前記入力信号類似値は、重なり類似値で
あることを特徴とする請求項1〜3のいずれかの項記載
の高速信号探索方法。
Wherein said input signal similarity value overlaps the high-speed signal searching method according to one of claims 1 to 3, characterized in that a similarity value.

【請求項】 前記入力信号注目窓は、時間軸方向にお
いて前記参照信号と同じ時間長を有する注目窓であるこ
とを特徴とする請求項1、2又は記載の高速信号探索
方法。
Wherein said input signal of interest window, according to claim 1, 2 or 4 high-speed signal searching method, wherein it is noted window having the same time length as the reference signal in the time axis direction.

【請求項】 前記移動可能量は、 θが前記閾値であり、 Sが前記入力信号類似値であり、 Dが前記特徴量系列の総度数であり、 floor{}が小数点以下の切り下げを表す場合、 Wherein said movable weight, theta is the threshold, S a is the input signal similar value, D is the total frequency of the feature value series, floor {} represents the following devaluation point If

【数1】 によって計算されることを特徴とする請求項1〜のい
ずれかの項記載の高速信号探索方法。
(Equation 1) The high-speed signal search method according to any one of claims 1 to 5 , wherein the high-speed signal search is performed.

【請求項10】 前記参照信号および前記入力信号は、
音響信号であることを特徴とする請求項のいずれ
かの項記載の高速信号探索方法。
Wherein said reference signal and said input signal,
The high-speed signal search method according to any one of claims 3 to 5 , wherein the method is an acoustic signal.

【請求項11】 前記入力信号注目窓および前記参照信
号注目窓は、時間軸方向において前記参照信号と同じ時
間長を有する注目窓であることを特徴とする請求項
記載の高速信号探索方法。
Wherein said input signal of interest window and the reference signal of interest window, according to claim 3 also <br/> 5 characterized in that it is a target window having the same time length as the reference signal in the time axis direction The high-speed signal search method according to the above.

【請求項12】 前記参照信号間類似値および前記入力
信号類似値は、重なり類似値であることを特徴とする請
求項又は記載の高速信号探索方法。
12. The method of claim 11, wherein the reference signal between similar values and the input signal similar values, high-speed signal searching method according to claim 4 or 5, wherein it is overlapped similar value.

【請求項13】 予め登録された音響信号である参照信
号について特徴量系列を生成する第1の過程と、 第1の過程で生成された特徴量系列についてヒストグラ
ムを作成する第2の過程と、 入力された音響信号である入力信号に対して、一定時間
長の入力信号注目窓を設定する第3の過程と、 前記入力信号注目窓内の入力信号について特徴量系列を
生成する第4の過程と、 第4の過程で生成された特徴量系列についてヒストグラ
ムを作成する第5の過程と、 第2の過程で作成されたヒストグラムと第5の過程で作
成されたヒストグラムとの類似度合いを示す入力信号類
似値を計算する第6の過程と、 第6の過程で計算された入力信号類似値に基づいて、入
力信号注目窓を移動できる量を示す移動可能量を計算す
る第7の過程と、 第7の過程で計算された移動可能量に基づいて、入力信
号注目窓の位置を決定し、その位置に該入力信号注目窓
を設定する第8の過程とを具備し、 前記第4の過程から前記第8の過程を繰り返すことによ
って、入力信号注目窓の各位置について、入力信号類似
値を計算し、 入力信号類似値と予め設定された閾値との比較結果に基
づいて、入力信号上において入力信号注目窓が現在示す
位置に参照信号が存在するか否かを判定することを特徴
とする高速信号探索方法。
13. A first step of generating a feature amount sequence for the reference signal is a previously registered sound signal, and a second step of generating a histogram for the generated feature amount sequence in the first step, the inputted input signal is an acoustic signal, a predetermined time
A third step of setting a long input signal attention window, a fourth step of generating a feature amount sequence for the input signal within the input signal attention window, and a histogram of the feature amount sequence generated in the fourth step. A sixth step of calculating an input signal similarity value indicating a degree of similarity between the histogram created in the second step and the histogram created in the fifth step; Based on the input signal similarity value calculated in the process, a seventh process of calculating a movable amount indicating the amount by which the input signal attention window can be moved; and based on the movable amount calculated in the seventh process, An eighth step of determining the position of the input signal attention window and setting the input signal attention window at the position; and repeating the fourth to eighth steps to obtain the input signal attention window. Input signal for each position Calculating a similarity value, and determining whether or not a reference signal exists at a position currently indicated by the input signal attention window on the input signal based on a comparison result between the input signal similarity value and a preset threshold value. Characteristic high-speed signal search method.

【請求項15】 予め登録された参照信号について特徴
量系列を生成する第1の過程と、 第1の過程で生成された特徴量系列に対して、参照信号
注目窓を設定する第2の過程と、 第2の過程で設定された参照信号注目窓を、複数の参照
信号分割注目窓に分割する第3の過程と、 入力された入力信号について特徴量系列を生成する第4
の過程と、 第4の過程で生成された特徴量系列に対して、入力信号
注目窓を設定する第5の過程と、 前記入力信号注目窓を、前記複数の参照信号分割注目窓
に対応する複数の入力信号分割注目窓に分割する第6の
過程と、 各参照信号分割注目窓内の特徴量系列についてヒストグ
ラムを作成する第7の過程と、 各入力信号分割注目窓内の特徴量系列についてヒストグ
ラムを作成する第8の過程と、 各参照信号分割注目窓内のヒストグラムと当該参照信号
分割注目窓に対応する入力信号分割注目窓内のヒストグ
ラムとの類似度合いを示す入力信号類似値を計算する第
9の過程と、 第9の過程で計算された入力信号類似値に基づいて、入
力信号注目窓を移動できる量を示す移動可能量を計算す
る第10の過程と、 第10の過程で計算された移動可能量に基づいて、入力
信号注目窓の位置を決定し、その位置に該入力信号注目
窓を設定する第11の過程とを具備し、 前記第6の過程から前記第11の過程を繰り返すことに
よって、入力信号注目窓の各位置について、入力信号類
似値を計算し、 入力信号類似値と予め設定された閾値との比較結果に基
づいて、入力信号注目窓が現在示す位置に参照信号が存
在するか否かを判定することを特徴とする高速信号探索
方法。
15. advance the registered reference signal and the first process of generating a feature value series, the second process in which the feature amount sequence generated by the first step, to set a reference signal of interest window A third step of dividing the reference signal attention window set in the second step into a plurality of reference signal division attention windows, and a fourth step of generating a feature amount sequence for the input signal input.
And a fifth step of setting an input signal attention window for the feature amount sequence generated in the fourth step. The input signal attention window corresponds to the plurality of reference signal division attention windows. A sixth process of dividing into a plurality of input signal division windows of interest, a seventh process of creating a histogram for a feature sequence in each reference signal division window of interest, and a feature sequence in each input signal division window of interest. Eighth process of creating a histogram, and calculating an input signal similarity value indicating a degree of similarity between the histogram in each reference signal division window and the histogram in the input signal division window corresponding to the reference signal division window. A ninth step, a tenth step of calculating a movable amount indicating an amount by which the input signal attention window can be moved based on the input signal similarity value calculated in the ninth step, and a tenth step Moved Determining an input signal window of interest based on the possible amount, and setting the input signal window of interest at that position; and repeating the eleventh step from the sixth step. The input signal similarity value is calculated for each position of the input signal attention window, and the reference signal is present at the position indicated by the input signal attention window based on the comparison result between the input signal similarity value and a preset threshold value. A high-speed signal search method characterized by determining whether or not to perform a search.

【請求項16】 予め登録された複数の参照信号につい
て特徴量系列を生成する第1の過程と、 第1の過程で生成された特徴量系列についてヒストグラ
ムを作成する第2の過程と、 入力された入力信号について特徴量系列を生成する第3
の過程と、 第3の過程で生成された特徴量系列に対して、入力信号
注目窓を設定する第4の過程と、 前記入力信号注目窓内の特徴量系列についてヒストグラ
ムを作成する第5の過程と、 前記複数の参照信号のうちの2つの参照信号について、
一方の参照信号に関するヒストグラムと他方の参照信号
に関するヒストグラムとの類似度合いを示す参照信号間
類似値を計算する第6の過程と、 前記複数の参照信号のうちの各参照信号について、第2
の過程で生成されたヒストグラムと第5の過程で生成さ
れたヒストグラムとの類似度合いを示す入力信号類似値
を計算する第7の過程と、 第6の過程で計算された参照信号間類似値と第7の過程
で計算された入力信号類似値とに基づいて、入力信号注
目窓を移動できる量を示す移動可能量を計算する第8の
過程と、 第8の過程で計算された移動可能量に基づいて、入力信
号注目窓の位置を決定し、その位置に該入力信号注目窓
を設定する第9の過程とを具備し、 前記第5の過程から前記第9の過程を繰り返すことによ
って、入力信号注目窓の各位置について、入力信号類似
値を計算し、入力信号類似値と予め設定された閾値との
比較結果に基づいて、入力信号注目窓が現在示す位置に
参照信号が存在するか否かを判定することを特徴とする
高速信号探索方法。
16. A first step of generating a feature sequence for a plurality of reference signals registered in advance, a second process of creating a histogram for the feature sequence generated in the first process, and Generating a feature sequence for the input signal
A fourth step of setting an input signal attention window for the feature amount sequence generated in the third step; and a fifth step of creating a histogram for the feature amount sequence in the input signal attention window. And for two reference signals of the plurality of reference signals,
A sixth step of calculating a similarity value between reference signals indicating a degree of similarity between the histogram related to one reference signal and the histogram related to the other reference signal;
A seventh step of calculating an input signal similarity value indicating a degree of similarity between the histogram generated in the step and the histogram generated in the fifth step; and a similarity value between the reference signals calculated in the sixth step. An eighth step of calculating a movable amount indicating an amount by which the input signal attention window can be moved based on the input signal similarity value calculated in the seventh step; and a movable amount calculated in the eighth step. A ninth step of determining the position of the input signal attention window based on the above, and setting the input signal attention window at that position. By repeating the ninth step from the fifth step, An input signal similarity value is calculated for each position of the input signal attention window, and based on a comparison result between the input signal similarity value and a preset threshold, whether a reference signal is present at the position currently indicated by the input signal attention window. Determining whether or not Fast signal search method.

【請求項17】 予め登録された複数の参照信号につい
て特徴量系列を生成する第1の過程と、 第1の過程で生成された各特徴量系列に対して、参照信
号注目窓を設定する第2の過程と、 第2の過程で設定された参照信号注目窓を、複数の参照
信号分割注目窓に分割する第3の過程と、 入力された入力信号について特徴量系列を生成する第4
の過程と、 第4の過程で生成された特徴量系列に対して、入力信号
注目窓を設定する第5の過程と、 前記入力信号注目窓を、前記複数の参照信号分割注目窓
に対応する複数の入力信号分割注目窓に分割する第6の
過程と、 各参照信号分割注目窓内の特徴量系列についてヒストグ
ラムを作成する第7の過程と、 各入力信号分割注目窓内の特徴量系列についてヒストグ
ラムを作成する第8の過程と、 前記複数の参照信号のうちの2つの参照信号について、
一方の参照信号に関するヒストグラムと他方の参照信号
に関するヒストグラムとの類似度合いを示す類似値であ
って、かつ、前記2つの参照信号間において互いに対応
する各参照信号分割注目窓内のヒストグラム間の類似度
合いを示す類似値である参照信号間類似値を計算する第
9の過程と、 複数の参照信号のうちの各参照信号について、各参照信
号分割注目窓内のヒストグラムと当該参照信号分割注目
窓に対応する入力信号分割注目窓内のヒストグラムとの
類似度合いを示す入力信号類似値を計算する第10の過
程と、 第9の過程で計算された参照信号間類似値と第10の過
程で計算された入力信号類似値とに基づいて、入力信号
注目窓を移動できる量を示す移動可能量を計算する第1
1の過程と、 第11の過程で計算された移動可能量に基づいて、入力
信号注目窓の位置を決定し、その位置に該入力信号注目
窓を設定する第12の過程とを具備し、 前記第6の過程から前記第12の過程を繰り返すことに
よって、入力信号注目窓の各位置について、入力信号類
似値を計算し、入力信号類似値と予め設定された閾値と
の比較結果に基づいて、入力信号注目窓が現在示す位置
に参照信号が存在するか否かを判定することを特徴とす
る高速信号探索方法。
17. A first step of generating a feature amount sequence for a plurality of reference signals registered in advance, and a second step of setting a reference signal attention window for each feature amount sequence generated in the first step. A second step of dividing the reference signal attention window set in the second step into a plurality of reference signal division attention windows; and a fourth step of generating a feature amount sequence for the input signal input.
And a fifth step of setting an input signal attention window for the feature amount sequence generated in the fourth step. The input signal attention window corresponds to the plurality of reference signal division attention windows. A sixth process of dividing into a plurality of input signal division windows of interest, a seventh process of creating a histogram for a feature sequence in each reference signal division window of interest, and a feature sequence in each input signal division window of interest. An eighth step of creating a histogram; and two reference signals of the plurality of reference signals,
A similarity value indicating the similarity between the histogram for one reference signal and the histogram for the other reference signal, and the similarity between the histograms in the reference signal division attention windows corresponding to each other between the two reference signals. A ninth step of calculating a similarity value between reference signals, which is a similarity value indicating a histogram of each of the plurality of reference signals. A tenth step of calculating an input signal similarity value indicating the degree of similarity with the histogram in the input signal division window of interest, and a similarity value between the reference signals calculated in the ninth step and the tenth step. First calculating a movable amount indicating the amount by which the input signal attention window can be moved based on the input signal similarity value;
And a twelfth step of determining the position of the input signal window of interest based on the movable amount calculated in the eleventh step, and setting the input signal window of interest at that position. By repeating the sixth to twelfth steps, an input signal similarity value is calculated for each position of the input signal attention window, and based on a comparison result between the input signal similarity value and a preset threshold value. And determining whether or not a reference signal is present at a position currently indicated by the input signal attention window.

【請求項21】 前記特徴量系列は、参照信号および入
力信号の零交差数およびその微分値の系列であり、 前記ヒストグラムは、前記零交差数およびその微分値が
取りうる値の範囲を複数の区間に分割し、前記各区間に
対応する特徴量系列を前記零交差数およびその微分値に
基づいて計数することによって作成されることを特徴と
する請求項1320のいずれかの項記載の高速信号探
索方法。
21. The feature amount sequence is a sequence of the number of zero crossings of a reference signal and an input signal and a derivative thereof, and the histogram includes a plurality of ranges of values that the number of zero crosses and the derivative thereof can take. is divided into sections, one section wherein the claims 13 to 20, characterized in that is created by the feature amount sequence corresponding to each section counted on the basis of the number of zero-crossings and its differential value Fast signal search method.

【請求項22】 前記特徴量系列は、複数の周波数帯域
の成分を要素とする特徴ベクトルの系列であり、 前記ヒストグラムは、前記特徴ベクトルの各要素が取り
うる値の範囲を複数の区間に分割し、前記各区間に対応
する特徴量系列を前記要素の値に基づいて計数すること
によって作成されることを特徴とする請求項1320
のいずれかの項記載の高速信号探索方法。
22. The feature amount sequence is a sequence of feature vectors having components of a plurality of frequency bands and elements, the histogram divides the range of each element can take the value of the feature vectors into a plurality of sections and, wherein claims 13 to 20, characterized in that is created by the feature amount sequence corresponding to each section counted based on the value of the element
13. The high-speed signal search method according to any one of the above items.

【請求項23】 予め登録された音響信号である参照信
号について特徴量系列を生成する参照信号特徴量生成手
段と、 入力された音響信号である入力信号について特徴量系列
を生成する入力信号特徴量生成手段と、 入力信号特徴量生成手段で生成された特徴量系列に対し
て、一定時間長の入力信号注目窓を設定する入力信号注
目窓設定手段と、 参照信号特徴量生成手段で生成された特徴量系列と前記
入力信号注目窓内の特徴量系列との類似度合いを示す入
力信号類似値を計算する入力信号類似値計算手段と、 入力信号類似値計算手段で計算された入力信号類似値に
基づいて、入力信号注目窓を移動できる量を示す移動可
能量を計算する移動可能量計算手段と、 移動可能量計算手段で計算された移動可能量に基づい
て、入力信号注目窓の位置を決定し、その位置に該入力
信号注目窓を設定する入力信号注目窓位置決定手段と、 入力信号類似値計算手段と移動可能量計算手段と入力信
号注目窓位置決定手段とに対して、それぞれの処理を繰
り返し行わせることによって、入力信号注目窓の各位置
について、入力信号類似値を計算させる繰返手段と、 入力信号類似値と予め設定された閾値との比較結果に基
づいて、入力信号上において入力信号注目窓が現在示す
位置に参照信号が存在するか否かを判定する判定手段と
を具備することを特徴とする高速信号探索装置。
23. A reference signal feature amount generating means for generating a feature amount sequence for a reference signal which is a previously registered audio signal, and an input signal feature amount for generating a feature amount sequence for an input signal which is an input audio signal. Generating means, input signal attention window setting means for setting an input signal attention window of a fixed time length for the feature amount sequence generated by the input signal feature amount generation means, and reference signal feature amount generation means. Input signal similarity calculating means for calculating an input signal similarity value indicating the degree of similarity between the feature amount series and the feature amount series in the input signal attention window; and an input signal similarity value calculated by the input signal similarity value calculating means. A movable amount calculating means for calculating a movable amount indicating an amount capable of moving the input signal attention window based on the input signal attention window based on the movable amount calculated by the movable signal amount calculating means. And the input signal attention window position determining means for setting the input signal attention window at that position, the input signal similarity value calculation means, the movable amount calculation means, and the input signal attention window position determination means, respectively. Is repeated to calculate an input signal similarity value for each position of the input signal attention window. Based on a comparison result between the input signal similarity value and a preset threshold value, the input signal A high-speed signal search apparatus comprising: a determination unit configured to determine whether a reference signal is present at a position currently indicated by the input signal attention window.

【請求項28】 請求項23又は24記載の高速信号探
索装置と、 ビデオ装置と、 前記高速信号探索装置の判定結果に基づいて、前記ビデ
オ装置の録画動作を制御する制御手段とを具備すること
を特徴とするビデオ自動制御装置。
28. a high-speed signal searching apparatus according to claim 23 or 24, wherein the video device, based on a determination result of the high-speed signal searching device, to a control means for controlling the recording operation of the video device Automatic video control device characterized by the above-mentioned.

【請求項29】 コンピュータを、 予め登録された音響信号である参照信号について特徴量
系列を生成する参照信号特徴量生成手段と、 入力された音響信号である入力信号について特徴量系列
を生成する入力信号特徴量生成手段と、 入力信号特徴量生成手段で生成された特徴量系列に対し
て、一定時間長の入力信号注目窓を設定する入力信号注
目窓設定手段と、 参照信号特徴量生成手段で生成された特徴量系列と前記
入力信号注目窓内の特徴量系列との類似度合いを示す入
力信号類似値を計算する入力信号類似値計算手段と、 入力信号類似値計算手段で計算された入力信号類似値に
基づいて、入力信号注目窓を移動できる量を示す移動可
能量を計算する移動可能量計算手段と、 移動可能量計算手段で計算された移動可能量に基づい
て、入力信号注目窓の位置を決定し、その位置に該入力
信号注目窓を設定する入力信号注目窓位置決定手段と、 入力信号類似値計算手段と移動可能量計算手段と入力信
号注目窓位置決定手段とに対して、それぞれの処理を繰
り返し行わせることによって、入力信号注目窓の各位置
について、入力信号類似値を計算させる繰返手段と、 入力信号類似値と予め設定された閾値との比較結果に基
づいて、入力信号上において入力信号注目窓が現在示す
位置に参照信号が存在するか否かを判定する判定手段と
して機能させるためのプログラムを記録した記録媒体。
The 29. Computer, generates a reference signal feature value generating means for generating a feature amount sequence for the reference signal is a pre-registered audio signal, a feature amount sequence for an input sound signal input signal input A signal feature amount generation unit, an input signal attention window setting unit for setting an input signal attention window of a fixed time length for the feature amount sequence generated by the input signal feature amount generation unit, and a reference signal feature amount generation unit. Input signal similarity value calculating means for calculating an input signal similarity value indicating a degree of similarity between the generated feature amount sequence and the feature amount sequence in the input signal attention window; and an input signal calculated by the input signal similarity value calculating means. A movable amount calculating means for calculating a movable amount indicating an amount by which the input signal attention window can be moved based on the similar value; and an input based on the movable amount calculated by the movable amount calculating means. An input signal attention window position determining means for determining a position of the signal attention window and setting the input signal attention window at the position; an input signal similarity value calculating means; a movable amount calculating means; and an input signal attention window position determining means. For each position of the input signal attention window, a repetition means for calculating the input signal similarity value for each position of the input signal attention window, and a comparison result between the input signal similarity value and a preset threshold value. A recording medium on which is recorded a program for functioning as a judging means for judging whether or not a reference signal is present at a position currently indicated by an input signal attention window on an input signal based on the input signal.

【手続補正2】[Procedure amendment 2]

【補正対象書類名】明細書[Document name to be amended] Statement

【補正対象項目名】0007[Correction target item name] 0007

【補正方法】変更[Correction method] Change

【補正内容】[Correction contents]

【0007】[0007]

【課題を解決するための手段】請求項1記載の発明は、
予め登録された音響信号である参照信号について特徴量
系列を生成する第1の過程と、入力された音響信号であ
入力信号に対して、一定時間長の入力信号注目窓を設
定する第2の過程と、前記入力信号注目窓内の入力信号
について特徴量系列を生成する第3の過程と、第1の過
程で生成された特徴量系列と第3の過程で生成された特
徴量系列との類似度合いを示す入力信号類似値を計算す
る第4の過程と、第4の過程で計算された入力信号類似
値に基づいて、入力信号注目窓を移動できる量を示す移
動可能量を計算する第5の過程と、第5の過程で計算さ
れた移動可能量に基づいて、入力信号注目窓の位置を決
定し、その位置に該入力信号注目窓を設定する第6の過
程とを具備し、前記第3の過程から前記第6の過程を繰
り返すことによって、入力信号注目窓の各位置につい
て、入力信号類似値を計算し、入力信号類似値と予め設
定された閾値との比較結果に基づいて、入力信号上にお
いて入力信号注目窓が現在示す位置に参照信号が存在す
るか否かを判定することを特徴としている。請求項2記
載の発明は、予め登録された動画像の映像信号である参
照信号について特徴量系列を生成する第1の過程と、入
力された動画像の映像信号である入力信号に対して、一
定時間長の入力信号注目窓を設定する第2の過程と、前
記入力信号注目窓内の入力信号について特徴量系列を生
成する第3の過程と、第1の過程で生成された特徴量系
列と第3の過程で生成された特徴量系列との類似度合い
を示す入力信号類似値を計算する第4の過程と、第4の
過程で計算された入力信号類似値に基づいて、入力信号
注目窓を移動できる量を示す移動可能量を計算する第5
の過程と、第5の過程で計算された移動可能量に基づい
て、入力信号注目窓の位置を決定し、その位置に該入力
信号注目窓を設定する第6の過程とを具備し、前記第3
の過程から前記第6の過程を繰り返すことによって、入
力信号注目窓の各位置について、入力信号類似値を計算
し、入力信号類似値と予め設定された閾値との比較結果
に基づいて、入力信号上において入力信号注目窓が現在
示す位置に参照信号が存在するか否かを判定することを
特徴としている。
According to the first aspect of the present invention,
A first process of generating a feature sequence for a reference signal that is a pre-registered audio signal;
A second step of setting an input signal attention window having a fixed time length for an input signal to be input, a third step of generating a feature amount sequence for an input signal within the input signal attention window, and a first step A fourth step of calculating an input signal similarity value indicating a degree of similarity between the feature quantity sequence generated in step 3 and the feature quantity sequence generated in the third step, and an input signal similarity value calculated in the fourth step And a position of the input signal attention window is determined on the basis of the movable amount calculated in the fifth step. A sixth step of setting the input signal attention window at the position, and repeating the third to sixth steps to obtain an input signal similarity value for each position of the input signal attention window. Is calculated, and the ratio between the input signal similarity value and a preset threshold is calculated. Based on the results, the input signal of interest windows on the input signal is characterized by determining whether the reference signal to the position indicated currently exists. Claim 2
The invention described above refers to a reference which is a video signal of a moving image registered in advance.
A first step of generating a feature sequence for the illumination signal;
The input signal, which is the video signal of the
The second step of setting the input signal attention window of a fixed time length, and
Generate a feature sequence for the input signal within the input signal attention window.
A third process to be performed and a feature amount system generated in the first process
Similarity between the sequence and the feature sequence generated in the third process
A fourth step of calculating an input signal similarity value indicating
Based on the input signal similarity value calculated in the process, the input signal
Fifth calculating the movable amount indicating the amount that the attention window can be moved
And the amount of movement calculated in the fifth step
To determine the position of the input signal attention window, and
And setting a signal attention window.
By repeating the sixth step from the step
Calculate the input signal similarity value for each position of the force signal attention window
And a comparison result between the input signal similarity value and a preset threshold value
Input signal attention window on the input signal based on
To determine whether a reference signal exists at the indicated position.
Features.

【手続補正3】[Procedure amendment 3]

【補正対象書類名】明細書[Document name to be amended] Statement

【補正対象項目名】0008[Correction target item name] 0008

【補正方法】変更[Correction method] Change

【補正内容】[Correction contents]

【0008】請求項記載の発明は、予め登録された参
照信号について特徴量系列を生成する第1の過程と、第
1の過程で生成された特徴量系列に対して、参照信号注
目窓を設定する第2の過程と、第2の過程で設定された
参照信号注目窓を、複数の参照信号分割注目窓に分割す
る第3の過程と、入力された入力信号について特徴量系
列を生成する第4の過程と、第4の過程で生成された特
徴量系列に対して、入力信号注目窓を設定する第5の過
程と、前記入力信号注目窓を、前記複数の参照信号分割
注目窓に対応する複数の入力信号分割注目窓に分割する
第6の過程と、各参照信号分割注目窓内の特徴量系列と
当該参照信号分割注目窓に対応する入力信号分割注目窓
内の特徴量系列との類似度合いを示す入力信号類似値を
計算する第7の過程と、第7の過程で計算された入力信
号類似値に基づいて、入力信号注目窓を移動できる量を
示す移動可能量を計算する第8の過程と、第8の過程で
計算された移動可能量に基づいて、入力信号注目窓の位
置を決定し、その位置に該入力信号注目窓を設定する第
9の過程とを具備し、前記第6の過程から前記第9の過
程を繰り返すことによって、入力信号注目窓の各位置に
ついて、入力信号類似値を計算し、入力信号類似値と予
め設定された閾値との比較結果に基づいて、入力信号注
目窓が現在示す位置に参照信号が存在するか否かを判定
することを特徴としている。
According to a third aspect of the present invention, a first step of generating a feature amount sequence for a reference signal registered in advance, and a reference signal attention window for a feature amount sequence generated in the first step are set. A second step of setting, a third step of dividing the reference signal attention window set in the second step into a plurality of reference signal division attention windows, and generating a feature amount sequence for the input signal input A fourth step, a fifth step of setting an input signal attention window for the feature amount series generated in the fourth step, and setting the input signal attention window to the plurality of reference signal division attention windows. A sixth process of dividing into a plurality of corresponding input signal division windows of interest, a feature value sequence in each reference signal division window of interest, and a feature value sequence in an input signal division window of interest corresponding to the reference signal division window of interest. The seventh step of calculating the input signal similarity value indicating the similarity degree of An eighth step of calculating a movable amount indicating an amount by which the input signal attention window can be moved based on the input signal similarity value calculated in the seventh step, and a movable amount calculated in the eighth step Ninth step of determining the position of the input signal attention window based on the quantity and setting the input signal attention window at that position, and repeating the ninth step from the sixth step. The input signal similarity value is calculated for each position of the input signal attention window, and the reference signal is present at the position indicated by the input signal attention window based on the comparison result between the input signal similarity value and a preset threshold value. Is determined.

【手続補正4】[Procedure amendment 4]

【補正対象書類名】明細書[Document name to be amended] Statement

【補正対象項目名】0009[Correction target item name] 0009

【補正方法】変更[Correction method] Change

【補正内容】[Correction contents]

【0009】請求項記載の発明は、予め登録された複
数の参照信号について特徴量系列を生成する第1の過程
と、入力された入力信号について特徴量系列を生成する
第2の過程と、第2の過程で生成された特徴量系列に対
して、入力信号注目窓を設定する第3の過程と、前記複
数の参照信号のうちの2つの参照信号について、一方の
参照信号に関する特徴量系列と他方の参照信号に関する
特徴量系列との類似度合いを示す参照信号間類似値を計
算する第4の過程と、前記複数の参照信号のうちの各参
照信号について、第1の過程で生成された特徴量系列と
前記入力信号注目窓内の特徴量系列との類似度合いを示
す入力信号類似値を計算する第5の過程と、第4の過程
で計算された参照信号間類似値と第5の過程で計算され
た入力信号類似値とに基づいて、入力信号注目窓を移動
できる量を示す移動可能量を計算する第6の過程と、第
6の過程で計算された移動可能量に基づいて、入力信号
注目窓の位置を決定し、その位置に該入力信号注目窓を
設定する第7の過程とを具備し、前記第5の過程から前
記第7の過程を繰り返すことによって、入力信号注目窓
の各位置について、入力信号類似値を計算し、入力信号
類似値と予め設定された閾値との比較結果に基づいて、
入力信号注目窓が現在示す位置に参照信号が存在するか
否かを判定することを特徴としている。
According to a fourth aspect of the present invention, there is provided a first step of generating a feature sequence for a plurality of reference signals registered in advance, a second process of generating a feature sequence for an input signal input, A third step of setting an input signal attention window with respect to the feature amount sequence generated in the second step; and a feature amount sequence relating to one of the plurality of reference signals. A fourth step of calculating an inter-reference signal similarity value indicating a degree of similarity between the reference signal and the other reference signal, and each of the plurality of reference signals is generated in the first step. A fifth step of calculating an input signal similarity value indicating a degree of similarity between the feature amount series and the feature amount sequence in the input signal attention window; and a fifth step of calculating the similarity value between the reference signals calculated in the fourth step. Input signal similarity value calculated in the process And a position of the input signal attention window is determined on the basis of the movable amount calculated in the sixth step. And a seventh step of setting the input signal attention window at that position, and repeating the fifth to seventh steps to obtain an input signal similarity value for each position of the input signal attention window. Is calculated, based on a comparison result between the input signal similarity value and a preset threshold value,
It is characterized in that it is determined whether or not a reference signal exists at a position currently indicated by the input signal attention window.

【手続補正5】[Procedure amendment 5]

【補正対象書類名】明細書[Document name to be amended] Statement

【補正対象項目名】0010[Correction target item name] 0010

【補正方法】変更[Correction method] Change

【補正内容】[Correction contents]

【0010】請求項記載の発明は、予め登録された複
数の参照信号について特徴量系列を生成する第1の過程
と、第1の過程で生成された各特徴量系列に対して、参
照信号注目窓を設定する第2の過程と、第2の過程で設
定された参照信号注目窓を、複数の参照信号分割注目窓
に分割する第3の過程と、入力された入力信号について
特徴量系列を生成する第4の過程と、第4の過程で生成
された特徴量系列に対して、入力信号注目窓を設定する
第5の過程と、前記入力信号注目窓を、前記複数の参照
信号分割注目窓に対応する複数の入力信号分割注目窓に
分割する第6の過程と、前記複数の参照信号のうちの2
つの参照信号について、一方の参照信号に関する特徴量
系列と他方の参照信号に関する特徴量系列との類似度合
いを示す類似値であって、かつ、前記2つの参照信号間
において互いに対応する各参照信号分割注目窓内の特徴
量系列間の類似度合いを示す類似値である参照信号間類
似値を計算する第7の過程と、複数の参照信号のうちの
各参照信号について、各参照信号分割注目窓内の特徴量
系列と当該参照信号分割注目窓に対応する入力信号分割
注目窓内の特徴量系列との類似度合いを示す入力信号類
似値を計算する第8の過程と、第7の過程で計算された
参照信号間類似値と第8の過程で計算された入力信号類
似値とに基づいて、入力信号注目窓を移動できる量を示
す移動可能量を計算する第9の過程と、第9の過程で計
算された移動可能量に基づいて、入力信号注目窓の位置
を決定し、その位置に該入力信号注目窓を設定する第1
0の過程とを具備し、前記第6の過程から前記第10の
過程を繰り返すことによって、入力信号注目窓の各位置
について、入力信号類似値を計算し、入力信号類似値と
予め設定された閾値との比較結果に基づいて、入力信号
注目窓が現在示す位置に参照信号が存在するか否かを判
定することを特徴としている。
According to a fifth aspect of the present invention, a first step of generating a feature amount sequence for a plurality of pre-registered reference signals, and a reference signal generation process for each of the feature amount sequences generated in the first step. A second step of setting an attention window, a third step of dividing the reference signal attention window set in the second step into a plurality of reference signal division attention windows, and a feature amount sequence for the input signal input. A fourth step of generating an input signal attention window for the feature amount sequence generated in the fourth step, and dividing the input signal attention window by the plurality of reference signal divisions. A sixth step of dividing the input signal into windows of interest corresponding to the window of interest;
Each of the reference signal divisions is a similarity value indicating a degree of similarity between a feature value sequence related to one reference signal and a feature value sequence related to the other reference signal, and corresponds to each other between the two reference signals. A seventh process of calculating a similarity value between reference signals, which is a similarity value indicating a degree of similarity between feature amount sequences in the window of interest, and, for each reference signal of the plurality of reference signals, a reference signal division in each window of interest. An input signal similarity value indicating the degree of similarity between the feature amount sequence of the above and the feature amount sequence in the input signal division attention window corresponding to the reference signal division attention window is calculated in an eighth process and a seventh process. A ninth step of calculating a movable amount indicating an amount by which the input signal attention window can be moved, based on the similarity value between the reference signals and the input signal similarity value calculated in the eighth step; Movable calculated by Based on, to determine the position of the input signal of interest window, first setting the input signal of interest window in that position
0, and by repeating the sixth to the tenth steps, an input signal similarity value is calculated for each position of the input signal attention window, and the input signal similarity value is preset as the input signal similarity value. It is characterized in that it is determined whether or not a reference signal exists at a position currently indicated by an input signal attention window based on a result of comparison with a threshold value.

【手続補正6】[Procedure amendment 6]

【補正対象書類名】明細書[Document name to be amended] Statement

【補正対象項目名】0011[Correction target item name] 0011

【補正方法】変更[Correction method] Change

【補正内容】[Correction contents]

【0011】請求項記載の発明は、請求項1〜のい
ずれかの項記載の高速信号探索方法において、前記入力
信号の複数の箇所について、該入力信号と前記参照信号
との類似値を予め求める予備照合過程と、前記予備照合
過程で得られた複数の類似値について、該類似値の平均
値と標準偏差値とを求める予備照合類似値統計過程と、
前記予備照合類似値統計過程で得られた平均値と標準偏
差値とに基づいて、前記閾値を決定する閾値決定過程と
を具備することを特徴としている。
According to a sixth aspect of the present invention, in the high-speed signal search method according to any one of the first to fifth aspects, a similar value between the input signal and the reference signal is determined for a plurality of points of the input signal. A preliminary matching process that is determined in advance, and a plurality of similar values obtained in the preliminary matching process, a preliminary matching similar value statistical process that determines an average value and a standard deviation value of the similar values;
A threshold value determining step of determining the threshold value based on the average value and the standard deviation value obtained in the preliminary matching similarity value statistical step.

【手続補正7】[Procedure amendment 7]

【補正対象書類名】明細書[Document name to be amended] Statement

【補正対象項目名】0012[Correction target item name] 0012

【補正方法】変更[Correction method] Change

【補正内容】[Correction contents]

【0012】請求項記載の発明は、請求項1〜3のい
ずれかの項記載の高速信号探索方法において、前記入力
信号類似値は、重なり類似値であることを特徴としてい
る。
[0012] According to a seventh aspect, claim 1-3 Neu
The high-speed signal search method according to any one of the preceding claims, wherein the input signal similarity value is an overlap similarity value.

【手続補正8】[Procedure amendment 8]

【補正対象書類名】明細書[Document name to be amended] Statement

【補正対象項目名】0013[Correction target item name] 0013

【補正方法】変更[Correction method] Change

【補正内容】[Correction contents]

【0013】請求項記載の発明は、請求項1、2又は
記載の高速信号探索方法において、前記入力信号注目
窓は、時間軸方向において前記参照信号と同じ時間長を
有する注目窓であることを特徴としている。
[0013] The invention according to claim 8 is the invention according to claim 1 , 2 or
5. The high-speed signal search method according to 4 , wherein the input signal attention window is an attention window having the same time length as the reference signal in a time axis direction.

【手続補正9】[Procedure amendment 9]

【補正対象書類名】明細書[Document name to be amended] Statement

【補正対象項目名】0014[Correction target item name] 0014

【補正方法】変更[Correction method] Change

【補正内容】[Correction contents]

【0014】請求項記載の発明は、請求項1〜のい
ずれかの項記載の高速信号探索方法において、前記移動
可能量は、θが前記閾値であり、Sが前記入力信号類似
値であり、Dが前記特徴量系列の総度数であり、flo
or{}が小数点以下の切り下げを表す場合、数1の式
によって計算されることを特徴としている。
According to a ninth aspect of the present invention, in the high-speed signal search method according to any one of the first to fifth aspects, the movable amount is such that θ is the threshold value and S is the input signal similarity value. And D is the total frequency of the feature amount series, and
When or {} represents rounding down to the decimal point, it is characterized by being calculated by the equation (1).

【手続補正10】[Procedure amendment 10]

【補正対象書類名】明細書[Document name to be amended] Statement

【補正対象項目名】0015[Correction target item name] 0015

【補正方法】変更[Correction method] Change

【補正内容】[Correction contents]

【0015】請求項10記載の発明は、請求項
いずれかの項記載の高速信号探索方法において、前記参
照信号および前記入力信号は、音響信号であることを特
徴としている。
According to a tenth aspect of the present invention, in the high-speed signal search method according to any one of the third to fifth aspects, the reference signal and the input signal are acoustic signals.

【手続補正11】[Procedure amendment 11]

【補正対象書類名】明細書[Document name to be amended] Statement

【補正対象項目名】0016[Correction target item name] 0016

【補正方法】変更[Correction method] Change

【補正内容】[Correction contents]

【0016】請求項11記載の発明は、請求項又は
記載の高速信号探索方法において、前記入力信号注目窓
および前記参照信号注目窓は、時間軸方向において前記
参照信号と同じ時間長を有する注目窓であることを特徴
としている。
The invention described in claim 11 is the invention according to claim 3 or 5.
In the high-speed signal search method described above, the input signal attention window and the reference signal attention window are attention windows having the same time length as the reference signal in a time axis direction.

【手続補正12】[Procedure amendment 12]

【補正対象書類名】明細書[Document name to be amended] Statement

【補正対象項目名】0017[Correction target item name] 0017

【補正方法】変更[Correction method] Change

【補正内容】[Correction contents]

【0017】請求項12記載の発明は、請求項又は
記載の高速信号探索方法において、前記参照信号間類似
値および前記入力信号類似値は、重なり類似値であるこ
とを特徴としている。
According to a twelfth aspect of the present invention, there is provided the fourth or fifth aspect.
In the high-speed signal search method described above, the similarity value between the reference signals and the similarity value of the input signal are overlapped similarity values.

【手続補正13】[Procedure amendment 13]

【補正対象書類名】明細書[Document name to be amended] Statement

【補正対象項目名】0018[Correction target item name] 0018

【補正方法】変更[Correction method] Change

【補正内容】[Correction contents]

【0018】請求項13記載の発明は、予め登録された
音響信号である参照信号について特徴量系列を生成する
第1の過程と、第1の過程で生成された特徴量系列につ
いてヒストグラムを作成する第2の過程と、入力された
音響信号である入力信号に対して、一定時間長の入力信
号注目窓を設定する第3の過程と、前記入力信号注目窓
内の入力信号について特徴量系列を生成する第4の過程
と、第4の過程で生成された特徴量系列についてヒスト
グラムを作成する第5の過程と、第2の過程で作成され
たヒストグラムと第5の過程で作成されたヒストグラム
との類似度合いを示す入力信号類似値を計算する第6の
過程と、第6の過程で計算された入力信号類似値に基づ
いて、入力信号注目窓を移動できる量を示す移動可能量
を計算する第7の過程と、第7の過程で計算された移動
可能量に基づいて、入力信号注目窓の位置を決定し、そ
の位置に該入力信号注目窓を設定する第8の過程とを具
備し、前記第4の過程から前記第8の過程を繰り返すこ
とによって、入力信号注目窓の各位置について、入力信
号類似値を計算し、入力信号類似値と予め設定された閾
値との比較結果に基づいて、入力信号上において入力信
号注目窓が現在示す位置に参照信号が存在するか否かを
判定することを特徴としている。請求項14記載の発明
は、予め登録された動画像の映像信号である参照信号に
ついて特徴量系列を生成する第1の過程と、第1の過程
で生成された特徴量系列についてヒストグラムを作成す
る第2の過程と、入力された動画像の映像信号である入
力信号に対して、一定時間長の入力信号注目窓を設定す
る第3の過程と、前記入力信号注目窓内の入力信号につ
いて特徴量系列を生成する第4の過程と、第4の過程で
生成された特徴量系列についてヒストグラムを作成する
第5の過程と、第2の過程で作成されたヒストグラムと
第5の過程で作成されたヒストグラムとの類似度合いを
示す入力信号類似値を計算する第6の過程と、第6の過
程で計算された入力信号類似値に基づいて、入力信号注
目窓を移動できる量を示す移動可能量を計算する第7の
過程と、第7の過程で計算された移動可能量に基づい
て、入力信号注目窓の位置を決定し、その位置に該入力
信号注目窓を設定する第8の過程とを具備し、前記第4
の過程から前記第8の過程を繰り返すことによって、入
力信号注目窓の各位置について、入力信号類似値を計算
し、入力信号類似値と予め設定された閾値との比較結果
に基づいて、入力信号上において入力信号注目窓が現在
示す位置に参照信号が存在するか否かを判定することを
特徴としている。
According to a thirteenth aspect of the present invention, there is provided a method in which
A first step of generating a feature sequence for a reference signal that is an acoustic signal, a second process of creating a histogram for the feature sequence generated in the first process,
A third step of setting an input signal attention window of a fixed time length for an input signal that is an acoustic signal, a fourth step of generating a feature amount sequence for an input signal in the input signal attention window, and A fifth step of creating a histogram for the feature amount series generated in step 4, and an input signal similarity value indicating the degree of similarity between the histogram created in the second step and the histogram created in the fifth step And a seventh step of calculating a movable amount indicating an amount by which the input signal attention window can be moved, based on the input signal similarity value calculated in the sixth step. An eighth step of determining the position of the input signal window of interest based on the movable amount calculated in the step, and setting the input signal window of interest at that position; and Input by repeating the process of 8 For each position of the signal attention window, the input signal similarity value is calculated, and based on the comparison result between the input signal similarity value and a preset threshold, the reference signal is located at the position indicated by the input signal attention window on the input signal. It is characterized in that it is determined whether or not it exists. The invention according to claim 14
Is a reference signal which is a video signal of a moving image registered in advance.
First step of generating a feature quantity sequence for the first and second steps
Create a histogram for the feature value series generated in
A second process, and an input which is a video signal of the input moving image.
Set an input signal attention window of a fixed time length for the force signal
A third process, and an input signal within the input signal attention window.
A fourth step of generating a feature quantity sequence
Create a histogram for the generated feature sequence
The fifth step, the histogram created in the second step,
The degree of similarity with the histogram created in the fifth process
A sixth step of calculating an input signal similarity value
Based on the input signal similarity value calculated in
Calculate the movable amount indicating the amount that the eye window can be moved.
Process and the amount of movement calculated in the seventh process
To determine the position of the input signal attention window, and
An eighth step of setting a signal attention window.
By repeating the eighth step from the step
Calculate the input signal similarity value for each position of the force signal attention window
And a comparison result between the input signal similarity value and a preset threshold value
Input signal attention window on the input signal based on
To determine whether a reference signal exists at the indicated position.
Features.

【手続補正14】[Procedure amendment 14]

【補正対象書類名】明細書[Document name to be amended] Statement

【補正対象項目名】0019[Correction target item name] 0019

【補正方法】変更[Correction method] Change

【補正内容】[Correction contents]

【0019】請求項15記載の発明は、予め登録された
参照信号について特徴量系列を生成する第1の過程と、
第1の過程で生成された特徴量系列に対して、参照信号
注目窓を設定する第2の過程と、第2の過程で設定され
た参照信号注目窓を、複数の参照信号分割注目窓に分割
する第3の過程と、入力された入力信号について特徴量
系列を生成する第4の過程と、第4の過程で生成された
特徴量系列に対して、入力信号注目窓を設定する第5の
過程と、前記入力信号注目窓を、前記複数の参照信号分
割注目窓に対応する複数の入力信号分割注目窓に分割す
る第6の過程と、各参照信号分割注目窓内の特徴量系列
についてヒストグラムを作成する第7の過程と、各入力
信号分割注目窓内の特徴量系列についてヒストグラムを
作成する第8の過程と、各参照信号分割注目窓内のヒス
トグラムと当該参照信号分割注目窓に対応する入力信号
分割注目窓内のヒストグラムとの類似度合いを示す入力
信号類似値を計算する第9の過程と、第9の過程で計算
された入力信号類似値に基づいて、入力信号注目窓を移
動できる量を示す移動可能量を計算する第10の過程
と、第10の過程で計算された移動可能量に基づいて、
入力信号注目窓の位置を決定し、その位置に該入力信号
注目窓を設定する第11の過程とを具備し、前記第6の
過程から前記第11の過程を繰り返すことによって、入
力信号注目窓の各位置について、入力信号類似値を計算
し、入力信号類似値と予め設定された閾値との比較結果
に基づいて、入力信号注目窓が現在示す位置に参照信号
が存在するか否かを判定することを特徴としている。
According to a fifteenth aspect of the present invention, a first step of generating a feature amount sequence for a reference signal registered in advance,
A second step of setting a reference signal attention window for the feature amount sequence generated in the first step, and a reference signal attention window set in the second step as a plurality of reference signal division attention windows. A third step of dividing, a fourth step of generating a feature value sequence for the input signal input, and a fifth step of setting an input signal attention window for the feature value sequence generated in the fourth process. And a sixth step of dividing the input signal attention window into a plurality of input signal division attention windows corresponding to the plurality of reference signal division attention windows, and a feature amount sequence in each reference signal division attention window. A seventh step of creating a histogram, an eighth step of creating a histogram for a feature amount sequence in each input signal division window of interest, and a histogram in each reference signal division window of interest and corresponding to the reference signal division window of interest. In the input signal division window of interest A ninth step of calculating an input signal similarity value indicating the degree of similarity with the togram, and a movable amount indicating an amount by which the input signal attention window can be moved based on the input signal similarity value calculated in the ninth step. Based on a tenth step of calculating and the movable amount calculated in the tenth step,
An eleventh step of determining the position of the input signal attention window and setting the input signal attention window at the position, and repeating the sixth to eleventh steps to obtain the input signal attention window. For each of the positions, the input signal similarity value is calculated, and based on the comparison result between the input signal similarity value and a preset threshold value, it is determined whether or not the reference signal is present at the position currently indicated by the input signal attention window. It is characterized by doing.

【手続補正15】[Procedure amendment 15]

【補正対象書類名】明細書[Document name to be amended] Statement

【補正対象項目名】0020[Correction target item name] 0020

【補正方法】変更[Correction method] Change

【補正内容】[Correction contents]

【0020】請求項16記載の発明は、予め登録された
複数の参照信号について特徴量系列を生成する第1の過
程と、第1の過程で生成された特徴量系列についてヒス
トグラムを作成する第2の過程と、入力された入力信号
について特徴量系列を生成する第3の過程と、第3の過
程で生成された特徴量系列に対して、入力信号注目窓を
設定する第4の過程と、前記入力信号注目窓内の特徴量
系列についてヒストグラムを作成する第5の過程と、前
記複数の参照信号のうちの2つの参照信号について、一
方の参照信号に関するヒストグラムと他方の参照信号に
関するヒストグラムとの類似度合いを示す参照信号間類
似値を計算する第6の過程と、前記複数の参照信号のう
ちの各参照信号について、第2の過程で生成されたヒス
トグラムと第5の過程で生成されたヒストグラムとの類
似度合いを示す入力信号類似値を計算する第7の過程
と、第6の過程で計算された参照信号間類似値と第7の
過程で計算された入力信号類似値とに基づいて、入力信
号注目窓を移動できる量を示す移動可能量を計算する第
8の過程と、第8の過程で計算された移動可能量に基づ
いて、入力信号注目窓の位置を決定し、その位置に該入
力信号注目窓を設定する第9の過程とを具備し、前記第
5の過程から前記第9の過程を繰り返すことによって、
入力信号注目窓の各位置について、入力信号類似値を計
算し、入力信号類似値と予め設定された閾値との比較結
果に基づいて、入力信号注目窓が現在示す位置に参照信
号が存在するか否かを判定することを特徴としている。
According to a sixteenth aspect of the present invention, there is provided a first step of generating a feature sequence for a plurality of reference signals registered in advance, and a second process of generating a histogram for the feature sequence generated in the first process. , A third step of generating a feature amount sequence for the input signal that has been input, a fourth step of setting an input signal attention window for the feature amount sequence generated in the third step, A fifth step of creating a histogram for the feature amount series in the input signal attention window, and, for two reference signals of the plurality of reference signals, a histogram of one reference signal and a histogram of the other reference signal. A sixth step of calculating a similarity value between reference signals indicating a degree of similarity, and a histogram generated in the second step and a fifth step for each of the plurality of reference signals. 7th step of calculating an input signal similarity value indicating the degree of similarity with the histogram generated in the step, and the similarity between the reference signals calculated in the sixth step and the input signal similarity calculated in the seventh step. An eighth step of calculating a movable amount indicating the amount by which the input signal attention window can be moved based on the value and the position of the input signal attention window based on the movable amount calculated in the eighth step. A ninth step of determining and setting the input signal attention window at that position, and repeating the ninth step from the fifth step,
An input signal similarity value is calculated for each position of the input signal attention window, and based on a comparison result between the input signal similarity value and a preset threshold, whether a reference signal is present at the position currently indicated by the input signal attention window. It is characterized in that it is determined whether or not it is.

【手続補正16】[Procedure amendment 16]

【補正対象書類名】明細書[Document name to be amended] Statement

【補正対象項目名】0021[Correction target item name] 0021

【補正方法】変更[Correction method] Change

【補正内容】[Correction contents]

【0021】請求項17記載の発明は、予め登録された
複数の参照信号について特徴量系列を生成する第1の過
程と、第1の過程で生成された各特徴量系列に対して、
参照信号注目窓を設定する第2の過程と、第2の過程で
設定された参照信号注目窓を、複数の参照信号分割注目
窓に分割する第3の過程と、入力された入力信号につい
て特徴量系列を生成する第4の過程と、第4の過程で生
成された特徴量系列に対して、入力信号注目窓を設定す
る第5の過程と、前記入力信号注目窓を、前記複数の参
照信号分割注目窓に対応する複数の入力信号分割注目窓
に分割する第6の過程と、各参照信号分割注目窓内の特
徴量系列についてヒストグラムを作成する第7の過程
と、各入力信号分割注目窓内の特徴量系列についてヒス
トグラムを作成する第8の過程と、前記複数の参照信号
のうちの2つの参照信号について、一方の参照信号に関
するヒストグラムと他方の参照信号に関するヒストグラ
ムとの類似度合いを示す類似値であって、かつ、前記2
つの参照信号間において互いに対応する各参照信号分割
注目窓内のヒストグラム間の類似度合いを示す類似値で
ある参照信号間類似値を計算する第9の過程と、複数の
参照信号のうちの各参照信号について、各参照信号分割
注目窓内のヒストグラムと当該参照信号分割注目窓に対
応する入力信号分割注目窓内のヒストグラムとの類似度
合いを示す入力信号類似値を計算する第10の過程と、
第9の過程で計算された参照信号間類似値と第10の過
程で計算された入力信号類似値とに基づいて、入力信号
注目窓を移動できる量を示す移動可能量を計算する第1
1の過程と、第11の過程で計算された移動可能量に基
づいて、入力信号注目窓の位置を決定し、その位置に該
入力信号注目窓を設定する第12の過程とを具備し、前
記第6の過程から前記第12の過程を繰り返すことによ
って、入力信号注目窓の各位置について、入力信号類似
値を計算し、入力信号類似値と予め設定された閾値との
比較結果に基づいて、入力信号注目窓が現在示す位置に
参照信号が存在するか否かを判定することを特徴として
いる。
According to a seventeenth aspect of the present invention, a first step of generating a feature value sequence for a plurality of reference signals registered in advance, and a feature value sequence generated in the first process,
A second step of setting a reference signal attention window, a third step of dividing the reference signal attention window set in the second step into a plurality of reference signal division attention windows, and a feature of the input signal. A fourth step of generating a quantity sequence; a fifth step of setting an input signal attention window for the feature quantity sequence generated in the fourth step; A sixth process of dividing into a plurality of input signal division windows of interest corresponding to the signal division window of interest, a seventh process of creating a histogram for a feature amount sequence in each reference signal division of window of interest, An eighth process of creating a histogram for the feature amount series in the window, and for two reference signals of the plurality of reference signals, determining the similarity between the histogram for one reference signal and the histogram for the other reference signal. A to similar values, and the two
A ninth step of calculating a similarity value between reference signals, which is a similarity value indicating a similarity degree between histograms in the reference signal division attention windows corresponding to each other between one reference signal, and each reference among a plurality of reference signals A tenth step of calculating, for the signal, an input signal similarity value indicating a degree of similarity between the histogram in each reference signal division window of interest and the histogram in the input signal division window of interest corresponding to the reference signal division window of interest;
Calculating a movable amount indicating an amount by which the input signal attention window can be moved, based on the reference signal similarity value calculated in the ninth process and the input signal similarity value calculated in the tenth process;
Step 1 and a twelfth step of determining the position of the input signal attention window based on the movable amount calculated in the eleventh step, and setting the input signal attention window at the position. By repeating the sixth to twelfth steps, an input signal similarity value is calculated for each position of the input signal attention window, and based on a comparison result between the input signal similarity value and a preset threshold value. It is characterized in that it is determined whether or not a reference signal is present at the position currently indicated by the input signal attention window.

【手続補正17】[Procedure amendment 17]

【補正対象書類名】明細書[Document name to be amended] Statement

【補正対象項目名】0022[Correction target item name] 0022

【補正方法】変更[Correction method] Change

【補正内容】[Correction contents]

【0022】請求項18記載の発明は、請求項13〜1
5のいずれかの項記載の高速信号探索方法において、前
記入力信号類似値は、重なり類似値であることを特徴と
している。請求項19記載の発明は、請求項13、14
又は16記載の高速信号探索方法において、前記入力信
号注目窓は、時間軸方向において前記参照信号と同じ時
間長を有する注目窓であることを特徴としている。請求
項20記載の発明は、請求項15〜17のいずれかの項
記載の高速信号探索方法において、前記参照信号および
前記入力信号は、音響信号であることを特徴としてい
る。請求項21記載の発明は、請求項1320のいず
れかの項記載の高速信号探索方法において、前記特徴量
系列は、参照信号および入力信号の零交差数およびその
微分値の系列であり、前記ヒストグラムは、前記零交差
数およびその微分値が取りうる値の範囲を複数の区間に
分割し、前記各区間に対応する特徴量系列を前記零交差
数およびその微分値に基づいて計数することによって作
成されることを特徴としている。
The invention according to claim 18 is the invention according to claims 13 to 1
5. The high-speed signal search method according to any one of
The input signal similarity value is an overlap similarity value.
are doing. The invention according to claim 19 is the invention according to claims 13 and 14.
Or the high-speed signal search method according to 16, wherein the input signal
Signal attention window is the same as the reference signal in the time axis direction.
It is a featured window that has an interval. Claim
The invention described in Item 20 is the invention according to any one of Items 15 to 17.
The method of claim 7, wherein the reference signal and
The input signal is an acoustic signal.
You. According to a twenty- first aspect of the present invention, in the high-speed signal search method according to any one of the thirteenth to twentieth aspects, the feature amount sequence is a sequence of a zero crossing number of a reference signal and an input signal and a differential value thereof. The histogram may divide the range of possible values of the number of zero crossings and its differential value into a plurality of sections, and count a feature amount series corresponding to each section based on the number of zero crossings and its differential value. It is characterized by being created by.

【手続補正18】[Procedure amendment 18]

【補正対象書類名】明細書[Document name to be amended] Statement

【補正対象項目名】0023[Correction target item name] 0023

【補正方法】変更[Correction method] Change

【補正内容】[Correction contents]

【0023】請求項22記載の発明は、請求項13
のいずれかの項記載の高速信号探索方法において、前
記特徴量系列は、複数の周波数帯域の成分を要素とする
特徴ベクトルの系列であり、前記ヒストグラムは、前記
特徴ベクトルの各要素が取りうる値の範囲を複数の区間
に分割し、前記各区間に対応する特徴量系列を前記要素
の値に基づいて計数することによって作成されることを
特徴としている。
The invention according to claim 22 is the invention according to claims 13 to 2.
0 , in the high-speed signal search method according to any one of the above items, the feature amount sequence is a sequence of feature vectors having components of a plurality of frequency bands as elements, and the histogram can take each element of the feature vector. It is characterized by being created by dividing a value range into a plurality of sections and counting a feature amount series corresponding to each section based on the value of the element.

【手続補正19】[Procedure amendment 19]

【補正対象書類名】明細書[Document name to be amended] Statement

【補正対象項目名】0024[Correction target item name] 0024

【補正方法】変更[Correction method] Change

【補正内容】[Correction contents]

【0024】請求項23記載の発明は、予め登録された
音響信号である参照信号について特徴量系列を生成する
参照信号特徴量生成手段と、入力された音響信号である
入力信号について特徴量系列を生成する入力信号特徴量
生成手段と、入力信号特徴量生成手段で生成された特徴
量系列に対して、一定時間長の入力信号注目窓を設定す
る入力信号注目窓設定手段と、参照信号特徴量生成手段
で生成された特徴量系列と前記入力信号注目窓内の特徴
量系列との類似度合いを示す入力信号類似値を計算する
入力信号類似値計算手段と、入力信号類似値計算手段で
計算された入力信号類似値に基づいて、入力信号注目窓
を移動できる量を示す移動可能量を計算する移動可能量
計算手段と、移動可能量計算手段で計算された移動可能
量に基づいて、入力信号注目窓の位置を決定し、その位
置に該入力信号注目窓を設定する入力信号注目窓位置決
定手段と、入力信号類似値計算手段と移動可能量計算手
段と入力信号注目窓位置決定手段とに対して、それぞれ
の処理を繰り返し行わせることによって、入力信号注目
窓の各位置について、入力信号類似値を計算させる繰返
手段と、入力信号類似値と予め設定された閾値との比較
結果に基づいて、入力信号上において入力信号注目窓が
現在示す位置に参照信号が存在するか否かを判定する判
定手段とを具備することを特徴としている。請求項24
記載の発明は、予め登録された動画像の映像信号である
参照信号について特徴量系列を生成する参照信号特徴量
生成手段と、入力された動画像の映像信号である入力信
号について特徴量系列を生成する入力信号特徴量生成手
段と、入力信号特徴量生成手段で生成された特徴量系列
に対して、一定時間長の入力信号注目窓を設定する入力
信号注目窓設定手段と、参照信号特徴量生成手段で生成
された特徴量系列と前記入力信号注目窓内の特徴量系列
との類似度合いを示す入力信号類似値を計算する入力信
号類似値計算手段と、入力信号類似値計算手段で計算さ
れた入力信号類似値に基づいて、入力信号注目窓を移動
できる量を示す移動可能量を計算する移動可能量計算手
段と、移動可能量計算手段で計算された移動可能量に基
づいて、入力信号注目窓の位置を決定し、その位置に該
入力信号注目窓を設定する入力信号注目窓位置決定手段
と、入力信号類似値計算手段と移動可能量計算手段と入
力信号注目窓位置決定手段とに対して、それぞれの処理
を繰り返し行わせることによって、入力信号注目窓の各
位置について、入力信号類似値を計算させる繰返手段
と、入力信号類似値と予め設定された閾値との比較結果
に基づいて、入力信号上において入力信号注目窓が現在
示す位置に参照信号が存在するか否かを判定する判定手
段とを具備することを特徴としている。請求項25記載
の発明は、請求項23又は24記載の高速信号探索装置
において、前記参照信号特徴量生成手段で生成された特
徴量系列についてヒストグラムを作成する第1のヒスト
グラム作成手段と、前記入力信号特徴量生成手段で生成
された特徴量系列のうち、前記入力信号注目窓設定手段
で設定された入力信号注目窓内のものについて、ヒスト
グラムを作成する第2のヒストグラム作成手段とを更に
有し、前記入力信号類似値計算手段は、前記第1のヒス
トグラム作成手段で作成されたヒストグラムと前記第2
のヒストグラム作成手段で作成されたヒストグラムとの
類似度合いを示す類似値を、前記入力信号類似値として
計算することを特徴としている。請求項26記載の発明
は、請求項25記載の高速信号探索装置において、前記
特徴量系列は、参照信号および入力信号の零交差数およ
びその微分値の系列であり、前記第1、第2のヒストグ
ラム作成手段は、それぞれ、前記零交差数およびその微
分値が取りうる値の範囲を複数の区間に分割し、前記各
区間に対応する特徴量系列を前記零交差数およびその微
分値に基づいて計数することによってヒストグラムを作
成することを特徴としている。請求項27記載の発明
は、請求項25記載の高速信号探索装置において、前記
特徴量系列は、複数の周波数帯域の成分を要素とする特
徴ベクトルの系列であり、前記第1、第2のヒストグラ
ム作成手段は、それぞれ、前記特徴ベクトルの各要素が
取りうる値の範囲を複数の区間に分割し、前記各区間に
対応する特徴量系列を前記要素の値に基づいて計数する
ことによってヒストグラムを作成することを特徴として
いる。
According to the twenty- third aspect of the present invention, there is provided a method in which
The input signal characteristic quantity generating means for generating a reference signal feature value generating means for generating a feature amount sequence, the feature amount sequence for the input acoustic signal <br/> input signal for the reference signal is an acoustic signal, input An input signal attention window setting means for setting an input signal attention window having a fixed time length for the feature value sequence generated by the signal feature value generation means; and a feature value sequence generated by the reference signal feature value generation means. Input signal similarity calculating means for calculating an input signal similarity value indicating a degree of similarity with the feature amount series in the input signal attention window; and an input signal similarity value calculated by the input signal similarity value calculating means. A movable amount calculating means for calculating a movable amount indicating an amount capable of moving the attention window, and a position of the input signal attention window is determined based on the movable amount calculated by the movable amount calculating means; The input signal The input signal attention window position determination means for setting the attention window, the input signal similarity value calculation means, the movable amount calculation means, and the input signal attention window position determination means are made to repeatedly perform the respective processes, thereby obtaining the input. A repetition means for calculating an input signal similarity value for each position of the signal attention window, and a position indicated by the input signal attention window on the input signal based on a comparison result between the input signal similarity value and a preset threshold value And determining means for determining whether or not a reference signal exists. Claim 24
The described invention is a video signal of a moving image registered in advance.
Reference signal features that generate feature sequences for reference signals
Generating means, and an input signal which is a video signal of an input moving image.
Input signal feature generator that generates a feature sequence for a signal
Stage and a feature value sequence generated by the input signal feature value generation means
To set an input signal attention window of a certain time length
Generated by signal attention window setting means and reference signal feature quantity generation means
Feature sequence and feature sequence in the input signal attention window
An input signal that calculates an input signal similarity value indicating the degree of similarity with
Signal similarity value calculation means and input signal similarity value calculation means.
Moves input signal attention window based on input signal similarity value
Moveable amount calculator that calculates the amount of movement that indicates the amount that can be done
Based on the steps and the movable amount calculated by the movable amount calculating means.
Then, the position of the input signal attention window is determined, and
Input signal attention window position determining means for setting an input signal attention window
And input signal similarity value calculating means and movable amount calculating means.
Each processing is performed for the force signal attention window position determination means.
Is repeated, so that each of the input signal attention windows
Repeating means for calculating input signal similarity values for positions
And the comparison result between the input signal similarity value and a preset threshold
Input signal attention window on the input signal based on
A determination step for determining whether or not a reference signal exists at the indicated position
And a step. Claim 25
A high-speed signal search apparatus according to claim 23 or 24.
The characteristic generated by the reference signal characteristic amount generating means.
First histogram for creating a histogram for the collection series
Generated by the input signal feature quantity generating means.
The input signal attention window setting means in the extracted feature amount sequence.
Of the input signal attention window set in
A second histogram creating means for creating a gram.
Wherein the input signal similarity value calculating means includes the first hiss.
The histogram created by the togram creating means and the second
With the histogram created by the histogram creation means
A similarity value indicating the degree of similarity is defined as the input signal similarity value.
It is characterized by calculating. The invention according to claim 26
The high-speed signal search apparatus according to claim 25, wherein
The feature sequence is based on the number of zero crossings of the reference signal and the input signal.
And a series of differential values of the first and second histograms.
The ram generating means respectively includes the number of zero crossings and the fineness thereof.
Divide the range of values that can be taken into a plurality of sections,
The feature amount series corresponding to the section is calculated by
Create a histogram by counting based on the fractional values
It is characterized by The invention according to claim 27
The high-speed signal search apparatus according to claim 25, wherein
A feature sequence is a feature sequence that includes components from multiple frequency bands.
A series of feature vectors, wherein the first and second histograms are
Each of the elements of the feature vector is
Divide the range of values that can be taken into multiple sections, and
Count the corresponding feature value series based on the value of the element
Is characterized by creating a histogram by
I have.

【手続補正20】[Procedure amendment 20]

【補正対象書類名】明細書[Document name to be amended] Statement

【補正対象項目名】0025[Correction target item name] 0025

【補正方法】変更[Correction method] Change

【補正内容】[Correction contents]

【0025】請求項28記載の発明は、請求項23又は
24記載の高速信号探索装置と、ビデオ装置と、前記高
速信号探索装置の判定結果に基づいて、前記ビデオ装置
の録画動作を制御する制御手段とを具備することを特徴
としている。
The invention according to claim 28 is the invention according to claim 23 or
24. A high-speed signal search device according to claim 24 , a video device, and control means for controlling a recording operation of the video device based on a determination result of the high-speed signal search device.

【手続補正21】[Procedure amendment 21]

【補正対象書類名】明細書[Document name to be amended] Statement

【補正対象項目名】0026[Correction target item name] 0026

【補正方法】変更[Correction method] Change

【補正内容】[Correction contents]

【0026】請求項29記載の発明は、コンピュータ
を、予め登録された音響信号である参照信号について特
徴量系列を生成する参照信号特徴量生成手段と、入力さ
れた音響信号である入力信号について特徴量系列を生成
する入力信号特徴量生成手段と、入力信号特徴量生成手
段で生成された特徴量系列に対して、一定時間長の入力
信号注目窓を設定する入力信号注目窓設定手段と、参照
信号特徴量生成手段で生成された特徴量系列と前記入力
信号注目窓内の特徴量系列との類似度合いを示す入力信
号類似値を計算する入力信号類似値計算手段と、入力信
号類似値計算手段で計算された入力信号類似値に基づい
て、入力信号注目窓を移動できる量を示す移動可能量を
計算する移動可能量計算手段と、移動可能量計算手段で
計算された移動可能量に基づいて、入力信号注目窓の位
置を決定し、その位置に該入力信号注目窓を設定する入
力信号注目窓位置決定手段と、入力信号類似値計算手段
と移動可能量計算手段と入力信号注目窓位置決定手段と
に対して、それぞれの処理を繰り返し行わせることによ
って、入力信号注目窓の各位置について、入力信号類似
値を計算させる繰返手段と、入力信号類似値と予め設定
された閾値との比較結果に基づいて、入力信号上におい
て入力信号注目窓が現在示す位置に参照信号が存在する
か否かを判定する判定手段として機能させるためのプロ
グラムを記録した記録媒体である。請求項30記載の発
明は、コンピュータを、予め登録された動画像の映像信
号である参照信号について特徴量系列を生成する参照信
号特徴量生成手段と、入力された動画像の映像信号であ
る入力信号について特徴量系列を生成する入力信号特徴
量生成手段と、入力信号特徴量生成手段で生成された特
徴量系列に対して、一定時間長の入力信号注目窓を設定
する入力信号注目窓設定手段と、参照信号特徴量生成手
段で生成された特徴量系列と前記入力信号注目窓内の特
徴量系列との類似度合いを示す入力信号類似値を計算す
る入力信号類似値計算手段と、入力信号類似値計算手段
で計算された入力信号類似値に基づいて、入力信号注目
窓を移動できる量を示す移動可能量を計算する移動可能
量計算手段と、移動可能量計算手段で計算された移動可
能量に基づいて、入力信号注目窓の位置を決定し、その
位置に該入力信号注目窓を設定する入力信号注目窓位置
決定手段と、入力信号類似値計算手段と移動可能量計算
手段と入力信号注目窓位置決定手段とに対して、それぞ
れの処理を繰り返し行わせることによって、入力信号注
目窓の各位置について、入力信号類似値を計算させる繰
返手段と、入力信号類似値と予め設定された閾値との比
較結果に基づいて、入力信号上において入力信号注目窓
が現在示す位置に参照信号が存在するか否かを判定する
判定手段として機能させるためのプログラムを記録した
記録媒体である。請求項31記載の発明は、請求項29
又は30記載の記録媒体において、前記参照信号特徴量
生成手段で生成された特徴量系列についてヒストグラム
を作成する第1のヒストグラム作成手段と、前記入力信
号特徴量生成手段で生成された特徴量系列のうち、前記
入力信号注目窓設定手段で設定された入力信号注目窓内
のものについて、ヒストグラムを作成する第2のヒスト
グラム作成手段として更にコンピュータを機能させると
共に、前記入力信号類似値計算手段が、前記第1のヒス
トグラム作成手段で作成されたヒストグラムと前記第2
のヒストグラム作成手段で作成されたヒストグラムとの
類似度合いを示す類似値を、前記入力信号類似値として
計算するものとして、コンピュータを機能させるための
プログラムを記録した記録媒体である。請求項32記載
の発明は、請求項31記載の記録媒体において、前記特
徴量系列は、参照信号および入力信号の零交差数および
その微分値の系列であり、前記第1、第2のヒストグラ
ム作成手段が、それぞれ、前記零交差数およびその微分
値が取りうる値の範囲を複数の区間に分割し、前記各区
間に対応する特徴量系列を前記零交差数およびその微分
値に基づいて計数することによってヒストグラムを作成
するものとして、コンピュータを機能させるためのプロ
グラムを記録した記録媒体である。請求項33記載の発
明は、請求項31記載の記録媒体において、前記特徴量
系列は、複数の周波数帯域の成分を要素とする特徴ベク
トルの系列であり、前記第1、第2のヒストグラム作成
手段が、それぞれ、前記特徴ベクトルの各要素が取りう
る値の範囲を複数の区間に分割し、前記各区間に対応す
る特徴量系列を前記要素の値に基づいて計数することに
よってヒストグラムを作成するものとして、コンピュー
タを機能させるためのプログラムを記録した記録媒体で
ある。
According to a twenty- ninth aspect of the present invention, there is provided a computer comprising: a reference signal generation unit configured to generate a characteristic amount sequence for a reference signal that is a pre-registered audio signal; Input signal feature value generation means for generating a quantity sequence; input signal attention window setting means for setting an input signal attention window of a fixed time length for the feature value sequence generated by the input signal feature value generation means; Input signal similarity calculation means for calculating an input signal similarity value indicating a degree of similarity between the feature quantity sequence generated by the signal feature quantity generation means and the feature quantity sequence in the input signal attention window, and input signal similarity value calculation means A movable amount calculating means for calculating a movable amount indicating an amount capable of moving the input signal attention window based on the input signal similarity value calculated in the step; and a movable amount calculated by the movable amount calculating means. Based on the position of the input signal attention window, the input signal attention window position determination means for setting the input signal attention window at the position, the input signal similarity value calculation means, the movable amount calculation means, and the input signal attention window. A repetition means for calculating the input signal similarity value for each position of the input signal attention window by causing the window position determination means to repeatedly perform the respective processes; and an input signal similarity value and a preset threshold value. And a program for functioning as a judging means for judging whether or not a reference signal is present at a position currently indicated by the input signal attention window on the input signal based on a comparison result with the recording medium. Claim 30
Akira uses a computer to send pre-registered video images.
Signal that generates a feature sequence for the reference signal
Signal feature amount generation means, and a video signal of the input moving image.
Signal features that generate a feature sequence for the input signal
Quantity generating means and the characteristic generated by the input signal feature quantity generating means.
Set input signal attention window of fixed time length for collection series
Input signal attention window setting means, and a reference signal feature amount generating means.
The characteristic amount sequence generated in the step and the characteristic in the input signal attention window
Calculate the input signal similarity value indicating the degree of similarity with the collection series
Input signal similarity value calculating means, and input signal similarity value calculating means
Note the input signal based on the input signal similarity value calculated in
Calculate the amount of movement that indicates how much you can move the window
The amount calculated by the amount calculating means and the movable amount calculated by the movable amount calculating means
The position of the input signal attention window is determined based on the
Input signal attention window position for setting the input signal attention window at the position
Determination means, input signal similarity value calculation means and movable amount calculation
Means and the input signal attention window position determining means, respectively.
By repeating this process, the input signal
For each position of the eye window, iterative calculation of the input signal similarity value
Return means, and a ratio between the input signal similarity value and a preset threshold value
Input signal attention window on the input signal based on the comparison result
Determines whether there is a reference signal at the position indicated by
Recorded a program to function as judgment means
It is a recording medium. The invention according to claim 31 is the invention according to claim 29
31. The recording medium according to claim 30, wherein the reference signal feature quantity
Histogram for the feature sequence generated by the generation means
First histogram creating means for creating the input signal;
Out of the feature amount series generated by the signal feature amount generation means,
Within the input signal attention window set by the input signal attention window setting means
Second histogram to create a histogram for
If you let the computer function as a program
In both cases, the input signal similarity value calculating means outputs the first hiss.
The histogram created by the togram creating means and the second
With the histogram created by the histogram creation means
A similarity value indicating the degree of similarity is defined as the input signal similarity value.
To make a computer function as a calculator
This is a recording medium on which a program is recorded. Claim 32
The invention according to claim 31 is the recording medium according to claim 31, wherein
The collection series is based on the number of zero crossings of the reference signal and the input signal and
A series of differential values of the first and second histograms;
Means for generating the zero crossing and the derivative thereof
The range of possible values is divided into multiple sections,
The number of zero crossings and its derivative
Create histograms by counting based on values
To make the computer work
This is a recording medium on which a gram is recorded. Claim 33
32. The recording medium according to claim 31, wherein the characteristic amount
A sequence is a feature vector that includes components from multiple frequency bands.
The first and second histograms
Means for taking each element of said feature vector, respectively
Value range is divided into a plurality of sections, and
Counting the feature value series based on the value of the element.
Therefore, computer
On a recording medium on which a program for operating the
is there.

───────────────────────────────────────────────────── フロントページの続き (72)発明者 ガビン スミス 51 エーカーフィールド ドライブ ケン ブリッジ ケンブリッジシア ユナイテッ ド キングダム Fターム(参考) 5C053 FA23 FA27 FA30 GB09 HA29 JA01 JA30 KA14 KA24 LA11 LA14 5D015 AA04 AA06 HH04 KK01 9A001 FF03 GG05 GG14 HH15  ──────────────────────────────────────────────────続 き Continuing on the front page (72) Inventor Gavin Smith 51 Acrefield Drive Cambridge Cambridgeshire United Kingdom F-term (reference) 5C053 FA23 FA27 FA30 GB09 HA29 JA01 JA30 KA14 KA24 LA11 LA14 5D015 AA04 AA06 HH04 KK01 9A001 FF03 GG05 GG14 HH15

Claims (20)

【特許請求の範囲】[Claims] 【請求項1】 予め登録された参照信号について特徴量
系列を生成する第1の過程と、 入力された入力信号に対して、入力信号注目窓を設定す
る第2の過程と、 前記入力信号注目窓内の入力信号について特徴量系列を
生成する第3の過程と、 第1の過程で生成された特徴量系列と第3の過程で生成
された特徴量系列との類似度合いを示す入力信号類似値
を計算する第4の過程と、 第4の過程で計算された入力信号類似値に基づいて、入
力信号注目窓を移動できる量を示す移動可能量を計算す
る第5の過程と、 第5の過程で計算された移動可能量に基づいて、入力信
号注目窓の位置を決定し、その位置に該入力信号注目窓
を設定する第6の過程とを具備し、 前記第3の過程から前記第6の過程を繰り返すことによ
って、入力信号注目窓の各位置について、入力信号類似
値を計算し、 入力信号類似値と予め設定された閾値との比較結果に基
づいて、入力信号上において入力信号注目窓が現在示す
位置に参照信号が存在するか否かを判定することを特徴
とする高速信号探索方法。
A first step of generating a feature amount sequence for a pre-registered reference signal; a second step of setting an input signal attention window for an input signal that has been input; A third step of generating a feature sequence for the input signal in the window; and an input signal similarity indicating a degree of similarity between the feature sequence generated in the first process and the feature sequence generated in the third process. A fourth step of calculating a value, a fifth step of calculating a movable amount indicating an amount by which the input signal attention window can be moved based on the input signal similarity value calculated in the fourth step, Determining the position of the input signal attention window based on the movable amount calculated in the step, and setting the input signal attention window at that position. By repeating the sixth process, each position of the input signal attention window is The input signal similarity value is calculated for the input signal, and based on a comparison result between the input signal similarity value and a preset threshold, whether or not the reference signal is present at the position indicated by the input signal attention window on the input signal. A high-speed signal search method, characterized in that:
【請求項2】 予め登録された参照信号について特徴量
系列を生成する第1の過程と、 第1の過程で生成された特徴量系列に対して、参照信号
注目窓を設定する第2の過程と、 第2の過程で設定された参照信号注目窓を、複数の参照
信号分割注目窓に分割する第3の過程と、 入力された入力信号について特徴量系列を生成する第4
の過程と、 第4の過程で生成された特徴量系列に対して、入力信号
注目窓を設定する第5の過程と、 前記入力信号注目窓を、前記複数の参照信号分割注目窓
に対応する複数の入力信号分割注目窓に分割する第6の
過程と、 各参照信号分割注目窓内の特徴量系列と当該参照信号分
割注目窓に対応する入力信号分割注目窓内の特徴量系列
との類似度合いを示す入力信号類似値を計算する第7の
過程と、 第7の過程で計算された入力信号類似値に基づいて、入
力信号注目窓を移動できる量を示す移動可能量を計算す
る第8の過程と、 第8の過程で計算された移動可能量に基づいて、入力信
号注目窓の位置を決定し、その位置に該入力信号注目窓
を設定する第9の過程とを具備し、 前記第6の過程から前記第9の過程を繰り返すことによ
って、入力信号注目窓の各位置について、入力信号類似
値を計算し、 入力信号類似値と予め設定された閾値との比較結果に基
づいて、入力信号注目窓が現在示す位置に参照信号が存
在するか否かを判定することを特徴とする高速信号探索
方法。
2. A first step of generating a feature sequence for a reference signal registered in advance, and a second process of setting a reference signal attention window for the feature sequence generated in the first process. A third step of dividing the reference signal attention window set in the second step into a plurality of reference signal division attention windows, and a fourth step of generating a feature amount sequence for the input signal input.
And a fifth step of setting an input signal attention window for the feature amount sequence generated in the fourth step. The input signal attention window corresponds to the plurality of reference signal division attention windows. A sixth process of dividing into a plurality of input signal division windows of interest, and a similarity between a feature sequence in each reference signal division window of interest and a feature sequence in the input signal division window of interest corresponding to the reference signal division window of interest. A seventh step of calculating an input signal similarity value indicating the degree; and an eighth step of calculating a movable amount indicating an amount by which the input signal attention window can be moved based on the input signal similarity value calculated in the seventh step. And a ninth step of determining the position of the input signal attention window based on the movable amount calculated in the eighth step, and setting the input signal attention window at that position. By repeating the ninth step from the sixth step, An input signal similarity value is calculated for each position of the signal attention window, and based on a comparison result between the input signal similarity value and a preset threshold, whether or not the reference signal is present at the position currently indicated by the input signal attention window A high-speed signal search method characterized by determining whether
【請求項3】 予め登録された複数の参照信号について
特徴量系列を生成する第1の過程と、 入力された入力信号について特徴量系列を生成する第2
の過程と、 第2の過程で生成された特徴量系列に対して、入力信号
注目窓を設定する第3の過程と、 前記複数の参照信号のうちの2つの参照信号について、
一方の参照信号に関する特徴量系列と他方の参照信号に
関する特徴量系列との類似度合いを示す参照信号間類似
値を計算する第4の過程と、 前記複数の参照信号のうちの各参照信号について、第1
の過程で生成された特徴量系列と前記入力信号注目窓内
の特徴量系列との類似度合いを示す入力信号類似値を計
算する第5の過程と、 第4の過程で計算された参照信号間類似値と第5の過程
で計算された入力信号類似値とに基づいて、入力信号注
目窓を移動できる量を示す移動可能量を計算する第6の
過程と、 第6の過程で計算された移動可能量に基づいて、入力信
号注目窓の位置を決定し、その位置に該入力信号注目窓
を設定する第7の過程とを具備し、 前記第5の過程から前記第7の過程を繰り返すことによ
って、入力信号注目窓の各位置について、入力信号類似
値を計算し、 入力信号類似値と予め設定された閾値との比較結果に基
づいて、入力信号注目窓が現在示す位置に参照信号が存
在するか否かを判定することを特徴とする高速信号探索
方法。
3. A first step of generating a feature sequence for a plurality of reference signals registered in advance, and a second process of generating a feature sequence for an input signal.
And a third step of setting an input signal attention window for the feature amount sequence generated in the second step; and for two reference signals of the plurality of reference signals,
A fourth step of calculating a similarity value between reference signals indicating a degree of similarity between the feature quantity sequence for one reference signal and the feature quantity sequence for the other reference signal; and for each reference signal of the plurality of reference signals, First
A fifth step of calculating an input signal similarity value indicating a degree of similarity between the feature amount sequence generated in the step and the feature amount sequence in the input signal attention window; and a reference signal calculated in the fourth step. A sixth step of calculating a movable amount indicating an amount by which the input signal attention window can be moved based on the similarity value and the input signal similarity value calculated in the fifth step; and Determining a position of the input signal attention window based on the movable amount, and setting the input signal attention window at the position, and repeating the fifth to seventh steps. Accordingly, the input signal similarity value is calculated for each position of the input signal attention window, and the reference signal is set at the position indicated by the input signal attention window based on the comparison result between the input signal similarity value and a preset threshold value. High speed characterized by determining whether or not it exists Signal search method.
【請求項4】 予め登録された複数の参照信号について
特徴量系列を生成する第1の過程と、 第1の過程で生成された各特徴量系列に対して、参照信
号注目窓を設定する第2の過程と、 第2の過程で設定された参照信号注目窓を、複数の参照
信号分割注目窓に分割する第3の過程と、 入力された入力信号について特徴量系列を生成する第4
の過程と、 第4の過程で生成された特徴量系列に対して、入力信号
注目窓を設定する第5の過程と、 前記入力信号注目窓を、前記複数の参照信号分割注目窓
に対応する複数の入力信号分割注目窓に分割する第6の
過程と、 前記複数の参照信号のうちの2つの参照信号について、
一方の参照信号に関する特徴量系列と他方の参照信号に
関する特徴量系列との類似度合いを示す類似値であっ
て、かつ、前記2つの参照信号間において互いに対応す
る各参照信号分割注目窓内の特徴量系列間の類似度合い
を示す類似値である参照信号間類似値を計算する第7の
過程と、 複数の参照信号のうちの各参照信号について、各参照信
号分割注目窓内の特徴量系列と当該参照信号分割注目窓
に対応する入力信号分割注目窓内の特徴量系列との類似
度合いを示す入力信号類似値を計算する第8の過程と、 第7の過程で計算された参照信号間類似値と第8の過程
で計算された入力信号類似値とに基づいて、入力信号注
目窓を移動できる量を示す移動可能量を計算する第9の
過程と、 第9の過程で計算された移動可能量に基づいて、入力信
号注目窓の位置を決定し、その位置に該入力信号注目窓
を設定する第10の過程とを具備し、 前記第6の過程から前記第10の過程を繰り返すことに
よって、入力信号注目窓の各位置について、入力信号類
似値を計算し、 入力信号類似値と予め設定された閾値との比較結果に基
づいて、入力信号注目窓が現在示す位置に参照信号が存
在するか否かを判定することを特徴とする高速信号探索
方法。
4. A first step of generating a feature amount sequence for a plurality of reference signals registered in advance, and a second step of setting a reference signal attention window for each feature amount sequence generated in the first step. A second step of dividing the reference signal attention window set in the second step into a plurality of reference signal division attention windows; and a fourth step of generating a feature amount sequence for the input signal input.
And a fifth step of setting an input signal attention window for the feature amount sequence generated in the fourth step. The input signal attention window corresponds to the plurality of reference signal division attention windows. A sixth step of dividing into a plurality of input signal division windows of interest; and two reference signals of the plurality of reference signals,
A similarity value indicating the degree of similarity between the feature amount sequence related to one reference signal and the feature amount sequence related to the other reference signal, and the feature in each reference signal division attention window corresponding to each other between the two reference signals. A seventh process of calculating a similarity value between reference signals, which is a similarity value indicating a degree of similarity between the quantity sequences, and a feature value sequence in each reference signal division attention window for each of the plurality of reference signals. Eighth step of calculating an input signal similarity value indicating the degree of similarity with the feature amount sequence in the input signal division attention window corresponding to the reference signal division attention window, and reference signal similarity calculated in the seventh step. A ninth step of calculating a movable amount indicating an amount by which the input signal attention window can be moved, based on the value and the input signal similarity value calculated in the eighth step; and a movement calculated in the ninth step. Based on the available Determining a position of the window of interest, and setting the window of interest of the input signal at that position, by repeating the tenth process from the sixth process, Calculating an input signal similarity value for the position and determining whether a reference signal is present at the position indicated by the input signal attention window based on a comparison result between the input signal similarity value and a preset threshold value; A high-speed signal search method characterized by the above-mentioned.
【請求項5】 前記入力信号の複数の箇所について、該
入力信号と前記参照信号との類似値を予め求める予備照
合過程と、 前記予備照合過程で得られた複数の類似値について、該
類似値の平均値と標準偏差値とを求める予備照合類似値
統計過程と、 前記予備照合類似値統計過程で得られた平均値と標準偏
差値とに基づいて、前記閾値を決定する閾値決定過程と
を具備することを特徴とする請求項1〜4のいずれかの
項記載の高速信号探索方法。
5. A preliminary matching step in which similarity between the input signal and the reference signal is determined in advance for a plurality of locations of the input signal, and the similarity value is determined for a plurality of similar values obtained in the preliminary matching step. A preliminary matching similarity value statistical process for obtaining an average value and a standard deviation value, and a threshold value determining process for determining the threshold value based on the average value and the standard deviation value obtained in the preliminary matching similarity value statistical process. The high-speed signal search method according to any one of claims 1 to 4, further comprising:
【請求項6】 前記入力信号類似値は、重なり類似値で
あることを特徴とする請求項1又は2記載の高速信号探
索方法。
6. The high-speed signal search method according to claim 1, wherein the input signal similar value is an overlap similar value.
【請求項7】 前記入力信号注目窓は、時間軸方向にお
いて前記参照信号と同じ時間長を有する注目窓であるこ
とを特徴とする請求項1又は3記載の高速信号探索方
法。
7. The high-speed signal search method according to claim 1, wherein the input signal attention window is an attention window having the same time length as the reference signal in a time axis direction.
【請求項8】 前記移動可能量は、 θが前記閾値であり、 Sが前記入力信号類似値であり、 Dが前記特徴量系列の総度数であり、 floor{}が小数点以下の切り下げを表す場合、 【数1】 によって計算されることを特徴とする請求項1〜4のい
ずれかの項記載の高速信号探索方法。
8. The movable amount, θ is the threshold value, S is the input signal similarity value, D is the total frequency of the feature amount sequence, and floor {} represents a round-down below a decimal point. In the case, 5. The high-speed signal search method according to claim 1, wherein the high-speed signal search is performed by:
【請求項9】 前記参照信号および前記入力信号は、音
響信号であることを特徴とする請求項1〜4のいずれか
の項記載の高速信号探索方法。
9. The high-speed signal search method according to claim 1, wherein the reference signal and the input signal are sound signals.
【請求項10】 前記入力信号注目窓および前記参照信
号注目窓は、時間軸方向において前記参照信号と同じ時
間長を有する注目窓であることを特徴とする請求項2又
は4記載の高速信号探索方法。
10. The high-speed signal search according to claim 2, wherein the input signal attention window and the reference signal attention window are attention windows having the same time length as the reference signal in a time axis direction. Method.
【請求項11】 前記参照信号間類似値および前記入力
信号類似値は、重なり類似値であることを特徴とする請
求項3又は4記載の高速信号探索方法。
11. The high-speed signal search method according to claim 3, wherein the inter-reference signal similarity value and the input signal similarity value are overlapping similarity values.
【請求項12】 予め登録された参照信号について特徴
量系列を生成する第1の過程と、 第1の過程で生成された特徴量系列についてヒストグラ
ムを作成する第2の過程と、 入力された入力信号に対して、入力信号注目窓を設定す
る第3の過程と、 前記入力信号注目窓内の入力信号について特徴量系列を
生成する第4の過程と、 第4の過程で生成された特徴量系列についてヒストグラ
ムを作成する第5の過程と、 第2の過程で作成されたヒストグラムと第5の過程で作
成されたヒストグラムとの類似度合いを示す入力信号類
似値を計算する第6の過程と、 第6の過程で計算された入力信号類似値に基づいて、入
力信号注目窓を移動できる量を示す移動可能量を計算す
る第7の過程と、 第7の過程で計算された移動可能量に基づいて、入力信
号注目窓の位置を決定し、その位置に該入力信号注目窓
を設定する第8の過程とを具備し、 前記第4の過程から前記第8の過程を繰り返すことによ
って、入力信号注目窓の各位置について、入力信号類似
値を計算し、 入力信号類似値と予め設定された閾値との比較結果に基
づいて、入力信号上において入力信号注目窓が現在示す
位置に参照信号が存在するか否かを判定することを特徴
とする高速信号探索方法。
12. A first step of generating a feature sequence for a reference signal registered in advance, a second process of creating a histogram for the feature sequence generated in the first process, A third step of setting an input signal attention window for the signal; a fourth step of generating a feature value sequence for the input signal in the input signal attention window; and a feature value generated in the fourth step A fifth step of creating a histogram for the series, a sixth step of calculating an input signal similarity value indicating a degree of similarity between the histogram created in the second step and the histogram created in the fifth step, A seventh step of calculating a movable amount indicating an amount by which the input signal attention window can be moved based on the input signal similarity value calculated in the sixth step, and a movable amount calculated in the seventh step. Based on input An eighth step of determining the position of the signal attention window and setting the input signal attention window at that position. By repeating the fourth to eighth steps, An input signal similarity value is calculated for each position, and based on a comparison result between the input signal similarity value and a preset threshold, whether or not a reference signal is present at a position indicated by the input signal attention window on the input signal. A high-speed signal search method characterized by determining whether
【請求項13】 予め登録された参照信号について特徴
量系列を生成する第1の過程と、 第1の過程で生成された特徴量系列に対して、参照信号
注目窓を設定する第2の過程と、 第2の過程で設定された参照信号注目窓を、複数の参照
信号分割注目窓に分割する第3の過程と、 入力された入力信号について特徴量系列を生成する第4
の過程と、 第4の過程で生成された特徴量系列に対して、入力信号
注目窓を設定する第5の過程と、 前記入力信号注目窓を、前記複数の参照信号分割注目窓
に対応する複数の入力信号分割注目窓に分割する第6の
過程と、 各参照信号分割注目窓内の特徴量系列についてヒストグ
ラムを作成する第7の過程と、 各入力信号分割注目窓内の特徴量系列についてヒストグ
ラムを作成する第8の過程と、 各参照信号分割注目窓内のヒストグラムと当該参照信号
分割注目窓に対応する入力信号分割注目窓内のヒストグ
ラムとの類似度合いを示す入力信号類似値を計算する第
9の過程と、 第9の過程で計算された入力信号類似値に基づいて、入
力信号注目窓を移動できる量を示す移動可能量を計算す
る第10の過程と、 第10の過程で計算された移動可能量に基づいて、入力
信号注目窓の位置を決定し、その位置に該入力信号注目
窓を設定する第11の過程とを具備し、 前記第6の過程から前記第11の過程を繰り返すことに
よって、入力信号注目窓の各位置について、入力信号類
似値を計算し、 入力信号類似値と予め設定された閾値との比較結果に基
づいて、入力信号注目窓が現在示す位置に参照信号が存
在するか否かを判定することを特徴とする高速信号探索
方法。
13. A first step of generating a feature sequence for a reference signal registered in advance, and a second process of setting a reference signal attention window for the feature sequence generated in the first process. A third step of dividing the reference signal attention window set in the second step into a plurality of reference signal division attention windows, and a fourth step of generating a feature amount sequence for the input signal input.
And a fifth step of setting an input signal attention window for the feature amount sequence generated in the fourth step. The input signal attention window corresponds to the plurality of reference signal division attention windows. A sixth process of dividing into a plurality of input signal division windows of interest, a seventh process of creating a histogram for a feature sequence in each reference signal division window of interest, and a feature sequence in each input signal division window of interest. Eighth process of creating a histogram, and calculating an input signal similarity value indicating a degree of similarity between the histogram in each reference signal division window and the histogram in the input signal division window corresponding to the reference signal division window. A ninth step, a tenth step of calculating a movable amount indicating an amount by which the input signal attention window can be moved based on the input signal similarity value calculated in the ninth step, and a tenth step Moved Determining an input signal window of interest based on the possible amount, and setting the input signal window of interest at that position; and repeating the eleventh step from the sixth step. The input signal similarity value is calculated for each position of the input signal attention window, and the reference signal is present at the position indicated by the input signal attention window based on the comparison result between the input signal similarity value and a preset threshold value. A high-speed signal search method characterized by determining whether or not to perform a search.
【請求項14】 予め登録された複数の参照信号につい
て特徴量系列を生成する第1の過程と、 第1の過程で生成された特徴量系列についてヒストグラ
ムを作成する第2の過程と、 入力された入力信号について特徴量系列を生成する第3
の過程と、 第3の過程で生成された特徴量系列に対して、入力信号
注目窓を設定する第4の過程と、 前記入力信号注目窓内の特徴量系列についてヒストグラ
ムを作成する第5の過程と、 前記複数の参照信号のうちの2つの参照信号について、
一方の参照信号に関するヒストグラムと他方の参照信号
に関するヒストグラムとの類似度合いを示す参照信号間
類似値を計算する第6の過程と、 前記複数の参照信号のうちの各参照信号について、第2
の過程で生成されたヒストグラムと第5の過程で生成さ
れたヒストグラムとの類似度合いを示す入力信号類似値
を計算する第7の過程と、 第6の過程で計算された参照信号間類似値と第7の過程
で計算された入力信号類似値とに基づいて、入力信号注
目窓を移動できる量を示す移動可能量を計算する第8の
過程と、 第8の過程で計算された移動可能量に基づいて、入力信
号注目窓の位置を決定し、その位置に該入力信号注目窓
を設定する第9の過程とを具備し、 前記第5の過程から前記第9の過程を繰り返すことによ
って、入力信号注目窓の各位置について、入力信号類似
値を計算し、 入力信号類似値と予め設定された閾値との比較結果に基
づいて、入力信号注目窓が現在示す位置に参照信号が存
在するか否かを判定することを特徴とする高速信号探索
方法。
14. A first step of generating a feature sequence for a plurality of reference signals registered in advance, a second process of creating a histogram for the feature sequence generated in the first process, and Generating a feature sequence for the input signal
A fourth step of setting an input signal attention window for the feature amount sequence generated in the third step; and a fifth step of creating a histogram for the feature amount sequence in the input signal attention window. And for two reference signals of the plurality of reference signals,
A sixth step of calculating a similarity value between reference signals indicating a degree of similarity between the histogram related to one reference signal and the histogram related to the other reference signal;
A seventh step of calculating an input signal similarity value indicating a degree of similarity between the histogram generated in the step and the histogram generated in the fifth step; and a similarity value between the reference signals calculated in the sixth step. An eighth step of calculating a movable amount indicating an amount by which the input signal attention window can be moved based on the input signal similarity value calculated in the seventh step; and a movable amount calculated in the eighth step. A ninth step of determining the position of the input signal attention window based on the above, and setting the input signal attention window at that position. By repeating the ninth step from the fifth step, An input signal similarity value is calculated for each position of the input signal attention window, and based on a comparison result between the input signal similarity value and a preset threshold, whether a reference signal exists at the position currently indicated by the input signal attention window. Determining whether or not Fast signal search method.
【請求項15】 予め登録された複数の参照信号につい
て特徴量系列を生成する第1の過程と、 第1の過程で生成された各特徴量系列に対して、参照信
号注目窓を設定する第2の過程と、 第2の過程で設定された参照信号注目窓を、複数の参照
信号分割注目窓に分割する第3の過程と、 入力された入力信号について特徴量系列を生成する第4
の過程と、 第4の過程で生成された特徴量系列に対して、入力信号
注目窓を設定する第5の過程と、 前記入力信号注目窓を、前記複数の参照信号分割注目窓
に対応する複数の入力信号分割注目窓に分割する第6の
過程と、 各参照信号分割注目窓内の特徴量系列についてヒストグ
ラムを作成する第7の過程と、 各入力信号分割注目窓内の特徴量系列についてヒストグ
ラムを作成する第8の過程と、 前記複数の参照信号のうちの2つの参照信号について、
一方の参照信号に関するヒストグラムと他方の参照信号
に関するヒストグラムとの類似度合いを示す類似値であ
って、かつ、前記2つの参照信号間において互いに対応
する各参照信号分割注目窓内のヒストグラム間の類似度
合いを示す類似値である参照信号間類似値を計算する第
9の過程と、 複数の参照信号のうちの各参照信号について、各参照信
号分割注目窓内のヒストグラムと当該参照信号分割注目
窓に対応する入力信号分割注目窓内のヒストグラムとの
類似度合いを示す入力信号類似値を計算する第10の過
程と、 第9の過程で計算された参照信号間類似値と第10の過
程で計算された入力信号類似値とに基づいて、入力信号
注目窓を移動できる量を示す移動可能量を計算する第1
1の過程と、 第11の過程で計算された移動可能量に基づいて、入力
信号注目窓の位置を決定し、その位置に該入力信号注目
窓を設定する第12の過程とを具備し、 前記第6の過程から前記第12の過程を繰り返すことに
よって、入力信号注目窓の各位置について、入力信号類
似値を計算し、 入力信号類似値と予め設定された閾値との比較結果に基
づいて、入力信号注目窓が現在示す位置に参照信号が存
在するか否かを判定することを特徴とする高速信号探索
方法。
15. A first step of generating a feature value sequence for a plurality of reference signals registered in advance, and a second step of setting a reference signal attention window for each feature value sequence generated in the first process. A second step of dividing the reference signal attention window set in the second step into a plurality of reference signal division attention windows; and a fourth step of generating a feature amount sequence for the input signal input.
And a fifth step of setting an input signal attention window for the feature amount sequence generated in the fourth step. The input signal attention window corresponds to the plurality of reference signal division attention windows. A sixth process of dividing into a plurality of input signal division windows of interest, a seventh process of creating a histogram for a feature sequence in each reference signal division window of interest, and a feature sequence in each input signal division window of interest. An eighth step of creating a histogram, and for two reference signals of the plurality of reference signals,
A similarity value indicating the similarity between the histogram for one reference signal and the histogram for the other reference signal, and the similarity between the histograms in the reference signal division attention windows corresponding to each other between the two reference signals. A ninth step of calculating a similarity value between reference signals, which is a similarity value indicating a histogram of each of the plurality of reference signals. A tenth step of calculating an input signal similarity value indicating the degree of similarity with the histogram in the input signal division window of interest, and a similarity value between the reference signals calculated in the ninth step and the tenth step. First calculating a movable amount indicating the amount by which the input signal attention window can be moved based on the input signal similarity value;
And a twelfth step of determining the position of the input signal window of interest based on the movable amount calculated in the eleventh step, and setting the input signal window of interest at that position. By repeating the sixth step to the twelfth step, an input signal similarity value is calculated for each position of the input signal attention window, and based on a comparison result between the input signal similarity value and a preset threshold value. A method for determining whether a reference signal is present at a position currently indicated by an input signal attention window.
【請求項16】 前記特徴量系列は、参照信号および入
力信号の零交差数およびその微分値の系列であり、 前記ヒストグラムは、前記零交差数およびその微分値が
取りうる値の範囲を複数の区間に分割し、前記各区間に
対応する特徴量系列を前記零交差数およびその微分値に
基づいて計数することによって作成されることを特徴と
する請求項12〜15のいずれかの項記載の高速信号探
索方法。
16. The feature amount sequence is a sequence of a number of zero crossings of a reference signal and an input signal and a derivative thereof, and the histogram includes a plurality of ranges of values that the number of zero crossings and a derivative thereof can take. 16. The method according to any one of claims 12 to 15, wherein the area is created by dividing the section into sections and counting a feature amount sequence corresponding to each section based on the number of zero crossings and a derivative thereof. Fast signal search method.
【請求項17】 前記特徴量系列は、複数の周波数帯域
の成分を要素とする特徴ベクトルの系列であり、 前記ヒストグラムは、前記特徴ベクトルの各要素が取り
うる値の範囲を複数の区間に分割し、前記各区間に対応
する特徴量系列を前記要素の値に基づいて計数すること
によって作成されることを特徴とする請求項12〜15
のいずれかの項記載の高速信号探索方法。
17. The feature amount sequence is a sequence of feature vectors having components of a plurality of frequency bands as elements, and the histogram divides a range of values that each element of the feature vector can take into a plurality of sections. The feature amount sequence is created by counting a feature amount sequence corresponding to each section based on the value of the element.
13. The high-speed signal search method according to any one of the above items.
【請求項18】 予め登録された参照信号について特徴
量系列を生成する参照信号特徴量生成手段と、 入力された入力信号について特徴量系列を生成する入力
信号特徴量生成手段と、 入力信号特徴量生成手段で生成された特徴量系列に対し
て、入力信号注目窓を設定する入力信号注目窓設定手段
と、 参照信号特徴量生成手段で生成された特徴量系列と前記
入力信号注目窓内の特徴量系列との類似度合いを示す入
力信号類似値を計算する入力信号類似値計算手段と、 入力信号類似値計算手段で計算された入力信号類似値に
基づいて、入力信号注目窓を移動できる量を示す移動可
能量を計算する移動可能量計算手段と、 移動可能量計算手段で計算された移動可能量に基づい
て、入力信号注目窓の位置を決定し、その位置に該入力
信号注目窓を設定する入力信号注目窓位置決定手段と、 入力信号類似値計算手段と移動可能量計算手段と入力信
号注目窓位置決定手段とに対して、それぞれの処理を繰
り返し行わせることによって、入力信号注目窓の各位置
について、入力信号類似値を計算させる繰返手段と、 入力信号類似値と予め設定された閾値との比較結果に基
づいて、入力信号上において入力信号注目窓が現在示す
位置に参照信号が存在するか否かを判定する判定手段と
を具備することを特徴とする高速信号探索装置。
18. A reference signal feature value generating means for generating a feature value sequence for a reference signal registered in advance, an input signal feature value generating means for generating a feature value sequence for an input signal inputted, and an input signal feature value. Input signal attention window setting means for setting an input signal attention window with respect to the feature value sequence generated by the generation means; feature value sequences generated by the reference signal feature value generation means; and features in the input signal attention window. Input signal similarity value calculating means for calculating an input signal similarity value indicating the degree of similarity with the quantity series; and an amount by which the input signal attention window can be moved based on the input signal similarity value calculated by the input signal similarity value calculating means. A movable amount calculating means for calculating the movable amount shown, and a position of the input signal attention window is determined based on the movable amount calculated by the movable amount calculating means, and the input signal attention window is set at the position. The input signal attention window position determination means, the input signal similarity value calculation means, the movable amount calculation means, and the input signal attention window position determination means are repeatedly subjected to the respective processes, whereby the input signal attention window A repetition means for calculating an input signal similarity value for each position; and a reference signal at a position currently indicated by the input signal attention window on the input signal based on a comparison result between the input signal similarity value and a preset threshold. A high-speed signal search device comprising: a determination unit configured to determine whether the signal exists.
【請求項19】 請求項18記載の高速信号探索装置
と、 ビデオ装置と、 前記高速信号探索装置の判定結果に基づいて、前記ビデ
オ装置の録画動作を制御する制御手段とを具備すること
を特徴とするビデオ自動制御装置。
19. A high-speed signal search device according to claim 18, comprising: a video device; and control means for controlling a recording operation of the video device based on a determination result of the high-speed signal search device. Video automatic control device.
【請求項20】 コンピュータを、 予め登録された参照信号について特徴量系列を生成する
参照信号特徴量生成手段と、 入力された入力信号について特徴量系列を生成する入力
信号特徴量生成手段と、 入力信号特徴量生成手段で生成された特徴量系列に対し
て、入力信号注目窓を設定する入力信号注目窓設定手段
と、 参照信号特徴量生成手段で生成された特徴量系列と前記
入力信号注目窓内の特徴量系列との類似度合いを示す入
力信号類似値を計算する入力信号類似値計算手段と、 入力信号類似値計算手段で計算された入力信号類似値に
基づいて、入力信号注目窓を移動できる量を示す移動可
能量を計算する移動可能量計算手段と、 移動可能量計算手段で計算された移動可能量に基づい
て、入力信号注目窓の位置を決定し、その位置に該入力
信号注目窓を設定する入力信号注目窓位置決定手段と、 入力信号類似値計算手段と移動可能量計算手段と入力信
号注目窓位置決定手段とに対して、それぞれの処理を繰
り返し行わせることによって、入力信号注目窓の各位置
について、入力信号類似値を計算させる繰返手段と、 入力信号類似値と予め設定された閾値との比較結果に基
づいて、入力信号上において入力信号注目窓が現在示す
位置に参照信号が存在するか否かを判定する判定手段と
して機能させるためのプログラムを記録した記録媒体。
20. A computer, comprising: a reference signal feature quantity generating means for generating a feature quantity sequence for a reference signal registered in advance; an input signal feature quantity generating means for generating a feature quantity sequence for an input signal input; Input signal attention window setting means for setting an input signal attention window with respect to the feature value sequence generated by the signal feature value generation means; a feature value sequence generated by the reference signal feature value generation means; Input signal similarity calculating means for calculating an input signal similarity value indicating the degree of similarity with the feature amount series in the input signal similarity value calculating means, and moving the input signal attention window based on the input signal similarity value calculated by the input signal similarity value calculating means A movable amount calculating means for calculating a movable amount indicating a possible amount; and a position of the input signal attention window is determined based on the movable amount calculated by the movable amount calculating means. The input signal attention window position determination means for setting the force signal attention window, the input signal similarity value calculation means, the movable amount calculation means, and the input signal attention window position determination means are made to repeat the respective processes. An iterative means for calculating the input signal similarity value for each position of the input signal attention window; and based on the comparison result between the input signal similarity value and a preset threshold, the input signal attention window is A recording medium on which a program for functioning as a judging means for judging whether or not a reference signal is present at the indicated position is recorded.
JP11130630A 1998-06-01 1999-05-11 High-speed signal search method and apparatus and recording medium thereof Expired - Lifetime JP3065314B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP11130630A JP3065314B1 (en) 1998-06-01 1999-05-11 High-speed signal search method and apparatus and recording medium thereof

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
JP15172398 1998-06-01
JP10-151723 1998-06-01
JP10-244162 1998-08-28
JP24416298 1998-08-28
JP4918499 1999-02-25
JP11-49184 1999-02-25
JP11130630A JP3065314B1 (en) 1998-06-01 1999-05-11 High-speed signal search method and apparatus and recording medium thereof

Publications (2)

Publication Number Publication Date
JP3065314B1 JP3065314B1 (en) 2000-07-17
JP2000312343A true JP2000312343A (en) 2000-11-07

Family

ID=27462320

Family Applications (1)

Application Number Title Priority Date Filing Date
JP11130630A Expired - Lifetime JP3065314B1 (en) 1998-06-01 1999-05-11 High-speed signal search method and apparatus and recording medium thereof

Country Status (1)

Country Link
JP (1) JP3065314B1 (en)

Cited By (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002035516A1 (en) * 2000-10-23 2002-05-02 Ntt Communications Corporation Musical composition recognition method and system, storage medium where musical composition program is stored, commercial recognition method and system, and storage medium where commercial recognition program is stored
WO2003036563A1 (en) 2001-10-22 2003-05-01 Sony Corporation Signal processing method and processor
JP2004309920A (en) * 2003-04-09 2004-11-04 Sony Corp Information processor and portable terminal device
JP2006338313A (en) * 2005-06-01 2006-12-14 Nippon Telegr & Teleph Corp <Ntt> Similar image retrieving method, similar image retrieving system, similar image retrieving program, and recording medium
WO2007066450A1 (en) * 2005-12-08 2007-06-14 Nec Corporation Segment automatic extracting system for extracting segment in musical composition, segment automatic extracting method, and segment automatic extracting program
JP2008111866A (en) * 2006-10-27 2008-05-15 Sanyo Electric Co Ltd Voice classification apparatus and computer program
US7653241B2 (en) 2004-07-15 2010-01-26 Nippon Telegraph And Telephone Corporation Signal detection method, signal detection system, signal detection processing program, and recording medium recorded with program thereof
US7720235B2 (en) 2001-10-22 2010-05-18 Sony Corporation Signal processing method and apparatus, signal processing program, and recording medium
US7797160B2 (en) 2002-12-06 2010-09-14 Nippon Telegraph And Telephone Corporation Signal compression method, device, program, and recording medium; and signal retrieval method, device, program, and recording medium
JP2010224481A (en) * 2009-03-25 2010-10-07 Toshiba Corp Device for detection of similar section
JP2010266880A (en) * 2010-06-23 2010-11-25 Sony Corp Mobile terminal device, information processing method, and program
US7860714B2 (en) 2004-07-01 2010-12-28 Nippon Telegraph And Telephone Corporation Detection system for segment including specific sound signal, method and program for the same
JP2011003193A (en) * 2009-06-19 2011-01-06 Ipeer Multimedia Internatl Ltd Multimedia identification system and method
US7873521B2 (en) 2004-07-09 2011-01-18 Nippon Telegraph And Telephone Corporation Sound signal detection system, sound signal detection server, image signal search apparatus, image signal search method, image signal search program and medium, signal search apparatus, signal search method and signal search program and medium
US8019163B2 (en) 2005-03-30 2011-09-13 Kabushiki Kaisha Toshiba Information processing apparatus and method
JP2012133371A (en) * 2012-01-04 2012-07-12 Intel Corp High-speed voice retrieval method and apparatus
US8255214B2 (en) 2001-10-22 2012-08-28 Sony Corporation Signal processing method and processor
JP2015031927A (en) * 2013-08-06 2015-02-16 日本電信電話株式会社 Common signal inclusion section presence determination device, method, and program
JP2015163988A (en) * 2015-05-18 2015-09-10 日本電信電話株式会社 Device, method and program for determining presence or absence of section including common signal
JP6425851B1 (en) * 2017-02-08 2018-11-21 三菱電機株式会社 INFORMATION PROCESSING APPARATUS, INFORMATION PROCESSING METHOD, AND INFORMATION PROCESSING PROGRAM

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3574075B2 (en) * 2001-02-07 2004-10-06 日本電信電話株式会社 Signal detection method, signal detection device, recording medium, and program
CN101327654B (en) * 2008-07-24 2011-01-12 北京彩虹宇星科技发展有限公司 Mould-closing bag-moulding one-shot forming technique for composite material

Cited By (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2384596A (en) * 2000-10-23 2003-07-30 Ntt Comm Corp Musical composition recognition method and system, storage medium where musical composition program is stored, commercial recognition method and system,
WO2002035516A1 (en) * 2000-10-23 2002-05-02 Ntt Communications Corporation Musical composition recognition method and system, storage medium where musical composition program is stored, commercial recognition method and system, and storage medium where commercial recognition program is stored
US7277852B2 (en) 2000-10-23 2007-10-02 Ntt Communications Corporation Method, system and storage medium for commercial and musical composition recognition and storage
WO2003036563A1 (en) 2001-10-22 2003-05-01 Sony Corporation Signal processing method and processor
US8255214B2 (en) 2001-10-22 2012-08-28 Sony Corporation Signal processing method and processor
US7720235B2 (en) 2001-10-22 2010-05-18 Sony Corporation Signal processing method and apparatus, signal processing program, and recording medium
US7729545B2 (en) 2001-10-22 2010-06-01 Sony Corporation Signal processing method and method for determining image similarity
US7797160B2 (en) 2002-12-06 2010-09-14 Nippon Telegraph And Telephone Corporation Signal compression method, device, program, and recording medium; and signal retrieval method, device, program, and recording medium
JP2004309920A (en) * 2003-04-09 2004-11-04 Sony Corp Information processor and portable terminal device
US7860714B2 (en) 2004-07-01 2010-12-28 Nippon Telegraph And Telephone Corporation Detection system for segment including specific sound signal, method and program for the same
US7873521B2 (en) 2004-07-09 2011-01-18 Nippon Telegraph And Telephone Corporation Sound signal detection system, sound signal detection server, image signal search apparatus, image signal search method, image signal search program and medium, signal search apparatus, signal search method and signal search program and medium
US7653241B2 (en) 2004-07-15 2010-01-26 Nippon Telegraph And Telephone Corporation Signal detection method, signal detection system, signal detection processing program, and recording medium recorded with program thereof
US8019163B2 (en) 2005-03-30 2011-09-13 Kabushiki Kaisha Toshiba Information processing apparatus and method
JP4545641B2 (en) * 2005-06-01 2010-09-15 日本電信電話株式会社 Similar image retrieval method, similar image retrieval system, similar image retrieval program, and recording medium
JP2006338313A (en) * 2005-06-01 2006-12-14 Nippon Telegr & Teleph Corp <Ntt> Similar image retrieving method, similar image retrieving system, similar image retrieving program, and recording medium
JP5145939B2 (en) * 2005-12-08 2013-02-20 日本電気株式会社 Section automatic extraction system, section automatic extraction method and section automatic extraction program for extracting sections in music
WO2007066450A1 (en) * 2005-12-08 2007-06-14 Nec Corporation Segment automatic extracting system for extracting segment in musical composition, segment automatic extracting method, and segment automatic extracting program
JP2008111866A (en) * 2006-10-27 2008-05-15 Sanyo Electric Co Ltd Voice classification apparatus and computer program
JP2010224481A (en) * 2009-03-25 2010-10-07 Toshiba Corp Device for detection of similar section
JP2011003193A (en) * 2009-06-19 2011-01-06 Ipeer Multimedia Internatl Ltd Multimedia identification system and method
JP2010266880A (en) * 2010-06-23 2010-11-25 Sony Corp Mobile terminal device, information processing method, and program
JP2012133371A (en) * 2012-01-04 2012-07-12 Intel Corp High-speed voice retrieval method and apparatus
JP2015031927A (en) * 2013-08-06 2015-02-16 日本電信電話株式会社 Common signal inclusion section presence determination device, method, and program
JP2015163988A (en) * 2015-05-18 2015-09-10 日本電信電話株式会社 Device, method and program for determining presence or absence of section including common signal
JP6425851B1 (en) * 2017-02-08 2018-11-21 三菱電機株式会社 INFORMATION PROCESSING APPARATUS, INFORMATION PROCESSING METHOD, AND INFORMATION PROCESSING PROGRAM
US11435383B2 (en) 2017-02-08 2022-09-06 Mitsubishi Electric Corporation Information processing apparatus, information processing method, and computer readable medium

Also Published As

Publication number Publication date
JP3065314B1 (en) 2000-07-17

Similar Documents

Publication Publication Date Title
JP2000312343A (en) High speed signal searching method and device, and recording medium therefor
US6826350B1 (en) High-speed signal search method device and recording medium for the same
CN111292764B (en) Identification system and identification method
US9378423B2 (en) Data recognition in content
EP1081960B1 (en) Signal processing method and video/voice processing device
JP4332988B2 (en) Signal processing apparatus and method
Kashino et al. Time-series active search for quick retrieval of audio and video
CN104704851B (en) Program recommendation apparatus and program commending method
CN106462609A (en) Methods, systems, and media for presenting music items relating to media content
JP2005530214A (en) Mega speaker identification (ID) system and method corresponding to its purpose
JP2000311180A (en) Method for feature set selection, method for generating video image class stastic model, method for classifying and segmenting video frame, method for determining similarity of video frame, computer-readable medium, and computer system
CN104918060B (en) The selection method and device of point position are inserted in a kind of video ads
CN112019871B (en) Live E-commerce content intelligent management platform based on big data
US20160088355A1 (en) Apparatus and method for processing image and computer readable recording medium
US20010043659A1 (en) Signal detection method and apparatus, relevant program, and storage medium storing the program
JPH10187182A (en) Method and device for video classification
CN100515048C (en) Method and system for fast detecting static stacking letters in online video stream
JP3408800B2 (en) Signal detection method and apparatus, program therefor, and recording medium
JP3537727B2 (en) Signal detection method, signal search method and recognition method, and recording medium
JPH11282492A (en) Speech recognition device, speaker detector, and image recorder
JP3730179B2 (en) SIGNAL SEARCH DEVICE, SIGNAL SEARCH METHOD, SIGNAL SEARCH PROGRAM, AND RECORDING MEDIUM CONTAINING SIGNAL SEARCH PROGRAM
Toheed et al. An automated framework for advertisement detection and removal from sports videos using audio-visual cues
WO2022264365A1 (en) Video processing device, video processing method, and recording medium
JP2002236496A (en) Signal detecting method, signal detecting device, recording medium and program
JP4507351B2 (en) Signal processing apparatus and method

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090512

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090512

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100512

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100512

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110512

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120512

Year of fee payment: 12

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130512

Year of fee payment: 13

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140512

Year of fee payment: 14

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

EXPY Cancellation because of completion of term