JP2007157064A - Signal search unit and its method - Google Patents
Signal search unit and its method Download PDFInfo
- Publication number
- JP2007157064A JP2007157064A JP2005355040A JP2005355040A JP2007157064A JP 2007157064 A JP2007157064 A JP 2007157064A JP 2005355040 A JP2005355040 A JP 2005355040A JP 2005355040 A JP2005355040 A JP 2005355040A JP 2007157064 A JP2007157064 A JP 2007157064A
- Authority
- JP
- Japan
- Prior art keywords
- search
- similarity
- signal sequence
- search window
- skip candidate
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Image Analysis (AREA)
Abstract
Description
本発明は、長時間の信号系列の中から、予め登録した信号と類似した部分を探す信号探索装置及びその方法に関する。 The present invention relates to a signal search apparatus and method for searching for a portion similar to a pre-registered signal from a long-time signal sequence.
特許文献1に、ヒストグラムインタセクションによって算出した類似度から検索不要な範囲を算出して、その範囲の処理をスキップして音声信号探索を高速化する時系列アクティブ探索法を開示している。
特許文献2、非特許文献1に、時系列アクティブ探索法を発展させて、現在の探索位置の類似度から算出された検索不要範囲と、暫定のスキップ位置の類似度から算出された後ろ向きの検索不要範囲とが重なる場合に、現在の探索位置から暫定のスキップ位置の全範囲を検索不要にして高速化するオ−バ−スキピングによる時系列アクティブ探索法を開示している。
特許文献2、非特許文献1による方法は、現在位置の類似度算出とスキップ候補位置の類似度算出を独立して行い、類似度の相関関係を考慮していなかった。そのため、両方の類似度を考慮すれば探索不要であるはずの範囲を探索してしまい十分に高速化できない問題があった。
The methods according to Patent Literature 2 and
本発明は、上記問題点を解決するためになされたものであって、従来よりも信号の探索不要範囲を広げることができる信号探索装置及びその方法を提供する。 The present invention has been made to solve the above-described problems, and provides a signal search apparatus and method capable of extending the signal search unnecessary range as compared with the conventional technique.
本発明の信号探索装置は、入力信号列上をスキップしながら参照信号列と類似する信号列を探索する信号探索装置において、前記入力信号列上の現在の探索位置に探索窓を設定する現在位置設定手段と、前記入力信号列上の次の探索位置の候補であるスキップ候補位置に探索窓を設定するスキップ候補位置設定手段と、前記現在位置の探索窓に含まれる信号列と前記参照信号列との類似度と、前記スキップ候補位置の探索窓に含まれる信号列と前記参照信号列の類似度とをそれぞれ算出する類似度算出手段と、前記現在位置の探索窓の末尾の位置と前記スキップ候補位置の探索窓の先頭の位置までの長さに基づいて、前記現在位置から前記スキップ候補位置までの範囲と前記参照信号列との類似度の最大値を算出する最大値算出手段と、前記最大値が閾値を超えない場合には、前記スキップ候補位置に次の現在位置を設定するスキップ幅算出手段と、を具備することを特徴とする信号探索装置である。 The signal search device of the present invention is a signal search device for searching a signal sequence similar to a reference signal sequence while skipping the input signal sequence, and a current position for setting a search window at the current search position on the input signal sequence Setting means; skip candidate position setting means for setting a search window at a skip candidate position that is a candidate for a next search position on the input signal string; a signal string included in the search window at the current position; and the reference signal string Similarity calculating means for calculating the similarity between the signal sequence included in the search window of the skip candidate position and the similarity of the reference signal sequence, the end position of the search window at the current position, and the skip A maximum value calculating means for calculating a maximum value of the similarity between the range from the current position to the skip candidate position and the reference signal sequence based on the length of the candidate position to the top position of the search window; If a large value does not exceed the threshold value is a signal search apparatus characterized by comprising, a skip width calculation means for setting a next current location to the deletion candidate position.
本発明によれば、従来よりも信号の探索不要範囲を広げて高速な信号探索を実現できる。 According to the present invention, it is possible to realize a high-speed signal search by expanding the signal search unnecessary range as compared with the conventional case.
以下、本発明の実施形態の信号探索装置100について説明する。
Hereinafter, the
(第1の実施形態)
第1の実施形態の信号探索装置100について図1から図5に基づいて説明する。本実施形態では、テレビ番組を録画した2時間の映像から15秒間のCM映像を検索する例を説明する。なお、参照信号と入力信号は、1秒間に30枚のフレーム画像が含まれた映像信号である。
(First embodiment)
A
(1)信号探索装置100の構成
図1は、本実施形態に係わる信号探索装置100を示すブロック図である。
(1) Configuration of
信号探索装置100は、検索キーである参照信号101を入力して特徴量を算出する参照信号特徴量算出部104と、検索対象である入力信号102の特徴量を算出する入力信号特徴量算出部105と、参照信号101の特徴量と入力信号102の特徴量との類似度を算出する類似度算出部106と、類似度に基づいてスキップ可能な最大値を算出する相関スキップ可能幅算出部107と、スキップ可能幅に基づいて実際にスキップする幅を決定するスキップ幅算出部108と、スキップした先の探索窓の類似度から後戻りする必要があるかどうかを判定するバックトラック判定部109と、から構成される。
The
信号探索装置100は、例えば、汎用のコンピュータ装置を基本ハードウェアとして用いることで実現することが可能である。
The
例えば、参照信号特徴量算出部104、入力信号特徴量算出部105、類似度算出部106、相関スキップ可能幅算出部107、スキップ幅算出部108、及び、バックトラック判定部109は、上記のコンピュータ装置に搭載されたプロセッサにプログラムを実行させることにより実現することができる。
For example, the reference signal feature
このとき、信号探索装置100は、上記のプログラムをコンピュータ装置に予めインストールすることで実現してもよいし、CD−ROMなどの記憶媒体に記憶して、あるいはネットワークを介して上記のプログラムを配布して、このプログラムをコンピュータ装置に適宜インストールすることで実現してもよい。また、B及びCは、上記のコンピュータ装置に内蔵あるいは外付けされたメモリ、ハードディスクもしくはCD−R、CD−RW、DVD−RAM、DVD−Rなどの記憶媒体などを適宜利用して実現することができる。
At this time, the
なお、特許文献2ではスキップ可能幅をそのままスキップ幅としたが、本実施形態では最もバックトラックが少ないスキップ幅をスキップ可能幅から算出するように、相関スキップ可能幅算出部107とスキップ幅算出部108を具備する。また、本実施形態は、特許文献2とスキップ可能幅の算出方法が異なる。
Although the skippable width is directly used as the skip width in Patent Document 2, the correlation skippable
(2)信号探索装置100の動作
次に、図1及び図2に示すフローチャートを用いて、信号探索装置100の動作について説明する。
(2) Operation of
(2−1)入力信号102における現在位置の類似度の算出
まず、参照信号101と入力信号102を取得する(ステップS200)。
(2-1) Calculation of similarity of current position in input signal 102 First, the reference signal 101 and the input signal 102 are acquired (step S200).
参照信号101の特徴量を参照信号特徴量算出部104で算出する(ステップS201)。参照信号101はここでは15秒間のCM映像とする。特徴量は参照信号101の映像を構成する各フレーム画面について、画面を16分割して輝度の平均を256ビン(すなわち、256区間)で算出する。特徴量として16次元のベクトルが450個得られる。さらに、これらの特徴量から24ビンのヒストグラムを算出する。
The reference signal feature
入力信号102は参照信号101と同様に映像であり、テレビ番組を録画した2時間の映像とする。入力信号102中に現在位置を入力信号102の先頭に設定して初期化する(ステップS202)。本実施形態では、現在位置を入力信号102中の先頭のフレームから末尾のフレームまで少しずつずらしながら参照信号101との類似度を算出して、類似度が予め与えられた閾値以上の場合に、参照信号101と同一の信号であると検出する。 The input signal 102 is a video, similar to the reference signal 101, and is a 2-hour video recording a television program. The current position is set to the head of the input signal 102 in the input signal 102 and is initialized (step S202). In the present embodiment, the similarity with the reference signal 101 is calculated while gradually shifting the current position from the first frame to the last frame in the input signal 102, and when the similarity is equal to or greater than a predetermined threshold value, It is detected that the signal is the same as the reference signal 101.
現在位置(すなわち、現在のフレーム位置)が入力信号102の末尾かどうかを調べ(ステップS203)、末尾のフレームの場合には探索処理を終了する。そうでない場合には現在位置の特徴量を入力信号特徴量算出部105で算出し、参照信号101との類似度を類似度算出部106で算出する(ステップS204)。現在位置の特徴量は、参照信号101の特徴量の算出と同様に、現在位置から参照信号101と同じ長さ、すなわち15秒の探索窓を設定し、この中に含まれるフレーム画像について特徴量を算出し、ヒストグラムを算出する。
It is checked whether or not the current position (that is, the current frame position) is the end of the input signal 102 (step S203), and in the case of the end frame, the search process is terminated. Otherwise, the feature quantity at the current position is calculated by the input signal
参照信号101のヒストグラムと現在位置の探索窓に含まれる信号との類似度は(以後、現在位置の類似度と呼ぶ)、特許文献1に示された式(下記で示す式(2)参照)と同様に、ヒストグラムの各ビンについて最小値を取り、それらを合計したものをヒストグラムの総度数で割って正規化したヒストグラムインタセクションと呼ばれる距離尺度で算出する。ヒストグラムインタセクションは、信号が類似していれば類似しているほど大きくなる性質を持つ。 The similarity between the histogram of the reference signal 101 and the signal included in the current position search window (hereinafter referred to as the current position similarity) is the expression shown in Patent Document 1 (see Expression (2) below). Similarly, the minimum value is taken for each bin of the histogram, and the sum is calculated by a distance measure called a histogram intersection obtained by dividing the sum by the total frequency of the histogram. The histogram intersection has the property that the more similar the signals, the larger the similar.
現在位置の類似度が予め与えられた閾値以上かどうかを調べ(ステップS205)、閾値以上の場合には、現在位置の探索窓に含まれる信号と参照信号101とは一致しているとみなして、例えば現在位置の数値を画面上に表示して探索結果を出力する(ステップS206)。そうでない場合には、ステップS207に進んで現在位置を前方にずらす。 It is checked whether or not the similarity of the current position is greater than or equal to a predetermined threshold value (step S205). If the similarity is greater than or equal to the threshold value, the signal included in the current position search window and the reference signal 101 are regarded as matching. For example, the numerical value of the current position is displayed on the screen, and the search result is output (step S206). If not, the process proceeds to step S207 to shift the current position forward.
(2−2)スキップ可能幅の算出
現在位置は1つずつ進めるのではなく(すなわち、1フレームずつ進めるのでなく)、現在位置の他にスキップ候補位置(すなわち、スキップする候補のフレーム位置)を設定し、現在位置の類似度とスキップ候補位置の類似度とから探索不要な範囲を算出して、この範囲の信号照合を省略してスキップすることによって高速化する。本実施形態における探索不要範囲(すなわち、スキップ可能幅)の算出方法は従来方法と異なり、本実施形態の最も特徴とする点である。
(2-2) Calculation of skippable width The current position is not advanced one by one (that is, not advanced one frame at a time), but the skip candidate position (that is, the frame position of the candidate to be skipped) is added in addition to the current position. The speed is increased by calculating a range that does not require a search from the similarity of the current position and the similarity of the skip candidate position, and skipping the signal collation in this range. Unlike the conventional method, the calculation method of the search unnecessary range (that is, skippable width) in the present embodiment is the most characteristic point of the present embodiment.
図3は、スキップ幅を算出する原理を説明するための図であり、図3−300は特許文献1の説明図、図3−310は特許文献2の説明図、図3−320は本実施形態の説明図である。
FIG. 3 is a diagram for explaining the principle of calculating the skip width. FIG. 3-300 is an explanatory diagram of
(2−3)特許文献1におけるスキップ可能幅の算出
図3−300は特許文献1のスキップ原理を示す。
(2-3) Calculation of Skippable Width in
特許文献1では、探索窓301の類似度がSoとすると、探索窓を前方にずらした部分が仮に全て一致していたとしても、類似度Soとずれによる類似度の増加分との合計が、閾値θを越えることがない。さらに説明すると、閾値θと等しい類似度を持つということは、探索窓302と入力信号とが完全に一致した部分、すなわち、15秒のCM映像を発見できた位置であり、探索を行っている過程でこの閾値θを超えることがない。そのため、この考え方を利用して、この間の照合を省略する。このスキップ幅w1は式(1)で与えられる。
In
w1=floor(L(θ−So))+1 So<θ
w1=1 それ以外
・・・(1)
但し、Lは探索窓の幅(探索窓のフレーム数)、関数floorは小数以下の切り捨てを表す関数、Soは現在位置の類似度(現在のフレーム位置における類似度)、θは閾値の類似度を示す。なお、θは、完全一致した場合は1であるが、外乱やデジタル化の過程で完全一致ではなくなるので0<θ<1である。例えば、θ=0.8である。
w1 = floor (L (θ−So)) + 1 So <θ
w1 = 1 otherwise
... (1)
Where L is the width of the search window (the number of frames in the search window), the function floor is a function that represents truncation of decimals, So is the similarity of the current position (similarity at the current frame position), and θ is the similarity of the threshold Indicates. Note that θ is 1 when it completely matches, but 0 <θ <1 because it does not completely match in the course of disturbance or digitization. For example, θ = 0.8.
(2−4)特許文献2におけるスキップ可能幅
(2−4−1)図3−310に基づく説明
図3−310は特許文献2のスキップ原理を示す。
(2-4) Skippable Width in Patent Document 2 (2-4-1) Description Based on FIG. 3-310 FIG. 3-310 shows the skip principle of Patent Document 2.
特許文献2では、特許文献1と同様に現在位置の探索窓311のスキップ可能幅を探索窓312のように算出する。
In Patent Document 2, as in
次に、スキップ候補位置の探索窓314について後方のスキップ幅を同様に探索窓314のように算出し、これらのスキップ幅が重なる場合には現在位置からスキップ候補位置までの照合を省略する。スキップ幅が重ならなかった場合には、スキップ候補位置を後方に戻すバックトラックを行い、再度判定する。
Next, the backward skip width of the
スキップ幅が重なるかどうかの判定は式(2)で与えられる。 The determination of whether or not the skip widths overlap is given by equation (2).
Tp−To<floor(L(2θ−So−Sp)) ・・・(2)
但し、Toは現在位置、Tpはスキップ候補位置、Spはスキップ候補位置の類似度を示す。よってスキップ幅の最大値w2は式(3)となる。
Tp−To <floor (L (2θ−So−Sp)) (2)
Where To is the current position, Tp is the skip candidate position, and Sp is the similarity of the skip candidate position. Therefore, the maximum value w2 of the skip width is expressed by Expression (3).
w2=floor(L(2θ−So−Sp)) ・・・(3)
(2−4−2)図3−330に基づく説明
次に、特許文献2について、図3−330を用いて説明する。この図は、図3−310に示した図と同じ原理を示している。
w2 = floor (L (2θ−So−Sp)) (3)
(2-4-2) Description Based on FIG. 3-330 Next, Patent Document 2 will be described with reference to FIG. This figure shows the same principle as that shown in FIG.
特許文献2では、まず現在位置の時刻To、類似度Soの点331と、スキップ候補位置の時刻Tpの類似度Spの点332を得る。探索窓の幅をLとすると類似度の変化率は1/Lを超えない。そのため、点331からの類似度の最大値は直線341のように表せ、類似度がθに等しくなる点333が式(1)に示したスキップ位置である。この点333から最も急激に類似度が低下すると直線342のように表せる。この直線342がスキップ候補位置の時刻Tpでの点334の類似度が点332の類似度を超える場合には、ToからTpまでの間には類似度がθを超えていかなったことが分かる。
In Patent Document 2, first, a
これを別の方法で説明すると、類似度の変化率は探索窓を後方に移動させても1/Lを超えないから、スキップ候補位置の類似度を表す点332からの後方の類似度の最大値は直線343のように表せ、類似度がθに等しくなる点335までは後方にスキップ可能である。点335が点333よりも後方にあれば、現在位置の探索窓による前方のスキップ幅と、スキップ候補位置の探索窓による後方のスキップ幅が重なり、現在位置からスキップ候補位置までの全区間で照合を省略できる。この説明は図3−310に示した原理と同一である。
To explain this in another way, since the rate of change in similarity does not exceed 1 / L even when the search window is moved backward, the maximum of the similarity in the rear from the
(2−5)本実施形態の技術
(2−5−1)図3−320に基づく説明
図3−320に本実施形態の原理を示す。現在位置の類似度とスキップ候補位置の類似度との相関を考慮することにより、特許文献2より広いスキップ可能幅を算出できる点に特徴がある。
(2-5) Technology of this Embodiment (2-5-1) Description Based on FIG. 3-320 FIG. 3-320 shows the principle of this embodiment. It is characterized in that a wider skippable width than that of Patent Document 2 can be calculated by considering the correlation between the similarity of the current position and the similarity of the skip candidate positions.
図3−310において、バックトラックを行い、スキップ候補位置の探索窓312のスキップ可能幅を算出する際に、探索窓311の類似度はSoを超えない。そのため、探索窓314は探索窓313までずらせないという制約がある。しかし、特許文献2ではスキップ幅を前方と後方とで独立して算出したため、上記の制約が全く考慮されていない。
In FIG. 3-310, when backtracking is performed and the skippable width of the
そこで、本実施形態では、現在位置の類似度とスキップ候補位置の類似度を同時に考慮する。現在位置の探索窓321と、スキップ候補位置の探索窓322との長さをdと定義する。すなわち、現在位置の探索窓の末尾のフレーム位置とスキップ候補位置の探索窓の先頭のフレーム位置までのフレーム数をdと定義する。
Therefore, in the present embodiment, the similarity at the current position and the similarity at the skip candidate position are considered simultaneously. The lengths of the current
探索窓321と探索窓322の間の長さdが全て類似度上昇に寄与したとしても、探索窓323の類似度は、現在位置の探索窓321の類似度So、スキップ候補位置の探索窓322の類似度Sq、及び、d/Lの類似度の和を超えない。よって、この合計の類似度が閾値θ(0<=θ<=1)を超えなければ現在位置とスキップ候補位置の間の照合を省略する。
Even if the length d between the
この判定は式(4)で与えられる。 This determination is given by equation (4).
Tq−To<floor(L(1+θ−So−Sq)) ・・・(4)
ここで、式(4)について導出過程について説明する。
Tq−To <floor (L (1 + θ−So−Sq)) (4)
Here, the derivation process for Equation (4) will be described.
まず、現在位置の探索窓321の末尾の位置Toとスキップ候補位置の探索窓322の先頭の位置Tqまでの長さdは、d=Tq−Toとなる。
First, the length d from the end position To of the current
次に、現在位置からスキップ候補位置までの範囲と参照信号との類似度の最大値Sを算出すると下記のようになる。 Next, the maximum value S of the similarity between the range from the current position to the skip candidate position and the reference signal is calculated as follows.
類似度の最大値S=d/L+So+Sq
=(Tq−To)/L−1+So+Sq
そして、最大値S<閾値θのときにスキップ候補位置に次の現在位置を設定できる。
Maximum similarity S = d / L + So + Sq
= (Tq-To) / L-1 + So + Sq
When the maximum value S <threshold value θ, the next current position can be set as the skip candidate position.
すなわち、
S=(Tq−To)/L−1+So+Sq<θ
である。これを変形すると、
d=Tq−To<L(1+θ−So−Sq)
となる。長さdはサンプリングして整数のため、右辺も整数化する必要があるため、関数floorを用いて式(4)のようになる。
That is,
S = (Tq−To) / L−1 + So + Sq <θ
It is. If this is transformed,
d = Tq−To <L (1 + θ−So−Sq)
It becomes. Since the length d is an integer obtained by sampling, it is necessary to convert the right side into an integer, so that the function floor is used to obtain the equation (4).
したがって、本実施形態におけるスキップ可能幅の最大値w3は、
w3=floor(L(1+θ−So−Sq)) ・・・(5)
となる。
Therefore, the maximum value w3 of the skippable width in this embodiment is
w3 = floor (L (1 + θ−So−Sq)) (5)
It becomes.
式(1)、式(3)、式(5)の大小関係は式(6)で与えられる。但し、等号はθ=1の場合にのみ成り立つ。よって、本実施形態のスキップ可能幅w3が最も大きい。 The magnitude relationship between the expressions (1), (3), and (5) is given by the expression (6). However, the equal sign holds only when θ = 1. Therefore, the skippable width w3 of this embodiment is the largest.
w1<w2<w3 ・・・(6)
また、本実施形態と特許文献2は、スキップ位置、すなわちスキップ候補位置の設定方法も異なる。特許文献2ではスキップ候補位置を式(3)によって求めた最大スキップ幅に設定したが、本実施形態では最大スキップ幅より少し手前にスキップ候補位置を設定して、バックトラックの危険性を低下させる。例えば、スキップ候補位置の類似度が正規分布に従うとして、式(5)の判定に成功する確率の分布関数とスキップ幅との積が最大になる位置をスキップ幅に定める。あるいは、スキップ候補位置の類似度の算出時に類似度を控えめに算出して同様の効果を得る。
w1 <w2 <w3 (6)
Also, the present embodiment and Patent Document 2 are different in the skip position, that is, the skip candidate position setting method. In Patent Document 2, the skip candidate position is set to the maximum skip width obtained by Expression (3), but in this embodiment, the skip candidate position is set slightly before the maximum skip width to reduce the risk of backtracking. . For example, assuming that the similarity of skip candidate positions follows a normal distribution, a position where the product of the distribution function of the probability of success in the determination of Expression (5) and the skip width is maximized is determined as the skip width. Alternatively, a similar effect is obtained by conservatively calculating the similarity when calculating the similarity of the skip candidate position.
(2−5−2)図3−310に基づく説明
次に、図3−330に示す図を用いて本実施形態を説明する。
(2-5-2) Description Based on FIG. 3-310 Next, the present embodiment will be described with reference to FIG.
点331から点333までは特許文献2と同様であるが、式(4)が等号で最大スキップ幅の場合には、既に説明したように探索窓321と探索窓322の相関関係によって、類似度はθのまま上昇しない。その後、探索窓323の位置が点336まで来ると、最大類似度は直線344のように変化率1/Lで低下する。点337で表されたスキップ候補位置Tqの類似度Sqが、Tqにおける直線344の最大類似度を超えない場合には、ToからTqまでの全範囲で類似度がθを超えないと保障できる。なお、ToからTqまでの全範囲で類似度がθを超えないとは、その範囲内で一致した映像がないことを意味するのでその範囲はスキップをしてもよいことになる。スキップ候補位置の類似度は、特許文献2と同様に、直線344と類似度推定直線または曲線との交点として算出してもよい。
(2−6)スキップ候補位置の特徴量の算出
以上に説明したように、本実施形態では、スキップ候補位置の類似度を例えば特許文献2と同様にこれまでの探索窓の履歴から線形予測するなどして類似度を推定し(ステップS207)、相関スキップ可能幅算出部107で最大スキップ幅を式(5)により算出し(ステップS208)、バックトラックの危険性を低下させるように、最大スキップ幅からスキップ幅をスキップ幅108で算出してスキップ候補位置を設定する(ステップS209)。
(2-6) Calculation of Feature Value of Skip Candidate Position As described above, in this embodiment, the similarity of skip candidate positions is linearly predicted from the history of search windows so far, for example, as in Patent Document 2. Thus, the similarity is estimated (step S207), the correlation skippable
入力信号特徴量算出部105でスキップ候補位置の特徴量を算出し、類似度算出部106で参照信号との類似度を算出する(ステップS210)。
The input signal feature
バックトラック判定部109で式(4)を用いてバックトラックが必要かどうかを判定し(ステップS211)、必要ならばスキップ候補位置を後戻りして再設定してステップS210に戻り再度判定する。そうでない場合は、現在位置とスキップ候補位置との間で類似度が閾値を超えないことを保証できるから、スキップ候補位置を現在位置に置き換えて設定して現在位置を進め(ステップS212)、ステップS205に戻って新たな現在位置について同様の照合を繰り返す。
The
以上のように現在位置を進めていき、現在位置が入力信号102の末尾まで照合が進んだら処理を終了する。 As described above, the current position is advanced, and when the current position reaches the end of the input signal 102, the process ends.
(3)効果
図4は本実施形態と背景技術の実行の差の一例を示した図である。
(3) Effect FIG. 4 is a diagram showing an example of a difference in execution between the present embodiment and the background art.
グラフ400、グラフ401、グラフ402は、それぞれ特許文献1、特許文献2、本実施形態による実行の様子の一例を示す。
A
横軸は入力信号102内の時間を、縦軸は類似度を表し、棒グラフは照合した箇所にのみ表示している。本実施形態によるものが最もスキップ幅が大きいことが分かる。 The horizontal axis represents the time in the input signal 102, the vertical axis represents the similarity, and the bar graph is displayed only at the collated portion. It can be seen that the one according to this embodiment has the largest skip width.
図5は本実施形態と背景技術との照合回数の差の一例を示した図である。 FIG. 5 is a diagram showing an example of the difference in the number of comparisons between the present embodiment and the background art.
40枚のフレーム画像から成る参照画像101を6000枚のフレーム画像から成る入力映像102から探索した結果である。 This is a result of searching a reference image 101 made up of 40 frame images from an input video 102 made up of 6000 frame images.
棒グラフは照合回数を表し、折れ線グラフはバックトラック回数を表す。棒グラフ500と点504は全探索、棒グラフ501と点505は特許文献1、棒グラフ502と506は特許文献2、棒グラフ503と点507は本実施形態による照合回数とバックトラック回数を表す。このように本実施形態は大幅に照合回数を削減できる。バックトラックの回数も激増はしておらず、全体として処理時間を低減できることが分かる。
The bar graph represents the number of collations, and the line graph represents the number of backtracks. A
このように、本実施形態に係わる信号探索装置100によれば、現在位置とスキップ候補位置の相互関係を考慮してスキップ幅を算出することにより、より広くスキップできる。
Thus, according to the
(4)変更例
なお、本発明は上記実施形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。また、上記実施形態に開示されている複数の構成要素の適宜な組み合わせにより、種々の発明を形成できる。例えば、実施形態に示される全構成要素から幾つかの構成要素を削除してもよい。さらに、異なる実施形態にわたる構成要素を適宜組み合わせてもよい。
(4) Modifications Note that the present invention is not limited to the above-described embodiments as they are, and can be embodied by modifying the constituent elements without departing from the scope of the invention in the implementation stage. In addition, various inventions can be formed by appropriately combining a plurality of components disclosed in the embodiment. For example, some components may be deleted from all the components shown in the embodiment. Furthermore, constituent elements over different embodiments may be appropriately combined.
例えば、本実施形態では映像の探索に用いたが、あらゆる信号探索、例えば、音声信号探索、DNA信号の探索などに適用できる。 For example, although the present embodiment is used for video search, it can be applied to any signal search, for example, audio signal search, DNA signal search, and the like.
101 参照信号
102 入力信号
104 参照信号特徴量算出部
105 入力信号特徴量算出部
106 類似度算出部
107 相関スキップ可能幅算出部
108 スキップ幅算出部
109 バックトラック判定部
101 Reference signal 102
Claims (15)
前記入力信号列上の現在の探索位置に探索窓を設定する現在位置設定手段と、
前記入力信号列上の次の探索位置の候補であるスキップ候補位置に探索窓を設定するスキップ候補位置設定手段と、
前記現在位置の探索窓に含まれる信号列と前記参照信号列との類似度と、前記スキップ候補位置の探索窓に含まれる信号列と前記参照信号列の類似度とをそれぞれ算出する類似度算出手段と、
前記現在位置の探索窓の末尾の位置と前記スキップ候補位置の探索窓の先頭の位置までの長さに基づいて、前記現在位置から前記スキップ候補位置までの範囲と前記参照信号列との類似度の最大値を算出する最大値算出手段と、
前記最大値が閾値を超えない場合には、前記スキップ候補位置に次の現在位置を設定するスキップ幅算出手段と、
を具備する
ことを特徴とする信号探索装置。 In a signal search device that searches for a signal sequence similar to a reference signal sequence while skipping over the input signal sequence,
Current position setting means for setting a search window at the current search position on the input signal sequence;
Skip candidate position setting means for setting a search window at a skip candidate position that is a candidate for the next search position on the input signal sequence;
Similarity calculation for calculating the similarity between the signal sequence included in the current position search window and the reference signal sequence, and the similarity between the signal sequence included in the skip candidate position search window and the reference signal sequence, respectively. Means,
Based on the length from the end position of the search window of the current position to the start position of the search window of the skip candidate position, the similarity between the range from the current position to the skip candidate position and the reference signal sequence A maximum value calculating means for calculating the maximum value of
If the maximum value does not exceed a threshold value, a skip width calculating means for setting a next current position as the skip candidate position;
A signal search apparatus comprising:
(1)前記現在位置の類似度と前記探索窓の長さの積、
(2)前記スキップ候補位置の類似度と前記探索窓の長さの積、
(3)前記現在位置における探索窓の末尾から前記スキップ候補位置における探索窓の先頭までの長さ、
を求め、これら(1)(2)(3)の和を前記最大値とする
ことを特徴とする請求項1記載の信号検索装置。 The maximum value calculating means includes
(1) The product of the similarity of the current position and the length of the search window,
(2) The product of the similarity of the skip candidate position and the length of the search window,
(3) a length from the end of the search window at the current position to the start of the search window at the skip candidate position;
The signal search apparatus according to claim 1, wherein a sum of these (1), (2), and (3) is set as the maximum value.
S=d/L+So+Sq=(Tq−To)/L−1+So+Sq
により求め、
前記スキップ幅算出手段はS<θのときに前記スキップ候補位置に次の現在位置を設定するものであり、
但し、Tqを前記入力信号列上のスキップ候補位置、Toを前記入力信号列上の現在位置、dは前記現在位置の探索窓の末尾の位置と前記スキップ候補位置の探索窓の先頭の位置までの長さ、θを前記閾値(0<=θ<=1)、Soを前記現在位置の類似度(0<=So<=1)、Sqを前記スキップ候補位置の類似度(0<=Sq<=1)とする
ことを特徴とする請求項1記載の信号探索装置。 The maximum value calculating means calculates the maximum value S,
S = d / L + So + Sq = (Tq−To) / L−1 + So + Sq
Sought by
The skip width calculation means sets a next current position to the skip candidate position when S <θ,
Where Tq is the skip candidate position on the input signal sequence, To is the current position on the input signal sequence, and d is the end position of the search window for the current position and the start position of the search window for the skip candidate position. , Θ is the threshold (0 <= θ <= 1), So is the similarity of the current position (0 <= So <= 1), and Sq is the similarity of the skip candidate position (0 <= Sq <= 1) The signal search device according to claim 1, wherein:
ことを特徴とする請求項1記載の信号探索装置。 The signal search apparatus according to claim 1, wherein the skip width calculation unit reverts the skip candidate position to the current position side when the maximum value exceeds a threshold value.
ことを特徴とする請求項1記載の信号探索装置。 The signal search apparatus according to claim 1, wherein the search is performed for the entire range of the input signal sequence.
前記入力信号列上の現在の探索位置に探索窓を設定し、
前記入力信号列上の次の探索位置の候補であるスキップ候補位置に探索窓を設定し、
前記現在位置の探索窓に含まれる信号列と前記参照信号列との類似度と、前記スキップ候補位置の探索窓に含まれる信号列と前記参照信号列の類似度とをそれぞれ算出し、
前記現在位置の探索窓の末尾の位置と前記スキップ候補位置の探索窓の先頭の位置までの長さに基づいて、前記現在位置から前記スキップ候補位置までの範囲と前記参照信号列との類似度の最大値を算出し、
前記最大値が閾値を超えない場合には、前記スキップ候補位置に次の現在位置を設定する
ことを特徴とする信号探索方法。 In a signal search method for searching for a signal sequence similar to a reference signal sequence while skipping over the input signal sequence,
Set a search window at the current search position on the input signal sequence;
Set a search window at a skip candidate position that is a candidate for the next search position on the input signal sequence,
Calculating the similarity between the signal sequence included in the search window at the current position and the reference signal sequence, and the similarity between the signal sequence included in the search window at the skip candidate position and the reference signal sequence,
Based on the length from the end position of the search window for the current position to the start position of the search window for the skip candidate position, the similarity between the range from the current position to the skip candidate position and the reference signal sequence The maximum value of
If the maximum value does not exceed a threshold value, a next current position is set as the skip candidate position.
(1)前記現在位置の類似度と前記探索窓の長さの積、
(2)前記スキップ候補位置の類似度と前記探索窓の長さの積、
(3)前記現在位置における探索窓の末尾から前記スキップ候補位置における探索窓の先頭までの長さ、
を求め、これら(1)(2)(3)の和を前記最大値とする
ことを特徴とする請求項6記載の信号検索方法。 When calculating the maximum value,
(1) The product of the similarity of the current position and the length of the search window,
(2) The product of the similarity of the skip candidate position and the length of the search window,
(3) a length from the end of the search window at the current position to the start of the search window at the skip candidate position;
The signal search method according to claim 6, wherein a sum of these (1), (2), and (3) is set as the maximum value.
S=d/L+So+Sq=(Tq−To)/L−1+So+Sq
により求め、
S<θのときに前記スキップ候補位置に次の現在位置を設定するものであり、
但し、Tqを前記入力信号列上のスキップ候補位置、Toを前記入力信号列上の現在位置、dは前記現在位置の探索窓の末尾の位置と前記スキップ候補位置の探索窓の先頭の位置までの長さ、θを前記閾値(0<=θ<=1)、Soを前記現在位置の類似度(0<=So<=1)、Sqを前記スキップ候補位置の類似度(0<=Sq<=1)とする
ことを特徴とする請求項6記載の信号探索方法。 When calculating the maximum value, the maximum value S is
S = d / L + So + Sq = (Tq−To) / L−1 + So + Sq
Sought by
The next current position is set to the skip candidate position when S <θ.
Where Tq is the skip candidate position on the input signal sequence, To is the current position on the input signal sequence, and d is the end position of the search window for the current position and the start position of the search window for the skip candidate position. , Θ is the threshold (0 <= θ <= 1), So is the similarity of the current position (0 <= So <= 1), and Sq is the similarity of the skip candidate position (0 <= Sq The signal search method according to claim 6, wherein <= 1).
ことを特徴とする請求項6記載の信号探索方法。 The signal search method according to claim 6, wherein, when the maximum value exceeds a threshold value, the skip candidate position is returned to the current position side.
ことを特徴とする請求項6記載の信号探索方法。 The signal search method according to claim 6, wherein the search is performed for the entire range of the input signal sequence.
前記入力信号列上の現在の探索位置に探索窓を設定する現在位置設定機能と、
前記入力信号列上の次の探索位置の候補であるスキップ候補位置に探索窓を設定するスキップ候補位置設定機能と、
前記現在位置の探索窓に含まれる信号列と前記参照信号列との類似度と、前記スキップ候補位置の探索窓に含まれる信号列と前記参照信号列の類似度とをそれぞれ算出する類似度算出機能と、
前記現在位置の探索窓の末尾の位置と前記スキップ候補位置の探索窓の先頭の位置までの長さに基づいて、前記現在位置から前記スキップ候補位置までの範囲と前記参照信号列との類似度の最大値を算出する最大値算出機能と、
前記最大値が閾値を超えない場合には、前記スキップ候補位置に次の現在位置を設定するスキップ幅算出機能と、
を具備する
ことを特徴とする信号探索プログラム。 In a signal search program for searching a signal sequence similar to a reference signal sequence by a computer while skipping over the input signal sequence,
A current position setting function for setting a search window at the current search position on the input signal sequence;
A skip candidate position setting function for setting a search window at a skip candidate position that is a candidate for the next search position on the input signal sequence;
Similarity calculation for calculating the similarity between the signal sequence included in the current position search window and the reference signal sequence, and the similarity between the signal sequence included in the skip candidate position search window and the reference signal sequence, respectively. Function and
Based on the length from the end position of the search window for the current position to the start position of the search window for the skip candidate position, the similarity between the range from the current position to the skip candidate position and the reference signal sequence Maximum value calculation function to calculate the maximum value of
When the maximum value does not exceed a threshold value, a skip width calculation function for setting a next current position as the skip candidate position;
The signal search program characterized by comprising.
(1)前記現在位置の類似度と前記探索窓の長さの積、
(2)前記スキップ候補位置の類似度と前記探索窓の長さの積、
(3)前記現在位置における探索窓の末尾から前記スキップ候補位置における探索窓の先頭までの長さ、
を求め、これら(1)(2)(3)の和を前記最大値とする
ことを特徴とする請求項1記載の信号検索プログラム。 The maximum value calculation function is:
(1) The product of the similarity of the current position and the length of the search window,
(2) The product of the similarity of the skip candidate position and the length of the search window,
(3) a length from the end of the search window at the current position to the start of the search window at the skip candidate position;
The signal search program according to claim 1, wherein a sum of these (1), (2), and (3) is set as the maximum value.
S=d/L+So+Sq=(Tq−To)/L−1+So+Sq
により求め、
前記スキップ幅算出機能はS<θのときに前記スキップ候補位置に次の現在位置を設定するものであり、
但し、Tqを前記入力信号列上のスキップ候補位置、Toを前記入力信号列上の現在位置、dは前記現在位置の探索窓の末尾の位置と前記スキップ候補位置の探索窓の先頭の位置までの長さ、θを前記閾値(0<=θ<=1)、Soを前記現在位置の類似度(0<=So<=1)、Sqを前記スキップ候補位置の類似度(0<=Sq<=1)とする
ことを特徴とする請求項11記載の信号探索プログラム。 The maximum similarity calculation function calculates the maximum value S as
S = d / L + So + Sq = (Tq−To) / L−1 + So + Sq
Sought by
The skip width calculation function sets a next current position to the skip candidate position when S <θ,
Where Tq is the skip candidate position on the input signal sequence, To is the current position on the input signal sequence, and d is the end position of the search window for the current position and the start position of the search window for the skip candidate position. , Θ is the threshold (0 <= θ <= 1), So is the similarity of the current position (0 <= So <= 1), and Sq is the similarity of the skip candidate position (0 <= Sq The signal search program according to claim 11, wherein <= 1).
ことを特徴とする請求項1記載の信号探索プログラム。 The signal search program according to claim 1, wherein the skip width calculation function causes the skip candidate position to be returned to the current position side when the maximum value exceeds a threshold value.
ことを特徴とする請求項11記載の信号探索プログラム。
The signal search program according to claim 11, wherein the search is performed for the entire range of the input signal sequence.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005355040A JP4469785B2 (en) | 2005-12-08 | 2005-12-08 | Signal search apparatus and method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005355040A JP4469785B2 (en) | 2005-12-08 | 2005-12-08 | Signal search apparatus and method |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2007157064A true JP2007157064A (en) | 2007-06-21 |
JP4469785B2 JP4469785B2 (en) | 2010-05-26 |
Family
ID=38241314
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005355040A Expired - Fee Related JP4469785B2 (en) | 2005-12-08 | 2005-12-08 | Signal search apparatus and method |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4469785B2 (en) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2010084712A1 (en) * | 2009-01-23 | 2010-07-29 | 日本電気株式会社 | Data retrieval device |
US8885870B2 (en) | 2010-09-14 | 2014-11-11 | Kabushiki Kaisha Toshiba | Information processing device and computer program product |
JP2014217030A (en) * | 2013-04-30 | 2014-11-17 | 日本電信電話株式会社 | Video reproduction device and video reproduction program |
-
2005
- 2005-12-08 JP JP2005355040A patent/JP4469785B2/en not_active Expired - Fee Related
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2010084712A1 (en) * | 2009-01-23 | 2010-07-29 | 日本電気株式会社 | Data retrieval device |
US8244739B2 (en) | 2009-01-23 | 2012-08-14 | Nec Corporation | Data retrieval device using a skip table |
KR101277419B1 (en) | 2009-01-23 | 2013-06-20 | 닛본 덴끼 가부시끼가이샤 | Data retrieval device |
US8885870B2 (en) | 2010-09-14 | 2014-11-11 | Kabushiki Kaisha Toshiba | Information processing device and computer program product |
JP2014217030A (en) * | 2013-04-30 | 2014-11-17 | 日本電信電話株式会社 | Video reproduction device and video reproduction program |
Also Published As
Publication number | Publication date |
---|---|
JP4469785B2 (en) | 2010-05-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Tan et al. | A framework for measuring video similarity and its application to video query by example | |
US9373054B2 (en) | Method for selecting frames from video sequences based on incremental improvement | |
US20060126942A1 (en) | Method of and apparatus for retrieving movie image | |
JP2005328105A (en) | Creation of visually representative video thumbnail | |
CN110443833A (en) | Method for tracing object and equipment | |
JP5380283B2 (en) | Template matching apparatus and method | |
US20060125956A1 (en) | Deinterlacing method and device in use of field variable partition type | |
JP5445467B2 (en) | Credit information section detection method, credit information section detection device, and credit information section detection program | |
US20150189193A1 (en) | Method and apparatus for video sequential alignment | |
KR102144975B1 (en) | Machine learning system and method for operating machine learning system | |
JP4469785B2 (en) | Signal search apparatus and method | |
EP3404652A1 (en) | Audio data processing method and terminal | |
CN113269086A (en) | Vilog editing method and system | |
JP2014110020A (en) | Image processor, image processing method and image processing program | |
KR102061413B1 (en) | Real-time stochastic pattern matching apparatus and method based on automata | |
JP5863180B2 (en) | Video analysis processing device, video analysis processing method, and video analysis processing program | |
US8244739B2 (en) | Data retrieval device using a skip table | |
JP2012033100A (en) | Image processing device and method and computer program | |
JP2008134706A (en) | Data stream monitoring device, data stream monitoring method, its program and recording medium | |
JP4167245B2 (en) | Digital video processing method and apparatus | |
JP2000341631A (en) | Method and device for retrieving video and storage medium recording video retrieval program | |
JP5026152B2 (en) | Dissolve detection device and program | |
JP2008065265A (en) | Signal dividing device and method | |
Tiburzi et al. | Camera motion analysis in on-line MPEG sequences | |
JP5204716B2 (en) | Video search device and video search program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20090803 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090818 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20091016 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20100202 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20100301 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130305 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130305 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140305 Year of fee payment: 4 |
|
LAPS | Cancellation because of no payment of annual fees |