JP4394083B2 - Signal detection apparatus, signal detection method, signal detection program, and recording medium - Google Patents

Signal detection apparatus, signal detection method, signal detection program, and recording medium Download PDF

Info

Publication number
JP4394083B2
JP4394083B2 JP2006093467A JP2006093467A JP4394083B2 JP 4394083 B2 JP4394083 B2 JP 4394083B2 JP 2006093467 A JP2006093467 A JP 2006093467A JP 2006093467 A JP2006093467 A JP 2006093467A JP 4394083 B2 JP4394083 B2 JP 4394083B2
Authority
JP
Japan
Prior art keywords
signal
search
accumulated
database
search key
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2006093467A
Other languages
Japanese (ja)
Other versions
JP2007271650A (en
Inventor
邦夫 柏野
秀尚 永野
淳司 大和
哲彰 鎌田
具英 山本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2006093467A priority Critical patent/JP4394083B2/en
Publication of JP2007271650A publication Critical patent/JP2007271650A/en
Application granted granted Critical
Publication of JP4394083B2 publication Critical patent/JP4394083B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

<P>PROBLEM TO BE SOLVED: To provide a signal detection apparatus for detecting a signal at high speed, in which a search signal is extracted from an input signal at coarse spacing, and a similar signal with the search signal is selected from an accumulated signal DB (data base) by the small number of search signals, and by the DB which collects this, the similar signal is searched with the search signal extracted from the input signal at dense spacing. <P>SOLUTION: The signal detection apparatus of the invention comprises: the accumulated signal DB for registering an accumulated signal; an upper search signal extraction section for extracting an upper search signal from a plurality of places of the input signal; an upper search section for searching the accumulated signal in which a similar period is included in the upper search signal is searched from the accumulated signal DB; a lower accumulated signal DB creation section for creating the lower accumulated signal DB in which the accumulated signal in the last search is collected; a lower search signal extraction section for extracting the lower search key signal from the plurality of places of the input signal; and the lower search section for searching the accumulated signal in which the similar period is included in the lower search signal. Therefore, searching is performed according to the number of stages. <P>COPYRIGHT: (C)2008,JPO&amp;INPIT

Description

本発明は、入力される入力信号に類似の信号を探索する信号探索技術に係わり、特に、信号が蓄積されている蓄積信号データベースから、入力信号から抽出した検索用キー信号に類似する信号を含む区間を検出(信号検出)する信号検出装置、信号検出方法、信号検出プログラム及び記録媒体に関する。
例えば、上記信号探索技術は、テレビ放送において使われた音楽やビデオクリップの検出およびリスト作成、またはラジオ放送において使われた音楽の検出およびリスト作成に利用される。
The present invention relates to a signal search technique for searching for a signal similar to an input signal to be input, and particularly includes a signal similar to a search key signal extracted from an input signal from a stored signal database in which the signal is stored. The present invention relates to a signal detection device, a signal detection method, a signal detection program, and a recording medium that detect a section (signal detection).
For example, the signal search technique is used for detection and list creation of music and video clips used in television broadcasting, or music detection and list creation used in radio broadcasting.

従来の上記信号探索技術としては、ある特定の信号(以下、参照信号とする)が与えられたとき、データベースに蓄積された複数の信号(以下、蓄積信号とする)から、参照信号が含まれる区間を検出する方法が用いられている。この検出方法として、時系列アクティブ探索法(例えば、特許文献1参照、TAS)、分割一致探索法(例えば、特許文献2参照、DAL−1)、より高速な分割一致探索法(例えば、特許文献3参照、DAL−2)、バイナリエリア照合法(例えば、特許文献4、BAM)が提案されている。   As the conventional signal search technique, when a specific signal (hereinafter referred to as a reference signal) is given, a reference signal is included from a plurality of signals stored in a database (hereinafter referred to as a stored signal). A method of detecting an interval is used. As this detection method, a time-series active search method (for example, see Patent Document 1, TAS), a division match search method (for example, see Patent Document 2, DAL-1), a faster division match search method (for example, Patent Document 1) 3, DAL-2), a binary area matching method (for example, Patent Document 4, BAM) has been proposed.

そして、複数の蓄積信号が登録された蓄積信号データベースを有した探索装置に対して、入力信号が与えられると、入力信号から探索用キー信号を順次切り出し、この切り出した探索用キー信号を参照信号として、上記蓄積信号データベースの蓄積信号中のある区間に類似した区間を有する蓄積信号を探索する。これにより、蓄積信号データベースに登録されている蓄積信号が入力信号の探索用キー信号を切り出した箇所にて使われていた場合に、この蓄積信号が入力信号の探索用キー信号を切り出した箇所で使われているとして検出することができる。   When an input signal is given to a search device having an accumulated signal database in which a plurality of accumulated signals are registered, search key signals are sequentially cut out from the input signals, and the cut-out search key signals are referred to as reference signals. As described above, an accumulated signal having a section similar to a certain section in the accumulated signal in the accumulated signal database is searched. As a result, when the accumulated signal registered in the accumulated signal database is used at the location where the search key signal for the input signal is cut out, the accumulated signal is used at the location where the search key signal for the input signal is cut out. It can be detected as being used.

上述したように、例えば、入力信号をテレビ放送の音声信号とし、この入力信号から5秒の長さの探索用キー信号を、1秒ずらしながら順次切り出し、切り出された各探索用キー信号に含まれる音楽を、音楽音響信号を蓄積信号とする蓄積信号データベースから探索する。この探索結果により、蓄積信号データベースに登録されている音楽が入力信号のどの時刻からどの時刻まで使われていたかを示すプレイリストを作成することができる。また、映像信号を用いることにより、上述した音楽の場合と同様な処理により映像コンテンツのプレイリストを作成することもできる。
なお、プレイリストの時刻情報の細かさは、探索用キー信号の切り出し間隔に依存し、探索用キー信号の切り出し間隔が細かいほど、プレイリストの時刻情報も細かく検出することができる。
特許第3065314号 特開2004−102023号公報 WO2006/004050 WO2006/006528
As described above, for example, an input signal is an audio signal for television broadcasting, and a search key signal having a length of 5 seconds is sequentially extracted from the input signal while being shifted by 1 second, and is included in each extracted search key signal. The stored music is searched from a stored signal database using a music acoustic signal as a stored signal. As a result of this search, it is possible to create a playlist indicating from which time of the input signal the music registered in the stored signal database was used. In addition, by using the video signal, it is possible to create a video content playlist by the same processing as in the case of the music described above.
Note that the fineness of the time information of the playlist depends on the search key signal cut-out interval, and the finer the search key signal cut-out interval, the finer the playlist time information can be detected.
Japanese Patent No. 30653314 JP 2004-102023 A WO2006 / 004050 WO2006 / 006528

従来、上述したように信号検出を行い、音楽コンテンツや映像コンテンツなどのプレイリストを作成することが考えられる。
しかしながら、上記従来例においては、探索用キー信号の切り出し間隔が小さくなればなるほど、探索用キー信号の個数が増加、すなわち探索用キーを用いた探索処理を行う回数が増加する。
この結果、従来例においては、プレイリストの時刻情報も細かく検出しようとする際、探索用キー信号の切り出し間隔を小さくするため、信号検出に時間がかかるという問題点があった。
Conventionally, it is conceivable to perform signal detection as described above and create a playlist such as music content or video content.
However, in the above conventional example, as the search key signal cut-out interval decreases, the number of search key signals increases, that is, the number of times search processing using the search key increases.
As a result, in the conventional example, when the time information of the playlist is to be detected in detail, there is a problem that it takes a long time to detect the signal in order to reduce the cut-out interval of the search key signal.

また、同様に、従来例においては、蓄積信号データベースに登録されている蓄積信号の数が増加するに従い、各探索用キー信号について、類似する信号の蓄積信号データベースからの探索に要するするのにかかる時間が増加し、信号検出に必要な時間が増大する問題点があった。
本発明は、このような事情に鑑みてなされたものであり、粗い間隔で探索用キー信号を入力信号から切り出し、少ない数の探索用キー信号で蓄積信号データベースから各探索用キー信号に類似する蓄積信号を選び、これらの少数の蓄積信号を集めたデータベースから、密な間隔で入力信号から切り出した探索用キー信号について類似する信号を探索することで、信号検出をより高速に行う信号検出装置、信号検出方法、信号検出プログラム及び記録媒体を提供することを目的としている.
Similarly, in the conventional example, as the number of accumulated signals registered in the accumulated signal database increases, it takes for each search key signal to be searched from the accumulated signal database for similar signals. There is a problem that the time increases and the time required for signal detection increases.
The present invention has been made in view of such circumstances, and the search key signal is cut out from the input signal at rough intervals, and is similar to each search key signal from the stored signal database with a small number of search key signals. A signal detection device that performs signal detection at a higher speed by selecting a stored signal and searching for a similar signal with respect to a search key signal extracted from the input signal at close intervals from a database in which these small number of stored signals are collected. An object of the present invention is to provide a signal detection method, a signal detection program, and a recording medium.

本発明の信号検出装置は、入力信号の所定の区間と、予め登録されている蓄積信号の一部または全部とを比較し、前記入力信号に類似する蓄積信号を複数の探索段階にて検出していく信号検出装置であって、蓄積信号を登録した蓄積信号データベースと、
上位探索キー信号を、予め定められた間隔にて前記入力信号から切り出す上位探索キー信号切り出し部と、前記上位探索キー信号に類似する区間を含む蓄積信号を、前記蓄積信号データベースから探索し、探索された蓄積信号を出力する上位探索部と、
前記上位探索部が出力した蓄積信号を集めた下位蓄積信号データベースを作成する下位蓄積信号データベース作成部と、下位探索キー信号を、前記上位探索キー信号切り出し部における間隔よりも狭い間隔にて、前記入力信号のうち前記上位探索部にて類似する区間を含む蓄積信号が探索された上位探索キー信号の切り出し箇所の近傍の領域のみから切り出す下位探索キー信号切り出し部と、前記下位探索キー信号に類似する区間を含む蓄積信号を、前記下位蓄積信号データベースから探索する下位探索部とを備えることを特徴とする。
The signal detection apparatus according to the present invention compares a predetermined section of an input signal with a part or all of the stored signals registered in advance, and detects a stored signal similar to the input signal at a plurality of search stages. An accumulated signal database in which accumulated signals are registered,
An upper search key signal cutout unit that cuts out an upper search key signal from the input signal at predetermined intervals, and an accumulation signal including a section similar to the upper search key signal is searched from the accumulated signal database and searched. A high-order search unit that outputs the stored signal that has been stored;
And the lower accumulation signal database creation unit that creates a lower accumulation signal database a collection of accumulated signals the upper search unit has output, the lower search key signal at intervals narrower than the spacing in the upper search key signal extracting unit, wherein Similar to the lower search key signal, and a lower search key signal cutout unit that cuts out only from a region in the vicinity of the cutout location of the upper search key signal in which the stored signal including a similar section is searched for in the upper search unit in the input signal A low-order search unit that searches the low-order stored signal database for an accumulated signal including a section to be stored.

本発明の信号検出方法は、入力信号の所定の区間と、蓄積信号データベースに予め登録されている蓄積信号の区間とを比較し、前記入力信号に類似する蓄積信号を複数の探索段階にて検出していく信号検出方法であって、前記複数の探索段階は、1つの粗探索段階と前記粗探索段階に引き続いて順番に実行される1以上の密探索段階とからなり、前記粗探索段階は、上位探索キー信号切り出し部が上位探索キー信号を、予め定められた間隔にて前記入力信号の複数箇所から切り出す上位探索キー信号切り出し過程と、上位探索部が前記上位探索キー信号に類似する区間を含む蓄積信号を、前記蓄積信号データベースから探索し、探索された蓄積信号を出力する上位探索過程と、を含み、前記密探索段階は、下位蓄積信号データベース作成部が当該密探索段階の直前に実行された探索段階の探索により探索された蓄積信号を集めた下位蓄積信号データベースを作成する下位蓄積信号データベース作成過程と、下位探索キー信号切り出し部が下位検索キー信号を、前記入力信号のうち、直前に実行された探索段階が粗探索段階であれば、前記粗探索段階にて類似する区間を含む蓄積信号が探索された上位探索キー信号の切り出し箇所の近傍の領域のみから、また直前に実行された探索段階が密探索段階であれば、前記直前の密探索段階にて類似する区間を含む蓄積信号が探索された下位探索キー信号の切り出し箇所の近傍の領域のみから、当該密探索段階の直前に実行された探索段階における信号の切り出し間隔よりも狭い間隔にて切り出す下位探索キー信号切り出し過程と、下位探索部が前記下位探索キー信号に類似する区間を含む蓄積信号を、前記下位蓄積信号データベースから探索する下位探索過程と
を含むことを特徴とする。
The signal detection method of the present invention compares a predetermined interval of an input signal with an interval of an accumulated signal registered in advance in an accumulated signal database, and detects accumulated signals similar to the input signal in a plurality of search stages. The plurality of search stages include one coarse search stage and one or more dense search stages that are sequentially executed following the coarse search stage. The coarse search stage includes: An upper search key signal cutout process in which the upper search key signal cutout section cuts out the upper search key signal from a plurality of locations of the input signal at predetermined intervals, and a section in which the upper search section is similar to the upper search key signal accumulation signal including said searched from stored signal database, wherein the upper search process for outputting the searched stored signal, wherein the dense search step, portion creates lower accumulation signal database And the lower accumulation signal database creation process of creating a lower accumulation signal database a collection of accumulated signals searched by the search for search stage that is performed immediately before said seal search stage, the lower search key signal extracting unit is lower search key signal If, in the input signal, the search stage executed immediately before is a coarse search stage, an area in the vicinity of the cut-out location of the upper search key signal in which the stored signal including a similar section is searched in the coarse search stage Only if the search stage executed immediately before is a dense search stage, only the region in the vicinity of the cut-out position of the lower search key signal in which the accumulated signal including the similar section was searched in the previous dense search stage is searched. from a lower search key signal clipping process of cutting out at the dense search stage narrower than cut interval of the signal in the executed search stage just before the lower search And lower search process but the stored signal comprising a section similar to the lower search key signal, searches from the lower accumulation signal database
It is characterized by including .

本発明のプログラムは、上記記載の信号検出装置として、コンピュータを機能させるための信号検出プログラムである。 Program of the present invention, as signal detection device described above, a signal detection program for causing a computer to function.

本発明の記録媒体は、上記プログラムを記録したコンピュータ読み取り可能な記録媒体である。   The recording medium of the present invention is a computer-readable recording medium on which the above program is recorded.

以上説明したように、本発明によれば、段階的に、粗から密に探索キーの切り出しを行うため、網羅的に探索キー信号を切り出す処理を行う処理を行う従来の方法に比較して、より少ない個数の上位段階の探索キー信号を用いて蓄積信号データベースから類似する信号の探索を行うことができ、途中の段階において、蓄積信号データベースから抽出された蓄積信号により、蓄積信号データベースの蓄積信号の中から、より密に入力信号から切り出した下位の探索段階における探索キー信号に類似する区間を有する蓄積信号を抽出し、この抽出された蓄積信号により下位蓄積信号データベース(実施形態における密探索用蓄積信号データベース)を生成し、蓄積信号データベーススよりも登録されている蓄積信号数の少ない下位蓄積信号データベースから、別途切り出された探索用キー信号に類似する蓄積信号を探索することによって、より蓄積信号の数の少ないデータベースからの検索処理となるため、従来の方法に比較して、より高速な信号検出処理を行うことができるという利点がある。   As described above, according to the present invention, in order to cut out the search key from coarse to dense step by step, compared to the conventional method that performs processing to cut out the search key signal comprehensively, It is possible to search for similar signals from the stored signal database using a smaller number of search key signals in the upper stage, and in the middle stage, the stored signals extracted from the stored signal database can be used to store the stored signals in the stored signal database. From the input signal, a stored signal having a section similar to the search key signal in the lower search stage is extracted, and the lower stored signal database (for the dense search in the embodiment) is extracted from the extracted stored signal. Low-order accumulated signal data with a smaller number of accumulated signals than the accumulated signal database. By searching for a stored signal similar to the search key signal separately cut out from the database, search processing is performed from a database with a smaller number of stored signals, which is faster than the conventional method. There is an advantage that signal detection processing can be performed.

また、本発明(第2の実施形態)によれば、上位の探索段階(一次探索)において、蓄積信号と比較する際、入力信号から切り出す上位探索段階用の上位探索キー信号のずらし幅を大きくすることにより、蓄積用データベースに格納された蓄積信号と比較する上位探索キーの数を削減することができ、より高速に類似する区間のある蓄積信号を探索することが可能である。
また、本発明(第2の実施形態)によれば、下位の探索段階(二次探索)において、リストアップされた、上記上位の探索段階にて探索した蓄積信号を識別する情報を用い、下位蓄積信号データベースに格納する蓄積信号(第2の実施形態における楽曲)を絞りこむことができ、探索する下位探索用キー信号と比較す蓄積信号が少なくなり、抽出したい蓄積信号を、従来に比較して高速に探索することが可能である。
Further, according to the present invention (second embodiment), in the upper search stage (primary search), when compared with the accumulated signal, the shift width of the upper search key signal for the upper search stage cut out from the input signal is increased. By doing so, it is possible to reduce the number of upper search keys to be compared with the accumulated signal stored in the accumulation database, and it is possible to search for accumulated signals having similar sections at higher speed.
Further, according to the present invention (second embodiment), in the lower search stage (secondary search), the information that identifies the accumulated signal searched in the upper search stage listed is used, accumulation signal to be stored in the storage signal database can narrow down (music in the second embodiment), the stored signal that compares with the lower search key signal for searching is reduced, the stored signal to be extracted, compared with the conventional It is possible to search at high speed.

また、本発明(第2の実施形態)によれば、上位の検索段階(一次探索)において、探索用キー信号の蓄積信号に対するずらし幅が大きいため、使用された探索用キー信号信号(楽曲)が、蓄積データベースに格納された蓄積信号(楽曲)の正確な区間(何秒目から何秒目まで)にて使用されたのかを求められないが、下位の探索段階(二次探索)において、細かいずらし幅による探索を行い、使用された探索用キー信号の区間に対応する蓄積信号の区間を、細かい情報、すなわち高い時間精度にて検出することができるという利点がある。   Further, according to the present invention (second embodiment), the search key signal signal (musical piece) used is large because the shift amount of the search key signal with respect to the accumulated signal is large in the upper search stage (primary search). Is not used in the exact interval (from what second to what second) of the accumulated signal (music) stored in the accumulated database, but in the lower search stage (secondary search), There is an advantage that a search with a fine shift width can be performed, and the interval of the accumulated signal corresponding to the interval of the used search key signal can be detected with fine information, that is, with high time accuracy.

本発明は、複数の段階にて徐々に、蓄積情報データベースから、入力信号に類似する区間を有する蓄積信号の検索において、検出精度の高い蓄積信号の検索を行うものであり、上位の段階において粗い間隔で探索キー信号(例えば、実施形態においては粗探索用探索キー信号)を入力信号から切り出し、少ない数の探索キー信号で蓄積信号データベース(例えば、実施形態においては蓄積信号データベース)から、各探索用キー信号に類似する蓄積信号を選び、選択された蓄積信号により下位の探索部の用いる、上位段階より少数の蓄積信号を集めた下位のデータベースを作成し、この下位データベースから、上位段階に比較して密な間隔で入力信号から切り出した下位探索キー信号(例えば、実施形態においては密探索用探索キー信号)を用いて、下位の探索段階用のデータベース(例えば、実施形態においては密探索用蓄積信号データベース)から類似する信号を探索する。   The present invention gradually searches for accumulated signals having a high detection accuracy in retrieval of accumulated signals having sections similar to the input signal from the accumulated information database in a plurality of stages, and is coarse in the upper level. A search key signal (for example, a search key signal for coarse search in the embodiment) is cut out from the input signal at intervals, and each search is performed from an accumulated signal database (for example, an accumulated signal database in the embodiment) with a small number of search key signals. Select a stored signal that is similar to the key signal for use, and use the selected stored signal to create a lower database that collects a smaller number of stored signals than the higher level used by the lower search unit, and compare this lower database to the higher level. Then, a lower search key signal (for example, a search key signal for fine search in the embodiment) cut out from the input signal at a dense interval is used. There are, databases for backward search stage (e.g., in embodiments dense search accumulation signal database) searches for a signal similar from.

このように、下位の探索段階を複数回にて行うことにより、高い時間精度による類似した信号の検出を、検索回数を減少させて行うことができるため、初めから密な間隔で切り出した探索用キー信号を用いる場合に比較して、より高速に検出処理を行うことができる。
すなわち、本発明は、予め複数の蓄積信号が登録された蓄積信号データベースがあり、探索の目的信号である入力信号が入力されると、上記入力信号から切り出した区間(探索キー信号)の信号に、上記蓄積信号のある区間に類似する信号が含まれているか否かを、入力信号を切り出した区間毎に探索を行う。このとき、本発明は、探索段階毎に入力信号からの区間のずらし幅を小さくしつつ区間を分割し、複数段階により、検索対象となる蓄積信号を除々に絞り込み、検出精度の高い入力信号に類似した蓄積信号の検出処理を高速に行う。
ここで、各段階の探索は、入力信号の所定の区間と、予め登録されている蓄積信号の一部または全部とを比較して行われる。
以下、本発明の実施形態による信号検出装置を図面を参照して説明する。
In this way, by performing the low-order search stage multiple times, similar signals can be detected with high time accuracy by reducing the number of searches. The detection process can be performed at a higher speed than when the key signal is used.
That is, according to the present invention, there is an accumulated signal database in which a plurality of accumulated signals are registered in advance. Whether or not a signal similar to a certain section of the accumulated signal is included is searched for each section in which the input signal is cut out. At this time, the present invention divides the section while reducing the shift width of the section from the input signal for each search stage, and gradually narrows down the accumulated signals to be searched in a plurality of stages to obtain an input signal with high detection accuracy. A similar accumulated signal detection process is performed at high speed.
Here, the search at each stage is performed by comparing a predetermined section of the input signal with a part or all of the stored signals registered in advance.
Hereinafter, a signal detection device according to an embodiment of the present invention will be described with reference to the drawings.

<第1の実施形態>
図1は第1の実施形態の構成例を示すブロック図である。この図1に示す第1の実施形態による信号検出装置は、複数の段階での信号検出を、粗探索及び密探索の2段階にて説明を行うが、すでに述べたように、最上位段階と、2つ以上の下位段階、すなわち3段階以上にても同様の処理にて、信号の検出処理が行えることは言うまでもない。図1の信号検出装置は、粗探索用探索キー信号切り出し部101(上位探索キー信号切り出し部),粗探索部(上位探索部)102,密探索用蓄積信号データベース作成部(下位蓄積信号蓄積信号データベース作成部)103,密探索用探索キー信号切り出し部104(下位探索キー信号切り出し部),密探索部105(下位探索部),蓄積信号データベース111及び密探索用蓄積信号データベース112(下位蓄積信号データベース)を有している。
<First Embodiment>
FIG. 1 is a block diagram showing a configuration example of the first embodiment. In the signal detection apparatus according to the first embodiment shown in FIG. 1, signal detection in a plurality of stages is described in two stages of a coarse search and a fine search. It goes without saying that the signal detection process can be performed in the same process even in two or more sub-stages, that is, three or more stages. 1 includes a rough search search key signal cutout unit 101 (upper search key signal cutout unit), a coarse search unit (upper search unit) 102, a dense search accumulated signal database creation unit (lower accumulated signal accumulated signal). Database creation unit) 103, search key signal cutout unit for fine search 104 (lower search key signal cutout unit), fine search unit 105 (lower search unit), accumulated signal database 111, and accumulated signal database for fine search 112 (lower accumulated signal) Database).

蓄積信号データベース111には、予め複数の蓄積信号としての音響信号または映像信号が、それぞれを特定する識別情報とともに登録されている。
粗探索用探索キー信号切り出し部101は、外部から入力される入力信号の複数箇所から、それぞれ粗探索用探索キー信号を切り出す。
粗探索部102は、上記粗探索用探索キー信号に類似する区間を含む蓄積信号を、上記蓄積信号データベース111から探索し、探索された蓄積信号を密探索用の蓄積信号として、この蓄積信号を特定する識別情報を下位段階の密探索用蓄積信号データベース作成部103へ出力する。
密探索用蓄積信号データベース作成部103は、粗探索部102が出力する密探索用の蓄積信号を集めて、識別番号に対応してこの蓄積信号をデータベースに登録して、密探索用蓄積信号データベース112を生成する。
In the accumulated signal database 111, acoustic signals or video signals as a plurality of accumulated signals are registered in advance together with identification information for specifying each.
The coarse search search key signal cutout unit 101 cuts out a coarse search search key signal from a plurality of locations of an input signal input from the outside.
The coarse search unit 102 searches the accumulated signal database 111 for an accumulated signal including a section similar to the coarse search key signal, and uses the accumulated signal thus searched as an accumulated signal for fine search. The identification information to be specified is output to the dense search accumulated signal database creation unit 103 at the lower stage.
The fine search accumulated signal database creation unit 103 collects the fine search accumulated signals output from the coarse search unit 102, registers the accumulated signals in the database in correspondence with the identification numbers, and performs the fine search accumulated signal database. 112 is generated.

密探索用探索キー信号切り出し部104は、外部から入力される参照信号としての入力信号の複数箇所から、それぞれ密探索用探索キー信号を切り出す。ここで、粗探索用探索キー信号の切り出し間隔は、密探索用探索キー信号の切り出し間隔に比較して大きい(切り出しのずらし幅が長い)。また、粗探索用探索キー信号切り出し部101は、粗探索用探索キー信号を、時間的に間引いた切り出し箇所から、順次切り出すようにしても良い。
密粗探索部105は、上記密探索用探索キー信号に類似する区間を有する蓄積信号を、密探索用蓄積信号データベース112から探索し、探索結果を出力する。この探索結果により、密探索用探索キーが切り出された箇所において、この密探索用探索キー信号に類似する蓄積信号が、切り出された箇所にて入力信号に含まれていることが検出される。
The fine search search key signal cutout unit 104 cuts out a fine search search key signal from a plurality of locations of an input signal as a reference signal input from the outside. Here, the cut-out interval of the search key signal for coarse search is larger than the cut-out interval of the search key signal for fine search (the cut-out shift width is long). Further, the coarse search search key signal cutout unit 101 may sequentially cut out the coarse search search key signal from cutout portions that are thinned out in time.
The dense coarse search unit 105 searches the dense search accumulated signal database 112 for an accumulated signal having a section similar to the fine search search key signal, and outputs a search result. From this search result, it is detected that the accumulated signal similar to the search key signal for fine search is included in the input signal at the extracted location at the location where the search key for fine search is extracted.

本発明の第1の実施形態においては、入力信号と蓄積信号として音響信号を一例として説明する。
以下、図1及び図2を用いて、本第1の実施形態による信号検出装置の動作を説明する。図2は、第1の実施形態による信号検出装置の動作例を示すフローチャートである。
まず、粗探索用探索キー信号切り出し部101は、外部機器から入力信号を入力し、指定されたずらし幅(例えば、ユーザにより設定あるいは予め設定されている粗探索用探索キー信号のずらし幅であり、後述する特徴ベクトルの符号列である場合、特徴ベクトル単位で設定)と、探索キー信号長(例えば、ユーザにより設定あるいは予め設定されている粗探索用探索キー信号長であり、後述する特徴ベクトルの符号列である場合、特徴ベクトル単位で設定)とにより、粗探索用探索キー信号を、入力した入力信号から順次切り出し、切り出した粗探索用探索キー信号を、粗探索装置102に対して出力する(ステップS101)。
In the first embodiment of the present invention, an acoustic signal is described as an example of the input signal and the accumulated signal.
Hereinafter, the operation of the signal detection apparatus according to the first embodiment will be described with reference to FIGS. 1 and 2. FIG. 2 is a flowchart showing an operation example of the signal detection apparatus according to the first embodiment.
First, the coarse search search key signal cutout unit 101 receives an input signal from an external device, and designates a specified shift width (for example, a shift width of a rough search search key signal set or preset by the user). In the case of a feature vector code string to be described later, the search key signal length (for example, a search key signal length for coarse search set or set in advance by the user) In the case of a code string of (2), the search key signal for coarse search is sequentially cut out from the inputted input signal, and the search key signal for coarse search is output to the coarse search device 102. (Step S101).

次に、粗探索部102は、粗探索用探索キー信号切り出し部101から入力された各粗探索用探索キー信号について、粗探索用探索キー信号毎に、類似する蓄積信号を、DAL−2の探索方法(後述)により、蓄積信号データベース111から探索する。
そして、粗探索部102は、粗探索用探索キー信号と蓄積信号の区間との類似度が、予め設定したしきい値より大きいことを検出すると、その区間を含む蓄積信号を一端選択し、この選択された蓄積信号のなかで、上記類似度が上位N件となる蓄積信号の識別番号(蓄積信号を特定する情報)を密探索用蓄積信号データベース作成装置103へ出力する(ステップS102)。
Next, for each of the coarse search search key signals input from the coarse search search key signal cutout unit 101, the coarse search unit 102 obtains a similar accumulated signal for each coarse search key signal in the DAL-2. The stored signal database 111 is searched by a search method (described later).
When the rough search unit 102 detects that the similarity between the search key signal for coarse search and the interval of the accumulated signal is larger than a preset threshold value, the coarse search unit 102 selects one of the accumulated signals including the interval, Among the selected accumulated signals, the identification number (information for identifying the accumulated signal) of the accumulated signal having the top N similarities is output to the dense search accumulated signal database creating apparatus 103 (step S102).

次に、密探索用蓄積信号データベース作成装置103は、粗探索装置102から入力された上記識別情報により、蓄積信号データベース111を検索し、この識別情報に対応する蓄積信号を蓄積信号データベース111から読み出し、この読み出した蓄積信号を密探索用蓄積信号データベース112へ登録し、粗探索用探索キー信号と類似する区間を有し、その類似度が予め設定された閾値を超えるN個の蓄積信号からなるデータベースを作成する。例えば、蓄積信号データベース111に3N個の蓄積信号が登録されていたとすると、密探索にて探索する蓄積信号数がN個となり、探索対象が1/3の量に絞り込まれ、時間精度の高い細かな探索を効果的に適用することができる。そして、密探索用蓄積信号データベース作成装置103は、密探索用蓄積信号データベース112の作成が完了すると、密探索用蓄積信号データベース作成完了通知を密探索用探索キー信号切り出し装置104に対して出力する(ステップS103)。   Next, the dense search accumulated signal database creation device 103 searches the accumulated signal database 111 based on the identification information input from the coarse search device 102 and reads the accumulated signal corresponding to the identification information from the accumulated signal database 111. The read accumulation signal is registered in the fine search accumulation signal database 112, and has a section similar to the coarse search search key signal, and is composed of N accumulation signals whose similarity exceeds a preset threshold value. Create a database. For example, if 3N accumulated signals are registered in the accumulated signal database 111, the number of accumulated signals to be searched in the dense search is N, and the search target is narrowed down to 1/3, and the time accuracy is fine. Effective search can be applied effectively. When the fine search accumulation signal database creation device 103 completes the creation of the fine search accumulation signal database 112, the fine search accumulation signal database creation completion output to the fine search search key signal extraction device 104 is output. (Step S103).

密探索用探索キー信号切り出し装置104は、密探索用蓄積信号データベース作成装置103から密探索用蓄積信号データベース作成完了通知が入力されると、指定されたずらし幅(例えば、ユーザにより設定、または予め設定されている密探索用探索キー信号ずらし幅、ビット単位)と、密探索用探索キー信号長(例えば、ユーザにより設定、または予め設定されている密探索用探索キー信号長)により、密探索用探索キー信号を入力信号から順次切り出し、切り出した密探索用探索キー信号を、順次、密探索装置105へ出力する(ステップS104)。   When a fine search accumulation signal database creation completion notification is input from the fine search accumulation signal database creation apparatus 103, the fine search search key signal extraction apparatus 104 receives a specified shift width (for example, set by a user or previously set). The fine search is performed based on the fine search search key signal shift width (in units of bits) and the fine search search key signal length (for example, a fine search search key signal length set or set in advance by the user). The search key signal for search is sequentially cut out from the input signal, and the search key signal for fine search cut out is sequentially output to the fine search device 105 (step S104).

次に、密探索部105は、密探索用探索キー信号切り出し部104から入力された各密探索用探索キー信号毎に、密探索用蓄積信号データベース112に登録されているN個の蓄積信号各々との比較を行う。ここで、密探索部105は、密探索用蓄積信号データベース112から蓄積信号を読み出し、上記密探索用探索キー信号を、読み出した蓄積信号に対して、予め設定されたずらし幅により、移動させつつ、密探索用探索キー信号と類似する区間を有する蓄積信号の探索を行う。そして、密探索部105は、各密探索用探索キー信号について、予め設定された閾値を超える類似度の区間を有する蓄積信号が検出された場合、入力信号におけるこの密探索用探索キー信号の切り出し箇所に、検出された蓄積信号における類似する区間と同じ信号が含まれていることを検出し、その蓄積信号及び類似した区間を検出結果として出力する(ステップS105)。
ここで、密探索の類似度の閾値としては、必ずしも粗探索の段階と同一である必要はなく、粗探索の段階よりも高い類似度値または低い類似度値を設定することができる。特に、高い類似度値を閾値として設定することにより、粗探索すなわち候補となる楽曲の選定時よりも、確実に高い類似性を有する蓄積信号を検出するという実用的な効果が期待できる。
Next, for each fine search search key signal input from the fine search search key signal cutout unit 104, the fine search unit 105 stores each of the N accumulation signals registered in the fine search accumulation signal database 112. Compare with. Here, the fine search unit 105 reads the accumulation signal from the fine search accumulation signal database 112, and moves the fine search search key signal with respect to the read accumulation signal by a preset shift width. The stored signal having a section similar to the search key signal for fine search is searched. When a search signal having a similarity level exceeding a preset threshold is detected for each search key signal for fine search, the fine search unit 105 extracts the search key signal for fine search from the input signal. It is detected that the same signal as a similar section in the detected accumulated signal is included in the location, and the accumulated signal and the similar section are output as a detection result (step S105).
Here, the threshold value of the similarity in the dense search is not necessarily the same as that in the coarse search stage, and a higher similarity value or a lower similarity value than in the coarse search stage can be set. In particular, by setting a high similarity value as a threshold value, it is possible to expect a practical effect of reliably detecting a stored signal having high similarity as compared with a rough search, that is, selection of a candidate music piece.

上述したDAL−2の探索法については、特許文献2に記載されているが、本実施形態の動作を明確にするため、補足としてTAS及びDAL−1とともに、以下に概要の説明を行う。
TASは、音響信号及び映像信号を対象とした高速な探索方法である。目的信号(本実施形態の入力信号に対応)と蓄積信号(音響信号や映像信号)とから、それぞれ特徴ベクトルを時系列に抽出する。蓄積信号としては、予め特徴情報が抽出され、この特徴情報の形式により、後に述べるベクトル量子化による符号列として蓄積信号データベース111に登録されている。この特徴ベクトルとしては、音響信号の場合にはパワースペクトル、映像信号の場合はフレーム毎の色特徴ベクトルなどを使用することができる。
The search method of DAL-2 described above is described in Patent Document 2, but in order to clarify the operation of this embodiment, an outline will be described below together with TAS and DAL-1 as a supplement.
TAS is a high-speed search method for audio signals and video signals. Feature vectors are extracted in time series from the target signal (corresponding to the input signal of this embodiment) and the accumulated signal (acoustic signal or video signal), respectively. As the accumulated signal, feature information is extracted in advance, and is registered in the accumulated signal database 111 as a code string by vector quantization described later in the format of the feature information. As the feature vector, a power spectrum can be used in the case of an audio signal, and a color feature vector for each frame can be used in the case of a video signal.

次に、抽出した特徴ベクトルをベクトル量子化による符号列に変換する。この変換の後、目的信号と同じ長さの照合窓を蓄積信号に設定する。
そして、目的信号と照合窓内の蓄積信号の符号列に対して、符号毎の出現頻度を調べて、ヒストグラムを作成する。
上述したように作成した目的信号ヒストグラムと、蓄積信号ヒストグラムとの類似度を測定し、その測定された値が設定値以上であるか否かにより、目的信号が検出されたか否かの検出が行われる。この際の、類似度尺度としては、ヒストグラムの重なり率などを使用することが可能である。
Next, the extracted feature vector is converted into a code string by vector quantization. After this conversion, a collation window having the same length as the target signal is set as the accumulated signal.
Then, the appearance frequency for each code is examined for the target signal and the code string of the accumulated signal in the verification window, and a histogram is created.
The degree of similarity between the target signal histogram created as described above and the stored signal histogram is measured, and whether or not the target signal has been detected is determined based on whether or not the measured value is equal to or greater than a set value. Is called. In this case, as a similarity measure, it is possible to use a histogram overlap rate or the like.

上述した類似度の検出処理を、蓄積信号上における照合窓の位置を順次時間軸方向にずらしながら(本実施形態においては探索キー信号を蓄積信号に対してずらしていく)繰り返し行うこととなる。
なお、照合窓の位置をずらす際、必ずしも特徴ベクトル1個分ずつ行う必要がなく、現在の位置における類似度と、検出基準となる類似度の設定値とから、移動可能幅を求め、照合窓を一度に複数個分ずつずらすことも可能である。この移動可能幅は、最大何個の特徴ベクトルが入れ替わっても、類似度が設定値に達しないかとの観点から計算することができ、具体的な計算方法はすでに公知であるため省略する。
The above-described similarity detection process is repeatedly performed while sequentially shifting the position of the matching window on the accumulated signal in the time axis direction (in this embodiment, the search key signal is shifted with respect to the accumulated signal).
When the position of the matching window is shifted, it is not always necessary to perform one feature vector at a time. Instead, the movable width is obtained from the similarity at the current position and the set value of the similarity as a detection reference. It is also possible to shift several at a time. This movable width can be calculated from the viewpoint that the degree of similarity does not reach the set value no matter how many feature vectors are exchanged, and a specific calculation method is already known and will be omitted.

DAL−1は、ナレーションなど、主に線スペクトル構造を有する前景音が存在している場合にも、その背景に流れている音楽について探索を行うことを目的とする探索法である。目的信号(本実施形態の入力信号に対応)と蓄積信号とのそれぞれについて、音響スペクトルを時間及び周波数方向に、各々1以上の数に分割する。
次に、分割したそれぞれの小領域(入力信号においては探索キー信号)に関して、比較を行うことにより探索処理を行う。この時に用いる探索方法としては、上述したTASを用いることができる。そして、それぞれの小領域に対する探索結果を投票法により統合することにより、多くの小領域が高い類似度を有する箇所を特定して探索を行う。
DAL-1 is a search method for searching for music flowing in the background even when foreground sound mainly having a line spectrum structure such as narration exists. For each of the target signal (corresponding to the input signal of this embodiment) and the accumulated signal, the acoustic spectrum is divided into one or more numbers in the time and frequency directions.
Next, search processing is performed by comparing each divided small region (search key signal in the input signal). As a search method used at this time, the above-described TAS can be used. And the search result with respect to each small area | region is integrated by a voting method, The location which many small areas have a high similarity is specified, and it searches.

DAL−2は、上記DAL−1の小領域の照合法を変更したものである。すなわち、DAL−2は、DAL−1における小領域をベクトル量子化し、さらに量子化符号どうしの類似度をあらかじめ計算しておき、類似度テーブルを作成するとともに、各蓄積信号(データベースに登録されている)に対して、各量子化符号の出現位置を予め調べたテーブルを作成することを特徴としている。これらのテーブルを用いることにより、DAL−1に比較して、ほぼ同等の探索結果を、より高速に得ることができる。   DAL-2 is a modification of the DAL-1 small region verification method. That is, DAL-2 vector-quantizes a small area in DAL-1, calculates the similarity between quantized codes in advance, creates a similarity table, and stores each accumulated signal (registered in the database). In contrast, the present invention is characterized in that a table in which the appearance position of each quantization code is checked in advance is created. By using these tables, almost equivalent search results can be obtained at a higher speed than DAL-1.

次に、以下に、上述した第1の実施形態の信号検出装置による信号検出の実験結果に関し、図を参照して説明する。
本実験においては、実験用のある番組の音響信号を入力信号として用い、蓄積信号として音楽の音響信号を集めた蓄積信号データベース111を用意し、入力信号により使用された蓄積信号を検出する楽曲使用検出実験を行うとする。そして、この楽曲使用検出実験を、上記第1の実施形態の手法および従来手法各々を計算機上に実装したもので比較実験行い、各々の手法にて処理に要する時間と、検出精度とを、本発明及び従来例との間にて比較した。なお、実験用番組は、番組Aと番組Bとの2つを用意し、各番組に対して上記の楽曲使用検出実験を行った。
Next, the results of signal detection experiments performed by the signal detection apparatus according to the first embodiment described above will be described with reference to the drawings.
In this experiment, an acoustic signal of an experimental program is used as an input signal, and a stored signal database 111 that collects music acoustic signals as a stored signal is prepared, and the stored music used to detect the stored signal used by the input signal is used. Suppose that a detection experiment is performed. Then, this music use detection experiment was performed by comparing the method of the first embodiment and the conventional method on a computer, and the time required for processing by each method and the detection accuracy were calculated. Comparison was made between the invention and the conventional example. Two experimental programs, program A and program B, were prepared, and the above-described music use detection experiment was performed for each program.

このとき、本第1の実施形態において、粗探索部103は、各組探索用探索キー信号に対して、類似する区間を含む蓄積信号の中から、探索用探索キー信号及び蓄積信号の区間との類似度が、上位のもの3件を密探索用蓄積信号データベース作成部103へ出力するように構成した。
また、粗探索用探索キー信号切り出し部101は、粗探索用探索キー信号ずらし幅を5秒とし、粗探索用探索キー信号長を5秒として、入力信号からの粗探索用探索キー信号の切り出しを行い。密探索用探索キー信号切り出し部104は、密探索用探索キー信号ずらし幅を1秒とし、密探索用探索キー信号長は5秒として、入力信号からの密探索用探索キー信号の切り出しを行った。
At this time, in the first embodiment, the coarse search unit 103 selects the search key signal for search and the interval of the accumulation signal from the accumulation signals including similar intervals for each group search search key signal. The top three similarities are output to the dense search accumulated signal database creation unit 103.
The coarse search search key signal cutout unit 101 cuts out the coarse search search key signal from the input signal by setting the coarse search key signal shift width to 5 seconds and the coarse search search key signal length to 5 seconds. To do. The search key signal cutout unit 104 for fine search cuts out the search key signal for fine search from the input signal by setting the search key signal shift width for fine search to 1 second and the search key signal length for fine search to 5 seconds. It was.

そして、蓄積信号データベース111に登録されている蓄積信号から、入力信号のある区間に類似する区間を有する蓄積信号の探索における実験を行った。
また、密探索部105におけるDAL−2を用いた探索においては、密探索用探索キー信号の切り出しにおいて、粗探索部102におけるDAL−2による探索の2倍の個数の小領域への分割を行うとした。
一方、従来法であるが、これは、入力信号から5秒の長さの探索用探索キー信号を、1秒ずらしで切り出し、各探索用探索キー信号に類似する区間を含む蓄積信号を蓄積信号データベースから用いて探索し、その結果を出力することとした。
従来法におけるDAL−2のパラメータ設定は、上記第1の実施形態の粗探索部102のDAL−2のパラメータ設定と同様にした。
Then, an experiment was performed in searching for an accumulated signal having a section similar to a certain section of the input signal from the accumulated signals registered in the accumulated signal database 111.
Further, in the search using DAL-2 in the dense search unit 105, in the extraction of the search key signal for fine search, the search is divided into twice as many small regions as the search by the DAL-2 in the coarse search unit 102. It was.
On the other hand, in the conventional method, the search key signal for search having a length of 5 seconds is cut out from the input signal by shifting it by 1 second, and the stored signal including a section similar to each search key signal for search is stored as the stored signal. We searched from the database and decided to output the result.
The DAL-2 parameter setting in the conventional method is the same as the DAL-2 parameter setting of the coarse search unit 102 of the first embodiment.

上記実験結果を、図3及び図4の各テーブルに示す。図3のテーブルは、従来法の検出速度を1としたときの、第1の実施形態における検出速度を示した、検出速度の比較テーブルである。この図3のテーブルからは、第1の実施形態が従来法の4倍以上の速度にて、高速に、使用された楽曲(蓄積信号)の検出を、蓄積信号データベースから行えることがわかる。ここで、検出速度とは、入力信号が信号検出装置に入力されてから、プレイリスト(番組中の使用楽曲、すなわち検出された蓄積信号を特定するデータがリストアップされた表)が信号検出装置から出力されるまでの時間の逆数を、従来の方法(全ての蓄積信号に対して、本願発明の密探索用と同一の探索条件によって探索した場合)における入力信号を入力してから探索結果が出力されるまでの時間の逆数を基準とした比として表している。   The experimental results are shown in the tables in FIGS. The table of FIG. 3 is a detection speed comparison table showing the detection speed in the first embodiment when the detection speed of the conventional method is 1. From the table in FIG. 3, it can be seen that the first embodiment can detect the used music (accumulated signal) from the accumulated signal database at a speed four times faster than the conventional method. Here, the detection speed refers to a playlist (a table in which data for identifying the stored music used in the program, that is, the data to be detected) is listed after the input signal is input to the signal detection device. The search result after the input signal in the conventional method (when searching for all accumulated signals under the same search conditions as for the dense search of the present invention) is input to It is expressed as a ratio based on the reciprocal of the time until output.

次に、図4のテーブルは、従来法と第1の実施形態とによる検出精度を比較したテーブルである。
ここで、正答率は検出された楽曲のうち正しいものの割合であり、検出率は入力信号で使用され、かつ蓄積信号データベース111内に同じ蓄積信号がある楽曲の中から検出されたものの割合である。
そして、図4のテーブルには、従来法の正答率および検出率を1としたときの、第1の実施形態の提案法における検出率と正答率とが示されている。
Next, the table of FIG. 4 is a table comparing detection accuracy between the conventional method and the first embodiment.
Here, the correct answer rate is the proportion of the detected songs that are correct, and the detection rate is the proportion of the songs that are used in the input signal and that are detected from the songs that have the same accumulated signal in the accumulated signal database 111. .
And the table of FIG. 4 shows the detection rate and correct answer rate in the proposed method of the first embodiment when the correct answer rate and the detection rate of the conventional method are 1.

本発明の第1の実施形態は、従来法に比較して、検出精度が向上する場合と、検出精度が低下する場合とがある。すなわち、検出精度が向上する場合としては、蓄積信号データベース111に蓄積されている楽曲から、粗探索用探索キー信号により抽出して、密探索用蓄積信号データベース112に登録した楽曲が、比較する数として削減されたことにより、密探索部105における誤検出が減少することが考えられる。一方、検出精度が低下する場合としては、粗探索部102の探索漏れにより、使用されている楽曲が密探索用蓄積信号データベース112に登録する段階において、抜け落ちてしまっていることが考えられる。   In the first embodiment of the present invention, there are a case where the detection accuracy is improved and a case where the detection accuracy is lowered as compared with the conventional method. That is, as a case where the detection accuracy is improved, the number of music pieces extracted from the music stored in the accumulated signal database 111 by the coarse search key signal and registered in the dense search accumulated signal database 112 is compared. As a result, the false detection in the dense search unit 105 may be reduced. On the other hand, as a case where the detection accuracy is lowered, it is conceivable that due to the search omission of the rough search unit 102, the music used is missing at the stage of registration in the dense search accumulated signal database 112.

上述した図3及び図4のテーブルに示す実験結果からは、本発明の実施形態における、蓄積信号データベースからの蓄積情報の検出精度が従来法とほぼ同等と考えられる。一方、本発明の実施形態における検出速度は、従来法の4倍以上である。
したがって、本発明の実施形態における信号検出方法は、従来に対して同等の検出精度を維持し、より高速な信号検出法として有効と考えられる。
また、本発明は、例えばテレビドラマなどのように、同じ楽曲が繰り返し使われる番組における楽曲使用検出には特に有効と考えれられる。
なお、上述した実験においては、粗探索用探索キー信号長と密探索用探索キー信号長とは同じ5秒として設定したが、これに限定されることなく、上述した長さと異なる長さとすることも可能であり、粗探索用探索キー信号長と密探索用探索キー信号長とで異なる長さとして設定してもよい。
From the experimental results shown in the tables of FIG. 3 and FIG. 4 described above, it is considered that the detection accuracy of the stored information from the stored signal database in the embodiment of the present invention is almost equivalent to the conventional method. On the other hand, the detection speed in the embodiment of the present invention is four times or more that of the conventional method.
Therefore, the signal detection method in the embodiment of the present invention is considered to be effective as a faster signal detection method while maintaining the same detection accuracy as the conventional one.
Further, the present invention is considered to be particularly effective for detecting the use of music in a program in which the same music is repeatedly used, such as a TV drama.
In the experiment described above, the search key signal length for coarse search and the search key signal length for fine search are set to the same 5 seconds. However, the length is not limited to this, and the length is different from the length described above. The search key signal length for coarse search and the search key signal length for fine search may be set as different lengths.

また、粗探索と密探索とに用いる探索法としては、本実施形態においては、DAL−2を用いたが、探索にTAS,BAM(バイナリエリア探索方法)等を用いても構わない。
また、粗探索と密探索とにおいて、それぞれ異なる探索法を用いることもできる。
また、粗探索用探索キー信号切り出し装置101は、粗探索用探索キー信号の切り出しにおいて、入力信号上の指定された区間または箇所(例えば、ユーザが設定する)からのみ行うようにすることも可能である。
In this embodiment, DAL-2 is used as the search method used for the coarse search and the fine search. However, TAS, BAM (binary area search method), or the like may be used for the search.
Different search methods may be used for the coarse search and the fine search.
Further, the search key signal extraction device 101 for rough search can be used only when starting the search key signal for rough search from a specified section or location (for example, set by the user) on the input signal. It is.

さらに、密探索用探索キー信号切り出し装置104は、ある蓄積信号の区間に対し、予め設定された閾値より、大きい類似度で類似することが粗探部102にて検出された粗探索用探索キー信号の切り出し箇所の近傍からのみ、密探索用探索キー信号を切り出すようにすることも容易である。
この場合、密探索用探索キー信号切り出し装置104は、切り出す密探索用探索キー信号の数を削減することができ、従来方法と比較してさらに高速な信号検出が行えることとなる。
Further, the search key signal extraction device 104 for fine search detects the search key for coarse search detected by the rough search unit 102 that a certain accumulated signal section is similar with a degree of similarity larger than a preset threshold. It is also easy to cut out the search key signal for fine search only from the vicinity of the signal cut-out location.
In this case, the fine search search key signal extraction device 104 can reduce the number of fine search search key signals to be extracted, and can perform signal detection at higher speed than the conventional method.

また、第1の実施形態においては、粗探索用探索キー信号切り出し、粗探索および密探索用蓄積信号データベース作成による密探索用蓄積信号データベースに登録される蓄積信号の削減を一回のみ行ったが、得られた密探索用蓄積信号データベースを蓄積信号データベースとして、粗探索用探索キー信号切り出し及び粗探索および密探索用蓄積信号データベース作成を行い、蓄積信号データーベースの粗探索用探索キー信号切り出し及び粗探索および密探索用蓄積信号データベース作成の処理におけるパラメータ・探索方法を変更しながら、蓄積信号データベースに登録される蓄積信号の削減を繰り返し、すなわち複数の段階にて行う構成としてもよい。   Further, in the first embodiment, the search signal for rough search is cut out only once, and the accumulated signal registered in the accumulation signal database for fine search by rough search and the accumulation signal database for fine search is reduced only once. The coarse search accumulated signal database thus obtained is used as an accumulated signal database to perform rough search search key signal extraction, coarse search and fine search accumulated signal database creation, The configuration may be such that the reduction of stored signals registered in the stored signal database is repeated, that is, performed in a plurality of stages, while changing the parameters and the search method in the process of creating the stored signal database for coarse search and fine search.

例えば、構成として、粗探索用探索キー信号切り出し部101が入力信号から粗探索用探索キー信号を切り出し、粗探索部102は蓄積信号データベース111から、すでに述べたように、粗探索用探索キー信号と類似する区間を有する蓄積信号を探索する。
次に、密探索用蓄積信号データベース作成部103は、上記探索された蓄積信号を登録した密探索用蓄積信号データベース112を作成する。
次に、密探索用探索キー信号切り出し部104は、密探索用探索キー信号を、入力信号から切り出す。
上記密探索用探索キー信号が切り出されると、密探索部105は、密探索用蓄積データベース112から、この密探索用探索キー信号に類似した蓄積信号を探索する。
For example, as a configuration, the coarse search search key signal cutout unit 101 cuts out the coarse search search key signal from the input signal, and the coarse search unit 102 extracts the coarse search search key signal from the accumulated signal database 111 as described above. A stored signal having a section similar to is searched.
Next, the dense search accumulated signal database creation unit 103 creates the dense search accumulated signal database 112 in which the searched accumulated signals are registered.
Next, the fine search search key signal cutout unit 104 cuts out the fine search search key signal from the input signal.
When the search key signal for fine search is extracted, the fine search unit 105 searches the accumulation database 112 for fine search for an accumulation signal similar to the search key signal for fine search.

そして、密探索用蓄積信号データベース作成部103は、直前の密探索段階において密探索部105が探索した蓄積信号を、新たに、上記密探索用データベース112に対して再登録する。
次に、密探索用探索キー信号切り出し部104は、密探索用探索キー信号を、入力信号から切り出す。このとき、密探索用探索キー信号切り出し部104は、直前の探索段階(自身より上位にある探索段階)の切り出しに比較して、より切り出しのずらし幅を小さくし、探索における時間精度を向上させる。
そして、密探索部105は、直前に比較して、さらに削減された数に再登録された密探索用蓄積データベース112から、この密探索用探索キー信号に類似した蓄積信号を探索する。
Then, the dense search accumulated signal database creation unit 103 newly re-registers the accumulated signal searched by the dense search unit 105 in the immediately preceding dense search stage in the fine search database 112.
Next, the fine search search key signal cutout unit 104 cuts out the fine search search key signal from the input signal. At this time, the dense search search key signal cutout unit 104 further reduces the cutout shift width and improves the time accuracy in the search as compared with the cutout in the immediately preceding search stage (the search stage higher than itself). .
Then, the dense search unit 105 searches for an accumulation signal similar to the search key signal for fine search from the accumulation database 112 for fine search re-registered to a number further reduced as compared to immediately before.

すなわち、上位段階の探索においては、入力信号を粗い間隔にて粗探索用探索キー信号を切り出し、少ない数の粗探索用探索キー信号により、蓄積信号データベース111から、ある程度の類似度を有する蓄積信号(例えば、上述したように、予め設定されている閾値を超える類似度と検出された区間を有する蓄積信号)を探索し、この探索された蓄積信号を集めた下位段階の探索に用いる密探索用蓄積信号データベース112から、直前の上位の探索段階の場合に比較して密な間隔で入力信号から切り出した密探索用探索キー信号にて、ある程度の類似度を有する蓄積信号(例えば、上述した上位の探索段階に比較し、より高い数値として予め設定された閾値を超える類似度と検出された区間を有する蓄積信号)を探索する。この処理を繰り返すことにより、各段階において徐々に検出精度を高くして探索を行っていくことができる。
例えば、探索処理を3段階以上の複数段階にて行う場合、最も上位の粗の探索段階から、最も下位の密な探索段階に至るまで、それぞれの段階において、入力信号に対する探索キー信号の最短信号長(照合窓長)や、探索キー信号の時間移動幅(照合窓の移動幅)の詳細化(小さくする)と、蓄積信号の絞り込みとを順次段階的に行う。
That is, in the upper-level search, the search signal for rough search is cut out from the input signal at rough intervals, and the stored signal having a certain degree of similarity from the stored signal database 111 by a small number of search key signals for rough search. (For example, as described above, an accumulated signal having a detected degree and a similarity exceeding a preset threshold value) An accumulation signal having a certain degree of similarity in the search key signal for fine search extracted from the input signal at a fine interval from the accumulated signal database 112 compared to the case of the immediately preceding upper search stage (for example, the above-described upper signal) Compared to the search stage, the stored signal having a detected similarity and a degree of similarity exceeding a preset threshold as a higher numerical value) is searched. By repeating this process, the search can be performed with gradually increasing detection accuracy at each stage.
For example, when the search process is performed in a plurality of stages of three or more stages, the shortest signal of the search key signal with respect to the input signal in each stage from the highest coarse search stage to the lowest dense search stage. The length (collation window length), the time movement width of the search key signal (movement width of the collation window) are refined (reduced), and the stored signal is narrowed down step by step.

このとき、密探索用探索キ一信号切り出し部104は、入力信号から密探索用探索キ一信号を切り出すが、上述したように、探索段階各々に対し、それぞれ予め設定された(あるいはユーザに指定された)切り出し間隔(ずらし幅)にて、密探索用探索キー信号を切り出す。ここで、このずらし幅は、下位段階の探索過程に比較して、上位の探索過程において大きく設定されている。すなわち、粗探索用探索キー信号の切り出しにおけるずらし幅は、密探索用探索キー信号に比較して大きい。また、密探索用探索キー信号は、下位段階の探索過程に行くに従い、直前の密探索用探索キー信号の切り出におけるずらし幅に比較して小さくなる。   At this time, the search key signal extraction unit 104 for fine search extracts the search key signal for fine search from the input signal. As described above, the search key signal extraction unit 104 is preset for each search stage (or designated by the user). The search key signal for fine search is cut out at the cutout interval (shift width). Here, the shift width is set larger in the upper search process than in the lower search process. That is, the shift width in cutting out the search key signal for coarse search is larger than that for the search key signal for fine search. Further, the search key signal for fine search becomes smaller as compared with the shift width in the cut-out of the search key signal for the previous fine search as it goes to the lower-level search process.

上述したように、第1の実施形態の信号検出装置を、密探索用蓄積信号データベース作成部103,密探索用探索キー信号切り出し部104及び密探索部105における下位段階の探索を複数回行い、徐々に、蓄積情報探索における検出精度を向上させるようにする構成としてもよい。
また、各探索段階の探索処理を行う、密探索用蓄積信号データベース作成部103,密探索用探索キー信号切り出し部104及び密探索部105に対応する構成を複数設けるようにしてもよい。
As described above, the signal detection apparatus according to the first embodiment performs the lower-level search in the dense search accumulated signal database creation unit 103, the fine search search key signal cutout unit 104, and the fine search unit 105 a plurality of times, The detection accuracy in the stored information search may be gradually improved.
In addition, a plurality of configurations corresponding to the dense search accumulated signal database creation unit 103, the fine search search key signal cutout unit 104, and the fine search unit 105 that perform search processing at each search stage may be provided.

上述してきたように、本実施形態における信号検出装置は、蓄積信号データベース111に登録されている蓄積信号のなかから、入力信号に用いられている蓄積信号を粗探索及び密探索の2段階において、探索対象の蓄積信号の数を絞り込むことで、探索の処理を高速化している。
一方、従来、粗い探索処理と密な探索処理とを順次行うことにより、パターン認識や信号探索の処理の効率を向上させる手法は、粗密法またはコース・トゥー・ファイン(coarse to fine)などの名称で広く知られているものである。
As described above, the signal detection apparatus according to the present embodiment includes the accumulated signal used as the input signal from the accumulated signals registered in the accumulated signal database 111 in the two stages of the coarse search and the fine search. Search processing is speeded up by narrowing down the number of accumulated signals to be searched.
On the other hand, methods that improve the efficiency of pattern recognition and signal search processing by sequentially performing coarse search processing and dense search processing are names such as coarse / fine or coarse to fine. Is widely known.

しかしながら、本発明は、公知の粗密法を信号検出に単に適用することを主旨とするものではない。これについて、以下に放送中の楽曲を検出する例にて説明する。
まず、公知の粗密法では、入力信号(放送の音響信号)において、粗い移動幅にて照合窓を蓄積信号に対して設定し、検出対象となる楽曲が検出された箇所の付近にて細かい移動幅にて照合窓を設定して、検出時刻、すなわち蓄積信号における検出位置を詳細に特定する処理となる。
このような方法によれば、初めから細かい移動幅にて、照合する方法に比較して、必ずしも同一の結果が得られるとは限らないが、照合回数を削減して、処理の効率化を期待することができる。
However, the present invention is not intended to simply apply a known density method to signal detection. This will be described below using an example of detecting a song being broadcast.
First, in the known coarse / fine method, in the input signal (broadcast acoustic signal), a collation window is set for the accumulated signal with a coarse movement width, and fine movement near the location where the music to be detected is detected. The collation window is set by the width, and the detection time, that is, the detection position in the accumulated signal is specified in detail.
According to such a method, it is not always possible to obtain the same result as compared with the method of matching with a small movement width from the beginning, but it is expected to reduce the number of times of matching and improve processing efficiency. can do.

一方、すでに詳細に説明したように、本発明の本実施形態では、粗探索過程により抽出された、より類似度が高い蓄積信号の集合である密探索用蓄積信号データベース112を新たに作成し、すなわち、粗い移動幅での照合において類似度が高いとして検出された蓄積信号(対象楽曲)を選択し、細かい移動幅での照合において、前記選択された蓄積信号のみを用いて探索を行う点が特徴である。   On the other hand, as already described in detail, in the present embodiment of the present invention, a dense search accumulated signal database 112 which is a set of accumulated signals extracted by a coarse search process and having a higher similarity is newly created. That is, the accumulated signal (target music piece) detected as having a high similarity in the collation with a rough movement width is selected, and the search is performed using only the selected accumulation signal in the collation with a fine movement width. It is a feature.

従来法による細かい移動幅のみでの照合は、計算量が非常に多くなる。このため、上記のように、選択された少数の蓄積信号(対象楽曲)のみを用いて、密な探索を行うことにより、本実施形態の信号処理装置は、信号処理における処理コストを、従来法に比較して著しく削減することができる。
上述したように、本実施形態は、蓄積信号データベース111から粗い処理により、密探索を行う蓄積信号を選択し、この選択した蓄積信号から密の探索処理により、最終的な探索結果を得る構成となっている。
また、とりわけ放送番組などに対する楽曲探索を対象とする場合、番組中においては一貫性を持たせるなどの目的で、特定の楽曲が繰り返し用いられることが多く、本実施形態が極めて有効に機能する。
Collation with only a small movement width by the conventional method requires a large amount of calculation. For this reason, as described above, by performing a dense search using only a small number of selected accumulated signals (target music pieces), the signal processing apparatus of this embodiment reduces the processing cost in signal processing by the conventional method. It can be significantly reduced compared to
As described above, the present embodiment selects a stored signal to be subjected to a fine search from the stored signal database 111 through a rough process, and obtains a final search result from the selected stored signal through a dense search process. It has become.
In particular, when searching for music for a broadcast program or the like, specific music is often used repeatedly for the purpose of providing consistency in the program, and this embodiment functions extremely effectively.

なお、各段階において用いる探索方法としては、必ずしも同一のアルゴリズムである必要はなく、また、探索パラメータの設定を変更することもできる。例えば、ここに述べた例においては、小領域を、密探索において粗探索よりも多数になるように、すなわち高密度にて配置した。他の、探索パラメータとしては、類似度閾値,周波数帯域,探索キー信号の長さなどが含まれる。
また、本実施形態において、外部から入力される入力信号及び蓄積信号データベース111に登録されている蓄積信号とは、音響信号や画像信号のデータそのものでも、特徴情報を抽出して時系列に並べた符号列のいずれでもよい。
すなわち、本実施形態ですでに述べたように、音響信号や画像信号のデータから特徴情報を抽出して、特徴情報によって類似性を求めてもよく、一方、データそのもの同士の類似性尺度(相関や距離など)を計算して、類似性を求めても、いずれの手法を用いてもよい。以下、入力信号を音響信号として説明するが、画像信号等の他の信号に対しても同様の処理を行う行うことができる。
Note that the search method used at each stage is not necessarily the same algorithm, and the search parameter setting can be changed. For example, in the example described here, the small areas are arranged so as to have a larger number in the dense search than in the coarse search, that is, at a high density. Other search parameters include a similarity threshold, a frequency band, a search key signal length, and the like.
Further, in the present embodiment, the input signal input from the outside and the accumulated signal registered in the accumulated signal database 111 are extracted in a time series by extracting feature information from the sound signal or the image signal data itself. Any of the code strings may be used.
That is, as already described in this embodiment, feature information may be extracted from the data of an acoustic signal or an image signal, and similarity may be obtained from the feature information. Or any other method may be used. Hereinafter, although an input signal is described as an acoustic signal, the same processing can be performed on other signals such as an image signal.

また、特徴情報にて類似性を求める場合、入力信号がすでに特徴情報であり、蓄積信号データベース111に登録されている蓄積情報も特徴情報である場合と、入力信号が音響信号そのもので、蓄積信号データベース111に登録されている蓄積情報が特徴情報で、類似性を求める際に、入力信号から特徴情報を抽出して比較を行う場合と、入力信号が音響信号の特徴情報であり、蓄積信号データベース111に登録されている蓄積情報が音響信号そのもので、類似性を求める際に、蓄積情報から特徴情報を抽出して比較を行う場合と、入力信号が音響信号そのもので、蓄積信号データベース111に登録されている蓄積情報が音響信号そのもので、類似性を求める際に、入力信号及び蓄積情報各々から特徴情報を抽出して比較を行う場合とのいずれの構成を用いても良い。
また、データそのもの同士の相関を計算して、類似性を求める手法の場合、蓄積信号データベース111には、画像信号及び音響信号そのもののデータが登録されている。
Further, when similarity is obtained from feature information, the input signal is already feature information, and the stored information registered in the stored signal database 111 is also feature information. The stored information registered in the database 111 is feature information. When obtaining similarity, the feature information is extracted from the input signal and compared, and the input signal is the feature information of the acoustic signal. When the stored information registered in 111 is the acoustic signal itself and the similarity is obtained, the feature information is extracted from the stored information for comparison, and the input signal is the acoustic signal itself and registered in the accumulated signal database 111. When the stored information is the acoustic signal itself and the similarity is obtained, the feature information is extracted from the input signal and the stored information for comparison. May be used either configuration.
Further, in the case of a technique for calculating a correlation between data itself and obtaining similarity, data of an image signal and an acoustic signal itself are registered in the accumulated signal database 111.

<第2の実施形態>
次に、本発明の第2の実施形態について、図5を用いて説明する。図5は本実施形態による信号検出装置の構成例を示すブロック図である。ここで、上記信号検出装置は、具体的にはCPUやメモリを有する一般的な計算機上に実現される。第1の実施形態における同様の構成については同一の符号を付し、異なる構成及び異なる機能について説明する。第2の実施形態における粗探索部102及び密探索部105での探索方法に関しては、第1の実施形態と同様であるが、特徴情報の抽出処理を明確化するため、特徴抽出部を設けた。
<Second Embodiment>
Next, a second embodiment of the present invention will be described with reference to FIG. FIG. 5 is a block diagram illustrating a configuration example of the signal detection apparatus according to the present embodiment. Here, the signal detection device is specifically realized on a general computer having a CPU and a memory. The same reference numerals are given to the same configurations in the first embodiment, and different configurations and different functions will be described. The search method in the coarse search unit 102 and the dense search unit 105 in the second embodiment is the same as that in the first embodiment, but a feature extraction unit is provided to clarify the feature information extraction process. .

特徴抽出部106は、入力される音響信号または映像信号から、特徴情報を抽出し、目的特徴信号として出力する。
原本データベース110には、複数の音響信号または映像信号の特徴情報が、蓄積信号として登録されている。
蓄積信号データベース111には、入力信号に対応し、粗探索部102により原本データベース110から選択され蓄積信号が記憶されている。
The feature extraction unit 106 extracts feature information from the input audio signal or video signal and outputs it as a target feature signal.
In the original database 110, characteristic information of a plurality of audio signals or video signals is registered as accumulated signals.
The accumulated signal database 111 stores an accumulated signal selected from the original database 110 by the rough search unit 102 corresponding to the input signal.

粗探索用探索キー信号切り出し部101は、第1の実施形態と同様に、粗探索用探索キー信号を設定されたずらし幅に応じて、切り出し位置をずらしつつ、順次、目的特徴信号から粗探索用探索キー信号を切り出す。
楽曲リスト作成部107は、粗探索部102が上記粗探索用探索キー信号にて探索した蓄積信号を特定する情報、例えば蓄積信号が音響信号であれば楽曲名,識別番号など、あるいは映像信号であれば映像名,識別番号などを粗探索リストへリストアップする。
As in the first embodiment, the coarse search search key signal cutout unit 101 sequentially performs coarse search from the target feature signal while shifting the cutout position according to the set shift width of the coarse search search key signal. The search key signal is cut out.
The music list creation unit 107 is information that specifies the stored signal searched by the rough search unit 102 using the search key signal for rough search, for example, if the stored signal is an acoustic signal, a song name, an identification number, etc., or a video signal. If so, list the video name, identification number, etc. in the coarse search list.

密探索用蓄積信号データベース作成部103は、上記粗探索リストを参照して、この粗探索リストにリストアップされている蓄積信号を蓄積用デーベース111から読み出し、密探索用蓄積信号データベース112へ記憶させ、密探索に用いる密探索用蓄積信号データベース112の作成処理を行う。
密探索用キー信号切り出し部104は、第1の実施形態と同様に、密探索用探索キー信号を設定されたずらし幅(粗探索用探索キー信号に比較して切り出しのずらし幅が小さい設定となっている)に応じて、切り出し位置をずらしつつ、順次、参照信号から密探索用探索キー信号を切り出す。
楽曲リスト作成部108は、密探索部105が上記密用探索キー信号にて探索した蓄積信号を特定する情報、例えば蓄積信号が音響信号であれば楽曲名,識別番号など、あるいは映像信号であれば映像名,識別番号などを密探索リストへリストアップする。
The fine search accumulated signal database creation unit 103 refers to the coarse search list, reads the accumulated signals listed in the coarse search list from the accumulation database 111, and stores them in the fine search accumulated signal database 112. Then, a process for creating the dense search accumulated signal database 112 used for the fine search is performed.
As in the first embodiment, the fine search key signal cutout unit 104 has a set shift width of the fine search search key signal (a cut shift width is smaller than that of the coarse search search key signal). The search key signal for fine search is sequentially cut out from the reference signal while shifting the cut-out position.
The music list creation unit 108 is information that specifies the accumulated signal searched by the dense search unit 105 using the above-described secret search key signal. For example, if the accumulated signal is an audio signal, the music list creation unit 108 may be a song name, an identification number, For example, video names and identification numbers are listed in the fine search list.

次に、図5,図6及び図7を参照して、第2の実施形態による信号検出装置の説明を行う。ここで、図6は、粗探索用及び密探索用の探索キー信号の切り出しを説明する概念図である。また、図7は、第2の実施形態の信号検出の動作例を示すフローチャートである。
なお、本実施形態においては、入力信号として、放送などで流される映像信号や音響信号、あるいは録画された映像信号、録音された音響信号を想定し、また、蓄積信号(原本データベース110に蓄積されている蓄積信号)としてはビデオ等に録画されている映像や、CDなどに記録されている音楽を特徴情報に変換した信号を想定している。
Next, the signal detection apparatus according to the second embodiment will be described with reference to FIGS. 5, 6, and 7. Here, FIG. 6 is a conceptual diagram illustrating the extraction of search key signals for coarse search and fine search. FIG. 7 is a flowchart illustrating an example of signal detection operation according to the second embodiment.
In the present embodiment, an input signal is assumed to be a video signal or an audio signal that is broadcast or the like, or a recorded video signal or a recorded audio signal, and an accumulated signal (stored in the original database 110). As the stored signal), a signal obtained by converting video recorded in a video or the like or music recorded on a CD into feature information is assumed.

信号検出装置は、外部機器から放送などで流された映像信号や音響信号,または録画された映像信号や録音された音響信号を、入力信号として入力し、この入力信号を特徴情報抽出部106へ出力する(ステップS201)する。
上記入力信号が入力されると、特徴情報抽出部106は、この入力信号を元に特徴情報を抽出して、目的特徴信号を作成して、管理部109を介して、目的特徴信号を粗探索用探索キー信号切り出し部101へ出力する(ステップS202)。
The signal detection device inputs a video signal or an audio signal that is broadcast from an external device or the like, or a recorded video signal or a recorded audio signal as an input signal, and inputs the input signal to the feature information extraction unit 106. Output (step S201).
When the input signal is input, the feature information extraction unit 106 extracts feature information based on the input signal, creates a target feature signal, and roughly searches the target feature signal via the management unit 109. The search key signal cut-out unit 101 is output (step S202).

次に、粗探索用探索キー信号切り出し部101は、設定されたずらし幅にて、切り出し位置をずらしつつ、入力される目的特徴信号から粗探索用探索キー信号を切り出し、順次、粗探索部102へ出力する(ステップS203)。ここで、粗探索用探索キー信号切り出し部101は、送信された目的特徴情報を見つけ出したい映像信号または音響信号の最短信号長Lにより、時間移動幅t1にてずらしながら、粗探索用探索キー信号を切り出す(図6(a)参照)。
また、粗探索用探索キー信号切り出し部101は、目的特徴信号と比較を行う、入力信号に対応した蓄積信号(映像信号または音響信号の特徴情報)を、原本データベース110から読み出し、蓄積信号データベース111へ格納する(ステップS204)。ここで、原本データベース110から蓄積信号を読み出し、蓄積信号データベース111への登録処理は、最初の粗探索時までに完了し、以下の下位段階の探索過程毎に、原本データベース110からの蓄積信号の取り出しは行われない。
Next, the coarse search search key signal cutout unit 101 cuts out the coarse search search key signal from the input target feature signal while shifting the cutout position by the set shift width, and sequentially searches the coarse search unit 102. (Step S203). Here, the coarse search search key signal cutout unit 101 performs a coarse search search key signal while shifting by the time movement width t1 according to the shortest signal length L of the video signal or audio signal for which the transmitted target feature information is to be found. Is cut out (see FIG. 6A).
The search key signal cutout unit 101 for coarse search reads an accumulated signal (characteristic information of a video signal or an audio signal) corresponding to an input signal, which is compared with the target feature signal, from the original database 110 and stores the accumulated signal database 111. (Step S204). Here, the accumulated signal is read from the original database 110 and registered in the accumulated signal database 111 is completed by the time of the first rough search, and the accumulated signal from the original database 110 is searched for each of the following lower-level search processes. No removal is performed.

粗探索用探索キー信号が入力されると、粗探索部102は、分割された、すなわち切り出された粗探索用探索キー信号と、蓄積信号データベース111から読み出す蓄積信号との比較を行い、この比較結果として類似度を算出して出力する(ステップS205)。
楽曲リスト作成部107は、比較した各蓄積信号の類似度を入力し、予め設定されている閾値と比較し、この閾値を超えた類似度を有する蓄積信号を、粗探索過程における一致と判定し、一致と判定した蓄積信号を特定するデータ(楽曲名、映像名、識別情報など)をリストアップして粗探索リストを生成し、この粗探索リストを管理部109へ出力する(ステップS206)。
When the search key signal for coarse search is input, the coarse search unit 102 compares the divided search key signal for coarse search, that is, the extracted search signal with the accumulated signal read from the accumulated signal database 111, and compares the comparison. As a result, the similarity is calculated and output (step S205).
The music list creation unit 107 inputs the similarity of each of the compared accumulated signals, compares it with a preset threshold value, and determines that the accumulated signal having the similarity exceeding the threshold value is a match in the rough search process. Then, the data (music name, video name, identification information, etc.) specifying the accumulated signal determined to be coincident is listed to generate a rough search list, and this rough search list is output to the management unit 109 (step S206).

次に、管理部9は、入力される粗探索リストを参照し、蓄積信号データベース111から、粗探索リストにおける蓄積信号を特定するデータにより蓄積信号を抽出し、粗探索リストに記載されている蓄積信号の収集を行い、目的特徴信号を密信号用探索キー信号へ、また、粗探索リスト及び収集した蓄積信号を密探索用蓄積信号データベス作成部103へ出力(送信)する(ステップS207)。
粗探索リスト及び収集した蓄積信号が入力(受信)されると、密探索用蓄積信号データベース作成部103は、粗探索リスト及び入力された蓄積信号をデータベースへ登録し、密探索用蓄積信号データベース112を、密探索用の最低限の蓄積信号を格納したデータベースとして作成(構築)する(ステップS208)。
Next, the management unit 9 refers to the input coarse search list, extracts an accumulated signal from the accumulated signal database 111 using data specifying the accumulated signal in the coarse search list, and stores the accumulated signal described in the coarse search list. Signals are collected, and the target feature signal is output (transmitted) to the fine signal search key signal, and the coarse search list and the collected accumulated signal are output to the fine search accumulated signal database creation unit 103 (step S207).
When the coarse search list and the collected accumulated signal are input (received), the fine search accumulated signal database creation unit 103 registers the coarse search list and the inputted accumulated signal in the database, and the fine search accumulated signal database 112. Is created (constructed) as a database storing a minimum accumulated signal for dense search (step S208).

次に、密探索用探索キー信号切り出し部104は、見つけ出したい映像または音響信号の特徴である目的特徴信号を、図6(b)に示すように、粗探索の探索過程と同様に、同一の最短信号長Lにて、また粗探索の探索過程におけるより短い時間移動幅t2(<t1)にてずらしながら、目的特徴信号から密探索用探索キー信号を切り出し、密探索部105へ順次出力する(ステップS209)。
密探索用探索キー信号が入力されると、密探索部105は、密探索用蓄積信号データベース112から比較を行う蓄積信号を読み出し、取得する(ステップS210)。
Next, as shown in FIG. 6B, the fine search search key signal cutout unit 104 selects the target feature signal that is the feature of the video or audio signal to be found in the same manner as in the coarse search process. The search key signal for fine search is cut out from the target feature signal while being shifted by the shortest signal length L and by a shorter time movement width t2 (<t1) in the search process of the coarse search, and sequentially output to the fine search unit 105. (Step S209).
When the search key signal for fine search is input, the fine search unit 105 reads and acquires an accumulation signal to be compared from the accumulation signal database 112 for fine search (step S210).

そして、密探索部105は、入力された粗探索用探索キー信号と、蓄積信号データベース111から読み出した蓄積信号との比較を行い、この比較結果として類似度を算出して出力する(ステップS211)。
楽曲リスト作成部212は、密探索部105から比較した各蓄積信号の類似度を入力し、予め設定されている閾値と比較し、この閾値を超えた類似度を有する蓄積信号を、密探索過程における一致と判定し、一致と判定した蓄積信号を特定するデータ(楽曲名、映像名、識別情報など)をリストアップして密探索リストを生成し、管理部109を介して、画面に表示するなどのユーザへの通知処理を行う(ステップS212)。
Then, the fine search unit 105 compares the input search key signal for coarse search with the accumulated signal read from the accumulated signal database 111, and calculates and outputs the similarity as the comparison result (step S211). .
The music list creation unit 212 receives the similarity of each accumulated signal compared from the dense search unit 105, compares it with a preset threshold value, and uses the accumulated signal having the similarity exceeding this threshold value as a dense search process. The data (music name, video name, identification information, etc.) specifying the stored signal determined to match is listed up, a dense search list is generated, and displayed on the screen via the management unit 109 A notification process to the user is performed (step S212).

なお、図2及び図7のフローチャートにおける信号検出処理の機能を実現するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することにより信号検出の処理を行ってもよい。なお、ここでいう「コンピュータシステム」とは、OSや周辺機器等のハードウェアを含むものとする。また、「コンピュータシステム」は、ホームページ提供環境(あるいは表示環境)を備えたWWWシステムも含むものとする。また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、CD−ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。さらに「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムが送信された場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリ(RAM)のように、一定時間プログラムを保持しているものも含むものとする。   Note that a program for realizing the function of the signal detection process in the flowcharts of FIGS. 2 and 7 is recorded on a computer-readable recording medium, and the program recorded on the recording medium is read into a computer system and executed. Thus, signal detection processing may be performed. The “computer system” here includes an OS and hardware such as peripheral devices. The “computer system” includes a WWW system having a homepage providing environment (or display environment). The “computer-readable recording medium” refers to a storage device such as a flexible medium, a magneto-optical disk, a portable medium such as a ROM and a CD-ROM, and a hard disk incorporated in a computer system. Further, the “computer-readable recording medium” refers to a volatile memory (RAM) in a computer system that becomes a server or a client when a program is transmitted via a network such as the Internet or a communication line such as a telephone line. In addition, those holding programs for a certain period of time are also included.

また、上記プログラムは、このプログラムを記憶装置等に格納したコンピュータシステムから、伝送媒体を介して、あるいは、伝送媒体中の伝送波により他のコンピュータシステムに伝送されてもよい。ここで、プログラムを伝送する「伝送媒体」は、インターネット等のネットワーク(通信網)や電話回線等の通信回線(通信線)のように情報を伝送する機能を有する媒体のことをいう。また、上記プログラムは、前述した機能の一部を実現するためのものであっても良い。さらに、前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるもの、いわゆる差分ファイル(差分プログラム)であっても良い。   The program may be transmitted from a computer system storing the program in a storage device or the like to another computer system via a transmission medium or by a transmission wave in the transmission medium. Here, the “transmission medium” for transmitting the program refers to a medium having a function of transmitting information, such as a network (communication network) such as the Internet or a communication line (communication line) such as a telephone line. The program may be for realizing a part of the functions described above. Furthermore, what can implement | achieve the function mentioned above in combination with the program already recorded on the computer system, and what is called a difference file (difference program) may be sufficient.

本発明の第1の実施形態による信号検出装置の構成例を示すブロック図である。It is a block diagram which shows the structural example of the signal detection apparatus by the 1st Embodiment of this invention. 図1の第1の実施形態による信号検出装置の動作例を示すフローチャートである。It is a flowchart which shows the operation example of the signal detection apparatus by 1st Embodiment of FIG. 第1の実施形態と従来法との検出速度の比較実験の結果を示したテーブルである。It is the table which showed the result of the comparison experiment of the detection speed of 1st Embodiment and the conventional method. 第1の実施形態と従来法との検出精度の比較実験の結果を示したテーブルである。It is the table which showed the result of the comparison experiment of the detection accuracy of 1st Embodiment and the conventional method. 本発明の第2の実施形態による信号検出装置の構成例を示すブロック図である。It is a block diagram which shows the structural example of the signal detection apparatus by the 2nd Embodiment of this invention. 第2の実施形態における入力信号からの粗探索用及び密探索用探索キー信号の切り出しを説明する概念図である。It is a conceptual diagram explaining the extraction of the search key signal for rough search and fine search from the input signal in the second embodiment. 図5の第2の実施形態による信号検出装置の動作例を示すフローチャートである。It is a flowchart which shows the operation example of the signal detection apparatus by 2nd Embodiment of FIG.

符号の説明Explanation of symbols

101…粗探索用探索キー信号切り出し部
102…粗探索部
103…密探索用蓄積信号データベース探索部
104…密探索用探索キー信号切り出し部
105…密探索部
106…特徴抽出部
107,108…楽曲リスト作成部
109…管理部
110…原本データベース
111…蓄積信号データベース
112…密探索用蓄積信号データベース
DESCRIPTION OF SYMBOLS 101 ... Rough search search key signal cutout part 102 ... Rough search part 103 ... Dense search accumulation signal database search part 104 ... Fine search search key signal cutout part 105 ... Dense search part 106 ... Feature extraction part 107, 108 ... Music List creation unit 109 ... management unit 110 ... original database 111 ... accumulation signal database 112 ... accumulation signal accumulation signal database

Claims (4)

入力信号の所定の区間と、予め登録されている蓄積信号の一部または全部とを比較し、前記入力信号に類似する蓄積信号を複数の探索段階にて検出していく信号検出装置であって、
蓄積信号を登録した蓄積信号データベースと、
上位探索キー信号を、予め定められた間隔にて前記入力信号から切り出す上位探索キー信号切り出し部と、
前記上位探索キー信号に類似する区間を含む蓄積信号を、前記蓄積信号データベースから探索し、探索された蓄積信号を出力する上位探索部と、
前記上位探索部が出力した蓄積信号を集めた下位蓄積信号データベースを作成する下位蓄積信号データベース作成部と、
下位探索キー信号を、前記上位探索キー信号切り出し部における間隔よりも狭い間隔にて、前記入力信号のうち前記上位探索部にて類似する区間を含む蓄積信号が探索された上位探索キー信号の切り出し箇所の近傍の領域のみから切り出す下位探索キー信号切り出し部と、
前記下位探索キー信号に類似する区間を含む蓄積信号を、前記下位蓄積信号データベースから探索する下位探索部と
を備えることを特徴とする信号検出装置。
A signal detection device that compares a predetermined section of an input signal with a part or all of a pre-registered accumulated signal and detects accumulated signals similar to the input signal at a plurality of search stages. ,
An accumulated signal database in which accumulated signals are registered;
An upper search key signal cutout unit that cuts out the upper search key signal from the input signal at a predetermined interval ;
An upper search unit that searches the stored signal database for an accumulated signal including a section similar to the upper search key signal, and outputs the searched accumulated signal;
And the lower accumulation signal database creation unit that creates a lower accumulation signal database a collection of accumulated signals the upper search unit has output,
Extraction of upper search key signal in which lower search key signal is searched at an interval narrower than the interval in upper search key signal extraction unit, and the stored signal including a similar section in the upper search unit is searched among the input signals. A low-order search key signal cutout unit that cuts out only from the area near the location ;
A signal detection apparatus comprising: a lower search unit that searches an accumulation signal including a section similar to the lower search key signal from the lower accumulation signal database.
入力信号の所定の区間と、蓄積信号データベースに予め登録されている蓄積信号の区間とを比較し、前記入力信号に類似する蓄積信号を複数の探索段階にて検出していく信号検出方法であって、
前記複数の探索段階は、1つの粗探索段階と前記粗探索段階に引き続いて順番に実行される1以上の密探索段階とからなり、
前記粗探索段階は、
上位探索キー信号切り出し部が上位探索キー信号を、予め定められた間隔にて前記入力信号の複数箇所から切り出す上位探索キー信号切り出し過程と、
上位探索部が前記上位探索キー信号に類似する区間を含む蓄積信号を、前記蓄積信号データベースから探索し、探索された蓄積信号を出力する上位探索過程と、
を含み、
前記密探索段階は、
下位蓄積信号データベース作成部が当該密探索段階の直前に実行された探索段階の探索により探索された蓄積信号を集めた下位蓄積信号データベースを作成する下位蓄積信号データベース作成過程と、
下位探索キー信号切り出し部が下位検索キー信号を、前記入力信号のうち、直前に実行された探索段階が粗探索段階であれば、前記粗探索段階にて類似する区間を含む蓄積信号が探索された上位探索キー信号の切り出し箇所の近傍の領域のみから、また直前に実行された探索段階が密探索段階であれば、前記直前の密探索段階にて類似する区間を含む蓄積信号が探索された下位探索キー信号の切り出し箇所の近傍の領域のみから、当該密探索段階の直前に実行された探索段階における信号の切り出し間隔よりも狭い間隔にて切り出す下位探索キー信号切り出し過程と、
下位探索部が前記下位探索キー信号に類似する区間を含む蓄積信号を、前記下位蓄積信号データベースから探索する下位探索過程と
を含む
ことを特徴とする信号検出方法。
This is a signal detection method in which a predetermined interval of an input signal is compared with an interval of an accumulated signal registered in advance in an accumulated signal database, and an accumulated signal similar to the input signal is detected in a plurality of search stages. And
The plurality of search stages includes one coarse search stage and one or more dense search stages that are sequentially executed following the coarse search stage.
The rough search step includes:
An upper search key signal cutout process in which the upper search key signal cutout unit cuts out the upper search key signal from a plurality of locations of the input signal at predetermined intervals ;
An upper search process in which an upper search unit searches the stored signal database for an accumulated signal including a section similar to the upper search key signal, and outputs the searched accumulated signal;
Including
The dense search step includes:
A lower accumulated signal database creating unit for creating a lower accumulated signal database in which accumulated signals searched by the search of the search stage executed immediately before the dense search stage are created by the lower accumulated signal database creating unit;
If the lower search key signal cut-out unit searches for the lower search key signal , and the search stage executed immediately before of the input signals is a coarse search stage, stored signals including similar sections are searched for in the coarse search stage. If the search stage executed immediately before is only from the area near the cut-out location of the upper search key signal, and if the search stage executed immediately before is a dense search stage, an accumulated signal including a similar section was searched in the previous dense search stage. A low-order search key signal cut-out process that cuts out only in the vicinity of the cut-out position of the low-order search key signal at an interval narrower than the signal cut-out interval at the search stage executed immediately before the dense search stage ;
A lower search process in which a lower search unit searches the lower stored signal database for an accumulated signal including a section similar to the lower search key signal;
Signal detection method, which comprises a.
請求項1に記載の信号検出装置として、コンピュータを機能させるための信号検出プログラム。   A signal detection program for causing a computer to function as the signal detection device according to claim 1. 請求項のプログラムを記録したコンピュータ読み取り可能な記録媒体。 A computer-readable recording medium on which the program according to claim 3 is recorded.
JP2006093467A 2006-03-30 2006-03-30 Signal detection apparatus, signal detection method, signal detection program, and recording medium Active JP4394083B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006093467A JP4394083B2 (en) 2006-03-30 2006-03-30 Signal detection apparatus, signal detection method, signal detection program, and recording medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006093467A JP4394083B2 (en) 2006-03-30 2006-03-30 Signal detection apparatus, signal detection method, signal detection program, and recording medium

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2009200969A Division JP5230567B2 (en) 2009-08-31 2009-08-31 Signal detection apparatus, signal detection method, signal detection program, and recording medium

Publications (2)

Publication Number Publication Date
JP2007271650A JP2007271650A (en) 2007-10-18
JP4394083B2 true JP4394083B2 (en) 2010-01-06

Family

ID=38674554

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006093467A Active JP4394083B2 (en) 2006-03-30 2006-03-30 Signal detection apparatus, signal detection method, signal detection program, and recording medium

Country Status (1)

Country Link
JP (1) JP4394083B2 (en)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102023995B (en) * 2009-09-22 2013-01-30 株式会社理光 Speech retrieval apparatus and speech retrieval method
KR101537370B1 (en) * 2013-11-06 2015-07-16 주식회사 시스트란인터내셔널 System for grasping speech meaning of recording audio data based on keyword spotting, and indexing method and method thereof using the system
JP5976029B2 (en) * 2014-04-10 2016-08-23 日本電信電話株式会社 Sequence signal identification method, apparatus, and program

Also Published As

Publication number Publication date
JP2007271650A (en) 2007-10-18

Similar Documents

Publication Publication Date Title
KR100774585B1 (en) Mehtod and apparatus for music retrieval using modulation spectrum
Cano et al. A review of algorithms for audio fingerprinting
JP5728888B2 (en) Signal processing apparatus and method, and program
KR100776495B1 (en) Method for search in an audio database
US8977067B1 (en) Audio identification using wavelet-based signatures
KR100862616B1 (en) Searching system and method of audio fingerprint by index information
WO2016189307A1 (en) Audio identification method
US20160005412A1 (en) Generation of a signature of a musical audio signal
JP4394083B2 (en) Signal detection apparatus, signal detection method, signal detection program, and recording medium
JP4597919B2 (en) Acoustic signal feature extraction method, extraction device, extraction program, recording medium recording the program, acoustic signal search method, search device, search program using the features, and recording medium recording the program
CN106663102B (en) Method and apparatus for generating a fingerprint of an information signal
Ouali et al. A spectrogram-based audio fingerprinting system for content-based copy detection
George et al. Scalable and robust audio fingerprinting method tolerable to time-stretching
JP5230567B2 (en) Signal detection apparatus, signal detection method, signal detection program, and recording medium
JP5271863B2 (en) Information analysis apparatus, information analysis method, and information analysis program
US8713030B2 (en) Video editing apparatus
KR100916310B1 (en) System and Method for recommendation of music and moving video based on audio signal processing
KR20090065197A (en) Creation apparatus of index database, creation method, search apparatus, and search method
CN103440305A (en) Method and device for searching for music
Nagano et al. A fast audio search method based on skipping irrelevant signals by similarity upper-bound calculation
CN111291224A (en) Video stream data processing method, device, server and storage medium
JP2004333605A (en) Device, method, and program for successive retrieval result use type similar music retrieval, and recording medium for the same program
Medina et al. Audio fingerprint parameterization for multimedia advertising identification
JP5851455B2 (en) Common signal containing section presence / absence judging device, method, and program
KR102611105B1 (en) Method and Apparatus for identifying music in content

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090630

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090831

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20091006

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20091014

R151 Written notification of patent or utility model registration

Ref document number: 4394083

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121023

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121023

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131023

Year of fee payment: 4

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350