JP2003323452A - データ識別方法及び装置及びデータ識別プログラム及びデータ識別プログラムを格納した記憶媒体 - Google Patents
データ識別方法及び装置及びデータ識別プログラム及びデータ識別プログラムを格納した記憶媒体Info
- Publication number
- JP2003323452A JP2003323452A JP2002130746A JP2002130746A JP2003323452A JP 2003323452 A JP2003323452 A JP 2003323452A JP 2002130746 A JP2002130746 A JP 2002130746A JP 2002130746 A JP2002130746 A JP 2002130746A JP 2003323452 A JP2003323452 A JP 2003323452A
- Authority
- JP
- Japan
- Prior art keywords
- structure information
- matching
- items
- sequence
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
徴量抽出誤りや特徴量誤差に起因する識別性能低下を防
ぐ。 【解決手段】 本発明は、利用者が識別を要求する時間
長を有するデータに対し、ある特徴が存在する時間位置
のシーケンスからなるデータの構造情報Xを取得し、構
造情報データベースに格納し、構造情報データベースか
ら構造情報Yiを取得し、構造情報X及び構造情報Yi
をシーケンス照合することで、両シーケンス照合区間に
おける一致項目数Mi及び不一致項目数Uiを算出し、
Mi及びUiにより構造情報Xに対する構造情報Yiの
類似性を判定し、類似している構造情報の識別子iを識
別結果として出力する。
Description
び装置及びデータ識別プログラム及びデータ識別プログ
ラムを格納した記憶媒体に係り、特に、映像や音楽コン
テンツなどのように表示・再生処理における時間長を有
するデータに係り、そのようなデータを蓄積したデータ
ベースから提示データに対する類似データを識別・検索
するためのデータ識別方法及び装置及びデータ識別プロ
グラム及びデータ識別プログラムを格納した記憶媒体に
関する。
示・再生処理における時間長を有するデータは、その性
質上瞬時に内容を確認することが難しい。そこで、その
内容を表す各種関連情報を付与することで、その識別性
能を向上させることができる。予めデータベースに蓄積
されたこのようなデータに対する識別・検索処理は、一
般的にはこれらの関連情報を対象とするキーワード検索
により実現することができる。以下では、映像コンテン
ツをこのようなデータの代表例として記すことにする。
に、上記の関連情報が必ずしも映像コンテンツを十分に
表現しているとは限らない点を挙げることができる。即
ち、あるオペレータにより付与されたキーワードは、必
ずしも利用ユーザが想起するキーワードと一致しないこ
とが起こり得るわけである。この問題を解決するための
一つの手法に、キーワードではなく映像コンテンツが保
有する、もしくは、保有すると想定される特徴量を提示
することで検索を行う、類似映像検索がある。この場合
は、オペレータやユーザによる主観が入らないため、常
に同じ検索処理が期待される。しかし、その一方で、ど
のような特徴量を用いるか、検索時にユーザはその特徴
量をどのように求め、提示するのか、どのように照合を
行うのかなどの技術課題が発生する。
る。
量を直接指示する手法がある。例えば、「ビデオデータ
を対象とする異種検索方式の統合システム」(第10回
データ工学ワークショップ、1999)では、フレーム
内の色の分布と移動方向を特徴量として抽出する一方、
ユーザはそれらを直接指示することによって映像を検索
する。しかしこの手法は、ユーザがあまり複雑な特徴量
やその変化を指示できないという問題がある。
は部分映像)もしくは、映像から抽出される特徴量をそ
のまま提示することによって検索する手法が考えられ
る。“Quick Audio Retrieval using Active Search ”
(ICASSP,1998) では、蓄積される映像に関して特徴量の
スペクトルを計算しておき、提示映像に対しても同様に
スペクトルヒストグラムを算出した後、図26に示すよ
うに、その比較を行うことで検索を実行する。上記の手
法は、基本的に映像のフレーム毎に特徴量を抽出する。
従って、その特徴量照合は、高速化処理の有無はあると
しても、フレーム毎の特徴量シーケンスを逐一比較する
ことにより実現される。
なり、映像コンテンツのショット長、もしくは、シーン
長を特徴量として用いた類似映像検索手法が提案されて
いる(特開平5−174072、特開平7−4651
7)。これらの方法では、映像シーンの切り替わり(一
般にカット点)で区切ることができる部分映像を1つの
ショットとして定義し、その時間長を特徴量とする方法
である。特徴量照合は、図27に示すように、ショット
長のシーケンスをその項目毎に逐一比較することにより
実現される。
来の類似検索技術には、以下のような相補的な問題点が
ある。
徴量を用いる手法では、総フレーム数に比例した特徴量
データ量を必要とする。従って、総フレーム数の増大に
伴い特徴量自身のデータ量が膨大になるという問題があ
る。一方、3つ目のショット長を用いる手法では、多数
のフレームがまとまって1つのショットを構成する。特
徴量はショット毎に抽出されるために、前者よりデータ
量の増加を抑えることができると考えられる。
一比較することにより照合を行う場合、図28に示すよ
うに、カット点検出誤りが存在した場合、その誤りによ
り特徴量が大幅に変わってしまい、照合失敗となるとい
う問題がある。何らかの手段により比較処理を継続した
としても、その後のショット長比較対象の選択誤りにつ
ながる。即ち、誤り伝播を起こしてしまうという問題も
ある。なお、最初の2例の場合には、予め決められたフ
レーム毎の比較であるために、この問題が発生しない。
この問題を回避する手法として、例えば、比較処理をシ
ョット長のシーケンス順に行わず、ショット長の集合同
士を比較する手法を考えることができる。しかしその場
合、順序情報が失われるために(例えば、10,20,
30と30,10,20を区別できない)、識別性能が
低下する。また、照合失敗時点で次ショット長との加算
を行うなどの例外処理を行う手法も考えられるが、例外
処理停止のためのルールを導入する必要があり(例え
ば、3つ先までは加算可能など)、処理が複雑になる。
された特徴量そのものを比較対象、即ち、類似性の根拠
としている。従って、例えば、映像フォーマットや解像
度の変化に起因する特徴量変化の影響を受けやすいとい
う問題が存在する。
で、識別・検索のためのデータ量を抑えつつ、特徴量抽
出誤りや特徴量誤差に起因する識別性能低下を防ぐこと
が可能なデータ識別方法及び装置及びデータ識別プログ
ラム及びデータ識別プログラムを格納した記憶媒体を提
供することを目的とする。
説明するための図である。
うに表示・再生処理における時間長を有するデータを蓄
積したデータベースからユーザからの提示データに対す
る類似データを識別・検索するデータ識別方法におい
て、表示・再生処理における時間長を有するデータから
得られる、ある特徴が存在する時間位置のシーケンスか
らなる、該データの構造情報Xを取得する構造情報取得
手順(ステップ1)と、構造情報Xを、該構造情報の識
別子と共に構造情報データベースに格納する構造情報格
納手順(ステップ2)と、構造情報データベースから別
の構造情報Yiを取得する検索手順(ステップ3)と、
構造情報X及び構造情報Yiをシーケンス照合すること
で、両シーケンス照合区間における一致項目数Mi及び
不一致項目数Uiを算出する構造情報照合手順(ステッ
プ4)と、構造情報照合手順から得られる一致項目数M
i及び不一致項目数Uiにより構造情報Xに対する構造
情報Yiの類似性を判定する類似性判定手順(ステップ
5)と、類似している場合には、類似している構造情報
の識別子iを識別結果として出力する識別結果出力手順
(ステップ6)と、更に他の構造情報に対して識別処理
を行うかどうかを判定する識別判定手順(ステップ7)
とを有する。
手順において、構造情報データベースから得られる構造
情報Yi中の時間位置シーケンスと、構造情報取得手順
から得られる構造情報X中の時間位置シーケンスから、
両者の開始時間位置のずれ(オフセット)の候補値集合
{O}を算出する手順と、各オフセットOjを、構造情
報Xの各シーケンス項目に加算することで、修正構造情
報Xjを生成する手順と、各修正構造情報Xjと、構造
情報Yiを各々シーケンス照合することにより、両シー
ケンス照合区間における一致項目数Mij及び不一致項
目数Uijを各々算出する手順と、を有し、類似性判定
手順において、全ての一致項目数Mij及び不一致項目
数Uijから構造情報Yiに最も類似している最類似修
正構造情報Xjを判定する手順と、最類似修正構造情報
Xjに対応する一致項目数及び不一致項目数を、Mi、
Uiとして出力する手順と、を有する。
手順において、入力される構造情報X,Yにおいて、照
合する可能性のある各時間区間を算出する時間区間算出
手順と、時間区間内で、構造情報X,Yを時間順に比較
することで得られる、シーケンス間での一致項目数の時
間変化を計測する一致項目数遷移計測手順と、時間区間
内で、構造情報X,Yを時間順に比較することで得られ
る、シーケンス間での不一致項目数の時間変化を計測す
る不一致項目数遷移計測手順と、一致項目数遷移計測手
順と不一致項目数遷移計測手順により得られる一致項目
数の時間変化及び不一致項目数の時間変化から、構造情
報X,Y中で照合していると考えられる部分シーケンス
の開始・終了時間を判定する手順と、開始時間・終了時
間の範囲内における一致項目数及び不一致項目数を算出
する手順と、を有する。
うに表示・再生処理における時間長を有するデータを蓄
積したデータベースからユーザからの提示データに対す
る類似データを識別・検索するデータ識別装置1であっ
て、表示・再生処理における時間長を有するデータから
得られる、ある特徴が存在する時間位置のシーケンスか
らなる、該データの構造情報を取得する構造情報取得手
段11と、構造情報取得手段11で取得した構造情報X
を、該構造情報の識別子と共に格納する構造情報データ
ベース12と、構造情報取得手段11から得られる利用
者提示の構造情報Xを、構造情報データベースから得ら
れる構造情報Yiとシーケンス照合することで、両シー
ケンス照合区間における一致項目数Mi及び不一致項目
数Uiを算出する構造情報照合手段13と、構造情報照
合手段13から得られる一致項目数Mi及び不一致項目
数Uiにより構造情報Xに対する構造情報Yiの類似性
を判定し、類似している場合には、類似している構造情
報の識別子iを識別結果として出力する類似構造情報識
別手段14と、を有する。
手段13は、構造情報データベース12から得られる構
造情報Yi中の時間位置シーケンスと、構造情報取得手
段から得られる構造情報X中の時間位置シーケンスか
ら、両者の開始時間位置のずれ(オフセット)の候補値
集合{O}を算出するオフセット算出手段と、オフセッ
ト算出手段から得られる各オフセットOjを、構造情報
Xの各シーケンス項目に加算することで、開始時間位置
ずれを考慮した修正構造情報Xjを生成する修正構造情
報生成手段と、修正構造情報生成手段から得られる各修
正構造情報Xjと、構造情報データベース12から得ら
れている構造情報Yiを各々シーケンス照合することに
より、両シーケンス照合区間における一致項目数Mij
及び不一致項目数Uijを各々算出する修正構造情報照
合手段と、を有し、修正構造情報照合手段から得られる
一致項目数Mij及び不一致項目数Uijにより構造情
報Yiに対する修正構造情報Xjの類似性を判定し、最
も類似している最類似修正構造情報Xjに対応する一致
項目数及び不一致項目数を、その結果の項目数Mi、U
iとして出力する最適照合判定手段と、を有する。
手段13は、入力される構造情報X,Yにおいて、照合
する可能性のある各時間区間を算出するシーケンス照合
区間算出手段と、シーケンス照合区間算出手段から得ら
れる時間区間内で、構造情報X,Yを時間順に比較する
ことで得られる、シーケンス間での一致項目数の時間変
化を計測する一致項目数遷移計測手段と、シーケンス照
合区間算出手段から得られる時間区間内で、構造情報
X,Yを時間順に比較することで得られる、シーケンス
間での不一致項目数の時間変化を計測する不一致項目数
遷移計測手段と、一致項目数遷移計測手段と不一致項目
数遷移計測手段により得られる一致項目数の時間変化及
び不一致項目数の時間変化から、構造情報X,Y中で照
合していると考えられる部分シーケンスの開始・終了時
間を判定する最適部分シーケンス判定手段と、最適部分
シーケンス判定手段から得られる開始時間・終了時間の
範囲内における一致項目数及び不一致項目数を算出する
一致・不一致項目数算出手段と、を有する。
うに表示・再生処理における時間長を有するデータを蓄
積したデータベースからユーザからの提示データに対す
る類似データを識別・検索するデータ識別プログラムで
あって、表示・再生処理における時間長を有するデータ
から得られる、ある特徴が存在する時間位置のシーケン
スからなる、該データの構造情報Xを取得する構造情報
取得ステップと、構造情報Xを、該構造情報の識別子と
共に構造情報データベースに格納する構造情報格納ステ
ップと、構造情報取得ステップからの構造情報Xを、構
造情報データベースから得られる構造情報Yiとシーケ
ンス照合することにより、両シーケンス照合区間におけ
る一致項目数Mi及び不一致項目数Uiを算出する構造
情報照合ステップと、構造情報照合ステップから得られ
る一致項目数Mi及び不一致項目数Uiにより構造情報
Xに対する構造情報Yiの類似性を判定し、類似してい
る場合にはその識別子iを識別結果として出力する類似
構造情報識別ステップと、をコンピュータに実現させ
る。
照合ステップは、構造情報データベースから得られる構
造情報Yi中の時間位置シーケンスと、構造情報取得ス
テップから得られる構造情報X中の時間位置シーケンス
から、両者の開始時間位置のずれ(オフセット)の候補
値集合{O}を算出するオフセット算出ステップと、オ
フセット算出ステップから得られる各オフセットOj
を、構造情報Xの各シーケンス項目に加算することで、
修正構造情報Xjを生成する修正構造情報生成ステップ
と、修正構造情報生成ステップから得られる各修正構造
情報Xjと、構造情報Yiを各々シーケンス照合するこ
とにより、両シーケンス照合区間における一致項目数M
ij及び不一致項目数Uijを各々算出する修正構造情
報照合ステップと、修正構造情報照合ステップから得ら
れる全ての一致項目数Mij及び不一致項目数Uijに
より構造情報Yiに対する修正構造情報Xjの類似性を
判定し、最も類似している修正構造情報Xjに対応する
一致項目数及び不一致項目数をその結果の項目数Mi、
Uiとして出力する最適照合判定ステップと、をコンピ
ュータに実現させる。
情報照合ステップにおいて、入力される構造情報X,Y
において、照合する可能性のある最小時間及び最大時間
を算出するシーケンス照合区間算出ステップと、シーケ
ンス照合区間算出ステップから得られる照合区間内で、
構造情報X,Yを時間順に比較することで得られる、シ
ーケンス間での一致項目数の時間変化を計測する一致項
目数遷移計測ステップと、シーケンス照合区間算出ステ
ップから得られる時間区間内で、構造情報X,Yを時間
順に比較することで得られる、シーケンス間での不一致
項目数の時間変化を計測する不一致項目数遷移計測ステ
ップと、一致項目数遷移計測ステップと不一致項目数遷
移計測ステップにより得られる一致項目数遷移情報及び
不一致項目数遷移情報から、構造情報X,Y中で照合し
ていると考えられるシーケンス位置を判定する最適部分
シーケンス判定ステップと、最適部分シーケンス判定ス
テップから得られる開始時間・終了時間の範囲内におけ
る一致項目数M及び不一致項目数Uを算出する一致・不
一致項目数算出ステップとを更にコンピュータに実現さ
せる。本発明は、映像や音楽コンテンツなどのように表
示・再生処理における時間長を有するデータを蓄積した
データベースからユーザからの提示データに対する類似
データを識別・検索するデータ識別プログラムを格納し
た記憶媒体であって、請求項7乃至請求項9記載のプロ
グラムを格納する。
ータにおける、ある特徴が存在する時間位置のシーケン
スからなる構造情報を用いることで、フレーム毎の特徴
量に比べて識別・検索のためのデータ量を抑えることが
可能となる。
形態を説明する。
ータ識別装置の構成を示す。
取得部11、構造情報データベース12、構造情報照合
部13、類似構造情報識別部14から構成される。
おける時間長を有するデータに関し、そのデータから得
られる、ある特徴が存在する時間位置のシーケンスから
なる、そのデータの構造情報を取得する。
得部11からの構造情報を、そのデータの識別子と共に
格納する。
1から得られる利用者提示の構造情報Xを、構造情報デ
ータベース12から得られる構造情報Yiとシーケンス
照合することにより、両シーケンス照合区間における一
致項目数Mi及び不一致項目数Uiを算出する。
部13から得られる一致項目数Mi及び不一致項目数U
iにより構造情報Xに対する構造情報Yiの類似性を判
定し、類似している場合には、その識別子iを識別結果
として出力する。
造情報の概念図を示し、図5は、本発明の一実施の形態
における構造情報照合を説明するための図である。
ける、ある特徴が存在する時間位置のシーケンスからな
る構造情報を用いることで、フレーム毎の特徴量に比べ
て識別・検索のためのデータ量を抑えることができる。
また、図5に示すように、抽出される特徴量そのもので
はなく、抽出された特徴量が存在する時間位置を照合に
用いることで、特徴量の誤差に起因する比較誤りを回避
することができる。
出誤りに対する照合処理を説明するための図である。同
図に示すように、構造情報におけるシーケンスの一部項
目が誤検出もしくは、検出漏れされたとしても、その影
響がその後の比較処理に伝播しない。これにより、特徴
量抽出誤りを許容できるデータ識別を行うことができ
る。
る。
造情報照合部の構成を示す。
ット算出部21、修正構造情報生成部22、修正構造情
報照合部23、最適照合判定部24から構成される。
ベース12から得られる構造情報Yi中の時間位置シー
ケンスと、構造情報取得部11から得られる利用者提示
の構造情報X中の時間位置シーケンスから、両者の開始
時間位置のずれを候補値集合{O}を算出する。
21から得られる各オフセットOjを、構造情報取得部
11から得られる構造情報Xの各シーケンス項目に加算
することで、開始時間位置ずれを考慮した修正構造情報
Xjを生成する。
部22から得られる各修正構造情報Xjと、構造情報デ
ータベース12から取得している構造情報Yiを各々シ
ーケンス照合することにより、両シーケンス照合区間に
おける一致項目数Mij及び不一致項目数Uijを算出
する。
部23から得られる一致項目数Mij及び不一致項目数
Uijにより構造情報Yiに対する修正構造情報Xjの
類似性を判定し、最も類似している修正構造情報Xjに
対応する一致項目数及び不一致項目数をその結果の項目
数Mi,Uiとして出力する。
と構造情報データベース12中の該当データとの開始時
間にずれがあったとしても、そのずれを考慮したデータ
識別を行うことができる。
造情報照合部23の構成について説明する。
造情報照合部の修正構造情報照合部の構成を示す。
合区間算出部31、一致項目数遷移計測部32、不一致
項目数遷移計測部33、最適部分シーケンス判定部3
4、一致・不一致項目数算出部35から構成される。
れる両構造情報X,Yにおいて照合する可能性のある最
小時間及び最大時間を算出する。
照合区間算出部31から得られる照合区間内で、両構造
情報X,Yを時間順に比較することで得られる、シーケ
ンス間での一致項目数の時間変化を計測する。
ス照合区間算出部31から得られる照合区間内で、両構
造情報X,Yを時間順に比較することで得られる、シー
ケンス間での不一致項目数の時間変化を計測する。
目数遷移計測部32及び不一致項目数遷移計測部33か
ら得られる一致項目数遷移情報及び不一致項目遷移情報
から、両構造情報X,Y中で照合していると考えられる
シーケンス位置を判定する。一致・不一致項目数算出部
35は、最適部分シーケンス判定部34から得られる開
始時間・終了時間の範囲内における一致項目数M及び不
一致項目数Uを算出する。
が構造情報データベース12に登録されているデータの
一部分を包含するデータであったとしても、その開始・
終了時間を推定した上で、データ識別を行うことができ
る。
方法について説明する。
ータ識別方法のフローチャートである。
ータに関し、そのデータの構造情報を取得する(ステッ
プ101)。
子と共に、構造情報データベース12に格納する(ステ
ップ102)。
報Yiを取得し(ステップ103)、構造情報X及びY
iをシーケンス照合することで、両シーケンスの照合区
間における一致項目数Mi及び不一致項目数Uiを算出
する(ステップ104)。
り、構造情報Xに対する構造情報Yiの類似性を判定し
(ステップ105)、類似している場合には、その識別
子iを識別結果として出力し(ステップ106)、更
に、他の構造情報に対して識別処理を行うかどうかを判
定する(ステップ107)。
情報X及びYiとのシーケンス照合による一致項目数及
び不一致項目数を算出する際に、XとYiの間に開始時
間のずれがある場合に、その照合情報を的確に提供する
方法を説明する。
構造情報照合方法のフローチャートである。
造情報Yi中の時間位置シーケンスと、構造情報取得部
11から得られる構造情報X中の時間位置シーケンスか
ら、両者の開始時間位置のずれ(オフセット)の候補値
集合{O}を算出する(ステップ201)。
シーケンス項目に加算することで、修正構造情報Xjを
生成する(ステップ202)。
iを各々シーケンス照合することにより、両シーケンス
照合区間における一致項目数Mij及び不一致項目数U
ijを各々算出する(ステップ203)。
項目数Uijから構造情報Yiに最も類似している修正
構造情報Xjを判定する(ステップ204)。
一致項目数及び不一致項目数をその結果の項目数Mi、
Uiとして出力する(ステップ205)。
ける、構造情報X及びYとのシーケンス照合による一致
項目数及び不一致項目数算出処理において、XとYのシ
ーケンスの一部分だけが照合するような場合に、その照
合情報を的確に提供するための方法を説明する。
構造情報照合方法の詳細な処理のフローチャートであ
る。
する可能性のある各々の時間区間を算出する(ステップ
301)。
時間順に比較することで得られる、シーケンス間での一
致項目数の時間変化を計測する(ステップ302)と共
に、同様に、上記の時間区間内で、両構造情報X,Yを
時間順に比較することで得られる、シーケンス間での不
一致項目数の時間変化を計測する(ステップ303)。
3)により得られる一致項目数の時間変化及び不一致項
目数の時間変化から、両構造情報X,Y中で照合してい
ると考えられる部分シーケンスの開始・終了時間を判定
する(ステップ304)。
範囲内における一致項目数及び不一致項目数を算出する
(ステップ305)。
る。
の実施例によるシステム構成を示す。
は、映像コンテンツを対象としている。利用者は、識別
対象となる映像を提示し、その映像に類似していると判
定された登録済映像の識別子を、その識別結果として受
け取る。
出すべき特徴としては、映像におけるシーンの切り替わ
り(カット点)を用いる。カット点検出により得られる
カット点の各時間位置(当該映像コンテンツにおけるタ
イムコード)を構造情報の各項目とし、これらの項目を
昇順に並べた数値シーケンスを、当該映像コンテンツの
構造情報と規定する。
アント装置100と、サービス提供側のサーバ装置20
0とを有する。
ト装置100が接続され得る。また、各装置間は同一L
ANで接続されていても、異種WANで接続されていて
もよい。
部111、構造情報ファイル112、構造情報送信部1
13、識別子受信部114、及び利用者インタフェース
115から構成される。
ェース115から対象となる映像コンテンツを受け取
り、解析処理により映像中のシーンの切り替わりをカッ
ト点として検出し、その時間位置シーケンスを構造情報
として構成し、出力する。
部111が出力した構造情報をファイル化したものであ
る。なお、その実現方法としては、どのようなファイル
形式であってもよく、また、データベース中の1項目と
してクライアント装置100に格納されていてもよい。
ル112の記述内容(以下、構造情報Xと記す)をサー
バ装置200に送信する。
から、提示した映像に類似していると判定された映像を
表す識別子を受信する。
映像コンテンツを指示するためのインタフェースであ
り、その指示を受けて構造情報解析部111に映像コン
テンツを転送する。また、当該インタフェース115
は、識別子受信部114が受信した識別子を利用者に表
示する。なお、この識別子に基づいて該当映像コンテン
ツ及びその関連情報を表示するシステムを構成すること
が別途実現可能である。
1、構造情報データベース222、構造情報抽出部22
3、構造情報照合部224、類似性判定部225、識別
子送信部226から構成される。
置100により送信された構造情報Xを受信し、構造情
報データベース222に登録すると同時に、構造情報照
合部224に転送する。
受信部221において受信された構造情報Xを格納する
と同時に、構造情報抽出部223からのリクエストを待
ち受ける。構造情報データベース222、既存のデータ
ベース製品により実現することも可能であり、また、構
造情報毎のファイルを格納することでも実現すること
も、1つのファイル内の1エントリとして記述すること
で実現することも可能である。
置100から送信された構造情報Xの受信を識別処理開
始要求と見做し、構造情報データベース222から順次
構造情報抽出を行い、構造情報照合部224に転送す
る。構造情報抽出部223は、構造情報データベース2
22から抽出すべき構造情報の識別子を指示するが、そ
の識別子はデータベース中のすべての構造情報を対象と
してもよく、また何らかのルールに基づいて対象を制限
してもよい。
223から順次転送される各識別子及び構造情報(以
下、その識別子をiとし、その構造情報をYiと記す)
及び、構造情報受信部221により受信された構造情報
Xとの照合処理を行い、構造情報間の一致項目数Mi及
び不一致項目数Uiを算出し、識別子iと共に類似性判
定部225に転送する。
24から転送された一致項目数及び不一致項目数に基づ
いて、構造情報Yiと構造情報Xの類似性を判定する。
類似していると判定された場合は、その識別子iを識別
子送信部226に転送する。識別子送信部226は、類
似性判定部225から転送された識別子iをクライアン
ト装置100に送信する。
データ識別方法手順を示すシーケンスチャートである。
以下、図13を参照して、本実施例におけるデータ識別
方法の動作について説明する。
15を介して識別対象となる映像コンテンツを指示する
(ステップ401)。
送された映像コンテンツを構造情報解析部111が解析
し、構造情報を取得する(ステップ402)。本実施例
における構造情報解析手段であるカット点検出処理とし
ては、特許2839132号に記載されているカット・
ディゾルブを検出する方法を用いることができる。ある
カット(または、ディゾルブ)が検出された時間位置
(タイムコード)を構造情報の1つの項目とし、これら
の項目を昇順に並べた数値シーケンスを、当該映像コン
テンツの構造情報とする。本実施例における構造情報の
例を図14に示す(なお、本例では、映像の開始時間
(ゼロ)もカット点に含まれると見做している)。
造情報を、構造情報ファイル112としてクライアント
装置100内に書き込む(ステップ403)。ファイル
形式として、例えば、csv形式を用いることができ
る。
ァイル112内の構造情報Xをサーバ装置200へ送信
する(ステップ404)。サーバ装置200内の構造情
報受信部221は、その構造情報Xを受信する(ステッ
プ405)。
データベース222に構造情報Xを格納する(ステップ
406)。構造情報データベース222として、例え
ば、1つのファイル内のcsvエントリとしての登録・
参照で実現することができる。本実施例における構造情
報データベース222の例を図15に示す。
データベース222内の構造情報を順次抽出する(ステ
ップ407)。構造情報抽出部223は、抽出すべき識
別子を指示するが、ここでは、X以外のすべての識別子
を対象とする。その場合、図15に示したデータベース
を1エントリずつ取り出し、最初の項目を識別子、以降
を構造情報として抽出し、Xを除く1エントリごとに以
降のステップ408からステップ410までの処理を繰
り返すことで、すべての識別子に対する処理を実現する
ことができる。
抽出部223により抽出された構造情報Yiと、構造情
報受信部221により受信された構造情報Xを照合し
て、一致項目数Mi及び不一致項目数Uiを算出する
(ステップ408)。
Mi及び不一致項目数Uiから類似性を判定する(ステ
ップ409)。類似性判定は、Mi及びUiを用いた評
価式により実現することができる。本実施例における評
価式の一例として、Fi=Mi/(Mi+Ui)を用い
ることができる。Fiは、一致項目数Miが多いほど、
また、不一致項目数Uiが少ないほど大きい値をとり、
その範囲は0から1までである。Fiが閾値Fthを上
回る場合、構造情報XとYiが類似していると判定する
ことができる。類似していると判定された場合は、識別
子iを識別子送信部226に転送する。
クライアント装置100に送信する(ステップ41
0)。クライアント装置100内の識別子受信部114
は、その識別子iを受信する(ステップ411)。そし
て、利用者インタフェース115がその識別子iを表示
する(ステップ412)。
構造情報照合処理の動作のフローチャートである。以
下、構造情報照合処理について説明する。
と構造情報Yiにおける最末尾項目の値を比較し、その
値が小さい方を数列p、大きい方を数列qとして扱う。
数列pの項目数をm、数列qの項目数をnとする(ステ
ップ501)。図15の例を参考にすると、構造情報Y
iの方がp、構造情報Xの方がqとなる。また、m=n
=6となる。
不一致項目数Uiをゼロに、数列の引数としての変数t
及びkを2とする。数列p及びqにおける各項目の参照
は、これらt及びkを用いて先頭から順番で行われるも
のとする。従って、tは1からmまで、kは1からnま
での値をとる。以下、参照される項目の値をそれぞれp
[t]及びp[k]と表す。ここで、本実施例の照合処
理例における構造情報の時間位置(カット点位置)の定
義上、p[1]=q[1]=0なので、照合処理は、t
=k=2から開始される(ステップ502)。
基づく数列参照が行われる。
で、thは閾値であり、カット点検出処理における誤差
を考慮した値を設定する。式1が成立する場合には、p
[t]とq[k]は一致していないと判断され、不一致
項目数Uiに1が加算される(ステップ504)。その
後、引数kが最大項目数n未満であるかどうか判断され
(ステップ505)、n未満である場合は、kに1加え
て(ステップ506)、ステップ503の手順に戻る。
一方、kがnに達していた場合には、照合処理を終了す
る。
る場合には、やはりp[t]とq[k]は一致していな
いと判断され、不一致項目数Uiに1が加算される(ス
テップ508)。その後、引数tが最大項目数m未満で
あるかどうか判断され(ステップ509)、m未満であ
る場合にはtに1加えて(ステップ510)、ステップ
503の手順に戻る。一方、tがmに達していた場合に
は、照合処理を終了する。
[t]とq[k]が一致していると判断され、一致項目
数Miに1が加算される(ステップ511)。その後、
引数k及びtの範囲を確認後加算処理が行われ、最終項
目に到達していた場合には、照合処理を終了する(ステ
ップ512、513、509、510)。
して行った場合の処理例を図17に示す。同図中の表
は、図16のフローチャートに従い処理を実行した際
の、引数t及びkの遷移、各数列中の値の比較結果、M
i及びUiの遷移を示している。比較を繰り返した結
果、正しい一致項目数Mi及び不一致項目数Uiが得ら
れることがわかる。
の実施例によるシステム構成を示す。同図に示すシステ
ムにおけるデータとしては、前述の第1の実施例と同様
に、映像コンテンツを対象としている。利用者は、識別
対象となる映像を提示し、その映像に類似していると判
定された登録済映像の識別子を、その識別結果として受
け取る。
いる特徴としても、第1の実施例と同様に映像における
シーンの切り替わり(カット点)を用いる。しかし、本
実施例では、利用者の指示により人手でカット点を編集
することで構造情報を作成する。
同様に、利用者側のクライアント装置100とサービス
提供側のサーバ装置200とを含む。クライアント装置
100は、構造情報ファイル112、構造情報送信部1
13、識別子受信部114、利用者インタフェース11
5に加え、構造情報編集部116及び映像再生制御部1
17から構成される。
114までは、第1の実施例と同様の機能を有する。利
用者インタフェース115は、映像再生制御部117と
連動し、利用者が映像コンテンツのカット点を発見し、
その時間位置を指示・編集するためのインターフェース
である。また、同インタフェース115は、識別子受信
部114が受信した識別子を利用者に表示する。
ェース115からのカット点編集指示を受け、構造情報
へのカット点時間位置追加・修正・削除を行う。編集終
了時には、構造情報ファイル112に書込みを行う。
コンテンツの指示を受け、その再生及び停止・早送り・
巻き戻し・コマ送りなどの機能を提供すると共に、利用
者インタフェース115からカット点検出指示があった
際に、その時間位置を返答する。
る構造情報受信部221、構造情報データベース22
2、構造情報抽出部223、類似性判定部225、識別
子送信部226に加え、オフセット算出部227、修正
構造情報生成部228、修正構造情報照合部229、及
び、最適照合判定部230から構成される。
223及び類似性判定部225、識別子送信部226
は、第1の実施例と同様の機能を有する。
び構造情報Yiに基づいて、両者の開始時間位置のずれ
を表すオフセットを算出する。オフセットは候補集合と
して複数算出される。その算出ルールとして、ある一定
の時間間隔でオフセットを算出する方法が考えられる。
他に、構造情報Xのt番目の項目X[t]及び、構造情
報Yiのk番目の項目Yi[k]より、(Yi[k]−
X[t])をオフセット値として算出する方法も考えら
れる。本実施例では、後者の方法を想定し、その値を以
下、Ojと表す。引数jは、構造情報Xの項目数がm
個、構造情報Yiの項目数がn個である場合、1から最
大mnまでの値を取り得る。
算出部227から算出される各オフセットOjの値を用
いて、構造情報Xの各項目の値を修正し、修正構造情報
Xjを生成する。修正構造情報Xjのt番目の項目Xj
[t]は、 Xj[t]=X[t]+Oj により算出される。
報Xjと構造情報Yiの照合を行う。図19は、本発明
の第2の実施例における修正構造情報照合処理の動作の
フローチャートである。
おける図16のフローチャートとほぼ同様である。但
し、ステップ501における最末尾項目の値の代わりに
構造情報の全時間長を用いて判定する(ステップ601
〜603)。また、t及びkの初期値を1に、XをXj
に、Mi・UiをMij・Uijとする(ステップ60
4)。
合部229から出力される各Mij・Uijに基づき、
最も照合していると思われるXjを判定、そのMij・
UijをMi・Uiとして識別子iと共に出力する。そ
の判定には、第1の実施例と同様に評価式 Fij=Mij/(Mij+Uij) を用いることができる。この場合、最も大きいFijに
対応する修正構造情報Xjを採用することで、最適照合
を判定する。
構造情報照合までを、図20の構造情報データベース2
22の例に対して行った場合の例を図21に示す。この
場合、オフセットは、20個算出され、そのうち、オフ
セット値50に対して最適な照合(Mij=5,Uij
=2)が行われることがわかる。
の実施例によるシステム構成を示す。
第2の実施例と同様に、映像コンテンツを対象としてい
る。利用者は識別対象となる映像を提示し、その映像に
類似していると判定された登録済映像の識別子をその識
別結果として受け取る。
いる特徴としても、第1、第2の実施例と同様に、映像
におけるシーンの切り替わり(カット点)を用いる。本
実施例では、利用者が映像コンテンツそのものをサーバ
装置200に送信し、構造情報はサーバ装置200内で
作成される。
同様に、利用者側のクライアント装置100と、サービ
ス提供側のサーバ装置200とを含む。
114、利用者インタフェース115及び映像コンテン
ツ送信部118から構成される。
ース115は、第1の実施例と同様の機能を有する。映
像コンテンツ送信部118は、利用者インタフェース1
15に提示された映像コンテンツをサーバ装置200に
送信する。これは、HTML文やJava(登録商標)Scri
pt文などを用い、Webブラウザ上で動作するインタフ
ェースシステムとして容易に実現できる。
る構造情報データベース222から最適照合判定部23
0に加え、映像コンテンツ受信部232、構造情報解析
部232、シーケンス照合区間算出部233、一致項目
数遷移計測部234、不一致項目数遷移計測部235、
最適部分シーケンス判定部236、一致・不一致項目数
算出部237から構成される。
ント装置100から映像コンテンツを受信する。
おけるクライアント装置100内の構造情報解析部11
1と同様の機能を有する。映像コンテンツ受信部231
が受信した映像コンテンツを解析し、構造情報Xを出力
する。
出部223、オフセット算出部227、及び修正構造情
報生成部228は、第2の実施例と同様の機能を有す
る。
される構造情報Yi及び修正構造情報Xjより、照合の
可能性がある最小時間min及び最大時間maxを時間
区間として算出する。本実施例では、図23の構造情報
データベース222を例にとり、オフセットOj=90
であるときの修正構造情報Xjと構造情報Yiを対象に
して説明する。この場合、シーケンス照合区間算出部2
33において算出される値は、min=0,max=1
80となる。本算出は、両構造情報における項目の最小
値及び最大値を求めることで実現される。
目数遷移計測部235は、シーケンス照合区間算出部2
33より出力される時間区間内で、両構造情報における
一致項目数、不一致項目数の時間遷移を計測する。本計
測部234、235における計測処理は、第2の実施例
における修正構造情報照合処理フロー上で実現できる。
即ち、図19に示した動作フローチャートに基づく照合
処理を実施する際に、変数t及びkの値変化に対応する
一致項目数及び不一致項目数の値変化を、図17におけ
る表のように全て保存しておけばよい。図24は、この
ようにして得られる計測処理結果を時間軸にマッピング
した例を表している。
項目数遷移計測部234及び不一致項目数遷移計測部2
35から得られる遷移情報に基づき、照合していると考
えられるシーケンス位置を判定する。本実施例では、一
致項目数遷移情報Mtが増加傾向にあり、不一致項目数
遷移情報Utが増加しない時間区間をその部分シーケン
スとして判定する。図25に判定処理の例を示す。この
図の場合、Mtが増加を開始する100秒目から、Mt
が増加しなくなる160秒目までを最適部分シーケンス
として判定する。実際の処理として、Mtが増加してい
る間はフラグ処理などにより、シーケンス継続中と見做
し、ある閾値以内でUtが増加してもノイズと見做すこ
とにより最適部分シーケンスを判定する方法などを用い
ることができる。
部分シーケンス判定部236から得られるシーケンス位
置としての開始・終了時間に基づき、一致項目数遷移情
報Mt及び不一致項目数遷移情報Utから、一致項目M
ij及び不一致項目数Uijを算出する。本実施例にお
ける算出式としては、 Mij=Mt{OUT+}−Mt{IN−} Uij=Ut{OUT+}−Ut{IN−} を用いる。ここで、Mt{OUT+}とは、終了時間O
UT直後におけるMtの値であり、Mt{IN−}と
は、開始時間IN直前におけるMtの値である。図25
の場合、Mt{OUT+}=4,Mt{IN−}=0で
ある。従って、Mij=4−0=4となる。同様に、U
ij=2−2=0となる。
5及び識別子送信部226は、第2の実施例と同様の機
能を有する。
対象データと想定し、その構造情報取得において用いら
れる特徴としてカット点を想定している。この他にも、
例えば、音楽コンテンツを対象データと想定し、一定長
以上の無音区間が検出される点をその特徴点と定義する
ことが可能である。
取得のための特徴を1種類としたが、複数の特徴を用
い、それぞれに対する構造情報を取得した上で、各々の
照合処理を行い、それらの結果(それぞれの構造情報に
よる一致・不一致項目数)を合成することで、類似性判
定を行うことも可能である。合成方法としては、単純に
評価式の積をとる方法や、ルールによる場合分けを行う
方法などが考えられる。また、上記の3つの実施例にお
いては、構造情報の各項目の比較により、一致・不一致
を判定したが、同時に取得される特徴量を勘案した上
で、一致・不一致を判定することも可能である。例え
ば、あまりにも算出される特徴量に隔たりがある場合に
は、その比較判定を留保する(一致とも不一致とも見做
さない)等の方法をとることができる。
ステムにおける装置(クライアント、サーバ)各部の一
部もしくは全部の機能をコンピュータのプログラムで構
成し、そのプログラムをコンピュータを用いて実行して
本発明を実現することができること、あるいは、図1
6、図19の各フローチャートや本文中記載の説明文や
式で示した処理の手順をコンピュータのプログラムで構
成し、そのプログラムをコンピュータに実行させること
ができることは言うまでもなく、コンピュータでその機
能を実現するためのプログラム、あるいは、コンピュー
タにその処理の手順を実行させるためのプログラムを、
そのコンピュータが読み取り可能な記憶媒体、例えば、
フレキシブルディスク、MO,ROM,メモリカード、
CD,DVD、リムーバブルディスクなどの記録して、
保存したり、配布したりすることが可能である。
子メールなど、ネットワークを通して提供することも可
能である。また、上記のプログラムは、サーバやクライ
アントのコンピュータ別に作成されることは当然である
が、記録媒体への記録や、ネットワークを通しての提供
に際しては、一まとめにしたり、個別にしたり、組み合
わせたりして行ってもよい。
が、本発明は、上記の実施例に限定されることなく、特
許請求の範囲内において、種々変更・応用が可能であ
る。
れたデータにおけるある特徴が存在する時間位置のシー
ケンスからなる構造情報を用いることで、フレーム毎の
特徴量に比べ、識別・検索のためのデータ量を抑えるこ
とができる。
く、抽出された特徴量が存在する時間位置を照合に用い
ることで、特徴量の誤差に起因する比較誤りを回避する
ことができる。同様に、特徴量抽出誤りを許容できるデ
ータ識別を行うことができる。
の構成図である。
図である。
説明するための図である。
る照合処理を説明するための図である。
の構成図である。
の修正構造情報照合部の構成図である。
のフローチャートである。
方法のフローチャートである。
方法の詳細な処理のフローチャートである。
である。
法手順を示すフローチャートである。
ある。
タベース例である。
処理の動作のフローチャートである。
処理例である。
である。
照合処理の動作フローチャートである。
タベース例である。
出修正構造情報生成及び照合処理例である。
である。
タベース例及びオフセット算出に基づく修正構造情報の
例である。
項目数遷移計測の処理例である。
ケンス判定及び一致・不一致項目数算出の処理例であ
る。
関する説明図である。
関する説明図である。
明図である。
Claims (10)
- 【請求項1】 映像や音楽コンテンツなどのように表示
・再生処理における時間長を有するデータを蓄積したデ
ータベースからユーザからの提示データに対する類似デ
ータを識別・検索するデータ識別方法において、 表示・再生処理における時間長を有するデータから得ら
れる、ある特徴が存在する時間位置のシーケンスからな
る、該データの構造情報Xを取得する構造情報取得手順
と、 前記構造情報Xを、該構造情報の識別子と共に構造情報
データベースに格納する構造情報格納手順と、 前記構造情報データベースから別の構造情報Yiを取得
する検索手順と、 前記構造情報X及び構造情報Yiをシーケンス照合する
ことで、両シーケンス照合区間における一致項目数Mi
及び不一致項目数Uiを算出する構造情報照合手順と、 前記構造情報照合手順から得られる一致項目数Mi及び
不一致項目数Uiにより前記構造情報Xに対する構造情
報Yiの類似性を判定する類似性判定手順と、 類似している場合には、類似している構造情報の識別子
iを識別結果として出力する識別結果出力手順と、 更に他の構造情報に対して識別処理を行うかどうかを判
定する識別判定手順とを有することを特徴とするデータ
識別方法。 - 【請求項2】 前記構造情報照合手順において、 前記構造情報データベースから得られる構造情報Yi中
の時間位置シーケンスと、前記構造情報取得手順から得
られる構造情報X中の時間位置シーケンスから、両者の
開始時間位置のずれ(オフセット)の候補値集合{O}
を算出する手順と、 前記各オフセットOjを、前記構造情報Xの各シーケン
ス項目に加算することで、修正構造情報Xjを生成する
手順と、 前記各修正構造情報Xjと、前記構造情報Yiを各々シ
ーケンス照合することにより、両シーケンス照合区間に
おける一致項目数Mij及び不一致項目数Uijを各々
算出する手順と、を有し、 前記類似性判定手順において、 全ての前記一致項目数Mij及び前記不一致項目数Ui
jから構造情報Yiに最も類似している最類似修正構造
情報Xjを判定する手順と、 前記最類似修正構造情報Xjに対応する一致項目数及び
不一致項目数を、Mi、Uiとして出力する手順と、を
有する請求項1記載のデータ識別方法。 - 【請求項3】 前記構造情報照合手順において、 入力される前記構造情報X,Yにおいて、照合する可能
性のある各時間区間を算出する時間区間算出手順と、 前記時間区間内で、前記構造情報X,Yを時間順に比較
することで得られる、シーケンス間での一致項目数の時
間変化を計測する一致項目数遷移計測手順と、 前記時間区間内で、前記構造情報X,Yを時間順に比較
することで得られる、シーケンス間での不一致項目数の
時間変化を計測する不一致項目数遷移計測手順と、 前記一致項目数遷移計測手順と前記不一致項目数遷移計
測手順により得られる一致項目数の時間変化及び不一致
項目数の時間変化から、前記構造情報X,Y中で照合し
ていると考えられる部分シーケンスの開始・終了時間を
判定する手順と、 前記開始時間・前記終了時間の範囲内における一致項目
数及び不一致項目数を算出する手順と、を有する請求項
1または、2記載のデータ識別方法。 - 【請求項4】 映像や音楽コンテンツなどのように表示
・再生処理における時間長を有するデータを蓄積したデ
ータベースからユーザからの提示データに対する類似デ
ータを識別・検索するデータ識別装置であって、 表示・再生処理における時間長を有するデータから得ら
れる、ある特徴が存在する時間位置のシーケンスからな
る、該データの構造情報を取得する構造情報取得手段
と、 前記構造情報取得手段で取得した前記構造情報Xを、該
構造情報の識別子と共に格納する構造情報データベース
と、 前記構造情報取得手段から得られる利用者提示の構造情
報Xを、前記構造情報データベースから得られる構造情
報Yiとシーケンス照合することで、両シーケンス照合
区間における一致項目数Mi及び不一致項目数Uiを算
出する構造情報照合手段と、 前記構造情報照合手段から得られる一致項目数Mi及び
不一致項目数Uiにより前記構造情報Xに対する構造情
報Yiの類似性を判定し、類似している場合には、類似
している構造情報の識別子iを識別結果として出力する
類似構造情報識別手段と、を有することを特徴とするデ
ータ識別装置。 - 【請求項5】 前記構造情報照合手段は、 前記構造情報データベースから得られる構造情報Yi中
の時間位置シーケンスと、構造情報取得手段から得られ
る構造情報X中の時間位置シーケンスから、両者の開始
時間位置のずれ(オフセット)の候補値集合{O}を算
出するオフセット算出手段と、 前記オフセット算出手段から得られる前記各オフセット
Ojを、前記構造情報Xの各シーケンス項目に加算する
ことで、開始時間位置ずれを考慮した修正構造情報Xj
を生成する修正構造情報生成手段と、 前記修正構造情報生成手段から得られる前記各修正構造
情報Xjと、前記構造情報データベースから得られてい
る前記構造情報Yiを各々シーケンス照合することによ
り、両シーケンス照合区間における一致項目数Mij及
び不一致項目数Uijを各々算出する修正構造情報照合
手段と、を有し、 前記修正構造情報照合手段から得られる前記一致項目数
Mij及び前記不一致項目数Uijにより前記構造情報
Yiに対する修正構造情報Xjの類似性を判定し、最も
類似している最類似修正構造情報Xjに対応する一致項
目数及び不一致項目数を、その結果の項目数Mi、Ui
として出力する最適照合判定手段と、を有する請求項4
記載のデータ識別装置。 - 【請求項6】 前記構造情報照合手段は、 入力される前記構造情報X,Yにおいて、照合する可能
性のある各時間区間を算出するシーケンス照合区間算出
手段と、 前記シーケンス照合区間算出手段から得られる前記時間
区間内で、前記構造情報X,Yを時間順に比較すること
で得られる、シーケンス間での一致項目数の時間変化を
計測する一致項目数遷移計測手段と、 前記シーケンス照合区間算出手段から得られる前記時間
区間内で、前記構造情報X,Yを時間順に比較すること
で得られる、シーケンス間での不一致項目数の時間変化
を計測する不一致項目数遷移計測手段と、 前記一致項目数遷移計測手段と前記不一致項目数遷移計
測手段により得られる一致項目数の時間変化及び不一致
項目数の時間変化から、前記構造情報X,Y中で照合し
ていると考えられる部分シーケンスの開始・終了時間を
判定する最適部分シーケンス判定手段と、 前記最適部分シーケンス判定手段から得られる前記開始
時間・前記終了時間の範囲内における一致項目数及び不
一致項目数を算出する一致・不一致項目数算出手段と、
を有する請求項5記載のデータ識別装置。 - 【請求項7】 映像や音楽コンテンツなどのように表示
・再生処理における時間長を有するデータを蓄積したデ
ータベースからユーザからの提示データに対する類似デ
ータを識別・検索するデータ識別プログラムであって、 表示・再生処理における時間長を有するデータから得ら
れる、ある特徴が存在する時間位置のシーケンスからな
る、該データの構造情報Xを取得する構造情報取得ステ
ップと、 前記構造情報Xを、該構造情報の識別子と共に構造情報
データベースに格納する構造情報格納ステップと、 前記構造情報取得ステップからの前記構造情報Xを、前
記構造情報データベースから得られる構造情報Yiとシ
ーケンス照合することにより、両シーケンス照合区間に
おける一致項目数Mi及び不一致項目数Uiを算出する
構造情報照合ステップと、 前記構造情報照合ステップから得られる一致項目数Mi
及び不一致項目数Uiにより前記構造情報Xに対する構
造情報Yiの類似性を判定し、類似している場合にはそ
の識別子iを識別結果として出力する類似構造情報識別
ステップと、をコンピュータに実現させることを特徴と
するデータ識別プログラム。 - 【請求項8】 前記構造情報照合ステップにおいて、 前記構造情報データベースから得られる構造情報Yi中
の時間位置シーケンスと、構造情報取得ステップから得
られる構造情報X中の時間位置シーケンスから、両者の
開始時間位置のずれ(オフセット)の候補値集合{O}
を算出するオフセット算出ステップと、 前記オフセット算出ステップから得られる前記各オフセ
ットOjを、前記構造情報Xの各シーケンス項目に加算
することで、修正構造情報Xjを生成する修正構造情報
生成ステップと、 前記修正構造情報生成ステップから得られる前記各修正
構造情報Xjと、前記構造情報Yiを各々シーケンス照
合することにより、両シーケンス照合区間における一致
項目数Mij及び不一致項目数Uijを各々算出する修
正構造情報照合ステップと、 前記修正構造情報照合ステップから得られる全ての前記
一致項目数Mij及び前記不一致項目数Uijにより構
造情報Yiに対する修正構造情報Xjの類似性を判定
し、最も類似している修正構造情報Xjに対応する一致
項目数及び不一致項目数をその結果の項目数Mi、Ui
として出力する最適照合判定ステップと、をコンピュー
タに実現させる請求項7記載のデータ識別プログラム。 - 【請求項9】 前記修正構造情報照合ステップにおい
て、 入力される前記構造情報X,Yにおいて、照合する可能
性のある最小時間及び最大時間を算出するシーケンス照
合区間算出ステップと、 前記シーケンス照合区間算出ステップから得られる照合
区間内で、前記構造情報X,Yを時間順に比較すること
で得られる、シーケンス間での一致項目数の時間変化を
計測する一致項目数遷移計測ステップと、 前記シーケンス照合区間算出ステップから得られる時間
区間内で、前記構造情報X,Yを時間順に比較すること
で得られる、シーケンス間での不一致項目数の時間変化
を計測する不一致項目数遷移計測ステップと、 前記一致項目数遷移計測ステップと前記不一致項目数遷
移計測ステップにより得られる一致項目数遷移情報及び
不一致項目数遷移情報から、前記構造情報X,Y中で照
合していると考えられるシーケンス位置を判定する最適
部分シーケンス判定ステップと、 前記最適部分シーケンス判定ステップから得られる開始
時間・終了時間の範囲内における一致項目数M及び不一
致項目数Uを算出する一致・不一致項目数算出ステップ
と、を更にコンピュータに実現させる請求項8記載のデ
ータ識別プログラム。 - 【請求項10】 映像や音楽コンテンツなどのように表
示・再生処理における時間長を有するデータを蓄積した
データベースからユーザからの提示データに対する類似
データを識別・検索するデータ識別プログラムを格納し
た記憶媒体であって、 前記請求項7乃至前記請求項9記載のプログラムを格納
したことを特徴とするデータ識別プログラムを格納した
記憶媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002130746A JP4010179B2 (ja) | 2002-05-02 | 2002-05-02 | データ識別装置及びプログラム及びコンピュータ読み取り可能な記録媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002130746A JP4010179B2 (ja) | 2002-05-02 | 2002-05-02 | データ識別装置及びプログラム及びコンピュータ読み取り可能な記録媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2003323452A true JP2003323452A (ja) | 2003-11-14 |
JP4010179B2 JP4010179B2 (ja) | 2007-11-21 |
Family
ID=29543689
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002130746A Expired - Fee Related JP4010179B2 (ja) | 2002-05-02 | 2002-05-02 | データ識別装置及びプログラム及びコンピュータ読み取り可能な記録媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4010179B2 (ja) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006237878A (ja) * | 2005-02-23 | 2006-09-07 | Sony Corp | Cm付加情報供給方法、cm付加情報供給装置、cm付加情報受給装置及びcm付加情報供給システム |
JP2010011501A (ja) * | 2009-10-13 | 2010-01-14 | Sony Corp | 情報処理装置、情報処理方法、プログラムおよび記録媒体 |
JP2011529293A (ja) * | 2008-07-23 | 2011-12-01 | エルティーユー テクノロジーズ エスエーエス | フレームに基づくビデオマッチング |
US8312489B2 (en) | 2005-02-23 | 2012-11-13 | Sony Corporation | CM searching method and apparatus, and CM-appendant information supplying method and apparatus |
US8817104B2 (en) | 2007-08-20 | 2014-08-26 | Sony Corporation | Data processing device and data processing method |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104111931A (zh) * | 2013-04-17 | 2014-10-22 | 中国科学院声学研究所 | 一种协议自动识别方法及其所用分类器的构造方法 |
-
2002
- 2002-05-02 JP JP2002130746A patent/JP4010179B2/ja not_active Expired - Fee Related
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006237878A (ja) * | 2005-02-23 | 2006-09-07 | Sony Corp | Cm付加情報供給方法、cm付加情報供給装置、cm付加情報受給装置及びcm付加情報供給システム |
JP4710350B2 (ja) * | 2005-02-23 | 2011-06-29 | ソニー株式会社 | Cm付加情報供給方法、cm付加情報供給装置、cm付加情報受給装置及びcm付加情報供給システム |
US8312489B2 (en) | 2005-02-23 | 2012-11-13 | Sony Corporation | CM searching method and apparatus, and CM-appendant information supplying method and apparatus |
US8817104B2 (en) | 2007-08-20 | 2014-08-26 | Sony Corporation | Data processing device and data processing method |
JP2011529293A (ja) * | 2008-07-23 | 2011-12-01 | エルティーユー テクノロジーズ エスエーエス | フレームに基づくビデオマッチング |
JP2010011501A (ja) * | 2009-10-13 | 2010-01-14 | Sony Corp | 情報処理装置、情報処理方法、プログラムおよび記録媒体 |
Also Published As
Publication number | Publication date |
---|---|
JP4010179B2 (ja) | 2007-11-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN100535890C (zh) | 以arpa标准格式表示经删除插值n字母语言模型 | |
EP2657884B1 (en) | Identifying multimedia objects based on multimedia fingerprint | |
US8868569B2 (en) | Methods for detecting and removing duplicates in video search results | |
US20170126724A1 (en) | Log analyzing device, attack detecting device, attack detection method, and program | |
US20150332154A1 (en) | System and method for identifying social trends | |
CN110059223B (zh) | 用于机内循环、图像到视频计算机视觉引导的方法与装置 | |
US8892570B2 (en) | Method to dynamically design and configure multimedia fingerprint databases | |
JP5370159B2 (ja) | 情報抽出装置及び情報抽出システム | |
US20160210367A1 (en) | Transition event detection | |
US12020467B2 (en) | Method and apparatus for optimizing tag of point of interest, electronic device and computer readable medium | |
CN113806588B (zh) | 搜索视频的方法和装置 | |
KR101576935B1 (ko) | 정답 키워드 제공 방법 및 장치 | |
CN115358643B (zh) | 一种基于消息的上下游单据的生成方法、装置及存储介质 | |
US20150104065A1 (en) | Apparatus and method for recognizing object in image | |
JP2003323452A (ja) | データ識別方法及び装置及びデータ識別プログラム及びデータ識別プログラムを格納した記憶媒体 | |
CN112069833B (zh) | 日志分析方法、日志分析装置及电子设备 | |
JP2007318688A (ja) | 映像情報交換方法、サーバ装置、及びクライアント装置 | |
CN114189818A (zh) | 消息发送方法、装置、服务器及存储介质 | |
US8463725B2 (en) | Method for analyzing a multimedia content, corresponding computer program product and analysis device | |
CN116545740B (zh) | 一种基于大数据的威胁行为分析方法及服务器 | |
US8306992B2 (en) | System for determining content topicality, and method and program thereof | |
CN109376064B (zh) | 一种接口测试报告的生成方法及设备 | |
US8515947B2 (en) | Analyzing XML data | |
CN112612866B (zh) | 知识库文本同步方法、装置、电子设备及存储介质 | |
CN110442572B (zh) | 用户特征值的确定方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20040723 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20070703 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070720 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20070814 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20070827 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100914 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100914 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110914 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120914 Year of fee payment: 5 |
|
LAPS | Cancellation because of no payment of annual fees |