JP2003323452A - データ識別方法及び装置及びデータ識別プログラム及びデータ識別プログラムを格納した記憶媒体 - Google Patents

データ識別方法及び装置及びデータ識別プログラム及びデータ識別プログラムを格納した記憶媒体

Info

Publication number
JP2003323452A
JP2003323452A JP2002130746A JP2002130746A JP2003323452A JP 2003323452 A JP2003323452 A JP 2003323452A JP 2002130746 A JP2002130746 A JP 2002130746A JP 2002130746 A JP2002130746 A JP 2002130746A JP 2003323452 A JP2003323452 A JP 2003323452A
Authority
JP
Japan
Prior art keywords
structure information
matching
items
sequence
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2002130746A
Other languages
English (en)
Other versions
JP4010179B2 (ja
Inventor
Masashi Morimoto
正志 森本
Haruhiko Kojima
治彦 児島
Hidekatsu Kuwano
秀豪 桑野
Masakatsu Aoki
政勝 青木
Kazu Miyagawa
和 宮川
Akihisa Kobayashi
昭久 小林
Kazuo Yamada
一穂 山田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2002130746A priority Critical patent/JP4010179B2/ja
Publication of JP2003323452A publication Critical patent/JP2003323452A/ja
Application granted granted Critical
Publication of JP4010179B2 publication Critical patent/JP4010179B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【課題】 識別・検索のためのデータ量を抑えつつ、特
徴量抽出誤りや特徴量誤差に起因する識別性能低下を防
ぐ。 【解決手段】 本発明は、利用者が識別を要求する時間
長を有するデータに対し、ある特徴が存在する時間位置
のシーケンスからなるデータの構造情報Xを取得し、構
造情報データベースに格納し、構造情報データベースか
ら構造情報Yiを取得し、構造情報X及び構造情報Yi
をシーケンス照合することで、両シーケンス照合区間に
おける一致項目数Mi及び不一致項目数Uiを算出し、
Mi及びUiにより構造情報Xに対する構造情報Yiの
類似性を判定し、類似している構造情報の識別子iを識
別結果として出力する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、データ識別方法及
び装置及びデータ識別プログラム及びデータ識別プログ
ラムを格納した記憶媒体に係り、特に、映像や音楽コン
テンツなどのように表示・再生処理における時間長を有
するデータに係り、そのようなデータを蓄積したデータ
ベースから提示データに対する類似データを識別・検索
するためのデータ識別方法及び装置及びデータ識別プロ
グラム及びデータ識別プログラムを格納した記憶媒体に
関する。
【0002】
【従来の技術】映像や音楽コンテンツなどのように、表
示・再生処理における時間長を有するデータは、その性
質上瞬時に内容を確認することが難しい。そこで、その
内容を表す各種関連情報を付与することで、その識別性
能を向上させることができる。予めデータベースに蓄積
されたこのようなデータに対する識別・検索処理は、一
般的にはこれらの関連情報を対象とするキーワード検索
により実現することができる。以下では、映像コンテン
ツをこのようなデータの代表例として記すことにする。
【0003】映像コンテンツ検索における問題点の一つ
に、上記の関連情報が必ずしも映像コンテンツを十分に
表現しているとは限らない点を挙げることができる。即
ち、あるオペレータにより付与されたキーワードは、必
ずしも利用ユーザが想起するキーワードと一致しないこ
とが起こり得るわけである。この問題を解決するための
一つの手法に、キーワードではなく映像コンテンツが保
有する、もしくは、保有すると想定される特徴量を提示
することで検索を行う、類似映像検索がある。この場合
は、オペレータやユーザによる主観が入らないため、常
に同じ検索処理が期待される。しかし、その一方で、ど
のような特徴量を用いるか、検索時にユーザはその特徴
量をどのように求め、提示するのか、どのように照合を
行うのかなどの技術課題が発生する。
【0004】以下、従来の類似映像検索について説明す
る。
【0005】類似映像検索の一例として、ユーザが特徴
量を直接指示する手法がある。例えば、「ビデオデータ
を対象とする異種検索方式の統合システム」(第10回
データ工学ワークショップ、1999)では、フレーム
内の色の分布と移動方向を特徴量として抽出する一方、
ユーザはそれらを直接指示することによって映像を検索
する。しかしこの手法は、ユーザがあまり複雑な特徴量
やその変化を指示できないという問題がある。
【0006】そこで、別の手法として、映像自身(多く
は部分映像)もしくは、映像から抽出される特徴量をそ
のまま提示することによって検索する手法が考えられ
る。“Quick Audio Retrieval using Active Search ”
(ICASSP,1998) では、蓄積される映像に関して特徴量の
スペクトルを計算しておき、提示映像に対しても同様に
スペクトルヒストグラムを算出した後、図26に示すよ
うに、その比較を行うことで検索を実行する。上記の手
法は、基本的に映像のフレーム毎に特徴量を抽出する。
従って、その特徴量照合は、高速化処理の有無はあると
しても、フレーム毎の特徴量シーケンスを逐一比較する
ことにより実現される。
【0007】上記のようなフレーム単位の特徴量とは異
なり、映像コンテンツのショット長、もしくは、シーン
長を特徴量として用いた類似映像検索手法が提案されて
いる(特開平5−174072、特開平7−4651
7)。これらの方法では、映像シーンの切り替わり(一
般にカット点)で区切ることができる部分映像を1つの
ショットとして定義し、その時間長を特徴量とする方法
である。特徴量照合は、図27に示すように、ショット
長のシーケンスをその項目毎に逐一比較することにより
実現される。
【0008】
【発明が解決しようとする課題】しかしながら、上記従
来の類似検索技術には、以下のような相補的な問題点が
ある。
【0009】まず、最初の2例のようなフレーム毎の特
徴量を用いる手法では、総フレーム数に比例した特徴量
データ量を必要とする。従って、総フレーム数の増大に
伴い特徴量自身のデータ量が膨大になるという問題があ
る。一方、3つ目のショット長を用いる手法では、多数
のフレームがまとまって1つのショットを構成する。特
徴量はショット毎に抽出されるために、前者よりデータ
量の増加を抑えることができると考えられる。
【0010】その一方で、ショット長のシーケンスを逐
一比較することにより照合を行う場合、図28に示すよ
うに、カット点検出誤りが存在した場合、その誤りによ
り特徴量が大幅に変わってしまい、照合失敗となるとい
う問題がある。何らかの手段により比較処理を継続した
としても、その後のショット長比較対象の選択誤りにつ
ながる。即ち、誤り伝播を起こしてしまうという問題も
ある。なお、最初の2例の場合には、予め決められたフ
レーム毎の比較であるために、この問題が発生しない。
この問題を回避する手法として、例えば、比較処理をシ
ョット長のシーケンス順に行わず、ショット長の集合同
士を比較する手法を考えることができる。しかしその場
合、順序情報が失われるために(例えば、10,20,
30と30,10,20を区別できない)、識別性能が
低下する。また、照合失敗時点で次ショット長との加算
を行うなどの例外処理を行う手法も考えられるが、例外
処理停止のためのルールを導入する必要があり(例え
ば、3つ先までは加算可能など)、処理が複雑になる。
【0011】また、いずれの従来技術においても、抽出
された特徴量そのものを比較対象、即ち、類似性の根拠
としている。従って、例えば、映像フォーマットや解像
度の変化に起因する特徴量変化の影響を受けやすいとい
う問題が存在する。
【0012】本発明は、上記の点に鑑みなされたもの
で、識別・検索のためのデータ量を抑えつつ、特徴量抽
出誤りや特徴量誤差に起因する識別性能低下を防ぐこと
が可能なデータ識別方法及び装置及びデータ識別プログ
ラム及びデータ識別プログラムを格納した記憶媒体を提
供することを目的とする。
【0013】
【課題を解決するための手段】図1は、本発明の原理を
説明するための図である。
【0014】本発明は、映像や音楽コンテンツなどのよ
うに表示・再生処理における時間長を有するデータを蓄
積したデータベースからユーザからの提示データに対す
る類似データを識別・検索するデータ識別方法におい
て、表示・再生処理における時間長を有するデータから
得られる、ある特徴が存在する時間位置のシーケンスか
らなる、該データの構造情報Xを取得する構造情報取得
手順(ステップ1)と、構造情報Xを、該構造情報の識
別子と共に構造情報データベースに格納する構造情報格
納手順(ステップ2)と、構造情報データベースから別
の構造情報Yiを取得する検索手順(ステップ3)と、
構造情報X及び構造情報Yiをシーケンス照合すること
で、両シーケンス照合区間における一致項目数Mi及び
不一致項目数Uiを算出する構造情報照合手順(ステッ
プ4)と、構造情報照合手順から得られる一致項目数M
i及び不一致項目数Uiにより構造情報Xに対する構造
情報Yiの類似性を判定する類似性判定手順(ステップ
5)と、類似している場合には、類似している構造情報
の識別子iを識別結果として出力する識別結果出力手順
(ステップ6)と、更に他の構造情報に対して識別処理
を行うかどうかを判定する識別判定手順(ステップ7)
とを有する。
【0015】本発明のデータ識別方法は、構造情報照合
手順において、構造情報データベースから得られる構造
情報Yi中の時間位置シーケンスと、構造情報取得手順
から得られる構造情報X中の時間位置シーケンスから、
両者の開始時間位置のずれ(オフセット)の候補値集合
{O}を算出する手順と、各オフセットOjを、構造情
報Xの各シーケンス項目に加算することで、修正構造情
報Xjを生成する手順と、各修正構造情報Xjと、構造
情報Yiを各々シーケンス照合することにより、両シー
ケンス照合区間における一致項目数Mij及び不一致項
目数Uijを各々算出する手順と、を有し、類似性判定
手順において、全ての一致項目数Mij及び不一致項目
数Uijから構造情報Yiに最も類似している最類似修
正構造情報Xjを判定する手順と、最類似修正構造情報
Xjに対応する一致項目数及び不一致項目数を、Mi、
Uiとして出力する手順と、を有する。
【0016】本発明のデータ識別方法は、構造情報照合
手順において、入力される構造情報X,Yにおいて、照
合する可能性のある各時間区間を算出する時間区間算出
手順と、時間区間内で、構造情報X,Yを時間順に比較
することで得られる、シーケンス間での一致項目数の時
間変化を計測する一致項目数遷移計測手順と、時間区間
内で、構造情報X,Yを時間順に比較することで得られ
る、シーケンス間での不一致項目数の時間変化を計測す
る不一致項目数遷移計測手順と、一致項目数遷移計測手
順と不一致項目数遷移計測手順により得られる一致項目
数の時間変化及び不一致項目数の時間変化から、構造情
報X,Y中で照合していると考えられる部分シーケンス
の開始・終了時間を判定する手順と、開始時間・終了時
間の範囲内における一致項目数及び不一致項目数を算出
する手順と、を有する。
【0017】図2は、本発明の原理構成図である。
【0018】本発明は、映像や音楽コンテンツなどのよ
うに表示・再生処理における時間長を有するデータを蓄
積したデータベースからユーザからの提示データに対す
る類似データを識別・検索するデータ識別装置1であっ
て、表示・再生処理における時間長を有するデータから
得られる、ある特徴が存在する時間位置のシーケンスか
らなる、該データの構造情報を取得する構造情報取得手
段11と、構造情報取得手段11で取得した構造情報X
を、該構造情報の識別子と共に格納する構造情報データ
ベース12と、構造情報取得手段11から得られる利用
者提示の構造情報Xを、構造情報データベースから得ら
れる構造情報Yiとシーケンス照合することで、両シー
ケンス照合区間における一致項目数Mi及び不一致項目
数Uiを算出する構造情報照合手段13と、構造情報照
合手段13から得られる一致項目数Mi及び不一致項目
数Uiにより構造情報Xに対する構造情報Yiの類似性
を判定し、類似している場合には、類似している構造情
報の識別子iを識別結果として出力する類似構造情報識
別手段14と、を有する。
【0019】本発明のデータ識別装置1の構造情報照合
手段13は、構造情報データベース12から得られる構
造情報Yi中の時間位置シーケンスと、構造情報取得手
段から得られる構造情報X中の時間位置シーケンスか
ら、両者の開始時間位置のずれ(オフセット)の候補値
集合{O}を算出するオフセット算出手段と、オフセッ
ト算出手段から得られる各オフセットOjを、構造情報
Xの各シーケンス項目に加算することで、開始時間位置
ずれを考慮した修正構造情報Xjを生成する修正構造情
報生成手段と、修正構造情報生成手段から得られる各修
正構造情報Xjと、構造情報データベース12から得ら
れている構造情報Yiを各々シーケンス照合することに
より、両シーケンス照合区間における一致項目数Mij
及び不一致項目数Uijを各々算出する修正構造情報照
合手段と、を有し、修正構造情報照合手段から得られる
一致項目数Mij及び不一致項目数Uijにより構造情
報Yiに対する修正構造情報Xjの類似性を判定し、最
も類似している最類似修正構造情報Xjに対応する一致
項目数及び不一致項目数を、その結果の項目数Mi、U
iとして出力する最適照合判定手段と、を有する。
【0020】本発明のデータ識別装置1の構造情報照合
手段13は、入力される構造情報X,Yにおいて、照合
する可能性のある各時間区間を算出するシーケンス照合
区間算出手段と、シーケンス照合区間算出手段から得ら
れる時間区間内で、構造情報X,Yを時間順に比較する
ことで得られる、シーケンス間での一致項目数の時間変
化を計測する一致項目数遷移計測手段と、シーケンス照
合区間算出手段から得られる時間区間内で、構造情報
X,Yを時間順に比較することで得られる、シーケンス
間での不一致項目数の時間変化を計測する不一致項目数
遷移計測手段と、一致項目数遷移計測手段と不一致項目
数遷移計測手段により得られる一致項目数の時間変化及
び不一致項目数の時間変化から、構造情報X,Y中で照
合していると考えられる部分シーケンスの開始・終了時
間を判定する最適部分シーケンス判定手段と、最適部分
シーケンス判定手段から得られる開始時間・終了時間の
範囲内における一致項目数及び不一致項目数を算出する
一致・不一致項目数算出手段と、を有する。
【0021】本発明は、映像や音楽コンテンツなどのよ
うに表示・再生処理における時間長を有するデータを蓄
積したデータベースからユーザからの提示データに対す
る類似データを識別・検索するデータ識別プログラムで
あって、表示・再生処理における時間長を有するデータ
から得られる、ある特徴が存在する時間位置のシーケン
スからなる、該データの構造情報Xを取得する構造情報
取得ステップと、構造情報Xを、該構造情報の識別子と
共に構造情報データベースに格納する構造情報格納ステ
ップと、構造情報取得ステップからの構造情報Xを、構
造情報データベースから得られる構造情報Yiとシーケ
ンス照合することにより、両シーケンス照合区間におけ
る一致項目数Mi及び不一致項目数Uiを算出する構造
情報照合ステップと、構造情報照合ステップから得られ
る一致項目数Mi及び不一致項目数Uiにより構造情報
Xに対する構造情報Yiの類似性を判定し、類似してい
る場合にはその識別子iを識別結果として出力する類似
構造情報識別ステップと、をコンピュータに実現させ
る。
【0022】本発明のデータ識別プログラムの構造情報
照合ステップは、構造情報データベースから得られる構
造情報Yi中の時間位置シーケンスと、構造情報取得ス
テップから得られる構造情報X中の時間位置シーケンス
から、両者の開始時間位置のずれ(オフセット)の候補
値集合{O}を算出するオフセット算出ステップと、オ
フセット算出ステップから得られる各オフセットOj
を、構造情報Xの各シーケンス項目に加算することで、
修正構造情報Xjを生成する修正構造情報生成ステップ
と、修正構造情報生成ステップから得られる各修正構造
情報Xjと、構造情報Yiを各々シーケンス照合するこ
とにより、両シーケンス照合区間における一致項目数M
ij及び不一致項目数Uijを各々算出する修正構造情
報照合ステップと、修正構造情報照合ステップから得ら
れる全ての一致項目数Mij及び不一致項目数Uijに
より構造情報Yiに対する修正構造情報Xjの類似性を
判定し、最も類似している修正構造情報Xjに対応する
一致項目数及び不一致項目数をその結果の項目数Mi、
Uiとして出力する最適照合判定ステップと、をコンピ
ュータに実現させる。
【0023】本発明のデータ識別プログラムの修正構造
情報照合ステップにおいて、入力される構造情報X,Y
において、照合する可能性のある最小時間及び最大時間
を算出するシーケンス照合区間算出ステップと、シーケ
ンス照合区間算出ステップから得られる照合区間内で、
構造情報X,Yを時間順に比較することで得られる、シ
ーケンス間での一致項目数の時間変化を計測する一致項
目数遷移計測ステップと、シーケンス照合区間算出ステ
ップから得られる時間区間内で、構造情報X,Yを時間
順に比較することで得られる、シーケンス間での不一致
項目数の時間変化を計測する不一致項目数遷移計測ステ
ップと、一致項目数遷移計測ステップと不一致項目数遷
移計測ステップにより得られる一致項目数遷移情報及び
不一致項目数遷移情報から、構造情報X,Y中で照合し
ていると考えられるシーケンス位置を判定する最適部分
シーケンス判定ステップと、最適部分シーケンス判定ス
テップから得られる開始時間・終了時間の範囲内におけ
る一致項目数M及び不一致項目数Uを算出する一致・不
一致項目数算出ステップとを更にコンピュータに実現さ
せる。本発明は、映像や音楽コンテンツなどのように表
示・再生処理における時間長を有するデータを蓄積した
データベースからユーザからの提示データに対する類似
データを識別・検索するデータ識別プログラムを格納し
た記憶媒体であって、請求項7乃至請求項9記載のプロ
グラムを格納する。
【0024】上記のように、本発明では、提示されたデ
ータにおける、ある特徴が存在する時間位置のシーケン
スからなる構造情報を用いることで、フレーム毎の特徴
量に比べて識別・検索のためのデータ量を抑えることが
可能となる。
【0025】
【発明の実施の形態】以下、図面と共に本発明の実施の
形態を説明する。
【0026】図3は、本発明の一実施の形態におけるデ
ータ識別装置の構成を示す。
【0027】同図に示すデータ識別装置1は、構造情報
取得部11、構造情報データベース12、構造情報照合
部13、類似構造情報識別部14から構成される。
【0028】構造情報取得部11は、表示・再生処理に
おける時間長を有するデータに関し、そのデータから得
られる、ある特徴が存在する時間位置のシーケンスから
なる、そのデータの構造情報を取得する。
【0029】構造情報データベース12は、構造情報取
得部11からの構造情報を、そのデータの識別子と共に
格納する。
【0030】構造情報照合部13は、構造情報取得部1
1から得られる利用者提示の構造情報Xを、構造情報デ
ータベース12から得られる構造情報Yiとシーケンス
照合することにより、両シーケンス照合区間における一
致項目数Mi及び不一致項目数Uiを算出する。
【0031】類似構造情報識別部14は、構造情報照合
部13から得られる一致項目数Mi及び不一致項目数U
iにより構造情報Xに対する構造情報Yiの類似性を判
定し、類似している場合には、その識別子iを識別結果
として出力する。
【0032】図4は、本発明の一実施の形態における構
造情報の概念図を示し、図5は、本発明の一実施の形態
における構造情報照合を説明するための図である。
【0033】図4に示すように、提示されたデータにお
ける、ある特徴が存在する時間位置のシーケンスからな
る構造情報を用いることで、フレーム毎の特徴量に比べ
て識別・検索のためのデータ量を抑えることができる。
また、図5に示すように、抽出される特徴量そのもので
はなく、抽出された特徴量が存在する時間位置を照合に
用いることで、特徴量の誤差に起因する比較誤りを回避
することができる。
【0034】図6は、本発明の一実施の形態における検
出誤りに対する照合処理を説明するための図である。同
図に示すように、構造情報におけるシーケンスの一部項
目が誤検出もしくは、検出漏れされたとしても、その影
響がその後の比較処理に伝播しない。これにより、特徴
量抽出誤りを許容できるデータ識別を行うことができ
る。
【0035】次に、構造情報照合部13について説明す
る。
【0036】図7は、本発明の一実施の形態における構
造情報照合部の構成を示す。
【0037】同図に示す構造情報照合部13は、オフセ
ット算出部21、修正構造情報生成部22、修正構造情
報照合部23、最適照合判定部24から構成される。
【0038】オフセット算出部21は、構造情報データ
ベース12から得られる構造情報Yi中の時間位置シー
ケンスと、構造情報取得部11から得られる利用者提示
の構造情報X中の時間位置シーケンスから、両者の開始
時間位置のずれを候補値集合{O}を算出する。
【0039】修正構造生成部22は、オフセット算出部
21から得られる各オフセットOjを、構造情報取得部
11から得られる構造情報Xの各シーケンス項目に加算
することで、開始時間位置ずれを考慮した修正構造情報
Xjを生成する。
【0040】修正構造情報照合部23は、修正構造生成
部22から得られる各修正構造情報Xjと、構造情報デ
ータベース12から取得している構造情報Yiを各々シ
ーケンス照合することにより、両シーケンス照合区間に
おける一致項目数Mij及び不一致項目数Uijを算出
する。
【0041】最適照合判定部24は、修正構造情報照合
部23から得られる一致項目数Mij及び不一致項目数
Uijにより構造情報Yiに対する修正構造情報Xjの
類似性を判定し、最も類似している修正構造情報Xjに
対応する一致項目数及び不一致項目数をその結果の項目
数Mi,Uiとして出力する。
【0042】これにより、利用者から提示されたデータ
と構造情報データベース12中の該当データとの開始時
間にずれがあったとしても、そのずれを考慮したデータ
識別を行うことができる。
【0043】次に、上記の構造情報照合部13の修正構
造情報照合部23の構成について説明する。
【0044】図8は、本発明の一実施の形態における構
造情報照合部の修正構造情報照合部の構成を示す。
【0045】修正構造情報照合部23は、シーケンス照
合区間算出部31、一致項目数遷移計測部32、不一致
項目数遷移計測部33、最適部分シーケンス判定部3
4、一致・不一致項目数算出部35から構成される。
【0046】シーケンス照合区間算出部31は、入力さ
れる両構造情報X,Yにおいて照合する可能性のある最
小時間及び最大時間を算出する。
【0047】一致項目数遷移計測部32は、シーケンス
照合区間算出部31から得られる照合区間内で、両構造
情報X,Yを時間順に比較することで得られる、シーケ
ンス間での一致項目数の時間変化を計測する。
【0048】不一致項目数遷移計測部33は、シーケン
ス照合区間算出部31から得られる照合区間内で、両構
造情報X,Yを時間順に比較することで得られる、シー
ケンス間での不一致項目数の時間変化を計測する。
【0049】最適部分シーケンス判定部34は、一致項
目数遷移計測部32及び不一致項目数遷移計測部33か
ら得られる一致項目数遷移情報及び不一致項目遷移情報
から、両構造情報X,Y中で照合していると考えられる
シーケンス位置を判定する。一致・不一致項目数算出部
35は、最適部分シーケンス判定部34から得られる開
始時間・終了時間の範囲内における一致項目数M及び不
一致項目数Uを算出する。
【0050】このような構成により、提示されたデータ
が構造情報データベース12に登録されているデータの
一部分を包含するデータであったとしても、その開始・
終了時間を推定した上で、データ識別を行うことができ
る。
【0051】次に、データ識別情報を利用者に提供する
方法について説明する。
【0052】図9は、本発明の一実施の形態におけるデ
ータ識別方法のフローチャートである。
【0053】表示・再生処理における時間長を有するデ
ータに関し、そのデータの構造情報を取得する(ステッ
プ101)。
【0054】取得した構造情報Xを、そのデータの識別
子と共に、構造情報データベース12に格納する(ステ
ップ102)。
【0055】構造情報データベース12から別の構造情
報Yiを取得し(ステップ103)、構造情報X及びY
iをシーケンス照合することで、両シーケンスの照合区
間における一致項目数Mi及び不一致項目数Uiを算出
する(ステップ104)。
【0056】一致項目数Mi及び不一致項目数Uiによ
り、構造情報Xに対する構造情報Yiの類似性を判定し
(ステップ105)、類似している場合には、その識別
子iを識別結果として出力し(ステップ106)、更
に、他の構造情報に対して識別処理を行うかどうかを判
定する(ステップ107)。
【0057】上記のステップ104における、ある構造
情報X及びYiとのシーケンス照合による一致項目数及
び不一致項目数を算出する際に、XとYiの間に開始時
間のずれがある場合に、その照合情報を的確に提供する
方法を説明する。
【0058】図10は、本発明の一実施の形態における
構造情報照合方法のフローチャートである。
【0059】構造情報データベース12から得られる構
造情報Yi中の時間位置シーケンスと、構造情報取得部
11から得られる構造情報X中の時間位置シーケンスか
ら、両者の開始時間位置のずれ(オフセット)の候補値
集合{O}を算出する(ステップ201)。
【0060】上記のオフセットOjを、構造情報Xの各
シーケンス項目に加算することで、修正構造情報Xjを
生成する(ステップ202)。
【0061】上記の各修正構造情報Xjと、構造情報Y
iを各々シーケンス照合することにより、両シーケンス
照合区間における一致項目数Mij及び不一致項目数U
ijを各々算出する(ステップ203)。
【0062】上記の全ての一致項目数Mij及び不一致
項目数Uijから構造情報Yiに最も類似している修正
構造情報Xjを判定する(ステップ204)。
【0063】上記の最類似修正構造情報Xjに対応する
一致項目数及び不一致項目数をその結果の項目数Mi、
Uiとして出力する(ステップ205)。
【0064】上記の図10におけるステップ203にお
ける、構造情報X及びYとのシーケンス照合による一致
項目数及び不一致項目数算出処理において、XとYのシ
ーケンスの一部分だけが照合するような場合に、その照
合情報を的確に提供するための方法を説明する。
【0065】図11は、本発明の一実施の形態における
構造情報照合方法の詳細な処理のフローチャートであ
る。
【0066】入力される両構造情報X,Yにおいて照合
する可能性のある各々の時間区間を算出する(ステップ
301)。
【0067】上記の時間区間内で、両構造情報X,Yを
時間順に比較することで得られる、シーケンス間での一
致項目数の時間変化を計測する(ステップ302)と共
に、同様に、上記の時間区間内で、両構造情報X,Yを
時間順に比較することで得られる、シーケンス間での不
一致項目数の時間変化を計測する(ステップ303)。
【0068】上記の2つの手順(ステップ302、30
3)により得られる一致項目数の時間変化及び不一致項
目数の時間変化から、両構造情報X,Y中で照合してい
ると考えられる部分シーケンスの開始・終了時間を判定
する(ステップ304)。
【0069】上記により得られる開始時間・終了時間の
範囲内における一致項目数及び不一致項目数を算出する
(ステップ305)。
【0070】
【実施例】以下、図面と共に本発明の実施例を説明す
る。
【0071】[第1の実施例]図12は、本発明の第1
の実施例によるシステム構成を示す。
【0072】同図に示すシステムにおけるデータとして
は、映像コンテンツを対象としている。利用者は、識別
対象となる映像を提示し、その映像に類似していると判
定された登録済映像の識別子を、その識別結果として受
け取る。
【0073】また、本システムでの構造情報において検
出すべき特徴としては、映像におけるシーンの切り替わ
り(カット点)を用いる。カット点検出により得られる
カット点の各時間位置(当該映像コンテンツにおけるタ
イムコード)を構造情報の各項目とし、これらの項目を
昇順に並べた数値シーケンスを、当該映像コンテンツの
構造情報と規定する。
【0074】同図に示すシステムは、利用者側のクライ
アント装置100と、サービス提供側のサーバ装置20
0とを有する。
【0075】サーバ装置200には、複数のクライアン
ト装置100が接続され得る。また、各装置間は同一L
ANで接続されていても、異種WANで接続されていて
もよい。
【0076】クライアント装置100は、構造情報解析
部111、構造情報ファイル112、構造情報送信部1
13、識別子受信部114、及び利用者インタフェース
115から構成される。
【0077】構造情報解析部111は、利用者インタフ
ェース115から対象となる映像コンテンツを受け取
り、解析処理により映像中のシーンの切り替わりをカッ
ト点として検出し、その時間位置シーケンスを構造情報
として構成し、出力する。
【0078】構造情報ファイル112は、構造情報解析
部111が出力した構造情報をファイル化したものであ
る。なお、その実現方法としては、どのようなファイル
形式であってもよく、また、データベース中の1項目と
してクライアント装置100に格納されていてもよい。
【0079】構造情報送信部113は、構造情報ファイ
ル112の記述内容(以下、構造情報Xと記す)をサー
バ装置200に送信する。
【0080】識別子受信部114は、サーバ装置200
から、提示した映像に類似していると判定された映像を
表す識別子を受信する。
【0081】利用者インタフェース115は、利用者が
映像コンテンツを指示するためのインタフェースであ
り、その指示を受けて構造情報解析部111に映像コン
テンツを転送する。また、当該インタフェース115
は、識別子受信部114が受信した識別子を利用者に表
示する。なお、この識別子に基づいて該当映像コンテン
ツ及びその関連情報を表示するシステムを構成すること
が別途実現可能である。
【0082】サーバ装置200は、構造情報受信部22
1、構造情報データベース222、構造情報抽出部22
3、構造情報照合部224、類似性判定部225、識別
子送信部226から構成される。
【0083】構造情報受信部221は、クライアント装
置100により送信された構造情報Xを受信し、構造情
報データベース222に登録すると同時に、構造情報照
合部224に転送する。
【0084】構造情報データベース222は、構造情報
受信部221において受信された構造情報Xを格納する
と同時に、構造情報抽出部223からのリクエストを待
ち受ける。構造情報データベース222、既存のデータ
ベース製品により実現することも可能であり、また、構
造情報毎のファイルを格納することでも実現すること
も、1つのファイル内の1エントリとして記述すること
で実現することも可能である。
【0085】構造情報抽出部223は、クライアント装
置100から送信された構造情報Xの受信を識別処理開
始要求と見做し、構造情報データベース222から順次
構造情報抽出を行い、構造情報照合部224に転送す
る。構造情報抽出部223は、構造情報データベース2
22から抽出すべき構造情報の識別子を指示するが、そ
の識別子はデータベース中のすべての構造情報を対象と
してもよく、また何らかのルールに基づいて対象を制限
してもよい。
【0086】構造情報照合部224は、構造情報抽出部
223から順次転送される各識別子及び構造情報(以
下、その識別子をiとし、その構造情報をYiと記す)
及び、構造情報受信部221により受信された構造情報
Xとの照合処理を行い、構造情報間の一致項目数Mi及
び不一致項目数Uiを算出し、識別子iと共に類似性判
定部225に転送する。
【0087】類似性判定部225は、構造情報照合部2
24から転送された一致項目数及び不一致項目数に基づ
いて、構造情報Yiと構造情報Xの類似性を判定する。
類似していると判定された場合は、その識別子iを識別
子送信部226に転送する。識別子送信部226は、類
似性判定部225から転送された識別子iをクライアン
ト装置100に送信する。
【0088】図13は、本発明の第1の実施例における
データ識別方法手順を示すシーケンスチャートである。
以下、図13を参照して、本実施例におけるデータ識別
方法の動作について説明する。
【0089】まず、利用者は、利用者インタフェース1
15を介して識別対象となる映像コンテンツを指示する
(ステップ401)。
【0090】次に、利用者インタフェース115から転
送された映像コンテンツを構造情報解析部111が解析
し、構造情報を取得する(ステップ402)。本実施例
における構造情報解析手段であるカット点検出処理とし
ては、特許2839132号に記載されているカット・
ディゾルブを検出する方法を用いることができる。ある
カット(または、ディゾルブ)が検出された時間位置
(タイムコード)を構造情報の1つの項目とし、これら
の項目を昇順に並べた数値シーケンスを、当該映像コン
テンツの構造情報とする。本実施例における構造情報の
例を図14に示す(なお、本例では、映像の開始時間
(ゼロ)もカット点に含まれると見做している)。
【0091】次に、構造情報解析部111が取得した構
造情報を、構造情報ファイル112としてクライアント
装置100内に書き込む(ステップ403)。ファイル
形式として、例えば、csv形式を用いることができ
る。
【0092】次に、構造情報送信部113が構造情報フ
ァイル112内の構造情報Xをサーバ装置200へ送信
する(ステップ404)。サーバ装置200内の構造情
報受信部221は、その構造情報Xを受信する(ステッ
プ405)。
【0093】次に、構造情報受信部221は、構造情報
データベース222に構造情報Xを格納する(ステップ
406)。構造情報データベース222として、例え
ば、1つのファイル内のcsvエントリとしての登録・
参照で実現することができる。本実施例における構造情
報データベース222の例を図15に示す。
【0094】次に、構造情報抽出部223は、構造情報
データベース222内の構造情報を順次抽出する(ステ
ップ407)。構造情報抽出部223は、抽出すべき識
別子を指示するが、ここでは、X以外のすべての識別子
を対象とする。その場合、図15に示したデータベース
を1エントリずつ取り出し、最初の項目を識別子、以降
を構造情報として抽出し、Xを除く1エントリごとに以
降のステップ408からステップ410までの処理を繰
り返すことで、すべての識別子に対する処理を実現する
ことができる。
【0095】次に、構造情報照合部224は、構造情報
抽出部223により抽出された構造情報Yiと、構造情
報受信部221により受信された構造情報Xを照合し
て、一致項目数Mi及び不一致項目数Uiを算出する
(ステップ408)。
【0096】次に、類似性判定部225は、一致項目数
Mi及び不一致項目数Uiから類似性を判定する(ステ
ップ409)。類似性判定は、Mi及びUiを用いた評
価式により実現することができる。本実施例における評
価式の一例として、Fi=Mi/(Mi+Ui)を用い
ることができる。Fiは、一致項目数Miが多いほど、
また、不一致項目数Uiが少ないほど大きい値をとり、
その範囲は0から1までである。Fiが閾値Fthを上
回る場合、構造情報XとYiが類似していると判定する
ことができる。類似していると判定された場合は、識別
子iを識別子送信部226に転送する。
【0097】次に、識別子送信部226は、識別子iを
クライアント装置100に送信する(ステップ41
0)。クライアント装置100内の識別子受信部114
は、その識別子iを受信する(ステップ411)。そし
て、利用者インタフェース115がその識別子iを表示
する(ステップ412)。
【0098】図16は、本発明の第1の実施例における
構造情報照合処理の動作のフローチャートである。以
下、構造情報照合処理について説明する。
【0099】まず、構造情報Xにおける最末尾項目の値
と構造情報Yiにおける最末尾項目の値を比較し、その
値が小さい方を数列p、大きい方を数列qとして扱う。
数列pの項目数をm、数列qの項目数をnとする(ステ
ップ501)。図15の例を参考にすると、構造情報Y
iの方がp、構造情報Xの方がqとなる。また、m=n
=6となる。
【0100】次に、初期値として、一致項目数Mi及び
不一致項目数Uiをゼロに、数列の引数としての変数t
及びkを2とする。数列p及びqにおける各項目の参照
は、これらt及びkを用いて先頭から順番で行われるも
のとする。従って、tは1からmまで、kは1からnま
での値をとる。以下、参照される項目の値をそれぞれp
[t]及びp[k]と表す。ここで、本実施例の照合処
理例における構造情報の時間位置(カット点位置)の定
義上、p[1]=q[1]=0なので、照合処理は、t
=k=2から開始される(ステップ502)。
【0101】以降のステップでは、変数t及びkの値に
基づく数列参照が行われる。
【0102】まず、 p[t]>q[k]+th (式1) が成立するかどうかを調べる(ステップ503)。ここ
で、thは閾値であり、カット点検出処理における誤差
を考慮した値を設定する。式1が成立する場合には、p
[t]とq[k]は一致していないと判断され、不一致
項目数Uiに1が加算される(ステップ504)。その
後、引数kが最大項目数n未満であるかどうか判断され
(ステップ505)、n未満である場合は、kに1加え
て(ステップ506)、ステップ503の手順に戻る。
一方、kがnに達していた場合には、照合処理を終了す
る。
【0103】式1が成立しない場合は、続いて、 q[k]>p[t]+th (式2) が成立するかどうか調べる(ステップ507)。成立す
る場合には、やはりp[t]とq[k]は一致していな
いと判断され、不一致項目数Uiに1が加算される(ス
テップ508)。その後、引数tが最大項目数m未満で
あるかどうか判断され(ステップ509)、m未満であ
る場合にはtに1加えて(ステップ510)、ステップ
503の手順に戻る。一方、tがmに達していた場合に
は、照合処理を終了する。
【0104】式1及び式2が成立しない場合は、p
[t]とq[k]が一致していると判断され、一致項目
数Miに1が加算される(ステップ511)。その後、
引数k及びtの範囲を確認後加算処理が行われ、最終項
目に到達していた場合には、照合処理を終了する(ステ
ップ512、513、509、510)。
【0105】以上の構造情報照合処理を図15の例に対
して行った場合の処理例を図17に示す。同図中の表
は、図16のフローチャートに従い処理を実行した際
の、引数t及びkの遷移、各数列中の値の比較結果、M
i及びUiの遷移を示している。比較を繰り返した結
果、正しい一致項目数Mi及び不一致項目数Uiが得ら
れることがわかる。
【0106】[第2の実施例]図18は、本発明の第2
の実施例によるシステム構成を示す。同図に示すシステ
ムにおけるデータとしては、前述の第1の実施例と同様
に、映像コンテンツを対象としている。利用者は、識別
対象となる映像を提示し、その映像に類似していると判
定された登録済映像の識別子を、その識別結果として受
け取る。
【0107】また、本システムでの構造情報において用
いる特徴としても、第1の実施例と同様に映像における
シーンの切り替わり(カット点)を用いる。しかし、本
実施例では、利用者の指示により人手でカット点を編集
することで構造情報を作成する。
【0108】本システムの装置構成は、第1の実施例と
同様に、利用者側のクライアント装置100とサービス
提供側のサーバ装置200とを含む。クライアント装置
100は、構造情報ファイル112、構造情報送信部1
13、識別子受信部114、利用者インタフェース11
5に加え、構造情報編集部116及び映像再生制御部1
17から構成される。
【0109】構造情報ファイル112から識別子受信部
114までは、第1の実施例と同様の機能を有する。利
用者インタフェース115は、映像再生制御部117と
連動し、利用者が映像コンテンツのカット点を発見し、
その時間位置を指示・編集するためのインターフェース
である。また、同インタフェース115は、識別子受信
部114が受信した識別子を利用者に表示する。
【0110】構造情報編集部116は、利用者インタフ
ェース115からのカット点編集指示を受け、構造情報
へのカット点時間位置追加・修正・削除を行う。編集終
了時には、構造情報ファイル112に書込みを行う。
【0111】映像再生制御部117は、利用者から映像
コンテンツの指示を受け、その再生及び停止・早送り・
巻き戻し・コマ送りなどの機能を提供すると共に、利用
者インタフェース115からカット点検出指示があった
際に、その時間位置を返答する。
【0112】サーバ装置200は、第1の実施例におけ
る構造情報受信部221、構造情報データベース22
2、構造情報抽出部223、類似性判定部225、識別
子送信部226に加え、オフセット算出部227、修正
構造情報生成部228、修正構造情報照合部229、及
び、最適照合判定部230から構成される。
【0113】構造情報受信部221から構造情報抽出部
223及び類似性判定部225、識別子送信部226
は、第1の実施例と同様の機能を有する。
【0114】オフセット算出部227は、構造情報X及
び構造情報Yiに基づいて、両者の開始時間位置のずれ
を表すオフセットを算出する。オフセットは候補集合と
して複数算出される。その算出ルールとして、ある一定
の時間間隔でオフセットを算出する方法が考えられる。
他に、構造情報Xのt番目の項目X[t]及び、構造情
報Yiのk番目の項目Yi[k]より、(Yi[k]−
X[t])をオフセット値として算出する方法も考えら
れる。本実施例では、後者の方法を想定し、その値を以
下、Ojと表す。引数jは、構造情報Xの項目数がm
個、構造情報Yiの項目数がn個である場合、1から最
大mnまでの値を取り得る。
【0115】修正構造情報生成部228は、オフセット
算出部227から算出される各オフセットOjの値を用
いて、構造情報Xの各項目の値を修正し、修正構造情報
Xjを生成する。修正構造情報Xjのt番目の項目Xj
[t]は、 Xj[t]=X[t]+Oj により算出される。
【0116】修正構造情報照合部229は、修正構造情
報Xjと構造情報Yiの照合を行う。図19は、本発明
の第2の実施例における修正構造情報照合処理の動作の
フローチャートである。
【0117】同図に示す処理フローは、第1の実施例に
おける図16のフローチャートとほぼ同様である。但
し、ステップ501における最末尾項目の値の代わりに
構造情報の全時間長を用いて判定する(ステップ601
〜603)。また、t及びkの初期値を1に、XをXj
に、Mi・UiをMij・Uijとする(ステップ60
4)。
【0118】最適照合判定部230は、修正構造情報照
合部229から出力される各Mij・Uijに基づき、
最も照合していると思われるXjを判定、そのMij・
UijをMi・Uiとして識別子iと共に出力する。そ
の判定には、第1の実施例と同様に評価式 Fij=Mij/(Mij+Uij) を用いることができる。この場合、最も大きいFijに
対応する修正構造情報Xjを採用することで、最適照合
を判定する。
【0119】本実施例におけるオフセット算出から修正
構造情報照合までを、図20の構造情報データベース2
22の例に対して行った場合の例を図21に示す。この
場合、オフセットは、20個算出され、そのうち、オフ
セット値50に対して最適な照合(Mij=5,Uij
=2)が行われることがわかる。
【0120】[第3の実施例]図22は、本発明の第3
の実施例によるシステム構成を示す。
【0121】本実施例におけるデータとしては、第1、
第2の実施例と同様に、映像コンテンツを対象としてい
る。利用者は識別対象となる映像を提示し、その映像に
類似していると判定された登録済映像の識別子をその識
別結果として受け取る。
【0122】また、本システムでの構造情報において用
いる特徴としても、第1、第2の実施例と同様に、映像
におけるシーンの切り替わり(カット点)を用いる。本
実施例では、利用者が映像コンテンツそのものをサーバ
装置200に送信し、構造情報はサーバ装置200内で
作成される。
【0123】本システムの装置構成は、第1の実施例と
同様に、利用者側のクライアント装置100と、サービ
ス提供側のサーバ装置200とを含む。
【0124】クライアント装置100は、識別子受信部
114、利用者インタフェース115及び映像コンテン
ツ送信部118から構成される。
【0125】識別子受信部114及び利用者インタフェ
ース115は、第1の実施例と同様の機能を有する。映
像コンテンツ送信部118は、利用者インタフェース1
15に提示された映像コンテンツをサーバ装置200に
送信する。これは、HTML文やJava(登録商標)Scri
pt文などを用い、Webブラウザ上で動作するインタフ
ェースシステムとして容易に実現できる。
【0126】サーバ装置200は、第2の実施例におけ
る構造情報データベース222から最適照合判定部23
0に加え、映像コンテンツ受信部232、構造情報解析
部232、シーケンス照合区間算出部233、一致項目
数遷移計測部234、不一致項目数遷移計測部235、
最適部分シーケンス判定部236、一致・不一致項目数
算出部237から構成される。
【0127】映像コンテンツ受信部231は、クライア
ント装置100から映像コンテンツを受信する。
【0128】構造情報解析部232は、第1の実施例に
おけるクライアント装置100内の構造情報解析部11
1と同様の機能を有する。映像コンテンツ受信部231
が受信した映像コンテンツを解析し、構造情報Xを出力
する。
【0129】構造情報データベース222、構造情報抽
出部223、オフセット算出部227、及び修正構造情
報生成部228は、第2の実施例と同様の機能を有す
る。
【0130】シーケンス照合区間算出部233は、入力
される構造情報Yi及び修正構造情報Xjより、照合の
可能性がある最小時間min及び最大時間maxを時間
区間として算出する。本実施例では、図23の構造情報
データベース222を例にとり、オフセットOj=90
であるときの修正構造情報Xjと構造情報Yiを対象に
して説明する。この場合、シーケンス照合区間算出部2
33において算出される値は、min=0,max=1
80となる。本算出は、両構造情報における項目の最小
値及び最大値を求めることで実現される。
【0131】一致項目数遷移計測部234及び不一致項
目数遷移計測部235は、シーケンス照合区間算出部2
33より出力される時間区間内で、両構造情報における
一致項目数、不一致項目数の時間遷移を計測する。本計
測部234、235における計測処理は、第2の実施例
における修正構造情報照合処理フロー上で実現できる。
即ち、図19に示した動作フローチャートに基づく照合
処理を実施する際に、変数t及びkの値変化に対応する
一致項目数及び不一致項目数の値変化を、図17におけ
る表のように全て保存しておけばよい。図24は、この
ようにして得られる計測処理結果を時間軸にマッピング
した例を表している。
【0132】最適部分シーケンス判定部236は、一致
項目数遷移計測部234及び不一致項目数遷移計測部2
35から得られる遷移情報に基づき、照合していると考
えられるシーケンス位置を判定する。本実施例では、一
致項目数遷移情報Mtが増加傾向にあり、不一致項目数
遷移情報Utが増加しない時間区間をその部分シーケン
スとして判定する。図25に判定処理の例を示す。この
図の場合、Mtが増加を開始する100秒目から、Mt
が増加しなくなる160秒目までを最適部分シーケンス
として判定する。実際の処理として、Mtが増加してい
る間はフラグ処理などにより、シーケンス継続中と見做
し、ある閾値以内でUtが増加してもノイズと見做すこ
とにより最適部分シーケンスを判定する方法などを用い
ることができる。
【0133】一致・不一致項目数算出部237は、最適
部分シーケンス判定部236から得られるシーケンス位
置としての開始・終了時間に基づき、一致項目数遷移情
報Mt及び不一致項目数遷移情報Utから、一致項目M
ij及び不一致項目数Uijを算出する。本実施例にお
ける算出式としては、 Mij=Mt{OUT+}−Mt{IN−} Uij=Ut{OUT+}−Ut{IN−} を用いる。ここで、Mt{OUT+}とは、終了時間O
UT直後におけるMtの値であり、Mt{IN−}と
は、開始時間IN直前におけるMtの値である。図25
の場合、Mt{OUT+}=4,Mt{IN−}=0で
ある。従って、Mij=4−0=4となる。同様に、U
ij=2−2=0となる。
【0134】最適照合判定部230、類似性判定部22
5及び識別子送信部226は、第2の実施例と同様の機
能を有する。
【0135】以上の3つの実施例は、映像コンテンツを
対象データと想定し、その構造情報取得において用いら
れる特徴としてカット点を想定している。この他にも、
例えば、音楽コンテンツを対象データと想定し、一定長
以上の無音区間が検出される点をその特徴点と定義する
ことが可能である。
【0136】また、3つの実施例においては、構造情報
取得のための特徴を1種類としたが、複数の特徴を用
い、それぞれに対する構造情報を取得した上で、各々の
照合処理を行い、それらの結果(それぞれの構造情報に
よる一致・不一致項目数)を合成することで、類似性判
定を行うことも可能である。合成方法としては、単純に
評価式の積をとる方法や、ルールによる場合分けを行う
方法などが考えられる。また、上記の3つの実施例にお
いては、構造情報の各項目の比較により、一致・不一致
を判定したが、同時に取得される特徴量を勘案した上
で、一致・不一致を判定することも可能である。例え
ば、あまりにも算出される特徴量に隔たりがある場合に
は、その比較判定を留保する(一致とも不一致とも見做
さない)等の方法をとることができる。
【0137】なお、図11、図18、図22で示したシ
ステムにおける装置(クライアント、サーバ)各部の一
部もしくは全部の機能をコンピュータのプログラムで構
成し、そのプログラムをコンピュータを用いて実行して
本発明を実現することができること、あるいは、図1
6、図19の各フローチャートや本文中記載の説明文や
式で示した処理の手順をコンピュータのプログラムで構
成し、そのプログラムをコンピュータに実行させること
ができることは言うまでもなく、コンピュータでその機
能を実現するためのプログラム、あるいは、コンピュー
タにその処理の手順を実行させるためのプログラムを、
そのコンピュータが読み取り可能な記憶媒体、例えば、
フレキシブルディスク、MO,ROM,メモリカード、
CD,DVD、リムーバブルディスクなどの記録して、
保存したり、配布したりすることが可能である。
【0138】上記のプログラムは、インターネットや電
子メールなど、ネットワークを通して提供することも可
能である。また、上記のプログラムは、サーバやクライ
アントのコンピュータ別に作成されることは当然である
が、記録媒体への記録や、ネットワークを通しての提供
に際しては、一まとめにしたり、個別にしたり、組み合
わせたりして行ってもよい。
【0139】以上、本発明の代表的な実施例を説明した
が、本発明は、上記の実施例に限定されることなく、特
許請求の範囲内において、種々変更・応用が可能であ
る。
【0140】
【発明の効果】上述のように、本発明によれば、提示さ
れたデータにおけるある特徴が存在する時間位置のシー
ケンスからなる構造情報を用いることで、フレーム毎の
特徴量に比べ、識別・検索のためのデータ量を抑えるこ
とができる。
【0141】また、抽出される特徴量そのものではな
く、抽出された特徴量が存在する時間位置を照合に用い
ることで、特徴量の誤差に起因する比較誤りを回避する
ことができる。同様に、特徴量抽出誤りを許容できるデ
ータ識別を行うことができる。
【図面の簡単な説明】
【図1】本発明の原理を説明するための図である。
【図2】本発明の原理構成図である。
【図3】本発明の一実施の形態におけるデータ識別装置
の構成図である。
【図4】本発明の一実施の形態における構造情報の概念
図である。
【図5】本発明の一実施の形態における構造情報照合を
説明するための図である。
【図6】本発明の一実施の形態における検出誤りに対す
る照合処理を説明するための図である。
【図7】本発明の一実施の形態における構造情報照合部
の構成図である。
【図8】本発明の一実施の形態における構造情報照合部
の修正構造情報照合部の構成図である。
【図9】本発明の一実施の形態におけるデータ識別方法
のフローチャートである。
【図10】本発明の一実施の形態における構造情報照合
方法のフローチャートである。
【図11】本発明の一実施の形態における構造情報照合
方法の詳細な処理のフローチャートである。
【図12】本発明の第1の実施例によるシステム構成図
である。
【図13】本発明の第1の実施例におけるデータ識別方
法手順を示すフローチャートである。
【図14】本発明の第1の実施例における構造情報例で
ある。
【図15】本発明の第1の実施例における構造情報デー
タベース例である。
【図16】本発明の第1の実施例における構造情報照合
処理の動作のフローチャートである。
【図17】本発明の第1の実施例における構造情報照合
処理例である。
【図18】本発明の第2の実施例によるシステム構成図
である。
【図19】本発明の第2の実施例における修正構造情報
照合処理の動作フローチャートである。
【図20】本発明の第2の実施例における構造情報デー
タベース例である。
【図21】本発明の第2の実施例におけるオフセット算
出修正構造情報生成及び照合処理例である。
【図22】本発明の第3の実施例によるシステム構成図
である。
【図23】本発明の第3の実施例における構造情報デー
タベース例及びオフセット算出に基づく修正構造情報の
例である。
【図24】本発明の第3の実施例における一致・不一致
項目数遷移計測の処理例である。
【図25】本発明の第3の実施例における最適部分シー
ケンス判定及び一致・不一致項目数算出の処理例であ
る。
【図26】従来手法におけるフレーム毎の特徴量比較に
関する説明図である。
【図27】従来手法におけるショット毎の特徴量比較に
関する説明図である。
【図28】ショット毎の特徴量比較における問題点の説
明図である。
【符号の説明】
1 データ識別装置 11 構造情報取得手段、構造情報取得部 12 構造情報データベース 13 構造情報照合手段、構造情報照合部 14 類似構造情報識別手段、類似構造情報識別部 21 オフセット算出部 22 修正構造情報生成部 23 修正構造情報照合部 24 最適照合判定部 31 シーケンス照合区間算出部 32 一致項目数遷移計測部 33 不一致項目数遷移計測部 34 最適部分シーケンス判定部 35 一致・不一致項目数算出部 100 クライアント装置 111 構造情報解析部 112 構造情報ファイル 113 構造情報送信部 114 識別子受信部 115 インタフェース利用者 116 構造情報編集部 117 映像再生制御部 118 映像コンテンツ送信部 200 サーバ装置 221 構造情報受信部 222 構造情報データベース 223 構造情報抽出部 224 構造情報照合部 225 類似性判定部 226 識別子送信部 227 オフセット算出部 228 修正構造情報生成部 229 修正構造情報照合部 230 最適照合判定部 231 映像コンテンツ受信部 232 構造情報解析部 233 シーケンス照合区間算出部 234 一致項目数遷移計測部 235 不一致項目数遷移計測部 236 最適部分シーケンス判定部 237 一致・不一致項目数算出部
───────────────────────────────────────────────────── フロントページの続き (72)発明者 桑野 秀豪 東京都千代田区大手町二丁目3番1号 日 本電信電話株式会社内 (72)発明者 青木 政勝 東京都千代田区大手町二丁目3番1号 日 本電信電話株式会社内 (72)発明者 宮川 和 東京都千代田区大手町二丁目3番1号 日 本電信電話株式会社内 (72)発明者 小林 昭久 東京都千代田区大手町二丁目3番1号 日 本電信電話株式会社内 (72)発明者 山田 一穂 東京都千代田区大手町二丁目3番1号 日 本電信電話株式会社内 Fターム(参考) 5B075 ND12 ND14 QM08 UU40 5C052 AA01 AB02 AB03 AB04 AC08 CC01 DD04 DD06 EE03

Claims (10)

    【特許請求の範囲】
  1. 【請求項1】 映像や音楽コンテンツなどのように表示
    ・再生処理における時間長を有するデータを蓄積したデ
    ータベースからユーザからの提示データに対する類似デ
    ータを識別・検索するデータ識別方法において、 表示・再生処理における時間長を有するデータから得ら
    れる、ある特徴が存在する時間位置のシーケンスからな
    る、該データの構造情報Xを取得する構造情報取得手順
    と、 前記構造情報Xを、該構造情報の識別子と共に構造情報
    データベースに格納する構造情報格納手順と、 前記構造情報データベースから別の構造情報Yiを取得
    する検索手順と、 前記構造情報X及び構造情報Yiをシーケンス照合する
    ことで、両シーケンス照合区間における一致項目数Mi
    及び不一致項目数Uiを算出する構造情報照合手順と、 前記構造情報照合手順から得られる一致項目数Mi及び
    不一致項目数Uiにより前記構造情報Xに対する構造情
    報Yiの類似性を判定する類似性判定手順と、 類似している場合には、類似している構造情報の識別子
    iを識別結果として出力する識別結果出力手順と、 更に他の構造情報に対して識別処理を行うかどうかを判
    定する識別判定手順とを有することを特徴とするデータ
    識別方法。
  2. 【請求項2】 前記構造情報照合手順において、 前記構造情報データベースから得られる構造情報Yi中
    の時間位置シーケンスと、前記構造情報取得手順から得
    られる構造情報X中の時間位置シーケンスから、両者の
    開始時間位置のずれ(オフセット)の候補値集合{O}
    を算出する手順と、 前記各オフセットOjを、前記構造情報Xの各シーケン
    ス項目に加算することで、修正構造情報Xjを生成する
    手順と、 前記各修正構造情報Xjと、前記構造情報Yiを各々シ
    ーケンス照合することにより、両シーケンス照合区間に
    おける一致項目数Mij及び不一致項目数Uijを各々
    算出する手順と、を有し、 前記類似性判定手順において、 全ての前記一致項目数Mij及び前記不一致項目数Ui
    jから構造情報Yiに最も類似している最類似修正構造
    情報Xjを判定する手順と、 前記最類似修正構造情報Xjに対応する一致項目数及び
    不一致項目数を、Mi、Uiとして出力する手順と、を
    有する請求項1記載のデータ識別方法。
  3. 【請求項3】 前記構造情報照合手順において、 入力される前記構造情報X,Yにおいて、照合する可能
    性のある各時間区間を算出する時間区間算出手順と、 前記時間区間内で、前記構造情報X,Yを時間順に比較
    することで得られる、シーケンス間での一致項目数の時
    間変化を計測する一致項目数遷移計測手順と、 前記時間区間内で、前記構造情報X,Yを時間順に比較
    することで得られる、シーケンス間での不一致項目数の
    時間変化を計測する不一致項目数遷移計測手順と、 前記一致項目数遷移計測手順と前記不一致項目数遷移計
    測手順により得られる一致項目数の時間変化及び不一致
    項目数の時間変化から、前記構造情報X,Y中で照合し
    ていると考えられる部分シーケンスの開始・終了時間を
    判定する手順と、 前記開始時間・前記終了時間の範囲内における一致項目
    数及び不一致項目数を算出する手順と、を有する請求項
    1または、2記載のデータ識別方法。
  4. 【請求項4】 映像や音楽コンテンツなどのように表示
    ・再生処理における時間長を有するデータを蓄積したデ
    ータベースからユーザからの提示データに対する類似デ
    ータを識別・検索するデータ識別装置であって、 表示・再生処理における時間長を有するデータから得ら
    れる、ある特徴が存在する時間位置のシーケンスからな
    る、該データの構造情報を取得する構造情報取得手段
    と、 前記構造情報取得手段で取得した前記構造情報Xを、該
    構造情報の識別子と共に格納する構造情報データベース
    と、 前記構造情報取得手段から得られる利用者提示の構造情
    報Xを、前記構造情報データベースから得られる構造情
    報Yiとシーケンス照合することで、両シーケンス照合
    区間における一致項目数Mi及び不一致項目数Uiを算
    出する構造情報照合手段と、 前記構造情報照合手段から得られる一致項目数Mi及び
    不一致項目数Uiにより前記構造情報Xに対する構造情
    報Yiの類似性を判定し、類似している場合には、類似
    している構造情報の識別子iを識別結果として出力する
    類似構造情報識別手段と、を有することを特徴とするデ
    ータ識別装置。
  5. 【請求項5】 前記構造情報照合手段は、 前記構造情報データベースから得られる構造情報Yi中
    の時間位置シーケンスと、構造情報取得手段から得られ
    る構造情報X中の時間位置シーケンスから、両者の開始
    時間位置のずれ(オフセット)の候補値集合{O}を算
    出するオフセット算出手段と、 前記オフセット算出手段から得られる前記各オフセット
    Ojを、前記構造情報Xの各シーケンス項目に加算する
    ことで、開始時間位置ずれを考慮した修正構造情報Xj
    を生成する修正構造情報生成手段と、 前記修正構造情報生成手段から得られる前記各修正構造
    情報Xjと、前記構造情報データベースから得られてい
    る前記構造情報Yiを各々シーケンス照合することによ
    り、両シーケンス照合区間における一致項目数Mij及
    び不一致項目数Uijを各々算出する修正構造情報照合
    手段と、を有し、 前記修正構造情報照合手段から得られる前記一致項目数
    Mij及び前記不一致項目数Uijにより前記構造情報
    Yiに対する修正構造情報Xjの類似性を判定し、最も
    類似している最類似修正構造情報Xjに対応する一致項
    目数及び不一致項目数を、その結果の項目数Mi、Ui
    として出力する最適照合判定手段と、を有する請求項4
    記載のデータ識別装置。
  6. 【請求項6】 前記構造情報照合手段は、 入力される前記構造情報X,Yにおいて、照合する可能
    性のある各時間区間を算出するシーケンス照合区間算出
    手段と、 前記シーケンス照合区間算出手段から得られる前記時間
    区間内で、前記構造情報X,Yを時間順に比較すること
    で得られる、シーケンス間での一致項目数の時間変化を
    計測する一致項目数遷移計測手段と、 前記シーケンス照合区間算出手段から得られる前記時間
    区間内で、前記構造情報X,Yを時間順に比較すること
    で得られる、シーケンス間での不一致項目数の時間変化
    を計測する不一致項目数遷移計測手段と、 前記一致項目数遷移計測手段と前記不一致項目数遷移計
    測手段により得られる一致項目数の時間変化及び不一致
    項目数の時間変化から、前記構造情報X,Y中で照合し
    ていると考えられる部分シーケンスの開始・終了時間を
    判定する最適部分シーケンス判定手段と、 前記最適部分シーケンス判定手段から得られる前記開始
    時間・前記終了時間の範囲内における一致項目数及び不
    一致項目数を算出する一致・不一致項目数算出手段と、
    を有する請求項5記載のデータ識別装置。
  7. 【請求項7】 映像や音楽コンテンツなどのように表示
    ・再生処理における時間長を有するデータを蓄積したデ
    ータベースからユーザからの提示データに対する類似デ
    ータを識別・検索するデータ識別プログラムであって、 表示・再生処理における時間長を有するデータから得ら
    れる、ある特徴が存在する時間位置のシーケンスからな
    る、該データの構造情報Xを取得する構造情報取得ステ
    ップと、 前記構造情報Xを、該構造情報の識別子と共に構造情報
    データベースに格納する構造情報格納ステップと、 前記構造情報取得ステップからの前記構造情報Xを、前
    記構造情報データベースから得られる構造情報Yiとシ
    ーケンス照合することにより、両シーケンス照合区間に
    おける一致項目数Mi及び不一致項目数Uiを算出する
    構造情報照合ステップと、 前記構造情報照合ステップから得られる一致項目数Mi
    及び不一致項目数Uiにより前記構造情報Xに対する構
    造情報Yiの類似性を判定し、類似している場合にはそ
    の識別子iを識別結果として出力する類似構造情報識別
    ステップと、をコンピュータに実現させることを特徴と
    するデータ識別プログラム。
  8. 【請求項8】 前記構造情報照合ステップにおいて、 前記構造情報データベースから得られる構造情報Yi中
    の時間位置シーケンスと、構造情報取得ステップから得
    られる構造情報X中の時間位置シーケンスから、両者の
    開始時間位置のずれ(オフセット)の候補値集合{O}
    を算出するオフセット算出ステップと、 前記オフセット算出ステップから得られる前記各オフセ
    ットOjを、前記構造情報Xの各シーケンス項目に加算
    することで、修正構造情報Xjを生成する修正構造情報
    生成ステップと、 前記修正構造情報生成ステップから得られる前記各修正
    構造情報Xjと、前記構造情報Yiを各々シーケンス照
    合することにより、両シーケンス照合区間における一致
    項目数Mij及び不一致項目数Uijを各々算出する修
    正構造情報照合ステップと、 前記修正構造情報照合ステップから得られる全ての前記
    一致項目数Mij及び前記不一致項目数Uijにより構
    造情報Yiに対する修正構造情報Xjの類似性を判定
    し、最も類似している修正構造情報Xjに対応する一致
    項目数及び不一致項目数をその結果の項目数Mi、Ui
    として出力する最適照合判定ステップと、をコンピュー
    タに実現させる請求項7記載のデータ識別プログラム。
  9. 【請求項9】 前記修正構造情報照合ステップにおい
    て、 入力される前記構造情報X,Yにおいて、照合する可能
    性のある最小時間及び最大時間を算出するシーケンス照
    合区間算出ステップと、 前記シーケンス照合区間算出ステップから得られる照合
    区間内で、前記構造情報X,Yを時間順に比較すること
    で得られる、シーケンス間での一致項目数の時間変化を
    計測する一致項目数遷移計測ステップと、 前記シーケンス照合区間算出ステップから得られる時間
    区間内で、前記構造情報X,Yを時間順に比較すること
    で得られる、シーケンス間での不一致項目数の時間変化
    を計測する不一致項目数遷移計測ステップと、 前記一致項目数遷移計測ステップと前記不一致項目数遷
    移計測ステップにより得られる一致項目数遷移情報及び
    不一致項目数遷移情報から、前記構造情報X,Y中で照
    合していると考えられるシーケンス位置を判定する最適
    部分シーケンス判定ステップと、 前記最適部分シーケンス判定ステップから得られる開始
    時間・終了時間の範囲内における一致項目数M及び不一
    致項目数Uを算出する一致・不一致項目数算出ステップ
    と、を更にコンピュータに実現させる請求項8記載のデ
    ータ識別プログラム。
  10. 【請求項10】 映像や音楽コンテンツなどのように表
    示・再生処理における時間長を有するデータを蓄積した
    データベースからユーザからの提示データに対する類似
    データを識別・検索するデータ識別プログラムを格納し
    た記憶媒体であって、 前記請求項7乃至前記請求項9記載のプログラムを格納
    したことを特徴とするデータ識別プログラムを格納した
    記憶媒体。
JP2002130746A 2002-05-02 2002-05-02 データ識別装置及びプログラム及びコンピュータ読み取り可能な記録媒体 Expired - Fee Related JP4010179B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002130746A JP4010179B2 (ja) 2002-05-02 2002-05-02 データ識別装置及びプログラム及びコンピュータ読み取り可能な記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002130746A JP4010179B2 (ja) 2002-05-02 2002-05-02 データ識別装置及びプログラム及びコンピュータ読み取り可能な記録媒体

Publications (2)

Publication Number Publication Date
JP2003323452A true JP2003323452A (ja) 2003-11-14
JP4010179B2 JP4010179B2 (ja) 2007-11-21

Family

ID=29543689

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002130746A Expired - Fee Related JP4010179B2 (ja) 2002-05-02 2002-05-02 データ識別装置及びプログラム及びコンピュータ読み取り可能な記録媒体

Country Status (1)

Country Link
JP (1) JP4010179B2 (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006237878A (ja) * 2005-02-23 2006-09-07 Sony Corp Cm付加情報供給方法、cm付加情報供給装置、cm付加情報受給装置及びcm付加情報供給システム
JP2010011501A (ja) * 2009-10-13 2010-01-14 Sony Corp 情報処理装置、情報処理方法、プログラムおよび記録媒体
JP2011529293A (ja) * 2008-07-23 2011-12-01 エルティーユー テクノロジーズ エスエーエス フレームに基づくビデオマッチング
US8312489B2 (en) 2005-02-23 2012-11-13 Sony Corporation CM searching method and apparatus, and CM-appendant information supplying method and apparatus
US8817104B2 (en) 2007-08-20 2014-08-26 Sony Corporation Data processing device and data processing method

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104111931A (zh) * 2013-04-17 2014-10-22 中国科学院声学研究所 一种协议自动识别方法及其所用分类器的构造方法

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006237878A (ja) * 2005-02-23 2006-09-07 Sony Corp Cm付加情報供給方法、cm付加情報供給装置、cm付加情報受給装置及びcm付加情報供給システム
JP4710350B2 (ja) * 2005-02-23 2011-06-29 ソニー株式会社 Cm付加情報供給方法、cm付加情報供給装置、cm付加情報受給装置及びcm付加情報供給システム
US8312489B2 (en) 2005-02-23 2012-11-13 Sony Corporation CM searching method and apparatus, and CM-appendant information supplying method and apparatus
US8817104B2 (en) 2007-08-20 2014-08-26 Sony Corporation Data processing device and data processing method
JP2011529293A (ja) * 2008-07-23 2011-12-01 エルティーユー テクノロジーズ エスエーエス フレームに基づくビデオマッチング
JP2010011501A (ja) * 2009-10-13 2010-01-14 Sony Corp 情報処理装置、情報処理方法、プログラムおよび記録媒体

Also Published As

Publication number Publication date
JP4010179B2 (ja) 2007-11-21

Similar Documents

Publication Publication Date Title
CN100535890C (zh) 以arpa标准格式表示经删除插值n字母语言模型
US8868569B2 (en) Methods for detecting and removing duplicates in video search results
EP2657884B1 (en) Identifying multimedia objects based on multimedia fingerprint
US20170126724A1 (en) Log analyzing device, attack detecting device, attack detection method, and program
CN110059223B (zh) 用于机内循环、图像到视频计算机视觉引导的方法与装置
US8892570B2 (en) Method to dynamically design and configure multimedia fingerprint databases
JP5370159B2 (ja) 情報抽出装置及び情報抽出システム
US20160210367A1 (en) Transition event detection
US12020467B2 (en) Method and apparatus for optimizing tag of point of interest, electronic device and computer readable medium
CN108664471B (zh) 文字识别纠错方法、装置、设备及计算机可读存储介质
CN110619035B (zh) 识别面试视频中关键词的方法、装置、设备及存储介质
WO2021073179A1 (zh) 命名实体的识别方法和设备、以及计算机可读存储介质
CN115358643B (zh) 一种基于消息的上下游单据的生成方法、装置及存储介质
KR101576935B1 (ko) 정답 키워드 제공 방법 및 장치
JP2003323452A (ja) データ識別方法及び装置及びデータ識別プログラム及びデータ識別プログラムを格納した記憶媒体
CN112148958A (zh) 用于信息推荐的方法、设备和计算机存储介质
CN112069833B (zh) 日志分析方法、日志分析装置及电子设备
CN114189818A (zh) 消息发送方法、装置、服务器及存储介质
US8463725B2 (en) Method for analyzing a multimedia content, corresponding computer program product and analysis device
JP2007318688A (ja) 映像情報交換方法、サーバ装置、及びクライアント装置
US20110153609A1 (en) System for determining content topicality, and method and program thereof
CN116545740A (zh) 一种基于大数据的威胁行为分析方法及服务器
CN113380254B (zh) 一种基于云计算和边缘计算的语音识别方法、设备及介质
US8515947B2 (en) Analyzing XML data
US20220377095A1 (en) Apparatus and method for detecting web scanning attack

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040723

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070703

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070720

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20070814

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20070827

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100914

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100914

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110914

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120914

Year of fee payment: 5

LAPS Cancellation because of no payment of annual fees