JP4420085B2 - データ処理装置、データ処理方法、プログラムおよび記録媒体 - Google Patents

データ処理装置、データ処理方法、プログラムおよび記録媒体 Download PDF

Info

Publication number
JP4420085B2
JP4420085B2 JP2007213221A JP2007213221A JP4420085B2 JP 4420085 B2 JP4420085 B2 JP 4420085B2 JP 2007213221 A JP2007213221 A JP 2007213221A JP 2007213221 A JP2007213221 A JP 2007213221A JP 4420085 B2 JP4420085 B2 JP 4420085B2
Authority
JP
Japan
Prior art keywords
change point
identification information
point interval
moving image
storage means
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2007213221A
Other languages
English (en)
Other versions
JP2009049668A (ja
Inventor
新次郎 柿田
慶太 白根
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP2007213221A priority Critical patent/JP4420085B2/ja
Priority to US12/177,364 priority patent/US8817104B2/en
Priority to KR1020080080846A priority patent/KR20090019713A/ko
Priority to CN2008102108443A priority patent/CN101373483B/zh
Publication of JP2009049668A publication Critical patent/JP2009049668A/ja
Application granted granted Critical
Publication of JP4420085B2 publication Critical patent/JP4420085B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N9/00Details of colour television systems
    • H04N9/79Processing of colour television signals in connection with recording
    • H04N9/80Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
    • H04N9/82Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback the individual colour picture signal components being recorded simultaneously only
    • H04N9/8205Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback the individual colour picture signal components being recorded simultaneously only involving the multiplexing of an additional signal and the colour video signal
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/91Television signal processing therefor
    • H04N5/93Regeneration of the television signal or of selected parts thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/02Editing, e.g. varying the order of information signals recorded on, or reproduced from, record carriers
    • G11B27/031Electronic editing of digitised analogue information signals, e.g. audio or video signals
    • G11B27/034Electronic editing of digitised analogue information signals, e.g. audio or video signals on discs
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/102Programmed access in sequence to addressed parts of tracks of operating record carriers
    • G11B27/105Programmed access in sequence to addressed parts of tracks of operating record carriers of operating discs
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream, rendering scenes according to MPEG-4 scene graphs
    • H04N21/44008Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream, rendering scenes according to MPEG-4 scene graphs involving operations for analysing video streams, e.g. detecting features or characteristics in the video stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/45Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
    • H04N21/462Content or additional data management, e.g. creating a master electronic program guide from data received from the Internet and a Head-end, controlling the complexity of a video stream by scaling the resolution or bit-rate based on the client capabilities
    • H04N21/4627Rights management associated to the content
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/83Generation or processing of protective or descriptive data associated with content; Content structuring
    • H04N21/835Generation of protective data, e.g. certificates
    • H04N21/8352Generation of protective data, e.g. certificates involving content or source identification data, e.g. Unique Material Identifier [UMID]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/83Generation or processing of protective or descriptive data associated with content; Content structuring
    • H04N21/835Generation of protective data, e.g. certificates
    • H04N21/8355Generation of protective data, e.g. certificates involving usage data, e.g. number of copies or viewings allowed
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/83Generation or processing of protective or descriptive data associated with content; Content structuring
    • H04N21/845Structuring of content, e.g. decomposing content into time segments
    • H04N21/8456Structuring of content, e.g. decomposing content into time segments by decomposing the content in the time domain, e.g. in time segments
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N9/00Details of colour television systems
    • H04N9/79Processing of colour television signals in connection with recording
    • H04N9/80Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
    • H04N9/804Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components
    • H04N9/8042Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components involving data reduction
    • H04N9/8047Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components involving data reduction using transform coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N9/00Details of colour television systems
    • H04N9/79Processing of colour television signals in connection with recording
    • H04N9/80Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
    • H04N9/82Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback the individual colour picture signal components being recorded simultaneously only
    • H04N9/8205Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback the individual colour picture signal components being recorded simultaneously only involving the multiplexing of an additional signal and the colour video signal
    • H04N9/8227Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback the individual colour picture signal components being recorded simultaneously only involving the multiplexing of an additional signal and the colour video signal the additional signal being at least another television signal

Description

本発明は、データ処理装置に関し、特に登録された動画コンテンツ(ビデオデータ)の中から入力された動画コンテンツに類似するものを検索するデータ処理装置、その処理方法ならびに当該方法をコンピュータに実行させるプログラム、および、そのプログラムを記録した記録媒体に関する。
近年、インターネット等のネットワーク技術が向上し、各情報を高速で通信することが可能になるとともに、この通信についての信頼性が向上している。また、インターネットに接続されている動画管理サーバに動画をアップロードしておき、インターネットに接続されている複数のパソコン(パーソナルコンピュータ)間で動画を共有して閲覧することが可能な動画共有システムが普及している。
例えば、インターネットを介して自宅のパソコンと動画管理サーバとを接続し、自宅のパソコンから動画管理サーバに動画をアップロードしておき、この動画を他のパソコンから閲覧することが可能なオンラインサービスが普及している。
このような動画共有システムにおいては、アップロードされた動画が、ユーザにより自ら作成されたものである場合があるとともに、他人の著作権を侵害している動画である場合も考えられる。このように他人の著作権を侵害している動画がアップロードされた場合には、その動画をアップロード禁止にする等により他人に閲覧できないようにすることが重要である。そこで、他人の著作権を侵害しているか否かを判断する場合には、動画管理サーバの管理者がアップロードされた各動画を見て、他人の著作権を侵害しているか否かを判断することが広く行われている。しかしながら、アップロードされる動画の数が多い場合には、全ての動画を管理者が見ることは困難である。
そこで、例えば、特定画像との一致判定や類似判定を行い、JPEG2000方式等に従って圧縮符号化された映像コンテンツを完全に復号することなく、特定画像と一致する画像を検索する画像検索装置が提案されている(例えば、特許文献1参照。)。
特開2006−285615号公報(図1)
上述の従来技術では、コードストリームと特定画像との間で、同じ位置のコードブロック同士のゼロビットプレーン数を比較することにより、コードストリームを完全に復号することなく一致判定を行っている。
しかしながら、動画コンテンツは時系列に並ぶ大量のフレームにより構成されるため、動画コンテンツからフレームを単位として特徴量を抽出すると、その特徴量が膨大になってしまい、それらを記憶するための領域が多くなり、また、比較処理に要する演算量が多くなってしまうという問題がある。
本発明はこのような状況に鑑みてなされたものであり、動画コンテンツから抽出する特徴量を削減し、効率良く動画コンテンツを検索することを目的とする。
本発明は、上記課題を解決するためになされたものであり、その第1の側面は、ビデオデータを識別する識別情報を、上記ビデオデータに含まれる特徴量に関連付けて記憶する第1記憶手段と、上記ビデオデータに含まれる特徴量を、上記ビデオデータを識別する識別情報に関連付けて記憶する第2記憶手段と、入力されたビデオデータに含まれる特徴量に基づいて、上記第1記憶手段に記憶された識別情報を読み出す第1読出し手段と、上記第1読出し手段により読み出された識別情報に基づいて上記第2記憶手段に記憶された特徴量を読み出す第2読出し手段と、上記入力されたビデオデータに含まれる特徴量と上記第2読出し手段により読み出された特徴量とを比較して、上記ビデオデータの識別情報照合する照合手段とを備えるデータ処理装置ならびにそのデータ処理方法、当該方法をコンピュータに実行させるプログラムおよびそのプログラムを記録する記録媒体である。これにより、第2読出し手段に記憶される特徴量を参照する際に、第1記憶手段に記憶されるビデオデータの識別情報を利用して参照範囲を絞り込み、効率良く特徴量の照合を行わせるという作用をもたらす。
また、の第の側面において上記特徴量は、チェンジ点の間隔を示すチェンジ点間隔を含んでもよい。これにより、第2読出し手段に記憶されるチェンジ点間隔を参照する際に、第1記憶手段に記憶されるビデオデータの識別情報を利用して参照範囲を絞り込み、効率良くチェンジ点間隔の照合を行わせるという作用をもたらす。
また、この第の側面において、上記第1記憶手段は、上記チェンジ点間隔の値が所定範囲にあるものを単位として、上記識別情報を連続アドレスに記憶する第1レイヤー記憶手段と、上記チェンジ点間隔を単位として、上記ビデオデータの識別情報を連続アドレスに記憶する第2レイヤー記憶手段とを含んでもよい。これにより、第1レイヤー記憶手段および第2レイヤー記憶手段を異なるメモリ階層に配置可能にするという作用をもたらす。
また、この第の側面において、上記第1レイヤー記憶手段に記憶された識別情報の数が許容数を超えた場合に上記所定範囲にあるチェンジ点間隔に従って上記識別情報をソートするソート手段と、上記ソート手段によりソートされた識別情報を上記チェンジ点間隔とともに第2レイヤー記憶手段に転送する転送手段とをさらに備えてもよい。これにより、メモリ階層間における転送を可能にするという作用をもたらす。
また、この第の側面において、上記第1レイヤー記憶手段は、上記ビデオデータの識別情報を所定数ずつ連続アドレスに記憶するユニット記憶手段と、上記チェンジ点間隔の値が所定範囲にあるものについて上記ユニット記憶手段における上記識別情報のアドレスを記憶するインデックス記憶手段とを含んでもよい。これにより、上記第1レイヤー記憶手段を、連続アドレスにより配置されるユニット記憶手段とそれを管理するインデックス記憶手段とに分離するという作用をもたらす。
また、この第の側面において、上記第2レイヤー記憶手段は、上記識別情報を所定数を単位として連続アドレスに記憶するユニット記憶手段と、上記ユニット記憶手段における上記識別情報のアドレスを記憶するインデックス記憶手段とを含んでもよい。これにより、上記第2レイヤー記憶手段を、連続アドレスにより配置されるユニット記憶手段とそれを管理するインデックス記憶手段とに分離するという作用をもたらす。
また、この第の側面において、上記第2記憶手段は、記チェンジ点間隔を時系列順に連続アドレスに記憶してもよい。これにより、上記第2記憶手段を連続したアドレス空間として扱うことを可能にするという作用をもたらす。
また、この第の側面において、上記第2記憶手段は、上記チェンジ点間隔を時系列順に連続アドレスに記憶するユニット記憶手段と、記チェンジ点間隔の上記ユニット記憶手段におけるアドレスを記憶するインデックス記憶手段とを含んでもよい。これにより、上記第2記憶手段を、連続アドレスにより配置されるユニット記憶手段とそれを管理するインデックス記憶手段とに分離するという作用をもたらす。
また、この第の側面において、登録対象のビデオデータに含まれるチェンジ点間隔のそれぞれに関連付けて上記登録対象のビデオデータの識別情報を上記第1記憶手段に登録する第1登録手段と、上記登録対象のビデオデータの識別情報に関連付けて上記登録対象のビデオデータに含まれるチェンジ点間隔を時系列順に上記第2記憶手段に登録する第2登録手段とをさらに備えてもよい。これにより、登録対象のビデオデータに含まれるチェンジ点間隔を第1記憶手段および第2記憶手段に登録させるという作用をもたらす。
本発明によれば、動画コンテンツから抽出する特徴量を削減し、効率良く動画コンテンツを検索することができるという優れた効果を奏し得る。
次に本発明の実施の形態について図面を参照して詳細に説明する。
図1は、本発明の実施の形態におけるコンテンツ検索装置100の一構成例を示すブロック図である。このコンテンツ検索装置100は、動画入力部110と、ビデオ・オーディオデマルチプレクサ120と、ビデオデコード部130と、特徴量抽出部200と、特徴量データベース140と、特徴量照合部150と、判定結果出力部160とを備える。なお、このコンテンツ検索装置100は、例えば、デジタルビデオカメラ等の撮像装置で撮影された動画(動画コンテンツ)について、映像解析により特徴量を抽出し、この抽出された特徴量を用いて各種画像処理を施すことが可能なパーソナルコンピュータによって実現することができる。
動画入力部110は、動画を入力する動画入力部であり、入力された動画をビデオ・オーディオデマルチプレクサ120に出力する。動画入力部110に入力される動画としては、例えば、撮像装置で撮影された動画やテレビジョン放送で受信された動画等が考えられる。
ビデオ・オーディオデマルチプレクサ120は、動画入力部110から出力された動画について、ビデオデータ(信号)とオーディオデータ(信号)とに分離するものであり、分離されたビデオデータをビデオデコード部130に出力する。なお、分離されたオーディオデータについては、本発明の実施の形態においては特に利用されない
ビデオデコード部130は、ビデオ・オーディオデマルチプレクサ120から出力されたビデオデータをデコードしてベースバンドデータを生成するものであり、生成されたベースバンドデータを特徴量抽出部200に出力する。
特徴量抽出部200は、ビデオデコード部130から出力されたベースバンドデータに基づいて特徴量を抽出するものであり、抽出された特徴量を特徴量データベース140および特徴量照合部150に出力する。本発明の実施の形態では、特徴量抽出部200が抽出する特徴量として、動画におけるチェンジ点の間隔(以下、チェンジ点間隔という。)を例にして説明する。なお、チェンジ点は、例えば、動画において撮影場面が瞬間的に変化する場合におけるその境界点を示すカットチェンジ点や、動画において撮影場面が比較的大きく変化する場合におけるその境界点を示すクロスフェード点等を含むものである。また、チェンジ点間隔は、連続するチェンジ点間の区間における時間やフレーム数等の間隔を示すものである。特徴量抽出部200により抽出されたチェンジ点間隔は、時系列に並べられて、チェンジ点間隔リストを構成する。
特徴量データベース140は、特徴量抽出部200から出力されたチェンジ点間隔リストを動画コンテンツ毎に格納するデータベースである。この特徴量データベース140は、特徴量の照合の際に、格納されているチェンジ点間隔リストを特徴量照合部150に出力する。
特徴量照合部150は、特徴量抽出部200から出力されたチェンジ点間隔リストと、特徴量データベース140に格納されている各チェンジ点間隔リストとを照合し、この照合結果に基づいて、動画入力部110に入力された動画と、特徴量データベース140に格納されているチェンジ点間隔リストに対応する動画とが一致するか否かを判定するものである。この特徴量照合部150による照合判定結果は、一致リストとして判定結果出力部160に出力される。すなわち、特徴量照合部150は、動画入力部110に入力された動画と一致する動画に対応するチェンジ点間隔リストを、特徴量データベース140に格納されているカットチェンジ点間隔リストの中から検索する。
判定結果出力部160は、特徴量照合部150から出力された一致リストを出力するものである。例えば、特徴量照合部150から出力された一致リストを表示して出力することができる。
このように、本発明の実施の形態におけるコンテンツ検索装置100は、動画コンテンツのチェンジ点間隔を照合することにより、動画コンテンツの内容が一致するか否かを判別する。
図2は、本発明の実施の形態における動画コンテンツとチェンジ点との関係を示す図である。以下では、チェンジ点の一例として、カットチェンジ点を例に挙げて説明する。撮像装置により撮影された動画290を構成する各フレームに対応する画像271乃至279を概略的に示している。画像271乃至279は、1つの動画290に含まれる画像ではあるものの、撮影された時刻および場所が異なる4つのシーンが含まれているため、これらのシーンが切り換わるフレームでは被写体の構図や色等が瞬間的に変化する。このため、連続する2フレーム間におけるそのような変化を検出して、カットチェンジ点として判別する。
例えば、画像271乃至273は、街中を歩いている人物を撮影したものであり、人物が移動しているため、人物の位置が多少異なるものの、画像全体では類似している印象となる。このため、画像271乃至273に関する連続する2フレーム間において変化がないことから、その連続する2フレーム間はカットチェンジ点ではないと判別される。
また、画像274または275は、山の前の家並みを撮影したものであり、撮像装置を水平方向に移動させて撮影しているため、被写体の位置が水平方向に移動して多少異なるものの、画像全体では類似している印象となる。しかしながら、画像273と画像274とを比較した場合には、撮影された時刻および場所が異なるシーンの切り換え部分に該当するため、画像全体が大きく異なっている。このため、画像273と画像274との境界がカットチェンジ点281とされる。
また、画像275と画像276との境界、および、画像277と画像278との境界についても、同様に、カットチェンジ点282および283として検出される。
このようにして検出されたカットチェンジ点によって区切られる区間をカットチェンジ点区間と呼び、そのカットチェンジ点区間の長さをカットチェンジ点間隔と呼ぶ。ここでは、チェンジ点の一例としてカットチェンジ点を挙げて説明したが、他のチェンジ点についても同様である。したがって、チェンジ点によって区切られる区間をチェンジ点区間と呼び、そのチェンジ点区間の長さをチェンジ点間隔と呼ぶ。
このチェンジ点は、動画コンテンツを構成する各フレームに対応する画像の階調に基づいて以下のように判別することができる。
図3は、本発明の実施の形態におけるチェンジ点判別の概要を示す図である。図3(a)乃至(c)は、何れも画像全体における各画素の輝度信号Y、色差信号(青)Cbおよび色差信号(赤)Crの各要素または全要素によるヒストグラムであり、横軸は階調を示し、縦軸は頻度を示す。例えば、図3(a)は動画aのヒストグラムであり、図3(b)は動画aに続く動画bのヒストグラムである。また、図3(c)は動画aおよびbのヒストグラムの面積の差分を示すものである。
図3(c)において、斜線で示す領域が、図3(a)および(b)に示すヒストグラムの面積の差分値に相当する領域である。この差分値の総和が予め定められた閾値を超える場合には、その動画aと動画bとの間がカットチェンジ点であると判別することができる。
図4は、本発明の実施の形態における特徴量抽出部200の機能構成例を示すブロック図である。この特徴量抽出部200は、カラーヒストグラム抽出部210と、連続フレーム間ヒストグラム差分算出部220と、閾値保持部230と、カットチェンジ点判別部240と、チェンジ点間隔算出部250とを備える。
カラーヒストグラム抽出部210は、ビデオデコード部130から出力されたベースバンドデータをバッファに保持して、このバッファに保持されたベースバンドデータから画面全体における各画素の輝度信号Y、色差信号(青)Cbおよび色差信号(赤)Crのカラーヒストグラムをサンプリングし、このサンプリングされたカラーヒストグラムについて、階調をN段階(例えば、N=16)に分け、各階調における頻度の和が一定になるように正規化を行うものである。このヒストグラムの一例は、図3(a)および(b)に示したとおりである。このカラーヒストグラム抽出部210は、正規化が施されたY、CbおよびCrのヒストグラムを連続フレーム間ヒストグラム差分算出部220に出力する。
連続フレーム間ヒストグラム差分算出部220は、カラーヒストグラム抽出部210から出力されたフレーム毎のY、CbおよびCrとのカラーヒストグラムについて、連続する2フレーム間におけるカラーヒストグラムの面積の差分値を算出するものであり、算出されたヒストグラム差分値をカットチェンジ点判別部240に出力するものである。例えば、連続する2フレームに対応する図3(a)および(b)に示すカラーヒストグラムの面積の差分値として、図3(c)に斜線で示す領域の面積の値が算出される。
閾値保持部230は、連続する2フレーム間がカットチェンジ点であるか否かをカットチェンジ点判別部240が判別する場合に用いられる閾値を保持するものであり、保持されている閾値をカットチェンジ点判別部240に出力する。
カットチェンジ点判別部240は、連続フレーム間ヒストグラム差分算出部220から出力されたヒストグラム差分値が、閾値保持部230に保持されている閾値を超えたか否かに基づいて、連続する2フレーム間がカットチェンジ点であるか否かを判別するものである。すなわち、カットチェンジ点判別部240は、連続フレーム間ヒストグラム差分算出部220から出力されたヒストグラム差分値が、閾値保持部230に保持されている閾値を超えた場合には、そのヒストグラム差分値に対応する連続する2フレーム間がカットチェンジ点であると判別して、そのフレーム間に対応する時刻をカットチェンジ点の時刻として、チェンジ点間隔算出部250に出力する。一方、カットチェンジ点判別部240は、連続フレーム間ヒストグラム差分算出部220から出力されたヒストグラム差分値が、閾値保持部230に保持されている閾値を超えていない場合には、そのヒストグラム差分値に対応する連続する2フレーム間がカットチェンジ点ではないと判別する。このようにカットチェンジ点ではないと判別された場合には、チェンジ点間隔算出部250には時刻が出力されない。
チェンジ点間隔算出部250は、カットチェンジ点判別部240から出力されたカットチェンジ点の時刻に基づいて、隣接する2つのカットチェンジ点間の時間間隔を算出するものであり、算出されたカットチェンジ点の間隔を特徴量データベース140および特徴量照合部150に出力する。すなわち、チェンジ点間隔算出部250は、カットチェンジ点判別部240からカットチェンジ点の時刻が出力された場合には、この時刻と、この時刻の直前に出力された時刻との差の値を算出して、隣接する2つのカットチェンジ点間の時間間隔を算出する。なお、隣接する2つのカットチェンジ点間の間隔として、このカットチェンジ点間に含まれるフレームの数を算出し、この算出されたフレーム数をカットチェンジ点の間隔とするようにしてもよい。
図5は、本発明の実施の形態におけるカットチェンジ点間隔リストの概略を示す図である。特徴量データベース140には、1または複数のカットチェンジ点間隔リストが格納されている。例えば、特徴量データベース140には、カットチェンジ点間隔リスト800、805、806が格納されている。なお、特徴量データベース140に格納されるカットチェンジ点間隔リストは、特徴量抽出部200から出力されたカットチェンジ点の間隔を順次格納して作成するようにしてもよく、他の情報処理装置において抽出されたカットチェンジ点の間隔を順次格納して作成するようにしてもよい。
カットチェンジ点間隔リスト800には、カットチェンジ点間隔803が時系列に記録されている。これらは、対応する動画を識別するためのコンテンツIDに関連付けられている。コンテンツIDは、コンテンツ検索装置100の内部または外部に備えられている動画データベースに格納されている動画を検索するために用いることができるIDであり、例えば、カットチェンジ点間隔リスト800に対応するコンテンツIDとして、「#123」が付与されているものとする。また、図5においては、対応する動画において抽出されたカットチェンジ点間隔の識別番号としてノードID802を付して説明する。
カットチェンジ点間隔803は、対応する動画において抽出されたカットチェンジ点間隔を時間で示すものであり、時刻の早い順序で記録される。
このように、1または複数のカットチェンジ点間隔リストが格納されている特徴量データベース140を用いて、動画入力部110から入力された動画について一致検索をする場合には、特徴量データベース140に格納されているカットチェンジ点間隔リストを1つずつ読み出して、次に示すように検索処理を実行する。
図6は、本発明の実施の形態における特徴量照合部150による照合の具体例を示す図である。ここでは、特徴量データベース140から取り出されたカットチェンジ点間隔リスト800および検索対象として動画入力部110から入力された動画において抽出されたカットチェンジ点間隔に対応するカットチェンジ点間隔リスト820の一例が示されている。また、図7は、本発明の実施の形態におけるカットチェンジ点間隔リストの照合の態様を示す図である。以下では、カットチェンジ点間隔リスト800とカットチェンジ点間隔リスト820とを照合して、これらのリストに対応する動画が一致するか否かを判定する場合について図6および図7を参照して説明する。
最初に、カットチェンジ点間隔リスト820の比較対象となるカットチェンジ点間隔リストが特徴量データベース140から取り出される。例えば、カットチェンジ点間隔リスト800が取り出される。続いて、カットチェンジ点間隔リスト800のカットチェンジ点間隔803の値と、カットチェンジ点間隔リスト820のカットチェンジ点間隔823の値とをノードIDの順番で順次比較して、一致する値が検出される。例えば、カットチェンジ点間隔リスト800におけるノードID802の「11」に対応するカットチェンジ点間隔803の値「0:00:05.605」と、カットチェンジ点間隔リスト820におけるノードID822の「21」に対応するカットチェンジ点間隔823の値「0:00:05.605」とが、矢印831で示すように一致する(841)。なお、図7では、図6に示すカットチェンジ点間隔の各値の前半部分を省略して示す。
このように、2つのカットチェンジ点間隔リストにおいて、一致するカットチェンジ点間隔の値が検出された場合には、この一致した値の次のノードIDに対応するカットチェンジ点間隔の値が2つのリストのそれぞれから取り出される。例えば、カットチェンジ点間隔リスト800におけるノードID802の「12」に対応するカットチェンジ点間隔803の値「0:00:03.603」と、カットチェンジ点間隔リスト820におけるノードID822の「22」に対応するカットチェンジ点間隔823の値「0:00:03.570」とが取り出される。そして、取り出された2つの値が一致するか否かが判断される(842)。ここで、一致した場合には、この一致した値の次のノードIDに対応するカットチェンジ点間隔の値が2つのリストのそれぞれから取り出され、一致するか否かが判断される。
一方、図6および図7に示すように、取り出された2つの値が一致しない場合には(842)、比較対象となっている2つの値のうちの小さい値が取り出されたカットチェンジ点間隔リストから、この値の次のノードIDに対応するカットチェンジ点間隔の値が取り出され、取り出された値と、比較対象となっている値とが加算される。例えば、カットチェンジ点間隔803の値「0:00:03.603」とカットチェンジ点間隔823の値「0:00:03.570」とを比較した場合には、カットチェンジ点間隔823の値「0:00:03.570」が小さい。このため、カットチェンジ点間隔リスト820におけるノードID822の「23」に対応するカットチェンジ点間隔823の値「0:00:01.634」が取り出され、カットチェンジ点間隔823の値「0:00:03.570」と加算される(843)。
続いて、加算された加算値と、加算の対象となっていない値とが一致するか否かが判断される(844)。ここで、一致した場合には、この一致した値の次のノードIDに対応するカットチェンジ点間隔の値が2つのリストのそれぞれから取り出され、一致するか否かが判断される。このように、最初の一致した値から所定の範囲内の値を順次加算して、2つのカットチェンジ点間隔リストの値が一致するか否かが判断される。所定の範囲として、例えば、ノードIDが3つの範囲とすることができる。例えば、図6に示す矢印831で結ばれる最初に一致した値から、ノードIDが3つの範囲832内において、加算処理(843、845、847)が行われるとともに、比較処理が行われる(842、844、846、848)。そして、ノードIDが3つの範囲832内において、矢印833で示す位置で比較対象となっている2つの値が一致する(848)。
このように、最初に一致した値から所定の範囲内において、2つのカットチェンジ点間隔リストの値が一致した場合には、同様に、この一致した各値から所定の範囲内の値を順次加算して、2つのカットチェンジ点間隔リストの値が一致するか否かが判断される。ここでの所定の範囲として、例えば、最初の範囲と同様に、ノードIDが3つの範囲とするようにしてもよく、異なる値とするようにしてもよい。
例えば、図6に示す矢印833で結ばれる一致した値から、カットチェンジ点間隔リスト800におけるノードIDが3つの範囲835内、および、カットチェンジ点間隔リスト820におけるノードIDが3つの範囲834内において、加算処理(850、852)が行われるとともに、比較処理が行われる(849、851、853)。そして、ノードIDが3つの範囲834または835内において、矢印836で示す位置で比較対象となっている2つの値が一致する(853)。
なお、最初に一致した値または2回目以降に一致した値を基準として取り出された2つの値のうちの少なくとも1つが加算前に一致した場合には、その1つの値については加算処理をせずに、この一致した値を基準として次の比較処理を行う。また、所定の範囲内で加算値が一致しない場合には、2つのリストにおいて、一致する値の検出を再度繰り返す。
このように、本発明の実施の形態におけるコンテンツ検索装置100は、動画コンテンツのチェンジ点間隔を照合することにより、動画コンテンツの内容が一致するか否かを判別する。この照合の際、隣接するチェンジ点区間のチェンジ点間隔を加算することにより、チェンジ点の検出が不十分であった場合にも対処することができる。一般に、ビットレートが異なる動画コンテンツ同士の比較において検索精度を向上させることは困難を伴うが、本発明の実施の形態では特徴量としてチェンジ点間隔を利用することにより、ビットレートや画枠が異なる動画コンテンツを高い精度で検索することができる。
次に本発明の実施の形態における特徴量データベースの構成について図面を参照して説明する。
図8は、本発明の実施の形態における特徴量データベースの周辺の構成例を示す図である。ここでは、図1の特徴量抽出部200に対応するものとして登録動画特徴量抽出部310および入力動画特徴量抽出部330を、図1の特徴量データベース140に対応するものとして特徴量データベース320を、図1の特徴量照合部150に対応するものとして特徴量照合部340をそれぞれ示している。
登録動画特徴量抽出部310は、特徴量データベース320に特徴量を登録する対象となる動画コンテンツ(以下、登録動画という。)からその特徴量としてチェンジ点間隔を抽出するものである。入力動画特徴量抽出部330は、検索対象として入力された動画コンテンツ(以下、入力動画という。)からその特徴量としてチェンジ点間隔を抽出するものである。両者は、特徴量の抽出対象である動画コンテンツが異なるが、基本的な構成に相違はなく、図4により説明した特徴量抽出部200と同様の構成を有する。
特徴量データベース320は、DC辞書600およびCD辞書700を記憶部として有し、DC辞書600に登録動画を登録するためのDC辞書登録部321と、CD辞書700に登録動画を登録するためのCD辞書登録部322と、DC辞書600を参照するためのDC辞書参照部323と、CD辞書700を参照するためのCD辞書参照部324とを備えている。DC辞書600は、チェンジ点間隔(Duration)をキーとしてコンテンツID(Content ID)を参照するための(Duration to Content ID)辞書である。一方、CD辞書700は、コンテンツIDをキーとしてチェンジ点間隔を参照するための(Content ID to Duration)辞書である。
登録動画特徴量抽出部310によって登録動画のチェンジ点間隔が抽出されると、そのチェンジ点間隔リストおよび登録動画のコンテンツIDは信号線319を介してDC辞書登録部321およびCD辞書登録部322に供給される。そして、DC辞書登録部321からDC辞書600に、CD辞書登録部322からCD辞書700に、それぞれ登録が行われる。
入力動画特徴量抽出部330によって入力動画のチェンジ点間隔が抽出されると、そのチェンジ点間隔リストおよび入力動画のコンテンツIDは信号線339を介してDC辞書参照部323および特徴量照合部340に供給される。そして、DC辞書参照部323は、入力動画のチェンジ点間隔をキーとしてDC辞書600を参照して、読み出された登録動画のコンテンツIDを、信号線328を介してCD辞書参照部324に供給する。CD辞書参照部324は、DC辞書参照部323から供給された登録動画のコンテンツIDをキーとしてCD辞書700を参照して、読み出された登録動画のチェンジ点間隔リストを特徴量照合部340に供給する。
特徴量照合部340は、入力動画特徴量抽出部330から供給されたチェンジ点間隔リストと、CD辞書参照部324から供給されたチェンジ点間隔リストとを照合することにより、登録動画と入力動画とが一致するか否かを判定するものである。この照合の内容は、図6および図7により説明したとおりである。
図9は、本発明の実施の形態における特徴量データベース320に対する操作の態様を示す図である。図9(a)に示すように、登録時には、登録動画のチェンジ点間隔リストが登録動画特徴量抽出部310によって抽出されて、特徴量データベース320に登録される。これにより、特徴量データベース320には、登録動画のチェンジ点間隔リストが登録動画のコンテンツIDとともに蓄積されていく。
一方、図9(b)に示すように、照合時には、入力動画のチェンジ点間隔リストが入力動画特徴量抽出部330によって抽出されて、特徴量データベース320から読み出された登録動画のチェンジ点間隔リストと照合される。
図9(a)および(b)では、チェンジ点間隔リストが特徴量データベース320に静的に登録されることを想定しているが、照合時に入力動画のチェンジ点間隔リストを抽出した際に、そのチェンジ点間隔リストを図9(c)のように特徴量データベース320に動的に登録するようにしてもよい。これにより、入力動画のチェンジ点間隔リストを入力動画のコンテンツIDとともに蓄積していくことができる。
図10は、本発明の実施の形態におけるDC辞書600とCD辞書700との関係を概念的に示す図である。
DC辞書600は、入力動画のチェンジ点間隔リストに含まれるチェンジ点間隔をキーとして参照されて、登録動画のコンテンツIDを出力する。この例では、入力動画のチェンジ点間隔リストに含まれるチェンジ点間隔「30」をキーとして、コンテンツID「#20」を出力している。
CD辞書700は、DC辞書600から出力されたコンテンツIDをキーとして参照されて、登録動画のチェンジ点間隔リストを出力する。この例では、DC辞書600から出力されたコンテンツID「#20」をキーとして、登録動画のチェンジ点間隔リストを出力している。
CD辞書700には、登録動画の各々について、コンテンツIDに関連付けてチェンジ点間隔リストが記憶されている。したがって、このCD辞書700の全ての内容を参照することにより、目的とする登録動画のチェンジ点間隔リストを見つけることは可能である。しかしながら、本発明の実施の形態においては、入力動画のチェンジ点間隔リストに含まれるチェンジ点間隔と一致するチェンジ点間隔を、登録動画のチェンジ点間隔リストの中から検索する必要があるため、CD辞書700の全ての内容を参照するのは効率的ではない。そこで、本発明の実施の形態では、DC辞書600においてチェンジ点間隔をキーとしてそのチェンジ点間隔を含む登録動画のコンテンツIDを出力することにより、CD辞書700において参照すべきチェンジ点間隔リストを絞り込んでいる。
なお、図10において示したDC辞書600およびCD辞書700は概念的なものであり、その実現例については、以下で説明する。
図11は、本発明の実施の形態におけるDC辞書600の一構成例を示す図である。このDC辞書600は、ヘッダ610に続き、第1レイヤー(620、630)および第2レイヤー(640、650)の階層構造をとる。また、第1レイヤーおよび第2レイヤーは、それぞれ、インデックス部とユニット部とに分かれている。第1レイヤーのインデックス部をL1インデックス620、第1レイヤーのユニット部をL1ユニット630と呼ぶ。また、第2レイヤーのインデックス部をL2インデックス640、第2レイヤーのユニット部をL2ユニット650と呼ぶ。
ヘッダ610は、間隔先頭値611と、間隔総数612と、L1先頭アドレス613と、L2先頭アドレス614とを記憶する。間隔先頭値611は、DC辞書600に記憶されるチェンジ点間隔の先頭の値を記憶するフィールドである。間隔総数612は、DC辞書600に記憶されるチェンジ点間隔の総数を記憶するフィールドである。L1先頭アドレス613は、L1インデックス620の先頭アドレスを記憶するフィールドである。L2先頭アドレス614は、L2インデックス640の先頭アドレスを記憶するフィールドである。
L1インデックス620は、L1ユニット630に対するインデックスの役割を有するものであり、各レコードについて、間隔開始値621と、間隔幅622と、データ数623と、オフセット624とを記憶する。間隔開始値621は、対応するレコードのチェンジ点間隔の開始値を記憶するフィールドである。間隔幅622は、対応するレコードに含まれるべきチェンジ点間隔の幅(個数)を記憶するフィールドである。データ数623は、L1ユニット630の対応するレコードに記憶されているデータ(区間情報)の数を記憶するフィールドである。オフセット624は、L1ユニット630の対応するレコードへのポインタを記憶するフィールドである。
L1ユニット630は、レコード毎に、区間情報631を記憶するものである。本発明の実施の形態においては、区間情報631はチェンジ点間隔632およびコンテンツID633の各フィールドを備えている。すなわち、チェンジ点区間に関する情報として、そのチェンジ点区間のチェンジ点間隔と、そのチェンジ点区間を含む動画コンテンツのコンテンツIDとを記憶する。この区間情報631は、一つのレコードに複数セットを連続アドレスに記憶することができる。また、1レコード当りの区間情報631の最大記憶可能数は、全レコードにおいて同一の固定サイズであることが望ましい。この場合、各レコードにオフセット624を記憶していなくても、L1ユニット630の先頭アドレスから各レコードのアドレスを計算することができるようになる。
L2インデックス640は、L2ユニット650に対するインデックスの役割を有するものであり、各レコードについて、チェンジ点間隔641と、データ数643と、オフセット644とを記憶する。チェンジ点間隔641は、対応するレコードのチェンジ点間隔を記憶するフィールドである。データ数643は、L2ユニット650の対応するレコードに記憶されているデータ(コンテンツID)の数を記憶するフィールドである。オフセット644は、L2ユニット650の対応するレコードへのポインタを記憶するフィールドである。
L2ユニット650は、レコード毎に、コンテンツID651を記憶するものである。このコンテンツID651は、一つのレコードに複数個を連続アドレスに記憶することができる。また、1レコード当りのコンテンツID651の最大記憶可能数は、全レコードにおいて同一の固定サイズであることが望ましい。この場合、各レコードにオフセット644を記憶していなくても、L2ユニット650の先頭アドレスから各レコードのアドレスを計算することができるようになる。
また、L2ユニット650の各レコードには、そのレコードを拡張するための次オフセット652を記憶することができる。1レコード当りのコンテンツID651の最大記憶可能数を超えるまでは、次オフセット652には特定のアドレスを示さない値(ヌルポインタ)が設定されており、新たなレコードが拡張された場合には、その拡張されたレコードに対するポインタが保持される。例えば、図中では、チェンジ点間隔641が「N+1」のレコードについて次オフセット652にアドレス「0x40000」が保持されており、レコードが拡張されていることを示している。
なお、メモリ空間を32ビットと想定すると、DC辞書600の各フィールドは4バイトに統一することができる。
チェンジ点間隔は、フレームを単位として考えると、1以上の全ての整数に対応することになり、チェンジ点間隔に上限は存在しない。また、コンテンツIDにも上限がない。したがって、DC辞書600の全てを1つの有限サイズのストレージに納めることができない場合がある。そこで、本発明の実施の形態では、DC辞書600を第1レイヤーおよび第2レイヤーの階層構造としている。これにより、プロセッサとメモリのアーキテクチャが階層的なストレージを有する場合にも対応することができる。第1レイヤーの記憶内容は、後述のように所定の条件を満たす場合に、第2レイヤーに転送される。
なお、チェンジ点間隔に上限は存在しないが、DC辞書600を具現化するにあたっては、チェンジ点間隔に上限を設けることが有用である。例えば、過去のチェンジ点間隔の分布によって、1分相当程度の上限値を想定し、それを超えた場合のために「上限値以上のチェンジ点間隔」のレコードを設けるようにしてもよい。また、その上限値を超えた場合には、第1レイヤーに登録せずに、第2レイヤーに直接登録するようにしてもよい。上限値を超える可能性が低い場合、第2レイヤーにバイト転送で登録しても大きな性能上の影響はないと考えられる。
このDC辞書600では、一般に、第2レイヤーの方が第1レイヤーよりもサイズが大きくなる。第2レイヤーでは全てのチェンジ点間隔について個別にレコードを有しているが(チェンジ点間隔641)、第1レイヤーでは1つのレコードに複数のチェンジ点間隔を詰め込んでいるため(間隔幅622)、第1レイヤーの方がレコード数を抑えることができる。例えば、この図において、第1レイヤーでは1レコード当りN個のチェンジ点間隔を記憶しており、個々のチェンジ点間隔をチェンジ点間隔632に記憶している。
なお、ここでは、第1レイヤーおよび第2レイヤーの階層構造について説明したが、レイヤーの数は特に限定されるものではない。すなわち、第2レイヤーにおいてもL2ユニット650のサイズは有限であることから、許容量を越えた際には他のストレージに転送することが可能である。
図12は、本発明の実施の形態におけるCD辞書700の一構成例を示す図である。このCD辞書700は、ヘッダ710と、インデックス720と、ユニット730とを備える。
ヘッダ710は、コンテンツID先頭値711と、コンテンツID総数712と、インデックス先頭アドレス713とを記憶する。コンテンツID先頭値711は、CD辞書700に記憶されるコンテンツIDの先頭の値を記憶するフィールドである。コンテンツID総数712は、CD辞書700に記憶されるコンテンツIDの総数を記憶するフィールドである。インデックス先頭アドレス713は、インデックス720の先頭アドレスを記憶するフィールドである。
インデックス720は、ユニット730に対するインデックスの役割を有するものであり、各レコードについて、コンテンツID721と、間隔数722と、オフセット723とを記憶する。コンテンツID721は、対応するレコードのコンテンツIDを記憶するフィールドである。間隔数722は、ユニット730の対応するレコードに記憶されているチェンジ点間隔の数を記憶するフィールドである。オフセット723は、ユニット730の対応するレコードへのポインタを記憶するフィールドである。
ユニット730は、レコード毎に、チェンジ点間隔731を記憶するものである。このチェンジ点間隔731は、一つのレコードに複数セットを時系列順に連続アドレスに記憶することができる。また、1レコード当りのチェンジ点間隔731の最大記憶可能数は、レコード毎に異なっていてよい。但し、ユニット730全体としては物理的に連続アドレスに格納する必要がある。
なお、このCD辞書700では、DC辞書600のようなレコード割当ての異なる階層構造は想定していない。これは、チェンジ点間隔リストはある程度の長さを有しており、まとめてアクセスすることが可能だからである。但し、ユニット730自体のサイズは有限であることから、許容量を越えた際には他のストレージに転送することは可能である。
なお、メモリ空間を32ビットと想定すると、CD辞書700の各フィールドは4バイトに統一することができる。
図13は、本発明の実施の形態におけるチェンジ点間隔リストの例を示す図である。この例では、コンテンツIDが「#20」の動画コンテンツに関するチェンジ点間隔リストのうち先頭の4つのノードが時系列に示されている。各ノードには「1」から昇順にノードIDが付されている。
先頭のノード(ノードID:1)にはチェンジ点間隔として「100」が記憶されている。また、2番目のノード(ノードID:2)にはチェンジ点間隔として「30」が記憶されている。また、3番目のノード(ノードID:3)にはチェンジ点間隔として「50」が記憶されている。また、4番目のノード(ノードID:4)にはチェンジ点間隔として「120」が記憶されている。
このチェンジ点間隔リストの例をDC辞書600およびCD辞書700に登録した場合の例について以下に説明する。
図14は、本発明の実施の形態におけるDC辞書600の第1レイヤーに図13のチェンジ点間隔リストを登録した場合の例を示す図である。この例では、間隔幅622は全て「50」に設定されており、チェンジ点間隔が「1」から「50」までが第1番目のレコードに、チェンジ点間隔が「51」から「100」までが第2番目のレコードに、チェンジ点間隔が「101」から「150」までが第3番目のレコードに、チェンジ点間隔が「151」から「200」までが第4番目のレコードに、それぞれ記憶される。
図13の例では、コンテンツIDが「#20」の動画コンテンツについて、チェンジ点間隔が「100」、「30」、「50」および「120」となっているため、L1ユニット630には、第1番目のレコードにチェンジ点間隔632として「30」および「50」が記憶され、これらに関連付けてコンテンツID623として「#20」がそれぞれ記憶される。
また、L1ユニット630の第2番目のレコードには、チェンジ点間隔632として「100」が記憶され、これに関連付けてコンテンツID623として「#20」が記憶される。さらに、L1ユニット630の第3番目のレコードには、チェンジ点間隔632として「120」が記憶され、これに関連付けてコンテンツID623として「#20」が記憶される。
これに伴い、データ数623にはL1ユニット630の対応するレコードに記憶されているデータ(区間情報)の数がそれぞれ記憶される。すなわち、データ数623の第1番目のレコードには「2」、第2番目のレコードには「1」、第3番目のレコードには「1」が、それぞれ記憶される。
図15は、本発明の実施の形態におけるDC辞書600の第2レイヤーに図13のチェンジ点間隔リストを登録した場合の例を示す図である。図14のようにDC辞書600の第1レイヤーに登録された内容は、以下のように第2レイヤーに転送される。
DC辞書600の第2レイヤーでは、チェンジ点間隔について個別にレコードが割り当てられる。すなわち、チェンジ点間隔641には、「1」から順に「1」ずつ増加した値が記憶される。
図13の例では、コンテンツIDが「#20」の動画コンテンツについて、チェンジ点間隔が「100」、「30」、「50」および「120」となっているため、チェンジ点間隔641が「30」、「50」、「100」および「120」を示すレコードにおいてコンテンツID651に「#20」が記憶される。
図16は、本発明の実施の形態におけるCD辞書700に図13のチェンジ点間隔リストを登録した場合の例を示す図である。図13の例では、コンテンツIDが「#20」の動画コンテンツについて、チェンジ点間隔が「100」、「30」、「50」および「120」となっているため、コンテンツID721が「20」を示すレコードにおいて、チェンジ点間隔731に「100」、「30」、「50」および「120」が記憶される。また、コンテンツID721が「20」を示すレコードにおいて、間隔数722として「4」が記憶される。
次に、本発明の実施の形態におけるレイヤー間の転送処理について図面を参照して説明する。
図17は、本発明の実施の形態におけるDC辞書600の転送に関する構成例を示す図である。ここでは、第1レイヤー記憶部601と、第2レイヤー記憶部602と、第3レイヤー記憶部603と、登録状態管理部691および692と、ソート部693と、転送部694および696と、転送制御部695および697とが示されている。
第1レイヤー記憶部601は、図11において説明した第1レイヤー(620、630)を記憶するものである。第2レイヤー記憶部602は、図11において説明した第2レイヤー(640、650)を記憶するものである。第3レイヤー記憶部603は、第2レイヤーの許容量を越えた際に第2レイヤーとして記憶されていた内容の一部または全部を第3レイヤーとして記憶するものである。後述するように、第1レイヤー記憶部601、第2レイヤー記憶部602および第3レイヤー記憶部603の実現例としては様々な形態のものが考えられるが、例えば、マルチプロセッサ環境においては、第1レイヤー記憶部601をローカルメモリ、第2レイヤー記憶部602を共有のメインメモリ、第3レイヤー記憶部603を大容量のハードディスクにより実現することが想定される。
登録状態管理部691は、第1レイヤーにおける登録状態を管理するものである。また、登録状態管理部692は、第2レイヤーにおける登録状態を管理するものである。この登録状態として、例えば、第1レイヤーまたは第2レイヤーに登録されるデータ(区間情報631またはコンテンツID651)の数が計数される。
ソート部693は、第1レイヤー記憶部601に記憶されている区間情報631をレコード内でソートするものである。L1ユニット630では区間情報631が不規則に蓄積されていく一方で、第2レイヤーではチェンジ点間隔の順にコンテンツIDが振り分けられるため、第1レイヤーから第2レイヤーへの転送の際にはソートを行う必要がある。そのため、このソート部693では、転送の際にチェンジ点間隔の順にソートを行う。なお、この例では、転送の前にソートを行っているが、転送の後にソートを行うようにしてもよい。また、第2レイヤーにおいては既にチェンジ点間隔の順にコンテンツIDを記憶しているため、第2レイヤーから第3レイヤーへの転送の際にはソートを行う必要はない。
転送部694は、第1レイヤーから第2レイヤーへの転送を行うものである。また、転送部696は、第2レイヤーから第3レイヤーへの転送を行うものである。
転送制御部695は、第1レイヤーから第2レイヤーへの転送を制御するものである。また、転送制御部697は、第2レイヤーから第3レイヤーへの転送を制御するものである。これら転送制御部695および697は、それぞれ登録状態管理部691および692において管理される登録状態に基づいて、転送部694および696における転送を制御する。転送のタイミングとしては、例えば、各レコードにおいて許容量を超えた場合に転送処理を起動してもよく、また、全レコードを合わせて所定数のデータが登録される度に転送処理を起動してもよい。この場合、前者を採用するときには、統計上、各レコード同士で同じ確率で転送処理が起動されるように、レコードサイズ(区間情報631やコンテンツID651の数)を予め調整しておくことが望ましい。
L1ユニット630およびL2ユニット650におけるデータは物理的に連続アドレスに記憶されているため、転送部694および696ではレコード毎にバースト転送が可能であり、転送処理の高速化を図ることができる。このバースト転送のために、L1ユニット630のレコードサイズ(区間情報631の数)は、バイトアラインメントに対応して決定することができる。例えば、128バイトのアラインメントが必要な場合には、チェンジ点間隔632およびコンテンツID633のサイズをそれぞれ4バイトとすると、L1ユニット630のレコードサイズUは、
U=128×i/(4+4)
により与えられる。但し、iは1以上の整数である。
図18は、本発明の実施の形態におけるソート部693によるソートの一例を示す図である。ここでは、ソート手法として公知の分布数え上げソート(distribution counting sort)を用いている。この手法によれば、一定の作業領域が必要になるものの、データの大小を比較する必要がなく高速であり、また、同じキーが複数含まれているデータにも対応可能である。但し、ソート対象のデータが取り得る値の範囲が予め決まっている必要がある。これについては、上述のように、チェンジ点間隔に上限値を設けることにより対処することができる。
図18(a)は、ソート対象のL1ユニット630における区間情報631のデータ配列である。各データには「0」から昇順にインデックスが付されている。各データは、チェンジ点間隔およびコンテンツIDを備えている。本発明の実施の形態では、チェンジ点間隔をキーとしてソートが行われる。
図18(b)は、キーとなるチェンジ点間隔の出現回数を記憶する作業用の配列である。ここでは、チェンジ点間隔「1」の出現回数として「1」、チェンジ点間隔「3」の出現回数として「2」、チェンジ点間隔「4」の出現回数として「1」、チェンジ点間隔「5」の出現回数として「1」が数えられている。なお、この出現回数はXにより表される。
図18(c)は、キーとなるチェンジ点間隔の出現回数の累積度数を記憶する作業用の配列である。ここでは、チェンジ点間隔の小さい順に出現回数Xの累積度数が数えられている。なお、この累積度数はYにより表される。
図18(d)は、ソート後のデータ配列を示している。このソート手法では、キーとなるチェンジ点間隔の昇順にデータ配列に設定される。その際のデータ配列におけるインデックスの値は、各チェンジ点間隔に対応する出現回数Xと累積度数Yによって、「Y−X」から「Y−1」の間となる。例えば、チェンジ点間隔が「3」を示すデータは2つあるが、この場合は出現回数Xが「2」、累積度数Yが「3」であることから、そのインデックスは「1」および「2」となる。
このようにして、L1ユニット630における区間情報631のデータは、転送の際、チェンジ点間隔をキーとしてソートされる。
図19は、本発明の実施の形態におけるCD辞書700の転送に関する構成例を示す図である。ここでは、第1レイヤー記憶部701と、第2レイヤー記憶部702と、登録状態管理部791と、転送部794と、転送制御部795とが示されている。
第1レイヤー記憶部701は、図12において説明したインデックス720およびユニット730を第1レイヤーとして記憶するものである。第2レイヤー記憶部702は、インデックス720およびユニット730の許容量を越えた際に第1レイヤーとして記憶されていた内容の一部または全部を第2レイヤーとして記憶するものである。CD辞書700は、DC辞書600の場合と異なり、レコードの割当てを変えた階層構造とはなっていないが、許容量を越えた場合には大容量のハードディスクなどに退避できるように制御される。
登録状態管理部791は、インデックス720およびユニット730における登録状態を管理するものである。この登録状態として、例えば、インデックス720およびユニット730に登録されるチェンジ点間隔731の数が計数される。
転送部794は、第1レイヤー(720、730)から第2レイヤーへの転送を行うものである。転送制御部795は、第1レイヤーから第2レイヤーへの転送を制御するものである。この転送制御部795は、登録状態管理部791において管理される登録状態に基づいて、各レコードにおいて許容量を超えた場合に転送が起動されるように、転送部794における転送を制御する。CD辞書700における各レコードのチェンジ点間隔731は、一般にある程度の数を有するため、転送部794ではレコード毎にバースト転送が可能であり、転送処理の高速化を図ることができる。
図20は、本発明の実施の形態におけるDC辞書600およびCD辞書700の配置例を示す図である。
図20(a)は、処理装置内のメモリ400の容量が十分に大きい場合の配置例である。この場合、処理装置内のメモリ400のみで動作を完結させることができるため、DC辞書600およびCD辞書700はメモリ400のみに配置され、ハードディスク490には配置されない。一方、図20(b)は、処理装置内のメモリ400の容量が小さい場合の配置例である。この場合、処理装置内のメモリ400のみでは動作を完結させることができないため、DC辞書600およびCD辞書700はメモリ410に配置されるとともに、その許容量を超える場合にはハードディスク490にもユニット(630、650、730)が配置される。
図20(c)および(d)は、2階層のメモリ構成を採用する場合の配置例である。この場合、DC辞書600は、第1レイヤー(620、630)がL1メモリ410に配置され、第2レイヤー(640、650)がL2メモリ420に配置される。また、CD辞書700は、L1メモリ410またはL2メモリ420に配置される。L2メモリ420の容量が十分に大きければDC辞書600およびCD辞書700は図20(c)のように配置され、ハードディスク490には配置されない。一方、L2メモリ420の容量が小さい場合には、DC辞書600およびCD辞書700はL1メモリ410およびL2メモリ420に配置されるとともに、その許容量を超える場合にはハードディスク490にもL2ユニット650またはユニット730が配置される。
このように、ストレージの階層構造が異なるプラットフォームに対して、本発明は柔軟に対応することができる。
図21は、2階層のメモリ構成を有するマルチプロセッサシステムの構成例を示す図である。このマルチプロセッサシステムは、複数の要素プロセッサ510と、要素プロセッサ510の各々に対応するローカルメモリ520と、管理プロセッサ530と、メインメモリ540と、ハードディスク550と、管理プロセッサ530およびローカルメモリ520を結合するバス590とを備えている。
要素プロセッサ510は、マルチプロセッサを構成する複数のプロセッサである。これら要素プロセッサ510は、他の要素プロセッサ510と同期をとりながら並列に処理を実行することができる。ローカルメモリ520は、要素プロセッサ510の各々に対応して設けられるメモリであり、その内容は対応する要素プロセッサ510における処理のために利用される。
管理プロセッサ530は、マルチプロセッサシステム全体を管理するプロセッサであり、バス590を介してローカルメモリ520とメインメモリ540との間のデータ転送を制御する。メインメモリ540は、管理プロセッサ530によって利用されるとともに、全ての要素プロセッサ510から共有されるメモリである。
ハードディスク550は、マルチプロセッサシステムの補助記憶部として用いられ、ファイルシステムを提供する大容量ストレージである。
このマルチプロセッサシステムは、2階層のメモリ構成を有しており、ローカルメモリ520は図20におけるL1メモリ410に相当し、メインメモリ540は図20におけるL2メモリ420に相当し、ハードディスク550は図20におけるハードディスク490に相当する。ローカルメモリ520の容量が小さく(例えば256Kバイト)、メインメモリ540の容量が比較的大きい(例えば1Gバイト以上)ようなシステムにおいても、本発明を適用することができる。
このようなマルチプロセッサシステムにおいて、動画コンテンツの登録および照合が並列に処理可能であることを以下に説明する。
図22は、マルチプロセッサシステムにおける本発明の実施の形態による動画コンテンツの登録処理例を示す図である。この例では、登録動画特徴量抽出部310としてN台(Nは1以上の整数)の要素プロセッサ510が割り当てられており、それぞれの出力はDC辞書登録部321およびCD辞書登録部322に供給される。DC辞書登録部321およびCD辞書登録部322においても、それぞれN台の要素プロセッサ510が割り当てられている。
登録動画特徴量抽出部310では、N個の登録動画に対して、並列にチェンジ点間隔リストの抽出処理が行われる。DC辞書登録部321では、抽出されたN個のチェンジ点間隔リストがDC辞書600へ登録される。このDC辞書600への登録の際には整合性を保つために、N台の要素プロセッサ510の間で排他制御が行われる。同様に、CD辞書登録部322では、抽出されたN個のチェンジ点間隔リストがCD辞書700へ登録される。このCD辞書700への登録の際には整合性を保つために、N台の要素プロセッサ510の間で排他制御が行われる。
図23は、マルチプロセッサシステムにおける本発明の実施の形態による動画コンテンツの照合処理例を示す図である。この例では、入力動画特徴量抽出部330およびDC辞書参照部323のそれぞれにN台ずつの要素プロセッサ510が割り当てられており、CD辞書参照部324および特徴量照合部340のそれぞれにM台(Mは1以上の整数)ずつの要素プロセッサ510が割り当てられている。
入力動画特徴量抽出部330では、N個の入力動画に対して、並列にチェンジ点間隔リストの抽出処理が行われる。DC辞書参照部323では、抽出されたN個のチェンジ点間隔リストに含まれるチェンジ点間隔をキーとしてDC辞書600が参照される。DC辞書600では、M個のコンテンツIDが読み出される。CD辞書参照部324では、読み出されたM個のコンテンツIDをキーとしてCD辞書700が参照される。CD辞書700では、M個のチェンジ点間隔リストが読み出される。特徴量照合部340では、読み出されたM個のチェンジ点間隔リストと入力されたN個のチェンジ点間隔リストとの間の照合が行われる。
一つの入力動画に着目すると、特徴量抽出、DC辞書参照、CD辞書参照、特徴量照合の4段階の処理は逐次的に行う必要があるが、複数の入力動画を想定した場合、入力動画同士にデータ依存関係はないため、N台の要素プロセッサ510による並列処理が可能である。また、ある一つの入力動画について特徴量抽出が終了した後、DC辞書参照を行っている間に、他の入力動画の特徴量抽出を開始することにより、パイプライン的に処理をオーバラップして行うことが可能である。
次に本発明の実施の形態におけるコンテンツ検索装置の動作について図面を参照して説明する。
図24は、本発明の実施の形態における特徴量の登録処理手順の一例を示す流れ図である。
登録対象となる動画コンテンツ(登録動画)が入力されると、登録動画特徴量抽出部310によって特徴量(チェンジ点間隔リスト)が抽出される(ステップS911)。抽出されたチェンジ点間隔リストは、DC辞書登録部321によってDC辞書600の第1レイヤーに登録される(ステップS912)。このとき、L1ユニット630の該当レコードにおいて、区間情報631のエントリの最大許容数を超えることになった場合には(ステップS913)、ソート部693によってそのレコード内でチェンジ点間隔632をキーとしたソートが行われ(ステップS914)、転送部694によって第2レイヤーへの転送が行われる(ステップS915)。
また、第2レイヤーへの転送(ステップS915)によりL2ユニット650の該当レコードにおいて、コンテンツID651のエントリの最大許容数を超えることになった場合には(ステップS916)、L2ユニット650に新たなレコードを追加する(ステップS917)。また、これにより、L2ユニット650全体のサイズの許容量を超えることになった場合には(ステップS918)、転送部696は第2レイヤーとして記憶されていた内容の一部または全部を第3レイヤー(例えば、ハードディスク)へ転送する(ステップS919)。
また、登録動画特徴量抽出部310によって抽出されたチェンジ点間隔リストは、CD辞書登録部322によってCD辞書700に登録される(ステップS921)。このとき、ユニット730全体のサイズの許容量を超えることになった場合には(ステップS922)、転送部794はユニット730に記憶されていた内容の一部または全部を第2レイヤー(例えば、ハードディスク)へ転送する(ステップS923)。
図25は、本発明の実施の形態における特徴量の照合処理手順の一例を示す流れ図である。
検索対象となる動画コンテンツ(入力動画)が入力されると、入力動画特徴量抽出部330によって特徴量(チェンジ点間隔リスト)が抽出される(ステップS931)。抽出されたチェンジ点間隔リストに含まれるチェンジ点間隔をキーとして、DC辞書参照部323によってDC辞書600が参照される(ステップS932)。これにより、コンテンツIDが読み出される。
そして、読み出されたコンテンツIDをキーとして、CD辞書参照部324によってCD辞書700が参照される(ステップS933)。これにより、登録動画のチェンジ点間隔リストが読み出される。
そして、特徴量照合部340によって入力動画チェンジ点間隔リストと登録動画のチェンジ点間隔リストとが照合され、両者の一致性が判定される(ステップS934)。
このように、本発明の実施の形態によれば、動画コンテンツの特徴量としてチェンジ点間隔を採用することにより、抽出すべき特徴量を削減することができる。また、特徴量データベース320において、コンテンツIDをキーとしてチェンジ点間隔リストを参照するためのCD辞書700に加えて、チェンジ点間隔をキーとしてコンテンツIDを参照するためのDC辞書600を備えることにより、入力動画のチェンジ点間隔リストに含まれるチェンジ点間隔に対して、それと一致するチェンジ点間隔を有する登録動画のチェンジ点間隔リストを効率良く取得することができる。これにより、入力動画のチェンジ点間隔リストと登録動画のチェンジ点間隔リストを照合して、両者の一致性を判定することができる。
なお、本発明の実施の形態では、DC辞書600のL1ユニット630においてチェンジ点間隔632に関連付けてコンテンツID633を記憶しているが、これに加えて以下のようにチェンジ点間隔リストにおけるノードIDを記憶してもよい。
図26は、本発明の実施の形態におけるDC辞書600のL1ユニット630の変形例を示す図である。このL1ユニット630の変形例では、図11のL1ユニット630と異なり、区間情報631においてチェンジ点間隔リストのノードID634をさらに記憶している。
この変形例のようにノードID634を設けることにより、CD辞書700を参照する際に、対応するコンテンツIDのチェンジ点間隔リスト(チェンジ点間隔731)を全て読み出すことなく、必要なノードIDの近傍のチェンジ点間隔のみを読み出すことが可能となり、CD辞書700に対して高速にアクセスすることができる。また、第1レイヤーから第2レイヤーに転送する際に、ノードID634を用いてソートすることが可能となり、高速に転送することができる。
なお、本発明の実施の形態は本発明を具現化するための一例を示したものであり、以下に示すように特許請求の範囲における発明特定事項とそれぞれ対応関係を有するが、これに限定されるものではなく本発明の要旨を逸脱しない範囲において種々の変形を施すことができる。
なお、本発明の実施の形態において説明した処理手順は、これら一連の手順を有する方法として捉えてもよく、また、これら一連の手順をコンピュータに実行させるためのプログラム乃至そのプログラムを記憶する記録媒体として捉えてもよい。
本発明の実施の形態におけるコンテンツ検索装置100の一構成例を示すブロック図である。 本発明の実施の形態における動画コンテンツとチェンジ点との関係を示す図である。 本発明の実施の形態におけるチェンジ点判別の概要を示す図である。 本発明の実施の形態における特徴量抽出部200の機能構成例を示すブロック図である。 本発明の実施の形態におけるカットチェンジ点間隔リストの概略を示す図である。 本発明の実施の形態における特徴量照合部150による照合の具体例を示す図である。 本発明の実施の形態におけるカットチェンジ点間隔リストの照合の態様を示す図である。 本発明の実施の形態における特徴量データベースの周辺の構成例を示す図である。 本発明の実施の形態における特徴量データベース320に対する操作の態様を示す図である。 本発明の実施の形態におけるDC辞書600とCD辞書700との関係を概念的に示す図である。 本発明の実施の形態におけるDC辞書600の一構成例を示す図である。 本発明の実施の形態におけるCD辞書700の一構成例を示す図である。このCD辞書700は、ヘッダ710と、インデックス720と、ユニット730とを備える。 本発明の実施の形態におけるチェンジ点間隔リストの例を示す図である。 本発明の実施の形態におけるDC辞書600の第1レイヤーに図13のチェンジ点間隔リストを登録した場合の例を示す図である。 本発明の実施の形態におけるDC辞書600の第2レイヤーに図13のチェンジ点間隔リストを登録した場合の例を示す図である。 本発明の実施の形態におけるCD辞書700に図13のチェンジ点間隔リストを登録した場合の例を示す図である。 本発明の実施の形態におけるDC辞書600の転送に関する構成例を示す図である。 本発明の実施の形態におけるソート部693によるソートの一例を示す図である。 本発明の実施の形態におけるCD辞書700の転送に関する構成例を示す図である。 本発明の実施の形態におけるDC辞書600およびCD辞書700の配置例を示す図である。 2階層のメモリ構成を有するマルチプロセッサシステムの構成例を示す図である。 マルチプロセッサシステムにおける本発明の実施の形態による動画コンテンツの登録処理例を示す図である。 マルチプロセッサシステムにおける本発明の実施の形態による動画コンテンツの照合処理例を示す図である。 本発明の実施の形態における特徴量の登録処理手順の一例を示す流れ図である。 本発明の実施の形態における特徴量の照合処理手順の一例を示す流れ図である。 本発明の実施の形態におけるDC辞書600のL1ユニット630の変形例を示す図である。
符号の説明
100 コンテンツ検索装置
110 動画入力部
120 ビデオ・オーディオデマルチプレクサ
130 ビデオデコード部
140 特徴量データベース
150 特徴量照合部
160 判定結果出力部
200 特徴量抽出部
210 カラーヒストグラム抽出部
220 連続フレーム間ヒストグラム差分算出部
230 閾値保持部
240 カットチェンジ点判別部
250 チェンジ点間隔算出部
310 登録動画特徴量抽出部
320 特徴量データベース
321 DC辞書登録部
322 CD辞書登録部
323 DC辞書参照部
324 CD辞書参照部
330 入力動画特徴量抽出部
340 特徴量照合部
510 要素プロセッサ
520 ローカルメモリ
530 管理プロセッサ
540 メインメモリ
550 ハードディスク
600 DC辞書
601 第1レイヤー記憶部
602 第2レイヤー記憶部
603 第3レイヤー記憶部
610 ヘッダ
620 L1インデックス
630 L1ユニット
640 L2インデックス
650 L2ユニット
691、692 登録状態管理部
693 ソート部
694、696 転送部
695、697 転送制御部
700 CD辞書
701 第1レイヤー記憶部
702 第2レイヤー記憶部
710 ヘッダ
720 インデックス
730 ユニット
791 登録状態管理部
794 転送部
795 転送制御部

Claims (10)

  1. 動画像における所定範囲内のチェンジ点間隔を単位として、前記動画像の識別情報を前記動画像におけるチェンジ点間隔と関連付けて連続アドレスに記憶する第一の識別情報記憶手段と、
    前記動画像におけるチェンジ点間隔を単位として、前記第一の識別情報記憶手段から転送された前記動画像の識別情報を連続アドレスに記憶する第二の識別情報記憶手段と、
    前記動画像におけるチェンジ点間隔リストを、前記動画像の識別情報関連付けて記憶する点間隔記憶手段と、
    入力された動画像におけるチェンジ点間隔リストの値と、前記第一または第二の識別情報記憶手段に記憶されたチェンジ点間隔との間で、一致するチェンジ点間隔を検出し、検出された前記チェンジ点間隔に関連付けられた前記動画像の識別情報を参照する識別情報参照手段と、
    前記点間隔記憶手段に記憶された動画像の識別情報の中から、前記識別情報参照手段により参照された識別情報を検出し、検出された前記識別情報に関連付けられたチェンジ点間隔リストを参照するリスト参照手段と、
    前記リスト参照手段により参照したチェンジ点間隔リストと前記入力された動画像におけるチェンジ点間隔リストが一致するかを判定する判定手段と
    を具備する情報処理装置。
  2. 前記第一の識別情報記憶手段に記憶された情報が所定量を超えた場合に、前記所定範囲内チェンジ点間隔に従って、前記識別情報をソートするソート手段
    さらに具備する請求項記載の情報処理装置。
  3. 前記第一の識別情報記憶手段は、各レコードにおける前記第一の識別情報記憶手段に記憶された情報が所定量を超えた場合に、前記第一の識別情報記憶手段に記憶された情報を、前記第二の識別情報記憶手段に転送する
    請求項1記載の情報処理装置。
  4. 前記第一の識別情報記憶手段は、全てのレコードにおける前記第一の識別情報記憶手段に記憶された情報の合計が所定量を超えた場合に、前記第一の識別情報記憶手段に記憶された情報を、前記第二の識別情報記憶手段に転送する
    請求項1記載の情報処理装置。
  5. 前記第二の識別情報記憶手段に記憶された情報の合計が所定量を超えた場合に、前記第二の識別情報記憶手段に記憶された情報の一部又は全てが転送され、当該情報の一部又は全てを記憶する第三の識別情報記憶手段
    をさらに具備する請求項1記載の情報処理装置。
  6. 前記第一の識別情報記憶手段は、
    前記動画像の識別情報を所定数ずつ連続アドレスに記憶するユニット記憶手段と、
    記ユニット記憶手段における前記識別情報のアドレスを記憶するインデックス記憶手段と
    を含む請求項記載の情報処理装置。
  7. 前記第二の識別情報記憶手段は、
    前記動画像の識別情報を、所定数ずつ連続アドレスに記憶するユニット記憶手段と、
    前記ユニット記憶手段における前記識別情報のアドレスを記憶するインデックス記憶手段と
    を含む請求項記載の情報処理装置。
  8. 動画像における所定範囲内のチェンジ点間隔を単位として、前記動画像の識別情報を前記動画像におけるチェンジ点間隔と関連付けて連続アドレスに記憶する第一の識別情報記憶手段と、前記動画像におけるチェンジ点間隔を単位として、前記第一の識別情報記憶手段から転送された前記動画像の識別情報を連続アドレスに記憶する第二の識別情報記憶手段と、前記動画像におけるチェンジ点間隔リストを、前記動画像の識別情報と関連付けて記憶する点間隔記憶手段とを備える情報処理装置におけるデータ処理方法であって、
    入力された動画像におけるチェンジ点間隔リストの値と、前記第一または第二の識別情報記憶手段に記憶されたチェンジ点間隔との間で、一致するチェンジ点間隔を検出し、検出された前記チェンジ点間隔に関連付けられた前記動画像の識別情報を参照する識別情報参照手順と、
    前記点間隔記憶手段に記憶された動画像の識別情報の中から、前記識別情報参照手順により参照された識別情報を検出し、検出された前記識別情報に関連付けられたチェンジ点間隔リストを参照するリスト参照手順と、
    前記リスト参照手順により参照したチェンジ点間隔リストと前記入力された動画像におけるチェンジ点間隔リストとが一致するかを判定する判定手順と
    を具備するデータ処理方法
  9. 動画像における所定範囲内のチェンジ点間隔を単位として、前記動画像の識別情報を前記動画像におけるチェンジ点間隔と関連付けて連続アドレスに記憶する第一の識別情報記憶手段と、前記動画像におけるチェンジ点間隔を単位として、前記第一の識別情報記憶手段から転送された前記動画像の識別情報を連続アドレスに記憶する第二の識別情報記憶手段と、前記動画像におけるチェンジ点間隔リストを、前記動画像の識別情報と関連付けて記憶する点間隔記憶手段とを備える情報処理装置において、
    入力された動画像におけるチェンジ点間隔リストの値と、前記第一または第二の識別情報記憶手段に記憶されたチェンジ点間隔との間で、一致するチェンジ点間隔を検出し、検出された前記チェンジ点間隔に関連付けられた前記動画像の識別情報を参照する識別情報参照手順と、
    前記点間隔記憶手段に記憶された動画像の識別情報の中から、前記識別情報参照手順により参照された識別情報を検出し、検出された前記識別情報に関連付けられたチェンジ点間隔リストを参照するリスト参照手順と、
    前記リスト参照手順により参照したチェンジ点間隔リストと前記入力された動画像におけるチェンジ点間隔リストとが一致するかを判定する判定手順と
    をコンピュータに実行させるプログラム
  10. 動画像における所定範囲内のチェンジ点間隔を単位として、前記動画像の識別情報を前記動画像におけるチェンジ点間隔と関連付けて連続アドレスに記憶する第一の識別情報記憶手段と、前記動画像におけるチェンジ点間隔を単位として、前記第一の識別情報記憶手段から転送された前記動画像の識別情報を連続アドレスに記憶する第二の識別情報記憶手段と、前記動画像におけるチェンジ点間隔リストを、前記動画像の識別情報と関連付けて記憶する点間隔記憶手段とを備える情報処理装置において、
    入力された動画像におけるチェンジ点間隔リストの値と、前記第一または第二の識別情報記憶手段に記憶されたチェンジ点間隔との間で、一致するチェンジ点間隔を検出し、検出された前記チェンジ点間隔に関連付けられた前記動画像の識別情報を参照する識別情報参照手順と、
    前記点間隔記憶手段に記憶された動画像の識別情報の中から、前記識別情報参照手順により参照された識別情報を検出し、検出された前記識別情報に関連付けられたチェンジ点間隔リストを参照するリスト参照手順と、
    前記リスト参照手順により参照したチェンジ点間隔リストと前記入力された動画像におけるチェンジ点間隔リストとが一致するかを判定する判定手順と
    をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
JP2007213221A 2007-08-20 2007-08-20 データ処理装置、データ処理方法、プログラムおよび記録媒体 Expired - Fee Related JP4420085B2 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2007213221A JP4420085B2 (ja) 2007-08-20 2007-08-20 データ処理装置、データ処理方法、プログラムおよび記録媒体
US12/177,364 US8817104B2 (en) 2007-08-20 2008-07-22 Data processing device and data processing method
KR1020080080846A KR20090019713A (ko) 2007-08-20 2008-08-19 데이터 처리 장치 및 데이터 처리 방법
CN2008102108443A CN101373483B (zh) 2007-08-20 2008-08-20 数据处理装置和数据处理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007213221A JP4420085B2 (ja) 2007-08-20 2007-08-20 データ処理装置、データ処理方法、プログラムおよび記録媒体

Publications (2)

Publication Number Publication Date
JP2009049668A JP2009049668A (ja) 2009-03-05
JP4420085B2 true JP4420085B2 (ja) 2010-02-24

Family

ID=40381750

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007213221A Expired - Fee Related JP4420085B2 (ja) 2007-08-20 2007-08-20 データ処理装置、データ処理方法、プログラムおよび記録媒体

Country Status (4)

Country Link
US (1) US8817104B2 (ja)
JP (1) JP4420085B2 (ja)
KR (1) KR20090019713A (ja)
CN (1) CN101373483B (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5553152B2 (ja) * 2010-04-09 2014-07-16 ソニー株式会社 画像処理装置および方法、並びにプログラム
US9122954B2 (en) * 2013-10-01 2015-09-01 Mobileye Vision Technologies Ltd. Performing a histogram using an array of addressable registers
US9805662B2 (en) * 2015-03-23 2017-10-31 Intel Corporation Content adaptive backlight power saving technology
CN106528800B (zh) * 2016-11-11 2019-10-08 叶一火 一种基于真实场景的影像生成方法及装置
JP7013182B2 (ja) * 2017-09-21 2022-01-31 キヤノン株式会社 情報処理装置、情報処理方法およびプログラム

Family Cites Families (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05174072A (ja) 1991-12-20 1993-07-13 Nippon Telegr & Teleph Corp <Ntt> 動画像検索処理方法
JP3200784B2 (ja) 1993-07-29 2001-08-20 キヤノン株式会社 動画像検索方法及び装置
US6055025A (en) * 1993-12-21 2000-04-25 Lucent Technologies, Inc. Method and apparatus for detecting abrupt and gradual scene changes in image sequences
US6546186B2 (en) * 1995-09-11 2003-04-08 Matsushita Electric Industrial Co., Ltd. Video/audio information collecting system using video camera and its editing system
JP3244629B2 (ja) * 1996-08-20 2002-01-07 株式会社日立製作所 シーン変化点検出方法
CA2196930C (en) * 1997-02-06 2005-06-21 Nael Hirzalla Video sequence recognition
JP3780623B2 (ja) * 1997-05-16 2006-05-31 株式会社日立製作所 動画像の記述方法
JP2001028722A (ja) * 1999-07-13 2001-01-30 Matsushita Electric Ind Co Ltd 動画像管理装置及び動画像管理システム
US6675174B1 (en) * 2000-02-02 2004-01-06 International Business Machines Corp. System and method for measuring similarity between a set of known temporal media segments and a one or more temporal media streams
JP2001283216A (ja) * 2000-04-03 2001-10-12 Nec Corp 画像照合装置、画像照合方法、及びそのプログラムを記録した記録媒体
US6689890B2 (en) * 2000-05-04 2004-02-10 University Of South Florida Efficient lactam synthesis
US7363278B2 (en) * 2001-04-05 2008-04-22 Audible Magic Corporation Copyright detection and protection system and method
CA2664732C (en) * 2002-04-12 2013-07-02 Mitsubishi Denki Kabushiki Kaisha An apparatus to edit, reproduce, deliver, search and re-generate condition settings for metadata
JP3844446B2 (ja) 2002-04-19 2006-11-15 日本電信電話株式会社 映像管理方法、装置、映像管理プログラム、および同プログラムを記録した記録媒体
JP4010179B2 (ja) 2002-05-02 2007-11-21 日本電信電話株式会社 データ識別装置及びプログラム及びコンピュータ読み取り可能な記録媒体
JP2004234613A (ja) 2002-12-02 2004-08-19 Nec Corp 映像記述システムおよび方法、映像識別システムおよび方法
US7500176B2 (en) * 2004-04-01 2009-03-03 Pinnacle Systems, Inc. Method and apparatus for automatically creating a movie
US7376274B2 (en) * 2004-08-31 2008-05-20 Sonic Solutions Method and apparatus for use in video searching
KR100652703B1 (ko) * 2004-12-08 2006-12-01 엘지전자 주식회사 휴대단말기의 동영상 검색장치 및 방법
JP4343120B2 (ja) 2005-01-21 2009-10-14 ソニー株式会社 画像検索装置及び方法、並びにプログラム及びプログラム記録媒体
JP4301193B2 (ja) 2005-03-31 2009-07-22 ソニー株式会社 画像比較装置及び方法、画像検索装置及び方法、並びにプログラム及び記録媒体
WO2007033352A2 (en) * 2005-09-12 2007-03-22 3Vr Security, Inc. Storage of video analysis data for real-time alerting and forensic analysis
KR100729660B1 (ko) * 2005-12-09 2007-06-18 한국전자통신연구원 장면 전환 길이를 이용한 디지털 비디오 인식 시스템 및 방법

Also Published As

Publication number Publication date
US8817104B2 (en) 2014-08-26
JP2009049668A (ja) 2009-03-05
US20090051771A1 (en) 2009-02-26
CN101373483B (zh) 2012-09-05
KR20090019713A (ko) 2009-02-25
CN101373483A (zh) 2009-02-25

Similar Documents

Publication Publication Date Title
US9785708B2 (en) Scalable, adaptable, and manageable system for multimedia identification
US8965863B1 (en) Scalable, adaptable, and manageable system for multimedia identification
CN101853486B (zh) 一种基于局部数字指纹的图像拷贝检测方法
JP4420085B2 (ja) データ処理装置、データ処理方法、プログラムおよび記録媒体
US20150254342A1 (en) Video dna (vdna) method and system for multi-dimensional content matching
CN110149529B (zh) 媒体信息的处理方法、服务器及存储介质
CN110688524A (zh) 视频检索方法、装置、电子设备及存储介质
KR100946694B1 (ko) 영상 정보 기반의 동영상 파일 중복 검사와 관리를 위한시스템 및 방법
Khan et al. Blockchain-enabled deep semantic video-to-video summarization for IoT devices
Zhou et al. Monitoring near duplicates over video streams
JP5366212B2 (ja) 多数の参照用映像の中から検索キー用映像を用いて検索する映像検索装置、プログラム及び方法
CN111191591A (zh) 一种水印检测、视频处理方法和相关设备
CN113157962B (zh) 图像检索方法、电子装置和存储介质
Kim et al. Video linkage: group based copied video detection
Liu et al. Video copy detection by conducting fast searching of inverted files
CN105989063B (zh) 视频检索方法和装置
Li et al. A confidence based recognition system for TV commercial extraction
CN108763465B (zh) 一种基于大数据的视频存储分配方法
JP5923744B2 (ja) 画像検索システム、画像検索方法及び検索装置
Wang et al. SSFS: A space-saliency fingerprint selection framework for crowdsourcing based mobile location recognition
JP2022112831A (ja) 顔追跡装置およびプログラム
CN111368115A (zh) 数据聚类方法、装置、聚类服务器及存储介质
JP7340992B2 (ja) 画像管理装置およびプログラム
CN110032652B (zh) 媒体文件查找方法和装置、存储介质及电子装置
Malhotra et al. AIR-IA: an analogous image removal approach using the intelligent archive

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20090805

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090811

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20091013

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20091110

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20091123

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121211

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121211

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131211

Year of fee payment: 4

LAPS Cancellation because of no payment of annual fees