JP2011130413A - デジタルコンテンツ符号器、復号器、検索装置、符号化方法、検索方法、記録担体、信号、および記憶装置 - Google Patents

デジタルコンテンツ符号器、復号器、検索装置、符号化方法、検索方法、記録担体、信号、および記憶装置 Download PDF

Info

Publication number
JP2011130413A
JP2011130413A JP2010221625A JP2010221625A JP2011130413A JP 2011130413 A JP2011130413 A JP 2011130413A JP 2010221625 A JP2010221625 A JP 2010221625A JP 2010221625 A JP2010221625 A JP 2010221625A JP 2011130413 A JP2011130413 A JP 2011130413A
Authority
JP
Japan
Prior art keywords
definition digital
definition
interval
fingerprint
encoded
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2010221625A
Other languages
English (en)
Other versions
JP2011130413A5 (ja
JP5733935B2 (ja
Inventor
Paul Brasnett
ポール・ブラスネット
Stavros Paschalakis
スタヴロス・パシャラキス
Nikola Sprljan
ニコラ・スプルリャン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric R&D Centre Europe BV Netherlands
Original Assignee
Mitsubishi Electric R&D Centre Europe BV Netherlands
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric R&D Centre Europe BV Netherlands filed Critical Mitsubishi Electric R&D Centre Europe BV Netherlands
Publication of JP2011130413A publication Critical patent/JP2011130413A/ja
Publication of JP2011130413A5 publication Critical patent/JP2011130413A5/ja
Application granted granted Critical
Publication of JP5733935B2 publication Critical patent/JP5733935B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/91Television signal processing therefor
    • H04N5/913Television signal processing therefor for scrambling ; for copy protection
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T9/00Image coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/129Scanning of coding units, e.g. zig-zag scan of transform coefficients or flexible macroblock ordering [FMO]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/93Run-length coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/94Vector quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/238Interfacing the downstream path of the transmission network, e.g. adapting the transmission rate of a video stream to network bandwidth; Processing of multiplex streams
    • H04N21/2389Multiplex stream processing, e.g. multiplex stream encrypting
    • H04N21/23892Multiplex stream processing, e.g. multiplex stream encrypting involving embedding information at multiplex stream level, e.g. embedding a watermark at packet level
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/83Generation or processing of protective or descriptive data associated with content; Content structuring
    • H04N21/835Generation of protective data, e.g. certificates
    • H04N21/8358Generation of protective data, e.g. certificates involving watermark
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/91Television signal processing therefor

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computer Security & Cryptography (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Collating Specific Patterns (AREA)

Abstract

【課題】ビデオまたはオーディオ等のマルチメディアアイテムの指紋の符号化および復号化を行う方法および装置を提供する。
【解決手段】ビデオセグメントまたはオーディオセグメント等のマルチメディアコンテンツの時間間隔が、1つの低精細指紋および複数の高精細指紋により記述され、各高精細指紋は、前記時間間隔の下位時間間隔に対応し、前記下位時間間隔は、通常、前記時間間隔よりも短い。1つまたは複数の高精細指紋は、時間的に隣り合う署名を参照せずに非予測的に符号化され、1つまたは複数の高精細指紋は、時間的に隣り合う署名から予測的に符号化される。予測符号化は、隣り合う高精細指紋間の差分を計算して、予測差分行列を構成すること、走査パターンに沿ってベクトル化し、一次元ベクトルにすること、および使用される走査方法に基づいて選択される適切な方法により、一次元ベクトルに可逆的符号化を実行することを伴う。
【選択図】図2

Description

関連出願
本願は、2009年10月5日に出願された英国特許出願第0917417.8号明細書からの優先権を主張するものであり、この英国特許出願は、そのすべてが参照により本明細書に援用される。
本発明は、ビデオまたはオーディオ等のマルチメディアアイテムの署名または指紋の符号化および復号化に関する。
マルチメディアコンテンツ(オーディオ、イメージ、およびビデオ)を一意に識別する方法として、マルチメディア指紋(一般に署名(シグネチャ)またはロバストハッシュとも呼ばれる)が提案されている。
典型的な指紋方法は、信号処理技法をマルチメディアコンテンツに適用して、記述子を抽出する。これら記述子は、時間サンプル点での空間情報、時間情報、および/または時空間を表すことができる。通常、記述子は、例えば、2(二進数)、3(三進数)、4(四進数)等の少数の値に量子化し得る特徴の高次元ベクトルである。記述子は、例えば、特異値分解(Singular Value Decomposition)(SVD)等により、より低次元のある空間に射影することもできる。異なるマルチメディア指紋方法の差別化に使用される重要な特性としては、一意性、ロバスト性、記述子サイズ、検索速度、および時間粒度が挙げられる。
フレーム毎、ある既知の期間、または時間位置でサンプリングする従来の方法により抽出されるビデオ指紋は、何等かの有意性(significance)(例えば、キーフレーム)を有すると考えられる。フレーム毎のサンプリングでは、大きな指紋が生成されることになり、記憶コストおよび伝送コストが高くなる。サンプリング間隔が低いほど、小さな指紋が生成されることになるが、この方法により達成可能な時間粒度に損失が生じる。同様の制限がオーディオ指紋に対しても存在することが当業者には明らかであろう。
通常、可逆符号化方式は、ランレングス符号化(run-length coding)と可変長接頭符号化との何等かの組み合わせを利用する。例えば、可逆符号化は、ファックス機メッセージの符号化およびデジタルイメージファイル形式の圧縮に用途を有する。符号化方式の語頭属性は、他のある符号語に等しい接頭部を有する符号語がないことを指す。ハフマン符号が特定の一例であり、符号語長は、符号化シンボルの確率に従って適応的に選択される。
特定のシンボルセットに対して最適なエントロピーの限界を達成するために、符号語の長さはli=−log2iである必要がある。但し、piはi番目のシンボルの確率である。
しかし、確率が符号器(送信器)には既知であるが、復号器(受信器)には既知ではない場合、ハフマン符号化では、信号伝送時に特定の符号語を特定のシンボルに割り当てることに関してのオーバーヘッドが必要である。これは、いくつかの所定の確率表が使用される場合に、少数のビットを使用して行うことができるため、表へのインデックスのみが送信される。
可変長符号化の別の変形である算術符号化は、シンボルの確率が非整数符号語長に対応する場合、最適な符号語長を達成することができる。一般に、算術符号化は、ハフマン符号化よりも複雑であり、ハフマン符号化は、符号語のセットが固定されるユニバーサル符号よりも複雑である。
ユニバーサル符号は、単調減少分布(pi≧pi+1)の場合、期待符号語長が、最適な符号語長よりも一定の係数(constant factor)だけ長いという属性を有する。一般に使用される1つのユニバーサル符号は、指数ゴロム(Exp−ゴロムとしても知られている)であり、指数ゴロムは、両裾が広い(大きなインデックスiを有するシンボルの確率が比較的大きい)指数確率分布の場合に上手く機能する。この符号は、非負整数s(non-negative integer s)により符号語長
Figure 2011130413
を使用してパラメータ化される。s=0,1,2の場合の最初の8つの符号語を以下の表1に示す。
Figure 2011130413
ランレングス符号化は、単一のシンボル表現およびその後に続くそのシンボルのカウント(ランレングス)を使用して、符号化シンボルの連なり(runs)を表す。ランレングス自体は、上述した任意の方法によりエントロピー符号化することができ、その選択は、根本にある確率分布に依存する。
「Video Identification」という名称の本出願人等の同時係属中の日本国特許出願第2010−014279号明細書には、マルチメディア指紋を、低精細指紋(coarse fingerprint)(日本国特許出願第2010−014279号明細書では「ワードヒストグラム」と呼ばれる)、および高精細指紋(fine fingerprint)(日本国特許出願第2010−014279号明細書では「フレーム記述子」と呼ばれる)で構成する方法が開示されており、この日本国特許出願の内容全体は、相互参照により本明細書に援用される。低精細指紋の期間は、複数の高精細指紋の期間に相当する。
典型的な検索アルゴリズムでは、低精細記述子を使用して、一致する時間領域を低い誤検出率で非常に高速に特定する。次に、高精細記述子を使用して、より詳細な検索を時間領域候補に対して実行し得る。
通常、あるマルチメディアコンテンツの高精細指紋の全体サイズは、同じコンテンツの低精細指紋のサイズよりもはるかに大きい。例えば、通常、サイズ比は約10:1であり得る。他方、高精細指紋へのアクセスは頻繁ではない。すなわち、低精細指紋が一致した時間領域を示す場合のみ、高精細指紋にアクセスする。
したがって、頻繁に使用されない部分の高率圧縮およびその部分への容易なアクセスの両方を可能にする、効率的で柔軟なマルチメディア指紋の符号化方式を案出することが望ましい。
本願は、マルチメディア指紋を効率的かつ柔軟に符号化する装置/方法を開示する。対応する復号化装置/方法も開示される。開示される装置/方法は、高精細記述子の圧縮を導入することを含む。これにより提供される技術的な利点は、全体の指紋サイズがかなり低減することである。ハードウェアコストの低減、または実際に使用できるデータベースサイズの増大において、これが非常に望ましいことは明らかであろう。インデックス付けおよび検索速度が顕著に増大しないことを保証するために、効率的であり、かつ複雑性が低い符号化/復号化方式が開示される。
一般に、この方法は、好ましくは動的に選択される圧縮方式に従って、署名のより大きくかつ使用頻度の低い部分を、効率的に、柔軟かつ高速に符号化する一方で、署名のより小さくかつ使用頻度の高い部分を圧縮しないことを含む。この符号化方式は、一方では、高圧縮率に繋がり、他方では、符号化データへの容易なアクセスおよび符号化データの容易な復号化を可能にするように設計される。
より詳細には、本発明の実施形態は、マルチメディア署名符号化の方法および装置を提供し、この方法および装置は、
・記述子のより大きくかつ使用頻度の低い部分の効率的、かつ柔軟、かつ高速の符号化を実現しながら、記述子のより小さくかつ使用頻度の高い部分を圧縮せず、
・一方では、高圧縮率に繋がり、他方では、符号化データへの容易なアクセスおよび符号化データの容易な復号化を可能にし、
・どのデータを圧縮するかを非符号化データの処理に基づいて判断するようにして、復号化の計算負荷を必要最低限まで低減し、
・より効率的なマルチメディア署名の記憶および伝送を可能にする。
マルチメディアコンテンツの時間間隔(temporal interval)(時間セグメントまたはフラグメントとも呼ばれる)、例えば、ビデオセグメントまたはオーディオセグメントは、1つの低精細指紋および複数の高精細指紋により記述され、各高精細指紋は、前記時間間隔の下位時間間隔(sub-interval)に対応し、通常、前記下位時間間隔は前記時間間隔よりも短い。
1つまたは複数の高精細指紋は、時間的に隣り合う署名を参照せずに非予測的に符号化され、1つまたは複数の高精細指紋は、予測的に、時間的に隣り合う署名から符号化される。
好ましくは、予測符号化は、
隣り合う高精細指紋同士の差分を計算して、予測差分行列を構成すること、
前記予測差分行列を走査し、行、列、対角線、または任意の適した走査パターンに沿ってベクトル化することにより一次元ベクトルにすること、および
適切な方法により一次元ベクトルに対して可逆的符号化を実行すること
を伴い、
適切な方法は、好ましくは、少なくとも部分的に、使用される走査方法に基づいて選択される。しかし、他の形態の予測符号化を代わりに使用してもよいことが理解されるであろう。
より具体的には、本発明によれば、デジタルデータの時間シーケンスを符号化するように動作可能なデジタルコンテンツ符号器が提供され、
この符号器は、
時間シーケンスの間隔中のデジタルデータを特徴付ける1つの低精細デジタル指紋を生成するように動作可能な低精細デジタル指紋生成器と、
間隔について複数の高精細デジタル指紋を生成するように動作可能な高精細デジタル指紋生成器であって、各高精細デジタル指紋が、間隔の各下位間隔中のデジタルデータを特徴付ける、高精細デジタル指紋生成器と、
間隔についての高精細デジタル指紋のサブセットに予測符号化を適用するように動作可能な予測符号器と、
を備える。
本発明は、デジタルデータの時間シーケンスのデジタル指紋を符号化するように動作可能なデジタルコンテンツ符号器も提供し、デジタル指紋が、時間シーケンスの間隔中のデジタルデータを特徴付ける1つの低精細デジタル指紋と、間隔についての複数の高精細デジタル指紋とを含み、各高精細デジタル指紋が、間隔の各下位間隔中のデジタルデータを特徴付け、
デジタルコンテンツ符号器は、
間隔の高精細デジタル指紋のうちの少なくとも1つであるが、すべてではない高精細指紋に予測符号化を適用するように構成される予測符号器を備える。
本発明は、符号化デジタルコンテンツを復号化するように動作可能な復号器も提供し、
復号器は、
デジタルデータの時間シーケンスの符号化データを受信するように動作可能な受信器であって、符号化データは、時間シーケンスの複数の間隔のそれぞれにつき、間隔中のデジタルデータを特徴付ける1つの低精細デジタル指紋と、間隔の第1の下位間隔中のデジタルデータを特徴付けるとともに、予測符号化されている少なくとも1つの高精細デジタル指紋と、間隔の第2の下位間隔中のデジタルデータを特徴付ける少なくとも1つの高精細デジタル指紋とを含む、受信器と、
予測符号化されている高精細デジタル指紋を復号化するように動作可能な予測復号器と、
を備える。
本発明は、デジタルデータの時間シーケンスの符号化データのデータベースを検索するように動作可能な検索装置も提供し、符号化データは、時間シーケンスの複数の間隔のそれぞれにつき、間隔中のデジタルデータを特徴付ける1つの低精細デジタル指紋と、間隔の第1の下位間隔中のデジタルデータを特徴付け、予測符号化された少なくとも1つの高精細デジタル指紋と、間隔の第2の下位間隔中のデジタルデータを特徴付ける少なくとも1つの高精細デジタル指紋とを含み、
検索装置は、
入力された低精細デジタル指紋をデータベース内の低精細デジタル指紋と比較して、入力された低精細デジタル指紋に一致するデータベース内の低精細デジタル指紋を識別するように動作可能な指紋照合器と、
予測符号化された高精細デジタル指紋を復号化するように動作可能な予測復号器を含む復号器とを備え、
復号器は、入力された低精細デジタル指紋に一致する低精細デジタル指紋を有する間隔のみの高精細デジタル指紋を復号化するように構成される。
本発明は、デジタルデータの時間シーケンスを符号化する方法も提供し、
この方法は、
時間シーケンスの間隔中のデジタルデータを特徴付ける低精細デジタル指紋を生成すること、
間隔について複数の高精細デジタル指紋を生成することであって、各高精細デジタル指紋は、間隔の各下位間隔中のデジタルデータを特徴付ける、生成すること、および
間隔の高精細デジタル指紋のサブセットにのみ予測符号化を適用すること
を含む。
本発明は、デジタルデータの時間シーケンスのデジタル指紋を符号化する方法も提供し、デジタル指紋は、時間シーケンスの間隔中のデジタルデータを特徴付ける1つの低精細デジタル指紋と、間隔についての複数の高精細デジタル指紋とを含み、各高精細デジタル指紋は、間隔中の各下位間隔中のデジタルデータを特徴付け、
この方法は、
間隔についての高精細デジタル指紋のうちの少なくとも1つであるが、すべてではない高精細指紋に予測符号化を適用することを含む。
本発明は、符号化デジタルコンテンツを復号化する方法も提供し、
この方法は、
デジタルデータの時間シーケンスの符号化データを受信することであって、符号化データは、時間シーケンスの複数の間隔のそれぞれにつき、間隔中のデジタルデータを特徴付ける1つの低精細デジタル指紋と、間隔の第1の下位間隔中のデジタルデータを特徴付け、予測符号化される少なくとも1つの高精細デジタル指紋と、間隔の第2の下位間隔中のデジタルデータを特徴付ける少なくとも1つの高精細デジタル指紋とを含む、受信すること、および
予測符号化された高精細デジタル指紋を復号化すること
を含む。
本発明は、デジタルデータの時間シーケンスの符号化データのデータベースを検索する方法も提供し、符号化データは、時間シーケンスの複数の間隔のそれぞれにつき、間隔中のデジタルデータを特徴付ける1つの低精細デジタル指紋と、間隔の第1の下位間隔中のデジタルデータを特徴付け、予測符号化される少なくとも1つの高精細デジタル指紋と、間隔の第2の下位間隔中のデジタルデータを特徴付ける少なくとも1つの高精細デジタル指紋とを含み、
この方法は、
入力された低精細デジタル指紋をデータベース内の低精細デジタル指紋と比較して、入力された低精細デジタル指紋に一致するデータベース内の低精細デジタル指紋を識別する検索プロセスと、
間隔について予測符号化された高精細デジタル指紋を復号化する復号化プロセスと
を含み、
復号化プロセスは、入力された低精細デジタル指紋に一致する低精細デジタル指紋を有する間隔についてのみ、高精細デジタル指紋を復号化するように実行される。
本発明は、上述した符号化方法、復号化方法、および/または検索方法の実行が動作可能となるようにプログラマブル処理装置をプログラムするコンピュータ可読プログラミング命令を記憶する物理的に具現されるコンピュータプログラム記憶装置も提供する。
本発明は、上述した符号化方法、復号化方法、および/または検索方法の実行が動作可能となるようにプログラマブル処理装置をプログラムするコンピュータ可読プログラミング命令を搬送する信号も提供する。
本発明は、デジタルデータの時間シーケンスの符号化データを搬送する記録担体をさらに提供し、符号化データは、時間シーケンスの複数の間隔のそれぞれにつき、間隔中のデジタルデータを特徴付ける1つの低精細デジタル指紋と、間隔の第1の下位間隔中のデジタルデータを特徴付け、予測符号化される少なくとも1つの高精細デジタル指紋と、間隔の第2の下位間隔中のデジタルデータを特徴付ける少なくとも1つの高精細デジタル指紋とを含む。
本発明は、デジタルデータの時間シーケンスの符号化データを搬送する信号をさらに提供し、符号化データは、時間シーケンスの複数の間隔のそれぞれにつき、間隔中のデジタルデータを特徴付ける低精細デジタル指紋と、間隔の第1の下位間隔中のデジタルデータを特徴付け、予測符号化される少なくとも1つの高精細デジタル指紋と、間隔の第2の下位間隔中のデジタルデータを特徴付ける少なくとも1つの高精細デジタル指紋とを含む。
これより、添付図面を参照して、本発明の実施形態を例としてのみ説明する。
実施形態における符号装置のブロック図を示す。 実施形態におけるデジタル署名を符号化する動作のフローチャートを示す。 実施形態における復号装置のブロック図を示す。 実施形態における予測差分行列の列走査を示す。 実施形態におけるベクトル化された予測差分行列の符号方式を示す。 裾の広い分布を有するゼロランレングスへの良好な適合を提供するために、指数ゴロム符号が実施形態においてどのように使用されるかを示す。 89×170三進値と89×272二進値との比較を示す。 89×170三進値と89×272二進値との比較を示す。
図1は、実施形態における符号装置のブロック図を示し、図2は、マルチメディア署名を符号化するために装置により実行される処理動作を示す。
図3は、実施形態における復号装置のブロック図を示す。
図1および図3に示される装置はそれぞれ、コンピュータプログラム命令に従って処理動作を実行するようにプログラムされたプログラマブル処理装置を備える。
したがって、本発明の実施形態は、CD−ROMもしくは他の記憶装置等のコンピュータプログラム製品(図1では28で示され、図3では122で示される)またはプログラマブル処理装置をプログラムするコンピュータプログラム命令を供給する信号(図1では30で示され、図3では124で示される)を含む。
しかし、図1および/または図3に示される装置の構成要素が、代替として、ハードウェア構成要素であってもよいことが理解されるであろう。
開示される符号化方法では、マルチメディアコンテンツの時間間隔(時間セグメントまたはフラグメントとも呼ばれる)、例えば、ビデオセグメントまたはオーディオセグメントは、1つの低精細指紋および複数の高精細指紋により記述され、各高精細指紋は、前記時間間隔の下位時間間隔に対応し、通常、前記下位時間間隔は前記時間間隔よりも短い。
限定ではなく例として、そのようなマルチメディア指紋抽出方法が、「Video Identification」という名称の上で参照した同時係属中の日本国特許出願第2010−014279号明細書に記載されており、この特許では、時間ビデオセグメント全体は、1つの低精細指紋と、時間セグメントの各フレームにつき1つずつの複数の高精細指紋とにより記述される。
コンテンツ署名を抽出するために、マルチメディアコンテンツを同じ長さの時間セグメントに分割し得るが、または代替として、可変長セグメントを使用してもよい。例えば、可変長は、ビデオもしくはオーディオのショット境界または顕著な変化を検出することにより決定し得る。
好ましい実施形態では、低精細指紋は高精細指紋から抽出される。したがって、可変長セグメントが使用される場合、すべての高精細記述子をマルチメディアコンテンツから抽出した後、時間セグメントを決定することが可能である。そのような実施形態では、高精細記述子の解析を使用して、適した時間セグメントを決定し得る。
ビデオ署名の場合の本発明の好ましい実施形態では、ビデオは時間セグメントに分割され、各時間セグメントの全体は、1つの低精細指紋と、時間セグメントのフレームまたはピクチャ毎に1つずつの複数の高精細指紋とにより記述される。時間セグメントの複数の高精細指紋は、ピクチャグループ(groups of pictures)(GOPs)にグループ化される。
本発明の好ましい実施形態では、temporal_segment( )と示される時間セグメントの圧縮表現を符号化するために必要なシンタックスを表2に概説する。
Figure 2011130413
シンタックス要素の説明
・group_of_pictures( )−少なくとも1つの符号化されたピクチャ指紋で構成されるピクチャグループを指定する。
・segment_length−ピクチャ数単位で時間セグメントの長さを指定する。マルチメディア署名シンタックスの上位レベル部で指定される(時間セグメントに対して定義されるか、またはコンテンツ全体で一定)。
キーピクチャ指紋は、時間的に隣り合うピクチャを参照せずに、非予測的に符号化されるピクチャ指紋であり、これはKPと記される。予測ピクチャ指紋は、時間的に隣り合うピクチャから予測的に符号化され、これはPPと記される。GOPは、時間的に最初のKPおよび次のKP前のすべてのPPを含む、2つのKP間のピクチャ指紋の集合であると定義される。したがって、GOPは、キーピクチャおよび0以上の予測ピクチャからなる。
本発明の好ましい実施形態では、ピクチャ指紋はM個の要素のベクトルであり、各要素はN=3個の可能な値をとる。すなわち、要素は三進数である。単一のキーピクチャ内の情報の冗長性は非常に小さいため、これらピクチャ指紋には圧縮が適用されず、符号化は二進表現を使用して行われる。
本発明の好ましい実施形態では、三進数指紋の2つの異なる二進表現が考えられる。
1.連続した5つの三進数要素のそれぞれが、1バイトにパッキングされる(35=243<256=28)。例えば、M=340の場合、ピクチャ指紋全体では、8×340/5=544ビットが必要である(68バイト)。この方法の実施は、8ビット算術を使用して容易に行うことができる。このパッキング方法は5t→8bと記される。別の例として、M=384の場合、ピクチャ指紋全体では、8×380/5(5t→8b)+7×4/4(4t→7b)=615ビットが必要である(1ビットの予備を有する76バイト)。
2.連続した17の三進数要素のそれぞれが、27ビットにパッキングされる(317=129140163<134217728=227)。最後のバイト列へのパッキングは、取得した27ビットを、特定のバイト位置で、必要なビット量だけビットシフトすることにより達成される。例えば、M=340の場合、27×340/17=540であるため、この方法では、ピクチャ毎に4ビットが節約され、その4ビットを追加の情報(例えば、フラグ)の送信に使用することができる。27ビットが一変換で使用されるため、32ビット算術ベースの実施が可能である。追加の4ビットを有することは、現在のGOP内のすべてゼロの差分ベクトルを、追加のバイトを費やさずに信号伝送することができるようなバイト位置合わせが要求される場合、有用である。このパッキング方法は17t→27bと記される。別の例として、M=384の場合、ピクチャ指紋全体では、27×374/17(17t→27b)+8×10/5(5t→8b)=610ビットが必要である(6ビットの予備を有する76バイト)。
あるいは、他の二進表現も可能であり、三進数要素の数に応じて、パッキングの効率と実施の複雑性とのトレードオフを図ることができる。例えば、M=290の場合、三進数パッキング方法29t→46bを使用することができ、5t→8bパッキングと比較して、4ビットが節約される。
以下、KPの表現に使用されるビット数は、パッキング方法に関係なく「KPビット」と呼ばれる。
本発明の好ましい実施形態では、group_of_pictures( )と記されるGOPの圧縮表現を符号化するために必要なシンタックスを表3に概説する。
Figure 2011130413
シンタックス要素の説明
・key_picture−KPビットにパッキングされたキーピクチャ。
・KP_GOP_flag−1に等しい場合、現在のGOPは単一のキーピクチャからなる(GOP内に予測ピクチャがない)。そうではなく、0に等しい場合、予測ピクチャが現在のGOP内に存在する。
・last_GOP_flag−0に等しい場合、現在のGOPは時間セグメント内の最後のGOPではない。1に等しい場合、現在のGOPはセグメント内の最後のGOPであり、その長さが導出される。
・GOP_length_minus2−ピクチャ数単位のGOP長から2ピクチャを差し引いたもの。例えば、1つのKPおよび1つのPPからなるGOPは、0に等しいこのシンタックス要素値を有する。
・nonzero_GOP_flag−0に等しい場合、PPが現在のGOPに存在するときは、すべてのPPはKPに等しく、復号化はスキップされる(KPはpplen回、繰り返される)。1に等しい場合、PPは復号化される。
・predicted_pictures( )−符号化されたPPを有するビットストリームの部分。
本発明の好ましい実施形態では、予測ピクチャは、現在の指紋内の要素と前の指紋内の要素とのモジュロ3差分(modulo 3 difference)を計算することにより変換される。そのように変換された予測ピクチャが予測差分行列を構成し、予測差分行列は、いわゆる「ベクトル化」ステップで走査されて、一次元ベクトルになる。
ベクトル化ステップは、予測差分行列の列を連結することにより行われる場合、1つのGOP内で、指紋の位置は他のものに比べて変化しない可能性が高いことを利用する。これにより、ゼロランがより長くなり、よりコンパクトな表現になる。
他の代替は、予測差分行列の行を連結し、ジグザグ走査または任意の他の走査パターンで走査することである。ベクトル化走査パターンの選択に応じて、エントロピー符号化方法の異なる選択を行い得る。この選択は、符号化された指紋の統計に応じて、ビデオシーケンス内で動的に行い得る。
符号化されるGOPの構造(KPおよび予測差分行列に変換されたPPで構成される)を図4に示す。図4は、予測差分行列の列走査を示すが、上述したように、他の走査方法を使用してもよい。
三進値は、バイトにパッキングされた二進表現を暗黙的に相関付け解除するため、予測差分の生成に使用されている。
これは、図7(89×170三進値であり、白が三進数「0」を表し、グレーが三進数「1」を表し、黒が三進数「2」を表す)と、
図8(89×272二進値であり、白が二進数「0」を表し、黒が二進数「1」を表す)とを比較することにより結論付けることができる。
図8では、ピクチャ内の相関が図7よりもはるかに高く、両方とも、同じGOP内の指紋要素の最初の半分を表す。
指紋の三進数要素間のモジュロ3差分演算はここでも、3つの三進数シンボル−「0」、「1」、および「2」になる。したがって、予測差分行列は、これら3つの三進数シンボルで構成され、これらは別様に符号化される。
・三進数「1」および「2」−それぞれ1ビットを使用して符号化され、三進数「1」には二進数「0」、三進数「2」には二進数「1」が使用される。各三進数シンボル後、ゼロランのランレングス符号語が挿入される。ゼロが続かない場合、ゼロ長の符号語が使用される。
・三進数「0」−各非ゼロ三進数シンボル後には、ゼロランが続かなければならないため、三進数シンボルは暗黙的に符号化される。
本発明の好ましい実施形態では、predicted_pictures( )と記される、予測差分行列の圧縮表現を符号化するために必要なシンタックスを表4に概説する。
Figure 2011130413
シンタックス要素の説明
・zero_rle−指数ゴロム符号化(exp-Golomb coding)を使用して符号化される三進数「0」のラン長。
・non_zero_symbol−0に等しい場合、現在のシンボルは三進数「1」である。1に等しい場合、現在のシンボルは三進数「2」である。
ベクトル化された予測差分行列のこの符号化方式を図5に示し、「vb」は可変ビット数(variable number of bits)を指し、「1b」は1ビット長を指す。しかし、この符号化方式が唯一の符号化方式ではない。例えば、三進数シンボルを符号化する2つの代替の方法は以下のように進められる。
1.ゼロのゼロ長ランレングスは使用されず、個々の非ゼロシンボルは1ビットを使用して符号化され、追加の1ビットが、次のシンボルの種類(非ゼロまたはゼロ)を信号伝送するために使用される。
2.ゼロのゼロ長ランレングスは使用されず、非ゼロシンボルのランは、ランレングス符号化を使用して符号化される。さらに、1ビットが、次のランのシンボルを信号伝送するために使用される。
ゼロランレングスは、裾が広い分布(裾が広い指数分布またはべき乗分布)を有する。このため、好ましい実施形態では、パラメータs=2を有する指数ゴロム符号が使用される。これは、指数ゴロム符号が、ゼロランレングスの分布に良好な適合性を提供し、複雑性の非常に低い実施に通じるためである。
これは図6に示され、図6は、経験的に取得されたゼロランレングスの確率分布を示す。本発明の代替の実施形態では、パラメータsが適応的に選択されるとともに、その選択がその他のパラメータを使用して符号化される適応指数ゴロム方式を使用することができ、または代替として、ハフマン符号化または算術符号化のような他の何等かの適した符号化方式を使用してもよい。
符号器の要件は、生成されるビットストリームが前の項で概説したシンタックスに従うことである。したがって、潜在的にそれぞれが異なる圧縮性能に繋がる多くの可能な符号化方法がある。以下に、符号器の好ましい実施形態を説明する。
1.各時間セグメントのピクチャ指紋を、その他の時間セグメントから独立して符号化する。
2.セグメントの最初のピクチャ指紋をKPとして符号化する。
3.1ピクチャ分先に進む。現在のピクチャがセグメント内の最後のピクチャである場合、ステップ6に進む。
4.前のピクチャとの相関性について現在のピクチャをテストし、テスト結果が低相関性を示す場合、現在のピクチャ指紋をKPとして符号化する。
5.ステップ4において、KPが挿入されなかった場合、予測差分を予測差分行列に記憶し、ステップ3に戻る。その他の場合、ステップ6に進む。予測差分は、現在のピクチャ指紋と前のピクチャ指紋との間のモジュロ3減算により取得される。
6.記憶された予測差分行列をベクトルに変換し(ベクトル化ステップ)、エントロピー符号化をそのようなベクトルに適用することにより、前のKPから現在のピクチャ前の最後のピクチャまでのすべての指紋を1つのGOPとして符号化する。GOPの冒頭に、必要なすべてのパラメータ、例えば、GOP長、エントロピー符号化パラメータ等を符号化する。任意的に、ベクトル化方法およびエントロピー符号化の選択が行われ、これもパラメータとして符号化される。
ステップ4での相関テストは、予測差分がランレングス符号器を使用して符号化され、そのようなデータのビット長がKPのビット長(KPビット)と比較される、単純な圧縮効率性テストからなり得る。別の例は、単に差分ピクチャ内の三進数ゼロをカウントし、それを閾値と比較することによる。
好ましい実施形態では、フラグが使用されて、圧縮された高精細指紋の存在が示され、好ましくは、1ビットフラグが使用される。
好ましい実施形態では、単一の圧縮フラグが、複数の時間セグメントを含むマルチメディアアイテム全体の指紋に使用される。代替の実施形態では、マルチメディアアイテムの時間セグメント毎に1つずつ、高精細指紋の各セグメントの圧縮の存在を示す複数の圧縮フラグがあってもよい。圧縮フラグは、計算リソースが記憶/送信リソースよりもはるかに少ない場合に圧縮を使用しないという選択肢を許容する。
さらに、システム内で、最も頻繁にアクセスされるコンテンツを圧縮せず、他のすべてのコンテンツを圧縮することが望ましい場合がある。これにより、利用可能な計算リソース(CPU時間、メモリサイズ、ハードディスク帯域幅等)のより最適なバランスを達成することが可能である。例えば、最後の7日間のTVのインデックスを圧縮しない状態で記憶し得る一方で、すべてのより古いコンテンツが圧縮された状態で記憶される。
単一のマルチメディアコンテンツの指紋のうちのいくつかを圧縮形式で記憶し、指紋のうちのいくつかを非圧縮形式で記憶することが望ましい場合もある。
好ましい実施形態では、圧縮フラグが「1」に設定される場合、対応する高精細記述子は圧縮される。圧縮フラグが「0」に設定される場合、圧縮は対応する高精細記述子に適用されない。
符号化は、抽出方法の一環をなしてもよく、または随時適用される別個の方法であってもよく、例えば、高精細指紋を抽出し、ローカルシステムに記憶し、次に、低速接続を介して送信する前に符号化される。
本発明の代替の実施形態では、予測符号化または任意の他の適した符号化方法を使用して、低精細記述子を圧縮することもできる。これは、全体の指紋サイズをさらに低減するが、例えば、照合用途で署名を使用する計算複雑性も増大させることになる。
本発明の代替の実施形態では、KPはいかなるパッキングもなく記憶し得る。例えば、三進値を含むKPを、ピクセル毎に2ビットを使用して「行」形式で記憶し得る。これは、全体の署名サイズを少し増大させるが、高精細署名ブロックを復号化する全体の複雑性の低減にも繋がる。
さらに、低精細署名に加えて、高精細署名の圧縮ブロックの特徴を時間セグメントの高速照合に使用することもできる。そのような特徴としては、KP(キーピクチャ)の絶対位置および相対位置、平均および最大等のゼロランの統計等が挙げられる。
検索速度は、多くのマルチメディア指紋用途で非常に重要である。この理由により、圧縮方式が効率的であることが非常に重要である。本明細書において概説した圧縮方式は、低複雑性という目標を達成する。

Claims (38)

  1. デジタルデータの時間シーケンスを符号化するように動作可能なデジタルコンテンツ符号器であって、
    前記時間シーケンスの間隔中の前記デジタルデータを特徴付ける1つの低精細デジタル指紋を生成するように動作可能な低精細デジタル指紋生成器と、
    前記間隔について複数の高精細デジタル指紋を生成するように動作可能な高精細デジタル指紋生成器であって、前記高精細デジタル指紋のそれぞれは、前記間隔の各下位間隔中の前記デジタルデータを特徴付ける、高精細デジタル指紋生成器と、
    前記高精細デジタル指紋のうちの少なくとも1つであるが、すべてではない高精細デジタル指紋が圧縮符号化されるように、可逆圧縮符号化を前記間隔についての前記高精細デジタル指紋に選択的に適用するように動作可能であると共に、圧縮符号化されない少なくとも1つの高精細デジタル指紋に非圧縮符号化を適用するように動作可能な符号器と
    を備える、デジタルコンテンツ符号器。
  2. デジタルデータの時間シーケンスを符号化するように動作可能なデジタルコンテンツ符号器であって、
    前記時間シーケンスの間隔中の前記デジタルデータを特徴付ける1つの低精細デジタル指紋を生成するように動作可能な低精細デジタル指紋生成器と、
    前記間隔について複数の高精細デジタル指紋を生成するように動作可能な高精細デジタル指紋生成器であって、前記高精細デジタル指紋のそれぞれは、前記間隔の各下位間隔中の前記デジタルデータを特徴付ける、高精細デジタル指紋生成器と、
    前記高精細デジタル指紋のうちの少なくとも1つであるが、すべてではない高精細デジタル指紋に予測符号化を適用するように動作可能な予測符号器と
    を備える、デジタルコンテンツ符号器。
  3. 前記間隔の前記高精細デジタル指紋の少なくとも1つの他の高精細デジタル指紋に非予測符号化を適用するように動作可能な非予測符号器をさらに備える、請求項2に記載のデジタルコンテンツ符号器。
  4. 前記高精細デジタル指紋生成器は、三進値のベクトルとして前記高精細デジタル指紋のそれぞれを生成するように動作可能であり、
    前記非予測符号器は、前記高精細デジタル指紋の三進値の前記ベクトルの二進表現を生成することにより、前記非予測符号化を高精細デジタル指紋に適用するように動作可能である、請求項3に記載のデジタルコンテンツ符号器。
  5. 前記デジタルコンテンツ符号器は、ピクチャの時間シーケンスを符号化するように動作可能であり、
    前記デジタルコンテンツ符号器は、前記シーケンス内のピクチャをキーピクチャとして指定するように動作可能なキーピクチャ指定部をさらに備え、
    前記予測符号器は、前記予測符号化を非キーピクチャの前記高精細デジタル指紋に適用するように動作可能である、請求項2から請求項4までのいずれか1項に記載のデジタルコンテンツ符号器。
  6. 前記低精細指紋生成器は、前記間隔についての前記複数の高精細指紋から、前記間隔についての前記1つの低精細指紋を生成するように動作可能である、請求項2から請求項5までのいずれか1項に記載のデジタルコンテンツ符号器。
  7. 前記デジタルコンテンツ符号器は、低精細デジタル指紋および高精細デジタル指紋を生成し、異なる長さの間隔の符号化を実行するように動作可能である、請求項2から請求項6までのいずれか1項に記載のデジタルコンテンツ符号器。
  8. 前記高精細デジタル指紋に応じて、前記間隔のそれぞれの長さを計算するように動作可能な間隔長計算器をさらに備える、請求項7に記載のデジタルコンテンツ符号器。
  9. 前記高精細デジタル指紋生成器は、三進値のベクトルとして前記高精細デジタル指紋のそれぞれを生成するように動作可能であり、
    前記予測符号器は、
    前記高精細デジタル指紋と異なる高精細デジタル指紋との差分を、それらのモジュロ3差分を計算して、予測差分行列を生成することにより計算し、
    前記予測差分行列を走査して、三進値のベクトルとして一次元ベクトルを形成し、
    三進値「1」および「2」が、1ビットを使用して符号化され、三進値「0」がゼロランを使用して暗黙的に符号化されるように、前記一次元ベクトルの符号化を実行する
    ことにより、予測符号化を高精細デジタル指紋に適用するように動作可能であり、
    前記予測符号器は、
    前記予測差分行列の複数の異なる種類の走査を実行して、前記一次元ベクトルを形成し、
    前記一次元ベクトルの複数の異なる種類の符号化を実行し、
    前記複数の異なる種類の走査から、前記デジタルデータの時間シーケンス内の高精細デジタル指紋を符号化するものを選択し、
    前記選択された走査の種類に応じて、前記複数の異なる種類の走査から、前記一次元ベクトルを符号化するものを選択する
    ように動作可能である、請求項2から請求項8までのいずれか1項に記載のデジタルコンテンツ符号器。
  10. 符号化デジタルコンテンツを復号化するように動作可能な復号器であって、
    デジタルデータの時間シーケンスの符号化データを受信するように動作可能な受信器であって、前記符号化データは、前記時間シーケンスの複数の間隔のそれぞれにつき、前記間隔中の前記デジタルデータを特徴付ける1つの低精細デジタル指紋、及び前記間隔の各下位間隔中の前記デジタルデータをそれぞれ特徴付ける複数の高精細デジタル指紋を含み、前記高精細デジタル指紋のうちの少なくとも1つであるが、すべてではない高精細デジタル指紋が、予測符号化される、受信器と、
    前記予測符号化された高精細デジタル指紋を復号化するように動作可能な予測復号器と
    を備える、復号器。
  11. 前記受信器は、符号化データを受信するように動作可能であり、各間隔の少なくとも1つの高精細デジタル指紋は非予測的に符号化され、
    前記復号器は、前記非予測的に符号化された高精細デジタル指紋を復号化するように動作可能である非予測復号器をさらに備える、請求項10に記載の復号器。
  12. 前記受信器は符号化データを受信するように動作可能であり、前記非予測的に符号化された高精細デジタル指紋は三進値の二進表現を含み、
    前記非予測復号器は、前記二進表現を復号化して、前記三進値を生成するように動作可能である、請求項11に記載の復号器。
  13. 前記復号器は、異なる長さの間隔の符号化データを受信して復号化するように動作可能である、請求項10から請求項12までのいずれか1項に記載の復号器。
  14. 前記予測復号器は、
    前記受信した予測符号化データを復号化して、一次元ベクトルを生成し、
    前記一次元ベクトルからの値を予測差分行列内に配置し、
    前記予測差分行列を前に復号化された高精細デジタル指紋と結合して、復号化中の前記高精細デジタル指紋を再構築する
    ことにより、予測符号化された高精細デジタル指紋のそれぞれを復号化するように動作可能である、請求項10から請求項13までのいずれか1項に記載の復号器。
  15. 前記予測符号器は、モジュロ3加算を実行することにより、前記予測差分行列を前に復号化された高精細デジタル指紋と結合するように動作可能である、請求項14に記載の復号器。
  16. デジタルデータの時間シーケンスの符号化データのデータベースを検索するように動作可能な検索装置であって、前記符号化データは、前記時間シーケンスの複数の間隔のそれぞれにつき、前記間隔内の前記デジタルデータを特徴付ける1つの低精細デジタル指紋と、前記間隔の各下位間隔中の前記デジタルデータをそれぞれ特徴付ける複数の高精細デジタル指紋とを備え、前記高精細デジタル指紋のうちの少なくとも1つであるが、すべてではない高精細デジタル指紋は予測符号化され、各間隔の前記符号化データは、非予測的に符号化されるとともに、三進値の二進表現を含む少なくとも1つの高精細デジタル指紋を含み、
    前記検索装置は、
    入力された低精細デジタル指紋と前記データベース内の前記低精細デジタル指紋とを比較して、前記入力された低精細デジタル指紋に一致する前記データベース内の低精細デジタル指紋を識別するように動作可能な指紋照合器と、
    復号器と
    を備え、
    前記復号器は、
    −前記予測符号化された高精細デジタル指紋を復号化するように動作可能な予測復号器と、
    −前記二進表現を復号化して、前記三進値を生成することにより、前記非予測的に符号化された高精細デジタル指紋を復号化するように動作可能な非予測復号器と
    を備え、
    前記復号器は、前記入力された低精細デジタル指紋に一致する低精細デジタル指紋を有する前記間隔の前記高精細デジタル指紋のみを復号化するように構成され、
    前記予測復号器は、
    前記受信した予測符号化データを復号化して、一次元ベクトルを生成し、
    前記一次元ベクトルからの値を予測差分行列内に配置し、
    モジュロ3加算を実行することにより、前記予測差分行列を前に復号化された高精細デジタル指紋と結合して、復号化中の前記高精細デジタル指紋を再構築する
    ことにより、予測符号化された高精細デジタル指紋のそれぞれを復号化するように動作可能である、検索装置。
  17. デジタルデータの時間シーケンスを符号化する方法であって、
    前記時間シーケンスの間隔中の前記デジタルデータを特徴付ける1つの低精細デジタル指紋を生成すること、
    前記間隔について複数の高精細デジタル指紋を生成することであって、前記高精細デジタル指紋のそれぞれは、前記間隔の各下位間隔中の前記デジタルデータを特徴付けること、
    前記高精細デジタル指紋のうちの少なくとも1つであるが、すべてではない高精細デジタル指紋が圧縮符号化されるように、可逆圧縮符号化を前記間隔についての前記高精細デジタル指紋に選択的に適用すること、および
    少なくとも1つの高精細デジタル指紋に非圧縮符号化を適用すること
    を含む、方法。
  18. デジタルデータの時間シーケンスを符号化する方法であって、
    前記時間シーケンスの間隔中の前記デジタルデータを特徴付ける1つの低精細デジタル指紋を生成すること、
    前記間隔について複数の高精細デジタル指紋を生成することであって、前記高精細デジタル指紋のそれぞれは、前記間隔の各下位間隔中の前記デジタルデータを特徴付けること、および
    前記間隔についての前記高精細デジタル指紋の少なくとも1つであるが、すべてではない高精細デジタル指紋を予測符号化すること
    を含む、方法。
  19. 前記間隔の前記高精細デジタル指紋のうちの少なくとも1つの他の高精細デジタル指紋を非予測的に符号化することをさらに含む、請求項18に記載の方法。
  20. 前記高精細デジタル指紋のそれぞれは、三進値のベクトルとして生成され、
    前記高精細デジタル指紋を非予測的に符号化することは、前記高精細デジタル指紋の三進値のベクトルの二進表現を生成することを含む、請求項19に記載の方法。
  21. 前記時間シーケンスは、ピクチャの時間シーケンスを含み、
    前記方法は、前記シーケンス内のピクチャをキーピクチャとして指定することをさらに含み、
    前記非キーピクチャの前記高精細デジタル指紋は、予測符号化される、請求項18から請求項20までのいずれか1項に記載の方法。
  22. 前記間隔の前記1つの低精細指紋は、前記間隔の前記複数の高精細指紋から生成される、請求項18から請求項21までのいずれか1項に記載の方法。
  23. 前記処理が繰り返されて、異なる長さの間隔の低精細デジタル指紋および高精細デジタル指紋を生成し符号化する、請求項18から請求項22までのいずれか1項に記載の方法。
  24. 前記高精細デジタル指紋に応じて、前記間隔のそれぞれの長さを計算することをさらに含む、請求項23に記載の方法。
  25. 前記高精細デジタル指紋のそれぞれは、三進値のベクトルとして生成され、
    前記高精細デジタル指紋の予測符号化は、
    前記高精細デジタル指紋と異なる高精細デジタル指紋との差分を、それらのモジュロ3差分を計算することにより計算して、予測差分行列を生成すること、
    複数の異なる種類の走査から、前記予測差分行列を走査するものを選択し、
    前記予測差分行列を前記選択された種類の走査で走査して、三進値のベクトルとして一次元ベクトルを形成すること、
    前記選択された走査の種類に応じて、複数の異なる種類の符号化から、前記高精細デジタル指紋の前記一次元ベクトルを符号化するものを選択すること、および
    三進値「1」および「2」が1ビットを使用して符号化され、三進値「0」がゼロランを使用して暗黙的に符号化されるように、前記選択された種類の符号化を使用して前記一次元ベクトルの符号化を実行すること
    を含む、請求項18から請求項24までのいずれか1項に記載の方法。
  26. 符号化デジタルコンテンツを復号化する方法であって、
    デジタルデータの時間シーケンスの符号化データを受信することであって、前記符号化データは、前記時間シーケンスの複数の間隔のそれぞれにつき、前記間隔中の前記デジタルデータを特徴付ける1つの低精細デジタル指紋と、前記間隔の各下位間隔中の前記デジタルデータをそれぞれ特徴付ける複数の高精細デジタル指紋とを含み、前記高精細指紋のうちの少なくとも1つであるが、すべてではない高精細デジタル指紋は予測符号化される、受信すること、および
    前記予測符号化された高精細デジタル指紋を復号化すること
    を含む、方法。
  27. 符号化データが受信され、前記符号化データ内では、各間隔の少なくとも1つの高精細デジタル指紋が非予測的に符号化され、
    前記方法は、前記非予測的に符号化された高精細デジタル指紋を復号化することをさらに含む、請求項26に記載の方法。
  28. 受信した前記符号化データ内で、前記非予測的に符号化された高精細デジタル指紋は、三進値の二進表現を含み、
    前記非予測的に復号化することは、前記二進表現を復号化して、前記三進値を生成することを含む、請求項27に記載の方法。
  29. 異なる長さの間隔の符号化データが受信され復号化される、請求項26から請求項28までのいずれか1項に記載の方法。
  30. 予測符号化された高精細デジタル指紋のそれぞれを予測復号化することは、
    前記受信した予測符号化データを復号化して、一次元ベクトルを生成すること、
    前記一次元ベクトルからの値を予測差分行列内に配置すること、および
    前記予測差分行列を前に復号化された高精細デジタル指紋と結合して、復号化中の前記高精細デジタル指紋を再構築すること
    を含む、請求項26から請求項29までのいずれか1項に記載の方法。
  31. 前記予測差分行列は、モジュロ3加算を実行することにより、前に復号化された高精細デジタル指紋と結合される、請求項30に記載の方法。
  32. デジタルデータの時間シーケンスの符号化データのデータベースを検索する方法であって、前記符号化データは、前記時間シーケンスの複数の間隔のそれぞれにつき、前記間隔中の前記デジタルデータを特徴付ける1つの低精細デジタル指紋と、前記間隔の各下位間隔中の前記デジタルデータをそれぞれ特徴付ける複数の高精細デジタル指紋とを含み、前記高精細デジタル指紋のうちの少なくとも1つであるが、すべてではない高精細デジタル指紋は、予測符号化され、各間隔の前記符号化データは、非予測的に符号化されるとともに、三進値の二進表現を含む少なくとも1つの高精細デジタル指紋を含み、前記方法は、
    入力された低精細デジタル指紋を前記データベース内の前記低精細デジタル指紋と比較して、前記入力された低精細デジタル指紋に一致する前記データベース内の低精細デジタル指紋を識別する照合プロセスと、
    復号化プロセスであって、
    −前記予測符号化された高精細デジタル指紋を予測復号化すること、および
    −前記二進表現を復号化することにより、前記非予測的に符号化された高精細デジタル指紋を復号化して、前記三進値を生成すること
    を含む、復号化プロセスと
    を含み、
    前記復号化プロセスは、前記入力された低精細デジタル指紋に一致する低精細デジタル指紋を有する間隔についての前記高精細デジタル指紋のみを復号化し、
    予測符号化された高精細デジタル指紋のそれぞれは、
    前記受信された予測符号化データを復号化して、一次元ベクトルを生成し、
    前記一次元ベクトルからの値を予測差分行列内に配置し、
    モジュロ3加算を実行することにより、前記予測差分行列を前に復号化された高精細デジタル指紋と結合して、復号化中の前記高精細デジタル指紋を再構築すること
    により復号化される、方法。
  33. デジタルデータの時間シーケンスの符号化データを搬送する記録担体であって、前記符号化データは、前記時間シーケンスの複数の間隔のそれぞれにつき、前記間隔中の前記デジタルデータを特徴付ける1つの低精細デジタル指紋と、前記間隔の各下位間隔中の前記デジタルデータをそれぞれ特徴付ける複数の高精細デジタル指紋とを含み、前記高精細指紋のうちの少なくとも1つであるが、すべてではない高精細デジタル指紋は、予測符号化される、記録担体。
  34. 各間隔の少なくとも1つの高精細デジタル指紋は非予測的に符号化される、請求項33に記載の記録担体。
  35. デジタルデータの時間シーケンスの符号化データを搬送する信号であって、前記符号化データは、前記時間シーケンスの複数の間隔のそれぞれにつき、前記間隔中の前記デジタルデータを特徴付ける1つの低精細デジタル指紋と、前記間隔の各下位間隔中の前記デジタルデータをそれぞれ特徴付ける複数の高精細デジタル指紋とを含み、前記高精細指紋のうちの少なくとも1つであるが、すべてではない高精細デジタル指紋は、予測符号化される、信号。
  36. 各間隔の少なくとも1つの高精細デジタル指紋は非予測的に符号化される、請求項35に記載の信号。
  37. 請求項17から請求項32までの少なくとも一項に記載の方法の実行を動作可能にするように、プログラマブル処理装置をプログラムするコンピュータプログラム命令を記憶する記憶装置。
  38. 請求項17から請求項32までの少なくとも一項に記載の方法の実行を動作可能にするように、プログラマブル処理装置をプログラムするコンピュータプログラム命令を搬送する信号。
JP2010221625A 2009-10-05 2010-09-30 デジタルコンテンツ符号器、復号器、検索装置、符号化方法、検索方法および記憶装置 Active JP5733935B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
GB0917417.8 2009-10-05
GBGB0917417.8A GB0917417D0 (en) 2009-10-05 2009-10-05 Multimedia signature coding and decoding

Publications (3)

Publication Number Publication Date
JP2011130413A true JP2011130413A (ja) 2011-06-30
JP2011130413A5 JP2011130413A5 (ja) 2013-11-07
JP5733935B2 JP5733935B2 (ja) 2015-06-10

Family

ID=41393857

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010221625A Active JP5733935B2 (ja) 2009-10-05 2010-09-30 デジタルコンテンツ符号器、復号器、検索装置、符号化方法、検索方法および記憶装置

Country Status (6)

Country Link
US (1) US8731066B2 (ja)
EP (1) EP2317476B1 (ja)
JP (1) JP5733935B2 (ja)
KR (1) KR101678223B1 (ja)
CN (1) CN102098508B (ja)
GB (1) GB0917417D0 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017513369A (ja) * 2014-03-25 2017-05-25 クアルコム,インコーポレイテッド ビデオコーディングのためのランレングスコードを用いるパレット予測子シグナリング

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9047516B2 (en) * 2010-06-18 2015-06-02 Verizon Patent And Licensing Inc. Content fingerprinting
US8762520B2 (en) 2010-07-02 2014-06-24 At&T Intellectual Property I, L.P. Method and system to detect a predictive network signature
ES2628427T3 (es) * 2011-02-02 2017-08-02 Nagravision S.A. Decodificador multimedia y método de decodificación que permite el rastreo del decodificador multimedia
US8538239B2 (en) 2011-12-22 2013-09-17 Broadcom Corporation System and method for fingerprinting video
US8660296B1 (en) * 2012-01-10 2014-02-25 Google Inc. Systems and methods for facilitating video fingerprinting using local descriptors
US9292894B2 (en) * 2012-03-14 2016-03-22 Digimarc Corporation Content recognition and synchronization using local caching
ITTO20120985A1 (it) * 2012-11-14 2014-05-15 St Microelectronics Srl Procedimenti per la codifica e la decodifica di flussi di frame video digitali, relativi sistemi e prodotti informatici
DE102013205542A1 (de) * 2013-03-28 2014-10-02 Robert Bosch Gmbh Vorrichtung und Verfahren zur Verarbeitung von Daten
US10284613B2 (en) 2014-02-18 2019-05-07 Dropbox, Inc. Streaming of variable length content segments
KR20150102333A (ko) * 2014-02-28 2015-09-07 삼성전자주식회사 방송신호수신장치 및 그 제어방법
EP3859734B1 (en) * 2014-05-01 2022-01-26 Nippon Telegraph And Telephone Corporation Sound signal decoding device, sound signal decoding method, program and recording medium
KR102430173B1 (ko) 2015-11-24 2022-08-05 삼성전자주식회사 디스플레이 장치

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11261961A (ja) * 1998-03-10 1999-09-24 Toshiba Corp 動画像処理装置
JP2006108984A (ja) * 2004-10-04 2006-04-20 Sony Corp 情報処理装置および方法、並びにプログラム
WO2008128143A2 (en) * 2007-04-13 2008-10-23 Ipharro Media, Gmbh Video detection system and methods
JP2008263502A (ja) * 2007-04-13 2008-10-30 Victor Co Of Japan Ltd 記録再生装置及び記録再生システム
WO2010087125A1 (ja) * 2009-01-29 2010-08-05 日本電気株式会社 時間区間代表特徴ベクトル生成装置

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5329313A (en) * 1992-04-01 1994-07-12 Intel Corporation Method and apparatus for real time compression and decompression of a digital motion video signal using a fixed Huffman table
AU2003247116A1 (en) * 2002-08-30 2004-03-19 Koninklijke Philips Electronics N.V. Embedding fingerprint data for media content identification
KR20050098292A (ko) * 2003-02-04 2005-10-11 코닌클리케 필립스 일렉트로닉스 엔.브이. 코딩된 잔류 모션 벡터 데이터의 존재를 통지하는 플래그를포함한 모션 벡터들의 예측 인코딩
GB2418555A (en) 2004-09-23 2006-03-29 Mitsubishi Electric Inf Tech Representing an image using descriptors based on colour information
GB2418556A (en) 2004-09-23 2006-03-29 Mitsubishi Electric Inf Tech Representing an image using descriptors based on colour information
US8326775B2 (en) * 2005-10-26 2012-12-04 Cortica Ltd. Signature generation for multimedia deep-content-classification by a large-scale matching system and method thereof
US8156132B1 (en) * 2007-07-02 2012-04-10 Pinehill Technology, Llc Systems for comparing image fingerprints
US8009861B2 (en) * 2006-04-28 2011-08-30 Vobile, Inc. Method and system for fingerprinting digital video object based on multiresolution, multirate spatial and temporal signatures
DE602006017001D1 (de) * 2006-06-29 2010-10-28 Thomson Licensing System und verfahren für objektorientierte fingerabdrücke digitaler videos
EP2315161A1 (en) 2006-10-11 2011-04-27 Mitsubishi Electric Information Technology Centre Europe B.V. Image descriptor for image recognition
US8351643B2 (en) * 2007-10-05 2013-01-08 Dolby Laboratories Licensing Corporation Media fingerprints that reliably correspond to media content
CN102124489B (zh) * 2008-08-17 2014-08-06 杜比实验室特许公司 图像的签名推导
US8290918B1 (en) * 2009-09-29 2012-10-16 Google Inc. Robust hashing of digital media data

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11261961A (ja) * 1998-03-10 1999-09-24 Toshiba Corp 動画像処理装置
JP2006108984A (ja) * 2004-10-04 2006-04-20 Sony Corp 情報処理装置および方法、並びにプログラム
WO2008128143A2 (en) * 2007-04-13 2008-10-23 Ipharro Media, Gmbh Video detection system and methods
JP2008263502A (ja) * 2007-04-13 2008-10-30 Victor Co Of Japan Ltd 記録再生装置及び記録再生システム
WO2010087125A1 (ja) * 2009-01-29 2010-08-05 日本電気株式会社 時間区間代表特徴ベクトル生成装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017513369A (ja) * 2014-03-25 2017-05-25 クアルコム,インコーポレイテッド ビデオコーディングのためのランレングスコードを用いるパレット予測子シグナリング
US10362336B2 (en) 2014-03-25 2019-07-23 Qualcomm Incorporated Palette predictor signaling with run length code for video coding

Also Published As

Publication number Publication date
EP2317476A2 (en) 2011-05-04
KR101678223B1 (ko) 2016-11-21
GB0917417D0 (en) 2009-11-18
CN102098508A (zh) 2011-06-15
EP2317476B1 (en) 2017-11-01
KR20110037898A (ko) 2011-04-13
US20110080958A1 (en) 2011-04-07
US8731066B2 (en) 2014-05-20
JP5733935B2 (ja) 2015-06-10
EP2317476A3 (en) 2011-12-14
CN102098508B (zh) 2016-08-17

Similar Documents

Publication Publication Date Title
JP5733935B2 (ja) デジタルコンテンツ符号器、復号器、検索装置、符号化方法、検索方法および記憶装置
US11638007B2 (en) Codebook generation for cloud-based video applications
JP3978478B2 (ja) 推定画素値により固定速度のブロック単位の画像圧縮を行うための装置及び方法
RU2417518C2 (ru) Эффективное кодирование и декодирование блоков преобразования
US5818877A (en) Method for reducing storage requirements for grouped data values
US5045852A (en) Dynamic model selection during data compression
US8285062B2 (en) Method for improving the performance of embedded graphics coding
JP2016006961A (ja) 整数値データのストリームを圧縮するシステム及び方法
CN101653004A (zh) 从编码比特流选择性地解码预定数据单元的解码器
CN113228668A (zh) 用于信号增强编码的熵编码
KR102400514B1 (ko) 디지털 데이터 압축을 위한 방법 및 디바이스
US11032578B2 (en) Residual entropy compression for cloud-based video applications
JP3990464B2 (ja) ディジタルビデオ信号プロセッサのためのデータ効率のよい量子化テーブル
KR100906041B1 (ko) 폰트 압축 및 검색 방법 및 장치
JP2006093958A (ja) プログレッシブjpeg復号化システム
Shoba et al. A Study on Data Compression Using Huffman Coding Algorithms
US8411745B2 (en) Method and apparatus for coding and decoding using bit-precision
US10798383B2 (en) Method for decoding a digital image, coding method, devices, terminal and associated computer programs
KR100686354B1 (ko) 가변 트리를 이용한 허프만 복호화 방법 및 장치
EA044215B1 (ru) Энтропийное кодирование усиления сигнала
Bhosale et al. A Modified Image Template for FELICS Algorithm for Lossless Image Compression
JPH0659857A (ja) データ圧縮装置
KR20030054146A (ko) 저전력 가변장 부호화 장치

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130920

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20130920

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20140827

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140909

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20141208

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20150317

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20150414

R150 Certificate of patent or registration of utility model

Ref document number: 5733935

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250