JP5060565B2 - 信号の信頼できる識別をするためのビデオ及びオーディオ信号内容の特徴の抽出 - Google Patents
信号の信頼できる識別をするためのビデオ及びオーディオ信号内容の特徴の抽出 Download PDFInfo
- Publication number
- JP5060565B2 JP5060565B2 JP2009539366A JP2009539366A JP5060565B2 JP 5060565 B2 JP5060565 B2 JP 5060565B2 JP 2009539366 A JP2009539366 A JP 2009539366A JP 2009539366 A JP2009539366 A JP 2009539366A JP 5060565 B2 JP5060565 B2 JP 5060565B2
- Authority
- JP
- Japan
- Prior art keywords
- value
- vector
- signature
- features
- video
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 230000005236 sound signal Effects 0.000 title claims description 26
- 238000000605 extraction Methods 0.000 title description 4
- 238000000034 method Methods 0.000 claims description 68
- 230000003595 spectral effect Effects 0.000 claims description 66
- 238000005259 measurement Methods 0.000 claims description 35
- 239000000284 extract Substances 0.000 claims description 5
- 238000005070 sampling Methods 0.000 claims description 5
- 239000013598 vector Substances 0.000 claims 77
- 238000012986 modification Methods 0.000 abstract description 15
- 230000004048 modification Effects 0.000 abstract description 15
- 230000008569 process Effects 0.000 description 25
- 238000010586 diagram Methods 0.000 description 22
- 238000012545 processing Methods 0.000 description 16
- 238000012360 testing method Methods 0.000 description 15
- 230000006870 function Effects 0.000 description 12
- 238000001228 spectrum Methods 0.000 description 12
- 238000009966 trimming Methods 0.000 description 10
- 230000001360 synchronised effect Effects 0.000 description 8
- 230000008859 change Effects 0.000 description 7
- 239000011159 matrix material Substances 0.000 description 7
- 230000015572 biosynthetic process Effects 0.000 description 6
- 238000012937 correction Methods 0.000 description 6
- 230000000694 effects Effects 0.000 description 6
- 238000011084 recovery Methods 0.000 description 6
- 230000035945 sensitivity Effects 0.000 description 6
- 238000006243 chemical reaction Methods 0.000 description 5
- 230000000750 progressive effect Effects 0.000 description 5
- 230000003111 delayed effect Effects 0.000 description 3
- 238000000691 measurement method Methods 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 239000002131 composite material Substances 0.000 description 2
- 230000001934 delay Effects 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 230000004075 alteration Effects 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 238000005352 clarification Methods 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 238000013144 data compression Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000009740 moulding (composite fabrication) Methods 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 230000002085 persistent effect Effects 0.000 description 1
- IBBLRJGOOANPTQ-JKVLGAQCSA-N quinapril hydrochloride Chemical compound Cl.C([C@@H](C(=O)OCC)N[C@@H](C)C(=O)N1[C@@H](CC2=CC=CC=C2C1)C(O)=O)CC1=CC=CC=C1 IBBLRJGOOANPTQ-JKVLGAQCSA-N 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
- 230000016776 visual perception Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T1/00—General purpose image data processing
- G06T1/0021—Image watermarking
- G06T1/005—Robust watermarking, e.g. average attack or collusion attack resistant
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/60—Information retrieval; Database structures therefor; File system structures therefor of audio data
- G06F16/68—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/683—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/70—Information retrieval; Database structures therefor; File system structures therefor of video data
- G06F16/78—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/783—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
- G06F16/7834—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using audio features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/70—Information retrieval; Database structures therefor; File system structures therefor of video data
- G06F16/78—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/783—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
- G06F16/7847—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using low-level visual features of the video content
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T1/00—General purpose image data processing
- G06T1/0021—Image watermarking
- G06T1/0028—Adaptive watermarking, e.g. Human Visual System [HVS]-based watermarking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/40—Scenes; Scene-specific elements in video content
- G06V20/46—Extracting features or characteristics from the video content, e.g. video fingerprints, representative shots or key frames
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/40—Scenes; Scene-specific elements in video content
- G06V20/48—Matching video sequences
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
- G10L25/54—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for retrieval
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/18—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B20/00—Signal processing not specific to the method of recording or reproducing; Circuits therefor
- G11B20/10—Digital recording or reproducing
- G11B20/10527—Audio or video recording; Data buffering arrangements
- G11B2020/10537—Audio or video recording
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- General Physics & Mathematics (AREA)
- Library & Information Science (AREA)
- General Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
- Image Analysis (AREA)
- Television Signal Processing For Recording (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Description
A.説明
図1は信号の信頼できる識別を得るためにビデオ/オーディオ信号3のセグメント3aから3dの内容を検討する代表的なシステム300の略ブロック図である。ビデオ署名発生器100はビデオ内容を認識する一組のビデオ署名(SV)199aから199dを得、オーディオ信号発生器200はオーディオ内容を識別する一組のオーディオ署名(SA)299aから299dを得る。図に示す例ではビデオ及びオーディオビデオ内容の個々の署名はビデオ/オーディオ信号のセグメントに対応する。この具体的な例は以下の幾つかの段落で更に議論するが、ビデオ/オーディオ信号のそれぞれのセグメントはビデオ内容の一フレーム及びオーディオ内容の一セグメントを伝える。ビデオ/オーディオセグメント、ビデオフレーム、オーディオセグメント及び署名の間のこの具体的な対応は単に一つの例として示すものである。他の組み合わせた対応も可能である。
ビデオ署名発生器100の成分は種々の方法で実施されうる。好ましい実施の態様では、殆ど又は全く知覚上の効果を持たないビデオ内容の改変に比較的無反応である署名を作り出す。ビデオ内容に対する改変が知覚される画像に本質的な影響を与えない場合は、これらの改変はまた生成された署名に本質的な影響を持たない。2つのビデオ署名の間のいくらかの相違は、署名が生成される2つの内容の相違の程度に等しい。いくつかの代表的な例を以下に検討する。
相違測定プロセッサ120の幾つかの代表的実施例を図4Aから4Cに示す。図4Aを参照すると、構成部分122aはビデオフレーム1aから一以上のピクセル群を形成し、構成部分124aはこれらのそれぞれのピクセル群の一以上の特徴を抽出しそして各特徴を表すR値を算出する。構成部分122bはビデオフレーム1bからの一以上のピクセル群を形成し、構成部分124bはこれらのそれぞれのピクセル群から一以上の特徴を抽出し、これらの各々の特徴を表すR値を算出する。構成部分126は2つのビデオフレーム1a、1b中の対応する特徴と対応するピクセル群のR値の間の相違測定値を表す中間値Qを算出する。
構成部分122a及び122bは実質的に任意の所望の方法によりピクセル群を形成してもよい。以下に幾つかの代替案を検討する。もし望む場合は、ビデオ署名を作り出すために用いられるビデオフレーム中の情報は、画像の端又はコーナーにレターボックス又は図形を加える任意のプロセスにより生ずる変化を避けるために全画像の一部分のみに限定してもよい。これは、特徴を抽出する前に画像をトリミングすることにより、R値が算出された後に抽出された特徴を表す一連のR値をトリミングすることにより、又はR値から算出される一連の相違値をトリミングすることによるなどの種々の方法により達成される。好ましくは、これは特徴を抽出する前に画像をトリミングすることで達成される。
構成部分124a及び124bは各ピクセル群から一以上の特徴を抽出して各特徴を表すR値を算出する。
RAVE(k,l)=ピクセル(k,l)群のピクセルの平均強度
e(i,j)=群中のピクセル(i,j)の強度
GX=ピクセル数で表されるピクセル群の幅
GY=ピクセル数で表されるピクセル群の高さ
K=ピクセル数で表される画像の水平解像度
L=ピクセル数で表される画像の垂直解像度
抽出される他の特徴はピクセル強度の標準偏差である。代替的に標準偏差の分散又は二乗を用いても良い。標準偏差を表すRSD値は以下の式から得られる:
RSD(k,l)=ピクセル(k, l)群中のピクセル強度の標準偏差。
構成部分126は測定相違Eを表す中間値Qを種々の方法で算出する。その測定方法を選択することは原則として本発明にとり決定的なものではないが、ある測定方法は構成部分124a及び124bにより抽出される特徴に基づいてより良い結果示すこともある。好適な選択をするためには経験的な判断が必要となることもある。以下に述べる2つの方法は広い範囲で適用されよい結果を生むことが判明した。
E(k, l, f1, f2) =ピクセル群(k,l)のフレームf1及び f2の間の相違、及びR(k, l, x) =フレームxのピクセル群(k,l)の抽出された特徴を表す値である。
式中
R(k, l, z, x) =フレームx中のピクセル群(k, l)のR値中の要素zである。
k及びlの合計の限界値は所望の群を含む様に選定される。この特定の例ではR値は一以上の要素を持つと想定される。もしR値が唯一の要素を持つ場合はzに対する合計は含まれない。
もし平均ピクセル強度の間の差が署名生成に使用される相違測定値のみである場合は、相違測定プロセッサ120は図4B及び4Cに示す様に実行されても良い。これらの実施の態様においては、ピクセル強度又は平均強度はビデオフレーム1a 及び1bから抽出され、抽出された特徴の間の相違測定値が算出され、そして相違測定値は続く署名生成のため群に形成される。
Q(k ,1) =低解像度画像中の中間値
GX= 要素の数で表される微分要素群の幅;
GY=要素の数で表される微分要素群の高さ;
K =低解像度画像の水平解像度;
L =低解像度画像の垂直解像度;及び
Δ(l, j) =微分要素
群の水平サイズGXは、K・GX= RHであり、及び群の垂直サイズGYはL・GY= RVとなる様に選択され、ここでRH及びRV は各々差分画像の水平及び垂直解像度である。解像度120 x 160を持つダウンサンプル化された差分画像に要素を生成する、上で検討した代表的な実施の態様においては、群にとってある好適なサイズは8 x 8ピクセルであり、このサイズは120/8 x 160/8 = 15 x 20の解像度を持つ低解像度画像を提供する。
以下の段落に記載するビデオ署名プロセッサ170を実行することによって、図5Aに示す一連のR値又は図4Cに示すプロセッサに関連して上で議論したK x L配置の微分要素から得られたK x L配置の中間値Qからビデオ署名を生成する。
(6)
Hn =中間値をベースマトリクスPnに投射したもの。
オーディオ署名発生器200の構成部分は種々の方法により構成することができる。好ましい実施の態様においては、オーディオ内容に殆んど又は感知されない効果しかない修正に対して比較的反応しない署名を生成する。もしオーディオ内容に対する修正が感知される音に本質的な影響を与えない場合、好ましくはこれらの修正はまた生成された署名に対して実質的な影響を与えない。2つのオーディオ署名にいくらかの違いがある場合にはそれは署名が生成される2つの内容の間の違いの程度に等しい。幾つかの好適な実施の態様について以下に検討する。
オーディオ信号のセグメントが個々のサンプルの振幅を表す値により表わされている代表的な実施の態様では、時間周波数表示プロセッサ210は、各セグメント内の一連の重複するオーディオサンプルブロックに対して、時間領域から周波数領域への変換を適用することにより生成させる変換係数から一組のスペクトル値を得る。もし望むならば、スペクトル値は、オーディオ内容のスペクトル形を変えるプロセスにより生成される変化を避けるためにオーディオ内容の全バンド幅の一部のみに限定しても良い。例えば、限定された表示は最低周波数及び最高周波数スペクトル成分を表す変換により生成されるこれらの変換係数を除くことにより、又は変換を適用する前にオーディオ内容を帯域(bandpass)フィルターろ過することにより得ることができる。
T =(LS−LB)/ZB (8)
式中
T=各セグメントのブロックの時間分解能又は数
LS =サンプル中の各セグメントの長さ;
LS =サンプル中の各ブロックの長さ;及び
ZB =ブロック ステップ サイズ
周波数分解能は通常ブロックの長さ又はスペクトル値を生成するために用いられる変換の長さにより決定される。
中間値プロセッサ250はスペクトル値の群を検証し、そして各群のスペクトル値の強度から中間値を導く。
Q(k, l)=低分解能表示の中間値
GF=数値で表されたスペクトル値群の幅
GT= ブロック数で表されたスペクトル値群の長さ
K = 低分解能表示の周波数分解能
L =低分解能表示の時間分解能
S(i, j) = スペクトル値
GF群のサイズはK・GF = RTとなり、GT群のサイズがL・GT= RTとなる様に選定され、ここでRF及びRTは各低分解能表示の周波数及び時間分解能である。上で検討した及び以下に検討する典型的な実施の態様においては、群のある好適なサイズはGF = 6及びGT= 14であり、これは
オーディオ署名プロセッサ270は一組のNハッシュビットを生成するためにハッシュ関数をK x L配置の中間値Qに適用する。これらのハッシュビットはオーディオセグメントの内容を識別するオーディオ署名(SA)を構成する。これはビデオ署名について上で記載したと同じ方法で実施される。
上で検討したビデオ及びオーディオ署名発信機は、ビデオ及びオーディオ内容の流れの間の失われた同期を回復すること及びビデオとオーディオ内容のコピーを検出することを含む種々の場合に用いても良い。これらに適用される場合の代表的な実施の態様を以下に示す。
ビデオ及びオーディオ内容の流れは、これらが記録され又は製作される場合、しばしば互いに同期させるが同期は続くプロセスで失われることもある。例えば、テレビジョン放送システムでは、同期させたビデオ及びオーディオの流れは、伝送のため組み合わされる前に信号処理のためしばしば2つの異なるパスに分離される。2つのパスの異なるプロセス処理上の遅れは同期を失わせる原因となる。これらの流れは手作業で互いに再同期させることができるがこれは骨の折れる且つ人的ミスの起こり易い作業である。上に記載の署名発生器は自動的に同期を回復するために使用することができる。例えば、放送システムでは、放送の直前の送信機又は聴取前の受信機を含むシステムの任意の箇所で同期を回復させることができる。
図8は同期させたビデオ及びオーディオ流れからビデオ及びオーディオ署名及び調整情報を生成する捕捉装置(capture device)350のブロック略図である。同期させたビデオ及びオーディオ内容及び流れはここで参考内容及び参考流れと呼ばれる。参考流れから得られる署名及び調整情報はここでそれぞれ参考署名及び参考調整情報とよばれる。ビデオ署名はビデオ署名発生器100により得られ、その後に同期回復装置で使用されるためパス190に沿い送られる。オーディオ署名はオーディオ署名発生器200により得られ、その後に同期回復装置で使用されるためパス290に沿い送られる。ビデオ及びオーディオ署名を生成するために用いられる技術は上に述べた。
上に述べた2つの内容遅れ計算機は参考及び現在の署名の順序を比較し、基礎となるビデオ/オーディオ内容の間の相対的時間差を予測する。これらの計算機は種々の方法で使用されうる。
D(m, i)=流れの間の、特定の配列に対して計算された数値
HD[r,c] =署名r及びcの間のハミング距離
F = 参考署名{ SREF(i)}の組中の署名の数
U =相関器の調査範囲
W= 署名の数として表現された相関窓の長さ
ハミング距離は2つの署名が異なるビット位置の数に等しい。
ビデオ及びオーディオ内容から生成される署名は、その内容が上に述べたものを含み、種々のプロセスで改変された場合においても、その内容を識別するために用いることができる。特定のビデオ内容またはオーディオ内容が参考ビデオ内容又はオーディオ内容のコピーであるか否かを決定する機能は、その内容が改変されている場合にも種々の形で用いることができる。その例の幾つかを以下のリストに簡単に示す:
・ 許可されていないコピーの検出:ピアーツピア(peer to peer)サーバーのネットワークは内容の配布を容易にするが、これはまた法で保護された内容の許可を得ていない又は海賊版コピーの検出をより困難にすることもある。何故ならそれらの内容の多くのコピーはピアーツピア サーバーの間で存在しうるからである。ある設備はでは、もし許可を得ていないコピーがネットワーク上に存在するか否かをネットワークから利用可能な全ての内容の署名を生成し、これらの署名をデータベースの参考署名と対比することにより自動的に決定することができる。
本発明の種々の特徴を取り入れた装置は、コンピュータにより、又は汎用コンピュータに見られるものと同様な構成品に接続されているデジタル信号プロセッサ(DSP)の様なより専用化された構成品を含むある種の他の装置によるソフトウェアーの実行を含め種々の方法により実施することができる。図12は本発明の特徴を実施するために用いることのできる装置70の概略ブロック図である。プロセッサ72は計算機資源を提供する。RAM73は処理するためにプロセッサ72により使用されるシステムランダムアクセスメモリー(RAM)である。ROM74は装置70を作動させるために必要なプログラムを記憶し及び、恐らく本発明の種々の特徴を実施する、読出し専用メモリー(ROM)の様なある形式の永続記憶装置を表す。I/O制御75は通信チャネル76、77により信号を受信し及び伝達するインターフェイス回路を表す。記載の実施の態様では、全ての主要なシステムの構成品はバス71に接続され、バスは一以上の物理的バス又は論理バスを表すが、バスの基本設計は本発明の実施するために必要なものではない。
Claims (51)
- ビデオ信号の内容を識別する署名を生成する方法であって、前記方法は、
ビデオ信号の一連のビデオフレーム内の第一のビデオフレームにより伝送される画像中のピクセルを表すデータから第一の組の一以上の特徴を抽出し、第一の組の特徴を表す第一の値を算出し;
ビデオ信号の一連のビデオフレーム内の第二の組のビデオフレームにより伝送される画像中のピクセルを表すデータから第二の組の一以上の特徴を抽出し、ここで第二の組の特徴中の各特徴は第一の組の特徴の中に対応する特徴を持ち、そして第二の組の特徴を表す第二の値を算出し、ここで第二の組の特徴中の各特徴を表す第二の値は、各特徴に対応する第一の組の特徴の中の特徴を表す第一の値に対応し;
一連の中間値を生成し、ここで一連の中間値の各々は第二の値及び対応する第一の値の間の一以上の相違測定値を表し;及び
中間値に対してハッシュ関数を適用することによりビデオ信号の内容を識別する署名を生成する、
ことを含み、
中間値にハッシュ関数を適用することは、中間値を一組のランダムベクトルに投射することを含み、前記署名の各成分は中間値を各ランダムベクトルに投射することから導出される、
前記方法。 - ピクセル群から第一の組の特徴及び第二の組の特徴を抽出することを含み、各ピクセル群は第一及び第二のビデオフレームにより伝送される画像の一つの各領域を表す、請求項1の方法。
- 前記第一の組及び第二の組の特徴が各ピクセル群内のピクセルの強度の平均を表す、請求項2の方法。
- 前記第一の組及び第二の組の特徴が各ピクセル群内のピクセルの強度の標準偏差を表す、請求項2の方法。
- 前記第一の組及び第二の組の特徴がピクセルの強度を表し、各相違測定値は第二の値及び対応する第一の値の間の絶対差である, 請求項1又は2の方法。
- 差分画像の領域に複数の相違測定値をグループ化し;及び
各領域中の相違測定値の平均値を表す各中間値を生成する、請求項5の方法。 - 前記第一及び第二のビデオフレームにより伝送される画像の中央部分を表すピクセルのみに係る第一の組及び第二の組の特徴を抽出することを含む請求項1乃至6のいずれか1項の方法。
- 前記第一及び第二のビデオフレームにより伝送される画像の水平及び垂直解像度を決定し;
解像度に対応する因子を選択し;及び
それらのデータ、相違測定値又は中間値を前記因子に等しい数値によってダウンサンプルし、一連の中間値の水平及び垂直解像度を低減させる
ことを含む、請求項1乃至7のいずれか1項の方法。 - 一連のフレーム中の複数の対となるフレームの各々に署名を生成することを含む、請求項1乃至8のいずれか1項の方法。
- 前記一組のランダムベクトル中の各ベクトルが、0から1の範囲内の均一に分布したランダム変数と、各ベクトルの全てのベクトル要素の均一に分布したランダム変数の平均との差より得られる値を持つベクトル要素を持ち;
各ランダムベクトルに中間値を投射することは中間値の各ベクトルのベクトル要素との内積から得られ;及び
前記署名の各成分は、中間値の対応するランダムベクトルへの投射が閾値より大きい場合は、第一の値を持ち、中間値の対応するランダムベクトルへの投射が閾値より小さい場合は、第二の値を持ち、ここに閾値は一組のランダムベクトルへ投射された中間値の中央値に等しい、請求項1乃至9のいずれか1項の方法。 - オーディオ信号の内容を識別する署名を生成する方法であって、前記方法は
オーディオ信号の一連のブロック内の一組のブロックの時間周波数表示を得、前記時間周波数表示は、複数組のスペクトル値を含み、各組のスペクトル値は各組のブロック中の各ブロック中のオーディオ信号のバンド幅の少なくとも一部の内の全てのスペクトル成分を表し;
各組のスペクトル値内の一以上のスペクトル値の群中に配置された全てのスペクトル値の強度から中間値を導出し;及び
一組のランダムベクトルに中間値を投射することによりオーディオ信号の内容を識別する署名を生成し、前記署名はビットにより表示され、署名の各ビットは全ての中間値に基づき導出される
前記方法。 - 時間周波数表示が、各組のスペクトル値を得るために時間・周波数変換を前記の組のブロック中のオーディオ信号の各ブロックに適用することにより得られ;及び
各中間値が各組のスペクトル値内の群の一以上のスペクトル値の平均強度を算出することにより導出される、
請求項11の方法。 - 前記一連のブロック内の複数組のブロック内の各組のために署名を生成させることを含む、請求項11又は12の方法。
- 前記スペクトル値の群が周波数により変わる多くのスペクトル値を持つ、請求項11乃至13のいずれか1項の方法。
- より周波数の大きいスペクトル値の群はより多くの数のスペクトル値を持つ、請求項14の方法。
- 前記署名の各成分が各ランダムベクトルに中間値を投射することにより導出される、請求項11乃至15のいずれか1項の方法。
- 前記一組のランダムベクトル中の各ベクトルが、0から1の範囲内の均一に分布したランダム変数と、各ベクトルの全てのベクトル要素の均一に分布したランダム変数の平均との差より得られる値を持つベクトル要素を持ち;
各ランダムベクトルに中間値を投射することは中間値の各ベクトルのベクトル要素との内積から得られ;及び
前記署名の各成分は、中間値の対応するランダムベクトルへの投射が閾値より大きい場合は、第一の値を持ち、中間値の対応するランダムベクトルへの投射が閾値より小さい場合は、第二の値を持ち、ここに閾値は一組のランダムベクトルへ投射された中間値の中央値に等しい、請求項16の方法。 - ビデオ信号の内容を識別する署名を生成する装置であって、前記装置は、
ビデオ信号の一連のビデオフレーム内の第一のビデオフレームにより伝送される画像中のピクセルを表すデータから第一の組の一以上の特徴を抽出し、第一の組の特徴を表す第一の値を算出する手段;
ビデオ信号の一連のビデオフレーム内の第二の組のビデオフレームにより伝送される画像中のピクセルを表すデータから第二の組の一以上の特徴を抽出し、ここで第二の組の特徴中の各特徴は第一の組の特徴に対応し、そして第二の組の特徴を表す第二の値を算出し、ここで第二の組の特徴中の各特徴を表す第二の値は、各特徴に対応する第一の組の特徴中の特徴を表す第一の値に対応する手段;
一連の中間値を生成する手段であり、ここに一連の中間値の各々は第二の値及び対応する第一の値の間の一以上の相違測定値を表す手段;及び
中間値に対してハッシュ関数を適用することによりビデオ信号の内容を識別する署名を生成する手段
を含み、
中間値にハッシュ関数を適用することは、中間値を一組のランダムベクトルに投射することを含み、前記署名の各成分は中間値を各ランダムベクトルに投射することから導出される、
前記装置。 - ピクセル群から第一の組の特徴及び第二の組の特徴を抽出する手段を含み、各ピクセル群は第一及び第二のビデオフレームにより伝送される画像の一つの各領域を表す、請求項18の装置。
- 前記第一の組及び第二の組の特徴が各ピクセル群内のピクセルの強度の平均を表す、請求項19の装置。
- 前記第一の組及び第二の組の特徴が各ピクセル群内のピクセルの強度の標準偏差を表す、請求項19の装置。
- 前記第一の組及び第二の組の特徴がピクセルの強度を表し、各相違測定値は第二の値及び対応する第一の値の間の絶対差である, 請求項18又は19の装置。
- 差分画像の領域に複数の相違測定値をグループ化する手段;及び
各領域中の相違測定値の平均値を表す各中間値を生成する手段、を含む請求項22の装置。 - 前記第一及び第二のビデオフレームにより伝送される画像の中央部分を表すピクセルのみに係る第一の組及び第二の組の特徴を抽出する手段を含む、請求項18乃至23のいずれか1項の装置。
- 前記第一及び第二のビデオフレームにより伝送される画像の水平及び垂直解像度を決定する手段;
解像度に対応する因子を選択する手段;及び
それらのデータ、相違測定値又は中間値を前記因子に等しい数値によってダウンサンプルし、一連の中間値の水平及び垂直解像度を低減させるための手段
を含む、請求項18乃至24のいずれか1項の装置。 - 一連のフレーム中の複数の対となるフレームの各々に署名を生成する手段を含む、請求項18乃至25のいずれか1項の装置。
- 前記一組のランダムベクトル中の各ベクトルが、0から1の範囲内の均一に分布したランダム変数と、各ベクトルの全てのベクトル要素の均一に分布したランダム変数の平均との差より得られる値を持つベクトル要素を持ち;
各ランダムベクトルに中間値を投射することは中間値の各ベクトルのベクトル要素との内積から得られ;及び
前記署名の各成分は、中間値の対応するランダムベクトルへの投射が閾値より大きい場合は、第一の値を持ち、中間値の対応するランダムベクトルへの投射が閾値より小さい場合は、第二の値を持ち、ここに閾値は一つ組のランダムベクトルへ投射された中間値の中央値に等しい、請求項18乃至26のいずれか1項の装置。 - オーディオ信号の内容を識別する署名を生成する装置であって、前記装置は、
オーディオ信号の一連のブロック内の一組のブロックの時間周波数表示を得、前記時間周波数表示は、複数組のスペクトル値を含み、各組のスペクトル値は各組のブロック中の各ブロック中のオーディオ信号のバンド幅の少なくとも一部の中の全てのスペクトル成分を表す手段;
各組のスペクトル値内の一以上の群中に配置された全てのスペクトル値の強度から中間値を導出する手段;及び
一組のランダムベクトルに中間値を投射することによりオーディオ信号の内容を識別する署名を生成し、前記署名はビットにより表示され、署名の各ビットは全ての中間値に基づき導出される手段、
を含む前記装置。 - 時間周波数表示が、各組のスペクトル値を得るために時間・周波数変換を前記の組のブロック中のオーディオ信号の各ブロックに適用することにより得られ;及び
各中間値が各組のスペクトル値内の群の一以上のスペクトル値の平均強度を算出することにより導出される、
請求項28の装置。 - 前記一連のブロック内の複数組のブロック内の各組のために署名を生成させる手段を含む、請求項28又は29の装置。
- 前記スペクトル値の群が周波数により変わる多くのスペクトル値を持つ、請求項28乃至30のいずれか1項の装置。
- より周波数の大きいスペクトル値の群はより多くの数のスペクトル値を持つ、請求項31の装置。
- 前記署名の各成分が各ランダムベクトルに中間値を投射することにより導出される、請求項28乃至32のいずれか1項の方法。
- 前記一組のランダムベクトル中の各ベクトルが、0から1の範囲内の均一に分布したランダム変数と、各ベクトルの全てのベクトル要素の均一に分布したランダム変数の平均との差より得られる値を持つベクトル要素を持ち;
各ランダムベクトルに中間値を投射することは中間値の各ベクトルの各ベクトル要素との内積から得られ;及び
前記署名の各成分は、中間値の対応するランダムベクトルへの投射が閾値より大きい場合は、第一の値を持ち、中間値の対応するランダムベクトルへの投射が閾値より小さい場合は、第二の値を持ち、ここに閾値は一組のランダムベクトルへ投射された中間値の中央値に等しい、請求項33の装置。 - ビデオ信号の内容を識別する署名を生成する方法を実施する装置により実行可能な指示のプログラムを記録する記憶媒体であり、
であって、前記方法は、
ビデオ信号の一連のビデオフレーム内の第一のビデオフレームにより伝送される画像中のピクセルを表すデータから第一の組の一以上の特徴を抽出し、そして第一の組の特徴を表す第一の値を算出し;
ビデオ信号の一連のビデオフレーム内の第二のビデオフレームにより伝送される画像中のピクセルを表すデータから第二の組の一以上の特徴を抽出し、ここで第二の組の特徴中の各特徴は第一の組の特徴中に対応する特徴を持ち、そして第二の組の特徴を表す第二の値を算出し、ここで第二の組の特徴中の各特徴を表す第二の値は、各特徴に対応する第一の組の特徴中の特徴を表す第一の値に対応し;
一連の中間値を生成し、ここに一連の中間値の各々は第二の値及び対応する第一の値の間の一以上の相違測定値を表し;及び
中間値に対してハッシュ関数を適用することによりビデオ信号の内容を識別する署名を生成する、
ことを含み、
中間値にハッシュ関数を適用することは、中間値を一組のランダムベクトルに投射することを含み、前記署名の各成分は中間値を各ランダムベクトルに投射することから導出される、
前記記憶媒体。 - 前記方法が、ピクセル群から第一の組の特徴及び第二の組の特徴を抽出することを含み、各ピクセル群は第一及び第二のビデオフレームにより伝送される一つの画像の各領域を表す、請求項35の記憶媒体。
- 前記第一の組及び第二の組の特徴が各ピクセル群内のピクセルの強度の平均を表す、請求項36の記憶媒体。
- 前記第一の組及び第二の組の特徴が各ピクセル群内のピクセルの強度の標準偏差を表す、請求項36の記憶媒体。
- 前記第一の組及び第二の組の特徴がピクセルの強度を表し、各相違測定値は第二の値及び対応する第一の値の間の絶対差である, 請求項35又は36の記憶媒体。
- 前記方法が、差分画像の領域に複数の相違測定値をグループ化し;及び
各領域中の相違測定値の平均値を表す各中間値を生成する、ことを含む請求項39の記憶媒体。 - 前記方法が、前記第一及び第二のビデオフレームにより伝送される画像の中央部分を表すピクセルのみに係る第一の組及び第二の組の特徴を抽出することを含む、請求項35乃至40のいずれか1項の記憶媒体。
- 前記方法が、前記第一及び第二のビデオフレームにより伝送される画像の水平及び垂直解像度を決定し;
解像度に対応する因子を選択し;及び
それらのデータ、相違測定値又は中間値を前記因子に等しい数値によってダウンサンプルし、一連の中間値の垂直及び水平解像度を低減させる
ことを含む、請求項35乃至41のいずれか1項の記憶媒体。 - 前記方法が、一連のフレーム中の複数の対となるフレームの各々に署名を生成することを含む、請求項35乃至42のいずれか1項の記憶媒体。
- 前記一組のランダムベクトル中の各ベクトルが、0から1の範囲内の均一に分布したランダム変数と、各ベクトルの全てもベクトル要素の均一に分布したランダム変数の平均との差より得られる値を持つベクトル要素を持ち;
各ランダムベクトルに中間値を投射することは中間値の各ベクトルのベクトル要素を持つ内積から得られ;及び
前記署名の各成分は、中間値の対応するランダムベクトルへの投射が閾値より大きい場合は、第一の値を持ち、中間値の対応するランダムベクトルへの投射が閾値より小さい場合は、第二の値を持ち、ここに閾値は一組のランダムベクトルへ投射された中間値の中央値に等しい、請求項35乃至43のいずれか1項の記憶媒体。 - オーディオ信号の内容を識別する署名を生成する方法を実施する装置により実行可能な指示のプログラムを記録する記憶媒体であり、
であって、前記方法は、
オーディオ信号の一連のブロック内の一組のブロックの時間周波数表示を得、前記時間周波数表示は、複数組のスペクトル値を含み、各組のスペクトル値は各組のブロック中の各ブロック中のオーディオ信号のバンド幅の少なくとも一部の内の全てのスペクトル成分を表し;
各組のスペクトル値内の一以上のスペクトル値の群中に配置された全てのスペクトル値の強度から中間値を導出し;及び
一組のランダムベクトルに中間値を投射することによりオーディオ信号の内容を識別する署名を生成し、前記署名はビットにより表示され、署名の各ビットは全ての中間値に基づき導出される
記憶媒体。 - 時間周波数表示が、各組のスペクトル値を得るために時間・周波数変換を前記の組のブロック中のオーディオ信号の各ブロックに適用することにより得られ;及び
各中間値が各組のスペクトル値内の群の一以上のスペクトル値の平均強度を算出することにより導出される、
請求項45の記憶媒体。 - 前記方法が、前記一連のブロック内の複数組のブロック内の各組のために署名を生成させることを含む、請求項45又は46の記憶媒体。
- 前記スペクトル値の群が周波数により変わる多くのスペクトル値を持つ、請求項45乃至47のいずれか1項の記憶媒体。
- より周波数の大きいスペクトル値の群はより多い数のスペクトル値を持つ、請求項48の記憶媒体。
- 前記署名の各成分が各ランダムベクトルに中間値を投射することにより導出される、請求項45乃至49のいずれか1項の記憶媒体。
- 前記一組のランダムベクトル中の各ベクトルが、0から1の範囲内の均一に分布したランダム変数と、各ベクトルの全てのベクトル要素の均一に分布したランダム変数の平均値との差から得られる値を持つベクトル要素を持ち;
各ランダムベクトルに中間値を投射することは中間値の各ベクトルのベクトル要素との内積から得られ;及び
前記署名の各成分は、中間値の対応するランダムベクトルへの投射が閾値より大きい場合は、第一の値を持ち、中間値の対応するランダムベクトルへの投射が閾値より小さい場合は、第二の値を持ち、ここに閾値は一組のランダムベクトルへ投射された中間値の中央値に等しい、請求項50の記憶媒体。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US87209006P | 2006-11-30 | 2006-11-30 | |
US60/872,090 | 2006-11-30 | ||
PCT/US2007/024744 WO2008066930A2 (en) | 2006-11-30 | 2007-11-29 | Extracting features of video & audio signal content to provide reliable identification of the signals |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010512057A JP2010512057A (ja) | 2010-04-15 |
JP5060565B2 true JP5060565B2 (ja) | 2012-10-31 |
Family
ID=39325541
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009539366A Expired - Fee Related JP5060565B2 (ja) | 2006-11-30 | 2007-11-29 | 信号の信頼できる識別をするためのビデオ及びオーディオ信号内容の特徴の抽出 |
Country Status (6)
Country | Link |
---|---|
US (2) | US8259806B2 (ja) |
EP (2) | EP2642483B1 (ja) |
JP (1) | JP5060565B2 (ja) |
CN (1) | CN101548294B (ja) |
TW (1) | TWI442773B (ja) |
WO (1) | WO2008066930A2 (ja) |
Families Citing this family (65)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB2457694B (en) * | 2008-02-21 | 2012-09-26 | Snell Ltd | Method of Deriving an Audio-Visual Signature |
EP2293294B1 (en) * | 2008-03-10 | 2019-07-24 | Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. | Device and method for manipulating an audio signal having a transient event |
US20100215211A1 (en) * | 2008-05-21 | 2010-08-26 | Ji Zhang | System for Facilitating the Archiving of Video Content |
US20100215210A1 (en) * | 2008-05-21 | 2010-08-26 | Ji Zhang | Method for Facilitating the Archiving of Video Content |
US8195689B2 (en) | 2009-06-10 | 2012-06-05 | Zeitera, Llc | Media fingerprinting and identification system |
US8335786B2 (en) * | 2009-05-28 | 2012-12-18 | Zeitera, Llc | Multi-media content identification using multi-level content signature correlation and fast similarity search |
US8793498B2 (en) * | 2008-08-11 | 2014-07-29 | Nbcuniversal Media, Llc | System and method for forensic analysis of media works |
CN102124489B (zh) * | 2008-08-17 | 2014-08-06 | 杜比实验室特许公司 | 图像的签名推导 |
CN102177726B (zh) * | 2008-08-21 | 2014-12-03 | 杜比实验室特许公司 | 用于音频和视频签名生成和检测的特征优化和可靠性估计 |
JP4966285B2 (ja) * | 2008-10-30 | 2012-07-04 | 株式会社東芝 | 情報処理装置、エフェクトプログラムおよびコンテンツ補正処理方法 |
EP2366170B1 (en) * | 2008-11-17 | 2013-01-02 | Dolby Laboratories Licensing Corporation | Media fingerprints that reliably correspond to media content with projection of moment invariants |
US8571255B2 (en) | 2009-01-07 | 2013-10-29 | Dolby Laboratories Licensing Corporation | Scalable media fingerprint extraction |
JP4883226B2 (ja) * | 2009-01-23 | 2012-02-22 | 日本電気株式会社 | 映像記述子生成装置 |
US9075897B2 (en) | 2009-05-08 | 2015-07-07 | Dolby Laboratories Licensing Corporation | Storing and searching fingerprints derived from media content based on a classification of the media content |
GB2470201A (en) * | 2009-05-12 | 2010-11-17 | Nokia Corp | Synchronising audio and image data |
WO2010135623A1 (en) * | 2009-05-21 | 2010-11-25 | Digimarc Corporation | Robust signatures derived from local nonlinear filters |
CN102460470B (zh) | 2009-06-11 | 2014-12-03 | 杜比实验室特许公司 | 基于指纹的内容识别趋势分析 |
US8436939B2 (en) * | 2009-10-25 | 2013-05-07 | Tektronix, Inc. | AV delay measurement and correction via signature curves |
US8860883B2 (en) * | 2009-11-30 | 2014-10-14 | Miranda Technologies Partnership | Method and apparatus for providing signatures of audio/video signals and for making use thereof |
WO2011063520A1 (en) * | 2009-11-30 | 2011-06-03 | Miranda Technologies Inc. | Method and apparatus for providing signatures of audio/video signals and for making use thereof |
US8542869B2 (en) * | 2010-06-02 | 2013-09-24 | Dolby Laboratories Licensing Corporation | Projection based hashing that balances robustness and sensitivity of media fingerprints |
US8928809B2 (en) * | 2010-09-15 | 2015-01-06 | Verizon Patent And Licensing Inc. | Synchronizing videos |
US20130275421A1 (en) | 2010-12-30 | 2013-10-17 | Barbara Resch | Repetition Detection in Media Data |
CN103339921B (zh) * | 2011-01-31 | 2015-11-25 | 杜比实验室特许公司 | 恢复图像的颜色和非颜色相关的完整性的系统和方法 |
US8786785B2 (en) * | 2011-04-05 | 2014-07-22 | Microsoft Corporation | Video signature |
CN102222222A (zh) * | 2011-05-27 | 2011-10-19 | 汉王科技股份有限公司 | 跳帧扫描识别装置和方法 |
KR101778530B1 (ko) * | 2011-06-14 | 2017-09-15 | 삼성전자 주식회사 | 영상 처리 방법 및 장치 |
CN102393903B (zh) * | 2011-07-15 | 2013-10-30 | 汉王科技股份有限公司 | 基于三轴加速计的扫描识别装置和方法 |
JP5896661B2 (ja) * | 2011-09-14 | 2016-03-30 | キヤノン株式会社 | 情報処理装置、情報処理装置の制御方法、およびプログラム |
US9892088B2 (en) * | 2011-11-24 | 2018-02-13 | Nxp Usa, Inc. | Data processing system and method of controlling access to a shared memory unit |
US8572092B2 (en) * | 2011-12-16 | 2013-10-29 | Palo Alto Research Center Incorporated | Generating sketches sensitive to high-overlap estimation |
US9386069B2 (en) | 2011-12-28 | 2016-07-05 | The Nielsen Company (Us), Llc | Media exposure data collection and security |
ITMI20121210A1 (it) | 2012-07-11 | 2014-01-12 | Rai Radiotelevisione Italiana | A method and an apparatus for the extraction of descriptors from video content, preferably for search and retrieval purpose |
US10158927B1 (en) * | 2012-09-05 | 2018-12-18 | Google Llc | Systems and methods for detecting audio-video synchronization using timestamps |
US9602858B1 (en) | 2013-01-28 | 2017-03-21 | Agile Sports Technologies, Inc. | Method and system for synchronizing multiple data feeds associated with a sporting event |
US10133636B2 (en) | 2013-03-12 | 2018-11-20 | Formulus Black Corporation | Data storage and retrieval mediation system and methods for using same |
US9817728B2 (en) | 2013-02-01 | 2017-11-14 | Symbolic Io Corporation | Fast system state cloning |
US9304703B1 (en) | 2015-04-15 | 2016-04-05 | Symbolic Io Corporation | Method and apparatus for dense hyper IO digital retention |
JP2016526826A (ja) * | 2013-06-20 | 2016-09-05 | トムソン ライセンシングThomson Licensing | コンテンツの分散型再生の同期化を支援するシステム及び方法 |
US9542976B2 (en) | 2013-09-13 | 2017-01-10 | Google Inc. | Synchronizing videos with frame-based metadata using video content |
JP6321153B2 (ja) | 2013-10-21 | 2018-05-09 | マイクロソフト テクノロジー ライセンシング,エルエルシー | モバイルビデオ検索 |
TWI527025B (zh) * | 2013-11-11 | 2016-03-21 | 財團法人資訊工業策進會 | 電腦系統、音訊比對方法及其電腦可讀取記錄媒體 |
EP2876890A1 (en) * | 2013-11-21 | 2015-05-27 | Thomson Licensing | Method and apparatus for frame accurate synchronization of video streams |
US9336567B2 (en) | 2013-12-16 | 2016-05-10 | Telefonaktiebolaget L M Ericsson (Publ) | Content-aware weighted image manipulations |
US11023737B2 (en) | 2014-06-11 | 2021-06-01 | Arris Enterprises Llc | Detection of demarcating segments in video |
US9930375B2 (en) * | 2014-06-16 | 2018-03-27 | Nexidia Inc. | Media asset management |
KR102474541B1 (ko) * | 2014-10-24 | 2022-12-06 | 돌비 인터네셔널 에이비 | 오디오 신호들의 인코딩 및 디코딩 |
US10061514B2 (en) | 2015-04-15 | 2018-08-28 | Formulus Black Corporation | Method and apparatus for dense hyper IO digital retention |
US9996769B2 (en) | 2016-06-08 | 2018-06-12 | International Business Machines Corporation | Detecting usage of copyrighted video content using object recognition |
KR20180068121A (ko) * | 2016-12-13 | 2018-06-21 | 삼성전자주식회사 | 컨텐트를 인식하는 방법 및 디바이스 |
WO2018185743A1 (en) * | 2017-04-02 | 2018-10-11 | SafeDK Mobile Ltd. | Monitoring of media displayed by third-party components |
US10313710B1 (en) * | 2017-07-31 | 2019-06-04 | Amazon Technologies, Inc. | Synchronizing encoding between encoders |
US10572186B2 (en) | 2017-12-18 | 2020-02-25 | Formulus Black Corporation | Random access memory (RAM)-based computer systems, devices, and methods |
US10997427B1 (en) * | 2018-04-25 | 2021-05-04 | Zorroa Corporation | Using motion-based features to match video sequences |
US11115712B2 (en) * | 2018-12-15 | 2021-09-07 | Activision Publishing, Inc. | Systems and methods for indexing, searching for, and retrieving digital media |
US10725853B2 (en) | 2019-01-02 | 2020-07-28 | Formulus Black Corporation | Systems and methods for memory failure prevention, management, and mitigation |
EP3797368B1 (en) * | 2019-03-26 | 2023-10-25 | Rovi Guides, Inc. | System and method for identifying altered content |
US11228799B2 (en) * | 2019-04-17 | 2022-01-18 | Comcast Cable Communications, Llc | Methods and systems for content synchronization |
US11281929B2 (en) * | 2019-05-06 | 2022-03-22 | Rovi Guides, Inc. | Systems and methods for determining whether to modify content |
US11120273B2 (en) * | 2019-06-21 | 2021-09-14 | Gfycat, Inc. | Adaptive content classification of a video content item |
US10929677B1 (en) | 2019-08-07 | 2021-02-23 | Zerofox, Inc. | Methods and systems for detecting deepfakes |
US11302095B2 (en) | 2020-01-09 | 2022-04-12 | International Business Machines Corporation | Cognitive motion picture analysis |
US20210352341A1 (en) * | 2020-05-06 | 2021-11-11 | At&T Intellectual Property I, L.P. | Scene cut-based time alignment of video streams |
US11417099B1 (en) * | 2021-11-08 | 2022-08-16 | 9219-1568 Quebec Inc. | System and method for digital fingerprinting of media content |
TWI806577B (zh) * | 2022-04-28 | 2023-06-21 | 瑞昱半導體股份有限公司 | 數位簽章方法及數位簽章的驗證方法 |
Family Cites Families (24)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5436653A (en) | 1992-04-30 | 1995-07-25 | The Arbitron Company | Method and system for recognition of broadcast segments |
US5946049A (en) * | 1993-07-26 | 1999-08-31 | Pixel Instruments Corp. | Apparatus and method for synchronizing multiple asynchronous signals |
US5550594A (en) * | 1993-07-26 | 1996-08-27 | Pixel Instruments Corp. | Apparatus and method for synchronizing asynchronous signals |
US6469741B2 (en) * | 1993-07-26 | 2002-10-22 | Pixel Instruments Corp. | Apparatus and method for processing television signals |
US5530483A (en) * | 1994-10-11 | 1996-06-25 | Pixel Instruments Corp. | Delay detector apparatus and method for plural image sequences |
US5920842A (en) * | 1994-10-12 | 1999-07-06 | Pixel Instruments | Signal synchronization |
US7289643B2 (en) * | 2000-12-21 | 2007-10-30 | Digimarc Corporation | Method, apparatus and programs for generating and utilizing content signatures |
JPH11261961A (ja) * | 1998-03-10 | 1999-09-24 | Toshiba Corp | 動画像処理装置 |
CN1235408C (zh) | 2001-02-12 | 2006-01-04 | 皇家菲利浦电子有限公司 | 生成和匹配多媒体内容的散列 |
EP1474761A2 (en) | 2002-02-05 | 2004-11-10 | Koninklijke Philips Electronics N.V. | Efficient storage of fingerprints |
CN100420306C (zh) | 2002-06-24 | 2008-09-17 | 皇家飞利浦电子股份有限公司 | 用于信号验证的稳健签名 |
US7212651B2 (en) * | 2003-06-17 | 2007-05-01 | Mitsubishi Electric Research Laboratories, Inc. | Detecting pedestrians using patterns of motion and appearance in videos |
WO2005036877A1 (en) * | 2003-09-12 | 2005-04-21 | Nielsen Media Research, Inc. | Digital video signature apparatus and methods for use with video program identification systems |
US7987369B2 (en) | 2005-03-03 | 2011-07-26 | Interdigital Technology Corporation | Using watermarking to reduce communication overhead |
US7684587B2 (en) * | 2005-04-04 | 2010-03-23 | Spirent Communications Of Rockville, Inc. | Reduced-reference visual communication quality assessment using data hiding |
US20070104943A1 (en) | 2005-11-10 | 2007-05-10 | 3M Innovative Properties Company | Filled polymer composites |
US20070250311A1 (en) * | 2006-04-25 | 2007-10-25 | Glen Shires | Method and apparatus for automatic adjustment of play speed of audio data |
US8126280B2 (en) * | 2007-09-21 | 2012-02-28 | Adobe Systems Incorporated | Enhanced decompression of compressed data |
CN102177726B (zh) | 2008-08-21 | 2014-12-03 | 杜比实验室特许公司 | 用于音频和视频签名生成和检测的特征优化和可靠性估计 |
EP2366170B1 (en) | 2008-11-17 | 2013-01-02 | Dolby Laboratories Licensing Corporation | Media fingerprints that reliably correspond to media content with projection of moment invariants |
US8571255B2 (en) | 2009-01-07 | 2013-10-29 | Dolby Laboratories Licensing Corporation | Scalable media fingerprint extraction |
US9075897B2 (en) | 2009-05-08 | 2015-07-07 | Dolby Laboratories Licensing Corporation | Storing and searching fingerprints derived from media content based on a classification of the media content |
CN102460470B (zh) | 2009-06-11 | 2014-12-03 | 杜比实验室特许公司 | 基于指纹的内容识别趋势分析 |
CN103339921B (zh) | 2011-01-31 | 2015-11-25 | 杜比实验室特许公司 | 恢复图像的颜色和非颜色相关的完整性的系统和方法 |
-
2007
- 2007-11-29 CN CN2007800440832A patent/CN101548294B/zh not_active Expired - Fee Related
- 2007-11-29 US US12/312,840 patent/US8259806B2/en not_active Expired - Fee Related
- 2007-11-29 WO PCT/US2007/024744 patent/WO2008066930A2/en active Application Filing
- 2007-11-29 EP EP13171236.6A patent/EP2642483B1/en not_active Not-in-force
- 2007-11-29 TW TW096145374A patent/TWI442773B/zh not_active IP Right Cessation
- 2007-11-29 JP JP2009539366A patent/JP5060565B2/ja not_active Expired - Fee Related
- 2007-11-29 EP EP07867605A patent/EP2126833A2/en not_active Withdrawn
-
2012
- 2012-08-30 US US13/599,992 patent/US8626504B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
US20090304082A1 (en) | 2009-12-10 |
EP2642483B1 (en) | 2015-01-07 |
EP2642483A3 (en) | 2013-10-30 |
EP2126833A2 (en) | 2009-12-02 |
TWI442773B (zh) | 2014-06-21 |
US20130064416A1 (en) | 2013-03-14 |
CN101548294B (zh) | 2012-06-27 |
JP2010512057A (ja) | 2010-04-15 |
WO2008066930A2 (en) | 2008-06-05 |
CN101548294A (zh) | 2009-09-30 |
TW200833116A (en) | 2008-08-01 |
US8259806B2 (en) | 2012-09-04 |
US8626504B2 (en) | 2014-01-07 |
WO2008066930A3 (en) | 2008-10-09 |
EP2642483A2 (en) | 2013-09-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5060565B2 (ja) | 信号の信頼できる識別をするためのビデオ及びオーディオ信号内容の特徴の抽出 | |
JP5698318B2 (ja) | オ−ディオ及びビデオ署名生成及び検出のための特徴の最適化及び信頼性予測 | |
JP5143896B2 (ja) | 画像修飾及びフレームレート変換に反応しないビデオ署名の導出 | |
US20090252370A1 (en) | Video watermark detection | |
US20110142348A1 (en) | Signature Derivation for Images | |
WO2009046438A1 (en) | Media fingerprints that reliably correspond to media content | |
JP2009508393A (ja) | ビデオ透かし挿入 | |
US20090136083A1 (en) | Coefficient Selection for Video Watermarking | |
US20090226030A1 (en) | Coefficient modification for video watermarking | |
US20130051666A1 (en) | Method and System for Color-Grading Multi-View Content | |
Radhakrishnan et al. | Audio and video signatures for synchronization | |
KR20080043323A (ko) | 비디오 워터마킹을 위한 계수 변경 | |
KR20080043320A (ko) | 비디오 워터마크 검출 | |
KR20080043321A (ko) | 비디오 워터마킹을 위한 계수 선택 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20111018 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120327 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120619 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120710 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120803 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150810 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |