JP2022542643A - パーセプチュアルフレームハッシングを使用したビデオメタデータの識別および検索 - Google Patents
パーセプチュアルフレームハッシングを使用したビデオメタデータの識別および検索 Download PDFInfo
- Publication number
- JP2022542643A JP2022542643A JP2021576733A JP2021576733A JP2022542643A JP 2022542643 A JP2022542643 A JP 2022542643A JP 2021576733 A JP2021576733 A JP 2021576733A JP 2021576733 A JP2021576733 A JP 2021576733A JP 2022542643 A JP2022542643 A JP 2022542643A
- Authority
- JP
- Japan
- Prior art keywords
- hash
- hash vector
- database
- vector
- source video
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/70—Information retrieval; Database structures therefor; File system structures therefor of video data
- G06F16/78—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/783—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
- G06F16/7837—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using objects detected or recognised in the video content
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q20/00—Payment architectures, schemes or protocols
- G06Q20/08—Payment architectures
- G06Q20/12—Payment architectures specially adapted for electronic shopping systems
- G06Q20/123—Shopping for digital content
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/22—Indexing; Data structures therefor; Storage structures
- G06F16/2228—Indexing structures
- G06F16/2255—Hash tables
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/70—Information retrieval; Database structures therefor; File system structures therefor of video data
- G06F16/71—Indexing; Data structures therefor; Storage structures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/70—Information retrieval; Database structures therefor; File system structures therefor of video data
- G06F16/78—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/7867—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using information manually generated, e.g. tags, keywords, comments, title and artist information, manually generated time, location and usage information, user ratings
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/54—Interprogram communication
- G06F9/547—Remote procedure calls [RPC]; Web services
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/764—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/7715—Feature extraction, e.g. by transforming the feature space, e.g. multi-dimensional scaling [MDS]; Mappings, e.g. subspace methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/40—Scenes; Scene-specific elements in video content
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/234—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
- H04N21/2343—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements
- H04N21/23439—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements for generating different versions
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/25—Management operations performed by the server for facilitating the content distribution or administrating data related to end-users or client devices, e.g. end-user or client device authentication, learning user preferences for recommending movies
- H04N21/266—Channel or content management, e.g. generation and management of keys and entitlement messages in a conditional access system, merging a VOD unicast channel into a multicast channel
- H04N21/26603—Channel or content management, e.g. generation and management of keys and entitlement messages in a conditional access system, merging a VOD unicast channel into a multicast channel for automatically generating descriptors from content, e.g. when it is not made available by its provider, using content analysis techniques
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/27—Server based end-user applications
- H04N21/278—Content descriptor database or directory service for end-user access
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/44—Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
- H04N21/44008—Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving operations for analysing video streams, e.g. detecting features or characteristics in the video stream
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/47—End-user applications
- H04N21/472—End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content
- H04N21/47217—End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content for controlling playback functions for recorded or on-demand content, e.g. using progress bars, mode or play-point indicators or bookmarks
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/47—End-user applications
- H04N21/472—End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content
- H04N21/4722—End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content for requesting additional data associated with the content
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/47—End-user applications
- H04N21/478—Supplemental services, e.g. displaying phone caller identification, shopping application
- H04N21/47815—Electronic shopping
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/60—Network structure or processes for video distribution between server and client or between remote clients; Control signalling between clients, server and network components; Transmission of management data between server and client, e.g. sending from server to client commands for recording incoming content stream; Communication details between server and client
- H04N21/65—Transmission of management data between client and server
- H04N21/654—Transmission by server directed to the client
- H04N21/6547—Transmission by server directed to the client comprising parameters, e.g. for client setup
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/60—Network structure or processes for video distribution between server and client or between remote clients; Control signalling between clients, server and network components; Transmission of management data between server and client, e.g. sending from server to client commands for recording incoming content stream; Communication details between server and client
- H04N21/65—Transmission of management data between client and server
- H04N21/658—Transmission by the client directed to the server
- H04N21/6581—Reference data, e.g. a movie identifier for ordering a movie or a product identifier in a home shopping application
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/80—Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
- H04N21/83—Generation or processing of protective or descriptive data associated with content; Content structuring
- H04N21/835—Generation of protective data, e.g. certificates
- H04N21/8352—Generation of protective data, e.g. certificates involving content or source identification data, e.g. Unique Material Identifier [UMID]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/40—Scenes; Scene-specific elements in video content
- G06V20/48—Matching video sequences
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V2201/00—Indexing scheme relating to image or video recognition or understanding
- G06V2201/10—Recognition assisted with metadata
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Multimedia (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Signal Processing (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Business, Economics & Management (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Library & Information Science (AREA)
- Accounting & Taxation (AREA)
- Medical Informatics (AREA)
- General Health & Medical Sciences (AREA)
- Evolutionary Computation (AREA)
- Computing Systems (AREA)
- Artificial Intelligence (AREA)
- Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Finance (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Computer Security & Cryptography (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
本出願は、米国特許出願第62/870,127号(2019年7月3日出願)の米国特許法119条(e)の下での優先権利益を主張し、引用することによりその全体が本明細書の一部をなすものとする。
(1)どれほど迅速に、ハッシュを、再生装置110の安価なハードウェア(例えば、スマートテレビまたはセットトップボックス(STB)中のプロセッサ)上で計算できるか(ハッシュベクトルを計算する目標時間の例は、100ミリ秒以下)。
(2)ハッシュベクトル145のサイズ。より小さいハッシュベクトル145は、再生装置110、APIサーバ120、およびハッシュデータベース140間の帯域幅消費の低減、ハッシュデータベース140のメモリ要件の低減、および検索時間の短縮を可能にする。16×16のサイズのdHashは、512ビット出力を有する。より大きなハッシュベクトル145は、より正確なマッチを可能にするが、より多くの帯域幅を消費し、より長い検索時間を有する。
(3)衝突の可能性(2つの異なる画像が同じハッシュベクトルを生成する可能性)。ハッシュベクトルの計算速度およびサイズは、2つの、類似しているが異なる入力に対して正確に異なるハッシュを生成するハッシングプロセス(hashing process)の能力と比較検討するべきである。例えば、(16×16とは対照的に)32×32のサイズでdHashを実行すると、2048ビットのサイズのハッシュベクトルがもたらされ、メモリ記憶空間を4倍にするコストで、フレーム間のより正確な識別(すなわち、より高い精度)が可能となる。使用ケースによっては、これは価値のあるトレードオフである場合があるが、他の使用ケースではそうでない場合がある。
発明に関するさまざまな実施形態を本明細書に記述し、かつ例示してきたが、当業者は、本明細書に記載の機能を実施するための、ならびに/または結果および/もしくは1つ以上の利点を得るための、さまざまな他の手段および/または構造を容易に想定し、またこうした変形および/または修正のそれぞれは、本明細書に記載の発明に関する実施形態の範囲内であるものと見なされる。より一般的に、当業者は、本明細書に記載のすべてのパラメータ、寸法、材料、および構成が例示であることを意味することと、実際のパラメータ、寸法、材料、および/または構成が、本発明の教示が使用される特定の用途(複数可)に依存することとを容易に理解するであろう。当業者は、本明細書に記載の特定の発明に関する実施形態の多くの同等物を、単に通常の実験を用いて認識し、または確認することができるであろう。従って、前述の実施形態は、例としてのみ提示されていて、添付の特許請求の範囲およびその均等物の範囲内で、発明に関する実施形態は、具体的に記述および特許請求される以外の形で実践されうることが理解される。本開示の発明に関する実施形態は、本明細書に記載の各個々の特徴、システム、物品、材料、キット、および/または方法を対象とする。加えて、2つ以上のこうした特徴、システム、物品、材料、キット、および/または方法の任意の組み合わせは、こうした特徴、システム、物品、材料、キット、および/または方法が相互に矛盾しない場合、本開示の発明の範囲内に含まれる。
Claims (38)
- ソースビデオのフレームを識別する方法であって、
前記ソースビデオの異なるバージョンのそれぞれのフレームに対してハッシュベクトルを生成することと、
前記ハッシュベクトルを、データベース中の前記ソースビデオに関する情報と関連付けることと、
再生装置上で前記ソースビデオの第1のバージョンを再生することと、
前記ソースビデオの前記第1のバージョンの第1のフレームに対して第1のハッシュベクトルを生成することと、
前記第1のハッシュベクトルを、前記データベース中の前記ハッシュベクトルの中のマッチするハッシュベクトルにマッチさせることと、
前記第1のハッシュベクトルを前記マッチするハッシュベクトルにマッチさせることに応答して、前記ソースビデオに関する情報を前記データベースから検索することと
を含む方法。 - 前記再生装置が、テレビ、セットトップボックス、コンピュータ、またはモバイルデバイスのうちの少なくとも1つを含む、請求項1に記載の方法。
- 前記第1のハッシュベクトルが前記マッチするハッシュベクトルにマッチすると判定することが、前記第1のハッシュベクトルが、前記マッチするハッシュベクトルの閾値距離内にあると判定することを含む、請求項1に記載の方法。
- 前記マッチするハッシュベクトルが、前記ソースビデオの前記第1のバージョンとは異なる前記ソースビデオの第2のバージョンのフレームに対するものである、請求項1に記載の方法。
- 前記ハッシュベクトルおよび前記第1のハッシュベクトルが、パーセプチュアルハッシングプロセスを用いて生成される、請求項1に記載の方法。
- 前記パーセプチュアルハッシングプロセスが、パーセプションハッシング(pHash)、差分ハッシング(dHash)、平均ハッシング(aHash)、およびウェーブレットハッシング(wHash)から成る群の1要素である、請求項5に記載の方法。
- 前記第1のハッシュベクトルを生成することが、約100ミリ秒以内に起こる、請求項6に記載の方法。
- 前記第1のハッシュベクトルが、4096ビット以下のサイズを有する、請求項6に記載の方法。
- 前記ハッシュベクトルがどの程度の頻度でアクセスされたか、または前記ハッシュベクトルがどの程度最近にアクセスされたかのうちの少なくとも1つに基づいて、前記ハッシュベクトルをサブセットに分離することと、
各サブセットを前記データベースの異なるシャードに保存することと
をさらに含む請求項1に記載の方法。 - 前記ハッシュベクトル間の距離に基づいて、前記ハッシュベクトルをサブセットに分離することと、
各サブセットを前記データベースの異なるシャードに保存することと
をさらに含む請求項1に記載の方法。 - 前記ハッシュベクトルの特徴に基づいて、前記ハッシュベクトルをサブセットに分離することと、
各サブセットを前記データベースの異なるシャードに保存することと
をさらに含む請求項1に記載の方法。 - 前記ハッシュベクトルをランダムにサブセットに分離することと、
各サブセットを前記データベースの異なるシャードに保存することと
をさらに含む請求項1に記載の方法。 - 前記第1のハッシュベクトルを生成することは、一定の間隔で自動的に起こる、請求項1に記載の方法。
- 前記第1のハッシュベクトルを生成することは、視聴者からのコマンドに応答して起こる、請求項1に記載の方法。
- ソースビデオの異なるバージョンのそれぞれのフレームに対するハッシュベクトルを保存するデータベースであって、前記ハッシュベクトルは前記ソースビデオに関する情報と前記データベース中で関連付けられているものである、データベースと、
再生装置上で再生された前記ソースビデオの第1のバージョンの第1のフレームに対する第1のハッシュベクトルを有する前記データベースに問い合わせるため、および前記ソースビデオに関する情報を、前記第1のハッシュベクトルと前記データベース中の前記ハッシュベクトルの中のマッチするハッシュベクトルとのマッチに応答して返すために、前記データベースに通信可能に結合されたアプリケーションプログラミングインターフェース(API)と
を備えるシステム。 - ソースビデオに関連付けられたメタデータを識別および取得する方法であって、
前記ソースビデオの少なくとも1つのバージョンのそれぞれのフレームに対してハッシュベクトルを生成することと、
前記ハッシュベクトルを第1のデータベースに保存することと、
前記それぞれのフレームに対応するメタデータを第2のデータベースに保存することと、
再生装置上で前記ソースビデオの第1のバージョンを再生することと、
前記ソースビデオの前記第1のバージョンの第1のフレームに対して第1のハッシュベクトルを生成することと、
前記第1のハッシュベクトルを、前記第1のデータベース中の前記ハッシュベクトルの中のマッチするハッシュベクトルにマッチさせることと、
前記第1のハッシュベクトルを前記マッチするハッシュベクトルにマッチさせることに応答して、前記第2のデータベースから前記マッチするハッシュベクトルに対応する前記メタデータを検索することと、
前記再生装置を介して前記メタデータを前記視聴者に表示することと
を含む方法。 - 前記再生装置が、テレビ、セットトップボックス、コンピュータ、またはモバイルデバイスのうちの少なくとも1つを含む、請求項16に記載の方法。
- 前記メタデータが、前記ソースビデオ中の場所、前記ソースビデオ中の俳優が着用する衣服、前記ソースビデオ中に現れる製品、または前記ソースビデオを再生する音楽のうちの少なくとも1つを表す、請求項16に記載の方法。
- 前記ハッシュベクトルは、それぞれのタイムスタンプによって前記メタデータと関連付けられている、請求項16に記載の方法。
- 前記第1のハッシュベクトルを前記マッチするハッシュベクトルにマッチさせることが、
前記第1のハッシュベクトルをアプリケーションプログラミングインターフェース(API)サーバに送信することと、
前記APIサーバを介して、前記第1のハッシュベクトルが、前記第1のデータベース中の前記ハッシュベクトルの中の前記マッチするハッシュベクトルにマッチすると判定することと、
前記第1のハッシュベクトルを前記マッチするハッシュベクトルにマッチさせることに応答して、前記第1のデータベース中の前記マッチするハッシュベクトルに関連付けられた前記タイムスタンプを識別することと
を含み、前記メタデータを検索することがさらに、
前記タイムスタンプに基づいて、前記第2のデータベースに問い合わせることと、
前記第2のデータベースから、前記タイムスタンプと関連付けられた前記メタデータを検索することと
を含む、請求項19に記載の方法。 - 前記第1のハッシュベクトルが前記マッチするハッシュベクトルにマッチすると判定することは、前記第1のハッシュベクトルが、前記マッチするハッシュベクトルの閾値距離内にあると判定することを含む、請求項16に記載の方法。
- 前記マッチするハッシュベクトルは、前記ソースビデオの前記第1のバージョンとは異なる前記ソースビデオの第2のバージョンのフレームに対するものである、請求項16に記載の方法。
- 前記ハッシュベクトルおよび前記第1のハッシュベクトルは、パーセプチュアルハッシングプロセスを用いて生成されるものである、請求項16に記載の方法。
- 前記パーセプチュアルハッシングプロセスは、パーセプションハッシング(pHash)、差分ハッシング(dHash)、平均ハッシング(aHash)、およびウェーブレットハッシング(wHash)から成る群の1要素である、請求項23に記載の方法。
- 前記第1のハッシュベクトルを生成することは、約100ミリ秒以内に起こる、請求項24に記載の方法。
- 前記第1のハッシュベクトルは、4096ビット以下のサイズを有する、請求項24に記載の方法。
- 前記ハッシュベクトルを保存することは、
前記ハッシュベクトルがどの程度の頻度でアクセスされたか、または前記ハッシュベクトルがどの程度最近にアクセスされたかのうちの少なくとも1つに基づいて、前記ハッシュベクトルをサブセットに分離することと、
各サブセットを前記第1のデータベースの異なるシャードに保存することと
を含む、請求項16に記載の方法。 - 前記ハッシュベクトルを保存することは、
前記ハッシュベクトル間の距離に基づいて、前記ハッシュベクトルをサブセットに分離することと、
各サブセットを前記第1のデータベースの異なるシャードに保存することと
を含む、請求項16に記載の方法。 - 前記ハッシュベクトルを保存することは、
前記ハッシュベクトルの特徴に基づいて、前記ハッシュベクトルをサブセットに分離することと、
各サブセットを前記第1のデータベースの異なるシャードに保存することと
を含む、請求項16に記載の方法。 - 前記ハッシュベクトルを保存することが、
前記ハッシュベクトルをランダムに等しいサブセットに分離することと、
各サブセットを前記第1のデータベースの異なるシャードに保存することと
を含む、請求項16に記載の方法。 - 前記第1のデータベース中の前記ハッシュベクトルを変更せずに、前記メタデータを更新することをさらに含む、請求項16に記載の方法。
- 前記第1のハッシュベクトルを生成することは、一定の間隔で自動的に発生する、請求項16に記載の方法。
- 前記第1のハッシュベクトルを生成することは、視聴者からのコマンドに応答して起こる、請求項16に記載の方法。
- ソースビデオの異なるバージョンのそれぞれのフレームに対するハッシュベクトルを保存するための第1のデータベースであって、前記ハッシュベクトルは前記ソースビデオに関する情報と前記第1のデータベース中で関連付けられているものである、第1のデータベースと、
前記ソースビデオに関するメタデータを保存するための第2のデータベースと、
再生装置上で再生される前記ソースビデオの第1のバージョンの第1のフレームに対する第1のハッシュベクトルを有する前記第1のデータベースに問い合わせるため、および前記第1のハッシュベクトルと前記データベース中の前記ハッシュベクトルの中のマッチするハッシュベクトルとのマッチに応答して、前記第1のデータベースから返される前記ソースビデオに関する前記情報に基づいて、前記ソースビデオに関する前記メタデータの少なくとも一部について、前記第2のデータベースに問い合わせるための、前記第1のデータベースおよび前記第2のデータベースに通信可能に結合されたアプリケーションプログラミングインターフェース(API)と
を備えるシステム。 - ビデオに関連付けられたメタデータを識別、取得、および表示する方法であって、
前記ビデオを、ディスプレイを介して再生することと、
前記ビデオの第1のフレームに対して第1のハッシュベクトルを生成することと、
前記第1のハッシュベクトルをアプリケーションプログラミングインターフェース(API)サーバに送信することと、
前記APIサーバを介して、前記第1のフレームと関連付けられた前記メタデータをメタデータデータベースから取得することであって、前記メタデータが、前記第1のハッシュベクトルを、ハッシュベクトルデータベースに保存された第2のハッシュベクトルにマッチさせることに応答して、前記第1のデータベースから検索されることと、
前記ディスプレイを介して、前記第1のフレームと関連付けられた前記メタデータをユーザに表示することと
を含む方法。 - データベースで、ビデオの第1のフレームに対して生成された第1のハッシュベクトルを受信することと、
前記第1のハッシュベクトルを前記データベースに保存することと、
前記データベースで、再生装置から第2のハッシュベクトルに基づいた問い合わせを受信することと、
前記第2のハッシュベクトルに対して前記データベースの前記問い合わせを実行することと、
前記第2のハッシュベクトルを前記第1のハッシュベクトルにマッチさせることに応答して、前記第1のハッシュベクトルと関連付けられたタイムスタンプをアプリケーションプログラミングインターフェース(API)サーバに送信することであって、前記タイムスタンプはメタデータを前記ビデオの前記第1のフレームと関連付けることと
を含む方法。 - ソースビデオの第1のフレームに対して第1のハッシュベクトルを生成することと、
前記第1のハッシュベクトルを第1のデータベースに保存することと、
再生装置上で前記ソースビデオの1つのバージョンを再生することと、
前記ソースビデオの前記バージョンの第2のフレームに対して第2のハッシュベクトルを生成することと、
前記第2のハッシュベクトルを前記第1のデータベース中の前記第1のハッシュベクトルにマッチさせることと
を含む方法。 - 前記第2のハッシュベクトルを前記第1のハッシュベクトルにマッチさせることに応答して、前記第2のハッシュベクトルに対応するタイムスタンプを検索することと、
前記タイムスタンプを前記再生装置に送信することと
を含む、請求項37に記載の方法。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201962870127P | 2019-07-03 | 2019-07-03 | |
US62/870,127 | 2019-07-03 | ||
PCT/US2020/040584 WO2021003323A1 (en) | 2019-07-03 | 2020-07-02 | Identifying and retrieving video metadata with perceptual frame hashing |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2022542643A true JP2022542643A (ja) | 2022-10-06 |
JP7672348B2 JP7672348B2 (ja) | 2025-05-07 |
Family
ID=74101125
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021576733A Active JP7672348B2 (ja) | 2019-07-03 | 2020-07-02 | パーセプチュアルフレームハッシングを使用したビデオメタデータの識別および検索 |
Country Status (5)
Country | Link |
---|---|
US (4) | US11321389B2 (ja) |
EP (1) | EP3994615A4 (ja) |
JP (1) | JP7672348B2 (ja) |
KR (1) | KR20220077120A (ja) |
WO (1) | WO2021003323A1 (ja) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11321389B2 (en) | 2019-07-03 | 2022-05-03 | Painted Dog, Inc. | Identifying and retrieving video metadata with perceptual frame hashing |
EP4087265A4 (en) * | 2020-01-03 | 2023-08-16 | LG Electronics Inc. | DISPLAY DEVICE AND DISPLAY SYSTEM |
US20220295141A1 (en) * | 2021-03-11 | 2022-09-15 | Quintar, Inc. | Remote presentation with augmented reality content synchronized with separately displayed video content |
US12279009B2 (en) * | 2021-09-17 | 2025-04-15 | Adeia Guides Inc. | Methods and systems to provide a playlist for simultaneous presentation of a plurality of media assets |
US11417099B1 (en) | 2021-11-08 | 2022-08-16 | 9219-1568 Quebec Inc. | System and method for digital fingerprinting of media content |
US11496288B1 (en) * | 2022-04-08 | 2022-11-08 | Verkada Inc. | Enhanced encryption for face-related data |
US20240171605A1 (en) * | 2022-11-17 | 2024-05-23 | Qatar Foundation For Education, Science And Community Development | Scalable darkweb analytics |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008243209A (ja) * | 2007-03-28 | 2008-10-09 | Ricoh Co Ltd | 書類画像を認証するサーバーシステム及び方法 |
JP2013529325A (ja) * | 2010-04-01 | 2013-07-18 | 株式会社ソニー・コンピュータエンタテインメント | コンテンツを決定し検索するためのメディアフィンガープリント |
US8494234B1 (en) * | 2007-03-07 | 2013-07-23 | MotionDSP, Inc. | Video hashing system and method |
WO2015015712A1 (ja) * | 2013-07-30 | 2015-02-05 | パナソニックIpマネジメント株式会社 | 映像受信装置、付加情報表示方法および付加情報表示システム |
JP2015233182A (ja) * | 2014-06-09 | 2015-12-24 | ナント・モバイル株式会社 | 動画情報取得システム |
Family Cites Families (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8171030B2 (en) * | 2007-06-18 | 2012-05-01 | Zeitera, Llc | Method and apparatus for multi-dimensional content search and video identification |
EP2193420A4 (en) * | 2007-07-27 | 2010-10-06 | Synergy Sports Technology Llc | SYSTEM AND METHOD FOR USING A WEBSITE CONTAINING VIDEOS READING LISTS AS INTRODUCED ON A DOWNLOAD MANAGER |
US8195689B2 (en) * | 2009-06-10 | 2012-06-05 | Zeitera, Llc | Media fingerprinting and identification system |
US9026668B2 (en) | 2012-05-26 | 2015-05-05 | Free Stream Media Corp. | Real-time and retargeted advertising on multiple screens of a user watching television |
US9055335B2 (en) * | 2009-05-29 | 2015-06-09 | Cognitive Networks, Inc. | Systems and methods for addressing a media database using distance associative hashing |
US8730354B2 (en) * | 2010-07-13 | 2014-05-20 | Sony Computer Entertainment Inc | Overlay video content on a mobile device |
GB201210702D0 (en) * | 2012-06-15 | 2012-08-01 | Qatar Foundation | A system and method to store video fingerprints on distributed nodes in cloud systems |
US9773228B2 (en) * | 2012-11-02 | 2017-09-26 | Facebook, Inc. | Systems and methods for sharing images in a social network |
CN105917359B (zh) * | 2013-10-21 | 2021-01-26 | 微软技术许可有限责任公司 | 移动视频搜索 |
EP3326135A4 (en) | 2015-07-24 | 2019-03-06 | Videoamp, Inc. | TARGETING TELEVISION ADVERTISING CRANES BASED ON ONLINE BEHAVIOR OF CONSUMERS |
US9906831B2 (en) * | 2016-02-24 | 2018-02-27 | Sorenson Media, Inc. | Fingerprinting media content using hashing |
EP3264325A1 (en) * | 2016-06-27 | 2018-01-03 | Facebook, Inc. | Systems and methods for identifying matching content |
US20190042853A1 (en) * | 2017-08-04 | 2019-02-07 | Facebook, Inc. | System and Method of Determining Video Content |
US20190129806A1 (en) * | 2017-10-27 | 2019-05-02 | Synology Inc. | Methods and computer program products for a file backup and apparatuses using the same |
US10846554B2 (en) * | 2018-07-17 | 2020-11-24 | Avigilon Corporation | Hash-based appearance search |
US10839220B2 (en) * | 2018-10-15 | 2020-11-17 | Kepler Vision Technologies B.V. | Method for categorizing a scene comprising a sub-scene with machine learning |
US11321389B2 (en) | 2019-07-03 | 2022-05-03 | Painted Dog, Inc. | Identifying and retrieving video metadata with perceptual frame hashing |
-
2020
- 2020-07-02 US US17/271,061 patent/US11321389B2/en active Active
- 2020-07-02 WO PCT/US2020/040584 patent/WO2021003323A1/en unknown
- 2020-07-02 JP JP2021576733A patent/JP7672348B2/ja active Active
- 2020-07-02 EP EP20834443.2A patent/EP3994615A4/en active Pending
- 2020-07-02 KR KR1020227003009A patent/KR20220077120A/ko active Pending
-
2022
- 2022-04-06 US US17/714,533 patent/US11727375B2/en active Active
-
2023
- 2023-07-17 US US18/353,426 patent/US12062026B2/en active Active
-
2024
- 2024-08-12 US US18/800,833 patent/US20250045330A1/en active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8494234B1 (en) * | 2007-03-07 | 2013-07-23 | MotionDSP, Inc. | Video hashing system and method |
JP2008243209A (ja) * | 2007-03-28 | 2008-10-09 | Ricoh Co Ltd | 書類画像を認証するサーバーシステム及び方法 |
JP2013529325A (ja) * | 2010-04-01 | 2013-07-18 | 株式会社ソニー・コンピュータエンタテインメント | コンテンツを決定し検索するためのメディアフィンガープリント |
WO2015015712A1 (ja) * | 2013-07-30 | 2015-02-05 | パナソニックIpマネジメント株式会社 | 映像受信装置、付加情報表示方法および付加情報表示システム |
JP2015233182A (ja) * | 2014-06-09 | 2015-12-24 | ナント・モバイル株式会社 | 動画情報取得システム |
Non-Patent Citations (1)
Title |
---|
VEGA, FRANCISCO ET AL.: "A robust video identification framework using perceptual image hashing", 2017 XLIII LATIN AMERICAN COMPUTER CONFERENCE (CLEI), JPN6024029310, pages 1 - 10, XP033286315, ISSN: 0005529636, DOI: 10.1109/CLEI.2017.8226396 * |
Also Published As
Publication number | Publication date |
---|---|
JP7672348B2 (ja) | 2025-05-07 |
EP3994615A4 (en) | 2023-07-19 |
KR20220077120A (ko) | 2022-06-08 |
US20250045330A1 (en) | 2025-02-06 |
US11321389B2 (en) | 2022-05-03 |
US20220229867A1 (en) | 2022-07-21 |
US12062026B2 (en) | 2024-08-13 |
WO2021003323A1 (en) | 2021-01-07 |
EP3994615A1 (en) | 2022-05-11 |
US11727375B2 (en) | 2023-08-15 |
US20240013178A1 (en) | 2024-01-11 |
US20210256058A1 (en) | 2021-08-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US12062026B2 (en) | Identifying and retrieving video metadata with perceptual frame hashing | |
US11971919B2 (en) | Systems and methods for partitioning search indexes for improved efficiency in identifying media segments | |
US10820048B2 (en) | Methods for identifying video segments and displaying contextually targeted content on a connected television | |
EP2541963B1 (en) | Method for identifying video segments and displaying contextually targeted content on a connected television | |
US20080089551A1 (en) | Interactive TV data track synchronization system and method | |
US20230336837A1 (en) | Detection of common media segments | |
WO2012138491A2 (en) | Video signature | |
US11582501B1 (en) | Methods and systems for accessing media content from multiple sources | |
KR20160080603A (ko) | 협찬 상품 정보 제공 방법, 서버 및 시스템 | |
HK1255272B (zh) | 用於提高識別媒體段的效率的劃分搜索索引的系統和方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20230628 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20240712 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20240726 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20241025 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20241220 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20250218 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20250328 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20250415 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20250422 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7672348 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |