JP2022537170A - 認知ビデオおよび音声検索集約 - Google Patents
認知ビデオおよび音声検索集約 Download PDFInfo
- Publication number
- JP2022537170A JP2022537170A JP2021574746A JP2021574746A JP2022537170A JP 2022537170 A JP2022537170 A JP 2022537170A JP 2021574746 A JP2021574746 A JP 2021574746A JP 2021574746 A JP2021574746 A JP 2021574746A JP 2022537170 A JP2022537170 A JP 2022537170A
- Authority
- JP
- Japan
- Prior art keywords
- video
- user
- processors
- program code
- search
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000001149 cognitive effect Effects 0.000 title claims description 35
- 230000002776 aggregation Effects 0.000 title description 3
- 238000004220 aggregation Methods 0.000 title description 3
- 230000002123 temporal effect Effects 0.000 claims abstract description 72
- 238000000034 method Methods 0.000 claims abstract description 67
- 238000004590 computer program Methods 0.000 claims abstract description 12
- 238000004458 analytical method Methods 0.000 claims description 31
- 238000012545 processing Methods 0.000 claims description 21
- 230000004044 response Effects 0.000 claims description 21
- 238000006243 chemical reaction Methods 0.000 claims description 11
- 238000012015 optical character recognition Methods 0.000 claims description 10
- 230000008569 process Effects 0.000 claims description 9
- 230000000694 effects Effects 0.000 claims description 6
- 230000001131 transforming effect Effects 0.000 claims description 6
- 238000012544 monitoring process Methods 0.000 claims description 2
- 239000012634 fragment Substances 0.000 description 46
- 238000003860 storage Methods 0.000 description 29
- 230000006870 function Effects 0.000 description 24
- 238000013528 artificial neural network Methods 0.000 description 16
- 230000008901 benefit Effects 0.000 description 12
- 238000013527 convolutional neural network Methods 0.000 description 12
- 238000010586 diagram Methods 0.000 description 12
- 239000000284 extract Substances 0.000 description 12
- 238000010191 image analysis Methods 0.000 description 8
- 238000004891 communication Methods 0.000 description 7
- 238000005516 engineering process Methods 0.000 description 6
- 230000007704 transition Effects 0.000 description 6
- 239000003795 chemical substances by application Substances 0.000 description 5
- 230000003287 optical effect Effects 0.000 description 5
- 238000003491 array Methods 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 4
- 238000001514 detection method Methods 0.000 description 4
- 238000000605 extraction Methods 0.000 description 4
- 230000003993 interaction Effects 0.000 description 4
- 238000007726 management method Methods 0.000 description 4
- 230000011218 segmentation Effects 0.000 description 4
- 238000012790 confirmation Methods 0.000 description 3
- 238000013135 deep learning Methods 0.000 description 3
- 230000010354 integration Effects 0.000 description 3
- 230000033001 locomotion Effects 0.000 description 3
- 239000000463 material Substances 0.000 description 3
- 230000008520 organization Effects 0.000 description 3
- 230000009466 transformation Effects 0.000 description 3
- 230000008878 coupling Effects 0.000 description 2
- 238000010168 coupling process Methods 0.000 description 2
- 238000005859 coupling reaction Methods 0.000 description 2
- 239000000835 fiber Substances 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000003058 natural language processing Methods 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 230000001902 propagating effect Effects 0.000 description 2
- 239000013589 supplement Substances 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 238000013519 translation Methods 0.000 description 2
- 238000012384 transportation and delivery Methods 0.000 description 2
- RYGMFSIKBFXOCR-UHFFFAOYSA-N Copper Chemical compound [Cu] RYGMFSIKBFXOCR-UHFFFAOYSA-N 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- 230000004931 aggregating effect Effects 0.000 description 1
- 230000003466 anti-cipated effect Effects 0.000 description 1
- 230000004888 barrier function Effects 0.000 description 1
- 230000009172 bursting Effects 0.000 description 1
- 235000019577 caloric intake Nutrition 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 229910052802 copper Inorganic materials 0.000 description 1
- 239000010949 copper Substances 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000005672 electromagnetic field Effects 0.000 description 1
- 230000008451 emotion Effects 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 238000000802 evaporation-induced self-assembly Methods 0.000 description 1
- 238000013467 fragmentation Methods 0.000 description 1
- 238000006062 fragmentation reaction Methods 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 210000002364 input neuron Anatomy 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 230000005055 memory storage Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 210000004205 output neuron Anatomy 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 230000037081 physical activity Effects 0.000 description 1
- 238000013439 planning Methods 0.000 description 1
- 239000000047 product Substances 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000003860 sleep quality Effects 0.000 description 1
- 238000010561 standard procedure Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/70—Information retrieval; Database structures therefor; File system structures therefor of video data
- G06F16/78—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/783—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
- G06F16/7837—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using objects detected or recognised in the video content
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2457—Query processing with adaptation to user needs
- G06F16/24578—Query processing with adaptation to user needs using ranking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/70—Information retrieval; Database structures therefor; File system structures therefor of video data
- G06F16/71—Indexing; Data structures therefor; Storage structures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/70—Information retrieval; Database structures therefor; File system structures therefor of video data
- G06F16/73—Querying
- G06F16/735—Filtering based on additional data, e.g. user or group profiles
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/70—Information retrieval; Database structures therefor; File system structures therefor of video data
- G06F16/73—Querying
- G06F16/738—Presentation of query results
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/70—Information retrieval; Database structures therefor; File system structures therefor of video data
- G06F16/78—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/783—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
- G06F16/7837—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using objects detected or recognised in the video content
- G06F16/784—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using objects detected or recognised in the video content the detected or recognised objects being people
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/211—Selection of the most significant subset of features
- G06F18/2113—Selection of the most significant subset of features by ranking or filtering the set of features, e.g. using a measure of variance or of feature cross-correlation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/40—Software arrangements specially adapted for pattern recognition, e.g. user interfaces or toolboxes therefor
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/771—Feature selection, e.g. selecting representative features from a multi-dimensional feature space
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/94—Hardware or software architectures specially adapted for image or video understanding
- G06V10/945—User interactive design; Environments; Toolboxes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/40—Scenes; Scene-specific elements in video content
- G06V20/41—Higher-level, semantic clustering, classification or understanding of video scenes, e.g. detection, labelling or Markovian modelling of sport events or news items
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/40—Scenes; Scene-specific elements in video content
- G06V20/49—Segmenting video sequences, i.e. computational techniques such as parsing or cutting the sequence, low-level clustering or determining units such as shots or scenes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V2201/00—Indexing scheme relating to image or video recognition or understanding
- G06V2201/10—Recognition assisted with metadata
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Software Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computational Linguistics (AREA)
- Library & Information Science (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Computing Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
Abstract
Description
Claims (20)
- 1つまたは複数のプロセッサによって、クライアントを介してユーザから、前記1つまたは複数のプロセッサがアクセスできるリポジトリにアップロードするためのビデオを取得することと、
前記1つまたは複数のプロセッサによって、前記ビデオを時間的ショットにセグメント化することであって、前記時間的ショットが前記ビデオのタイムラインを含む、前記セグメント化することと、
前記1つまたは複数のプロセッサによって、画像認識アルゴリズムを前記ビデオに適用し、前記ビデオの各時間的ショット内の画像実体を識別することによって、前記ビデオを認知解析することと、
前記1つまたは複数のプロセッサによって、前記ユーザのユーザ・プロフィールを含んでいるデータ構造を前記時間的ショットに適用し、前記ビデオの各時間的ショット内の個人実体を識別することによって、認知解析することと、
前記1つまたは複数のプロセッサによって、前記画像実体および前記個人実体を含むユーザ実体を利用して前記ビデオの検索インデックスを生成することであって、前記検索インデックスの各エントリが、複数の前記ユーザ実体から選択される特定のユーザ実体と、複数の前記時間的ショットのうちの特定の時間的ショットへのリンクであって前記ビデオの前記タイムライン内の前記特定のユーザ実体の位置を示すリンクと含む、前記生成することと、
を含む、コンピュータ実装方法。 - 前記ユーザ・プロフィールを適用することが、
前記1つまたは複数のプロセッサによって、ネットワークを経由した前記クライアントの接続に基づいて、1つまたは複数のアプリケーションに対して前記クライアントを介して前記ユーザによって実行されたコンピューティング活動を監視することと、
前記1つまたは複数のプロセッサによって、前記1つまたは複数のアプリケーションにおいて前記ユーザによって実行された前記コンピューティング活動を解析し、前記ユーザに関連する要素を含んでいるデータおよび前記要素と前記ユーザの間の関係を識別することと、
前記1つまたは複数のプロセッサによって、前記解析に基づいて前記データ構造を生成することであって、前記データ構造が前記ユーザ・プロフィールを含んでいる、前記生成することとを含む、請求項1に記載のコンピュータ実装方法。 - 前記ユーザ・プロフィールを適用することが、
前記1つまたは複数のプロセッサによって、複数の前記時間的ショットのうちの時間的ショットごとに、前記ビデオ内の非テキスト要素をテキスト・コンテンツに変換することと、
前記1つまたは複数のプロセッサによって、各時間的ショットの前記テキスト・コンテンツ内で、前記ユーザに関連する前記要素および前記要素と前記ユーザの間の前記関係を識別することであって、前記要素が前記個人実体を含んでいる、前記識別することとをさらに含む、請求項2に記載のコンピュータ実装方法。 - 前記1つまたは複数のプロセッサによって、前記検索インデックスをインデックス作成済みのリポジトリに格納することをさらに含む、請求項1に記載のコンピュータ実装方法。
- 前記1つまたは複数のプロセッサによって、前記検索インデックスにおいて複数の前記ユーザ実体のうちの1つまたは複数の関連するユーザ実体を識別する検索パラメータを取得することと、
前記1つまたは複数のプロセッサによって、前記関連するユーザ実体を識別することと、
前記1つまたは複数のプロセッサによって、前記関連するユーザ実体について前記ビデオを検索することであって、前記検索が、前記インデックス・リポジトリにアクセスし、前記検索インデックスを利用して、前記ビデオ内の前記関連するユーザ実体の位置を特定することを含む、前記検索することとをさらに含む、請求項4に記載のコンピュータ実装方法。 - 前記1つまたは複数のプロセッサによって、前記検索に応答して検索結果を作成することをさらに含み、前記検索結果が、前記関連するユーザ実体と、関連するユーザ実体ごとに前記タイムライン内の前記関連するユーザ実体の位置とを含み、前記位置が開始時間および終了時間を含む、請求項5に記載のコンピュータ実装方法。
- 前記検索結果を作成することが、前記検索パラメータとの関連性に基づいて前記検索結果をランク付けすることを含む、請求項6に記載のコンピュータ実装方法。
- 前記1つまたは複数のプロセッサによって、検索の成果物を生成することをさらに含み、前記生成することが、
前記1つまたは複数のプロセッサによって、前記ビデオから前記時間的ショットの部分を取得することであって、前記部分の各時間的ショットが、関連するユーザ実体ごとに、前記タイムライン内の前記関連するユーザ実体の前記位置を含む、前記取得することと、
前記1つまたは複数のプロセッサによって、前記時間的ショットの前記部分を新しいビデオに組み立てることとを含む、請求項7に記載のコンピュータ実装方法。 - 前記1つまたは複数のプロセッサによって、前記クライアントを介して、前記検索の成果物を前記ユーザに提供することをさらに含む、請求項8に記載のコンピュータ実装方法。
- 前記組み立てることが、前記検索パラメータとの前記関連性に基づく前記検索結果の前記ランク付けに従って、前記時間的ショットの前記部分を組み立てることを含む、請求項8に記載のコンピュータ実装方法。
- 前記新しいビデオが、2つ以上の個別の新しいビデオを含み、前記検索の成果物の前記提供が、前記個別の新しいビデオの各々へのリンクを提供することを含む、請求項10に記載のコンピュータ実装方法。
- 前記検索パラメータの形式が、テキスト、音声、画像、およびビデオから成る群から選択される、請求項5に記載のコンピュータ実装方法。
- 前記画像認識アルゴリズムを適用することが、前記1つまたは複数のプロセッサがアクセスできる画像メタデータ・リポジトリにアクセスすることを含む、請求項1に記載のコンピュータ実装方法。
- 前記非テキスト要素が発話および音声を含み、前記要素を変換することが、発話からテキストへの変換処理アルゴリズムを適用して、前記テキスト・コンテンツを生成することを含む、請求項3に記載のコンピュータ実装方法。
- 前記非テキスト要素が、前記ビデオを含んでいる画像に埋め込まれたテキストを含み、前記要素を変換することが、前記埋め込まれたテキストに対して光学式文字認識プロセスを実行し、前記埋め込まれたテキストを前記テキスト・コンテンツに変換することを含み、前記1つまたは複数のアプリケーションが、ソーシャル・メディアWebサイトを含み、前記ユーザに関連する前記要素が、前記ユーザによってソーシャル・メディアWebサイトに投稿された画像および前記画像に関連付けられたタグを含む、請求項3に記載のコンピュータ実装方法。
- 前記検索インデックスを生成する前に、前記1つまたは複数のプロセッサによって、前記ビデオの分類を決定することであって、前記クライアントを介して前記ユーザから前記ビデオを取得することが、前記クライアントを介して前記ユーザから前記分類を取得することをさらに含む、前記決定することと、
前記1つまたは複数のプロセッサによって、前記リポジトリ内で、前記ユーザによってアップロードされた別のビデオを識別することであって、前記別のビデオの前記分類が、前記ビデオの前記分類と同等である、前記識別することと、
前記1つまたは複数のプロセッサによって、前記別のビデオの検索インデックスから、前記別のビデオの前記検索インデックスを含んでいるユーザ実体を抽出することと、
前記1つまたは複数のプロセッサによって、前記別のビデオの前記検索インデックスを含んでいる前記ユーザ実体について前記ビデオを検索することと、
前記1つまたは複数のプロセッサによって、前記ビデオ内で、前記別のビデオの前記検索インデックスを含んでいる前記ユーザ実体の部分の位置を特定することとをさらに含む、請求項1に記載のコンピュータ実装方法。 - 前記ユーザ実体が、前記ユーザ実体の前記部分をさらに含む、請求項16に記載のコンピュータ実装方法。
- 前記検索インデックスを生成する前に、前記1つまたは複数のプロセッサによって、前記クライアントのユーザ・インターフェイスにおいて、前記個人実体および前記個人実体の各リンクを表示するインターフェイスを生成することであって、前記インターフェイスが、前記ユーザがフィードバックを提供できる入力箇所を含む、前記生成することと、
前記1つまたは複数のプロセッサによって、前記インターフェイスを介して提供された前記フィードバックを前記ユーザから取得することと、
前記1つまたは複数のプロセッサによって、前記フィードバックに基づいて前記ユーザ実体を更新することとをさらに含む、請求項1に記載のコンピュータ実装方法。 - 請求項1ないし18のいずれかに記載の前記方法のステップのすべてを実行するのに適している手段を備える、システム。
- コンピュータ・プログラムであって、前記コンピュータ・プログラムがコンピュータ・システム上で実行されたときに、請求項1ないし18のいずれかに記載の前記方法のステップのすべてを実行するための命令を含んでいる、コンピュータ・プログラム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US16/445,570 | 2019-06-19 | ||
US16/445,570 US11341186B2 (en) | 2019-06-19 | 2019-06-19 | Cognitive video and audio search aggregation |
PCT/IB2020/054841 WO2020254890A1 (en) | 2019-06-19 | 2020-05-21 | Cognitive video and audio search aggregation |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2022537170A true JP2022537170A (ja) | 2022-08-24 |
JPWO2020254890A5 JPWO2020254890A5 (ja) | 2022-10-18 |
Family
ID=74038045
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021574746A Pending JP2022537170A (ja) | 2019-06-19 | 2020-05-21 | 認知ビデオおよび音声検索集約 |
Country Status (6)
Country | Link |
---|---|
US (1) | US11341186B2 (ja) |
JP (1) | JP2022537170A (ja) |
CN (1) | CN113811884A (ja) |
DE (1) | DE112020002228T5 (ja) |
GB (1) | GB2600281B (ja) |
WO (1) | WO2020254890A1 (ja) |
Families Citing this family (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11386144B2 (en) * | 2019-09-09 | 2022-07-12 | Adobe Inc. | Identifying digital attributes from multiple attribute groups within target digital images utilizing a deep cognitive attribution neural network |
US11032226B1 (en) * | 2019-12-04 | 2021-06-08 | Caastle, Inc. | Systems and methods for rapid electronic messaging testing and positional impact assessment in a prospect electronic messaging series |
US11076192B1 (en) * | 2020-01-16 | 2021-07-27 | International Business Machines Corporation | Identifying and calibrating internet of things (IOT) devices to enhance content consumption experience |
US11275724B2 (en) * | 2020-03-27 | 2022-03-15 | International Business Machines Corporation | Automated feedback validation |
US11682204B2 (en) * | 2020-07-27 | 2023-06-20 | International Business Machines Corporation | Recognition assistant |
US11729476B2 (en) * | 2021-02-08 | 2023-08-15 | Sony Group Corporation | Reproduction control of scene description |
US20220321970A1 (en) * | 2021-03-03 | 2022-10-06 | Voodle, Inc. | Dynamic Real-Time Audio-Visual Search Result Assembly |
US11682415B2 (en) * | 2021-03-19 | 2023-06-20 | International Business Machines Corporation | Automatic video tagging |
US11947586B2 (en) | 2021-06-29 | 2024-04-02 | Oracle International Corporation | Video processing optimization and content searching |
CN113823323B (zh) * | 2021-09-30 | 2023-12-12 | 深圳万兴软件有限公司 | 一种基于卷积神经网络的音频处理方法、装置及相关设备 |
US11899673B2 (en) * | 2021-12-20 | 2024-02-13 | Sony Group Corporation | User interface for cognitive search in content |
WO2023235780A1 (en) * | 2022-06-01 | 2023-12-07 | Apple Inc. | Video classification and search system to support customizable video highlights |
Family Cites Families (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009181216A (ja) * | 2008-01-29 | 2009-08-13 | Toshiba Corp | 電子機器および画像処理方法 |
US20140328570A1 (en) * | 2013-01-09 | 2014-11-06 | Sri International | Identifying, describing, and sharing salient events in images and videos |
US20150134668A1 (en) * | 2013-11-14 | 2015-05-14 | Dragan Popovich | Index of Video Objects |
US10609454B2 (en) * | 2015-07-31 | 2020-03-31 | Promptu Systems Corporation | Natural language navigation and assisted viewing of indexed audio video streams, notably sports contests |
CN105893510A (zh) | 2016-03-30 | 2016-08-24 | 北京格灵深瞳信息技术有限公司 | 一种视频结构化系统及其目标搜索方法 |
US10049663B2 (en) * | 2016-06-08 | 2018-08-14 | Apple, Inc. | Intelligent automated assistant for media exploration |
CN107590150A (zh) | 2016-07-07 | 2018-01-16 | 北京新岸线网络技术有限公司 | 基于关键帧的视频分析实现方法及装置 |
US10083347B2 (en) * | 2016-07-29 | 2018-09-25 | NTech lab LLC | Face identification using artificial neural network |
US10560734B2 (en) * | 2016-08-01 | 2020-02-11 | Microsoft Technology Licensing, Llc | Video segmentation and searching by segmentation dimensions |
WO2018176017A1 (en) | 2017-03-24 | 2018-09-27 | Revealit Corporation | Method, system, and apparatus for identifying and revealing selected objects from video |
US10311308B2 (en) * | 2017-03-31 | 2019-06-04 | International Business Machines Corporation | Image processing to identify selected individuals in a field of view |
US10552471B1 (en) * | 2017-04-21 | 2020-02-04 | Stripe, Inc. | Determining identities of multiple people in a digital image |
US10178294B2 (en) * | 2017-05-25 | 2019-01-08 | International Business Machines Corporation | Controlling a video capture device based on cognitive personal action and image identification |
US10541001B2 (en) * | 2017-12-27 | 2020-01-21 | Facebook, Inc. | Video highlights |
US10979669B2 (en) * | 2018-04-10 | 2021-04-13 | Facebook, Inc. | Automated cinematic decisions based on descriptive models |
US11244162B2 (en) * | 2018-10-31 | 2022-02-08 | International Business Machines Corporation | Automatic identification of relationships between a center of attention and other individuals/objects present in an image or video |
-
2019
- 2019-06-19 US US16/445,570 patent/US11341186B2/en active Active
-
2020
- 2020-05-21 GB GB2200555.7A patent/GB2600281B/en active Active
- 2020-05-21 CN CN202080033541.8A patent/CN113811884A/zh active Pending
- 2020-05-21 WO PCT/IB2020/054841 patent/WO2020254890A1/en active Application Filing
- 2020-05-21 JP JP2021574746A patent/JP2022537170A/ja active Pending
- 2020-05-21 DE DE112020002228.5T patent/DE112020002228T5/de active Pending
Also Published As
Publication number | Publication date |
---|---|
CN113811884A (zh) | 2021-12-17 |
DE112020002228T5 (de) | 2022-02-17 |
US11341186B2 (en) | 2022-05-24 |
WO2020254890A1 (en) | 2020-12-24 |
US20200401621A1 (en) | 2020-12-24 |
GB2600281A (en) | 2022-04-27 |
GB2600281B (en) | 2024-01-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2022537170A (ja) | 認知ビデオおよび音声検索集約 | |
JP7123122B2 (ja) | 認知的洞察を使用したビデオ・シーンの移動 | |
US9704185B2 (en) | Product recommendation using sentiment and semantic analysis | |
US10679047B2 (en) | System and method for pose-aware feature learning | |
US11062086B2 (en) | Personalized book-to-movie adaptation recommendation | |
US20170034107A1 (en) | Annotating content with contextually relevant comments | |
US11263208B2 (en) | Context-sensitive cross-lingual searches | |
US10169342B1 (en) | Filtering document search results using contextual metadata | |
US11126682B1 (en) | Hyperlink based multimedia processing | |
US10579666B2 (en) | Computerized cognitive recall assistance | |
US20180217986A1 (en) | Automated extraction tools and their use in social content tagging systems | |
US11630755B2 (en) | Request flow log retrieval | |
US11620334B2 (en) | Commercial video summaries using crowd annotation | |
US10795549B2 (en) | Generating a graphical user interface to navigate video content | |
US11093743B2 (en) | Intelligent personalization of operations of an image capturing device | |
US11558471B1 (en) | Multimedia content differentiation | |
US11804245B2 (en) | Video data size reduction | |
US11675828B2 (en) | Visual representation coherence preservation | |
CN113919446A (zh) | 多媒体资源的模型训练及相似度确定方法和装置 | |
US11010935B2 (en) | Context aware dynamic image augmentation | |
US11526544B2 (en) | System for object identification | |
US11520839B2 (en) | User based network document modification | |
US20230161775A1 (en) | Non-textual hashtag creation for non-textual content | |
US20230222236A1 (en) | Composite analysis content privacy | |
US20200394532A1 (en) | Detaching Social Media Content Creation from Publication |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20220512 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220909 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20221021 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20231016 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20231114 |
|
RD12 | Notification of acceptance of power of sub attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7432 Effective date: 20231214 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20240214 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20240412 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240510 |