JP2022135930A - ビデオ分類方法、装置、機器、および記憶媒体 - Google Patents
ビデオ分類方法、装置、機器、および記憶媒体 Download PDFInfo
- Publication number
- JP2022135930A JP2022135930A JP2022005486A JP2022005486A JP2022135930A JP 2022135930 A JP2022135930 A JP 2022135930A JP 2022005486 A JP2022005486 A JP 2022005486A JP 2022005486 A JP2022005486 A JP 2022005486A JP 2022135930 A JP2022135930 A JP 2022135930A
- Authority
- JP
- Japan
- Prior art keywords
- video
- text
- information
- keyword
- visual
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 46
- 230000000007 visual effect Effects 0.000 claims abstract description 96
- 239000013598 vector Substances 0.000 claims description 26
- 238000000605 extraction Methods 0.000 claims description 21
- 230000004927 fusion Effects 0.000 claims description 19
- 238000002372 labelling Methods 0.000 claims description 16
- 238000013145 classification model Methods 0.000 claims description 14
- 238000004590 computer program Methods 0.000 claims description 11
- 238000012549 training Methods 0.000 claims description 7
- 238000012015 optical character recognition Methods 0.000 description 20
- 238000005516 engineering process Methods 0.000 description 13
- 238000010586 diagram Methods 0.000 description 12
- 238000012545 processing Methods 0.000 description 12
- 238000004891 communication Methods 0.000 description 8
- 238000013473 artificial intelligence Methods 0.000 description 7
- 230000006872 improvement Effects 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 230000004048 modification Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 238000013527 convolutional neural network Methods 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 230000001815 facial effect Effects 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000005094 computer simulation Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/764—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/40—Scenes; Scene-specific elements in video content
- G06V20/46—Extracting features or characteristics from the video content, e.g. video fingerprints, representative shots or key frames
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/253—Fusion techniques of extracted features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/22—Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/768—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using context analysis, e.g. recognition aided by known co-occurring patterns
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/80—Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level
- G06V10/806—Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level of extracted features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/40—Scenes; Scene-specific elements in video content
- G06V20/41—Higher-level, semantic clustering, classification or understanding of video scenes, e.g. detection, labelling or Markovian modelling of sport events or news items
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/60—Type of objects
- G06V20/62—Text, e.g. of license plates, overlay texts or captions on TV images
- G06V20/635—Overlay text, e.g. embedded captions in a TV program
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/70—Labelling scene content, e.g. deriving syntactic or semantic representations
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Software Systems (AREA)
- Artificial Intelligence (AREA)
- Data Mining & Analysis (AREA)
- Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Medical Informatics (AREA)
- General Health & Medical Sciences (AREA)
- Databases & Information Systems (AREA)
- Computational Linguistics (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Mathematical Physics (AREA)
- Human Computer Interaction (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Acoustics & Sound (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Image Analysis (AREA)
- Liquid Crystal (AREA)
- Devices For Indicating Variable Information By Combining Individual Elements (AREA)
Abstract
Description
本明細書で説明された内容は、本開示の実施例のキーまたは重要な特徴を特定することを意図しておらず、本開示の範囲を制限するためにも使用されないことを理解されたい。本開示の他の特徴は、以下の明細書を通じて容易に理解できる。
101、ビデオのマルチモーダル情報に基づいて、ビデオ内のキーワードを抽出する。
201、ビデオに対応するテキストのテキストコンテンツを取得する。
Claims (17)
- ビデオ分類方法であって、
ビデオのマルチモーダル情報に基づいて、前記ビデオ内のキーワードを抽出するステップと、
前記キーワードに対応する背景知識を取得し、前記キーワードと前記背景知識に基づいて、認識すべきテキストを決定するステップと、
前記認識すべきテキストを分類して、前記ビデオのカテゴリを取得するステップと、を含む、
ビデオ分類方法。 - 前記ビデオのマルチモーダル情報に基づいて、前記ビデオ内のキーワードを抽出するステップは、
前記マルチモーダル情報内の各モーダル情報に対して、それぞれ特徴抽出を行って、前記各モーダル情報に対応する特徴を取得するステップと、
前記各モーダル情報に対応する特徴を融合して、融合特徴を取得するステップと、
前記融合特徴に基づいてキーワードラベル付けを行って、前記ビデオ内のキーワードを決定するステップと、を含む、
請求項1に記載のビデオ分類方法。 - 前記マルチモーダル情報は、テキストコンテンツと視覚情報を含み、前記視覚情報は、第1の視覚情報と第2の視覚情報を含み、前記第1の視覚情報は、前記ビデオの中のビデオフレームにおけるテキストに対応する視覚情報であり、前記第2の視覚情報は、前記ビデオ内のキーフレームであり、
前記マルチモーダル情報内の各モーダル情報に対して、それぞれ特徴抽出を行って、前記各モーダル情報に対応する特徴を取得するステップは、
前記テキストコンテンツに対して第1のテキスト符号化を行って、テキスト特徴を取得するステップと、
前記第1の視覚情報に対して第2のテキスト符号化を行って、第1の視覚特徴を取得するステップと、
前記第2の視覚情報に対して画像符号化を行って、第2の視覚特徴を取得するステップと、を含む、
請求項2に記載のビデオ分類方法。 - 前記各モーダル情報に対応する特徴を融合して、融合特徴を取得するステップは、
前記各モーダル情報に対応する特徴に対してベクトルスティッチングを行って、スティッチングベクトルを取得し、前記スティッチングベクトルを融合特徴とするステップを含む、
請求項2に記載のビデオ分類方法。 - 前記融合特徴に基づいてキーワードラベル付けを行うステップは、
条件付き確率場を使用して、前記融合特徴に基づいてキーワードラベル付けを行うステップを含む、
請求項2に記載のビデオ分類方法。 - 前記キーワードに対応する背景知識を取得するステップは、
既存の知識ベースから、前記キーワードに対応する背景知識を取得するステップを含む、
請求項1に記載のビデオ分類方法。 - 前記認識すべきテキストを分類するステップは、
分類モデルを使用して、前記認識すべきテキストを分類するステップを含み、前記分類モデルは、ラジオとテレビのデータを使用してトレーニングした後に取得される、
請求項1から6のいずれか一項に記載のビデオ分類方法。 - ビデオ分類装置であって、
ビデオのマルチモーダル情報に基づいて、前記ビデオ内のキーワードを抽出するための抽出モジュールと、
前記キーワードに対応する背景知識を取得し、前記キーワードと前記背景知識に基づいて、認識すべきテキストを決定するための決定モジュールと、
前記認識すべきテキストを分類して、前記ビデオのカテゴリを取得するための分類モジュールと、を含む、
ビデオ分類装置。 - 前記抽出モジュールは、具体的には、
前記マルチモーダル情報内の各モーダル情報に対して、それぞれ特徴抽出を行って、前記各モーダル情報に対応する特徴を取得し、
前記各モーダル情報に対応する特徴を融合して、融合特徴を取得し、
前記融合特徴に基づいてキーワードラベル付けを行って、前記ビデオ内のキーワードを決定するために用いられる、
請求項8に記載のビデオ分類装置。 - 前記マルチモーダル情報は、テキストコンテンツと視覚情報を含み、前記視覚情報は、第1の視覚情報と第2の視覚情報を含み、前記第1の視覚情報は、前記ビデオの中のビデオフレームにおけるテキストに対応する視覚情報であり、前記第2の視覚情報は、前記ビデオ内のキーフレームであり、
前記抽出モジュールは、さらに、具体的には、
前記テキストコンテンツに対して第1のテキスト符号化を行って、テキスト特徴を取得し、
前記第1の視覚情報に対して第2のテキスト符号化を行って、第1の視覚特徴を取得し、
前記第2の視覚情報に対して画像符号化を行って、第2の視覚特徴を取得するために用いられる、
請求項9に記載のビデオ分類装置。 - 前記抽出モジュールは、さらに、具体的には、
前記各モーダル情報に対応する特徴に対してベクトルスティッチングを行って、スティッチングベクトルを取得し、前記スティッチングベクトルを融合特徴とするために用いられる、
請求項9に記載のビデオ分類装置。 - 前記抽出モジュールは、具体的に、
条件付き確率場を使用して、前記融合特徴に基づいてキーワードラベル付けを行うために用いられる、
請求項9に記載のビデオ分類装置。 - 前記決定モジュールは、具体的には、
既存の知識ベースから、前記キーワードに対応する背景知識を取得するために用いられる、
請求項8に記載のビデオ分類装置。 - 前記分類モジュールは、具体的には、
分類モデルを使用して、前記認識すべきテキストを分類するために用いられ、前記分類モデルは、ラジオとテレビのデータを使用してトレーニングした後に取得される、
請求項8から13のいずれか一項に記載のビデオ分類装置。 - 電子機器であって、
少なくとも一つのプロセッサと、
前記少なくとも一つのプロセッサと通信接続されたメモリと、を含み、
前記メモリに前記少なくとも一つのプロセッサにより実行可能な命令が記憶されており、前記命令が前記少なくとも一つのプロセッサにより実行されると、前記少なくとも一つのプロセッサが請求項1から7のいずれか一項に記載のビデオ分類方法を実行する、
電子機器。 - コンピュータ命令が記憶されている非一時的なコンピュータ読み取り可能な記憶媒体であって、
前記コンピュータ命令は、コンピュータに請求項1~7のいずれか一項に記載のビデオ分類方法を実行させる、
非一時的なコンピュータ読み取り可能な記憶媒体。 - プロセッサによって実行される時に請求項1~7のいずれかの一つに記載のビデオ分類方法を実現する、
コンピュータプログラム。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110244368.2A CN113159010B (zh) | 2021-03-05 | 2021-03-05 | 视频分类方法、装置、设备和存储介质 |
CN202110244368.2 | 2021-03-05 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2022135930A true JP2022135930A (ja) | 2022-09-15 |
JP7334395B2 JP7334395B2 (ja) | 2023-08-29 |
Family
ID=76884217
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022005486A Active JP7334395B2 (ja) | 2021-03-05 | 2022-01-18 | ビデオ分類方法、装置、機器、および記憶媒体 |
Country Status (5)
Country | Link |
---|---|
US (1) | US20220284218A1 (ja) |
EP (1) | EP4053802A1 (ja) |
JP (1) | JP7334395B2 (ja) |
KR (1) | KR20220125672A (ja) |
CN (1) | CN113159010B (ja) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113657230B (zh) * | 2021-08-06 | 2024-04-23 | 北京百度网讯科技有限公司 | 训练新闻视频识别模型的方法、检测视频的方法及其装置 |
CN114398889A (zh) * | 2022-01-18 | 2022-04-26 | 平安科技(深圳)有限公司 | 基于多模态模型的视频文本摘要方法、设备及存储介质 |
CN116363261A (zh) * | 2023-03-31 | 2023-06-30 | 北京百度网讯科技有限公司 | 图像编辑模型的训练方法、图像编辑方法和装置 |
CN116486420B (zh) * | 2023-04-12 | 2024-01-12 | 北京百度网讯科技有限公司 | 文档图像的实体抽取方法、装置及存储介质 |
CN117234369A (zh) * | 2023-08-21 | 2023-12-15 | 华院计算技术(上海)股份有限公司 | 数字人交互方法及系统、计算机可读存储介质、数字人设备 |
CN117556067B (zh) * | 2024-01-11 | 2024-03-29 | 腾讯科技(深圳)有限公司 | 数据检索方法、装置、计算机设备和存储介质 |
CN117609553B (zh) * | 2024-01-23 | 2024-03-22 | 江南大学 | 基于局部特征增强和模态交互的视频检索方法及系统 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007294020A (ja) * | 2006-04-26 | 2007-11-08 | Sony Corp | 記録再生方法、記録再生装置、記録方法、記録装置、再生方法および再生装置 |
US20140201180A1 (en) * | 2012-09-14 | 2014-07-17 | Broadbandtv, Corp. | Intelligent Supplemental Search Engine Optimization |
US20180032845A1 (en) * | 2016-07-26 | 2018-02-01 | Viisights Solutions Ltd. | Video content contextual classification |
CN109472232A (zh) * | 2018-10-31 | 2019-03-15 | 山东师范大学 | 基于多模态融合机制的视频语义表征方法、系统及介质 |
CN110516654A (zh) * | 2019-09-03 | 2019-11-29 | 北京百度网讯科技有限公司 | 视频场景的实体识别方法、装置、电子设备和介质 |
CN111259215A (zh) * | 2020-02-14 | 2020-06-09 | 北京百度网讯科技有限公司 | 基于多模态的主题分类方法、装置、设备、以及存储介质 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20160014482A1 (en) * | 2014-07-14 | 2016-01-14 | The Board Of Trustees Of The Leland Stanford Junior University | Systems and Methods for Generating Video Summary Sequences From One or More Video Segments |
CN110012349B (zh) * | 2019-06-04 | 2019-09-20 | 成都索贝数码科技股份有限公司 | 一种端到端的新闻节目结构化方法 |
CN110362684B (zh) * | 2019-06-27 | 2022-10-25 | 腾讯科技(深圳)有限公司 | 一种文本分类方法、装置及计算机设备 |
CN110879974B (zh) * | 2019-11-01 | 2020-10-13 | 北京微播易科技股份有限公司 | 一种视频分类方法和装置 |
CN112256917B (zh) * | 2020-11-17 | 2024-03-26 | 腾讯科技(深圳)有限公司 | 用户兴趣识别方法、装置、设备及计算机可读存储介质 |
-
2021
- 2021-03-05 CN CN202110244368.2A patent/CN113159010B/zh active Active
- 2021-10-07 EP EP21201377.5A patent/EP4053802A1/en active Pending
- 2021-10-15 US US17/502,173 patent/US20220284218A1/en active Pending
-
2022
- 2022-01-11 KR KR1020220004158A patent/KR20220125672A/ko unknown
- 2022-01-18 JP JP2022005486A patent/JP7334395B2/ja active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007294020A (ja) * | 2006-04-26 | 2007-11-08 | Sony Corp | 記録再生方法、記録再生装置、記録方法、記録装置、再生方法および再生装置 |
US20140201180A1 (en) * | 2012-09-14 | 2014-07-17 | Broadbandtv, Corp. | Intelligent Supplemental Search Engine Optimization |
US20180032845A1 (en) * | 2016-07-26 | 2018-02-01 | Viisights Solutions Ltd. | Video content contextual classification |
CN109472232A (zh) * | 2018-10-31 | 2019-03-15 | 山东师范大学 | 基于多模态融合机制的视频语义表征方法、系统及介质 |
CN110516654A (zh) * | 2019-09-03 | 2019-11-29 | 北京百度网讯科技有限公司 | 视频场景的实体识别方法、装置、电子设备和介质 |
CN111259215A (zh) * | 2020-02-14 | 2020-06-09 | 北京百度网讯科技有限公司 | 基于多模态的主题分类方法、装置、设备、以及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
EP4053802A1 (en) | 2022-09-07 |
US20220284218A1 (en) | 2022-09-08 |
KR20220125672A (ko) | 2022-09-14 |
CN113159010B (zh) | 2022-07-22 |
JP7334395B2 (ja) | 2023-08-29 |
CN113159010A (zh) | 2021-07-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7334395B2 (ja) | ビデオ分類方法、装置、機器、および記憶媒体 | |
CN104735468B (zh) | 一种基于语义分析将图像合成新视频的方法及系统 | |
CN110991427B (zh) | 用于视频的情绪识别方法、装置和计算机设备 | |
CN111046656A (zh) | 文本处理方法、装置、电子设备及可读存储介质 | |
CN115982376B (zh) | 基于文本、多模数据和知识训练模型的方法和装置 | |
CN111177462B (zh) | 视频分发时效的确定方法和装置 | |
CN110851644A (zh) | 图像检索方法及装置、计算机可读存储介质、电子设备 | |
CN111191428A (zh) | 评论信息处理方法、装置、计算机设备和介质 | |
CN113806588B (zh) | 搜索视频的方法和装置 | |
CN115099239B (zh) | 一种资源识别方法、装置、设备以及存储介质 | |
CN111639228B (zh) | 视频检索方法、装置、设备及存储介质 | |
US11687711B2 (en) | Method and apparatus for generating commentary | |
CN112148874A (zh) | 可自动新增用户潜在意图的意图识别方法及系统 | |
CN112906368A (zh) | 行业文本增量方法、相关装置及计算机程序产品 | |
CN112822506A (zh) | 用于分析视频流的方法和装置 | |
US20230004715A1 (en) | Method and apparatus for constructing object relationship network, and electronic device | |
CN114880520B (zh) | 视频标题生成方法、装置、电子设备和介质 | |
CN114627296B (zh) | 图像分割模型的训练方法、装置、电子设备及存储介质 | |
CN113254578B (zh) | 用于数据聚类的方法、装置、设备、介质和产品 | |
CN116010545A (zh) | 一种数据处理方法、装置及设备 | |
JP2023554210A (ja) | インテリジェント推奨用のソートモデルトレーニング方法及び装置、インテリジェント推奨方法及び装置、電子機器、記憶媒体、並びにコンピュータプログラム | |
CN115329132A (zh) | 生成视频标签的方法、装置、设备以及存储介质 | |
CN112559727B (zh) | 用于输出信息的方法、装置、设备、存储介质和程序 | |
CN114880498A (zh) | 事件信息展示方法及装置、设备和介质 | |
CN113435523A (zh) | 预测内容点击率的方法、装置、电子设备以及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220118 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230221 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230519 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230718 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230728 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7334395 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |