JP7635366B2 - モデルデータ処理方法、装置、電子機器、コンピュータ可読媒体およびコンピュータプログラム - Google Patents
モデルデータ処理方法、装置、電子機器、コンピュータ可読媒体およびコンピュータプログラム Download PDFInfo
- Publication number
- JP7635366B2 JP7635366B2 JP2023517266A JP2023517266A JP7635366B2 JP 7635366 B2 JP7635366 B2 JP 7635366B2 JP 2023517266 A JP2023517266 A JP 2023517266A JP 2023517266 A JP2023517266 A JP 2023517266A JP 7635366 B2 JP7635366 B2 JP 7635366B2
- Authority
- JP
- Japan
- Prior art keywords
- data
- vector
- model
- feature
- autoregressive model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/70—Labelling scene content, e.g. deriving syntactic or semantic representations
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/40—Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
- G06F16/45—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/284—Lexical analysis, e.g. tokenisation or collocates
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/7715—Feature extraction, e.g. by transforming the feature space, e.g. multi-dimensional scaling [MDS]; Mappings, e.g. subspace methods
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/80—Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level
- G06V10/806—Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level of extracted features
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- Artificial Intelligence (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Databases & Information Systems (AREA)
- Computational Linguistics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Computing Systems (AREA)
- Data Mining & Analysis (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Machine Translation (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Image Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
Description
本開示は2021年1月21日に出願され、出願番号が202110080903.5であり、発明の名称が「モデルデータ処理方法、装置、電子機器およびコンピュータ可読媒体」である中国特許出願の優先権を主張し、当該出願の全文は引用により本開示に組み込まれる。
特徴系列においてコンカットされた全ての単語分割結果のうちの各単語分割結果の総位置データを確定するステップをさらに含み、上記の特徴系列に対してモデルマッピング処理を行い、自己回帰モデルに適合するマルチモーダルの入力データを取得するステップは、特徴系列に対して自己回帰モデルに適合するベクトルマッピングを行い、特徴系列に対応するデータ特徴ベクトルを得るステップと、総位置データに対して自己回帰モデルに適合するベクトルマッピングを行い、総位置ベクトルを得るステップと、データ特徴ベクトルと総位置ベクトルとを加算して、自己回帰モデルに適合するマルチモーダルの入力データを得るステップと、を含む。
処理対象テキストデータに単語分割処理を施し、得られた全ての単語分割結果をコンカットして分割語系列を得るステップと、画像データに特徴抽出を施して画像特徴を得るステップと、分割語系列と画像特徴を重ね合わせして特徴系列を得るステップとを含む。
特徴系列中の分割語系列に対して自己回帰モデルに適合するベクトルマッピングを行い、分割語系列のデータ特徴ベクトルを得るステップと、特徴系列中の画像特徴に対して自己回帰モデルの入力層と同じ次元のベクトルマッピングを行い、画像特徴ベクトルを得るステップと、データ特徴ベクトルおよび画像特徴ベクトルを加算し、自己回帰モデルに適合するマルチモーダルの入力データを得るステップとを含む。
特徴系列に対して自己回帰モデルに適合するベクトルマッピングを行い、特徴系列に対応したデータ特徴ベクトルを得るステップを含み、このデータ特徴ベクトルは、得られた自己回帰モデルに適合するマルチモーダルの入力データである。なお、このオプション的な実施形態において、上記特徴系列はすべての単語分割結果をコンカットしたものである。
特徴系列中のコンカットされた全ての単語分割結果に対して、自己回帰モデルに適合するベクトルマッピングを行い、コンカットされた全ての単語分割結果に対応するデータ特徴ベクトルを得るステップと、特徴系列中の画像特徴に対して自己回帰モデルの入力層と同じ次元のベクトルマッピングを行い、画像特徴ベクトルを得るステップと、データ特徴ベクトルと画像特徴ベクトルとを加算して、自己回帰モデルに適合するマルチモーダルの入力データを得るステップとを含む。
特徴系列中の分割語系列に対して自己回帰モデルに適合するベクトルマッピングを行い、分割語系列のデータ特徴ベクトルを得るステップと、特徴系列中の画像特徴に対して自己回帰モデルの入力層と同じ次元のベクトルマッピングを行い、画像特徴ベクトルを得るステップと、語位置データに対して自己回帰モデルに適合するベクトルマッピングを行い、語位置ベクトルを得るステップと、語分類データに対して自己回帰モデルに適合するベクトルマッピングを行い、語分類ベクトルを得るステップと、データ特徴ベクトル、語位置ベクトル、語分類ベクトルおよび画像特徴ベクトルを加算し、自己回帰モデルに適合するマルチモーダルの入力データを得るステップとを含む。
Claims (11)
- コンピュータによって実行されるモデルデータ処理方法であって、
処理対象となるデータセット内の少なくとも2種の異なるモーダルのデータを取得するステップと、
前記少なくとも2種の異なるモーダルのデータに対して特徴抽出を行った後にコンカットおよび/または重ね合わせにより特徴系列を取得するステップと、
前記特徴系列に対してモデルマッピング処理を行い、自己回帰モデルに適合するマルチモーダルの入力データを取得するステップと、
前記マルチモーダルの入力データを前記自己回帰モデルに入力して、前記自己回帰モデルから出力されたシングルモーダルの結果を取得するステップと、を含み、
前記少なくとも2種の異なるモーダルのデータは、処理対象テキストデータと知識グラフデータとを含み、
前記少なくとも2種の異なるモーダルのデータに対して特徴抽出を行った後にコンカットおよび/または重ね合わせにより特徴系列を取得するステップは、
前記知識グラフデータに対応するターナリテキストデータを採集するステップと、
前記ターナリテキストデータおよび前記処理対象テキストデータに対してそれぞれ単語分割処理を行い、全ての単語分割結果をコンカットして特徴系列を得るステップと、
を含むモデルデータ処理方法。 - 前記モデルデータ処理方法は、
前記特徴系列においてコンカットされた全ての単語分割結果のうちの各単語分割結果の総位置データを確定するステップをさらに含み、
前記特徴系列に対してモデルマッピング処理を行い、自己回帰モデルに適合するマルチモーダルの入力データを取得するステップは、
前記特徴系列に対して自己回帰モデルに適合するベクトルマッピングを行い、前記特徴系列に対応するデータ特徴ベクトルを得るステップと、
前記総位置データに対して前記自己回帰モデルに適合するベクトルマッピングを行い、総位置ベクトルを得るステップと、
前記データ特徴ベクトルと前記総位置ベクトルとを加算して、前記自己回帰モデルに適合するマルチモーダルの入力データを得るステップと、
を含む請求項1に記載のモデルデータ処理方法。 - 前記モデルデータ処理方法は、
前記特徴系列においてコンカットされた全ての単語分割結果のうちの各単語分割結果に対して分類処理を行って総分類データを得るステップをさらに含み、
前記特徴系列に対してモデルマッピング処理を行い、自己回帰モデルに適合するマルチモーダルの入力データを取得するステップは、
前記特徴系列に対して自己回帰モデルに適合するベクトルマッピングを行い、前記特徴系列に対応するデータ特徴ベクトルを得るステップと、
前記総分類データに対して前記自己回帰モデルに適合するベクトルマッピングを行い、総分類ベクトルを得るステップと、
前記データ特徴ベクトルと前記総分類ベクトルとを加算して、前記自己回帰モデルに適合するマルチモーダルの入力データを得るステップと、
を含む請求項1に記載のモデルデータ処理方法。 - 前記少なくとも2種の異なるモーダルのデータは、画像データをさらに含み、
前記少なくとも2種の異なるモーダルのデータに対して特徴抽出を行った後にコンカットおよび/または重ね合わせにより特徴系列を取得するステップは、
前記画像データに対して特徴抽出を行って画像特徴を得るステップさらに含み、
得られた特徴系列に前記画像特徴がさらに重ね合わせされており、
前記特徴系列に対してモデルマッピング処理を行い、自己回帰モデルに適合するマルチモーダルの入力データを取得するステップは、
前記特徴系列中のコンカットされた全ての単語分割結果に対して自己回帰モデルに適合するベクトルマッピングを行い、コンカットされた全ての単語分割結果に対応するデータ特徴ベクトルを得るステップと、
前記特徴系列中の画像特徴に対して前記自己回帰モデルの入力層と同じ次元のベクトルマッピングを行い、画像特徴ベクトルを得るステップと、
前記データ特徴ベクトルと前記画像特徴ベクトルとを加算して、前記自己回帰モデルに適合するマルチモーダルの入力データを得るステップと、
を含む請求項1に記載のモデルデータ処理方法。 - 前記モデルデータ処理方法は、
前記特徴系列においてコンカットされた全ての単語分割結果のうちの各単語分割結果の総位置データを確定するステップと、
前記特徴系列においてコンカットされた全ての単語分割結果のうちの各単語分割結果に対して分類処理を行って総分類データを得るステップとをさらに含み、
前記特徴系列に対してモデルマッピング処理を行い、自己回帰モデルに適合するマルチモーダルの入力データを取得するステップは、
前記総位置データに対して前記自己回帰モデルに適合するベクトルマッピングを行い、総位置ベクトルを得るステップと、
前記総分類データに対して前記自己回帰モデルに適合するベクトルマッピングを行い、総分類ベクトルを得るステップと、をさらに含み、
得られた、前記自己回帰モデルに適合するマルチモーダルの入力データは、前記総位置ベクトルと前記総分類ベクトルとをさらに含む
請求項4に記載のモデルデータ処理方法。 - 前記少なくとも2種の異なるモーダルのデータは、処理対象テキストデータと画像データとを含み、
前記少なくとも2種の異なるモーダルのデータに対して特徴抽出を行った後にコンカットおよび/または重ね合わせにより特徴系列を取得するステップは、
前記処理対象テキストデータに対して単語分割処理を行い、全ての単語分割結果をコンカットして分割語系列を得るステップと、
前記画像データに対して特徴抽出を行って画像特徴を得るステップと、
前記分割語系列と前記画像特徴とを重ね合わせして特徴系列を得るステップと、を含み、
前記特徴系列に対してモデルマッピング処理を行い、自己回帰モデルに適合するマルチモーダルの入力データを得るステップは、
前記特徴系列中の分割語系列に対して自己回帰モデルに適合するベクトルマッピングを行い、前記分割語系列のデータ特徴ベクトルを得るステップと、
前記特徴系列中の画像特徴に対して前記自己回帰モデルの入力層と同じ次元のベクトルマッピングを行い、画像特徴ベクトルを得るステップと、
前記データ特徴ベクトルと前記画像特徴ベクトルとを加算して、前記自己回帰モデルに適合するマルチモーダルの入力データを得るステップと、
を含む請求項1に記載のモデルデータ処理方法。 - 前記モデルデータ処理方法は、
前記分割語系列において各語の語位置データを確定するステップと、
前記分割語系列における各語を分類処理して、語分類データを得るステップとをさらに含み、
前記特徴系列に対してモデルマッピング処理を行い、自己回帰モデルに適合するマルチモーダルの入力データを取得するステップは、
前記語位置データに対して前記自己回帰モデルに適合するベクトルマッピングを行い、語位置ベクトルを得るステップと、
前記語分類データに対して前記自己回帰モデルに適合するベクトルマッピングを行い、語分類ベクトルを得るステップと、をさらに含み、
得られた、前記自己回帰モデルに適合するマルチモーダルの入力データは、前記語位置ベクトルと前記語分類ベクトルとをさらに含む
請求項6に記載のモデルデータ処理方法。 - モデルデータ処理装置であって、
処理対象となるデータセット内の少なくとも2種の異なるモーダルのデータを取得するように構成される獲得ユニットと、
前記少なくとも2種の異なるモーダルのデータに対して特徴抽出を行った後にコンカットおよび/または重ね合わせにより特徴系列を取得するように構成される抽出ユニットと、
前記特徴系列に対してモデルマッピング処理を行い、自己回帰モデルに適合するマルチモーダルの入力データを取得するように構成される取得ユニットと、
前記マルチモーダルの入力データを前記自己回帰モデルに入力して、前記自己回帰モデルから出力されたシングルモーダルの結果を取得するように構成される処理ユニットと、を備え、
前記少なくとも2種の異なるモーダルのデータは、処理対象テキストデータと知識グラフデータとを含み、
前記抽出ユニットは、
前記知識グラフデータに対応するターナリテキストデータを採集し、
前記ターナリテキストデータおよび前記処理対象テキストデータに対してそれぞれ単語分割処理を行い、全ての単語分割結果をコンカットして特徴系列を得るようにさらに構成されるモデルデータ処理装置。 - 電子機器であって、
1つまたは複数のプロセッサと、1つまたは複数のプログラムが格納されている記憶装置と、を備える電子機器であって、
前記1つまたは複数のプログラムが前記1つまたは複数のプロセッサによって実行されると、前記1つまたは複数のプロセッサに請求項1~7のいずれか一項に記載のモデルデータ処理方法を実現させる、電子機器。 - コンピュータプログラムが格納されているコンピュータ可読媒体であって、
当該コンピュータプログラムがプロセッサによって実行されると、請求項1~7のいずれか1項に記載のモデルデータ処理方法を実現する、コンピュータ可読媒体。 - プロセッサによって実行されると請求項1~7のいずれか1項に記載のモデルデータ処理方法が実現されるコンピュータプログラム。
Applications Claiming Priority (3)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CN202110080903.5A CN113821652B (zh) | 2021-01-21 | 2021-01-21 | 模型数据处理方法、装置、电子设备以及计算机可读介质 |
| CN202110080903.5 | 2021-01-21 | ||
| PCT/CN2021/140074 WO2022156468A1 (zh) | 2021-01-21 | 2021-12-21 | 模型数据处理方法、装置、电子设备以及计算机可读介质 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2023542665A JP2023542665A (ja) | 2023-10-11 |
| JP7635366B2 true JP7635366B2 (ja) | 2025-02-25 |
Family
ID=78912340
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2023517266A Active JP7635366B2 (ja) | 2021-01-21 | 2021-12-21 | モデルデータ処理方法、装置、電子機器、コンピュータ可読媒体およびコンピュータプログラム |
Country Status (5)
| Country | Link |
|---|---|
| US (1) | US12536386B2 (ja) |
| JP (1) | JP7635366B2 (ja) |
| KR (1) | KR20230065339A (ja) |
| CN (1) | CN113821652B (ja) |
| WO (1) | WO2022156468A1 (ja) |
Families Citing this family (9)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN115544200A (zh) * | 2022-09-22 | 2022-12-30 | 太保科技有限公司 | 一种文档影像分类方法和装置 |
| CN115632995B (zh) * | 2022-12-19 | 2023-03-17 | 北京安帝科技有限公司 | 用于工控网络的数据特征提取方法、设备与计算机介质 |
| CN115937864B (zh) * | 2022-12-26 | 2025-11-21 | 抖音视界有限公司 | 文本重叠检测方法、装置、介质和电子设备 |
| US12450933B2 (en) * | 2023-04-03 | 2025-10-21 | Zhejiang Lab | Method, device, computer equipment and storage medium for identifying illegal commodity |
| KR102667192B1 (ko) * | 2023-07-04 | 2024-05-22 | 주식회사 피앤씨솔루션 | 오프라인에서 멀티모달 데이터를 처리해 결과를 제공하는 증강현실 글래스 장치 및 그의 운용 방법 |
| CN117077073A (zh) * | 2023-07-11 | 2023-11-17 | 华为技术有限公司 | 一种多模态数据的处理方法及相关装置 |
| US12481839B2 (en) * | 2023-12-14 | 2025-11-25 | Jpmorgan Chase Bank, N.A. | System and method for layout-aware generative pretraining for visually rich document understanding |
| CN118298049B (zh) * | 2024-04-01 | 2026-01-27 | 北京百度网讯科技有限公司 | 多模态数据生成方法及多模态模型的训练方法 |
| CN119293751B (zh) * | 2024-12-12 | 2025-05-09 | 首都医科大学附属北京天坛医院 | 一种基于智能穿戴设备的全方位风险预警监测方法及系统 |
Citations (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US10467274B1 (en) | 2016-11-10 | 2019-11-05 | Snap Inc. | Deep reinforcement learning-based captioning with embedding reward |
| JP2019219827A (ja) | 2018-06-18 | 2019-12-26 | 日本放送協会 | 言語モデル学習装置およびそのプログラム、ならびに、単語推定装置およびそのプログラム |
| CN111461203A (zh) | 2020-03-30 | 2020-07-28 | 北京百度网讯科技有限公司 | 跨模态处理方法、装置、电子设备和计算机存储介质 |
Family Cites Families (19)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| GB2358752A (en) * | 2000-01-31 | 2001-08-01 | Tricorder Technology Plc | Surface or volumetric data processing method and apparatus |
| JP2002158877A (ja) * | 2000-11-21 | 2002-05-31 | Ricoh Co Ltd | 画像データ処理方法及び画像データ処理装置 |
| CN101226557B (zh) * | 2008-02-22 | 2010-07-14 | 中国科学院软件研究所 | 一种高效的关联主题模型数据处理方法 |
| JP7014072B2 (ja) * | 2018-07-17 | 2022-02-01 | 日本電信電話株式会社 | 特徴量生成方法、特徴量生成装置、及び特徴量生成プログラム |
| CN110263324B (zh) * | 2019-05-16 | 2021-02-12 | 华为技术有限公司 | 文本处理方法、模型训练方法和装置 |
| US12033083B2 (en) * | 2019-05-22 | 2024-07-09 | Royal Bank Of Canada | System and method for machine learning architecture for partially-observed multimodal data |
| CN112015859B (zh) * | 2019-05-31 | 2023-08-18 | 百度在线网络技术(北京)有限公司 | 文本的知识层次抽取方法及装置、计算机设备及可读介质 |
| CN112035401A (zh) * | 2019-06-03 | 2020-12-04 | 北京京东尚科信息技术有限公司 | 模型数据处理方法、装置、电子设备及可读介质 |
| CN110288980A (zh) * | 2019-06-17 | 2019-09-27 | 平安科技(深圳)有限公司 | 语音识别方法、模型的训练方法、装置、设备及存储介质 |
| CN110234018B (zh) * | 2019-07-09 | 2022-05-31 | 腾讯科技(深圳)有限公司 | 多媒体内容描述生成方法、训练方法、装置、设备及介质 |
| CN110490095A (zh) * | 2019-07-31 | 2019-11-22 | 中国人民解放军战略支援部队信息工程大学 | 一种基于神经网络的多模态特征融合调制识别方法和系统 |
| CN110597878B (zh) * | 2019-09-16 | 2023-09-15 | 广东工业大学 | 一种多模态数据的跨模态检索方法、装置、设备及介质 |
| CN111258995B (zh) * | 2020-01-14 | 2022-11-11 | 腾讯科技(深圳)有限公司 | 数据处理方法、装置、存储介质及设备 |
| CN111259663B (zh) * | 2020-01-14 | 2023-05-26 | 北京百度网讯科技有限公司 | 信息处理方法和装置 |
| CN111259148B (zh) * | 2020-01-19 | 2024-03-26 | 北京小米松果电子有限公司 | 信息处理方法、装置及存储介质 |
| CN111768367B (zh) * | 2020-05-20 | 2024-03-29 | 深圳迈瑞生物医疗电子股份有限公司 | 数据处理方法、装置和存储介质 |
| CN111898636B (zh) | 2020-06-28 | 2024-05-14 | 华为技术有限公司 | 一种数据处理方法及装置 |
| CN112148836B (zh) * | 2020-09-07 | 2024-10-15 | 北京字节跳动网络技术有限公司 | 多模态信息处理方法、装置、设备及存储介质 |
| CN112199952B (zh) * | 2020-12-04 | 2021-03-23 | 支付宝(杭州)信息技术有限公司 | 一种分词方法、多模式分词模型和系统 |
-
2021
- 2021-01-21 CN CN202110080903.5A patent/CN113821652B/zh active Active
- 2021-12-21 JP JP2023517266A patent/JP7635366B2/ja active Active
- 2021-12-21 KR KR1020237012388A patent/KR20230065339A/ko active Pending
- 2021-12-21 WO PCT/CN2021/140074 patent/WO2022156468A1/zh not_active Ceased
- 2021-12-21 US US18/029,342 patent/US12536386B2/en active Active
Patent Citations (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US10467274B1 (en) | 2016-11-10 | 2019-11-05 | Snap Inc. | Deep reinforcement learning-based captioning with embedding reward |
| JP2019219827A (ja) | 2018-06-18 | 2019-12-26 | 日本放送協会 | 言語モデル学習装置およびそのプログラム、ならびに、単語推定装置およびそのプログラム |
| CN111461203A (zh) | 2020-03-30 | 2020-07-28 | 北京百度网讯科技有限公司 | 跨模态处理方法、装置、电子设备和计算机存储介质 |
Also Published As
| Publication number | Publication date |
|---|---|
| CN113821652A (zh) | 2021-12-21 |
| US20230367972A1 (en) | 2023-11-16 |
| US12536386B2 (en) | 2026-01-27 |
| CN113821652B (zh) | 2025-12-16 |
| JP2023542665A (ja) | 2023-10-11 |
| WO2022156468A1 (zh) | 2022-07-28 |
| KR20230065339A (ko) | 2023-05-11 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP7635366B2 (ja) | モデルデータ処理方法、装置、電子機器、コンピュータ可読媒体およびコンピュータプログラム | |
| CN109902186B (zh) | 用于生成神经网络的方法和装置 | |
| CN110288049B (zh) | 用于生成图像识别模型的方法和装置 | |
| CN107346336B (zh) | 基于人工智能的信息处理方法和装置 | |
| CN109740018B (zh) | 用于生成视频标签模型的方法和装置 | |
| US20180174037A1 (en) | Suggesting resources using context hashing | |
| CN111738010B (zh) | 用于生成语义匹配模型的方法和装置 | |
| CN110347940A (zh) | 用于优化兴趣点标签的方法和装置 | |
| CN110059172B (zh) | 基于自然语言理解的推荐答案的方法和装置 | |
| CN111666416B (zh) | 用于生成语义匹配模型的方法和装置 | |
| JP7194233B2 (ja) | オブジェクト推薦方法、ニューラルネットワークおよびそのトレーニング方法、装置ならびに媒体 | |
| CN113379449A (zh) | 多媒体资源召回方法、装置、电子设备以及存储介质 | |
| CN112182255A (zh) | 用于存储媒体文件和用于检索媒体文件的方法和装置 | |
| CN111026849B (zh) | 数据处理方法和装置 | |
| CN110245310B (zh) | 一种对象的行为分析方法、装置及存储介质 | |
| CN111770125A (zh) | 用于推送信息的方法和装置 | |
| US12517932B2 (en) | Method and apparatus for processing information | |
| CN111460169B (zh) | 语义表达式生成方法、装置及设备 | |
| CN112395490B (zh) | 用于生成信息的方法和装置 | |
| WO2025108303A1 (zh) | 视频生成方法、装置、电子设备和存储介质 | |
| CN112149426A (zh) | 阅读任务处理方法及相关设备 | |
| JP6844143B2 (ja) | 情報処理装置 | |
| CN119202284A (zh) | 一种数据标注方法、装置、电子设备和存储介质 | |
| CN113722578B (zh) | 数据处理方法和装置 | |
| CN115761410A (zh) | 属性识别模型的训练方法、训练装置和电子设备 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230314 |
|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20230314 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20240417 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20240430 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240709 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20240819 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20241021 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20250114 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20250212 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 7635366 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |