JP7225273B2 - マルチモーダルコンテンツ処理方法、装置、機器及び記憶媒体 - Google Patents
マルチモーダルコンテンツ処理方法、装置、機器及び記憶媒体 Download PDFInfo
- Publication number
- JP7225273B2 JP7225273B2 JP2021004519A JP2021004519A JP7225273B2 JP 7225273 B2 JP7225273 B2 JP 7225273B2 JP 2021004519 A JP2021004519 A JP 2021004519A JP 2021004519 A JP2021004519 A JP 2021004519A JP 7225273 B2 JP7225273 B2 JP 7225273B2
- Authority
- JP
- Japan
- Prior art keywords
- multimodal
- content
- semantic understanding
- knowledge
- understanding result
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/40—Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
- G06F16/48—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/483—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/901—Indexing; Data structures therefor; Storage structures
- G06F16/9024—Graphs; Linked lists
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/042—Knowledge-based neural networks; Logical representations of neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/02—Knowledge representation; Symbolic representation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- Databases & Information Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Software Systems (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Evolutionary Computation (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Biophysics (AREA)
- Molecular Biology (AREA)
- Biomedical Technology (AREA)
- Animal Behavior & Ethology (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Library & Information Science (AREA)
- Multimedia (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Machine Translation (AREA)
Description
ユーザのコンテンツ処理要求を受信し、前記コンテンツ処理要求が、処理対象マルチモーダルコンテンツに対して意味理解を行うことを要求するために使用されることと、
前記マルチモーダルコンテンツに対して解析を行い、前記マルチモーダルコンテンツに対応するマルチモーダル知識点を得ることと、
前記マルチモーダル知識点、予め確立されたマルチモーダル知識グラフ及び前記マルチモーダルコンテンツに従って、前記マルチモーダルコンテンツの意味理解結果を確定し、前記マルチモーダル知識グラフが、前記マルチモーダル知識点と前記マルチモーダル知識点との関連関係を含むことと、を含む。
前記マルチモーダル知識点と前記マルチモーダル知識グラフに従って、前記マルチモーダル知識点間の関連関係を確定することと、
前記マルチモーダル知識点と予め設定された意味理解方法に従って、前記マルチモーダルコンテンツの基本的な意味理解結果を確定することと、
前記マルチモーダル知識点間の関連関係、前記基本的な意味理解結果及び前記マルチモーダル知識グラフに従って、前記マルチモーダルコンテンツの意味理解結果を確定することと、を含む。
前記第1の意味理解結果は、前記マルチモーダル知識点と予め設定された深度学習方法に従って、前記マルチモーダルコンテンツに対して意味理解を行うことによって得られ、
前記第2の意味理解結果は、予め設定された融合方法に従って、前記マルチモーダル知識点に対応する複数のシングルモーダル意味理解結果に対して融合を行うことによって得られる。
マルチモーダルデータセットを取得し、前記マルチモーダルデータセットが、複数のマルチモーダルコンテンツサンプルを含むことと、
前記マルチモーダルデータセットに対して処理を行い、前記マルチモーダル知識グラフの本体を確定することと、
前記マルチモーダルデータセットにおける各マルチモーダルコンテンツサンプルのマルチモーダル知識点サンプルを発掘することと、
知識グラフ表現学習によって、前記マルチモーダル知識点サンプル間の関連関係を確立することと、
前記マルチモーダル知識点サンプル間の関連関係と前記マルチモーダル知識グラフの本体に基づいて、前記マルチモーダル知識グラフを確立することと、をさらに含む。
知識グラフの意味表現方法に基づいて、前記マルチモーダルコンテンツの意味理解結果を出力することをさらに含む。
前記意味理解結果のベクトル表現に従って、タイプが前記マルチモーダルコンテンツと一致する推薦リソースを取得することと、
前記ユーザに前記推薦リソースをプッシュすることと、
又は
前記意味理解結果のベクトル表現に従って、前記マルチモーダルコンテンツのテキスト理解結果を確定することと、
前記テキスト理解結果に従って、検索プロセスを実行し、前記マルチモーダルコンテンツに対する検索結果を取得することと、をさらに含む。
前記受信モジュールが、ユーザのコンテンツ処理要求を受信するために使用され、前記コンテンツ処理要求が、処理対象マルチモーダルコンテンツに対して意味理解を行うことを要求するために使用され、
前記処理モジュールが、前記マルチモーダルコンテンツに対して解析を行い、前記マルチモーダルコンテンツに対応するマルチモーダル知識点を得るために使用され、
前記確定モジュールが、前記マルチモーダル知識点、予め確立されたマルチモーダル知識グラフ及び前記マルチモーダルコンテンツに従って、前記マルチモーダルコンテンツの意味理解結果を確定するために使用され、前記マルチモーダル知識グラフが、前記マルチモーダル知識点と前記マルチモーダル知識点との関連関係を含む。
前記第1の意味理解結果は、前記マルチモーダル知識点と予め設定された深度学習方法に従って、前記マルチモーダルコンテンツに対して意味理解を行うことによって得られ、
前記第2の意味理解結果は、予め設定された融合方法に従って、前記マルチモーダル知識点に対応する複数のシングルモーダル意味理解結果に対して融合を行うことによって得られる。
前記出力モジュールは、知識グラフの意味表現方法に基づいて、前記マルチモーダルコンテンツの意味理解結果を出力するために使用される。
前記処理モジュールは、前記意味理解結果のベクトル表現に従って、タイプが前記マルチモーダルコンテンツと一致する推薦リソースを取得するためにさらに使用され、
前記出力モジュールは、前記ユーザに前記推薦リソースをプッシュするために使用され、
又は
前記確定モジュールは、前記意味理解結果のベクトル表現に従って、前記マルチモーダルコンテンツのテキスト理解結果を確定するためにさらに使用され、
前記処理モジュールは、前記テキスト理解結果に従って、検索プロセスを実行し、前記マルチモーダルコンテンツに対する検索結果を取得するためにさらに使用され、
前記出力モジュールは、前記マルチモーダルコンテンツに対する検索結果を出力するために使用される。
少なくとも1つのプロセッサ、及び
前記少なくとも1つのプロセッサと通信接続されるメモリ、を含み、そのうち、
前記メモリには前記少なくとも1つのプロセッサによって実行可能な命令が記憶され、前記命令が前記少なくとも1つのプロセッサによって実行されることにより、前記少なくとも1つのプロセッサが、第1の態様及び第1の態様の各可能な設計に記載の方法を実行することができる。
外部のコンテンツ処理要求に応答して、処理対象マルチモーダルコンテンツを確定することと、
予め確立された知識グラフと前記マルチモーダルコンテンツに従って、前記マルチモーダルコンテンツの意味理解結果を確定することと、を含む。
マルチモーダルコンテンツは、様々なモダリティを有するリソースであり、各情報のソース又は形態は、1つのモダリティと呼ばれることができる。例えば、人は、触覚、聴覚、視覚、及び嗅覚を有し、情報の媒体は、音声、ビデオ、文字などがあり、様々なセンサー、例えばレーダー、赤外線、加速度計などである。上記のいずれも1つのモダリティと言える。また、モダリティは、非常に広い定義を持つことができ、例えば、2つの異なる言語を、2つのモダリティとしてもよく、2つの異なる状況で収集されたデータセットさえ、2つのモダリティとして考えられてもよい。
知識グラフは、ノードとサイドから図の形で構成され、知識の構造化表現形態である。知識グラフのノードは、知識点と呼ばれることができ、その表現された情報は、エンティティ、概念、イベント、動作、機能、テーマ、シーン、ソース、視覚リソース、音声リソース、テキストリソース、ユーザ行為などを含むが、これらに限定されなく、これに応じて、知識グラフのサイドは、知識点間の関連関係とも呼ばれることができ、その表現された情報は、属性、従属、タイミング及び因果などを含むが、これらに限定されない。
知識グラフの意味表現方法に基づいて、当該マルチモーダルコンテンツの意味理解結果を出力する。
当該意味理解結果のベクトル表現に従って、タイプが当該マルチモーダルコンテンツと一致する推薦リソースを取得し、当該ユーザに当該推薦リソースをプッシュする。
当該意味理解結果のベクトル表現に従って、当該マルチモーダルコンテンツのテキスト理解結果を確定し、当該テキスト理解結果に従って、検索プロセスを実行し、当該マルチモーダルコンテンツに対する検索結果を取得し、当該マルチモーダルコンテンツに対する検索結果を出力する。
当該処理モジュール802は、前記マルチモーダルコンテンツに対して解析を行い、前記マルチモーダルコンテンツに対応するマルチモーダル知識点を得るために使用され、
当該確定モジュール803は、前記マルチモーダル知識点、予め確立されたマルチモーダル知識グラフと前記マルチモーダルコンテンツに従って、前記マルチモーダルコンテンツの意味理解結果を確定するために使用され、前記マルチモーダル知識グラフは、前記マルチモーダル知識点と前記マルチモーダル知識点間の関連関係を含む。
前記第1の意味理解結果は、前記マルチモーダル知識点と予め設定された深度学習方法に従って、前記マルチモーダルコンテンツに対して意味理解を行うことによって得られ、
前記第2の意味理解結果は、予め設定された融合方法に従って、前記マルチモーダル知識点に対応する複数のシングルモーダル意味理解結果に対して融合を行うことによって得られる。
当該出力モジュールは、知識グラフの意味表現方法に基づいて、前記マルチモーダルコンテンツの意味理解結果を出力するために使用される。
当該処理モジュール802は、前記意味理解結果のベクトル表現に従って、タイプが前記マルチモーダルコンテンツと一致する推薦リソースを取得するためにさらに使用され、
前記出力モジュールは、前記ユーザに前記推薦リソースをプッシュするために使用され、
又は
当該確定モジュール803は、さらに前記意味理解結果のベクトル表現に従って、前記マルチモーダルコンテンツのテキスト理解結果を確定するために使用され、
当該処理モジュール802は、さらに前記テキスト理解結果に従って、検索プロセスを実行し、前記マルチモーダルコンテンツに対する検索結果を取得するために使用され、
前記出力モジュールは、前記マルチモーダルコンテンツに対する検索結果を出力するために使用される。
外部のコンテンツ処理要求に応答し、処理対象マルチモーダルコンテンツを確定することと、
予め確立された知識グラフと前記マルチモーダルコンテンツに従って、前記マルチモーダルコンテンツの意味理解結果を確定することと、を含む。
Claims (13)
- 電子機器によって実行されるマルチモーダルコンテンツ処理方法であって、
ユーザのコンテンツ処理要求を受信することであって、前記コンテンツ処理要求には処理対象マルチモーダルコンテンツが含まれ、前記コンテンツ処理要求が、前記マルチモーダルコンテンツに対して意味理解を行うことを要求するために使用されることと、
前記マルチモーダルコンテンツに対して解析を行い、前記マルチモーダルコンテンツに対応するマルチモーダル知識点を得ることと、
前記マルチモーダル知識点、予め確立されたマルチモーダル知識グラフ及び前記マルチモーダルコンテンツに従って、前記マルチモーダルコンテンツの意味理解結果を確定し、前記マルチモーダル知識グラフが、前記マルチモーダル知識点と前記マルチモーダル知識点間の関連関係を含むことと、を含み、
前記コンテンツ処理要求に含まれる前記マルチモーダルコンテンツの意味理解結果のベクトル表現に従って、タイプが前記マルチモーダルコンテンツと一致する推薦リソースを取得することと、
前記ユーザに前記推薦リソースをプッシュすることと、
又は
前記コンテンツ処理要求に含まれる前記マルチモーダルコンテンツの意味理解結果のベクトル表現に従って、前記マルチモーダルコンテンツのテキスト理解結果を確定することと、
前記テキスト理解結果に従って、検索プロセスを実行し、前記マルチモーダルコンテンツに対する検索結果を取得することと、
をさらに含むことを特徴とするマルチモーダルコンテンツ処理方法。 - 前記マルチモーダル知識点、予め確立されたマルチモーダル知識グラフ及び前記マルチモーダルコンテンツに従って、前記マルチモーダルコンテンツの意味理解結果を確定することは、
前記マルチモーダル知識点と前記マルチモーダル知識グラフに従って、前記マルチモーダル知識点間の関連関係を確定することと、
前記マルチモーダル知識点と予め設定された意味理解方法に従って、前記マルチモーダルコンテンツの基本的な意味理解結果を確定することと、
前記マルチモーダル知識点間の関連関係、前記基本的な意味理解結果及び前記マルチモーダル知識グラフに従って、前記マルチモーダルコンテンツの意味理解結果を確定することと、を含むことを特徴とする請求項1に記載の方法。 - 前記基本的な意味理解結果は、第1の意味理解結果及び/又は第2の意味理解結果を含み、
前記第1の意味理解結果は、前記マルチモーダル知識点と予め設定された深度学習方法に従って、前記マルチモーダルコンテンツに対して意味理解を行うことによって得られ、
前記第2の意味理解結果は、予め設定された融合方法に従って、前記マルチモーダル知識点に対応する複数のシングルモーダル意味理解結果に対して融合を行うことによって得られることを特徴とする請求項2に記載の方法。 - マルチモーダルデータセットを取得し、前記マルチモーダルデータセットが、複数のマルチモーダルコンテンツサンプルを含むことと、
前記マルチモーダルデータセットに対して処理を行い、前記マルチモーダル知識グラフの本体を確定することと、
前記マルチモーダルデータセットにおける各マルチモーダルコンテンツサンプルのマルチモーダル知識点サンプルを発掘することと、
知識グラフ表現学習によって、前記マルチモーダル知識点サンプル間の関連関係を確立することと、
前記マルチモーダル知識点サンプル間の関連関係と前記マルチモーダル知識グラフの本体に基づいて、前記マルチモーダル知識グラフを確立することと、をさらに含むことを特徴とする請求項1~請求項3のいずれか1項に記載の方法。 - 知識グラフの意味表現方法に基づいて、前記マルチモーダルコンテンツの意味理解結果を出力することをさらに含むことを特徴とする請求項1~請求項3のいずれか1項に記載の方法。
- 受信モジュール、処理モジュール及び確定モジュールを含み、
前記受信モジュールは、ユーザのコンテンツ処理要求を受信するために使用され、前記コンテンツ処理要求には処理対象マルチモーダルコンテンツが含まれ、前記コンテンツ処理要求は、前記マルチモーダルコンテンツに対して意味理解を行うことを要求するために使用され、
前記処理モジュールは、前記マルチモーダルコンテンツに対して解析を行い、前記マルチモーダルコンテンツに対応するマルチモーダル知識点を得るために使用され、
前記確定モジュールは、前記マルチモーダル知識点、予め確立されたマルチモーダル知識グラフ及び前記マルチモーダルコンテンツに従って、前記マルチモーダルコンテンツの意味理解結果を確定するために使用され、前記マルチモーダル知識グラフは、前記マルチモーダル知識点と前記マルチモーダル知識点間の関連関係を含み、
出力モジュールをさらに含み、
前記処理モジュールは、前記コンテンツ処理要求に含まれる前記マルチモーダルコンテンツの意味理解結果のベクトル表現に従って、タイプが前記マルチモーダルコンテンツと一致する推薦リソースを取得するためにさらに使用され、
前記出力モジュールは、前記ユーザに前記推薦リソースをプッシュするために使用され、
又は
前記確定モジュールは、前記コンテンツ処理要求に含まれる前記マルチモーダルコンテンツの意味理解結果のベクトル表現に従って、前記マルチモーダルコンテンツのテキスト理解結果を確定するためにさらに使用され、
前記処理モジュールは、前記テキスト理解結果に従って、検索プロセスを実行し、前記マルチモーダルコンテンツに対する検索結果を取得するためにさらに使用され、
前記出力モジュールは、前記マルチモーダルコンテンツに対する検索結果を出力するために使用されることを特徴とするマルチモーダルコンテンツ処理装置。 - 前記確定モジュールは、前記マルチモーダル知識点と前記マルチモーダル知識グラフに従って、前記マルチモーダル知識点間の関連関係を確定し、前記マルチモーダル知識点と予め設定された意味理解方法に従って、前記マルチモーダルコンテンツの基本的な意味理解結果を確定し、前記マルチモーダル知識点間の関連関係、前記基本的な意味理解結果及び前記マルチモーダル知識グラフに従って、前記マルチモーダルコンテンツの意味理解結果を確定するために使用されることを特徴とする請求項6に記載の装置。
- 前記基本的な意味理解結果は、第1の意味理解結果及び/又は第2の意味理解結果を含み、
前記第1の意味理解結果は、前記マルチモーダル知識点と予め設定された深度学習方法に従って、前記マルチモーダルコンテンツに対して意味理解を行うことによって得られ、
前記第2の意味理解結果は、予め設定された融合方法に従って前記マルチモーダル知識点に対応する複数のシングルモーダル意味理解結果に対して融合を行うことによって得られることを特徴とする請求項7に記載の装置。 - 前記処理モジュールはさらに、マルチモーダルデータセットを取得し、前記マルチモーダルデータセットが、複数のマルチモーダルコンテンツサンプルを含み、前記マルチモーダルデータセットに対して処理を行い、前記マルチモーダル知識グラフの本体を確定し、前記マルチモーダルデータセットにおける各マルチモーダルコンテンツサンプルのマルチモーダル知識点サンプルを発掘し、知識グラフ表現学習によって、前記マルチモーダル知識点サンプル間の関連関係を確立し、及び前記マルチモーダル知識点サンプル間の関連関係と前記マルチモーダル知識グラフの本体に基づいて、前記マルチモーダル知識グラフを確立するために使用されることを特徴とする請求項6~請求項8のいずれか1項に記載の装置。
- 出力モジュールをさらに含み、
前記出力モジュールは、知識グラフの意味表現方法に基づいて、前記マルチモーダルコンテンツの意味理解結果を出力するために使用されることを特徴とする請求項6~請求項8のいずれか1項に記載の装置。 - 少なくとも1つのプロセッサ、及び
前記少なくとも1つのプロセッサと通信接続されるメモリを含み、
前記メモリには前記少なくとも1つのプロセッサによって実行可能な命令が記憶され、前記命令が前記少なくとも1つのプロセッサによって実行されることにより、前記少なくとも1つのプロセッサが請求項1~請求項5のいずれか1項に記載の方法を実行することを特徴とする電子機器。 - コンピュータ命令を記憶する非一時的なコンピュータ可読記憶媒体であって、前記コンピュータ命令が、コンピュータに請求項1~請求項5のいずれか1項に記載の方法を実行させるために使用されることを特徴とするコンピュータ可読記憶媒体。
- プロセッサで実行されると、請求項1~請求項5のいずれか1項に記載の方法が実現されることを特徴とするコンピュータプログラム。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010044247.9A CN111221984B (zh) | 2020-01-15 | 2020-01-15 | 多模态内容处理方法、装置、设备及存储介质 |
CN202010044247.9 | 2020-01-15 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021082308A JP2021082308A (ja) | 2021-05-27 |
JP7225273B2 true JP7225273B2 (ja) | 2023-02-20 |
Family
ID=70831856
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021004519A Active JP7225273B2 (ja) | 2020-01-15 | 2021-01-14 | マルチモーダルコンテンツ処理方法、装置、機器及び記憶媒体 |
Country Status (5)
Country | Link |
---|---|
US (1) | US20210192142A1 (ja) |
EP (1) | EP3812926A1 (ja) |
JP (1) | JP7225273B2 (ja) |
KR (1) | KR102532152B1 (ja) |
CN (1) | CN111221984B (ja) |
Families Citing this family (39)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11528248B2 (en) * | 2020-06-10 | 2022-12-13 | Bank Of America Corporation | System for intelligent multi-modal classification in a distributed technical environment |
US20220019742A1 (en) * | 2020-07-20 | 2022-01-20 | International Business Machines Corporation | Situational awareness by fusing multi-modal data with semantic model |
CN112201228A (zh) * | 2020-09-28 | 2021-01-08 | 苏州贝果智能科技有限公司 | 一种基于人工智能的多模态语义识别服务接入方法 |
CN113849575B (zh) * | 2020-12-10 | 2022-08-09 | 阿里巴巴集团控股有限公司 | 数据处理方法、装置和系统 |
CN112465144B (zh) * | 2020-12-11 | 2023-07-28 | 北京航空航天大学 | 基于有限知识的多模态示范意图生成方法及装置 |
CN112668489A (zh) * | 2020-12-30 | 2021-04-16 | 深圳英飞拓科技股份有限公司 | 一种基于人体部位关节点检测有限空间内人员行为的方法及系统 |
CN112732969A (zh) * | 2021-01-14 | 2021-04-30 | 珠海格力电器股份有限公司 | 图像语义分析方法、装置、存储介质及电子设备 |
JP7486263B2 (ja) | 2021-03-05 | 2024-05-17 | Kddi株式会社 | マルチモーダルな知識グラフを用いて雑談的に対話するプログラム、装置及び方法 |
CN113032538A (zh) * | 2021-03-11 | 2021-06-25 | 五邑大学 | 一种基于知识图谱的话题转移方法、控制器及存储介质 |
CN113127708B (zh) * | 2021-04-20 | 2024-06-07 | 中国科学技术大学 | 信息交互方法、装置、设备及存储介质 |
CN113487024A (zh) * | 2021-06-29 | 2021-10-08 | 任立椋 | 交替序列生成模型训练方法、从文本中抽取图的方法 |
CN113688251B (zh) * | 2021-07-27 | 2024-02-13 | 广东师大维智信息科技有限公司 | 一种室内体育赛事安保领域的知识图谱构建方法与系统 |
CN113779934B (zh) * | 2021-08-13 | 2024-04-26 | 远光软件股份有限公司 | 多模态信息提取方法、装置、设备及计算机可读存储介质 |
CN113722430A (zh) * | 2021-08-23 | 2021-11-30 | 北京工业大学 | 面向食品安全的多模态人机交互方法和系统、设备及介质 |
CN113742586B (zh) * | 2021-08-31 | 2023-10-24 | 华中师范大学 | 一种基于知识图谱嵌入的学习资源推荐方法及系统 |
CN113688220B (zh) * | 2021-09-02 | 2022-05-24 | 国家电网有限公司客户服务中心 | 一种基于语义理解的文本机器人对话方法及系统 |
CN113837910B (zh) * | 2021-09-28 | 2024-04-16 | 科大讯飞股份有限公司 | 试题推荐方法、装置、电子设备和存储介质 |
CN114067796B (zh) * | 2021-11-15 | 2024-07-23 | 四川长虹电器股份有限公司 | 一种自定义语音命令的设计方法 |
CN114255427B (zh) * | 2021-12-21 | 2023-04-18 | 北京百度网讯科技有限公司 | 视频理解方法、装置、设备以及存储介质 |
CN114299194B (zh) * | 2021-12-23 | 2023-06-02 | 北京百度网讯科技有限公司 | 图像生成模型的训练方法、图像生成方法及装置 |
CN114167994B (zh) * | 2022-02-11 | 2022-06-28 | 北京亮亮视野科技有限公司 | 知识库添加方法、装置、设备及介质 |
CN114610911B (zh) * | 2022-03-04 | 2023-09-19 | 中国电子科技集团公司第十研究所 | 多模态知识本征表示学习方法、装置、设备及存储介质 |
CN114399006B (zh) * | 2022-03-24 | 2022-07-12 | 山东省计算中心(国家超级计算济南中心) | 基于超算的多源异构图数据融合方法及系统 |
CN114580425B (zh) * | 2022-05-06 | 2022-09-09 | 阿里巴巴(中国)有限公司 | 命名实体识别的方法和装置,以及电子设备和存储介质 |
CN115130435B (zh) * | 2022-06-27 | 2023-08-11 | 北京百度网讯科技有限公司 | 文档处理方法、装置、电子设备和存储介质 |
TWI811026B (zh) * | 2022-07-15 | 2023-08-01 | 葉德源 | 自主數位學習評量系統及方法 |
CN115422399B (zh) * | 2022-07-21 | 2023-10-31 | 中国科学院自动化研究所 | 视频搜索方法、装置、设备和存储介质 |
CN114925176B (zh) * | 2022-07-22 | 2022-10-11 | 北京融信数联科技有限公司 | 一种智能体多模态认知图谱的构建方法、系统和介质 |
JP2024031042A (ja) * | 2022-08-25 | 2024-03-07 | ユニ・チャーム株式会社 | 情報処理装置、情報処理方法及び情報処理プログラム |
WO2024076156A1 (ko) * | 2022-10-07 | 2024-04-11 | 삼성전자주식회사 | 멀티미디어 콘텐트 내에서 텍스트와 결합된 이미지를 식별하기 위한 전자 장치 및 그 방법 |
CN115658935B (zh) * | 2022-12-06 | 2023-05-02 | 北京红棉小冰科技有限公司 | 一种个性化评论生成方法及装置 |
CN115860436B (zh) * | 2023-02-21 | 2023-05-26 | 齐鲁工业大学(山东省科学院) | 一种基于知识图谱的城市热线派单方法及系统 |
CN117150031A (zh) * | 2023-07-24 | 2023-12-01 | 青海师范大学 | 一种面向多模态数据的处理方法及系统 |
CN117009550B (zh) * | 2023-08-09 | 2024-04-19 | 中国船舶集团有限公司第七〇九研究所 | 一种海上多源冲突条件下多模态时空本体构建方法 |
CN116934754B (zh) * | 2023-09-18 | 2023-12-01 | 四川大学华西第二医院 | 基于图神经网络的肝脏影像识别方法及装置 |
CN117540102B (zh) * | 2023-12-04 | 2024-07-09 | 中国科学院地理科学与资源研究所 | 一种基于知识图谱和多模态数据的生态文明模式推荐方法 |
CN117831056A (zh) * | 2023-12-29 | 2024-04-05 | 广电运通集团股份有限公司 | 票据信息提取方法、装置及票据信息提取系统 |
CN117633328B (zh) * | 2024-01-25 | 2024-04-12 | 武汉博特智能科技有限公司 | 基于数据挖掘的新媒体内容监测方法及系统 |
CN118133845B (zh) * | 2024-05-08 | 2024-07-16 | 中国人民解放军国防科技大学 | 一种多通道语义理解的融合方法、装置、设备及存储介质 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20020107827A1 (en) | 2000-11-06 | 2002-08-08 | International Business Machines Corporation | Multimedia network for knowledge representation |
JP2002288178A (ja) | 2001-03-23 | 2002-10-04 | Toshiba Corp | マルチメディア情報収集管理装置およびプログラム |
JP2004505378A (ja) | 2000-07-28 | 2004-02-19 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | マルチメディア・セグメンテーション及びインデキシングのためのコンテキスト及びコンテンツに基づく情報処理 |
JP2008123486A (ja) | 2006-11-10 | 2008-05-29 | Fuji Xerox Co Ltd | デジタルメディアで1つまたは複数の概念を検出する方法、システム及びプログラム |
US20160179945A1 (en) | 2014-12-19 | 2016-06-23 | Universidad Nacional De Educación A Distancia (Uned) | System and method for the indexing and retrieval of semantically annotated data using an ontology-based information retrieval model |
US20180189570A1 (en) | 2016-12-30 | 2018-07-05 | Facebook, Inc. | Video Understanding Platform |
JP2019074843A (ja) | 2017-10-13 | 2019-05-16 | ヤフー株式会社 | 情報提供装置、情報提供方法、およびプログラム |
Family Cites Families (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2948159B2 (ja) * | 1996-12-06 | 1999-09-13 | 株式会社日立製作所 | データベース装置 |
US8358856B2 (en) * | 2008-06-02 | 2013-01-22 | Eastman Kodak Company | Semantic event detection for digital content records |
JP4969554B2 (ja) | 2008-11-14 | 2012-07-04 | ヤフー株式会社 | トピックグラフを利用したドキュメント検索サーバ及び方法 |
EP2579609A1 (en) * | 2011-10-06 | 2013-04-10 | Thomson Licensing | Method and apparatus for providing information for a multimedia content item |
US11397462B2 (en) * | 2012-09-28 | 2022-07-26 | Sri International | Real-time human-machine collaboration using big data driven augmented reality technologies |
CN105550190B (zh) * | 2015-06-26 | 2019-03-29 | 许昌学院 | 面向知识图谱的跨媒体检索系统 |
US11023523B2 (en) * | 2015-10-23 | 2021-06-01 | Carnegie Mellon University | Video content retrieval system |
CN106326440B (zh) * | 2016-08-26 | 2019-11-29 | 北京光年无限科技有限公司 | 一种面向智能机器人的人机交互方法及装置 |
CN107273477A (zh) * | 2017-06-09 | 2017-10-20 | 北京光年无限科技有限公司 | 一种用于机器人的人机交互方法及装置 |
CN107766571B (zh) * | 2017-11-08 | 2021-02-09 | 北京大学 | 一种多媒体资源的检索方法和装置 |
US11010436B1 (en) * | 2018-04-20 | 2021-05-18 | Facebook, Inc. | Engaging users by personalized composing-content recommendation |
CN109033277A (zh) * | 2018-07-10 | 2018-12-18 | 广州极天信息技术股份有限公司 | 基于机器学习的类脑系统、方法、设备及存储介质 |
WO2020023590A1 (en) * | 2018-07-24 | 2020-01-30 | Newton Howard | Intelligent reasoning framework for user intent extraction |
CN109697233B (zh) * | 2018-12-03 | 2023-06-20 | 中电科大数据研究院有限公司 | 一种知识图谱体系搭建方法 |
CN110647662B (zh) * | 2019-08-03 | 2022-10-14 | 电子科技大学 | 一种基于语义的多模态时空数据关联方法 |
CN110472107B (zh) * | 2019-08-22 | 2024-01-30 | 腾讯科技(深圳)有限公司 | 多模态知识图谱构建方法、装置、服务器以及存储介质 |
CN110516160B (zh) * | 2019-08-30 | 2022-04-01 | 中国科学院自动化研究所 | 基于知识图谱的用户建模方法、序列推荐方法 |
CN110597992B (zh) * | 2019-09-10 | 2023-08-29 | 腾讯科技(深圳)有限公司 | 基于知识图谱的语义推理方法及装置、电子设备 |
-
2020
- 2020-01-15 CN CN202010044247.9A patent/CN111221984B/zh active Active
- 2020-09-17 EP EP20196650.4A patent/EP3812926A1/en not_active Ceased
- 2020-09-18 US US17/024,756 patent/US20210192142A1/en not_active Abandoned
-
2021
- 2021-01-14 JP JP2021004519A patent/JP7225273B2/ja active Active
- 2021-01-15 KR KR1020210005681A patent/KR102532152B1/ko active IP Right Grant
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004505378A (ja) | 2000-07-28 | 2004-02-19 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | マルチメディア・セグメンテーション及びインデキシングのためのコンテキスト及びコンテンツに基づく情報処理 |
US20020107827A1 (en) | 2000-11-06 | 2002-08-08 | International Business Machines Corporation | Multimedia network for knowledge representation |
JP2002288178A (ja) | 2001-03-23 | 2002-10-04 | Toshiba Corp | マルチメディア情報収集管理装置およびプログラム |
JP2008123486A (ja) | 2006-11-10 | 2008-05-29 | Fuji Xerox Co Ltd | デジタルメディアで1つまたは複数の概念を検出する方法、システム及びプログラム |
US20160179945A1 (en) | 2014-12-19 | 2016-06-23 | Universidad Nacional De Educación A Distancia (Uned) | System and method for the indexing and retrieval of semantically annotated data using an ontology-based information retrieval model |
US20180189570A1 (en) | 2016-12-30 | 2018-07-05 | Facebook, Inc. | Video Understanding Platform |
JP2019074843A (ja) | 2017-10-13 | 2019-05-16 | ヤフー株式会社 | 情報提供装置、情報提供方法、およびプログラム |
Non-Patent Citations (2)
Title |
---|
Kesorn Kraisak et al.,Enhansed Sports Image Annotation and Retrieval Based upon Semantic Analysis of Multimodal Cues,3rd Pacific Rim Symposium on Image and Video Technology,vol.5414,[online],2009年01月13日,pp.817-828,[令和3年10月27日検索], インターネット<URL:https://link.springer.com/content/pdf/10.1007/978-3-540-92957-4_71.pdf> |
入部 百合絵、外1名,分散型VODにおけるSemanticWebの提案及び同期型表示インタフェースの構築,電子情報通信学会技術研究報告,日本,社団法人電子情報通信学会,2001年07月12日,第101巻,第203号,p.67-72 |
Also Published As
Publication number | Publication date |
---|---|
JP2021082308A (ja) | 2021-05-27 |
US20210192142A1 (en) | 2021-06-24 |
EP3812926A1 (en) | 2021-04-28 |
CN111221984A (zh) | 2020-06-02 |
KR20210037619A (ko) | 2021-04-06 |
KR102532152B1 (ko) | 2023-05-12 |
CN111221984B (zh) | 2024-03-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7225273B2 (ja) | マルチモーダルコンテンツ処理方法、装置、機器及び記憶媒体 | |
US20210397947A1 (en) | Method and apparatus for generating model for representing heterogeneous graph node | |
CN112507715B (zh) | 确定实体之间关联关系的方法、装置、设备和存储介质 | |
US20210390428A1 (en) | Method, apparatus, device and storage medium for training model | |
US11847164B2 (en) | Method, electronic device and storage medium for generating information | |
JP7194150B2 (ja) | ドキュメントのベクトル化表現方法、ドキュメントのベクトル化表現装置及びコンピュータ機器 | |
US10474962B2 (en) | Semantic entity relation detection classifier training | |
KR102451496B1 (ko) | 텍스트 주제 생성 방법, 장치 및 전자기기 | |
CN111967256B (zh) | 事件关系的生成方法、装置、电子设备和存储介质 | |
JP7386827B2 (ja) | セマンティック処理方法、装置、電子機器及び媒体 | |
KR20210040316A (ko) | 사용자 상호작용 정보 처리모델 생성방법, 사용자 상호작용 정보 처리방법 및 프로그램 | |
US12032906B2 (en) | Method, apparatus and device for quality control and storage medium | |
US20210216722A1 (en) | Method and apparatus for processing sematic description of text entity, and storage medium | |
KR102475235B1 (ko) | 리소스 정렬 방법, 정렬 모델을 트레이닝하는 방법 및 대응하는 장치 | |
JP7091430B2 (ja) | インタラクション情報推薦方法及び装置 | |
JP2022050379A (ja) | 意味検索方法、装置、電子機器、記憶媒体およびコンピュータプログラム | |
JP2021111334A (ja) | 検索データに基づくヒューマンコンピュータ対話型インタラクションの方法、装置及び電子機器 | |
JP7192192B2 (ja) | 語義類似度モデルの訓練方法、装置、電子デバイス及び記憶媒体 | |
CN111858880B (zh) | 获取查询结果的方法、装置、电子设备和可读存储介质 | |
CN112329429B (zh) | 文本相似度学习方法、装置、设备以及存储介质 | |
CN117391067A (zh) | 内容质检方法、装置、设备以及存储介质 | |
US11922144B1 (en) | Schema-based integration of external APIs with natural language applications | |
WO2024196429A1 (en) | Schema-based integration of external apis with natural language applications |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210114 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20210917 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20211102 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220128 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220628 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220916 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230110 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230208 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7225273 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |