JP7417679B2 - 情報抽出方法、装置、電子機器及び記憶媒体 - Google Patents
情報抽出方法、装置、電子機器及び記憶媒体 Download PDFInfo
- Publication number
- JP7417679B2 JP7417679B2 JP2022136486A JP2022136486A JP7417679B2 JP 7417679 B2 JP7417679 B2 JP 7417679B2 JP 2022136486 A JP2022136486 A JP 2022136486A JP 2022136486 A JP2022136486 A JP 2022136486A JP 7417679 B2 JP7417679 B2 JP 7417679B2
- Authority
- JP
- Japan
- Prior art keywords
- text
- entity
- image
- mention
- candidate
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000605 extraction Methods 0.000 title claims description 73
- 239000011159 matrix material Substances 0.000 claims description 115
- 239000006185 dispersion Substances 0.000 claims description 31
- 238000000034 method Methods 0.000 claims description 26
- 239000013598 vector Substances 0.000 claims description 15
- 238000012546 transfer Methods 0.000 claims description 14
- 238000013528 artificial neural network Methods 0.000 claims description 13
- 238000004364 calculation method Methods 0.000 claims description 13
- 238000004590 computer program Methods 0.000 claims description 10
- 239000002356 single layer Substances 0.000 claims description 6
- 230000032258 transport Effects 0.000 description 61
- 230000006870 function Effects 0.000 description 17
- 238000009826 distribution Methods 0.000 description 12
- 238000012545 processing Methods 0.000 description 12
- 238000004422 calculation algorithm Methods 0.000 description 9
- 238000004891 communication Methods 0.000 description 9
- 239000010410 layer Substances 0.000 description 9
- 238000010586 diagram Methods 0.000 description 8
- 230000008569 process Effects 0.000 description 7
- 238000013473 artificial intelligence Methods 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 6
- 238000011160 research Methods 0.000 description 5
- 238000013507 mapping Methods 0.000 description 4
- 238000003058 natural language processing Methods 0.000 description 4
- 238000013135 deep learning Methods 0.000 description 3
- 230000003993 interaction Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 238000012549 training Methods 0.000 description 3
- 238000012800 visualization Methods 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 101000822695 Clostridium perfringens (strain 13 / Type A) Small, acid-soluble spore protein C1 Proteins 0.000 description 1
- 101000655262 Clostridium perfringens (strain 13 / Type A) Small, acid-soluble spore protein C2 Proteins 0.000 description 1
- 101000655256 Paraclostridium bifermentans Small, acid-soluble spore protein alpha Proteins 0.000 description 1
- 101000655264 Paraclostridium bifermentans Small, acid-soluble spore protein beta Proteins 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 239000000969 carrier Substances 0.000 description 1
- 238000010225 co-occurrence analysis Methods 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 238000011176 pooling Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/55—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/583—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/16—Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
- G06F40/295—Named entity recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/74—Image or video pattern matching; Proximity measures in feature spaces
- G06V10/761—Proximity, similarity or dissimilarity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/80—Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Evolutionary Computation (AREA)
- Computing Systems (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- Medical Informatics (AREA)
- Multimedia (AREA)
- Mathematical Physics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computational Mathematics (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Pure & Applied Mathematics (AREA)
- Library & Information Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Algebra (AREA)
- Animal Behavior & Ethology (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Signal Processing For Digital Recording And Reproducing (AREA)
Description
Claims (21)
- 情報抽出装置によって実行される情報抽出方法であって、
テキストと画像が含まれる情報ストリームを取得するステップと、
前記テキストに基づいてテキストエンティティメンションの埋め込み表現、並びに前記テキストエンティティメンションと候補テキストエンティティとのテキスト類似度マトリクスを生成するステップと、
前記画像に基づいて画像エンティティメンションの埋め込み表現、並びに前記画像エンティティメンションと候補画像エンティティとの画像類似度マトリクスを生成するステップと、
前記テキストエンティティメンションの埋め込み表現、前記画像エンティティメンションの埋め込み表現、前記テキスト類似度マトリクス及び前記画像類似度マトリクスをもとに、最適輸送に基づいて前記テキストエンティティメンションに対応するターゲットテキストエンティティ、及び前記画像エンティティメンションに対応するターゲット画像エンティティを決定するステップと、
を含む情報抽出方法。 - 前記テキストに基づいてテキストエンティティメンションの埋め込み表現、並びに前記テキストエンティティメンションと候補テキストエンティティとのテキスト類似度マトリクスを生成するステップが、
前記テキストに基づいて前記テキストエンティティメンションと前記候補テキストエンティティを決定するステップと、
前記テキストエンティティメンションに基づいて前記テキストエンティティメンションの埋め込み表現を生成するステップと、
前記候補テキストエンティティに基づいて前記候補テキストエンティティの埋め込み表現を生成するステップと、
前記テキストエンティティメンションの埋め込み表現と前記候補テキストエンティティの埋め込み表現に基づいて計算して前記テキスト類似度マトリクスを得るステップと、
を含む請求項1に記載の情報抽出方法。 - 前記テキストに基づいて前記テキストエンティティメンションと前記候補テキストエンティティを決定するステップが、
前記テキストに基づいて前記テキストエンティティメンションを決定するステップと、
前記テキストエンティティメンションとリダイレクトリンク数の統計に基づいて、リダイレクトリンク数の最も多いn個のテキストエンティティを初歩的な候補テキストエンティティとして決定するステップと、
前記初歩的な候補テキストエンティティのうちリダイレクトリンク数の最も多いm個のテキストエンティティを前記候補テキストエンティティとして決定するステップと、
前記テキストエンティティメンションと前記初歩的な候補テキストエンティティとの類似度を計算し、類似度の最も高いp個のテキストエンティティを前記候補テキストエンティティとして決定するステップと、
を含む請求項2に記載の情報抽出方法。 - 前記テキストエンティティメンションの埋め込み表現と前記候補テキストエンティティの埋め込み表現に基づいて計算して前記テキスト類似度マトリクスを得るステップが、
前記テキストエンティティメンションの埋め込み表現と前記候補テキストエンティティの埋め込み表現をテキスト類似度モデルに入力し、前記テキスト類似度マトリクスを得るステップであって、前記テキストエンティティメンションの埋め込み表現と前記候補テキストエンティティの埋め込み表現が、前記テキスト類似度モデルにおける単層ニューラルネットワークを通過した後に潜在関係ベクトルで乗算されて前記テキストエンティティメンションと前記候補テキストエンティティとの関連スコアを得て、同じ種類の潜在関係の前記関連スコアを正規化し、前記テキスト類似度マトリクスを得るステップを含む請求項2に記載の情報抽出方法。 - 前記画像に基づいて画像エンティティメンションの埋め込み表現、並びに前記画像エンティティメンションと候補画像エンティティとの画像類似度マトリクスを生成するステップが、
前記画像を画像符号化モデルに入力し、前記画像エンティティメンションの埋め込み表現を得るステップと、
前記候補画像エンティティを前記画像符号化モデルに入力し、前記候補画像エンティティの埋め込み表現を得るステップと、
前記画像エンティティメンションの埋め込み表現と前記候補画像エンティティの埋め込み表現に基づいて、前記画像エンティティメンションと前記候補画像エンティティのコサイン類似度を計算し、前記画像類似度マトリクスを得るステップと、
を含む請求項1に記載の情報抽出方法。 - 前記画像符号化モデルが、transformerモデルにおけるエンコーダモジュールである請求項5に記載の情報抽出方法。
- 前記テキストエンティティメンションの埋め込み表現、前記画像エンティティメンションの埋め込み表現、前記テキスト類似度マトリクス及び前記画像類似度マトリクスをもとに、最適輸送に基づいて前記テキストエンティティメンションに対応するターゲットテキストエンティティ、及び前記画像エンティティメンションに対応するターゲット画像エンティティを決定するステップが、
前記テキストエンティティメンションの埋め込み表現と前記画像エンティティメンションの埋め込み表現をもとに、前記最適輸送に基づいて、トランスポートコストの最も低い前記テキストエンティティメンションとトランスポートコストの最も低い前記画像エンティティメンションを決定するステップと、
前記トランスポートコストの最も低い前記テキストエンティティメンションと前記画像類似度マトリクスに基づいて前記ターゲットテキストエンティティを決定するステップと、
前記トランスポートコストの最も低い前記画像エンティティメンションと前記テキスト類似度マトリクスに基づいて前記ターゲット画像エンティティを決定するステップと、
を含む請求項1に記載の情報抽出方法。 - 前記テキストエンティティメンションの埋め込み表現と前記画像エンティティメンションの埋め込み表現をもとに、前記最適輸送に基づいて、トランスポートコストの最も低い前記テキストエンティティメンションとトランスポートコストの最も低い前記画像エンティティメンションを決定するステップが、
任意の2つの前記テキストエンティティメンションの埋め込み表現に基づいて任意の2つの前記テキストエンティティメンション間のテキスト統計分散度を計算するステップと、
任意の2つの前記画像エンティティメンションの埋め込み表現に基づいて任意の2つの前記画像エンティティメンション間の画像統計分散度を計算するステップと、
前記テキスト統計分散度と前記画像統計分散度に基づいてトランスポートコストの最も低い場合のトランスポート転送マトリクスを決定するステップと、
前記トランスポートコストの最も低い場合のトランスポート転送マトリクスに基づいて前記トランスポートコストの最も低い前記テキストエンティティメンションと前記トランスポートコストの最も低い前記画像エンティティメンションを決定するステップと、
を含む請求項7に記載の情報抽出方法。 - 前記テキスト統計分散度および/または前記画像統計分散度が、グロモフ-ワッサースタイン距離である請求項8に記載の情報抽出方法。
- テキストと画像が含まれる情報ストリームを取得する取得モジュールと、
前記テキストに基づいてテキストエンティティメンションの埋め込み表現、並びに前記テキストエンティティメンションと候補テキストエンティティとのテキスト類似度マトリクスを生成する第1の生成モジュールと、
前記画像に基づいて画像エンティティメンションの埋め込み表現、並びに前記画像エンティティメンションと候補画像エンティティとの画像類似度マトリクスを生成する第2の生成モジュールと、
前記テキストエンティティメンションの埋め込み表現、前記画像エンティティメンションの埋め込み表現、前記テキスト類似度マトリクス及び前記画像類似度マトリクスをもとに、最適輸送に基づいて前記テキストエンティティメンションに対応するターゲットテキストエンティティ、及び前記画像エンティティメンションに対応するターゲット画像エンティティを決定する決定モジュールと、
を備える情報抽出装置。 - 前記第1の生成モジュールが、
前記テキストに基づいて前記テキストエンティティメンションと前記候補テキストエンティティを決定する第1の決定ユニットと、
前記テキストエンティティメンションに基づいて前記テキストエンティティメンションの埋め込み表現を生成する第1の生成ユニットと、
前記候補テキストエンティティに基づいて前記候補テキストエンティティの埋め込み表現を生成する第2の生成ユニットと、
前記テキストエンティティメンションの埋め込み表現と前記候補テキストエンティティの埋め込み表現に基づいて計算して前記テキスト類似度マトリクスを得る第1の計算ユニットと、
を備える請求項10に記載の情報抽出装置。 - 前記第1の決定ユニットが、
前記テキストに基づいて前記テキストエンティティメンションを決定する第1の決定サブユニットと、
前記テキストエンティティメンションとリダイレクトリンク数の統計に基づいて、リダイレクトリンク数の最も多いn個のテキストエンティティを初歩的な候補テキストエンティティとして決定する第2の決定サブユニットと、
前記初歩的な候補テキストエンティティのうちリダイレクトリンク数の最も多いm個のテキストエンティティを前記候補テキストエンティティとして決定する第3の決定サブユニットと、
前記テキストエンティティメンションと前記初歩的な候補テキストエンティティとの類似度を計算し、類似度の最も高いp個のテキストエンティティを前記候補テキストエンティティとして決定する第4の決定サブユニットと、
を備える請求項11に記載の情報抽出装置。 - 前記第1の計算ユニットが、
前記テキストエンティティメンションの埋め込み表現と前記候補テキストエンティティの埋め込み表現をテキスト類似度モデルに入力し、前記テキスト類似度マトリクスを得る入力サブユニットであって、前記テキストエンティティメンションの埋め込み表現と前記候補テキストエンティティの埋め込み表現が、前記テキスト類似度モデルにおける単層ニューラルネットワークを通過した後に潜在関係ベクトルで乗算されて前記テキストエンティティメンションと前記候補テキストエンティティとの関連スコアを得て、同じ種類の潜在関係の前記関連スコアを正規化し、前記テキスト類似度マトリクスを得る入力サブユニットを備える請求項11に記載の情報抽出装置。 - 前記第2の生成モジュールが、
前記画像を画像符号化モデルに入力し、前記画像エンティティメンションの埋め込み表現を得る第1の入力ユニットと、
前記候補画像エンティティを前記画像符号化モデルに入力し、前記候補画像エンティティの埋め込み表現を得る第2の入力ユニットと、
前記画像エンティティメンションの埋め込み表現と前記候補画像エンティティの埋め込み表現に基づいて、前記画像エンティティメンションと前記候補画像エンティティのコサイン類似度を計算し、前記画像類似度マトリクスを得る第2の計算ユニットと、
を含む請求項10に記載の情報抽出装置。 - 前記画像符号化モデルが、transformerモデルにおけるエンコーダモジュールである請求項14に記載の情報抽出装置。
- 前記決定モジュールが、
前記テキストエンティティメンションの埋め込み表現と前記画像エンティティメンションの埋め込み表現をもとに、前記最適輸送に基づいて、トランスポートコストの最も低い前記テキストエンティティメンションとトランスポートコストの最も低い前記画像エンティティメンションを決定する第2の決定ユニットと、
前記トランスポートコストの最も低い前記テキストエンティティメンションと前記画像類似度マトリクスに基づいて前記ターゲットテキストエンティティを決定する第3の決定ユニットと、
前記トランスポートコストの最も低い前記画像エンティティメンションと前記テキスト類似度マトリクスに基づいて前記ターゲット画像エンティティを決定する第4の決定ユニットと、
を備える請求項10に記載の情報抽出装置。 - 前記第2の決定ユニットが、
任意の2つの前記テキストエンティティメンションの埋め込み表現に基づいて任意の2つの前記テキストエンティティメンション間のテキスト統計分散度を計算する第1の計算サブユニットと、
任意の2つの前記画像エンティティメンションの埋め込み表現に基づいて任意の2つの前記画像エンティティメンション間の画像統計分散度を計算する第2の計算サブユニットと、
前記テキスト統計分散度と前記画像統計分散度に基づいてトランスポートコストの最も低い場合のトランスポート転送マトリクスを決定する第5の決定サブユニットと、
前記トランスポートコストの最も低い場合のトランスポート転送マトリクスに基づいて前記トランスポートコストの最も低い前記テキストエンティティメンションと前記トランスポートコストの最も低い前記画像エンティティメンションを決定する第6の決定サブユニットと、
を備える請求項16に記載の情報抽出装置。 - 前記テキスト統計分散度および/または前記画像統計分散度が、グロモフ-ワッサースタイン距離である請求項17に記載の情報抽出装置。
- 少なくとも1つのプロセッサと、
該少なくとも1つのプロセッサと通信可能に接続されるメモリと、
を備え、
前記メモリには、前記少なくとも1つのプロセッサによって実行可能な命令が記憶され、前記命令が、前記少なくとも1つのプロセッサが請求項1から9のいずれか一項に記載の方法を実行できるように、前記少なくとも1つのプロセッサによって実行される電子機器。 - コンピュータ命令が記憶されている非一時的なコンピュータ読み取り可能な記憶媒体であって、
前記コンピュータ命令が、コンピュータに請求項1から9のいずれか一項に記載の方法を実行させる非一時的なコンピュータ読み取り可能な記憶媒体。 - プロセッサによって実行される場合、請求項1から9のいずれか一項に記載の方法のステップを実現するコンピュータプログラム。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111006586.9 | 2021-08-30 | ||
CN202111006586.9A CN113806552B (zh) | 2021-08-30 | 2021-08-30 | 信息提取方法、装置、电子设备和存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2022169743A JP2022169743A (ja) | 2022-11-09 |
JP7417679B2 true JP7417679B2 (ja) | 2024-01-18 |
Family
ID=78894381
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022136486A Active JP7417679B2 (ja) | 2021-08-30 | 2022-08-30 | 情報抽出方法、装置、電子機器及び記憶媒体 |
Country Status (5)
Country | Link |
---|---|
US (1) | US20220406034A1 (ja) |
EP (1) | EP4131024A1 (ja) |
JP (1) | JP7417679B2 (ja) |
KR (1) | KR20220124120A (ja) |
CN (1) | CN113806552B (ja) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115878760B (zh) * | 2023-02-10 | 2023-05-23 | 北京知呱呱科技服务有限公司 | 一种基于图匹配的跨语种专利检索方法及系统 |
CN116167434B (zh) * | 2023-04-24 | 2023-07-04 | 清华大学 | 一种弱监督视觉语言预训练模型的训练方法和装置 |
CN116665228B (zh) * | 2023-07-31 | 2023-10-13 | 恒生电子股份有限公司 | 图像处理方法及装置 |
CN117094394B (zh) * | 2023-10-16 | 2024-01-30 | 之江实验室 | 基于论文pdf的天文多模态知识图谱构建方法和系统 |
CN117435714B (zh) * | 2023-12-20 | 2024-03-08 | 湖南紫薇垣信息系统有限公司 | 一种基于知识图谱的数据库和中间件问题智能诊断系统 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010152884A (ja) | 2008-12-02 | 2010-07-08 | Intel Corp | 画像認識アルゴリズム、それを用いて目標画像を識別する方法、および、携帯用電子装置へ送信するデータを選択する方法 |
US20130218858A1 (en) | 2012-02-16 | 2013-08-22 | Dmitri Perelman | Automatic face annotation of images contained in media content |
US20190220749A1 (en) | 2018-01-17 | 2019-07-18 | Beijing Baidu Netcom Science And Technology Co., Ltd. | Text processing method and device based on ambiguous entity words |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6727097B2 (ja) * | 2016-10-24 | 2020-07-22 | ヤフー株式会社 | 情報処理装置、情報処理方法、およびプログラム |
US11727243B2 (en) * | 2019-01-30 | 2023-08-15 | Baidu Usa Llc | Knowledge-graph-embedding-based question answering |
CN110928961B (zh) * | 2019-11-14 | 2023-04-28 | 出门问问(苏州)信息科技有限公司 | 一种多模态实体链接方法、设备及计算机可读存储介质 |
CN112200317B (zh) * | 2020-09-28 | 2024-05-07 | 西南电子技术研究所(中国电子科技集团公司第十研究所) | 多模态知识图谱构建方法 |
CN112560466B (zh) * | 2020-12-24 | 2023-07-25 | 北京百度网讯科技有限公司 | 链接实体关联方法、装置、电子设备和存储介质 |
-
2021
- 2021-08-30 CN CN202111006586.9A patent/CN113806552B/zh active Active
-
2022
- 2022-08-23 KR KR1020220105258A patent/KR20220124120A/ko unknown
- 2022-08-24 EP EP22191894.9A patent/EP4131024A1/en not_active Withdrawn
- 2022-08-29 US US17/822,898 patent/US20220406034A1/en active Pending
- 2022-08-30 JP JP2022136486A patent/JP7417679B2/ja active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010152884A (ja) | 2008-12-02 | 2010-07-08 | Intel Corp | 画像認識アルゴリズム、それを用いて目標画像を識別する方法、および、携帯用電子装置へ送信するデータを選択する方法 |
US20130218858A1 (en) | 2012-02-16 | 2013-08-22 | Dmitri Perelman | Automatic face annotation of images contained in media content |
US20190220749A1 (en) | 2018-01-17 | 2019-07-18 | Beijing Baidu Netcom Science And Technology Co., Ltd. | Text processing method and device based on ambiguous entity words |
Also Published As
Publication number | Publication date |
---|---|
JP2022169743A (ja) | 2022-11-09 |
CN113806552A (zh) | 2021-12-17 |
US20220406034A1 (en) | 2022-12-22 |
EP4131024A1 (en) | 2023-02-08 |
KR20220124120A (ko) | 2022-09-13 |
CN113806552B (zh) | 2022-06-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7417679B2 (ja) | 情報抽出方法、装置、電子機器及び記憶媒体 | |
CN111259127B (zh) | 一种基于迁移学习句向量的长文本答案选择方法 | |
CN111753060A (zh) | 信息检索方法、装置、设备及计算机可读存储介质 | |
CN110795527B (zh) | 候选实体排序方法、训练方法及相关装置 | |
CN111930894B (zh) | 长文本匹配方法及装置、存储介质、电子设备 | |
CN113127624B (zh) | 问答模型的训练方法及装置 | |
CN110990555B (zh) | 端到端检索式对话方法与系统及计算机设备 | |
CN116775847A (zh) | 一种基于知识图谱和大语言模型的问答方法和系统 | |
CN109740158B (zh) | 一种文本语义解析方法及装置 | |
WO2019154411A1 (zh) | 词向量更新方法和装置 | |
CN115455171B (zh) | 文本视频的互检索以及模型训练方法、装置、设备及介质 | |
CN118113815B (zh) | 内容搜索方法、相关装置和介质 | |
CN114065769B (zh) | 情感原因对抽取模型的训练方法、装置、设备及介质 | |
WO2022228127A1 (zh) | 要素文本处理方法、装置、电子设备和存储介质 | |
CN114492669B (zh) | 关键词推荐模型训练方法、推荐方法和装置、设备、介质 | |
CN114492661B (zh) | 文本数据分类方法和装置、计算机设备、存储介质 | |
CN116152833A (zh) | 基于图像的表格还原模型的训练方法及表格还原方法 | |
CN111737406A (zh) | 文本检索方法、装置及设备、文本检索模型的训练方法 | |
CN116680575B (zh) | 模型处理方法、装置、设备及存储介质 | |
CN109117471B (zh) | 一种词语相关度的计算方法及终端 | |
CN113761151A (zh) | 同义词挖掘、问答方法、装置、计算机设备和存储介质 | |
CN117290478A (zh) | 一种知识图谱问答方法、装置、设备和存储介质 | |
CN114398903B (zh) | 意图识别方法、装置、电子设备及存储介质 | |
CN112966513B (zh) | 用于实体链接的方法和装置 | |
CN112749251B (zh) | 文本处理方法、装置、计算机设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220830 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20230929 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20231003 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20231215 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20231226 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240105 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7417679 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |