JP7178441B2 - 要約生成方法、装置、プログラム、電子デバイス及び記憶媒体 - Google Patents

要約生成方法、装置、プログラム、電子デバイス及び記憶媒体 Download PDF

Info

Publication number
JP7178441B2
JP7178441B2 JP2021048484A JP2021048484A JP7178441B2 JP 7178441 B2 JP7178441 B2 JP 7178441B2 JP 2021048484 A JP2021048484 A JP 2021048484A JP 2021048484 A JP2021048484 A JP 2021048484A JP 7178441 B2 JP7178441 B2 JP 7178441B2
Authority
JP
Japan
Prior art keywords
node
word
representation
words
text file
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2021048484A
Other languages
English (en)
Other versions
JP2022051666A (ja
Inventor
ウェンハオ ウー
ウェイ リー
シンヤン シャオ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Publication of JP2022051666A publication Critical patent/JP2022051666A/ja
Application granted granted Critical
Publication of JP7178441B2 publication Critical patent/JP7178441B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/34Browsing; Visualisation therefor
    • G06F16/345Summarisation for human users
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/151Transformation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • G06F18/251Fusion techniques of input or preprocessed data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/29Graphical models, e.g. Bayesian networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/126Character encoding
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation

Description

本出願はコンピュータ応用技術に関し、特に自然言語処理、ディープラーニング及び知識グラフ分野における要約生成方法、装置、プログラム、電子デバイス及び記憶媒体に関する。
自動要約技術とは、1つまたは複数のテーマに関連するテキスト(文書)に対して要約を自動的に生成する技術である。情報爆発の現在、自動要約技術は、読者に簡潔で重要な要約情報を提供することにより、読者の読書時間を大幅に節約して情報取得効率等を向上させることができる。
現在一般的に使用されている自動要約方法には、抽出型方法と生成型方法が含まれる。ここで、抽出型方法とは、テキストから複数の重要文を抽出して1つの要約にまとめることである。生成型方法は通常エンドツーエンド生成型アーキテクチャを採用し、まずデコーダを利用してテキスト情報を高次元ベクトルにマッピングし、次にデコーダを利用して高次元ベクトルから復号化して要約を生成する。
しかし、抽出型方法で抽出される文言には語義の一貫性が乏しく、正確度も劣ることが多い。また、生成型方法は人間のようにテキストの語義を真に理解しておらず、生成される要約の正確度も劣る。
これに鑑み、本出願は、要約生成方法、装置、電子デバイス、及び記憶媒体を提供する。
要約を生成する方法であって、処理待ちテキストに対応する知識グラフを取得することであって、前記知識グラフにおけるノードが前記処理待ちテキストの中の語義概念を示し、前記知識グラフにおけるエッジが語義概念間の語義関係を示す、知識グラフを取得することと、前記処理待ちテキストを単語レベルで符号化して各単語の文脈符号化表現を得ることと、各単語の文脈符号化表現に基づいて前記知識グラフにおける各ノードの初期表示をそれぞれ特定することと、各ノードの初期表現および各ノード間の接続関係に基づいて符号化して各ノードのノード表現を得ることと、各ノードのノード表現に基づいて復号化して前記処理待ちテキストの要約を得ることと、を含む。
要約を生成する装置であって、グラフ解析モジュールと、単語符号化モジュールと、統合モジュールと、グラフ符号化モジュールと、グラフ復号化モジュールと、を備え、前記グラフ解析モジュールは、処理待ちテキストに対応する知識グラフを取得し、前記知識グラフにおけるノードが前記処理待ちテキストの中の語義概念を示し、前記知識グラフにおけるエッジが語義概念間の語義関係を示し、前記単語符号化モジュールは、前記処理待ちテキストを単語レベルで符号化して各単語の文脈符号化表現を得、前記統合モジュールは、各単語の文脈符号化表現に基づいて前記知識グラフにおける各ノードの初期表現をそれぞれ特定し、前記グラフ符号化モジュールは、各ノードの初期表現および各ノード間の接続関係に基づいて符号化して各ノードのノード表現を得、前記グラフ復号化モジュールは、各ノードのノード表現に基づいて復号化して前記処理待ちテキストの要約を得る。
電子デバイスであって、少なくとも1つのプロセッサと、前記少なくとも1つのプロセッサと通信接続されたメモリとを備え、前記メモリに前記少なくとも1つのプロセッサにより実行可能なコマンドが記憶されており、前記コマンドが前記少なくとも1つのプロセッサにより実行されると、前記少なくとも1つのプロセッサに前記の方法を実行させる。
非一時的なコンピュータ可読記憶媒体であって、コンピュータに前記の方法を実行させるためのコンピュータコマンドが記憶された。
前記の出願の一実施形態は、以下の利点または有益な効果を有する。即ち、エンドツーエンド生成型アーキテクチャに基づいてテキスト情報を知識グラフ構造情報に変換し、文脈情報の単語レベルにおける符号化を考慮した上で、テキスト中の語義概念および語義概念間の語義関係を明示的にモデル化することにより、テキスト中の重要な情報をより明確かつ正確に理解して絞り込むことができ、生成された要約の語義の一貫性や正確度などを向上させることができる。
理解すべきなのは、この部分で説明される内容は、本開示の実施形態の肝心又は重要な特徴を識別することを意図しておらず、本開示の範囲を制限することを意図していない。本開示の他の特徴は、以下の説明により容易に理解される。
図面は、本出願をより良く理解するためのものであり、本出願を限定しない。
本出願に記載された要約生成方法の実施形態のフローチャートである。 本出願に記載された知識グラフの模式図である。 本出願に記載された要約生成方法の全体的な実施プロセスの模式図である。 本出願に記載された要約生成装置の実施形態40の構造の模式図である。 本出願の実施形態に記載の方法による電子デバイスのブロック図である。
以下、図面に基づいて、本出願の例示的な実施例を説明する。理解を容易にするために、本出願の実施例の様々な詳細が含まれており、それらは単なる例示と見なされるべきである。従って、当業者は、本出願の範囲及び精神から逸脱することなく、本明細書に記載の実施形態に対して様々な変更及び修正を行うことができることを認識するはずである。同様に、簡明のために、以下の説明では、よく知られた機能と構造の説明は省略される。
また、理解すべきなのは、本願中の専門語である「及び/又は」は、関連対象を描画する関連関係に過ぎず、三つの関係がある可能性を示す。例えば、A及び/又はBは、Aだけが存在すること、AとBが同時に存在すること、Bだけが存在する、という三つの状況を示すことができる。また、本願中の文字である“/”は、一般的に、前後の関連対象が「又は」の関係を有すると示す。
図1は、本出願に記載の要約生成方法の実施形態のフローチャートである。図1に示されたように、以下の具体的な実施形態を含む。
ステップ101において、処理待ちテキストに対応する知識グラフを取得し、知識グラフにおけるノードが処理待ちテキストの中の語義概念を示し、知識グラフにおけるエッジが語義概念間の語義関係を示す。
ステップ102において、処理待ちテキストを単語レベルで符号化して各単語の文脈符号化表現を得る。
ステップ103において、各単語の文脈符号化表現に基づいて、知識グラフにおける各ノードの初期表現をそれぞれ特定する。
ステップ104において、各ノードの初期表現および各ノード間の接続関係に基づいて符号化を行って各ノードのノード表現を得る。
ステップ105において、各ノードのノード表現に基づいて復号化を行って処理待ちテキストの要約を得る。
前記の実施形態では、エンドツーエンド生成型アーキテクチャに基づいてテキスト情報を知識グラフ構造情報に変換し、文脈情報の単語レベルにおける符号化を考慮した上で、テキスト中の語義概念および語義概念間の語義関係を明示的にモデル化することにより、テキスト中の重要な情報をより明確かつ正確に理解して絞り込むことができ、生成される要約の語義の一貫性や正確度などを向上させることができる。
処理待ちテキストにはN個のテキストを含んでも良い。Nは正の整数であり、具体的な値は実際の必要に応じて決定することができる。つまり、処理待ちテキストには、1つのテキストだけを含んでも良く、複数のテキストを含んでも良い。複数の場合に、これら複数のテキストは通常にテーマに関連するテキストである。
ステップ101で説明したように、処理待ちテキストに対応する知識グラフを取得することができる。知識グラフにおけるノードは処理待ちテキストの中の語義概念を示し、知識グラフにおけるエッジは語義概念間の語義関係を示す。
テキスト中の語義概念および語義概念間の語義関係は、テキストの理解や要約生成時の情報選択などに重要な役割を果たす。処理待ちテキストについて、グラフ解析器のようなテキスト解析ツールを介して対応する知識グラフを取得し、即ちテキスト構造を、語義構造を有するグラフに変換して表現することができる。構文解析変換に基づく知識グラフは、テキスト中の比較的小さく完全な語義概念をノードとして効率的に抽出し、語義概念間の語義関係をエッジで表現する。語義概念は、分割可能な最小語義単位として理解することもできる。
図2は、本出願に記載の知識グラフの模式図である。 図2に示されたように、処理待ちテキストに、アルベルト・アインシュタイン(Albert Einstein)、ドイツの理論物理学者(a German theoretical physicist)、相対性理論を発表した(published the theory of relativity)、彼はノーベル賞を受賞した(He won the Nobel Prize)、相対性理論は現代物理学の二つの柱の一つである(The theory of relativity is one of the two pillars of modern physics)、この偉大な賞は彼の光電効果の解釈を表彰する(The great Prize was for his explanation of the photoelectric effect)、という内容を含むテキストが含まれていると仮定する。このテキストに対して図2のような知識グラフが得られる。知識グラフは、異なる語句の中の語義概念等を統合することにより、語義関係を導入しつつ、クロスセンテンス関係とニューラルネットワークモデルによるモデル化が困難な長依存関係とを同時に提供する。
ステップ102で説明されたように、処理待ちテキストについて、単語(token)レベルで符号化して各単語の文脈符号化表現(ベクトル表現)を取得しても良い。具体的には、事前訓練モジュールを利用して、処理待ちテキストを単語レベルで符号化して処理待ちテキストの中の各単語の文脈符号化表現を得ることができる。処理待ちテキストを単語レベルで符号化することにより、テキストの文脈依存の語義を保持することができる。
ステップ103で説明されたように、各単語の文脈符号化表現が得られた後、各単語の文脈符号化表現から知識グラフにおける各ノードの初期表現(ベクトル表現)をそれぞれ特定することもできる。
なお、何れか一つのノードに対して、そのノードに対応する統合すべき単語を取得できれば、統合すべき単語の文脈符号化表現からそのノードの初期表現を特定することができ、統合すべき単語の数は1より大きい。さもなければ、そのノードに対応する語義概念の文脈符号化表現をそのノードの初期表現とすることができ、そのノードに対応する語義概念は一つの単語である。
具体的には、対応する語義概念が一つの単語である何れか一つのノードについて、処理待ちテキスト内の少なくとも2つの異なる位置に当該単語が存在すると確定された場合、異なる位置に出現した当該単語をすべて当該ノードに対応する統合すべき単語とすることができる。当該単語と表現方式は異なるが表現の語義は同じである他の単語が存在すると確定すれば、前記他の単語と当該単語をすべて当該ノードに対応する統合すべき単語とすることができる。
同じ単語について、処理待ちテキスト内の異なる位置に出現すると、その文脈符号化表現が異なる場合がある。例えば、あるノードaについて、その対応する語義概念が単語aであり、かつ単語aが処理待ちテキスト内の3つの異なる位置に出現している場合に、その3つの異なる位置に出現している単語aをすべてノードaに対応する統合すべき単語とすることができる。
また、あるノードaについて、対応する語義概念が単語aであり、単語bと単語aの表現方式は異なるが、表現された語義が単語aであり、すなわち両者の表現された語義が同じであれば、単語bと単語aをすべてノードaに対応する統合すべき単語とすることができる。
また、対応する語義概念が一つのフレーズである何れか一つのノードについて、処理待ちテキスト内の各位置に現れる、そのフレーズを構成する各単語を、そのノードに対応する統合すべき単語とすることができる。また、そのノードに対応する語義概念の表現方式は異なるが、表現された語義が同じ単語が存在すると確定された場合に、確定された単語もそのノードに対応する統合すべき単語とすることができる。
図2に示されたノード「Albert Einstein」を例にすると、それに対応する語義概念はフレーズであり、「Albert」と「Einstein」の2つの単語で構成されるため、この2つの単語をすべてそのノードに対応する統合すべき単語とすることができる。なお、この2つの単語が何れも処理待ちテキスト内の異なる2つの位置に出現したと仮定すると、異なる位置に出現したこの2つの単語を全てそのノードに対応する統合すべき単語とすることができる。また、図2に示されたように、単語「he」と「his」は「Albert Einstein」とは表現が異なるが、表現の語義が何れも「Albert Einstein」であるため、「he」と「his」もそのノードに対応する統合すべき単語とすることができる。
知識グラフにおける何れか一つのノードについて、それに対応する語義概念の表現方式は異なるが、同じ語義を表す単語が存在すると確定した場合に、そのノードを共参照関係ノードと呼ぶことができ、例えば図2に示されたノード「Albert Einstein」や「the Nobel Prize」などである。なお、ノード「the Nobel Prize」について、「the great Prize」は表現方式が異なるが、表現された語義が「the Nobel Prize」となる。
統合すべき単語をどのように特定するかに関する上記の方式は例示にすぎず、本願の技術案を限定するためのものではなく、具体的な実施形態は実際の必要に応じて決定することができる。
何れか一つのノードについて、対応する統合すべき単語の文脈符号化表現から、そのノードの初期表現を特定することができる。例えば、そのノードに対応する各統合すべき単語の文脈符号化表現の加算値を計算し、加算値とそのノードに対応する統合すべき単語の数との商を計算し、計算された商をそのノードの初期表現とすることができる。
処理待ちテキストを前記の「Albert Einstein、a German theoretical physicist、published the theory of relativity;He won the Nobel Prize;The theory of relativity is one of the two pillars of modern physics;The great Prize was for his explanation of the photoelectric effect」とすると、対応する知識グラフは図2に示された。その中のノード「Albert Einstein」を例にすると、「Albert」と「Einstein」の2つの単語からなる。この2つの単語は、処理待ちテキストにおいて1つの位置にしか出現されなく、それをすべて当該ノードの統合すべきノードとする。また、単語「he」と「his」は「Albert Einstein」との表現方式が異なるが、表現の語義が「Albert Einstein」であるため、そのノードに対応する統合すべき単語とすることもできる。これにより、合計4つの統合すべき単語を得ることができる。これら4つの統合すべき単語の文脈符号化表現を加算し、加算値を4で割ることで得られた商をノード「Albert Einstein」の初期表現とすることができる。
上記の処理により、知識グラフにおける各ノードの初期表現を正確に取得し、後続の処理に良い基盤を築くことができる。
ステップ104で説明されたように、各ノードの初期表現および各ノード間の接続関係に基づいて符号化して各ノードのノード表現(ベクトル表現)を得、つまりグラフエンコーダで知識グラフをノードレベルで符号化して知識グラフの構造を考慮したノード表現を得ることができる。
従来におけるグラフニューラルネットワークに基づくグラフエンコーダは、マルチホップ関係をうまくモデル化できないことが多いが、実際の応用においてマルチホップ関係は非常に重要である。具体的には、本出願では、処理待ちテキストが知識グラフに変換された後、語句の中の主語と目的語は二階隣接関係になることが多く、主語と目的語の関係は、一般的に主語と述語、述語と目的語よりも重要である。
そこで、本出願では、知識グラフにノードと、そのノードに他のノードを介して接続されているノードである二階隣接ノードとの間の近道エッジを追加できることを提案した。図2に示したノード「Albert Einstein」を例にすると、ノード「the Nobel Prize」などが二階隣接ノードであり、二階隣接ノード「the Nobel Prize」などとノード「Albert Einstein」をエッジで直接に接続することができる。さらに、各ノードの初期表現および近道エッジが追加された各ノード間の接続関係に基づいて符号化して各ノードのノード表現を得ることができる。
前記の処理方式では、ノードから二階隣接ノードへの近道エッジを追加することにより、グラフエンコーダによるグラフにおけるマルチホップ関係モデリングの強化を実現し、得られたノード表現の正確度などを向上させる。
ステップ105で説明されたように、各ノードのノード表現に基づいて復号化して処理待ちテキストの要約を得、つまりグラフデコーダを用いて、知識グラフにおける各ノードのノード表現に基づいて復号化して最終的に必要な処理待ちテキストの要約を得ることができる。
好ましくは、グラフによって伝達された注意メカニズムに基づいて、各ノードのノード表現に基づいて復号化して処理待ちテキストの要約を得ることができる。従来の注意メカニズムは、符号化情報に対してグラフ構造を考慮せずに線形的にシリアライズすることが多い。本出願では、グラフによって伝達された注意メカニズムを使用し、すなわち従来の注意メカニズムのように各ノードの重要度を線形的に予測した後に、重要度をグラフ中に伝達させることでグラフ構造を考慮した注意を取得することにより、復号化結果の正確度等を向上させることを提案する。
また、知識グラフを用いて符号化と復号化を行い、前記のグラフによって伝達された注意メカニズムなどを用いることにより、従来方式と比べて、入力された長いテキストを効率的かつ正確に処理することが可能となる。
前記の説明に基づいて、図3は、本出願に記載された要約生成方法の全体的な実施プロセスの模式図である。図3に示されたように、前処理の段階で、グラフ解析器による解析を介して処理待ちテキストに対応する知識グラフを得、また、処理待ちテキストに対して事前訓練モデルを用いて単語レベルの符号化を行って処理待ちテキストの中の各単語の文脈符号化表現を得、その後に得られた各単語の文脈符号化表現に基づいて統合などの処理により知識グラフにおける各ノードの初期表現をそれぞれ特定し、その後に各ノードの初期表現や各ノード間の接続関係などに基づいて符号化して各ノードのノード表現を得、さらに、各ノードのノード表現に基づいて復号化して処理待ちテキストの要約を得ることができる。なお、復号化を行う場合に、グラフによって伝達された注意メカニズムなどを用いることができる。
処理待ちテキストに対応する知識グラフをどのように取得するか、各単語の文脈符号化表現をどのように取得するか、および符号化と復号化をどのように行うかなどは何れも従来技術であり、その他の具体的な実現は前記の関連説明を参照でき、ここでは詳しく説明しない。
説明すべきなのは、前記の各方法実施例について、説明を簡単にするために、一連の動作の組合せとして記述された。しかし、当業者であればわかるように、本願により幾つかのステップが他の順番を採用し、或いは同時に実行可能であるため、本願は説明された動作の順番に限定されない。次に、当業者であればわかるように、明細書に説明された実施例は何れも好適な実施例であり、関わる動作とモジュールが必ずしも本願に必要なものではない。
以上は、方法の実施形態に関する説明である。以下で装置の実施形態により本出願に記載された方案をさらに説明する。
図4は、本出願に記載の要約生成装置の実施形態40の構造の模式図である。図4に示されたように、グラフ解析モジュール401と、単語符号化モジュール402と、統合モジュール403と、グラフ符号化モジュール404と、グラフ復号化モジュール405とを備える。
グラフ解析モジュール401は、処理待ちテキストに対応する知識グラフを取得し、知識グラフにおけるノードは処理待ちテキストの中の語義概念を表し、知識グラフの中のエッジは語義概念間の語義関係を表す。
単語符号化モジュール402は、処理待ちテキストを単語レベルで符号化して各単語の文脈符号化表現を得る。
統合モジュール403は、各単語の文脈符号化表現に基づいて、知識グラフにおける各ノードの初期表現をそれぞれ特定する。
図符号化モジュール404は、各ノードの初期表現および各ノード間の接続関係に基づいて符号化して各ノードのノード表現を得る。
図復号化モジュール405は、各ノードのノード表現に基づいて復号化して処理待ちテキストの要約を得る。
ここで、処理待ちテキストにはN個のテキストを含み、Nは正の整数である。つまり、処理待ちテキストには、1つのテキストだけを含んでも良く、複数のテキストを含んでも良い。複数の場合に、これら複数のテキストは通常にテーマに関連するテキストである。
グラフ解析モジュール401は、処理待ちテキストについて、グラフ解析器のようなテキスト解析ツールを介して対応する知識グラフを得、すなわちテキスト構造を、語義構造を有するグラフ表現に変換することができる。
単語符号化モジュール402は、更に事前訓練モデルを用いて、処理待ちテキストを単語レベルで符号化して各単語の文脈符号化表現を得ることができる。
各単語の文脈符号化表現が得られた後、統合モジュール403は、更に各単語の文脈符号化表現に基づいて、知識グラフにおける各ノードの初期表現をそれぞれ特定することができる。
なお、統合モジュール403は、何れか一つのノードに対して、そのノードに対応する統合すべき単語を取得できれば、統合すべき単語の文脈符号化表現からそのノードの初期表現を特定することができ、統合すべき単語の数が1より大きい。さもなければ、そのノードに対応する語義概念の文脈符号化表現をそのノードの初期表現とすることができ、そのノードに対応する語義概念が一つの単語である。
具体的には、統合モジュール403は、対応する語義概念が一つの単語である何れか一つのノードについて、処理待ちテキスト内の少なくとも2つの異なる位置に当該単語が存在すると確定された場合、異なる位置に出現した当該単語をすべて当該ノードに対応する統合すべき単語とすることができる。当該単語と表現方式は異なるが表現の語義は同じである他の単語が存在すると確定すれば、前記他の単語と当該単語をすべて当該ノードに対応する統合すべき単語とすることができる。
さらに、統合モジュール403は、対応する語義概念が一つのフレーズである何れか一つのノードについて、処理待ちテキスト内の各位置に現れる、そのフレーズを構成する各単語を、そのノードに対応する統合すべき単語とすることができる。また、そのノードに対応する語義概念の表現方式は異なるが、表現された語義が同じ単語が存在すると確定された場合に、確定された単語もそのノードに対応する統合すべき単語とすることができる。
統合モジュール403は、何れか一つのノードについて、そのノードに対応する統合すべき単語の文脈符号化表現の加算値を計算し、加算値とそのノードに対応する統合すべき単語の数との商を計算し、計算された商をそのノードの初期表現とすることができる。
さらに、グラフ符号化モジュール404は、各ノードの初期表現および各ノード間の接続関係に基づいて符号化して各ノードのノード表現を得ることができる。好ましくは、グラフ符号化モジュール404は更に、知識グラフにおいてノードと、他のノードを介してそのノードに接続されているノードである二階隣接ノードとの間の近道エッジを追加し、各ノードの初期表現と近道エッジを追加された各ノード間の接続関係に基づいて符号化して各ノードのノード表現を得ることができる。
グラフ復号化モジュール405は、各ノードのノード表現に基づいて復号化して処理待ちテキストの要約を得ることができる。好ましくは、グラフ復号化モジュール405は、グラフによって伝達された注意メカニズムに基づいて、各ノードのノード表現に従って復号化して処理待ちテキストの要約を得ることができる。
図4に示された装置の実施形態の具体的なワークフローは、前記の方法の実施形態の関連説明を参照でき、ここでは詳しく説明しない。
要するには、本出願の装置の実施形態に記載の方案によれば、エンドツーエンド生成型アーキテクチャに基づいて、テキスト情報を知識グラフ構造情報に変換し、文脈情報を考慮した単語レベルの符号化に基づいて、テキストの中の語義概念および語義概念間の語義関係を明示的にモデル化することにより、テキストの中の重要な情報をより明確かつ正確に理解して絞り込むことができ、ひいては生成された要約の語義の一貫性や正確度などを向上させることができる。
本出願の実施形態によれば、本出願は更に電子デバイスおよび可読記憶媒体を提供する。
図5は、本出願の実施形態に記載の方法による電子デバイスのブロック図である。電子デバイスは、様々な形式のデジタルコンピュータ、例えば、ラップトップコンピュータ、デスクトップコンピュータ、ワークステーション、PDA、サーバ、ブレードサーバ、メインフレームコンピュータ、及び他の適切なコンピュータであることが意図される。電子デバイスは、様々な形式のモバイル装置、例えば、PDA、携帯電話、スマートフォン、ウェアラブルデバイス、及び他の類似するコンピューティング装置を示してもよい。本文で示された構成要素、それらの接続及び関係、ならびにそれらの機能は例示にすぎなく、本明細書において説明及び/又は請求される本出願の実現を限定することが意図されない。
図5に示すように、この電子デバイスは、一つ又は複数のプロセッサY01、メモリY02、及び各構成要素に接続するための高速インターフェース及び低速インターフェースを含むインターフェースを備える。各構成要素は、異なるバスで相互接続され、そして、共通マザーボードに、又は必要に応じて、他の態様で実装されてもよい。プロセッサは、電子デバイス内で実行されるコマンドを処理してもよく、メモリに記憶される又はメモリ上で外部入力/出力装置(例えば、インターフェースに結合される表示装置)にグラフィカルユーザインターフェースのグラフィカル情報を表示するコマンドを含む。他の実施形態において、必要な場合に、複数のプロセッサ及び/又は複数のバスが、複数のメモリとともに用いられてもよい。同様に、複数の電子デバイスが接続されてもよく、それぞれのデバイスが必要な操作の一部を提供する(例えば、サーババンク、ブレードサーバの集まり、又はマルチプロセッサシステムとする)。図5において、一つのプロセッサY01を例とする。
メモリY02は、本出願で提供される非一時的コンピュータ可読記憶媒体である。なお、前記メモリには、少なくとも1つのプロセッサが本願に提供された方法を実行するように、前記少なくとも1つのプロセッサに実行可能なコマンドが記憶されている。本出願の非一時的コンピュータ可読記憶媒体は、本願に提供された方法をコンピュータに実行させるためのコンピュータコマンドを記憶している。
メモリY02は、非一時的コンピュータ可読記憶媒体として、非一時的ソフトウェアプログラム、非一時的コンピュータ実行可能なプログラム、モジュール、例えば、本出願の実施例における方法に対応するプログラムコマンド/ユニットを記憶するために用いられる。プロセッサY01は、メモリY02に記憶されている非一時的ソフトウェアプログラム、コマンド及びモジュールを実行することで、サーバの様々な機能アプリケーション及びデータ処理を実行し、即ち、上記の方法実施例における方法を実現する。
メモリY02は、プログラム記憶領域及びデータ記憶領域を含んでもよく、プログラム記憶領域はオペレーティングシステム、少なくとも一つの機能に必要なアプリケーションプログラムを記憶してもよく、データ記憶領域は電子デバイスの使用により作成されたデータなどを記憶してもよい。また、メモリY02は、高速ランダムアクセスメモリを含んでもよく、さらに非一時的メモリ、例えば、少なくとも一つの磁気ディスク記憶装置、フラッシュメモリ装置、又は他の非一時的固体記憶装置を含んでもよい。幾つかの実施例において、メモリY02は、プロセッサY01に対して遠隔設置されたメモリを選択的に含んでもよく、これらのリモートメモリは、ネットワークを介して電子デバイスに接続されてもよい。上記のネットワークの実例には、インターネット、イントラネット、ローカルエリアネットワーク、モバイル通信ネットワーク、及びそれらの組み合わせが含まれるが、これらに限定されない。
電子デバイスは、更に、入力装置Y03と出力装置Y04とを備えても良い。プロセッサY01、メモリY02、入力装置Y03及び出力装置Y04は、バス又は他の手段により接続されても良く、図5においてバスによる接続を例とする。
入力装置Y03は、入力された数字又はキャラクタ情報を受信し、電子デバイスのユーザ設定及び機能制御に関連するキー信号入力を生成でき、例えば、タッチスクリーン、キーパッド、マウス、トラックパッド、タッチパッド、ポインティングスティック、一つ又は複数のマウスボタン、トラックボール、ジョイスティックなどの入力装置である。出力装置Y04は、表示装置、補助照明装置(例えば、LED)、触覚フィードバック装置(例えば、振動モータ)などを含むことができる。当該表示装置は、液晶ディスプレイ(LCD)、発光ダイオードディスプレイ(LED)、及びプラズマディスプレイを含み得るが、これらに限定されない。いくつかの実施形態では、表示装置はタッチパネルであってもよい。
本明細書に説明されるシステム及び技術の様々な実施形態は、デジタル電子回路システム、集積回路システム、専用ASIC(専用集積回路)、コンピュータハードウェア、ファームウェア、ソフトウェア、及び/又はそれらの組み合わせにおいて実現することができる。これらの様々な実施形態は、記憶システム、少なくとも一つの入力装置、及び少なくとも一つの出力装置からデータ及びコマンドを受信し、当該記憶システム、当該少なくとも一つの入力装置、及び当該少なくとも一つの出力装置にデータ及びコマンドを送信するようにつなげられた、特殊用途でもよく一般用途でもよい少なくとも一つのプログラマブルプロセッサを含む、プログラマブルシステム上で実行可能及び/又は解釈可能な一つ又は複数のコンピュータプログラムにおける実行を含んでもよい。
これらのコンピューティングプログラム(プログラム、ソフトウェア、ソフトウェアアプリケーション、又は、コードとも称される)は、プログラマブルプロセッサの機械命令を含み、高水準のプロセス及び/又はオブジェクト向けプログラミング言語、及び/又はアセンブリ/機械言語で実行されることができる。本明細書で用いられる「機械可読媒体」及び「コンピュータ可読媒体」という用語は、機械可読信号としての機械命令を受け取る機械可読媒体を含むプログラマブルプロセッサに機械命令及び/又はデータを提供するのに用いられる任意のコンピュータプログラム製品、機器、及び/又は装置(例えば、磁気ディスク、光ディスク、メモリ、及びプログラマブル論理デバイス)を指す。「機械可読信号」という用語は、プログラマブルプロセッサに機械命令及び/又はデータを提供するために用いられる任意の信号を指す。
ユーザとのインタラクティブを提供するために、本明細書に説明されるシステムと技術は、ユーザに対して情報を表示するための表示装置(例えば、CRT(ブラウン管)又はLCD(液晶ディスプレイ)モニタ)、ユーザがコンピュータに入力を与えることができるキーボード及びポインティングデバイス(例えば、マウスや、トラックボール)を有するコンピュータ上に実施されることが可能である。その他の種類の装置は、さらに、ユーザとのインタラクションを提供するために使用されることが可能であり、例えば、ユーザに提供されるフィードバックは、任意の形態のセンシングフィードバック(例えば、視覚的なフィードバック、聴覚的なフィードバック、又は触覚的なフィードバック)であり得、ユーザからの入力は、任意の形態で(音響、音声又は触覚による入力を含む)受信され得る。
本明細書に説明されるシステムと技術は、バックエンド構成要素を含むコンピューティングシステム(例えば、データサーバとする)、又はミドルウェア構成要素を含むコンピューティングシステム(例えば、アプリケーションサーバ)、又はフロントエンド構成要素を含むコンピューティングシステム(例えば、グラフィカルユーザインターフェースもしくはウェブブラウザを有するクライアントコンピュータであり、ユーザは、当該グラフィカルユーザインターフェースもしくは当該ウェブブラウザを通じて本明細書で説明されるシステムと技術の実施形態とインタラクションすることができる)、そのようなバックエンド構成要素、ミドルウェア構成要素、もしくはフロントエンド構成要素の任意の組合せを含むコンピューティングシステムに実施されることが可能である。システムの構成要素は、任意の形態又は媒体のデジタルデータ通信(例えば、通信ネットワーク)によって相互に接続されることが可能である。通信ネットワークの例は、ローカルエリアネットワーク(「LAN」)、ワイド・エリア・ネットワーク(「WAN」)、インターネットワークを含む。
コンピュータシステムは、クライアントとサーバを含み得る。クライアントとサーバは、一般的に互いから遠く離れており、通常は、通信ネットワークを通じてインタラクトする。クライアントとサーバとの関係は、相応するコンピュータ上で実行され、互いにクライアント-サーバの関係を有するコンピュータプログラムによって生じる。サーバは、クラウドコンピューティングサーバまたはクラウドホストとも呼ばれるクラウドサーバであって良く、クラウドコンピューティングサービスシステムのホスト製品であり、従来の物理ホストとVPSサービスにおいて管理が難しく、ビジネスの拡張性が低いという欠点を解決する。
上記で示された様々な形式のフローを使用して、ステップを並べ替え、追加、又は削除できることを理解されたい。例えば、本出願に説明される各ステップは、並列の順序又は順次的な順序で実施されてもよいし、又は異なる順序で実行されてもよく、本出願で開示された技術案の望ましい結果が達成できる限り、ここで制限されない。
前記の具体的な実施形態は本出願の保護範囲に対する制限を構成しない。設計要件及び他の要因に従って、様々な修正、組み合わせ、部分的組み合わせ及び置換を行うことができることを当業者は理解するべきである。本出願の精神及び原則の範囲内で行われる修正、同等の置換、改善は、何れも本出願の保護範囲内に含まれるべきである。

Claims (15)

  1. コンピュータにより実行される、要約生成方法であって、
    処理待ちテキストファイルに対応する知識グラフを取得することであって、前記知識グラフにおけるノードが前記処理待ちテキストファイルの中の語義概念を表し、前記知識グラフにおけるエッジが語義概念間の語義関係を表す、知識グラフを取得することと、
    前記処理待ちテキストファイルを単語レベルで符号化して各単語の文脈符号化表現を得ることと、
    各単語の文脈符号化表現に基づいて前記知識グラフにおける各ノードの初期表現をそれぞれ特定することと、
    各ノードの初期表現および各ノード間の接続関係に基づいて符号化して各ノードのノード表現を得ることと、
    各ノードのノード表現に基づいて復号化して前記処理待ちテキストファイルの要約を得ることと、を含み、
    ノードと、他の1つのノードを介して前記ノードに接続されているノードである二階隣接ノードとの間の近道エッジを前記知識グラフに追加することと、
    各ノードの初期表現と、前記近道エッジが追加された各ノード間の接続関係に基づいて符号化して各ノードのノード表現を得ることと、をさらに含む、方法。
  2. 前記処理待ちテキストファイルは、N個のテキストを含み、Nは正整数であり、
    前記処理待ちテキストファイルを単語レベルで符号化することは、事前訓練モデルを用いて前記処理待ちテキストファイルを単語レベルで符号化することを含む、請求項1に記載の方法。
  3. 前記各単語の文脈符号化表現に基づいて、前記知識グラフにおける各ノードの初期表現をそれぞれ特定することは、
    何れか一つのノードについて、
    前記ノードに対応する、数が1より多い統合すべき単語を取得できる場合、前記統合すべき単語の文脈符号化表現に基づいて前記ノードの初期表現を特定することと、
    取得できない場合、前記ノードに対応する語義概念の文脈符号化表現を前記ノードの初期表現とすることであって、前記ノードに対応する語義概念は一つの単語である、初期表現とすることと、を含む請求項1に記載の方法。
  4. 前記ノードに対応する統合すべき単語を取得できることは、
    対応する語義概念が一つの単語である何れか一つのノードについて、前記単語が前記処理待ちテキストファイルの中の少なくとも2つの異なる位置に出現したと判定された場合、異なる位置に出現した前記単語をすべて前記ノードに対応する統合すべき単語とし、表現方式が前記単語と異なるが、表現された語義が同じである他の単語が存在したと判定された場合に、前記他の単語及び前記単語をすべて前記ノードに対応する統合すべき単語とし、
    対応する語義概念が一つのフレーズである何れか一つのノードについて、前記処理待ちテキストファイルの中の各位置に出現した、前記フレーズを構成する各単語を全て前記ノードに対応する統合すべき単語とし、かつ、表現方式が前記ノードに対応する語義概念と異なるが、表現された語義が同じである単語が存在したと判定された場合に、判定された単語を前記ノードに対応する統合すべき単語とする、ことを含む、請求項3に記載の方法。
  5. 前記統合すべき単語の文脈符号化表現に基づいて前記ノードの初期表現を特定することは、
    何れか一つのノードについて、前記ノードに対応する各統合すべき単語の文脈符号化表現の加算値を算出し、前記加算値と前記ノードに対応する統合すべき単語の数との商を算出し、算出された商を前記ノードの初期表現とする、ことを含む請求項3に記載の方法。
  6. 前記各ノードのノード表現に基づいて符号化して前記処理待ちテキストファイルの要約を得ることは、
    グラフによって伝達される注意メカニズムに基づいて、各ノードのノード表現に従って復号化して前記処理待ちテキストファイルの要約を得ること、を含む請求項1に記載の方法。
  7. グラフ解析モジュールと、単語符号化モジュールと、統合モジュールと、グラフ符号化モジュールと、グラフ復号化モジュールと、を備える要約生成装置であって、
    前記グラフ解析モジュールは、処理待ちテキストファイルに対応する知識グラフを取得し、前記知識グラフにおけるノードは前記処理待ちテキストファイルの中の語義概念を表し、前記知識グラフにおけるエッジが語義概念間の語義関係を表し、
    前記単語符号化モジュールは、前記処理待ちテキストファイルを単語レベルで符号化して各単語の文脈符号化表現を得、
    前記統合モジュールは、各単語の文脈符号化表現に基づいて前記知識グラフにおける各ノードの初期表現をそれぞれ特定し、
    前記グラフ符号化モジュールは、各ノードの初期表現および各ノード間の接続関係に基づいて符号化して各ノードのノード表現を得、
    前記グラフ復号化モジュールは、各ノードのノード表現に基づいて復号化して前記処理待ちテキストファイルの要約を得、
    前記グラフ符号化モジュールは、さらに、ノードと、他の1つのノードを介して前記ノードに接続されているノードである二階隣接ノードとの間の近道エッジを前記知識グラフに追加し、各ノードの初期表現と前記近道エッジが追加された各ノード間の接続関係に基づいて符号化して各ノードのノード表現を得る、装置。
  8. 前記処理待ちテキストファイルは、N個のテキストを含み、Nは正整数であり、
    前記単語符号化モジュールは、事前訓練モデルを用いて、前記処理待ちテキストファイルを単語レベルで符号化する、請求項に記載の装置。
  9. 前記統合モジュールは、
    何れか一つのノードに対して、前記ノードに対応する、数が1より多い統合すべき単語を取得できる場合、前記統合すべき単語の文脈符号化表現に基づいて前記ノードの初期表現を特定し、
    できない場合、前記ノードに対応する語義概念の文脈符号化表現を前記ノードの初期表現とし、この場合、前記ノードに対応する語義概念は一つの単語である、請求項に記載の装置。
  10. 前記統合モジュールは、対応する語義概念が一つの単語である何れか一つのノードに対して、前記単語が前記処理待ちテキストファイルの中の少なくとも2つの異なる位置に出現したと判定された場合、異なる位置に出現した前記単語をすべて前記ノードに対応する統合すべき単語とし、表現方法が前記単語と異なるが、表現された語義が同じである他の単語が存在したと判定された場合に、前記他の単語及び前記単語をすべて前記ノードに対応する統合すべき単語とし、
    前記統合モジュールは、対応する語義概念が一つのフレーズである何れか一つのノードに対して、前記処理待ちテキストファイルの中の各位置に出現した、前記フレーズを構成する各単語を前記ノードに対応する統合すべき単語とし、かつ、表現方法が前記ノードに対応する語義概念と異なるが、表現された語義が同じである単語が存在したと判定された場合に、判定された単語を前記ノードに対応する統合すべき単語とする、請求項に記載の装置。
  11. 前記統合モジュールは、何れか一つのノードについて、前記ノードに対応する各統合すべき単語の文脈符号化表現の加算値を算出し、前記加算値と前記ノードに対応する統合すべき単語の数との商を算出し、算出された商を前記ノードの初期表現とする、請求項に記載の装置。
  12. 前記グラフ復号化モジュールは、グラフによって伝達された注意メカニズムに基づいて、各ノードのノード表現に基づいて復号化して前記処理待ちテキストファイルの要約を得る、請求項に記載の装置。
  13. 少なくとも1つのプロセッサと、
    前記少なくとも1つのプロセッサと通信接続されたメモリと、を備え、
    前記メモリに前記少なくとも1つのプロセッサにより実行可能なコマンドが記憶されており、前記コマンドが前記少なくとも1つのプロセッサにより実行されると、前記少なくとも1つのプロセッサに請求項1~の何れか1項に記載の方法を実行させる電子デバイス。
  14. コンピュータに請求項1~の何れか1項に記載の方法を実行させるコンピュータコマンドが記憶された非一時的なコンピュータ可読記憶媒体。
  15. コンピュータに請求項1~の何れか1項に記載の方法を実行させるコンピュータプログラム。

JP2021048484A 2020-09-21 2021-03-23 要約生成方法、装置、プログラム、電子デバイス及び記憶媒体 Active JP7178441B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN202010993704.9A CN112148871B (zh) 2020-09-21 2020-09-21 摘要生成方法、装置、电子设备及存储介质
CN202010993704.9 2020-09-21

Publications (2)

Publication Number Publication Date
JP2022051666A JP2022051666A (ja) 2022-04-01
JP7178441B2 true JP7178441B2 (ja) 2022-11-25

Family

ID=73893401

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021048484A Active JP7178441B2 (ja) 2020-09-21 2021-03-23 要約生成方法、装置、プログラム、電子デバイス及び記憶媒体

Country Status (5)

Country Link
US (1) US20220092252A1 (ja)
EP (1) EP3971761A1 (ja)
JP (1) JP7178441B2 (ja)
KR (1) KR20220039576A (ja)
CN (1) CN112148871B (ja)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114580354B (zh) * 2022-05-05 2022-10-28 阿里巴巴达摩院(杭州)科技有限公司 基于同义词的信息编码方法、装置、设备和存储介质
CN116484870B (zh) * 2022-09-09 2024-01-05 北京百度网讯科技有限公司 提取文本信息的方法、装置、设备及介质
CN115905598B (zh) * 2023-02-24 2023-05-16 中电科新型智慧城市研究院有限公司 一种社会事件摘要生成的方法、装置、终端设备及介质
CN116484010B (zh) * 2023-03-15 2024-01-16 北京擎盾信息科技有限公司 知识图谱构建方法、装置、存储介质及电子装置
CN116595192B (zh) * 2023-05-18 2023-11-21 中国科学技术信息研究所 科技前沿信息获取方法、装置、电子设备和可读存储介质
CN116562275B (zh) * 2023-06-09 2023-09-15 创意信息技术股份有限公司 一种结合实体属性图的自动文本摘要方法
CN116561299B (zh) * 2023-07-10 2023-10-20 合肥综合性国家科学中心人工智能研究院(安徽省人工智能实验室) 代码摘要生成方法、装置、设备及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040195897A1 (en) 2001-06-12 2004-10-07 Mitjans Jose Figueras Backrest for armchairs
JP2018067199A (ja) 2016-10-20 2018-04-26 日本電信電話株式会社 要約生成装置、テキスト変換装置、方法、及びプログラム
JP2018147238A (ja) 2017-03-06 2018-09-20 株式会社日立製作所 発想支援装置及び発想支援方法

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7774198B2 (en) * 2006-10-06 2010-08-10 Xerox Corporation Navigation system for text
US9886501B2 (en) * 2016-06-20 2018-02-06 International Business Machines Corporation Contextual content graph for automatic, unsupervised summarization of content
CN109657051A (zh) * 2018-11-30 2019-04-19 平安科技(深圳)有限公司 文本摘要生成方法、装置、计算机设备及存储介质
US11615240B2 (en) * 2019-08-15 2023-03-28 Salesforce.Com, Inc Systems and methods for a transformer network with tree-based attention for natural language processing
CN111506725B (zh) * 2020-04-17 2021-06-22 北京百度网讯科技有限公司 生成摘要的方法和装置
US11397575B2 (en) * 2020-12-15 2022-07-26 Sap Se Microservices graph generation

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040195897A1 (en) 2001-06-12 2004-10-07 Mitjans Jose Figueras Backrest for armchairs
JP2018067199A (ja) 2016-10-20 2018-04-26 日本電信電話株式会社 要約生成装置、テキスト変換装置、方法、及びプログラム
JP2018147238A (ja) 2017-03-06 2018-09-20 株式会社日立製作所 発想支援装置及び発想支援方法

Also Published As

Publication number Publication date
CN112148871A (zh) 2020-12-29
KR20220039576A (ko) 2022-03-29
JP2022051666A (ja) 2022-04-01
CN112148871B (zh) 2024-04-12
US20220092252A1 (en) 2022-03-24
EP3971761A1 (en) 2022-03-23

Similar Documents

Publication Publication Date Title
JP7178441B2 (ja) 要約生成方法、装置、プログラム、電子デバイス及び記憶媒体
JP7317791B2 (ja) エンティティ・リンキング方法、装置、機器、及び記憶媒体
US10360308B2 (en) Automated ontology building
JP7264866B2 (ja) イベント関係の生成方法、装置、電子機器及び記憶媒体
JP7126542B2 (ja) データセット処理方法、装置、電子機器及び記憶媒体
JP7228662B2 (ja) イベント抽出方法、装置、電子機器及び記憶媒体
JP2021190087A (ja) テキスト認識処理方法、装置、電子機器及び記憶媒体
JP7179123B2 (ja) 言語モデルの訓練方法、装置、電子デバイス及び可読記憶媒体
JP7301922B2 (ja) 意味検索方法、装置、電子機器、記憶媒体およびコンピュータプログラム
JP5513898B2 (ja) 共有された言語モデル
KR102521765B1 (ko) 인과 관계의 판별 방법, 장치, 전자 기기 및 저장 매체
JP7234483B2 (ja) エンティティリンキング方法、装置、電子デバイス、記憶媒体及びプログラム
JP7149993B2 (ja) 感情分析モデルの事前トレーニング方法、装置及び電子機器
JP7413630B2 (ja) 要約生成モデルの訓練方法、装置、デバイス及び記憶媒体
JP2022008207A (ja) トリプルサンプルの生成方法、装置、電子デバイス及び記憶媒体
CN112506949B (zh) 结构化查询语言查询语句生成方法、装置及存储介质
KR102561951B1 (ko) 모델링 매개 변수의 설정 방법, 장치, 전자 기기 및 기록 매체
KR20200063281A (ko) 신경망 자동 번역 장치 및 그 방법
CN111831814A (zh) 摘要生成模型的预训练方法、装置、电子设备和存储介质
EP3855341A1 (en) Language generation method and apparatus, electronic device and storage medium
CN111310481B (zh) 语音翻译方法、装置、计算机设备和存储介质
JP7286737B2 (ja) テキスト誤り訂正方法、装置、電子デバイス、記憶媒体及びプログラム
US11893977B2 (en) Method for recognizing Chinese-English mixed speech, electronic device, and storage medium
CN109828775B (zh) 一种多语言翻译文本内容的web管理系统及方法
JP7146986B2 (ja) 情報抽出方法、情報抽出装置及び電子機器

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210323

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220524

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220808

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20221101

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20221114

R150 Certificate of patent or registration of utility model

Ref document number: 7178441

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150