JP7487768B2 - 要約生成装置、要約生成方法及びプログラム - Google Patents

要約生成装置、要約生成方法及びプログラム Download PDF

Info

Publication number
JP7487768B2
JP7487768B2 JP2022509755A JP2022509755A JP7487768B2 JP 7487768 B2 JP7487768 B2 JP 7487768B2 JP 2022509755 A JP2022509755 A JP 2022509755A JP 2022509755 A JP2022509755 A JP 2022509755A JP 7487768 B2 JP7487768 B2 JP 7487768B2
Authority
JP
Japan
Prior art keywords
target
feature information
unit
service
text data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2022509755A
Other languages
English (en)
Other versions
JPWO2021191938A1 (ja
Inventor
崇 古谷
章 竹内
百合子 田中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Publication of JPWO2021191938A1 publication Critical patent/JPWO2021191938A1/ja
Application granted granted Critical
Publication of JP7487768B2 publication Critical patent/JP7487768B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/34Browsing; Visualisation therefor
    • G06F16/345Summarisation for human users
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/268Morphological analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、要約生成装置、要約生成方法及びプログラムに関する。
2015年に、持続可能な開発目標(SDGs(Sustainable Development Goals))を中心とする「持続可能な開発のための2030アジェンダ」が国連サミットで採択された。SDGsは、17の目標(ゴール)と169のターゲットで構成されており、貧困や飢餓、健康や教育、水の安全など、開発途上国の開発支援などから、働きがいや経済成長、エネルギー、更には気候変動や生物多様性に関するものまで多義に及ぶ。
SDGsなどの社会課題に対する貢献は、大きなビジネスチャンスをもたらす市場として捉えられ、多数の企業が各目標に対するソリューションの検討を始めている。特に、ICT(Information and Communication Technology)サービス・ソリューションは、これら社会課題の解決に大きく貢献することが期待されている。
各ICTサービスがSDGsのどのゴールに貢献可能かを判定するには、SDGsの意味をターゲット文書を含めて正しく理解する必要がある。ターゲットを正しく理解しないとICTサービスが本来有していた効果を見過ごす可能性があるのみならず、過剰評価をしてしまうというリスクがある。
しかしながら、169のターゲットは数値目標ではなく行動目標であるため判読が困難である。ICTサービスの関連性を評価する評価者が169のターゲットの意図する内容を正確に把握し、因果関係を把握することは稼働面で困難であるため、ICTサービスがどのように貢献可能かの因果関係を加味した適切に要約が必要である。
従来、ターゲットを要約した目標の生成には、例えばキーワード抽出法などが用いられている(非特許文献1)。
「SDGsビジネスの可能性とルール形成最終報告書」,デロイトトーマツコンサルティング合同会社,2017年12月
しかしながら、特に、ICTサービスにおいては、ICTサービスが貢献する効果の作用する対象との因果関係を明らかにする必要があるところ、キーワードのみではそのような因果関係を明確にすることができないため、或るICTサービスがいずれの目標に貢献するのかを容易に判別可能な要約を得ることは困難であった。
例えば、非特許文献1に記載の目標1のターゲットからのキーワード抽出では、「土地」というキーワードが抽出されているが、その単語のみではどのようにICTサービスが当該目標に対して貢献可能かの判断が難しい。
また、例えば一般的に用いられる係り受け解析などによる要約(キーワード抽出)によって、目標1のターゲット「2030年までに各国定義によるあらゆる次元の貧困状態にある、すべての年齢の男性、女性、子供の割合を半減させる」を要約すると、「貧困状態にある」、「割合を半減させる」などが得られる。
しかし、これでは、文意をくみ取ることが困難であり、ICTサービスが当該目標に対してどのように貢献可能かの判断が難しい。
本発明は、上記の点に鑑みてなされたものであって、SDGsの目標についてICTサービスの貢献の判別の容易性を向上させることのできる要約を生成することを目的とする。
そこで上記課題を解決するため、要約生成装置は、ICTサービスに関するテキストデータの構成要素に基づいて、1以上の第1の特徴情報を前記テキストデータから抽出する第1の抽出部と、SDGsの目標に属するターゲットの構成要素に基づいて、前記ターゲットの特徴を示す1以上の第2の特徴情報を前記ターゲットから抽出する第2の抽出部と、前記第2の特徴情報のそれぞれについて、前記第1の特徴情報との類似度を判定する判定部と、前記類似度が閾値以上である前記第2の特徴情報のそれぞれに対応する、前記ターゲットの前記構成要素の集合をクラスター分析した結果を、前記目標の要約として生成する生成部と、を有する。

SDGsの目標についてICTサービスの貢献の判別の容易性を向上させることのできる要約を生成することができる。
本発明の実施の形態における要約生成装置10のハードウェア構成例を示す図である。 本発明の実施の形態における要約生成装置10の機能構成例を示す図である。 ICTサービスの特徴情報の抽出処理の処理手順の一例を説明するためのフローチャートである。 SDGsの各目標の要約の生成処理の処理手順の一例を説明するためのフローチャートである。 ターゲット文書の形態素解析の結果の一例を示す図である。 SDGsの各目標の要約の出力例を示す図である。 SDGsの各目標の要約の出力例を示す図である。 SDGsの各目標の要約の出力例を示す図である。 SDGsの各目標の要約の出力例を示す図である。 SDGsの各目標の要約の出力例を示す図である。 SDGsの各目標の要約の出力例を示す図である。
以下、図面に基づいて本発明の実施の形態を説明する。図1は、本発明の実施の形態における要約生成装置10のハードウェア構成例を示す図である。図1の要約生成装置10は、それぞれバスBで相互に接続されているドライブ装置100、補助記憶装置102、メモリ装置103、CPU104、及びインタフェース装置105等を有する。
要約生成装置10での処理を実現するプログラムは、CD-ROM等の記録媒体101によって提供される。プログラムを記憶した記録媒体101がドライブ装置100にセットされると、プログラムが記録媒体101からドライブ装置100を介して補助記憶装置102にインストールされる。但し、プログラムのインストールは必ずしも記録媒体101より行う必要はなく、ネットワークを介して他のコンピュータよりダウンロードするようにしてもよい。補助記憶装置102は、インストールされたプログラムを格納すると共に、必要なファイルやデータ等を格納する。
メモリ装置103は、プログラムの起動指示があった場合に、補助記憶装置102からプログラムを読み出して格納する。CPU104は、メモリ装置103に格納されたプログラムに従って要約生成装置10に係る機能を実行する。インタフェース装置105は、ネットワークに接続するためのインタフェースとして用いられる。
図2は、本発明の実施の形態における要約生成装置10の機能構成例を示す図である。図2において、要約生成装置10は、サービス特徴抽出部11、形態素解析部12、構文解析部13、判定部14、要約生成部15及び要約出力部16等を有する。また、サービス特徴抽出部11は、形態素解析部111及び特徴計算部112を含む。これら各部は、要約生成装置10にインストールされた1以上のプログラムが、CPU104に実行させる処理により実現される。要約生成装置10は、また、テキストDB121及び特徴記憶部122等の記憶部を利用する。これら各記憶部は、例えば、補助記憶装置102、又は要約生成装置10にネットワークを介して接続可能な記憶装置等を用いて実現可能である。
以下、要約生成装置10が実行する処理手順について説明する。図3は、ICTサービスの特徴情報の抽出処理の処理手順の一例を説明するためのフローチャートである。図3において、ループL1(ステップS101~S104)は、テキストDB121にテキストデータが記憶されているICT(Information and Communication Technology)サービスごとに実行される。ICTサービスのテキストデータとは、例えば、SDGs(Sustainable Development Goals)に対する貢献事例が記載されたテキストデータである。但し、ICTサービスの概要や効用作用を説明するテキストデータ等、ICTサービスに関する電子的な説明文書が、当該ICTサービスのテキストデータとしてテキストDB121に記憶されていてもよい。また、テキストデータは、Webサイトから収集されてもよい。以下、ループL1において処理対象とされているICTサービスを「対象サービス」という。
ステップS101において、形態素解析部111は、対象サービスのテキストデータ(以下、「対象テキストデータ」という。)を入力する。なお、テキストDB121には、ICTサービスの識別情報(サービス名等)に対応付けられてテキストデータが記憶されている。
続いて、形態素解析部111は、対象テキストデータに対して形態素解析を実行して、対象テキストデータの構成要素(形態素)を抽出する(S102)。例えばJUMAN、MeCab又はChaSen等の形態素解析ツールが用いられて形態素解析が実行されてもよい。
続いて、特徴計算部112は、形態素解析の結果(対象テキストデータの構成要素)に基づいて、対象テキストデータの1以上の特徴情報(以下、「サービス特徴」という。)を抽出(計算)する(S103)。特徴計算部112は、例えば、Tf-idf法、共起度解析、係り受け解析等の自然言語処理、又はテキストマイニングの技術を利用して、サービス特徴を抽出(計算)する。例えば、係り受け解析については、CaboChaなどの係り受け解析ツール等が用いられてもよい。共起度解析については、pyfpgrowthなどのライブラリ等が用いられてもよい。
例えば、対象サービスが「ICTブイ」であり、対象テキストデータが、「https://www.nttdocomo.co.jp/biz/service/ict_bui/」において公開されているWeb文書である場合、名詞間の係り受け解析の結果(名詞-名詞)として、例えば、以下のようなサービス特徴の集合が抽出される。
塩分濃度-データ
塩分濃度-海洋
携帯電話-確認
作業内容-記憶
最高値-表示

なお、特徴計算部112は、上記の各サービス特徴をベクトル化(数値化)してもよい。具体的には、Word2Vecを用いて、各名詞を分散表現に変換し、係り受けの関係にある名詞同士の分散表現の平均を、当該名詞同士のサービス特徴の値としてもよい。例えば、「塩分濃度-データ」であれば、「塩分濃度」の分散表現と「データ」の分散表現との平均がサービス特徴とされてもよい。また、当該名詞同士の分散表現の値を加算し正規化したものをサービス特徴としてもよい。
続いて、特徴計算部112は、対象サービスの識別情報(例えば、サービス名)に関連付けて、ステップS103において計算されたサービス特徴の集合を特徴記憶部122に記憶する(S104)。
ループL1が、各ICTサービスについて実行されることにより、複数のICTサービスのそれぞれのサービス特徴の集合が特徴記憶部122に記憶される。
図4は、SDGsの各目標の要約の生成処理の処理手順の一例を説明するためのフローチャートである。
図4において、ループ処理L2は、SDGsの17の目標(ゴール)ごとに実行される。以下、ループ処理L2において処理対象とされている目標を、以下「対象目標」という。また、ループ処理L2内のループ処理L3は、169のターゲットのうち、対象目標に属するターゲットごとに実行される。ループ処理L3において処理対象とされているターゲットを、以下「対象ターゲット」という。
ステップS201において、形態素解析部12は、対象ターゲットが記載されたテキストデータ(以下、「ターゲット文書」という。)について、形態素解析を実行することで、ターゲット文書の構成要素(形態素)を抽出する。形態素解析の方法は、形態素解析部111による形態素解析と同様でよい。なお、図5に、ターゲット13.1のターゲット文書(「全ての国々において、気候関連災害や自然災害に対する強靱性(レジリエンス)及び適応の能力を強化する。」)の形態素解析の結果の一例を示す。
続いて、構文解析部13は、ターゲット文書の形態素解析の結果(ターゲット文書の構成要素)に基づいて、ターゲット文書の構文解析を実行することで、ターゲット文書の1以上の特徴情報を抽出する(S202)。なお、当該構文解析の内容は、特徴計算部112が実行する処理内容と同様でよい。したがって、係り受け解析(名詞-名詞)であれば、
自然災害-適応

といった単語又は句の集合が特徴情報(以下、「ターゲット特徴」という。)の集合として得られる。特徴計算部112によって計算されるサービス特徴がベクトル(分散表現)である場合、構文解析部13は、特徴計算部112と同様の方法で各ターゲット特徴をベクトルに変換すればよい。すなわち、構文解析部13によって、ターゲット文書に関して、ICTサービスのテキストデータの特徴情報と対比可能な特徴情報が得られる。
続いて、判定部14は、ステップS202において取得されたターゲット特徴ごとに、特徴記憶部122に記憶されている各サービス特徴との類似度を判定(計算)する(S203)。この際、ターゲット特徴との類似度の判定対象とされるサービス特徴は、特徴記憶部122に記憶されている全てではなく、対象ターゲットに貢献することが知られている1以上のICTサービスに関するサービス特徴に限定されてもよい。例えば、ターゲットと当該ターゲットに貢献するICTサービスとの対応情報が補助記憶装置102等に予め記憶されていてもよい。判定部14は、ステップS202において取得されたターゲット特徴ごとに、当該対応情報において対象ターゲットに対応するICTサービスに関する各サービス特徴との類似度を判定(計算)する。例えば、ターゲット特徴がN個であり、1以上の当該ICTサービスに関するサービス特徴がM個であれば、N個のターゲット特徴のそれぞれについて、M個の類似度が計算される。なお、類似度としては公知の指標が用いられればよい。例えば、コサイン類似度が用いられてもよい。
続いて、判定部14は、ステップS202において取得されたターゲット特徴の集合の中から、いずれかの類似度(上記の例では、M個の類似度のうちのいずれかの類似度)が閾値以上(例えば、コサイン類似度であれば0.6以上)であるターゲット特徴に係る単語又は句(ターゲット文書の構成要素)を抽出する(S204)。すなわち、ターゲット文書の中から、ICTサービスと関連性の高い構成要素が抽出されたことになる。
対象目標に属する全てのターゲットについてループ処理L3月が実行されると、要約生成部15は、当該ループ処理L3のステップS204において抽出された単語又は句の集合について、クラスター分析を実行して、当該集合をクラスターに分類し、クラスターへの分類結果を対象目標の要約として生成する(S205)。そうすることで、対象目標に対して単語又は句の重複が回避された要約が生成される。なお、クラスター分析には、例えば、Topicモデルが利用されてもよい。
17の全ての目標についてループ処理L2が実行されると、要約出力部16は、各目標について生成された要約を出力する(S206)。例えば、各目標の要約は、ユーザ(例えば、SDGsに精通した専門家)が操作可能な端末の表示装置に表示されてもよい。この際、より理解がし易いように要約の一部がユーザによって編集(訂正)されてもよい。
図6~図11は、SDGsの各目標の要約の出力例を示す図である。各目標の要約は複数行に分割されているが、この分割は、ステップS205におけるクラスターへの分類結果に基づく。すなわち、各行が1つのクラスターに対応し、それぞれの行に含まれる単語等が、当該行に対応するクラスターに分類された単語等に該当する。
上述したように、本実施の形態によれば、ICTサービスがどのように貢献可能かの因果関係が反映されて、SDGsのターゲット文書から抽出される構成要素が抽出され、当該構成要素に基づいて目標の要約が生成される。すなわち、ICTサービスの効果の対象と効用等に関するサービス特徴が用いられるため、どのように貢献可能かの因果関係を反映できる。また、サービス特徴を用いて抽出されたターゲット特徴をクラスター分析することで重複を避けた適切に要約された目標を生成できる。したがって、SDGsの目標についてICTサービスの貢献の判別の容易性を向上させることのできる要約を生成することができる。
なお、本実施の形態において、サービス特徴抽出部11は、第1の抽出部の一例である。形態素解析部12及び構文解析部13は、第2の抽出部の一例である。要約生成部15は、生成部の一例である。要約出力部16は、出力部の一例である。サービス特徴は、第1の特徴情報の一例である。ターゲット特徴は、第2の特徴情報の一例である。
以上、本発明の実施の形態について詳述したが、本発明は斯かる特定の実施形態に限定されるものではなく、請求の範囲に記載された本発明の要旨の範囲内において、種々の変形・変更が可能である。
10 要約生成装置
11 サービス特徴抽出部
12 形態素解析部
13 構文解析部
14 判定部
15 要約生成部
16 要約出力部
100 ドライブ装置
101 記録媒体
102 補助記憶装置
103 メモリ装置
104 CPU
105 インタフェース装置
111 形態素解析部
112 特徴計算部
121 テキストDB
122 特徴記憶部
B バス

Claims (6)

  1. ICTサービスに関するテキストデータの構成要素に基づいて、1以上の第1の特徴情報を前記テキストデータから抽出する第1の抽出部と、
    SDGsの目標に属するターゲットの構成要素に基づいて、前記ターゲットの特徴を示す1以上の第2の特徴情報を前記ターゲットから抽出する第2の抽出部と、
    前記第2の特徴情報のそれぞれについて、前記第1の特徴情報との類似度を判定する判定部と、
    前記類似度が閾値以上である前記第2の特徴情報のそれぞれに対応する、前記ターゲットの前記構成要素の集合をクラスター分析した結果を、前記目標の要約として生成する生成部と、
    を有することを特徴とする要約生成装置。
  2. 前記第1の抽出部は、前記テキストデータについて形態素解析を実行し、前記形態素解析の結果を入力とする自然言語処理に基づいて前記第1の特徴情報を抽出する、
    ことを特徴とする請求項1記載の要約生成装置。
  3. 前記第2の抽出部は、前記ターゲットについて形態素解析を実行し、前記形態素解析の結果を入力とする自然言語処理に基づいて前記第2の特徴情報を抽出する、
    ことを特徴とする請求項1又は2記載の要約生成装置。
  4. 前記生成部が生成した前記要約を出力する出力部、
    を有することを特徴とする請求項1乃至3いずれか一項記載の要約生成装置。
  5. ICTサービスに関するテキストデータの構成要素に基づいて、1以上の第1の特徴情報を前記テキストデータから抽出する第1の抽出手順と、
    SDGsの目標に属するターゲットの構成要素に基づいて、前記ターゲットの特徴を示す1以上の第2の特徴情報を前記ターゲットから抽出する第2の抽出手順と、
    前記第2の特徴情報のそれぞれについて、前記第1の特徴情報との類似度を判定する判定手順と、
    前記類似度が閾値以上である前記第2の特徴情報のそれぞれに対応する、前記ターゲットの前記構成要素の集合をクラスター分析した結果を、前記目標の要約として生成する生成手順と、
    をコンピュータが実行することを特徴とする要約生成方法。
  6. 請求項1乃至4いずれか一項記載の要約生成装置としてコンピュータを機能させることを特徴とするプログラム。
JP2022509755A 2020-03-23 2020-03-23 要約生成装置、要約生成方法及びプログラム Active JP7487768B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2020/012589 WO2021191938A1 (ja) 2020-03-23 2020-03-23 要約生成装置、要約生成方法及びプログラム

Publications (2)

Publication Number Publication Date
JPWO2021191938A1 JPWO2021191938A1 (ja) 2021-09-30
JP7487768B2 true JP7487768B2 (ja) 2024-05-21

Family

ID=77891076

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022509755A Active JP7487768B2 (ja) 2020-03-23 2020-03-23 要約生成装置、要約生成方法及びプログラム

Country Status (3)

Country Link
US (1) US12019666B2 (ja)
JP (1) JP7487768B2 (ja)
WO (1) WO2021191938A1 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20230047849A (ko) 2021-10-01 2023-04-10 네이버 주식회사 초대형 언어 모델을 이용한 문서 요약 방법 및 시스템

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007323570A (ja) 2006-06-05 2007-12-13 Nippon Telegr & Teleph Corp <Ntt> 情報通信を利用したサービスの評価方法およびプログラム
JP2016153998A (ja) 2015-02-16 2016-08-25 日本電信電話株式会社 サービスの評価装置及びサービスの評価方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20130060720A (ko) * 2011-11-30 2013-06-10 한국전자통신연구원 목적 기반 시맨틱 서비스 디스커버리를 위한 서비스 목적 해석 장치 및 방법
CN108170684B (zh) * 2018-01-22 2020-06-05 京东方科技集团股份有限公司 文本相似度计算方法及系统、数据查询系统和计算机产品
US11222167B2 (en) * 2019-12-19 2022-01-11 Adobe Inc. Generating structured text summaries of digital documents using interactive collaboration

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007323570A (ja) 2006-06-05 2007-12-13 Nippon Telegr & Teleph Corp <Ntt> 情報通信を利用したサービスの評価方法およびプログラム
JP2016153998A (ja) 2015-02-16 2016-08-25 日本電信電話株式会社 サービスの評価装置及びサービスの評価方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
Galsurkar et al.,Assessing national development plans for alignment with sustainable development goals via semantic search,In Proceedings of the AAAI Conference on Artificial Intelligence,vol. 32, no. 1,2018年02月02日,pp.7753-7758
古谷 崇 外3名,ICTサービスによる持続可能な開発目標(SDGs)への貢献に向けた一考察,電子情報通信学会2019年総合大会講演論文集 基礎・境界,一般社団法人電子情報通信学会,2019年03月05日,pp.114
関 洋平 外2名,文の機能的タイプを利用した複数文書要約,第66回(平成16年)全国大会講演論文集(2) 人工知能と認知科学,社団法人情報処理学会,2004年03月09日,pp.2-61~2-62

Also Published As

Publication number Publication date
JPWO2021191938A1 (ja) 2021-09-30
US20230146583A1 (en) 2023-05-11
US12019666B2 (en) 2024-06-25
WO2021191938A1 (ja) 2021-09-30

Similar Documents

Publication Publication Date Title
US12019978B2 (en) Lean parsing: a natural language processing system and method for parsing domain-specific languages
US20200334492A1 (en) Ablation on observable data for determining influence on machine learning systems
JP7251181B2 (ja) 対訳処理方法および対訳処理プログラム
US9607035B2 (en) Extensible validation framework for question and answer systems
CN108875059B (zh) 用于生成文档标签的方法、装置、电子设备和存储介质
WO2022218186A1 (zh) 个性化知识图谱的生成方法、装置及计算机设备
US10380263B2 (en) Translation synthesizer for analysis, amplification and remediation of linguistic data across a translation supply chain
CN104462057A (zh) 用于产生语言分析的词汇资源的方法和系统
CN111783450B (zh) 语料文本中的短语提取方法、装置、存储介质及电子设备
CN108319586B (zh) 一种信息提取规则的生成和语义解析方法及装置
US20150212976A1 (en) System and method for rule based classification of a text fragment
CA3207902A1 (en) Auditing citations in a textual document
Zhong et al. Natural language processing for systems engineering: automatic generation of systems modelling language diagrams
JP7487768B2 (ja) 要約生成装置、要約生成方法及びプログラム
CN112417860A (zh) 训练样本增强方法、系统、设备及存储介质
CN113569578B (zh) 一种用户意图识别方法、装置和计算机设备
US11675980B2 (en) Bias identification and correction in text documents
CN115495556A (zh) 文档处理方法及装置
US20220269860A1 (en) Evaluation apparatus and evaluation method
CN113378543B (zh) 数据分析方法、训练数据分析模型的方法及电子设备
WO2020026229A2 (en) Proposition identification in natural language and usage thereof
WO2023162129A1 (ja) 学習用データ生成装置、リスク検知装置、学習用データ生成方法、リスク検知方法、学習用データ生成プログラム及びリスク検知プログラム
CN112733492B (zh) 基于知识库的辅助设计方法、装置、终端和存储介质
US20230325606A1 (en) Method for extracting information from an unstructured data source
CA3076418C (en) Lean parsing: a natural language processing system and method for parsing domain-specific languages

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220914

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20231205

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20240116

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20240409

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20240422

R150 Certificate of patent or registration of utility model

Ref document number: 7487768

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150