JP2023027985A - 識別装置、方法、プログラムおよび学習装置 - Google Patents
識別装置、方法、プログラムおよび学習装置 Download PDFInfo
- Publication number
- JP2023027985A JP2023027985A JP2021133394A JP2021133394A JP2023027985A JP 2023027985 A JP2023027985 A JP 2023027985A JP 2021133394 A JP2021133394 A JP 2021133394A JP 2021133394 A JP2021133394 A JP 2021133394A JP 2023027985 A JP2023027985 A JP 2023027985A
- Authority
- JP
- Japan
- Prior art keywords
- subsets
- sentences
- event
- sentence
- causal relationship
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims description 28
- 230000001364 causal effect Effects 0.000 claims abstract description 98
- 230000006870 function Effects 0.000 claims description 6
- 238000012545 processing Methods 0.000 abstract description 17
- 238000000605 extraction Methods 0.000 description 14
- 238000010586 diagram Methods 0.000 description 9
- 238000004891 communication Methods 0.000 description 3
- 238000013434 data augmentation Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000002457 bidirectional effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000011478 gradient descent method Methods 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000011176 pooling Methods 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/166—Editing, e.g. inserting or deleting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
Abstract
Description
第1の実施形態に係る識別装置について図1のブロック図を参照して説明する。
第1の実施形態に係る識別装置10は、取得部101と、サブセット生成部102と、選択部103と、因果関係識別部104と、決定部105とを含む。
選択部103は、複数のサブセットそれぞれにおいて、因果関係の識別対象となるセンテンスであるターゲットを選択する。
決定部105は、サブセットごとに識別された因果関係に基づき、イベントと文書全体との因果関係を決定する。
ステップS201では、取得部101が、外部から文書およびイベントを取得する。
ステップS202では、サブセット生成部102が、取得した文書に含まれる複数のセンテンスを用いて、複数のセンテンスのうちの一部のセンテンスをグループ化し、複数のサブセットを生成する。サブセットの生成において、例えば、取得したイベントと関連性の低いセンテンスは除外し、入力されたイベントとの関連性が閾値以上であるセンテンスを文書から選択してグループ化する。関連性は、例えばイベントと各センテンスとの情報の類似度を分析すればよい。また、類似度は、イベントとセンテンスとが類似する度合いを示し、イベントの内容とセンテンスの内容とが近いほど、類似度が高い。よって、類似度が閾値以上であるセンテンスを関連性が閾値以上のセンテンスであると決定する。また、関連性として、イベントの文字列と、各センテンスの内容から分析される情報量を用いてもよい。例えば、センテンスを構成する単語群の意味または出現頻度から、各文の情報量を分析する。情報量が高い文ほど、他の文と比較してユニークな情報が含まれる。
ステップS204では、選択部103が、処理対象のサブセットに含まれる複数のセンテンスのうち、イベントとの比較対象であるターゲットを選択する。
図3は、文書30と、当該文書30から生成された複数のサブセット32との一例を示す。
図3の例では、関連性が閾値以上となるセンテンス1からセンテンス5まで、およびセンテンス7の6つが抽出され、センテンス7が関連性が閾値未満であるノイズとなり得るセンテンスであるとして、除外されるとする。
このようにサブセット32は、文書に含まれるセンテンスの数をN(Nは3以上の自然数)、サブセットに含まれるセンテンスの数をM(Mは2以上N未満の自然数)とすると、NCMの組み合わせ数まで生成することができる。すなわち、図3の例では、6C4=15通りのサブセット32を生成することができる。各サブセット32は関係性を有するセンテンスがグループ化されているため、複数パターンの文脈を生成できる。
図4は、サブセットAからサブセットEまでの5つのサブセットにそれぞれ含まれる、4つのセンテンスの因果関係の識別結果を示すテーブルである。4つのセンテンスは、6つセンテンス(センテンス1~センテンス5,センテンス7)のうちの4つの組み合わせである。識別結果として、ここでは0(ゼロ)から1まで間の数値が割り当てられる例を示す。0に近いほど、イベントとセンテンスとの間で因果関係がないことを示し、1に近いほど、イベントとセンテンスとの間に因果関係があることを示す。なお、サブセットに含まれないセンテンスの欄には、該当なしであることを示す「-」の記号が入力される。
図5は、図4に示すテーブルに、平均値を示す項目と、因果関係のありなしを示す項目と、イベントと文書全体との因果関係を示す最終結果の項目とを追加したテーブルである。
図5では、決定部105は、複数のサブセットに含まれるセンテンスの識別結果を示す値の平均値を算出する。決定部105は、当該平均値と閾値とを比較する。ここでは、識別結果の平均値に対する閾値として「0.7」を設定する。決定部105は、平均値が閾値以上であれば、「因果関係あり」と決定し、平均値が閾値未満であれば、「因果関係なし」と決定する。また、決定部105は、因果関係ありと判定されたセンテンスの中で、平均値が最大のセンテンスを、イベントに対する文書全体の因果関係の最終結果として出力してもよい。
決定部105は、識別結果の値から「0.4~0.6」の値を除き、「0.0~0.3」および「0.7~1.0」までの値のみを用いて、例えば投票により識別結果の有無の多数決をとればよい。図6では、図5のテーブルに対し、「0.4~0.6」の値については、斜線を記入して計算から除外することを表現する。
上述した図5では、「センテンス5」の平均値が閾値未満であるため、因果関係なしと決定されたが、図6の例では、「センテンス5」の平均値が「0.7」となり、平均値が閾値以上となるため、因果関係ありと決定される。
このように、確信度が高い値に基づいて因果関係の最終結果を決定することにより、因果関係識別部のモデルによるあいまいな識別結果を除外しつつ、確信度の高い値を用いることで、より因果関係抽出の精度を高めることができる。
図7は、センテンス1~センテンス5およびセンテンス7のセンテンスごとに、複数の統計処理の結果である統計値が入力されたテーブルである。
さらに、複数のサブセットにそれぞれ含まれる複数のセンテンスは、関係性を有しているため、複数パターンの文脈を生成できる。よって、学習済みモデルにおいて複数パターンの文脈を考慮した因果関係の識別結果が得られるため、確信度の高い因果関係の抽出結果を得ることができる。すなわち、高精度な識別を実現することができる。
第1の実施形態では、学習済みモデルを用いて複数のサブセットから因果関係を抽出する例を示すが、生成部により生成された複数のサブセットにより因果関係部のモデルを学習することもできる。
第2の実施形態に係る学習装置80は、取得部801と、サブセット生成部802と、選択部803と、因果関係識別部804と、学習部805と、モデル格納部806とを含む。
サブセット生成部802は、第1の実施形態と同様に、文書から複数のサブセットを生成する。
選択部803は、複数のサブセットのそれぞれから、イベントに対するターゲットを選択する。
学習部805は、ネットワークモデルの出力と正解となるラベルとの学習誤差を算出する。学習部805は、学習誤差が最小となるように、ネットワークモデルのパラメータを更新する。学習部805による学習が完了すると、学習済みモデルが生成される。
モデル格納部806は、学習前のネットワークモデルおよび学習後の学習済みモデルを格納する。また、必要に応じて、学習データを生成するための文書などを格納してもよい。
図9は、ラベル付き文書の例である。センテンス1からセンテンス10までの10個のセンテンスを含む1つの文書90のうち、「センテンス2」がイベントと因果関係があることを示すラベルが付与される。また、サブセット生成部802により、文書90から4個のセンテンスを含むサブセットが複数生成されることを想定する。
このように、複数のサブセットごとに、センテンスがターゲットとして選択される際に、正例および負例のラベルが付与された学習データを用意することができるため、1つの文書90をまとめて学習データとする場合よりも、学習データ数の増強(データオーギュメンテーション)を実現できる。
図10は、因果関係識別部804を実現する、学習対象となるネットワークモデルを示す。ネットワークモデルは、第1特徴量抽出層1001と、重み付き平均層1002と、結合(Concatenate)層1003と、第2特徴量抽出層1004と、因果関係識別層1005と、出力層1006とを含む。
ステップS1101では、取得部801が、イベントと、ラベル付き文書とを取得する。
ステップS1102では、サブセット生成部802が、ラベル付き文書に含まれる複数のセンテンスに基づいて、複数のサブセットを生成することで、学習データを生成する。サブセットの生成処理については、第1の実施形態と同様の処理を行えばよいため、説明を省略する。
ステップS1104では、選択部803が、処理対象のサブセットに含まれる複数のセンテンスからターゲットを選択する。
また、データ増強された学習データを用いてネットワークモデルを学習することで、より高精度な因果関係抽出を実行できる学習済みモデルを生成できる。
識別装置10および学習装置80は、CPU(Central Processing Unit)1201と、RAM(Random Access Memory)1202と、ROM(Read Only Memory)1203と、ストレージ1204と、表示装置1205と、入力装置1206と、通信装置1207とを含み、それぞれバスにより接続される。
通信装置1207は、CPU1201からの制御に応じて外部機器とネットワークを介して通信する。
また、記録媒体からコンピュータや組み込みシステムにインストールされたプログラムの指示に基づきコンピュータ上で稼働しているOS(オペレーティングシステム)や、データベース管理ソフト、ネットワーク等のMW(ミドルウェア)等が本実施形態を実現するための各処理の一部を実行してもよい。
さらに、本実施形態における記録媒体は、コンピュータあるいは組み込みシステムと独立した媒体に限らず、LANやインターネット等により伝達されたプログラムをダウンロードして記憶または一時記憶した記録媒体も含まれる。
また、記録媒体は1つに限られず、複数の媒体から本実施形態における処理が実行される場合も、本実施形態における記録媒体に含まれ、媒体の構成は何れの構成であってもよい。
また、本実施形態におけるコンピュータとは、パソコンに限らず、情報処理機器に含まれる演算処理装置、マイコン等も含み、プログラムによって本実施形態における機能を実現することが可能な機器、装置を総称している。
Claims (10)
- 処理対象となる事例を示すイベントと、複数のセンテンスを含む文書とを取得する取得部と、
前記複数のセンテンスの一部をグループ化したサブセットを複数生成する生成部と、
前記サブセットごとに、前記サブセットに含まれるセンテンスと前記イベントとの間の因果関係を識別する識別部と、
を具備する識別装置。 - 前記生成部は、前記イベントと前記文書に含まれる各センテンスとの間の類似度に基づき前記サブセットを生成する、請求項1に記載の識別装置。
- 前記生成部は、前記文書中の少なくとも1つのセンテンスが複数のサブセットに重複して含まれるように前記サブセットを生成する、請求項1または請求項2に記載の識別装置。
- 前記複数のサブセットそれぞれにおいて、対象となるセンテンスであるターゲットを選択する選択部をさらに具備し、
前記識別部は、前記イベントと前記ターゲットとの間の因果関係を識別する、請求項1から請求項3のいずれか1項に記載の識別装置。 - 前記サブセットごとに識別された因果関係に基づき、前記イベントと前記文書全体との因果関係を決定する決定部をさらに具備する、請求項1から請求項4のいずれか1項に記載の識別装置。
- 前記決定部は、前記サブセットごとに識別された因果関係の確信度を算出し、前記確信度に基づいて前記イベントと前記文書全体との因果関係を決定する、請求項5に記載の識別装置。
- 前記決定部は、前記サブセットごとに因果関係について複数の識別手段により複数の値を算出し、前記複数の値に関する投票により、前記イベントと前記文書全体との因果関係を決定する、請求項5または請求項6に記載の識別装置。
- 処理対象となる事例を示すイベントと、複数のセンテンスを含む文書とを取得し、
前記複数のセンテンスの一部をグループ化したサブセットを複数生成し、
前記サブセットごとに、前記サブセットに含まれるセンテンスと前記イベントとの間の因果関係を識別する、識別方法。 - コンピュータを、
処理対象となる事例を示すイベントと、複数のセンテンスを含む文書とを取得する取得手段と、
前記複数のセンテンスの一部をグループ化したサブセットを複数生成する生成手段と、
前記サブセットごとに、前記サブセットに含まれるセンテンスと前記イベントとの間の因果関係を識別する識別手段として機能させるための識別プログラム。 - 処理対象となる事例を示すイベントと、複数のセンテンスを含む文書であって、前記イベントと因果関係のあるセンテンスに関するラベルを含むラベル付き文書とを取得する取得部と、
前記ラベル付き文書に含まれる複数のセンテンスの一部をグループ化したサブセットを、複数生成する生成部と、
ネットワークモデルを用いて、前記サブセットごとに、前記サブセットに含まれるセンテンスと前記イベントとの間の因果関係の識別した値を出力する識別部と、
前記値と前記ラベルとの差分に関する誤差関数を最小化するように前記ネットワークモデルを学習し、学習済みモデルを生成する学習部と、
を具備する学習装置。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021133394A JP2023027985A (ja) | 2021-08-18 | 2021-08-18 | 識別装置、方法、プログラムおよび学習装置 |
US17/674,295 US20230059476A1 (en) | 2021-08-18 | 2022-02-17 | Discrimination apparatus, method and learning apparatus |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021133394A JP2023027985A (ja) | 2021-08-18 | 2021-08-18 | 識別装置、方法、プログラムおよび学習装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2023027985A true JP2023027985A (ja) | 2023-03-03 |
Family
ID=85228500
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021133394A Pending JP2023027985A (ja) | 2021-08-18 | 2021-08-18 | 識別装置、方法、プログラムおよび学習装置 |
Country Status (2)
Country | Link |
---|---|
US (1) | US20230059476A1 (ja) |
JP (1) | JP2023027985A (ja) |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6150282B2 (ja) * | 2013-06-27 | 2017-06-21 | 国立研究開発法人情報通信研究機構 | ノン・ファクトイド型質問応答システム及びコンピュータプログラム |
US11386358B2 (en) * | 2019-04-17 | 2022-07-12 | International Business Machines Corporation | Intelligent decision support system |
US20220004701A1 (en) * | 2021-06-22 | 2022-01-06 | Samsung Electronics Co., Ltd. | Electronic device and method for converting sentence based on a newly coined word |
-
2021
- 2021-08-18 JP JP2021133394A patent/JP2023027985A/ja active Pending
-
2022
- 2022-02-17 US US17/674,295 patent/US20230059476A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
US20230059476A1 (en) | 2023-02-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11120801B2 (en) | Generating dialogue responses utilizing an independent context-dependent additive recurrent neural network | |
Mueller et al. | Answering conversational questions on structured data without logical forms | |
CN111985239A (zh) | 实体识别方法、装置、电子设备及存储介质 | |
CN110597966A (zh) | 自动问答方法及装置 | |
CN112241626A (zh) | 一种语义匹配、语义相似度模型训练方法及装置 | |
US20220230061A1 (en) | Modality adaptive information retrieval | |
CN110678882A (zh) | 使用机器学习从电子文档选择回答跨距 | |
CN112463924B (zh) | 面向智能问答基于内部相关性编码的文本意图匹配方法 | |
CN116228383A (zh) | 风险预测方法及装置、存储介质和电子设备 | |
CN116467417A (zh) | 问题答案的生成方法、装置、设备及存储介质 | |
CN115359321A (zh) | 一种模型训练方法、装置、电子设备及存储介质 | |
CN116341651A (zh) | 实体识别模型训练方法、装置、电子设备及存储介质 | |
CN116186237A (zh) | 一种基于事件因果推断的实体关系的联合抽取方法 | |
CN112396092B (zh) | 一种众包开发者推荐方法和装置 | |
JP2022108008A (ja) | データ生成装置、方法および学習装置 | |
JP2023027985A (ja) | 識別装置、方法、プログラムおよび学習装置 | |
CN116561272A (zh) | 开放域视觉语言问答方法、装置、电子设备及存储介质 | |
CN111353295A (zh) | 序列标注方法、装置、存储介质及计算机设备 | |
CN112528003B (zh) | 一种基于语义排序和知识修正的多项选择问答方法 | |
KR102508131B1 (ko) | 지식그래프에 대한 그래프 연결강화 시스템 및 방법 | |
CN115617689A (zh) | 一种基于cnn模型和领域特征的软件缺陷定位方法 | |
CN112818688B (zh) | 文本处理方法、装置、设备及存储介质 | |
CN114254642A (zh) | 实体信息处理方法、装置、电子设备和介质 | |
KR102483927B1 (ko) | 계층적 단어 정보를 이용한 문장 인코딩 방법 및 장치 | |
US20230195723A1 (en) | Estimation apparatus, learning apparatus, estimation method, learning method and program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20230105 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20230315 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20231215 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20240109 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240311 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20240326 |