JP2018067199A - 要約生成装置、テキスト変換装置、方法、及びプログラム - Google Patents
要約生成装置、テキスト変換装置、方法、及びプログラム Download PDFInfo
- Publication number
- JP2018067199A JP2018067199A JP2016206254A JP2016206254A JP2018067199A JP 2018067199 A JP2018067199 A JP 2018067199A JP 2016206254 A JP2016206254 A JP 2016206254A JP 2016206254 A JP2016206254 A JP 2016206254A JP 2018067199 A JP2018067199 A JP 2018067199A
- Authority
- JP
- Japan
- Prior art keywords
- unit
- encoder
- directed acyclic
- node
- acyclic graph
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims description 36
- 238000004364 calculation method Methods 0.000 claims abstract description 39
- 238000006243 chemical reaction Methods 0.000 claims abstract description 31
- 238000010276 construction Methods 0.000 claims description 24
- 125000002015 acyclic group Chemical group 0.000 claims description 4
- 230000009466 transformation Effects 0.000 claims 2
- 239000013598 vector Substances 0.000 description 20
- 230000014509 gene expression Effects 0.000 description 13
- 230000008569 process Effects 0.000 description 13
- 238000012545 processing Methods 0.000 description 8
- 230000006870 function Effects 0.000 description 7
- 230000001174 ascending effect Effects 0.000 description 4
- 238000004519 manufacturing process Methods 0.000 description 4
- 238000013528 artificial neural network Methods 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 230000006403 short-term memory Effects 0.000 description 2
- 230000008901 benefit Effects 0.000 description 1
- FFBHFFJDDLITSX-UHFFFAOYSA-N benzyl N-[2-hydroxy-4-(3-oxomorpholin-4-yl)phenyl]carbamate Chemical compound OC1=C(NC(=O)OCC2=CC=CC=C2)C=CC(=C1)N1CCOCC1=O FFBHFFJDDLITSX-UHFFFAOYSA-N 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000007787 long-term memory Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
Landscapes
- Machine Translation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
まず、本発明の実施の形態における概要を説明する。
次に本発明の実施の形態に係る処理の概要について説明する。
要約文を生成したいテキストを受け付ける。
意味表現解析器を用いて入力されたテキストを意味表現(有向非循環グラフ形式)に変換する。
変換された意味表現に対し、有向非循環グラフの性質に則ってノードの順序付けを行う。
処理2で決定したノードの順序に従って符号器を構築し、意味表現の有向非循環グラフ上の各ノードの符号(固定長ベクトル)を計算 する。
処理3で得た意味表現の有向非循環グラフ上の各ノードの符号(固定長ベクトル)を用いて、系列復号器から文を生成する。
系列復号器により生成された文章を出力する。
符号化ユニットと復号化ユニット内のパラメタは、学習用データを使って決定する。学習後、パラメタは固定される。このパラメタが符号化の精度を決定する。
次に、本発明の実施の形態に係る要約生成装置の構成について説明する。図3に示すように、本発明の実施の形態に係る要約生成装置100は、CPUと、RAMと、後述する要約生成処理ルーチンを実行するためのプログラムや各種データを記憶したROMと、を含むコンピュータで構成することが出来る。この要約生成装置100は、機能的には図3に示すように入力部10と、演算部20と、出力部50とを備えている。
は、有向非循環グラフ中のk番目のノードに向かって有向エッジを持つノード番号の集合とする。このとき、有向非循環グラフ中のk番目のノードの符号(固定長ベクトル)は以下の計算式により計算される。
次に、本発明の実施の形態に係る要約生成装置100の作用について説明する。入力部10において入力テキストを受け付けると、要約生成装置100は、図8に示す要約生成処理ルーチンを実行する。
20 演算部
30 変換部
32 整列部
34 符号器構築部
36 符号器計算部
38 復号器計算部
50 出力部
100 要約生成装置
Claims (5)
- 入力テキストを、前記入力テキストの文法的又は意味的な構成である意味構造を表し、かつ、各ノードにラベルが付与された有向非循環グラフに変換し、前記入力テキストの単語系列を表す各ノードを含む系列構造を、前記有向非循環グラフに結合する変換部と、
前記変換部により得られた前記有向非循環グラフの各エッジの向きに基づいて、前記有向非循環グラフの各ノードを順序付ける整列部と、
前記整列部による各ノードの順序付けに沿って、各ノードに対応する、前記ノードのラベルを符号化する符号化ユニットを接続した符号器であって、かつ、前記符号化ユニットは、前段の少なくとも一つの前記符号化ユニットの出力と前記ノードのラベルとを入力とする前記符号器を構築する符号器構築部と、
前記整列部による各ノードの順序付けに沿って、各ノードのラベルを、前記符号器構築部によって構築された符号器の、対応する符号化ユニットに入力して順次計算して、前記有向非循環グラフの符号を出力する符号器計算部と、
前記符号器計算部から出力された前記有向非循環グラフの符号を、単語に復号する復号化ユニットの系列である系列復号器であって、かつ、前記復号化ユニットは、前段の前記復号化ユニットの出力を入力とする前記系列復号器に入力して、順次計算して、単語の系列を、前記入力テキストの要約として出力する復号器計算部と、
を含む要約生成装置。 - 入力テキストを、前記入力テキストの文法的又は意味的な構成である意味構造を表し、かつ、各ノードにラベルが付与された有向非循環グラフに変換し、前記入力テキストの単語系列を表す各ノードを含む系列構造を、前記有向非循環グラフに結合する変換部と、
前記変換部により得られた前記有向非循環グラフの各エッジの向きに基づいて、前記有向非循環グラフの各ノードを順序付ける整列部と、
前記整列部による各ノードの順序付けに沿って、各ノードに対応する、前記ノードのラベルを符号化する符号化ユニットを接続した符号器であって、かつ、前記符号化ユニットは、前段の少なくとも一つの前記符号化ユニットの出力と前記ノードのラベルとを入力とする前記符号器を構築する符号器構築部と、
前記整列部による各ノードの順序付けに沿って、各ノードのラベルを、前記符号器構築部によって構築された符号器の、対応する符号化ユニットに入力して順次計算して、前記有向非循環グラフの符号を出力する符号器計算部と、
前記符号器計算部から出力された前記有向非循環グラフの符号を、単語に復号する復号化ユニットの系列である系列復号器であって、かつ、前記復号化ユニットは、前段の前記復号化ユニットの出力を入力とする前記系列復号器に入力して、順次計算して、単語の系列を、変換後テキストとして出力する復号器計算部と、
を含むテキスト変換装置。 - 変換部が、入力テキストを、前記入力テキストの文法的又は意味的な構成である意味構造を表し、かつ、各ノードにラベルが付与された有向非循環グラフに変換し、前記入力テキストの単語系列を表す各ノードを含む系列構造を、前記有向非循環グラフに結合し、
整列部が、前記変換部により得られた前記有向非循環グラフの各エッジの向きに基づいて、前記有向非循環グラフの各ノードを順序付け、
符号器構築部が、前記整列部による各ノードの順序付けに沿って、各ノードに対応する、前記ノードのラベルを符号化する符号化ユニットを接続した符号器であって、かつ、前記符号化ユニットは、前段の少なくとも一つの前記符号化ユニットの出力と前記ノードのラベルとを入力とする前記符号器を構築し、
符号器計算部が、前記整列部による各ノードの順序付けに沿って、各ノードのラベルを、前記符号器構築部によって構築された符号器の、対応する符号化ユニットに入力して順次計算して、前記有向非循環グラフの符号を出力し、
復号器計算部が、前記符号器計算部から出力された前記有向非循環グラフの符号を、単語に復号する復号化ユニットの系列である系列復号器であって、かつ、前記復号化ユニットは、前段の前記復号化ユニットの出力を入力とする前記系列復号器に入力して、順次計算して、単語の系列を、前記入力テキストの要約として出力する
要約生成方法。 - 変換部が、入力テキストを、前記入力テキストの文法的又は意味的な構成である意味構造を表し、かつ、各ノードにラベルが付与された有向非循環グラフに変換し、前記入力テキストの単語系列を表す各ノードを含む系列構造を、前記有向非循環グラフに結合し、
整列部が、前記変換部により得られた前記有向非循環グラフの各エッジの向きに基づいて、前記有向非循環グラフの各ノードを順序付け、
符号器構築部が、前記整列部による各ノードの順序付けに沿って、各ノードに対応する、前記ノードのラベルを符号化する符号化ユニットを接続した符号器であって、かつ、前記符号化ユニットは、前段の少なくとも一つの前記符号化ユニットの出力と前記ノードのラベルとを入力とする前記符号器を構築し、
符号器計算部が、前記整列部による各ノードの順序付けに沿って、各ノードのラベルを、前記符号器構築部によって構築された符号器の、対応する符号化ユニットに入力して順次計算して、前記有向非循環グラフの符号を出力し、
復号器計算部が、前記符号器計算部から出力された前記有向非循環グラフの符号を、単語に復号する復号化ユニットの系列である系列復号器であって、かつ、前記復号化ユニットは、前段の前記復号化ユニットの出力を入力とする前記系列復号器に入力して、順次計算して、単語の系列を、変換後テキストとして出力する
テキスト変換方法。 - コンピュータを、請求項1に記載の要約生成装置、又は請求項2に記載のテキスト変換装置の各部として機能させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016206254A JP6635307B2 (ja) | 2016-10-20 | 2016-10-20 | 要約生成装置、テキスト変換装置、方法、及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016206254A JP6635307B2 (ja) | 2016-10-20 | 2016-10-20 | 要約生成装置、テキスト変換装置、方法、及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2018067199A true JP2018067199A (ja) | 2018-04-26 |
JP6635307B2 JP6635307B2 (ja) | 2020-01-22 |
Family
ID=62086144
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016206254A Active JP6635307B2 (ja) | 2016-10-20 | 2016-10-20 | 要約生成装置、テキスト変換装置、方法、及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6635307B2 (ja) |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109522403A (zh) * | 2018-11-05 | 2019-03-26 | 中山大学 | 一种基于融合编码的摘要文本生成方法 |
CN110298038A (zh) * | 2019-06-14 | 2019-10-01 | 北京奇艺世纪科技有限公司 | 一种文本打分方法及装置 |
JP2020087353A (ja) * | 2018-11-30 | 2020-06-04 | 富士通株式会社 | 要約文生成方法、要約文生成プログラム及び要約文生成装置 |
CN111414505A (zh) * | 2020-03-11 | 2020-07-14 | 上海爱数信息技术股份有限公司 | 一种基于序列生成模型的快速图像摘要生成方法 |
JP2020115303A (ja) * | 2019-01-18 | 2020-07-30 | ハーディス株式会社 | 自然言語の解析システム、解析方法およびプログラム |
CN111723196A (zh) * | 2020-05-21 | 2020-09-29 | 西北工业大学 | 基于多任务学习的单文档摘要生成模型构建方法及装置 |
CN113010666A (zh) * | 2021-03-18 | 2021-06-22 | 京东数字科技控股股份有限公司 | 摘要生成方法、装置、计算机系统及可读存储介质 |
JP2021197132A (ja) * | 2020-06-12 | 2021-12-27 | ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド | 知識表現学習方法、装置、電子機器、記憶媒体及びコンピュータプログラム |
JP2022051666A (ja) * | 2020-09-21 | 2022-04-01 | ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド | 要約生成方法、装置、プログラム、電子デバイス及び記憶媒体 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005276183A (ja) * | 2004-03-02 | 2005-10-06 | Microsoft Corp | グラフベースの順位付けを使用してテキスト内の単語および概念に順位付けする方法およびシステム |
-
2016
- 2016-10-20 JP JP2016206254A patent/JP6635307B2/ja active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005276183A (ja) * | 2004-03-02 | 2005-10-06 | Microsoft Corp | グラフベースの順位付けを使用してテキスト内の単語および概念に順位付けする方法およびシステム |
Non-Patent Citations (1)
Title |
---|
渡辺 太郎: "ニューラルネットワーク研究のフロンティア", 人工知能, vol. 31巻2号, JPN6019045177, 1 March 2016 (2016-03-01), JP, pages 202 - 209, ISSN: 0004158499 * |
Cited By (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109522403A (zh) * | 2018-11-05 | 2019-03-26 | 中山大学 | 一种基于融合编码的摘要文本生成方法 |
JP7211045B2 (ja) | 2018-11-30 | 2023-01-24 | 富士通株式会社 | 要約文生成方法、要約文生成プログラム及び要約文生成装置 |
JP2020087353A (ja) * | 2018-11-30 | 2020-06-04 | 富士通株式会社 | 要約文生成方法、要約文生成プログラム及び要約文生成装置 |
JP2020115303A (ja) * | 2019-01-18 | 2020-07-30 | ハーディス株式会社 | 自然言語の解析システム、解析方法およびプログラム |
JP7095874B2 (ja) | 2019-01-18 | 2022-07-05 | ハーディス株式会社 | 自然言語の解析システム、解析方法およびプログラム |
CN110298038B (zh) * | 2019-06-14 | 2022-12-06 | 北京奇艺世纪科技有限公司 | 一种文本打分方法及装置 |
CN110298038A (zh) * | 2019-06-14 | 2019-10-01 | 北京奇艺世纪科技有限公司 | 一种文本打分方法及装置 |
CN111414505B (zh) * | 2020-03-11 | 2023-10-20 | 上海爱数信息技术股份有限公司 | 一种基于序列生成模型的快速图像摘要生成方法 |
CN111414505A (zh) * | 2020-03-11 | 2020-07-14 | 上海爱数信息技术股份有限公司 | 一种基于序列生成模型的快速图像摘要生成方法 |
CN111723196A (zh) * | 2020-05-21 | 2020-09-29 | 西北工业大学 | 基于多任务学习的单文档摘要生成模型构建方法及装置 |
CN111723196B (zh) * | 2020-05-21 | 2023-03-24 | 西北工业大学 | 基于多任务学习的单文档摘要生成模型构建方法及装置 |
JP7220190B2 (ja) | 2020-06-12 | 2023-02-09 | ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド | 知識表現学習方法、装置、電子機器、記憶媒体及びコンピュータプログラム |
JP2021197132A (ja) * | 2020-06-12 | 2021-12-27 | ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド | 知識表現学習方法、装置、電子機器、記憶媒体及びコンピュータプログラム |
US11687718B2 (en) | 2020-06-12 | 2023-06-27 | Beijing Baidu Netcom Science And Technology Co., Ltd. | Method, apparatus, device, and storage medium for learning knowledge representation |
JP7178441B2 (ja) | 2020-09-21 | 2022-11-25 | ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド | 要約生成方法、装置、プログラム、電子デバイス及び記憶媒体 |
JP2022051666A (ja) * | 2020-09-21 | 2022-04-01 | ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド | 要約生成方法、装置、プログラム、電子デバイス及び記憶媒体 |
CN113010666A (zh) * | 2021-03-18 | 2021-06-22 | 京东数字科技控股股份有限公司 | 摘要生成方法、装置、计算机系统及可读存储介质 |
CN113010666B (zh) * | 2021-03-18 | 2023-12-08 | 京东科技控股股份有限公司 | 摘要生成方法、装置、计算机系统及可读存储介质 |
Also Published As
Publication number | Publication date |
---|---|
JP6635307B2 (ja) | 2020-01-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6635307B2 (ja) | 要約生成装置、テキスト変換装置、方法、及びプログラム | |
CN110309287B (zh) | 建模对话轮次信息的检索式闲聊对话打分方法 | |
Liu et al. | A recursive recurrent neural network for statistical machine translation | |
CN109661664B (zh) | 一种信息处理的方法及相关装置 | |
CN109740158B (zh) | 一种文本语义解析方法及装置 | |
Kong et al. | Transforming dependencies into phrase structures | |
CN111382574B (zh) | 一种虚拟现实与增强现实场景下结合句法的语义解析系统 | |
CN112989796A (zh) | 一种基于句法指导的文本命名实体信息识别方法 | |
CN114489669A (zh) | 一种基于图学习的Python语言代码片段生成方法 | |
CN113641819A (zh) | 基于多任务稀疏共享学习的论辩挖掘系统及方法 | |
CN115935957B (zh) | 一种基于句法分析的句子语法纠错方法及系统 | |
CN115238045B (zh) | 一种生成式事件论元抽取方法、系统及存储介质 | |
CN111813923A (zh) | 文本摘要方法、电子设备及存储介质 | |
WO2020040255A1 (ja) | 単語符号化装置、解析装置、言語モデル学習装置、方法、及びプログラム | |
CN110516053B (zh) | 对话处理方法、设备及计算机存储介质 | |
CN115455197A (zh) | 一种融合位置感知细化的对话关系抽取方法 | |
JP6550677B2 (ja) | 符号化装置、復号化装置、離散系列変換装置、方法、及びプログラム | |
CN114757181B (zh) | 基于先验知识端到端的事件抽取模型的训练、事件抽取方法及装置 | |
CN116629283A (zh) | 文本翻译方法和装置、计算机设备及存储介质 | |
CN116955644A (zh) | 基于知识图谱的知识融合方法、系统及存储介质 | |
CN114611529B (zh) | 意图识别方法和装置、电子设备及存储介质 | |
CN115374784A (zh) | 一种多模态信息选择性融合的中文命名实体识别方法 | |
JP6633999B2 (ja) | 符号器学習装置、変換装置、方法、及びプログラム | |
CN114239548A (zh) | 一种融合依存句法和指针生成网络的三元组抽取方法 | |
Dadas et al. | A deep learning model with data enrichment for intent detection and slot filling |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20161024 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20181210 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20181210 |
|
TRDD | Decision of grant or rejection written | ||
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20191120 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20191126 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20191204 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6635307 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |