JP2018190188A - 要約生成装置、要約生成方法及びコンピュータプログラム - Google Patents
要約生成装置、要約生成方法及びコンピュータプログラム Download PDFInfo
- Publication number
- JP2018190188A JP2018190188A JP2017092146A JP2017092146A JP2018190188A JP 2018190188 A JP2018190188 A JP 2018190188A JP 2017092146 A JP2017092146 A JP 2017092146A JP 2017092146 A JP2017092146 A JP 2017092146A JP 2018190188 A JP2018190188 A JP 2018190188A
- Authority
- JP
- Japan
- Prior art keywords
- text
- word
- word vector
- sequence
- storage device
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims description 79
- 238000004590 computer program Methods 0.000 title claims description 18
- 239000013598 vector Substances 0.000 claims abstract description 146
- 238000013528 artificial neural network Methods 0.000 claims abstract description 27
- 238000006243 chemical reaction Methods 0.000 claims abstract description 16
- 230000004044 response Effects 0.000 claims abstract description 12
- 238000010801 machine learning Methods 0.000 claims abstract description 6
- 230000006870 function Effects 0.000 claims description 16
- 238000005516 engineering process Methods 0.000 abstract description 9
- 238000004458 analytical method Methods 0.000 description 29
- 238000012545 processing Methods 0.000 description 28
- 238000013527 convolutional neural network Methods 0.000 description 18
- 238000013500 data storage Methods 0.000 description 18
- 238000010586 diagram Methods 0.000 description 14
- 230000000694 effects Effects 0.000 description 8
- 230000015654 memory Effects 0.000 description 8
- 230000000877 morphologic effect Effects 0.000 description 8
- 239000000284 extract Substances 0.000 description 7
- 238000011176 pooling Methods 0.000 description 6
- 238000001514 detection method Methods 0.000 description 5
- 238000000605 extraction Methods 0.000 description 4
- 239000011159 matrix material Substances 0.000 description 4
- 238000013473 artificial intelligence Methods 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 3
- 239000000126 substance Substances 0.000 description 3
- 238000012706 support-vector machine Methods 0.000 description 3
- 238000011161 development Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000003058 natural language processing Methods 0.000 description 2
- 239000002245 particle Substances 0.000 description 2
- 230000006403 short-term memory Effects 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- 238000013519 translation Methods 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000004836 empirical method Methods 0.000 description 1
- 230000007787 long-term memory Effects 0.000 description 1
- 230000001537 neural effect Effects 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/34—Browsing; Visualisation therefor
- G06F16/345—Summarisation for human users
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/268—Morphological analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/047—Probabilistic or stochastic networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- Molecular Biology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Evolutionary Computation (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Databases & Information Systems (AREA)
- Probability & Statistics with Applications (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Machine Translation (AREA)
Abstract
【解決手段】要約生成装置は、テキストを、その注目箇所を示す情報とともに記憶するテキスト記憶装置と、テキストの各単語をベクトル化し、当該単語が注目箇所か否かを示す要素をベクトルに追加して、テキストを単語ベクトル列に変換するための単語ベクトル変換部834及び836と、シーケンス・ツー・シーケンス型の変換を行うニューラルネットワークからなり、単語ベクトル列の各単語ベクトルが所定の順番で入力されたことに応答して、当該単語ベクトル列が表す単語からなるテキストの要約を出力するよう、予め機械学習により学習済のLSTMと、単語ベクトル列の各単語ベクトルを所定の順番でニューラルネットワークに入力する入力部838〜848とを含む。
【選択図】図18
Description
<構成>
図1を参照して、以下に述べる第1の実施の形態に係るテキスト要約システム30は、テキスト集合記憶装置40に記憶されたテキストに含まれる、問題を記述した箇所の候補(問題記述候補)を問題記述候補抽出器46により抽出した後、それら問題記述候補が真に問題を記述しているか否かをMCNNからなる問題記述判定器50により判定する。MCNNについては後述する。なお、本実施の形態では特定の事項として問題記述を検出し、それに基づいて要約を作成する。しかし本発明はそのような実施の形態には限定されない。様々な手法で検出できる特定事項であれば、それに基づいて要約を作成できる。
以上、構成を説明したテキスト要約システム30は以下のように動作する。テキスト要約システム30の動作フェーズは大きく分けて2つある。第1は学習フェーズ、第2は要約作成フェーズである。
学習フェーズはさらに3つに分かれる。第1は問題記述判定器50の学習であり、第2は重要箇所抽出器56の学習であり、第3は要約器62の学習である。
問題記述判定器50の学習は以下のようにして行われる。図3を参照して、最初に、学習用のテキストをテキスト集合記憶装置130に記憶し、名詞極性辞書132及びテンプレート極性辞書134を準備する。問題記述候補抽出器140が以下のようにしてテキスト集合記憶装置130の各テキストを読み、名詞極性辞書132とテンプレート極性辞書134を参照してこれらテキスト中で問題記述の候補を見つけ、その箇所を含む前後の3文からなる問題記述候補を抽出する。
図11に示す重要箇所抽出器MCNN学習部58により図1に示す重要箇所抽出器56の学習を行うためには、図11を参照して、最初に複数の要約対象テキストを集め、要約対象テキスト記憶装置500に記憶させておく。これら要約対象テキストの各々について、複数人(本実施の形態では3人)の要約作成者により要約を作成する(要約作成処理502)。作成された要約は、要約対象テキストに関連付けて要約記憶装置504に記憶させる。この要約作成の際には、ある制約にしたがって行うことは前述したとおりである。
図17を参照して、要約器62の実体を構成する要約器LSTMの学習を行う処理(要約器LSTM学習部64に相当)は以下のように行われる。この処理に先立って、要約対象テキストと、各要約対象テキストに対して人手で3つずつ作成された要約とが記憶装置に記憶されている必要がある。要約対象テキストの各々の各単語には、問題記述の箇所と重要箇所とをそれ以外に対して識別するフラグが付されている。
図1を参照して、テキスト集合記憶装置40に要約作成の対象となるテキストを格納し、名詞極性辞書42とテンプレート極性辞書44を予め準備しておく。テキスト集合記憶装置40に格納された各文に対して、問題記述候補抽出器46が名詞極性辞書42及びテンプレート極性辞書44を参照しながら問題記述の候補を抽出し、問題記述の候補を含む文とその前後の文からなる3文を要約対象テキスト候補として抽出し問題記述候補記憶装置48に格納する。
上記実施の形態に係る要約作成システム及びその各構成要素は、コンピュータハードウェアと、そのコンピュータハードウェア上で実行されるコンピュータプログラムとにより実現できる。図19はこのコンピュータシステム930の外観を示し、図20はコンピュータシステム930の内部構成を示す。
上記した実施の形態のテキスト要約システム30によれば、要約対象テキストから要約を作成するにあたり、要約対象テキスト中の問題記述の箇所と、さらにその問題記述に対して重要な箇所とが特定され、他の単語と区別したフラグが付された単語ベクトルとしてLSTMへの入力が行われる。その結果、要約対象テキストに含まれる問題記述に関連した視点から要約が作成され、従来よりもテキストの内容をより適切に表す要約を得ることができる。
42、132 名詞極性辞書
44、134 テンプレート極性辞書
46、140 問題記述候補抽出器
50 問題記述判定器
52 問題記述判定器MCNN学習部
56 重要箇所抽出器
58 重要箇所抽出器MCNN学習部
60、510 マーク済要約対象テキスト記憶装置
62 要約器
64 要約器LSTM学習部
130 テキスト集合記憶装置
144 人手による分類処理
150、512 学習データ生成部
152、514、516 学習データ記憶装置
160 制御部
164 テキスト読出部
166 形態素解析部
168 係り受け関係解析部
170 解析後文
172 第1−第11の単語列生成部
174 単語ベクトル変換部
176 フラグ付加部
178 学習データ出力部
214 MCNN
504 要約記憶装置
506 重要箇所選択部
508 要約対象テキストマーキング部
518、522 学習処理部
520、524 重要箇所検出器
540、702 要約対象テキスト
700、706 LSTM
704 アテンション層
708 単語列
Claims (6)
- テキストの要約を生成する要約生成装置であって、
前記テキストを、当該テキストの内の注目箇所を示す情報とともに記憶するテキスト記憶装置と、
前記テキストの各単語を、予め定める方法によりベクトル化し、さらに、当該単語が前記注目箇所か否かを示す要素を前記ベクトルに追加することにより、前記テキストを単語ベクトル列に変換するための単語ベクトル変換手段と、
シーケンス・ツー・シーケンス型の変換を行うニューラルネットワークからなり、単語ベクトル列の各単語ベクトルが所定の順番で入力されたことに応答して、当該単語ベクトル列が表す単語からなるテキストの要約を出力するよう、予め機械学習により学習済の要約手段と、
前記単語ベクトル変換手段により変換された単語ベクトル列の各単語ベクトルを前記所定の順番で前記ニューラルネットワークに入力するための入力手段とを含む、要約生成装置。 - 前記テキスト記憶装置は、前記テキストとともに、当該テキストの複数箇所の前記注目箇所を示す情報を記憶可能である、請求項1に記載の要約生成装置。
- 前記ニューラルネットワークは、再帰型ニューラルネットワークである、請求項1又は請求項2に記載の要約生成装置。
- 前記再帰型ニューラルネットワークはLSTMである、請求項3に記載の要約生成装置。
- コンピュータを用いてテキストの要約を生成する要約生成方法であって、
コンピュータが、前記テキストを、当該テキストの内の注目箇所を示す情報とともにテキスト記憶装置に記憶するステップと、
コンピュータが、前記テキスト記憶装置に記憶された前記テキストの各単語を、予め定める方法によりベクトル化し、さらに、当該単語が前記注目箇所か否かを示す要素を前記ベクトルに追加することにより、前記テキストを単語ベクトル列に変換するステップと、
コンピュータが、シーケンス・ツー・シーケンス型の変換を行うニューラルネットワークからなり、単語ベクトル列の各単語ベクトルが所定の順番で入力されたことに応答して、当該単語ベクトル列が表す単語からなるテキストの要約を出力するよう、予め機械学習により学習済の要約プログラムを呼び出すステップと、
コンピュータが、前記単語ベクトル列の各単語ベクトルを前記所定の順番で前記ニューラルネットワークに入力し、当該入力に応答して前記ニューラルネットワークの出力する単語列を前記テキストの要約として得るステップとを含む、要約生成方法。 - コンピュータに、請求項5に記載の要約生成方法を実行するよう機能させる、コンピュータプログラム。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017092146A JP6842167B2 (ja) | 2017-05-08 | 2017-05-08 | 要約生成装置、要約生成方法及びコンピュータプログラム |
US16/610,916 US11106714B2 (en) | 2017-05-08 | 2018-05-07 | Summary generating apparatus, summary generating method and computer program |
PCT/JP2018/017606 WO2018207723A1 (ja) | 2017-05-08 | 2018-05-07 | 要約生成装置、要約生成方法及びコンピュータプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017092146A JP6842167B2 (ja) | 2017-05-08 | 2017-05-08 | 要約生成装置、要約生成方法及びコンピュータプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2018190188A true JP2018190188A (ja) | 2018-11-29 |
JP6842167B2 JP6842167B2 (ja) | 2021-03-17 |
Family
ID=64104725
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017092146A Active JP6842167B2 (ja) | 2017-05-08 | 2017-05-08 | 要約生成装置、要約生成方法及びコンピュータプログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US11106714B2 (ja) |
JP (1) | JP6842167B2 (ja) |
WO (1) | WO2018207723A1 (ja) |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110348016A (zh) * | 2019-07-15 | 2019-10-18 | 昆明理工大学 | 基于句子关联注意力机制的文本摘要生成方法 |
CN111178053A (zh) * | 2019-12-30 | 2020-05-19 | 电子科技大学 | 一种结合语义和文本结构进行生成式摘要抽取的文本生成方法 |
CN111274793A (zh) * | 2018-11-19 | 2020-06-12 | 阿里巴巴集团控股有限公司 | 一种文本处理方法、装置以及计算设备 |
JP2020101936A (ja) * | 2018-12-20 | 2020-07-02 | ヤフー株式会社 | 提供装置、提供方法、及び提供プログラム |
JP2020520492A (ja) * | 2018-03-08 | 2020-07-09 | 平安科技(深▲せん▼)有限公司Ping An Technology (Shenzhen) Co.,Ltd. | 文書要約自動抽出方法、装置、コンピュータ機器及び記憶媒体 |
JP2020140469A (ja) * | 2019-02-28 | 2020-09-03 | 富士ゼロックス株式会社 | 学習装置及び学習プログラム並びに文生成装置及び文生成プログラム |
KR20210043406A (ko) * | 2019-10-11 | 2021-04-21 | 숭실대학교산학협력단 | 문서 맥락 기반 커버리지를 이용한 자동 요약 방법, 이를 수행하기 위한 기록 매체 및 장치 |
WO2021176549A1 (ja) * | 2020-03-03 | 2021-09-10 | 日本電信電話株式会社 | 文生成装置、文生成学習装置、文生成方法、文生成学習方法及びプログラム |
JP2022511593A (ja) * | 2019-10-28 | 2022-02-01 | バイドゥ オンライン ネットワーク テクノロジー(ペキン) カンパニー リミテッド | Poi状態情報を取得する方法、装置、デバイス、プログラム及びコンピュータ記憶媒体 |
Families Citing this family (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10664472B2 (en) * | 2018-06-27 | 2020-05-26 | Bitdefender IPR Management Ltd. | Systems and methods for translating natural language sentences into database queries |
CN109766434B (zh) * | 2018-12-29 | 2020-12-11 | 北京百度网讯科技有限公司 | 摘要生成方法及装置 |
US20200402116A1 (en) * | 2019-06-19 | 2020-12-24 | Reali Inc. | System, method, computer program product or platform for efficient real estate value estimation and/or optimization |
US11281854B2 (en) * | 2019-08-21 | 2022-03-22 | Primer Technologies, Inc. | Limiting a dictionary used by a natural language model to summarize a document |
CN110716964A (zh) * | 2019-09-19 | 2020-01-21 | 卓尔智联(武汉)研究院有限公司 | 基于gru网络的新生儿取名方法、电子设备及存储介质 |
US20220343076A1 (en) * | 2019-10-02 | 2022-10-27 | Nippon Telegraph And Telephone Corporation | Text generation apparatus, text generation learning apparatus, text generation method, text generation learning method and program |
CN111026861B (zh) * | 2019-12-10 | 2023-07-04 | 腾讯科技(深圳)有限公司 | 文本摘要的生成方法、训练方法、装置、设备及介质 |
CN111046168B (zh) * | 2019-12-19 | 2023-12-01 | 智慧芽信息科技(苏州)有限公司 | 用于生成专利概述信息的方法、装置、电子设备和介质 |
CN111461904B (zh) * | 2020-04-17 | 2022-06-21 | 支付宝(杭州)信息技术有限公司 | 对象类别的分析方法及装置 |
CN111538829B (zh) * | 2020-04-27 | 2021-04-20 | 众能联合数字技术有限公司 | 一种新的工程机械租赁场景网页文本关键内容提取方法 |
US10885436B1 (en) * | 2020-05-07 | 2021-01-05 | Google Llc | Training text summarization neural networks with an extracted segments prediction objective |
US11397892B2 (en) * | 2020-05-22 | 2022-07-26 | Servicenow Canada Inc. | Method of and system for training machine learning algorithm to generate text summary |
CN111813924B (zh) * | 2020-07-09 | 2021-04-09 | 四川大学 | 基于可扩展动态选择与注意力机制的类别检测算法及系统 |
CN111858914B (zh) * | 2020-07-27 | 2021-07-30 | 湖南大学 | 一种基于句级评估的文本摘要生成方法和系统 |
CN112818113A (zh) * | 2021-01-26 | 2021-05-18 | 山西三友和智慧信息技术股份有限公司 | 一种基于异构图网络的文本自动摘要方法 |
CN113806627A (zh) * | 2021-03-12 | 2021-12-17 | 京东科技控股股份有限公司 | 兴趣点的类型识别方法、装置、计算机设备及存储介质 |
CN113076127B (zh) * | 2021-04-25 | 2023-08-29 | 南京大学 | 编程环境下问答内容的提取方法、系统、电子设备及介质 |
US11586805B2 (en) * | 2021-07-26 | 2023-02-21 | Atlassian Pty Ltd. | Machine-learning-based natural language processing techniques for low-latency document summarization |
CN113761934B (zh) * | 2021-07-29 | 2023-03-31 | 华为技术有限公司 | 一种基于自注意力机制的词向量表示方法及自注意力模型 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH1153396A (ja) * | 1997-07-29 | 1999-02-26 | Just Syst Corp | 文書処理装置、文書処理プログラムが記憶された記憶媒体および文書処理方法 |
JP2011221728A (ja) * | 2010-04-08 | 2011-11-04 | Hitachi Ltd | 文書分析装置及び文書分析方法 |
Family Cites Families (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3579204B2 (ja) * | 1997-01-17 | 2004-10-20 | 富士通株式会社 | 文書要約装置およびその方法 |
JP2002169834A (ja) * | 2000-11-20 | 2002-06-14 | Hewlett Packard Co <Hp> | 文書のベクトル解析を行うコンピュータおよび方法 |
JP2002236681A (ja) * | 2001-02-09 | 2002-08-23 | Inst Of Physical & Chemical Res | 日常言語コンピューティングシステムおよびその方法 |
WO2010035412A1 (ja) * | 2008-09-25 | 2010-04-01 | 日本電気株式会社 | 情報分析装置、情報分析方法、及びプログラム |
US10146751B1 (en) * | 2014-12-31 | 2018-12-04 | Guangsheng Zhang | Methods for information extraction, search, and structured representation of text data |
JP6775935B2 (ja) * | 2015-11-04 | 2020-10-28 | 株式会社東芝 | 文書処理装置、方法、およびプログラム |
US10509860B2 (en) * | 2016-02-10 | 2019-12-17 | Weber State University Research Foundation | Electronic message information retrieval system |
US20180033425A1 (en) * | 2016-07-28 | 2018-02-01 | Fujitsu Limited | Evaluation device and evaluation method |
US10402495B1 (en) * | 2016-09-01 | 2019-09-03 | Facebook, Inc. | Abstractive sentence summarization |
US10474709B2 (en) * | 2017-04-14 | 2019-11-12 | Salesforce.Com, Inc. | Deep reinforced model for abstractive summarization |
CN108509413A (zh) * | 2018-03-08 | 2018-09-07 | 平安科技(深圳)有限公司 | 文摘自动提取方法、装置、计算机设备及存储介质 |
US10909157B2 (en) * | 2018-05-22 | 2021-02-02 | Salesforce.Com, Inc. | Abstraction of text summarization |
US11380300B2 (en) * | 2019-10-11 | 2022-07-05 | Samsung Electronics Company, Ltd. | Automatically generating speech markup language tags for text |
-
2017
- 2017-05-08 JP JP2017092146A patent/JP6842167B2/ja active Active
-
2018
- 2018-05-07 WO PCT/JP2018/017606 patent/WO2018207723A1/ja active Application Filing
- 2018-05-07 US US16/610,916 patent/US11106714B2/en active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH1153396A (ja) * | 1997-07-29 | 1999-02-26 | Just Syst Corp | 文書処理装置、文書処理プログラムが記憶された記憶媒体および文書処理方法 |
JP2011221728A (ja) * | 2010-04-08 | 2011-11-04 | Hitachi Ltd | 文書分析装置及び文書分析方法 |
Non-Patent Citations (1)
Title |
---|
吉岡 重紀 外: "生成型一文要約のためのマルチアテンションモデルの提案", 第8回データ工学と情報マネジメントに関するフォーラム (第14回日本データベース学会年次大会) [O, JPN6020041473, 2 March 2016 (2016-03-02), JP, pages 1 - 7, ISSN: 0004376414 * |
Cited By (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2020520492A (ja) * | 2018-03-08 | 2020-07-09 | 平安科技(深▲せん▼)有限公司Ping An Technology (Shenzhen) Co.,Ltd. | 文書要約自動抽出方法、装置、コンピュータ機器及び記憶媒体 |
CN111274793A (zh) * | 2018-11-19 | 2020-06-12 | 阿里巴巴集团控股有限公司 | 一种文本处理方法、装置以及计算设备 |
JP2020101936A (ja) * | 2018-12-20 | 2020-07-02 | ヤフー株式会社 | 提供装置、提供方法、及び提供プログラム |
JP7142559B2 (ja) | 2018-12-20 | 2022-09-27 | ヤフー株式会社 | 提供装置、提供方法、及び提供プログラム |
JP7322428B2 (ja) | 2019-02-28 | 2023-08-08 | 富士フイルムビジネスイノベーション株式会社 | 学習装置及び学習プログラム並びに文生成装置及び文生成プログラム |
JP2020140469A (ja) * | 2019-02-28 | 2020-09-03 | 富士ゼロックス株式会社 | 学習装置及び学習プログラム並びに文生成装置及び文生成プログラム |
CN110348016B (zh) * | 2019-07-15 | 2022-06-14 | 昆明理工大学 | 基于句子关联注意力机制的文本摘要生成方法 |
CN110348016A (zh) * | 2019-07-15 | 2019-10-18 | 昆明理工大学 | 基于句子关联注意力机制的文本摘要生成方法 |
KR102501446B1 (ko) * | 2019-10-11 | 2023-02-21 | 숭실대학교 산학협력단 | 문서 맥락 기반 커버리지를 이용한 자동 요약 방법, 이를 수행하기 위한 기록 매체 및 장치 |
KR20210043406A (ko) * | 2019-10-11 | 2021-04-21 | 숭실대학교산학협력단 | 문서 맥락 기반 커버리지를 이용한 자동 요약 방법, 이를 수행하기 위한 기록 매체 및 장치 |
JP2022511593A (ja) * | 2019-10-28 | 2022-02-01 | バイドゥ オンライン ネットワーク テクノロジー(ペキン) カンパニー リミテッド | Poi状態情報を取得する方法、装置、デバイス、プログラム及びコンピュータ記憶媒体 |
JP7214949B2 (ja) | 2019-10-28 | 2023-01-31 | バイドゥ オンライン ネットワーク テクノロジー(ペキン) カンパニー リミテッド | Poi状態情報を取得する方法、装置、デバイス、プログラム及びコンピュータ記憶媒体 |
US11709999B2 (en) | 2019-10-28 | 2023-07-25 | Baidu Online Network Technology (Beijing) Co., Ltd. | Method and apparatus for acquiring POI state information, device and computer storage medium |
CN111178053A (zh) * | 2019-12-30 | 2020-05-19 | 电子科技大学 | 一种结合语义和文本结构进行生成式摘要抽取的文本生成方法 |
WO2021176549A1 (ja) * | 2020-03-03 | 2021-09-10 | 日本電信電話株式会社 | 文生成装置、文生成学習装置、文生成方法、文生成学習方法及びプログラム |
JP7405234B2 (ja) | 2020-03-03 | 2023-12-26 | 日本電信電話株式会社 | 文生成装置、文生成学習装置、文生成方法、文生成学習方法及びプログラム |
Also Published As
Publication number | Publication date |
---|---|
WO2018207723A1 (ja) | 2018-11-15 |
US11106714B2 (en) | 2021-08-31 |
US20200159755A1 (en) | 2020-05-21 |
JP6842167B2 (ja) | 2021-03-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2018207723A1 (ja) | 要約生成装置、要約生成方法及びコンピュータプログラム | |
Wang et al. | Mathdqn: Solving arithmetic word problems via deep reinforcement learning | |
EP3926531B1 (en) | Method and system for visio-linguistic understanding using contextual language model reasoners | |
KR20180062321A (ko) | 딥러닝-기반 키워드에 연관된 단어를 도출하는 방법과 컴퓨터프로그램 | |
CN111444320A (zh) | 文本检索方法、装置、计算机设备和存储介质 | |
JP2004110161A (ja) | テキスト文比較装置 | |
Lin et al. | Deep structured scene parsing by learning with image descriptions | |
US10528664B2 (en) | Preserving and processing ambiguity in natural language | |
CN106778878B (zh) | 一种人物关系分类方法及装置 | |
KR20180094664A (ko) | 텍스트 데이터로부터 정보를 추출하기 위한 정보 추출 방법 및 장치 | |
CN111475622A (zh) | 一种文本分类方法、装置、终端及存储介质 | |
US20220414463A1 (en) | Automated troubleshooter | |
Banik et al. | Gru based named entity recognition system for bangla online newspapers | |
KR20210034679A (ko) | 엔티티-속성 관계 식별 | |
CN111274829A (zh) | 一种利用跨语言信息的序列标注方法 | |
JP6867963B2 (ja) | 要約評価装置、方法、プログラム、及び記憶媒体 | |
CN110909174B (zh) | 一种基于知识图谱的简单问答中实体链接的改进方法 | |
JP2006330935A (ja) | 学習データ作成プログラム、学習データ作成方法および学習データ作成装置 | |
CN109902162B (zh) | 基于数字指纹的文本相似性的识别方法、存储介质及装置 | |
Zhang et al. | Modeling the relationship between user comments and edits in document revision | |
CN113392220B (zh) | 一种知识图谱生成方法、装置、计算机设备及存储介质 | |
KR102299001B1 (ko) | 문장의 중의성을 해결하고 생략된 문법 요소를 함께 표시하는 사용자 맞춤형 번역 방법 및 그 장치 | |
CN114201957A (zh) | 文本情感分析方法、装置及计算机可读存储介质 | |
CN113420127A (zh) | 威胁情报处理方法、装置、计算设备及存储介质 | |
CN113011141A (zh) | 佛经注解模型训练方法、佛经注解生成方法及相关设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200414 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20201110 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210202 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210212 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6842167 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |