JP2019061656A - 要約文自動生成方法、装置及び電子デバイス - Google Patents
要約文自動生成方法、装置及び電子デバイス Download PDFInfo
- Publication number
- JP2019061656A JP2019061656A JP2018134689A JP2018134689A JP2019061656A JP 2019061656 A JP2019061656 A JP 2019061656A JP 2018134689 A JP2018134689 A JP 2018134689A JP 2018134689 A JP2018134689 A JP 2018134689A JP 2019061656 A JP2019061656 A JP 2019061656A
- Authority
- JP
- Japan
- Prior art keywords
- feature
- features
- vector
- syntactic
- document
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/211—Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Machine Translation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【解決手段】本発明の要約文自動生成方法は、処理の対象となるドキュメントの字句特徴を抽出し、ドキュメントの構文特徴を抽出し、ドキュメントの単語ベクトルを生成し、字句特徴のベクトル表示及び構文特徴のベクトル表示を形成し、単語ベクトルと、字句特徴のベクトル表示及び構文特徴のベクトル表示とを接続し、処理の対象となる情報を形成し、情報をエンコーダの入力として処理し、ドキュメントの要約文を生成するステップを含む。
【選択図】図1
Description
処理の対象となるドキュメントの字句特徴を抽出し;
前記ドキュメントの構文特徴を抽出し;
前記ドキュメントの単語ベクトルを生成し、前記字句特徴のベクトル表示及び前記構文特徴のベクトル表示を形成し;
前記単語ベクトルと、前記字句特徴のベクトル表示及び前記構文特徴のベクトル表示とを接続し、処理の対象となる情報を形成し;
前記情報をエンコーダの入力として処理し、前記ドキュメントの要約文を生成することを特徴とする要約文自動生成方法を提供する。
前記字句特徴と前記構文特徴における連続値特徴及び発散値特徴を求め;
ワン・ホットで前記発散値特徴を表示し;
前記連続値特徴を目標発散値特徴に変換してワン・ホットで表示するステップを含む。
前記連続値特徴を予め数が設定される円筒に割り当てて目標発散値特徴に変換し;
前記連続値特徴における目標連続値特徴を発散値特徴に変換するための円筒の番号をワン・ホットで表示するステップを含む。
前記ドキュメントにおける単語毎に、各単語に対応する単語ベクトルと、字句特徴のベクトル表示と、構文特徴ベクトル表示とを首尾で接続して1つのベクトルとし、形成される複数のベクトルを前記処理の対象となる情報とするステップを含む。
処理の対象となるドキュメントの字句特徴を抽出する第1の抽出モジュールと、
前記ドキュメントの構文特徴を抽出する第2の抽出モジュールと、
前記ドキュメントの単語ベクトルを生成し、前記字句特徴のベクトル表示及び前記構文特徴のベクトル表示を形成する生成モジュールと、
前記単語ベクトルと、前記字句特徴のベクトル表示及び前記構文特徴のベクトル表示とを接続して、処理の対象となる情報を形成する接続モジュールと、
前記情報をエンコーダの入力として処理し、前記ドキュメントの要約文を生成する処理モジュールと、を含むことを特徴とする要約文自動生成装置を提供する。
処理の対象となるドキュメントの字句特徴を抽出するステップと、
前記ドキュメントの構文特徴を抽出するステップと、
前記ドキュメントの単語ベクトルを生成し、前記字句特徴のベクトル表示及び前記構文特徴のベクトル表示を形成するステップと、
前記単語ベクトルと、前記字句特徴のベクトル表示及び前記構文特徴のベクトル表示とを接続して、処理の対象となる情報を形成するステップと、
前記情報をエンコーダの入力として処理し、前記ドキュメントの要約文を生成するステップと、が実行されることを特徴とする電子デバイスを提供する。
処理の対象となるドキュメントの字句特徴を抽出し;
前記ドキュメントの構文特徴を抽出し;
前記ドキュメントの単語ベクトルを生成し、前記字句特徴のベクトル表示及び前記構文特徴のベクトル表示を形成し;
前記単語ベクトルと、前記字句特徴のベクトル表示及び前記構文特徴のベクトル表示とを接続して、処理の対象となる情報を形成し;
前記情報をエンコーダの入力として処理し、前記ドキュメントの要約文を生成するステップを実行させられることを特徴とする記憶媒体を提供する。
処理の対象となるドキュメントの字句特徴を抽出する第1の抽出モジュール501と、
前記ドキュメントの構文特徴を抽出する第2の抽出モジュール502と、
前記ドキュメントの単語ベクトルを生成し、前記字句特徴のベクトル表示及び前記構文特徴のベクトル表示を形成する生成モジュール503と、
前記単語ベクトルと、前記字句特徴のベクトル表示及び前記構文特徴のベクトル表示とを接続して、処理の対象となる情報を形成する接続モジュール504と、
前記情報をエンコーダの入力として処理し、前記ドキュメントの要約文を生成する処理モジュール505と、を含む。
ドキュメントの単語ベクトルを生成する第1の生成サブモジュール5031と、
前記字句特徴と前記構文特徴における連続値特徴と発散値特徴を求める第2の生成サブモジュール5032と、
ワン・ホットで前記発散値特徴を表示する第1の処理サブモジュール5033と、
前記連続値特徴を目標発散値特徴に変換してワン・ホットで表示する第2の処理サブモジュール5034と、を備える。
前記連続値特徴を予め数が設定される円筒に割り当てて目標発散値特徴に変換する割当ユニット50341と、
前記連続値特徴における目標連続値特徴を発散値特徴に変換するための円筒の番号をワン・ホットで表示する処理ユニット50342と、を備える。
ドキュメントの字句特徴を抽出するステップと、
前記ドキュメントの構文特徴を抽出するステップと、
前記ドキュメントの単語ベクトルを生成し、前記字句特徴のベクトル表示及び前記構文特徴のベクトル表示を形成するステップと、
前記単語ベクトルと、前記字句特徴のベクトル表示及び前記構文特徴のベクトル表示とを接続して、処理の対象となる情報を形成するステップと、
前記情報をエンコーダの入力として処理し、前記ドキュメントの要約文を生成するステップと、が実行される電子デバイスを提供する。
ドキュメントの字句特徴を抽出するステップと、
前記ドキュメントの構文特徴を抽出するステップと、
前記ドキュメントの単語ベクトルを生成し、前記字句特徴のベクトル表示及び前記構文特徴のベクトル表示を形成するステップと、
前記単語ベクトル、前記字句特徴のベクトル表示と前記構文特徴のベクトル表示を接続して、処理の対象となる情報を形成するステップと、
前記情報をエンコーダの入力として処理し、前記ドキュメントの要約文を生成するステップと、が実行される。
前記字句特徴と前記構文特徴における連続値特徴と発散値特徴を取得するステップと、
ワン・ホットで前記発散値特徴を表示するステップと、
前記連続値特徴を目標発散値特徴に変換してワン・ホットで表示するステップと、を実行することが出来る。
前記連続値特徴を予め数が設定される円筒に割り当てて目標発散値特徴に変換するステップと、
前記連続値特徴における目標連続値特徴を発散値特徴に変換するための円筒の番号をワン・ホットで表示するステップと、を実行することができる。
ドキュメントにおける単語毎に、当該単語に対応する単語ベクトルと、字句特徴のベクトル表示と、構文特徴ベクトル表示とを首尾で接続して1つのベクトルとして形成して、形成された複数のベクトルを処理の対象となる情報とするステップを実行することができる。
ドキュメントの字句特徴を抽出するステップと、
前記ドキュメントの構文特徴を抽出するステップと、
前記ドキュメントの単語ベクトルを生成し、前記字句特徴のベクトル表示及び前記構文特徴のベクトル表示を形成するステップと、
前記単語ベクトル、前記字句特徴のベクトル表示と前記構文特徴のベクトル表示を接続して、処理の対象となる情報を形成するステップと、
前記情報をエンコーダの入力として処理し、前記ドキュメントの要約文を生成するステップと、が実行される記憶媒体を提供する。
前記字句特徴と前記構文特徴における連続値特徴と発散値特徴を取得し、
ワン・ホットで前記発散値特徴を表示し、
前記連続値特徴を目標発散値特徴に変換してワン・ホットで表示することを、含む。
前記連続値特徴を予め数が設定される円筒に割り当てて目標発散値特徴に変換し、
前記連続値特徴における目標連続値特徴を発散値特徴に変換するための円筒の番号をワン・ホットで表示すること、を含む。
ドキュメントにおける単語毎に、当該単語に対応する単語ベクトルと、字句特徴のベクトル表示と、構文特徴ベクトル表示とを首尾で接続して1つのベクトルとして形成して、形成された複数のベクトルを処理の対象となる情報とすることを含む。
Claims (10)
- 処理の対象となるドキュメントの字句特徴を抽出し;
前記ドキュメントの構文特徴を抽出し;
前記ドキュメントの単語ベクトルを生成し、前記字句特徴のベクトル表示及び前記構文特徴のベクトル表示を形成し;
前記単語ベクトルと、前記字句特徴のベクトル表示及び前記構文特徴のベクトル表示とを接続し、処理の対象となる情報を形成し;及び
前記情報をエンコーダの入力として処理し、前記ドキュメントの要約文を生成するステップを含むことを特徴とする要約文自動生成方法。 - 前記字句特徴は、品詞特徴、固有表現特徴、ターム頻度及び逆ドキュメント頻度の統計特徴を含むことを特徴とする請求項1に記載の要約文自動生成方法。
- 前記構文特徴は、依存構文依頼関係特徴及び構文成分特徴を含むことを特徴とする請求項1に記載の要約文自動生成方法。
- 前記字句特徴のベクトル表示及び前記構文特徴のベクトル表示を形成することは、
前記字句特徴と前記構文特徴における連続値特徴及び発散値特徴を求め;
ワン・ホットで前記発散値特徴を表示し;及び
前記連続値特徴を目標発散値特徴に変換してワン・ホットで表示するステップを含むことを特徴とする請求項1に記載の要約文自動生成方法。 - 前記連続値特徴を目標発散値特徴に変換してワン・ホットで表示することは、
前記連続値特徴を予め数が設定される円筒に割り当てて目標発散値特徴に変換し;及び
前記連続値特徴における目標連続値特徴を発散値特徴に変換するための円筒の番号をワン・ホットで表示するステップを含むことを特徴とする請求項4に記載の要約文自動生成方法。 - 前記単語ベクトルと、前記字句特徴のベクトル表示及び前記構文特徴のベクトル表示とを接続し、処理の対象となる情報を形成することは、
前記ドキュメントにおける単語毎に、各単語に対応する単語ベクトルと、字句特徴のベクトル表示と、構文特徴ベクトル表示とを首尾で接続して1つのベクトルとし、形成される複数のベクトルを前記処理の対象となる情報とするステップを含むことを特徴とする請求項1に記載の要約文自動生成方法。 - 処理の対象となるドキュメントの字句特徴を抽出する第1の抽出モジュールと、
前記ドキュメントの構文特徴を抽出する第2の抽出モジュールと、
前記ドキュメントの単語ベクトルを生成し、前記字句特徴のベクトル表示及び前記構文特徴のベクトル表示を形成する生成モジュールと、
前記単語ベクトルと、前記字句特徴のベクトル表示及び前記構文特徴のベクトル表示とを接続して、処理の対象となる情報を形成する接続モジュールと、
前記情報をエンコーダの入力として処理し、前記ドキュメントの要約文を生成する処理モジュールと、を含むことを特徴とする要約文自動生成装置。 - 処理装置と、コンピュータプログラム指令を記憶する記憶装置とを備える電子デバイスであって、
前記処理装置が前記コンピュータプログラム指令を実行することにより、
処理の対象となるドキュメントの字句特徴を抽出し;
前記ドキュメントの構文特徴を抽出し;
前記ドキュメントの単語ベクトルを生成し、前記字句特徴のベクトル表示及び前記構文特徴のベクトル表示を形成し;
前記単語ベクトルと、前記字句特徴のベクトル表示及び前記構文特徴のベクトル表示とを接続して、処理の対象となる情報を形成し;及び
前記情報をエンコーダの入力として処理し、前記ドキュメントの要約文を生成するステップが実行されることを特徴とする電子デバイス。 - コンピュータに、請求項1〜6の任意の1項に記載の要約文自動生成方法を実行させるためのプログラム。
- 請求項9に記載のプログラムを記憶したコンピュータ読み取り可能な記憶媒体。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710892106.0 | 2017-09-27 | ||
CN201710892106.0A CN109558583A (zh) | 2017-09-27 | 2017-09-27 | 一种自动生成文摘的方法、装置及设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019061656A true JP2019061656A (ja) | 2019-04-18 |
JP6579239B2 JP6579239B2 (ja) | 2019-09-25 |
Family
ID=65864224
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018134689A Active JP6579239B2 (ja) | 2017-09-27 | 2018-07-18 | 要約文自動生成方法、装置及び電子デバイス |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP6579239B2 (ja) |
CN (1) | CN109558583A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112560456A (zh) * | 2020-11-03 | 2021-03-26 | 重庆安石泽太科技有限公司 | 一种基于改进神经网络的生成式摘要生成方法和系统 |
WO2023068691A1 (en) * | 2021-10-18 | 2023-04-27 | Samsung Electronics Co., Ltd. | Method of natural language processing by performing semantic analysis using syntactic information, and an apparatus for the same |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110457483B (zh) * | 2019-06-21 | 2022-02-18 | 浙江大学 | 一种基于神经主题模型的长文本生成方法 |
CN111178053B (zh) * | 2019-12-30 | 2023-07-28 | 电子科技大学 | 一种结合语义和文本结构进行生成式摘要抽取的文本生成方法 |
CN111209751B (zh) * | 2020-02-14 | 2023-07-28 | 全球能源互联网研究院有限公司 | 一种中文分词方法、装置及存储介质 |
CN112541348A (zh) * | 2020-12-10 | 2021-03-23 | 平安科技(深圳)有限公司 | 长文本生成方法、装置、设备及存储介质 |
CN112765987A (zh) * | 2021-01-26 | 2021-05-07 | 武汉大学 | 一种基于递归条件随机场解码器的事件识别方法及系统 |
CN113515627B (zh) * | 2021-05-19 | 2023-07-25 | 北京世纪好未来教育科技有限公司 | 文档检测方法、装置、设备及存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001249935A (ja) * | 2000-03-07 | 2001-09-14 | Nippon Telegr & Teleph Corp <Ntt> | 文書ダイジェスト作成方法、文書検索装置および記録媒体 |
JP2003108571A (ja) * | 2001-09-28 | 2003-04-11 | Seiko Epson Corp | 文書要約装置、文書要約装置の制御方法、文書要約装置の制御プログラムおよび記録媒体 |
JP2015088064A (ja) * | 2013-10-31 | 2015-05-07 | 日本電信電話株式会社 | テキスト要約装置、方法、及びプログラム |
JP2016207141A (ja) * | 2015-04-28 | 2016-12-08 | ヤフー株式会社 | 要約生成装置、要約生成方法、及び要約生成プログラム |
WO2017161320A1 (en) * | 2016-03-18 | 2017-09-21 | Google Inc. | Generating dependency parses of text segments using neural networks |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104281645B (zh) * | 2014-08-27 | 2017-06-16 | 北京理工大学 | 一种基于词汇语义和句法依存的情感关键句识别方法 |
CN104536950B (zh) * | 2014-12-11 | 2018-04-20 | 北京百度网讯科技有限公司 | 生成文本摘要的方法及装置 |
CN106383817B (zh) * | 2016-09-29 | 2019-07-02 | 北京理工大学 | 利用分布式语义信息的论文标题生成方法 |
-
2017
- 2017-09-27 CN CN201710892106.0A patent/CN109558583A/zh active Pending
-
2018
- 2018-07-18 JP JP2018134689A patent/JP6579239B2/ja active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001249935A (ja) * | 2000-03-07 | 2001-09-14 | Nippon Telegr & Teleph Corp <Ntt> | 文書ダイジェスト作成方法、文書検索装置および記録媒体 |
JP2003108571A (ja) * | 2001-09-28 | 2003-04-11 | Seiko Epson Corp | 文書要約装置、文書要約装置の制御方法、文書要約装置の制御プログラムおよび記録媒体 |
JP2015088064A (ja) * | 2013-10-31 | 2015-05-07 | 日本電信電話株式会社 | テキスト要約装置、方法、及びプログラム |
JP2016207141A (ja) * | 2015-04-28 | 2016-12-08 | ヤフー株式会社 | 要約生成装置、要約生成方法、及び要約生成プログラム |
WO2017161320A1 (en) * | 2016-03-18 | 2017-09-21 | Google Inc. | Generating dependency parses of text segments using neural networks |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112560456A (zh) * | 2020-11-03 | 2021-03-26 | 重庆安石泽太科技有限公司 | 一种基于改进神经网络的生成式摘要生成方法和系统 |
CN112560456B (zh) * | 2020-11-03 | 2024-04-09 | 重庆安石泽太科技有限公司 | 一种基于改进神经网络的生成式摘要生成方法和系统 |
WO2023068691A1 (en) * | 2021-10-18 | 2023-04-27 | Samsung Electronics Co., Ltd. | Method of natural language processing by performing semantic analysis using syntactic information, and an apparatus for the same |
Also Published As
Publication number | Publication date |
---|---|
CN109558583A (zh) | 2019-04-02 |
JP6579239B2 (ja) | 2019-09-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6579239B2 (ja) | 要約文自動生成方法、装置及び電子デバイス | |
TWI684881B (zh) | 基於機器翻譯的自動生成重述以產生一對話式代理人的方法、系統及非暫態機器可讀取媒體 | |
CN111859994B (zh) | 机器翻译模型获取及文本翻译方法、装置及存储介质 | |
US8886517B2 (en) | Trust scoring for language translation systems | |
US9805718B2 (en) | Clarifying natural language input using targeted questions | |
US20070299824A1 (en) | Hybrid approach for query recommendation in conversation systems | |
JP2018533786A (ja) | 世界共通翻訳 | |
KR20210061141A (ko) | 자연어 처리 방법 및 장치 | |
JP7178441B2 (ja) | 要約生成方法、装置、プログラム、電子デバイス及び記憶媒体 | |
JP6693582B2 (ja) | 文書要約の生成方法、装置、電子機器、コンピュータ読み取り可能な記憶媒体 | |
Wu et al. | Research on business English translation framework based on speech recognition and wireless communication | |
JP7343566B2 (ja) | 言語モデルを利用したデータ生成方法、コンピュータ装置、およびコンピュータプログラム | |
JP2021099890A (ja) | 因果関係の判別方法、装置、電子機器及び記憶媒体 | |
US20230214593A1 (en) | A computer- implemented method of structuring content for training an artificial intelligence model | |
JP2022003537A (ja) | 対話意図の認識方法及び装置、電子機器並びに記憶媒体 | |
JP6622236B2 (ja) | 発想支援装置及び発想支援方法 | |
TWI470620B (zh) | 文字到語音轉換之方法和系統 | |
KR20210056114A (ko) | 자동 질의응답 장치 | |
Lytvyn et al. | A method of construction of automated basic ontology | |
El-Assady et al. | lingvis. io-A linguistic visual analytics framework | |
US20220165257A1 (en) | Neural sentence generator for virtual assistants | |
Pandey et al. | Error analysis of sahit-a statistical sanskrit-hindi translator | |
CN114490984A (zh) | 基于关键词指导的问答知识抽取方法、装置、设备及介质 | |
KR102284903B1 (ko) | 입력 시퀀스 생성 방법 및 장치 | |
Aunimo | Enhancing reliability and user experience in conversational agents |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20180718 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20190625 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20190702 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190717 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20190730 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20190812 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 6579239 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |