JP7142435B2 - 要約装置、要約方法、及び要約プログラム - Google Patents
要約装置、要約方法、及び要約プログラム Download PDFInfo
- Publication number
- JP7142435B2 JP7142435B2 JP2017255133A JP2017255133A JP7142435B2 JP 7142435 B2 JP7142435 B2 JP 7142435B2 JP 2017255133 A JP2017255133 A JP 2017255133A JP 2017255133 A JP2017255133 A JP 2017255133A JP 7142435 B2 JP7142435 B2 JP 7142435B2
- Authority
- JP
- Japan
- Prior art keywords
- sentence
- compressed
- sentences
- important
- document
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Machine Translation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
本発明の実施の形態に係る要約装置の構成について図1を用い説明する。図1は、本実施形態に係る要約装置の構成を示す図である。
次に実施の形態に係る要約装置の構成について図2を用い説明する。図2は、本実施形態に係る学習装置の構成を示す図である。
次に、図3を用いて、要約装置10が実行する処理の流れについて説明する。
次に、本実施形態の要約装置10のハードウェア構成について図8を用いて説明する。
Claims (6)
- 文書から要約を生成する要約装置において、
文書に対して、形態素解析により生成された分かち書き済みの文章データに基づいて構文解析を行った構文解析済み文書データを生成する文書解析部と、
前記文書解析部により解析された構文解析済み文書データから、重要スコアが高い順に上位N番目(Nは2以上の整数)までの複数の文を重要文としてそれぞれ抽出する重要文抽出部と、
前記重要文抽出部により抽出された前記重要文をそれぞれ文圧縮して、当該重要文に対応する圧縮文をM行(Mは2以上の整数)生成する圧縮文生成部と、
前記各重要文に対応する前記M行の圧縮文から、要約スコアが最も高い前記圧縮文をそれぞれ選択して要約を生成する要約生成部と、
を有し、
前記圧縮文生成部は、前記重要文の意味を抽出し、その意味から単語を生成して、前記重要文とは単語及び構文が相違しつつ、意味が同じまたは類似の圧縮文を生成する、
ことを特徴とする要約装置。 - 請求項1に記載の要約装置であって、
要約生成部は、
前記各圧縮文に対して、形態素解析により生成された分かち書き済みの圧縮文データに基づいて構文解析を行った構文解析済み圧縮文データをそれぞれ生成する圧縮文解析部と、
前記構文解析済み圧縮文データから抽出された特徴量に基づいて要約スコアを算出するスコア算出部と、
を有することを特徴とする要約装置。 - 請求項1または2に記載の要約装置であって、
前記圧縮文生成部は、文圧縮の前に、前記重要文に含まれる固有表現を抽出して任意のラベルを付与し、
前記要約生成部は、選択した前記圧縮文に含まれる前記任意のラベルに対し、これに対応する前記固有表現を置き換える、
ことを特徴とする要約装置。 - 請求項1から3のいずれか1つに記載の要約装置であって、
前記圧縮文生成部は、ニューラルネットワークを用いて前記重要文を文圧縮し、
前記ニューラルネットワークの学習モデルは、複数の学習用文書と前記複数の学習用文書の各々に対する要約とから予め学習されたものである、
ことを特徴とする要約装置。 - 文書から要約を生成する要約方法であって、
文書解析部が、文書に対して、形態素解析により生成された分かち書き済みの文章データに基づいて構文解析を行った構文解析済み文書データを生成する文書解析ステップと、
重要文抽出部が、前記文書解析ステップにより解析された構文解析済み文書データから、スコアが高い順に上位N番目(Nは2以上の整数)までの高い複数の文を重要文としてそれぞれ抽出する重要文抽出ステップと、
圧縮文生成部が、前記重要文抽出ステップにより抽出された前記重要文をそれぞれ文圧縮して、当該重要文に対応する圧縮文をM行(Mは2以上の整数)生成する圧縮文生成ステップと、
要約生成部が、前記各重要文に対応する前記M行の圧縮文から、要約スコアが最も高い前記圧縮文をそれぞれ選択して要約を生成する要約生成ステップと、
を有し、
前記圧縮文生成部は、前記重要文の意味を抽出し、その意味から単語を生成して、前記重要文とは単語及び構文が相違しつつ、意味が同じまたは類似の圧縮文を生成する、
ことを特徴とする要約方法。 - コンピュータを、請求項1から4の何れか1つに記載の要約装置の各部として機能させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017255133A JP7142435B2 (ja) | 2017-12-29 | 2017-12-29 | 要約装置、要約方法、及び要約プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017255133A JP7142435B2 (ja) | 2017-12-29 | 2017-12-29 | 要約装置、要約方法、及び要約プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019121139A JP2019121139A (ja) | 2019-07-22 |
JP7142435B2 true JP7142435B2 (ja) | 2022-09-27 |
Family
ID=67306352
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017255133A Active JP7142435B2 (ja) | 2017-12-29 | 2017-12-29 | 要約装置、要約方法、及び要約プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7142435B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7279753B2 (ja) | 2021-09-01 | 2023-05-23 | 信越半導体株式会社 | シリコンウェーハの洗浄方法および製造方法 |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112632976A (zh) * | 2019-09-20 | 2021-04-09 | 株式会社Ntt都科摩 | 文本处理装置、方法、设备以及计算机可读存储介质 |
US20220343076A1 (en) * | 2019-10-02 | 2022-10-27 | Nippon Telegraph And Telephone Corporation | Text generation apparatus, text generation learning apparatus, text generation method, text generation learning method and program |
KR102565149B1 (ko) * | 2020-05-27 | 2023-08-09 | 정치훈 | 문서의 요약문 제공 장치 및 방법 |
KR20220023211A (ko) * | 2020-08-20 | 2022-03-02 | 삼성전자주식회사 | 대화 텍스트에 대한 요약 정보를 생성하는 전자 장치 및 그 동작 방법 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2009104613A1 (ja) | 2008-02-19 | 2009-08-27 | 日本電気株式会社 | テキスト変換装置、方法、プログラム |
JP2010262511A (ja) | 2009-05-08 | 2010-11-18 | Nippon Telegr & Teleph Corp <Ntt> | テキスト要約方法、その装置およびプログラム |
JP2017111190A (ja) | 2015-12-14 | 2017-06-22 | 株式会社日立製作所 | 対話テキスト要約装置及び方法 |
-
2017
- 2017-12-29 JP JP2017255133A patent/JP7142435B2/ja active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2009104613A1 (ja) | 2008-02-19 | 2009-08-27 | 日本電気株式会社 | テキスト変換装置、方法、プログラム |
JP2010262511A (ja) | 2009-05-08 | 2010-11-18 | Nippon Telegr & Teleph Corp <Ntt> | テキスト要約方法、その装置およびプログラム |
JP2017111190A (ja) | 2015-12-14 | 2017-06-22 | 株式会社日立製作所 | 対話テキスト要約装置及び方法 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7279753B2 (ja) | 2021-09-01 | 2023-05-23 | 信越半導体株式会社 | シリコンウェーハの洗浄方法および製造方法 |
Also Published As
Publication number | Publication date |
---|---|
JP2019121139A (ja) | 2019-07-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7142435B2 (ja) | 要約装置、要約方法、及び要約プログラム | |
CN111368996B (zh) | 可传递自然语言表示的重新训练投影网络 | |
US10606946B2 (en) | Learning word embedding using morphological knowledge | |
JP6676110B2 (ja) | 発話文生成装置とその方法とプログラム | |
Sampath et al. | Data set creation and empirical analysis for detecting signs of depression from social media postings | |
Yüksel et al. | Turkish tweet classification with transformer encoder | |
Kumar et al. | Analysis of users’ sentiments from kannada web documents | |
Tiwari et al. | Ensemble approach for twitter sentiment analysis | |
CN111985243A (zh) | 情感模型的训练方法、情感分析方法、装置及存储介质 | |
Nasim et al. | Cluster analysis of urdu tweets | |
CN115238039A (zh) | 文本生成方法、电子设备及计算机可读存储介质 | |
Thakur et al. | A review on text based emotion recognition system | |
EP1503295A1 (en) | Text generation method and text generation device | |
Saha et al. | Vader vs. bert: A comparative performance analysis for sentiment on coronavirus outbreak | |
Zhang et al. | Multi-document extractive summarization using window-based sentence representation | |
Chhabra et al. | Deep learning model for personality traits classification from text emphasis on data slicing | |
JP5782487B2 (ja) | 行動目的抽出方法及び装置 | |
Liu et al. | Data-driven Model Generalizability in Crosslinguistic Low-resource Morphological Segmentation | |
Naseem | Hybrid Words Representation for the classification of low quality text | |
Riemer et al. | A deep learning and knowledge transfer based architecture for social media user characteristic determination | |
KR101987605B1 (ko) | 음악 감성 인식 방법 및 장치 | |
Praveena et al. | Chunking based malayalam paraphrase identification using unfolding recursive autoencoders | |
GeethaRamani et al. | Identification of emotions in text articles through data pre-processing and data mining techniques | |
Dangol et al. | Automated news classification using n-gram model and key features of nepali language | |
Maciołek et al. | Using shallow semantic analysis and graph modelling for document classification |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20201228 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20211110 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20211129 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20220126 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220328 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220808 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220825 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220912 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220913 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7142435 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |