KR20180084580A - 복수 문단 텍스트의 추상적 요약문 생성 장치 및 방법, 그 방법을 수행하기 위한 기록 매체 - Google Patents

복수 문단 텍스트의 추상적 요약문 생성 장치 및 방법, 그 방법을 수행하기 위한 기록 매체 Download PDF

Info

Publication number
KR20180084580A
KR20180084580A KR1020170030546A KR20170030546A KR20180084580A KR 20180084580 A KR20180084580 A KR 20180084580A KR 1020170030546 A KR1020170030546 A KR 1020170030546A KR 20170030546 A KR20170030546 A KR 20170030546A KR 20180084580 A KR20180084580 A KR 20180084580A
Authority
KR
South Korea
Prior art keywords
abstract
unit
internal representation
output
paragraph
Prior art date
Application number
KR1020170030546A
Other languages
English (en)
Other versions
KR101882906B1 (ko
Inventor
이민호
데니스사이 모이랑뎀
Original Assignee
경북대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 경북대학교 산학협력단 filed Critical 경북대학교 산학협력단
Priority to PCT/KR2017/011747 priority Critical patent/WO2018135723A1/ko
Publication of KR20180084580A publication Critical patent/KR20180084580A/ko
Application granted granted Critical
Publication of KR101882906B1 publication Critical patent/KR101882906B1/ko

Links

Classifications

    • G06F17/2705
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Evolutionary Computation (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Biophysics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Document Processing Apparatus (AREA)

Abstract

복수 문단 텍스트의 추상적 요약문 생성 장치는, 문서를 문단들로 자동 구분하여 전달하는 입력부; 상기 입력부로부터 전달된 문단을 내부표현 벡터로 변환하고, 다중 시상수를 갖는 GRU(Multiple Timescales Gated Recurrent Unit, 이하 MTGRU)를 포함하는 회귀신경망을 통해 변환된 벡터를 내부표현(representation)으로 생성하여 전달하는 부호화 처리부; MTGRU를 포함하는 회귀신경망을 통해 상기 부호화 처리부로부터 전달받은 내부표현을 복호화하고, 언어 모델링을 이용하여 문장들을 생성하는 복호화 처리부; 및 각 문단의 요약 출력을 수집하여 최종 추상적 요약을 출력하는 출력부를 포함한다. 이에 따라, 추상적 표현을 생성함으로써 보다 사람이 작성한 요약에 가까운 요약문을 생성할 수 있다.
KR1020170030546A 2017-01-17 2017-03-10 복수 문단 텍스트의 추상적 요약문 생성 장치 및 방법, 그 방법을 수행하기 위한 기록 매체 KR101882906B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
PCT/KR2017/011747 WO2018135723A1 (ko) 2017-01-17 2017-10-24 복수 문단 텍스트의 추상적 요약문 생성 장치 및 방법, 그 방법을 수행하기 위한 기록 매체

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR1020170007888 2017-01-17
KR20170007888 2017-01-17

Publications (2)

Publication Number Publication Date
KR20180084580A true KR20180084580A (ko) 2018-07-25
KR101882906B1 KR101882906B1 (ko) 2018-07-27

Family

ID=63059102

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020170030546A KR101882906B1 (ko) 2017-01-17 2017-03-10 복수 문단 텍스트의 추상적 요약문 생성 장치 및 방법, 그 방법을 수행하기 위한 기록 매체

Country Status (1)

Country Link
KR (1) KR101882906B1 (ko)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109635103A (zh) * 2018-12-17 2019-04-16 北京百度网讯科技有限公司 摘要生成方法和装置
CN110147532A (zh) * 2019-01-24 2019-08-20 腾讯科技(深圳)有限公司 编码方法、装置、设备及存储介质
CN110389820A (zh) * 2019-06-28 2019-10-29 浙江大学 一种基于v-TGRU模型进行资源预测的私有云任务调度方法
CN111026861A (zh) * 2019-12-10 2020-04-17 腾讯科技(深圳)有限公司 文本摘要的生成方法、训练方法、装置、设备及介质
KR20210125275A (ko) * 2020-04-08 2021-10-18 에스케이 주식회사 딥러닝 기반 문서 요약 생성 방법 및 시스템
CN113704457A (zh) * 2021-07-23 2021-11-26 北京搜狗科技发展有限公司 摘要的生成方法、装置及存储介质
CN113743082A (zh) * 2021-09-16 2021-12-03 京东科技信息技术有限公司 一种数据处理方法、系统、存储介质及电子设备
KR20220091035A (ko) * 2020-12-23 2022-06-30 주식회사 카카오 요약 평가 장치, 그것의 제어 방법 및 요약 평가 프로그램
CN115982343A (zh) * 2023-03-13 2023-04-18 阿里巴巴达摩院(杭州)科技有限公司 摘要生成方法、训练摘要生成模型的方法及装置
WO2024085715A1 (ko) * 2022-10-20 2024-04-25 주식회사 아이팩토리 자연어 생성 모델을 이용하여 텍스트를 자동으로 생성하는 기능을 갖는 문서 작성 장치, 방법, 컴퓨터 프로그램, 컴퓨터로 판독 가능한 기록매체, 서버 및 시스템

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100785927B1 (ko) 2006-06-02 2007-12-17 삼성전자주식회사 데이터 요약 생성 방법 및 장치
KR20130116908A (ko) 2011-01-28 2013-10-24 인텔 코포레이션 소스 텍스트를 맥락 정보의 함수로서 요약하는 방법 및 시스템
KR20170107015A (ko) * 2015-11-25 2017-09-22 바이두 유에스에이 엘엘씨 단대단 음성 인식

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100785927B1 (ko) 2006-06-02 2007-12-17 삼성전자주식회사 데이터 요약 생성 방법 및 장치
KR20130116908A (ko) 2011-01-28 2013-10-24 인텔 코포레이션 소스 텍스트를 맥락 정보의 함수로서 요약하는 방법 및 시스템
KR20170107015A (ko) * 2015-11-25 2017-09-22 바이두 유에스에이 엘엘씨 단대단 음성 인식

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
A.M.Rush et. al., A neural attention model for sentence summarization, Proc. of 2015 conference EMNLP, pp.379-389, 2015. *
Minsoo Kim, Moirangthem Dennis Singh, and Minho Lee, "Towards Abstraction from Extraction: Multiple Timescale Gated Recurrent Unit for Summarization", Association for Computational Linguistics (2016).
R. Nallapati et al., Abstractive Text Summarization using Sequence-to-sequence RNNs and Beyond, Proc. of 20th SIGNLL Conference, pp.280-290, 2016.08.07 *
S. Chopra et al., Abstractive Sentence Summarization with Attentive Recurrent Neural Networks, Proc. of NAACL-HLT 2016, pp.93-98, 2016.06 *
권영대 외, 문장 수반 관계 추론을 통한 문서 요약, 한국정보과학회 학술발표 논문집, pp.711-713, 2016.06 *

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109635103B (zh) * 2018-12-17 2022-05-20 北京百度网讯科技有限公司 摘要生成方法和装置
CN109635103A (zh) * 2018-12-17 2019-04-16 北京百度网讯科技有限公司 摘要生成方法和装置
CN110147532A (zh) * 2019-01-24 2019-08-20 腾讯科技(深圳)有限公司 编码方法、装置、设备及存储介质
CN110147532B (zh) * 2019-01-24 2023-08-25 腾讯科技(深圳)有限公司 编码方法、装置、设备及存储介质
CN110389820A (zh) * 2019-06-28 2019-10-29 浙江大学 一种基于v-TGRU模型进行资源预测的私有云任务调度方法
CN111026861A (zh) * 2019-12-10 2020-04-17 腾讯科技(深圳)有限公司 文本摘要的生成方法、训练方法、装置、设备及介质
CN111026861B (zh) * 2019-12-10 2023-07-04 腾讯科技(深圳)有限公司 文本摘要的生成方法、训练方法、装置、设备及介质
KR20210125275A (ko) * 2020-04-08 2021-10-18 에스케이 주식회사 딥러닝 기반 문서 요약 생성 방법 및 시스템
KR20220091035A (ko) * 2020-12-23 2022-06-30 주식회사 카카오 요약 평가 장치, 그것의 제어 방법 및 요약 평가 프로그램
CN113704457A (zh) * 2021-07-23 2021-11-26 北京搜狗科技发展有限公司 摘要的生成方法、装置及存储介质
CN113704457B (zh) * 2021-07-23 2024-03-01 北京搜狗科技发展有限公司 摘要的生成方法、装置及存储介质
CN113743082A (zh) * 2021-09-16 2021-12-03 京东科技信息技术有限公司 一种数据处理方法、系统、存储介质及电子设备
CN113743082B (zh) * 2021-09-16 2024-04-05 京东科技信息技术有限公司 一种数据处理方法、系统、存储介质及电子设备
WO2024085715A1 (ko) * 2022-10-20 2024-04-25 주식회사 아이팩토리 자연어 생성 모델을 이용하여 텍스트를 자동으로 생성하는 기능을 갖는 문서 작성 장치, 방법, 컴퓨터 프로그램, 컴퓨터로 판독 가능한 기록매체, 서버 및 시스템
CN115982343A (zh) * 2023-03-13 2023-04-18 阿里巴巴达摩院(杭州)科技有限公司 摘要生成方法、训练摘要生成模型的方法及装置
CN115982343B (zh) * 2023-03-13 2023-08-22 阿里巴巴达摩院(杭州)科技有限公司 摘要生成方法、训练摘要生成模型的方法及装置

Also Published As

Publication number Publication date
KR101882906B1 (ko) 2018-07-27

Similar Documents

Publication Publication Date Title
KR20180084580A (ko) 복수 문단 텍스트의 추상적 요약문 생성 장치 및 방법, 그 방법을 수행하기 위한 기록 매체
MX2017013899A (es) Proceso y sistema para generar documentos de arquitectura funcional y documentos de especificación de análisis y de diseño de software de manera automática a partir de lenguaje natural.
AU2016331881A8 (en) Q-compensated full wavefield inversion
MX2016013015A (es) Métodos y sistemas de administrar un dialogo con un robot.
WO2014140977A9 (en) Improving entity recognition in natural language processing systems
WO2008106664A3 (en) Human behavioral modeling and simulation framework
WO2018212584A3 (ko) 딥 뉴럴 네트워크를 이용하여 문장이 속하는 클래스를 분류하는 방법 및 장치
EP3789928A3 (en) Neural network method and apparatus
PH12020552089A1 (en) Search sentence generation system and search sentence generation method
Krischer et al. Generating seismograms with deep neural networks
De Sousa Webber Semantic folding theory and its application in semantic fingerprinting
MX2021014491A (es) Proceso y sistema de generación automática de documentos de arquitectura funcional y documentos de especificación de diseño y análisis de software a partir de lenguaje natural.
FI20196098A1 (fi) Neuroverkkoon perustuva ratkaisu
Thanh Nguyen et al. A robust 3d-2d interactive tool for scene segmentation and annotation
Zizhuang Wang et al. Riemannian Normalizing Flow on Variational Wasserstein Autoencoder for Text Modeling
Hummels et al. Trident: Synthetic spectrum generator
Shih-Han Wang et al. Toward Few-step Adversarial Training from a Frequency Perspective
Kobayashi et al. Improving user experiences in talking to robots using ASE-based backchannel feedbacks
Quyen Pham et al. A Noise-Robust Method with Smoothed\ell_1/\ell_2 Regularization for Sparse Moving-Source Mapping
Rafae Khan et al. Diversity by Phonetics and its Application in Neural Machine Translation
Ferreira Luz et al. Semantic Parsing Natural Language into SPARQL: Improving Target Language Representation with Neural Attention
Seidel Oliveira et al. PLSUM: Generating PT-BR Wikipedia by Summarizing Multiple Websites
Zenocratti et al. Caracterización de galaxias elípticas en contexto cosmológico
Capelas de Oliveira et al. Analytic components for the hadronic total cross-section: Fractional calculus and Mellin transform
Bastiaan Kleijn et al. Wavenet based low rate speech coding

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant