KR102348689B1 - 감정점수를 활용한 시퀀스-투-시퀀스 기반의 텍스트 요약 - Google Patents
감정점수를 활용한 시퀀스-투-시퀀스 기반의 텍스트 요약 Download PDFInfo
- Publication number
- KR102348689B1 KR102348689B1 KR1020190179964A KR20190179964A KR102348689B1 KR 102348689 B1 KR102348689 B1 KR 102348689B1 KR 1020190179964 A KR1020190179964 A KR 1020190179964A KR 20190179964 A KR20190179964 A KR 20190179964A KR 102348689 B1 KR102348689 B1 KR 102348689B1
- Authority
- KR
- South Korea
- Prior art keywords
- sentences
- score
- text
- sentence
- extracting
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Machine Translation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
도 1은 본 명세서의 일 실시예에 따른 텍스트 요약장치의 블록도이다.
도 2는 본 명세서의 일 실시예에 따른 언어처리방법의 순서도이다.
도 3 및 도 4는 본 명세서의 일 실시예에 따른 언어처리방법의 구현예를 설명하기 위한 도면이다.
Claims (15)
- 메모리와 프로세서를 포함하는 장치에서 상기 프로세서에 의해 수행되는 언어처리방법에 있어서,
복수의 문서로부터 복수의 문장을 추출하는 단계;
상기 복수의 문장의 감정점수를 생성하는 단계;
상기 감정점수에 기반하여 상기 복수의 문장 중 적어도 일부 문장을 추출하는 단계;
상기 복수의 문서의 도메인을 분류하는 단계;
상기 분류된 도메인에 기반하여 적어도 하나의 추가문장을 추출하는 단계; 및
상기 추출된 문장과 상기 추가 문장을 입력으로 미리 학습된 언어모델(language model)에 적용하여, 적어도 하나의 후보 텍스트(text prediction candidates)를 생성하는 단계를 포함하고,
상기 복수의 문장 중 적어도 일부 문장을 추출하는 단계는,
상기 복수의 문장 각각에 대응되는 감정점수를 비교하여, 인접한 문장 간의 감정점수의 차이가 최대인 구간을 확인하는 단계; 및
상기 확인된 구간에 포함된 적어도 두 문장을 추출하는 단계를 포함하고,
상기 복수의 문서의 도메인을 분류하는 단계는,
상기 복수의 문서를 구성하는 상기 복수의 텍스트로부터 센텐스 벡터를 추출하는 단계; 및
상기 센텐스 벡터를 미리 학습된 분류모델에 적용하여, 상기 복수의 텍스트에 대응하는 하나 이상의 후보 도메인(domain prediction candidates)을 생성하는 단계를 포함하고,
상기 추가문장을 추출하는 단계는,
상기 후보 도메인이 두괄식 문단으로 판단되면 상기 두괄식 문단의 첫 번째 문장으로부터 순서대로 N 번째(N은 자연수)문장까지의 텍스트를 포함하는 추가문장을 추출하고, 상기 후보 도메인이 미괄식 문단으로 판단되면 상기 미괄식 문단의 마지막 문장으로부터 역순으로 M 번째(M은 자연수)문장까지의 텍스트를 포함하는 추가문장을 추출하는 것을 특징으로 하는 언어처리방법.
- 제1 항에 있어서,
상기 복수의 문서는 복수의 도메인으로 설정된 문서를 포함하는 것을 특징으로 하는 언어처리방법.
- 제1 항에 있어서,
상기 감정점수는 긍정점수, 부정점수, 중립점수, 또는 혼합점수를 포함하는 것을 특징으로 하는 언어처리방법.
- 제3 항에 있어서,
상기 긍정점수는 +1, 상기 부정점수는 -1, 상기 중립점수는 0의 가중치를 가질 수 있고,
상기 혼합점수는 -1 내지 +1 사이의 값을 나타내는 것을 특징으로 하는 언어처리방법.
- 제1 항에 있어서,
상기 감정점수를 생성하는 단계는,
상기 복수의 문장의 센텐스 벡터를 추출하는 단계; 및
상기 센텐스 벡터를 미리 학습된 감정모델(emotion model)에 입력으로 적용하여, 상기 감정점수를 생성하는 단계;
를 포함하는 것을 특징으로 하는 언어처리방법.
- 삭제
- 삭제
- 삭제
- 제1 항에 있어서,
상기 복수의 문장을 추출하는 단계는,
상기 복수의 문서 중 상기 문서를 구성하는 문장의 수가 미리 설정된 임계치 미만인 제1 문서를 제외하고, 상기 문장의 수가 미리 설정된 임계치 이상인 제2 문서로부터 상기 복수의 문장을 추출하는 것을 특징으로 하는 언어처리방법.
- 제9 항에 있어서,
상기 미리 설정된 임계치는,
상기 언어모델의 입력으로 적용되는 문장의 수에 상응하는 것을 특징으로 하는 언어처리방법.
- 삭제
- 삭제
- 삭제
- 삭제
- 제1 항 내지 제5 항, 제9 항 및 제10 항 중 어느 한 항의 방법을 컴퓨터 시스템에서 실행하기 위한 프로그램이 기록된 컴퓨터 시스템이 판독 가능한 기록매체.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020190179964A KR102348689B1 (ko) | 2019-12-31 | 2019-12-31 | 감정점수를 활용한 시퀀스-투-시퀀스 기반의 텍스트 요약 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020190179964A KR102348689B1 (ko) | 2019-12-31 | 2019-12-31 | 감정점수를 활용한 시퀀스-투-시퀀스 기반의 텍스트 요약 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20210086192A KR20210086192A (ko) | 2021-07-08 |
KR102348689B1 true KR102348689B1 (ko) | 2022-01-07 |
Family
ID=76894056
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020190179964A Active KR102348689B1 (ko) | 2019-12-31 | 2019-12-31 | 감정점수를 활용한 시퀀스-투-시퀀스 기반의 텍스트 요약 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR102348689B1 (ko) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102497436B1 (ko) * | 2022-09-16 | 2023-02-08 | 주식회사 액션파워 | 음성 신호를 포함하는 컨텐츠를 기반으로 타겟 단어와 관련된 정보를 획득하는 방법 |
US12210834B2 (en) | 2022-09-16 | 2025-01-28 | International Business Machines Corporation | Text summarization with emotion conditioning |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101851795B1 (ko) * | 2017-12-22 | 2018-04-24 | 주식회사 마인드셋 | 도메인 특화 용어를 이용한 감정사전 업데이트 장치 및 방법 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101136007B1 (ko) * | 2010-06-29 | 2012-04-20 | (주)워드워즈 | 문서 감성 분석 시스템 및 그 방법 |
CN105940395B (zh) * | 2014-01-31 | 2019-07-16 | 谷歌有限责任公司 | 生成文档的矢量表示 |
KR102146152B1 (ko) * | 2018-01-03 | 2020-08-28 | 세종대학교산학협력단 | 관능 평가 방법 및 그 장치 |
-
2019
- 2019-12-31 KR KR1020190179964A patent/KR102348689B1/ko active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101851795B1 (ko) * | 2017-12-22 | 2018-04-24 | 주식회사 마인드셋 | 도메인 특화 용어를 이용한 감정사전 업데이트 장치 및 방법 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102497436B1 (ko) * | 2022-09-16 | 2023-02-08 | 주식회사 액션파워 | 음성 신호를 포함하는 컨텐츠를 기반으로 타겟 단어와 관련된 정보를 획득하는 방법 |
US12210834B2 (en) | 2022-09-16 | 2025-01-28 | International Business Machines Corporation | Text summarization with emotion conditioning |
Also Published As
Publication number | Publication date |
---|---|
KR20210086192A (ko) | 2021-07-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111312245B (zh) | 一种语音应答方法、装置和存储介质 | |
US11210470B2 (en) | Automatic text segmentation based on relevant context | |
CN108984526B (zh) | 一种基于深度学习的文档主题向量抽取方法 | |
CN110377714A (zh) | 基于迁移学习的文本匹配方法、装置、介质及设备 | |
KR102296154B1 (ko) | 줄거리를 통한 머신러닝 기반의 미디어 흥행 예측 | |
JP7618201B2 (ja) | 回答特定用テキスト分類器及び背景知識表現ジェネレータ及びその訓練装置、並びにコンピュータプログラム | |
CN110879938A (zh) | 文本情感分类方法、装置、设备和存储介质 | |
CN111639186B (zh) | 动态嵌入投影门控的多类别多标签文本分类模型及装置 | |
CN110162639A (zh) | 识图知意的方法、装置、设备及存储介质 | |
RU2712101C2 (ru) | Предсказание вероятности появления строки с использованием последовательности векторов | |
CN115393933A (zh) | 一种基于帧注意力机制的视频人脸情绪识别方法 | |
CN114694255B (zh) | 基于通道注意力与时间卷积网络的句子级唇语识别方法 | |
Elshaer et al. | Transfer learning from sound representations for anger detection in speech | |
CN113870863B (zh) | 声纹识别方法及装置、存储介质及电子设备 | |
KR102348689B1 (ko) | 감정점수를 활용한 시퀀스-투-시퀀스 기반의 텍스트 요약 | |
CN111613219B (zh) | 语音数据识别方法、设备及介质 | |
CN113177118A (zh) | 文本分类模型、文本分类的方法以及装置 | |
Neelima et al. | An Efficient Deep Learning framework with CNN and RBM for Native Speech to Text Translation | |
CN113569094B (zh) | 视频推荐方法、装置、电子设备及存储介质 | |
CN115116470B (zh) | 音频处理方法、装置、计算机设备和存储介质 | |
CN111259650A (zh) | 基于类标序列生成式对抗模型的文本自动生成方法 | |
CN114332476B (zh) | 维语识别方法、装置、电子设备、存储介质和产品 | |
CN113823271B (zh) | 语音分类模型的训练方法、装置、计算机设备及存储介质 | |
CN114170997A (zh) | 发音技巧检测方法、装置、存储介质及电子设备 | |
CN118568262B (zh) | 针对中国农业问答平台问句短文本分类方法、设备及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PA0109 | Patent application |
Patent event code: PA01091R01D Comment text: Patent Application Patent event date: 20191231 |
|
PA0201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20210618 Patent event code: PE09021S01D |
|
PG1501 | Laying open of application | ||
E701 | Decision to grant or registration of patent right | ||
PE0701 | Decision of registration |
Patent event code: PE07011S01D Comment text: Decision to Grant Registration Patent event date: 20211230 |
|
GRNT | Written decision to grant | ||
PR0701 | Registration of establishment |
Comment text: Registration of Establishment Patent event date: 20220104 Patent event code: PR07011E01D |
|
PR1002 | Payment of registration fee |
Payment date: 20220105 End annual number: 3 Start annual number: 1 |
|
PG1601 | Publication of registration |