KR102441854B1 - 범용적인 감정 분석 서비스를 위한 방법 및 장치 - Google Patents
범용적인 감정 분석 서비스를 위한 방법 및 장치 Download PDFInfo
- Publication number
- KR102441854B1 KR102441854B1 KR1020200156482A KR20200156482A KR102441854B1 KR 102441854 B1 KR102441854 B1 KR 102441854B1 KR 1020200156482 A KR1020200156482 A KR 1020200156482A KR 20200156482 A KR20200156482 A KR 20200156482A KR 102441854 B1 KR102441854 B1 KR 102441854B1
- Authority
- KR
- South Korea
- Prior art keywords
- model
- data
- correct answer
- processor
- learning
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 85
- 238000004458 analytical method Methods 0.000 title claims abstract description 65
- 230000008451 emotion Effects 0.000 claims abstract description 53
- 238000013526 transfer learning Methods 0.000 claims abstract description 31
- 238000013473 artificial intelligence Methods 0.000 claims abstract description 26
- 238000012545 processing Methods 0.000 claims description 21
- 230000015654 memory Effects 0.000 claims description 20
- 238000013140 knowledge distillation Methods 0.000 claims description 16
- 238000004590 computer program Methods 0.000 claims description 8
- 230000002457 bidirectional effect Effects 0.000 claims description 3
- 230000002996 emotional effect Effects 0.000 claims description 3
- 230000008569 process Effects 0.000 description 16
- 238000004891 communication Methods 0.000 description 11
- 238000012549 training Methods 0.000 description 10
- 238000010586 diagram Methods 0.000 description 8
- 230000006870 function Effects 0.000 description 8
- 238000005516 engineering process Methods 0.000 description 7
- 238000013527 convolutional neural network Methods 0.000 description 4
- 230000008901 benefit Effects 0.000 description 2
- 230000015556 catabolic process Effects 0.000 description 2
- 238000006731 degradation reaction Methods 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 238000012552 review Methods 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000003203 everyday effect Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000008014 freezing Effects 0.000 description 1
- 238000007710 freezing Methods 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000000877 morphologic effect Effects 0.000 description 1
- 230000007935 neutral effect Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000002085 persistent effect Effects 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000006403 short-term memory Effects 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
- G06N20/20—Ensemble learning
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Medical Informatics (AREA)
- Computing Systems (AREA)
- Evolutionary Computation (AREA)
- Data Mining & Analysis (AREA)
- Mathematical Physics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Machine Translation (AREA)
- Analysing Materials By The Use Of Radiation (AREA)
- Cash Registers Or Receiving Machines (AREA)
Abstract
Description
도 2는 본 발명의 일실시예에 따른 컴퓨터 장치의 예를 도시한 블록도이다.
도 3은 본 발명의 일실시예에 따른 컴퓨터 장치가 수행할 수 있는 방법의 예를 도시한 순서도이다.
도 4는 본 발명의 일실시예에 있어서 BERT 모델 구조를 설명하기 위한 예시 도면이다.
도 5는 본 발명의 일실시예에 있어서 KD(Knowledge Distillation) 방법론을 설명하기 위한 예시 도면이다.
도 6은 본 발명의 일실시예에 있어서 감정 분석 모델 구축 과정의 예를 도시한 순서도이다.
도 7은 본 발명의 일실시예에 있어서 앙상블 방법을 이용한 데이터 확장 프로세스를 설명하기 위한 예시 도면이다.
도 8 내지 도 10은 본 발명의 일실시예에 있어서 전이 학습을 이용한 데이터 확장 프로세스를 설명하기 위한 예시 도면이다.
Claims (17)
- 컴퓨터 장치에서 실행되는 감정 분석 방법에 있어서,
상기 컴퓨터 장치는 메모리에 포함된 컴퓨터 판독가능한 명령들을 실행하도록 구성된 적어도 하나의 프로세서를 포함하고,
상기 감정 분석 방법은,
상기 적어도 하나의 프로세서에 의해, 데이터 확장(data expansion)이 가능한 모델 구조로 앙상블 학습(ensemble learning)과 전이 학습(transfer learning)에 기반한 인공지능 언어모델을 생성하는 단계; 및
상기 적어도 하나의 프로세서에 의해, 주어진 문서에 대해 상기 인공지능 언어모델을 이용하여 감정 분석을 수행하는 단계
를 포함하고,
상기 인공지능 언어모델을 생성하는 단계는,
복수 개의 도메인에 대해 도메인 별로 수집된 정답 데이터 셋을 기초로 상기 앙상블 학습으로 생성된 복수 개의 모델과 상기 전이 학습으로 생성된 복수 개의 모델을 이용하여 새로운 도메인의 정답이 없는 데이터에 대해 정답을 예측한 정답 데이터를 생성함으로써 상기 인공지능 언어모델의 학습 데이터를 확장하는 단계
를 포함하는 감정 분석 방법. - 제1항에 있어서,
상기 인공지능 언어모델의 학습 데이터를 확장하는 단계는,
상기 정답 데이터 셋을 분할하여 복수 개의 데이터 그룹을 구축하는 단계; 및
상기 복수 개의 도메인으로 학습된 모델에 대해 상기 정답 데이터 셋의 전체 데이터로 전이 학습한 제1 모델과 상기 데이터 그룹 각각으로 전이 학습한 복수 개의 제2 모델을 생성하는 단계
를 포함하는 감정 분석 방법. - 제2항에 있어서,
상기 제1 모델과 상기 제2 모델을 생성하는 단계는,
상기 복수 개의 도메인으로 학습된 모델의 전체 파라미터를 재학습하는 전이 학습을 이용하여 상기 제1 모델과 상기 제2 모델을 생성하는 것
을 특징으로 하는 감정 분석 방법. - 제2항에 있어서,
상기 제1 모델과 상기 제2 모델을 생성하는 단계는,
상기 복수 개의 도메인으로 학습된 모델의 일부 파라미터를 고정시키고 나머지 파라미터를 재학습하는 전이 학습을 이용하여 상기 제1 모델과 상기 제2 모델을 생성하는 것
을 특징으로 하는 감정 분석 방법. - 삭제
- 제1항에 있어서,
상기 인공지능 언어모델의 학습 데이터를 확장하는 단계는,
상기 새로운 도메인의 데이터에 대해 복수 개의 모델을 이용하여 정답을 예측하는 단계; 및
모델 간의 예측 결과를 비교하여 정답을 예측한 데이터 중 적어도 일부를 정답 데이터로 선정하는 단계
를 포함하는 감정 분석 방법. - 제1항에 있어서,
상기 인공지능 언어모델은 BERT(Bidirectional Encoder Representations from Transformer) 언어모델로 구성되는 것
을 특징으로 하는 감정 분석 방법. - 제7항에 있어서,
상기 인공지능 언어모델은 감정 분석의 정확도와 처리 속도를 고려하여 레이어 수를 축소한 쉘로우(shallow) BERT 모델로 구성되는 것
을 특징으로 하는 감정 분석 방법. - 제7항에 있어서,
상기 인공지능 언어모델은 PKD(Patient Knowledge Distillation) 기법을 적용한 BERT 모델로 구성되는 것
을 특징으로 하는 감정 분석 방법. - 제1항 내지 제4항, 제6항 내지 제9항 중 어느 한 항의 감정 분석 방법을 컴퓨터 장치에 실행시키기 위해 컴퓨터 판독가능한 기록 매체에 저장되는 컴퓨터 프로그램.
- 제1항 내지 제4항, 제6항 내지 제9항 중 어느 한 항의 감정 분석 방법을 컴퓨터에 실행시키기 위한 프로그램이 기록되어 있는 컴퓨터 판독 가능한 기록 매체.
- 컴퓨터 장치에 있어서,
메모리에 포함된 컴퓨터 판독가능한 명령들을 실행하도록 구성된 적어도 하나의 프로세서
를 포함하고,
상기 적어도 하나의 프로세서는,
데이터 확장이 가능한 모델 구조로 앙상블 학습과 전이 학습에 기반한 인공지능 언어모델을 생성하고,
주어진 문서에 대해 상기 인공지능 언어모델을 이용하여 감정 분석을 수행하고,
상기 적어도 하나의 프로세서는,
복수 개의 도메인에 대해 도메인 별로 수집된 정답 데이터 셋을 기초로 상기 앙상블 학습으로 생성된 복수 개의 모델과 상기 전이 학습으로 생성된 복수 개의 모델을 이용하여 새로운 도메인의 정답이 없는 데이터에 대해 정답을 예측한 정답 데이터를 생성함으로써 상기 인공지능 언어모델의 학습 데이터를 확장하는 것
을 특징으로 하는 컴퓨터 장치. - 제12항에 있어서,
상기 적어도 하나의 프로세서는,
상기 정답 데이터 셋을 분할하여 복수 개의 데이터 그룹을 구축하고,
상기 복수 개의 도메인으로 학습된 모델에 대해 상기 정답 데이터 셋의 전체 데이터로 전이 학습한 제1 모델과 상기 데이터 그룹 각각으로 전이 학습한 복수 개의 제2 모델을 생성하는 것
을 특징으로 하는 컴퓨터 장치. - 제13항에 있어서,
상기 적어도 하나의 프로세서는,
상기 복수 개의 도메인으로 학습된 모델의 전체 파라미터를 재학습하는 전이 학습을 이용하여 상기 제1 모델과 상기 제2 모델을 생성하는 것
을 특징으로 하는 컴퓨터 장치. - 제13항에 있어서,
상기 적어도 하나의 프로세서는,
상기 복수 개의 도메인으로 학습된 모델의 일부 파라미터를 고정시키고 나머지 파라미터를 재학습하는 전이 학습을 이용하여 상기 제1 모델과 상기 제2 모델을 생성하는 것
을 특징으로 하는 컴퓨터 장치. - 삭제
- 제12항에 있어서,
상기 적어도 하나의 프로세서는,
상기 새로운 도메인의 데이터에 대해 복수 개의 모델을 이용하여 정답을 예측하고,
모델 간의 예측 결과를 비교하여 정답을 예측한 데이터 중 적어도 일부를 상기 정답 데이터로 선정하는 것
을 특징으로 하는 컴퓨터 장치.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020200156482A KR102441854B1 (ko) | 2020-11-20 | 2020-11-20 | 범용적인 감정 분석 서비스를 위한 방법 및 장치 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020200156482A KR102441854B1 (ko) | 2020-11-20 | 2020-11-20 | 범용적인 감정 분석 서비스를 위한 방법 및 장치 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20220069404A KR20220069404A (ko) | 2022-05-27 |
KR102441854B1 true KR102441854B1 (ko) | 2022-09-13 |
Family
ID=81791904
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020200156482A KR102441854B1 (ko) | 2020-11-20 | 2020-11-20 | 범용적인 감정 분석 서비스를 위한 방법 및 장치 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR102441854B1 (ko) |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102368064B1 (ko) | 2020-08-25 | 2022-02-25 | 서울대학교산학협력단 | 텍스트 기반 사전 학습 모델을 활용한 종단형 음성언어이해 지식 증류를 위한 방법, 시스템, 및 컴퓨터 판독가능한 기록 매체 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20200033515A (ko) * | 2018-09-20 | 2020-03-30 | 한국전자통신연구원 | 다중특징 추출 및 전이학습 기반 기계학습 장치/방법 및 이를 이용한 누출 탐지 장치 |
KR102410239B1 (ko) * | 2019-02-12 | 2022-06-20 | 주식회사 자이냅스 | 가변 분류기를 이용한 문서 학습 프로그램을 기록한 기록매체 |
KR102204740B1 (ko) * | 2019-02-28 | 2021-01-19 | 네이버 주식회사 | 대화 시스템에서의 의도 불분명 질의를 처리하는 방법 및 시스템 |
-
2020
- 2020-11-20 KR KR1020200156482A patent/KR102441854B1/ko active IP Right Grant
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102368064B1 (ko) | 2020-08-25 | 2022-02-25 | 서울대학교산학협력단 | 텍스트 기반 사전 학습 모델을 활용한 종단형 음성언어이해 지식 증류를 위한 방법, 시스템, 및 컴퓨터 판독가능한 기록 매체 |
Non-Patent Citations (4)
Title |
---|
Kai Zhang 외 5명, 'Interactive Attention Transfer Network for Cross-Domain Sentiment Classification', The Thirty-Third AAAI Conference on Artificial Intelligence (AAAI-19), 2019.07., pp.5773-5780. 1부.* |
Siqi Sun 외 2명, ‘Patient Knowledge Distillation for BERT Model Compression’, EMNPL-IJCNLP 2019, 2019.11., pp.4323-4332. 1부.* |
네이버 블로그, '[Python Machine Learning] 5. 분류 : 앙상블 & 랜덤 포레스트', url: https://blog.naver.com/slykid/221658390208)", 2019.09., pp.1-22. 1부.* |
박성욱 외 1명 ‘전이학습에 방법에 따른 컨벌루션 신경망의 영상 분류 성능 비교’, Journal of Korea Multimedia Society Vol. 21, No. 12, 2018.11., pp. 1387-1395. 1부.* |
Also Published As
Publication number | Publication date |
---|---|
KR20220069404A (ko) | 2022-05-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11934791B2 (en) | On-device projection neural networks for natural language understanding | |
US11816439B2 (en) | Multi-turn dialogue response generation with template generation | |
CN111602148B (zh) | 正则化神经网络架构搜索 | |
US10769532B2 (en) | Network rating prediction engine | |
US20180018562A1 (en) | Platform for providing task based on deep learning | |
US20230162098A1 (en) | Schema-Guided Response Generation | |
CN111368996A (zh) | 可传递自然语言表示的重新训练投影网络 | |
US11533495B2 (en) | Hierarchical video encoders | |
US11360927B1 (en) | Architecture for predicting network access probability of data files accessible over a computer network | |
CN118119954A (zh) | 使用一个或多个机器学习模型的提示调整 | |
CN111723295B (zh) | 一种内容分发方法、装置和存储介质 | |
CN116547681A (zh) | 用于持续演进内容的动态语言模型 | |
Fung et al. | Empathetic dialog systems | |
CN115803806A (zh) | 用于训练双模式机器学习言语识别模型的系统和方法 | |
Zhu et al. | Joint visual-textual sentiment analysis based on cross-modality attention mechanism | |
WO2023231513A1 (zh) | 对话内容的生成方法及装置、存储介质、终端 | |
KR102446305B1 (ko) | 하이라이팅 기능이 포함된 감정 분석 서비스를 위한 방법 및 장치 | |
Lei et al. | BERT based hierarchical sequence classification for context-aware microblog sentiment analysis | |
KR102441854B1 (ko) | 범용적인 감정 분석 서비스를 위한 방법 및 장치 | |
Lamons et al. | Python Deep Learning Projects: 9 projects demystifying neural network and deep learning models for building intelligent systems | |
CN114818690A (zh) | 一种评论信息生成的方法、装置及存储介质 | |
US20250061312A1 (en) | Knowledge Graphs for Dynamically Generating Content Using a Machine-Learned Content Generation Model | |
Griol et al. | A Comparison of Learning Approaches to Dialogue Management in Conversational Systems | |
KR20240048799A (ko) | 본문 단어를 이용하여 제목 단어의 임베딩을 강화하는 문서 추천 방법, 컴퓨터 장치, 및 컴퓨터 프로그램 | |
Wang et al. | BAB-QA: a new neural model for emotion detection in multi-party dialogue |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PA0109 | Patent application |
Patent event code: PA01091R01D Comment text: Patent Application Patent event date: 20201120 |
|
PA0201 | Request for examination | ||
PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20211215 Patent event code: PE09021S01D |
|
PG1501 | Laying open of application | ||
E701 | Decision to grant or registration of patent right | ||
PE0701 | Decision of registration |
Patent event code: PE07011S01D Comment text: Decision to Grant Registration Patent event date: 20220630 |
|
GRNT | Written decision to grant | ||
PR0701 | Registration of establishment |
Comment text: Registration of Establishment Patent event date: 20220905 Patent event code: PR07011E01D |
|
PR1002 | Payment of registration fee |
Payment date: 20220906 End annual number: 3 Start annual number: 1 |
|
PG1601 | Publication of registration |