KR102100951B1 - 기계 독해를 위한 질의응답 데이터 생성 시스템 - Google Patents
기계 독해를 위한 질의응답 데이터 생성 시스템 Download PDFInfo
- Publication number
- KR102100951B1 KR102100951B1 KR1020170153356A KR20170153356A KR102100951B1 KR 102100951 B1 KR102100951 B1 KR 102100951B1 KR 1020170153356 A KR1020170153356 A KR 1020170153356A KR 20170153356 A KR20170153356 A KR 20170153356A KR 102100951 B1 KR102100951 B1 KR 102100951B1
- Authority
- KR
- South Korea
- Prior art keywords
- correct answer
- question
- text
- sentence
- correct
- Prior art date
Links
- 238000012545 processing Methods 0.000 claims abstract description 42
- 238000000034 method Methods 0.000 claims abstract description 40
- 230000004044 response Effects 0.000 claims abstract description 32
- 238000012937 correction Methods 0.000 claims description 37
- 230000014509 gene expression Effects 0.000 claims description 8
- 238000012549 training Methods 0.000 claims description 4
- 238000004458 analytical method Methods 0.000 description 12
- 238000010801 machine learning Methods 0.000 description 11
- 238000010586 diagram Methods 0.000 description 8
- 230000008569 process Effects 0.000 description 6
- 230000006870 function Effects 0.000 description 5
- 239000013589 supplement Substances 0.000 description 5
- 230000000694 effects Effects 0.000 description 3
- 210000000056 organ Anatomy 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000000877 morphologic effect Effects 0.000 description 2
- 239000000047 product Substances 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000010224 classification analysis Methods 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000001151 other effect Effects 0.000 description 1
- 230000009469 supplementation Effects 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 230000001755 vocal effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Software Systems (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Artificial Intelligence (AREA)
- Machine Translation (AREA)
Abstract
Description
도 2는 본 발명에 따른, 학습 데이터 생성 방법을 나타낸 흐름도이다.
도 3은, 입력되는 본문들에 대한 언어 처리 과정을 개략적으로 도시한 도면이다.
도 4는 정답의 위치가 보정되는 예를 나타낸 도면이다.
도 5는 본 발명에 따른 질의 응답 시스템을 도시한 도면이다.
도 6은 본 발명에 따른, 정답 보정부의 동작을 설명하기 위한 도면이다.
마인즈랩(대표 유태준)은 28일 부산에서 열린 'ITU 텔레콤월드 2017' 시상식에서 ITU 인증 우수 기업(Recognition of Excellence Certificate)으로 선정됐다고 밝혔다. 행사에 참여한 기업 중 가장 혁신적인 미래 기술 경쟁력을 지닌 중소기업에 부여되는 인증으로, 국내 기업으로는 마인즈랩이 유일하게 선정됐다. 마인즈랩은 전시회에서 인공지능 플랫폼 기반의 고객 센터 분석 및 품질 관리, 상답원 지원 솔루션인 마인즈 VOC, QC, RS 제품군을 선보였다. 해당 제품군은, 마인즈랩이 기업 고객을 대상으로 개발해 국내외 주요 기업의 전화 상담 센터에 도입된 인공지능 고객센터 솔루션이다. |
<템플릿 예시> 1. 00의 00은 누구야 2. 00은 어디에서 00했어? |
<질문 제작 예시> 1. <마인즈랩>의 <대표>는 누구야? 2. <'ITU 텔레콤월드 2017' 시상식>은 어디에서 <열렸>어? |
<언어 처리 결과 예시> 마인즈랩/NNP<ORG>, 대표/NNG, 유태준/NNP<PERSON>, 부산/NNG<LOC>, 열/VV... |
<질문-정답 제작 예시> 1. 마인즈랩의 대표는 누구야? - 유태준 |
<질의 응답 예시> Q : ITU 텔레콤월드 2017' 시상식에서 ITU 인증 우수 기업으로 선정된 기업이 제공하는 솔루션이 뭐야? A : 인공지능 고객센터 솔루션 |
<시스템 에러 문구 예시> - 질문 관련 문장과 정답이 <3> 문장 떨어져 있습니다. - 정답 근처에 질문과 연관 있는 내용이 없습니다. - 질문 관련 문장 근처에 정답과 연관 있는 내용이 없습니다. |
<질의 응답 예시> Q : 마인즈랩 뭘로 선정됐어? A : ITU 인증 우수 기업 |
<시스템이 추천한 복수 정답> A1 : ITU 인증 우수 기업(Recognition of Excellence Certificate) A2 : 'ITU 텔레콤월드 2017' 시상식에서 ITU 인증 우수 기업(Recognition of Excellence Certificate) |
<질의 응답 예시> Q : 마인즈랩이 공개한 솔루션 뭐 있어? A : 마인즈 VOC, QC |
<시스템이 추천한 정답> A : 마인즈 VOC, QC, RS |
<입력된 질문> Q : 마인즈랩은 어떤 기업이야? |
<본문 중 정답을 추출할 부분> 마인즈랩은 인공지는 플랫폼을 만드는 회사로 현재… |
<모델이 예측한 정답> 마인즈랩은 인공지능 플랫폼을 만드는 |
<보정된 정답> 마인즈랩은 인공지는 플랫폼을 만드는 회사 |
200 : 질의 응답 시스템
Claims (14)
- 컴퓨팅 디바이스에 의해 구현되는 학습 데이터 생성 방법에 있어서,
학습하고자 하는 본문에 대한 언어 처리를 수행하는 단계;
상기 본문과 관련된 질문 및 정답 세트를 수신하는 단계;
상기 본문 내 상기 질문과 관련된 문장의 위치 및 상기 정답과 관련된 문장의 위치를 특정하는 단계; 및
상기 질문과 관련된 문장의 위치 및 상기 정답과 관련된 문장의 위치 차이가 기 설정된 값 이상인지 여부를 기초로, 상기 질문 및 정답 세트의 유효성을 검증하는 단계를 포함하는, 학습 데이터 생성 방법. - 제1 항에 있어서,
상기 본문에 포함된 문장 중 상기 질문에 포함된 실질 형태소를 가장 많이 포함하는 문장이 상기 질문과 관련된 문장으로 결정되는 것을 특징으로 하는, 학습 데이터 생성 방법. - 제1 항에 있어서,
상기 질문 및 정답 세트가 유효한 것으로 판단되는 경우, 상기 정답과 관련된 문장의 위치는, 상기 정답을 포함하는 문장들 중 상기 질문과 유사도가 가장 높은 것으로 결정되는 것을 특징으로 하는, 학습 데이터 생성 방법. - 제1 항에 있어서,
상기 질문 및 정답 세트가 유효한 것으로 판단되는 경우, 상기 본문에서 상기 질문에 대한 추가 정답을 추출하는 단계를 더 포함하는, 학습 데이터 생성 방법. - 제4 항에 있어서,
상기 추가 정답은, 상기 본문 내 상기 정답을 포함하는 문장에서, 상기 정답에 인접한 괄호 표현과 상기 정답을 결합함으로써 생성되는 것을 특징으로 하는, 학습 데이터 생성 방법. - 제4 항에 있어서,
상기 본문 내 상기 정답을 포함하는 문장에서, 상기 정답이 포함된 구 전체가 상기 추가 정답으로 생성되는 것을 특징으로 하는, 학습 데이터 생성 방법. - 제1 항에 있어서,
상기 질문 및 정답 세트가 유효한 것으로 판단되고, 상기 정답이 상기 본문 중 열거형으로 표현된 요소들 중 일부만을 포함하는 경우, 상기 열거형으로 표현된 요소들 모두를 포함하도록 상기 정답이 보정되는 것을 특징으로 하는, 학습 데이터 생성 방법. - 학습하고자 하는 본문에 대한 언어 처리를 수행하는 언어 처리부;
상기 본문과 관련된 질문 및 정답 세트를 수신하는 입력부; 및
상기 본문 내 상기 질문과 관련된 문장의 위치 및 상기 정답과 관련된 문장의 위치를 특정하고, 상기 질문과 관련된 문장의 위치 및 상기 정답과 관련된 문장의 위치 차이가 기 설정된 값 이상인지 여부를 기초로, 상기 질문 및 정답 세트의 유효성을 검증하는 질의 응답 보정부를 포함하는, 학습 데이터 생성 시스템. - 삭제
- 컴퓨팅 디바이스에 의해 구현되는 기계 독해에 기반한 질의 응답 방법에 있어서,
본문을 입력받는 단계;
상기 본문에 대한 언어 처리를 수행하는 단계;
상기 본문과 관련된 질문을 입력받는 단계;
상기 본문을 기초로 상기 질문에 대한 정답을 예측하는 단계; 및
상기 정답을 보정하는 단계를 포함하고,
상기 보정은
상기 예측된 정답을 포함하는 문장을 전후하여, 상기 질문에 포함된 실질 형태소와 의미적 유사도가 일정 수준 이상인 단어가 포함되는 경우, 상기 단어를 추가하는 방식으로 상기 보정이 수행되는 것을 특징으로 하는, 기계 독해에 기반한 질의 응답 방법. - 컴퓨팅 디바이스에 의해 구현되는 기계 독해에 기반한 질의 응답 방법에 있어서,
본문을 입력받는 단계;
상기 본문에 대한 언어 처리를 수행하는 단계;
상기 본문과 관련된 질문을 입력받는 단계;
상기 본문을 기초로 상기 질문에 대한 정답을 예측하는 단계; 및
상기 정답을 보정하는 단계를 포함하고,
상기 보정은
상기 예측된 정답을 포함하는 문장을 전후하여, 상기 예측된 정답과 인접한 단어가 동일한 구를 형성하는 경우, 상기 인접 단어를 추가하는 방식으로 상기 보정이 수행되는 것을 특징으로 하는, 기계 독해에 기반한 질의 응답 방법. - 컴퓨팅 디바이스에 의해 구현되는 기계 독해에 기반한 질의 응답 방법에 있어서,
본문을 입력받는 단계;
상기 본문에 대한 언어 처리를 수행하는 단계;
상기 본문과 관련된 질문을 입력받는 단계;
상기 본문을 기초로 상기 질문에 대한 정답을 예측하는 단계; 및
상기 정답을 보정하는 단계를 포함하고,
상기 예측된 정답이 명사로 종결되지 않는 경우,
상기 보정은,
상기 예측된 정답을 포함하는 문장에서 상기 예측된 정답 이후 처음으로 명사가 발견되는 지점 까지 상기 정답의 위치를 변경함으로써 수행되는 것을 특징으로 하는, 기계 독해에 기반한 질의 응답 방법. - 컴퓨팅 디바이스에 의해 구현되는 기계 독해에 기반한 질의 응답 방법에 있어서,
본문을 입력받는 단계;
상기 본문에 대한 언어 처리를 수행하는 단계;
상기 본문과 관련된 질문을 입력받는 단계;
상기 본문을 기초로 상기 질문에 대한 정답을 예측하는 단계; 및
상기 정답을 보정하는 단계를 포함하고,
상기 예측된 정답을 보정할 것인지 여부는, 상기 예측된 정답의 길이, 상기 예측된 정답의 종결어가 명사인지 여부 또는 상기 예측된 정답의 종결어미가 서술형인지 여부에 따라 결정되는 것을 특징으로 하는, 기계 독해에 기반한 질의 응답 방법. - 본문 및 질문을 입력받는 입력부;
상기 본문에 대한 언어 처리를 수행하는 언어 처리부;
상기 본문을 기초로 상기 질문에 대한 정답을 예측하는 정답 예측부; 및
상기 예측된 정답을 보정하는 정답 보정부를 포함하고,
상기 예측된 정답을 보정할 것인지 여부는, 상기 예측된 정답의 길이, 상기 예측된 정답의 종결어가 명사인지 여부 또는 상기 예측된 정답의 종결어미가 서술형인지 여부에 따라 결정되는 것을 특징으로 하는, 기계 독해에 기반한 질의 응답 시스템.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020170153356A KR102100951B1 (ko) | 2017-11-16 | 2017-11-16 | 기계 독해를 위한 질의응답 데이터 생성 시스템 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020170153356A KR102100951B1 (ko) | 2017-11-16 | 2017-11-16 | 기계 독해를 위한 질의응답 데이터 생성 시스템 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20190056184A KR20190056184A (ko) | 2019-05-24 |
KR102100951B1 true KR102100951B1 (ko) | 2020-04-14 |
Family
ID=66679930
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020170153356A KR102100951B1 (ko) | 2017-11-16 | 2017-11-16 | 기계 독해를 위한 질의응답 데이터 생성 시스템 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR102100951B1 (ko) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102231365B1 (ko) * | 2019-11-20 | 2021-03-24 | 재단법인 한국특허정보원 | 특허분야를 위한 기계독해기술 기반 질의응답 서비스 제공 방법, 서버, 및 기록매체 |
CN111061851B (zh) * | 2019-12-12 | 2023-08-08 | 中国科学院自动化研究所 | 基于给定事实的问句生成方法及系统 |
KR102569381B1 (ko) | 2019-12-16 | 2023-08-23 | 부산대학교 산학협력단 | 테이블 중심의 웹 문서를 위한 기계독해 시스템 및 방법 |
CN112149426B (zh) * | 2020-09-27 | 2024-02-09 | 腾讯科技(深圳)有限公司 | 阅读任务处理方法及相关设备 |
KR102584452B1 (ko) * | 2020-10-07 | 2023-10-05 | 한국전자통신연구원 | 기계 독해 학습 데이터 자동 생성 장치 및 그 방법 |
CN113010655B (zh) * | 2021-03-18 | 2022-12-16 | 华南理工大学 | 一种机器阅读理解的回答与干扰项生成方法、装置 |
KR102436549B1 (ko) * | 2022-07-20 | 2022-08-25 | (주) 유비커스 | 딥러닝을 이용한 자연어처리 기반의 faq 및 챗봇을 위한 학습데이터를 자동으로 생성하기 위한 방법 및 이를 위한 장치 |
KR102741563B1 (ko) * | 2023-11-29 | 2024-12-12 | 퍼플에듀케이션 주식회사 | 인공지능 기반의 ar교육콘텐츠 제공시스템 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2010135204A2 (en) | 2009-05-22 | 2010-11-25 | Microsoft Corporation | Mining phrase pairs from an unstructured resource |
JP2017049681A (ja) | 2015-08-31 | 2017-03-09 | 国立研究開発法人情報通信研究機構 | 質問応答システムの訓練装置及びそのためのコンピュータプログラム |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20150129134A (ko) * | 2014-05-08 | 2015-11-19 | 한국전자통신연구원 | 질의 응답 시스템 및 그 방법 |
JP6414956B2 (ja) * | 2014-08-21 | 2018-10-31 | 国立研究開発法人情報通信研究機構 | 質問文生成装置及びコンピュータプログラム |
-
2017
- 2017-11-16 KR KR1020170153356A patent/KR102100951B1/ko active IP Right Grant
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2010135204A2 (en) | 2009-05-22 | 2010-11-25 | Microsoft Corporation | Mining phrase pairs from an unstructured resource |
JP2017049681A (ja) | 2015-08-31 | 2017-03-09 | 国立研究開発法人情報通信研究機構 | 質問応答システムの訓練装置及びそのためのコンピュータプログラム |
Also Published As
Publication number | Publication date |
---|---|
KR20190056184A (ko) | 2019-05-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102100951B1 (ko) | 기계 독해를 위한 질의응답 데이터 생성 시스템 | |
CN112417102B (zh) | 一种语音查询方法、装置、服务器和可读存储介质 | |
US9342499B2 (en) | Round-trip translation for automated grammatical error correction | |
US20180276525A1 (en) | Method and neural network system for human-computer interaction, and user equipment | |
US20170206897A1 (en) | Analyzing textual data | |
US9443513B2 (en) | System and method for automated detection of plagiarized spoken responses | |
US20150079554A1 (en) | Language learning system and learning method | |
US10896222B1 (en) | Subject-specific data set for named entity resolution | |
TWI553491B (zh) | 問句處理系統及其方法 | |
JP6988924B2 (ja) | 質問群抽出方法、質問群抽出装置および質問群抽出プログラム | |
KR102292040B1 (ko) | 기계 독해 기반 지식 추출을 위한 시스템 및 방법 | |
TW201822190A (zh) | 語音辨識系統及其方法、詞彙建立方法與電腦程式產品 | |
CN117828057A (zh) | 知识问答方法、装置、设备和存储介质 | |
KR20120042562A (ko) | 온라인 사전을 이용한 개체명 사전 구축 방법 및 이를 실행하는 장치 | |
CN113157888A (zh) | 支持多知识来源的询问答复方法、装置和电子设备 | |
US11106874B2 (en) | Automated chatbot linguistic expression generation | |
KR102562692B1 (ko) | 문장 구두점 제공 시스템 및 방법 | |
CN109934347B (zh) | 扩展问答知识库的装置 | |
JP2013250926A (ja) | 質問応答装置、方法、及びプログラム | |
JP6942759B2 (ja) | 情報処理装置、プログラム及び情報処理方法 | |
US20200026753A1 (en) | Machine based expansion of contractions in text in digital media | |
CN115049899B (zh) | 模型训练方法、指代表达式生成方法及相关设备 | |
BE1022627A1 (nl) | Methode en apparaat voor het automatisch genereren van feedback | |
KR20220160358A (ko) | 상담문에 대한 요약문을 생성하는 서버, 방법 및 컴퓨터 프로그램 | |
JP5528376B2 (ja) | 文書平易化装置およびプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
PA0109 | Patent application |
Patent event code: PA01091R01D Comment text: Patent Application Patent event date: 20171116 |
|
PA0201 | Request for examination | ||
PG1501 | Laying open of application | ||
E902 | Notification of reason for refusal | ||
PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20190722 Patent event code: PE09021S01D |
|
E701 | Decision to grant or registration of patent right | ||
PE0701 | Decision of registration |
Patent event code: PE07011S01D Comment text: Decision to Grant Registration Patent event date: 20200109 |
|
GRNT | Written decision to grant | ||
PR0701 | Registration of establishment |
Comment text: Registration of Establishment Patent event date: 20200408 Patent event code: PR07011E01D |
|
PR1002 | Payment of registration fee |
Payment date: 20200409 End annual number: 3 Start annual number: 1 |
|
PG1601 | Publication of registration | ||
PR1001 | Payment of annual fee |
Payment date: 20230407 Start annual number: 4 End annual number: 4 |
|
PR1001 | Payment of annual fee |
Payment date: 20240409 Start annual number: 5 End annual number: 5 |