KR20190109614A - 계층적으로 사용자 표현을 이해하고 답변을 생성하는 대화형 상담 챗봇 장치 및 방법 - Google Patents

계층적으로 사용자 표현을 이해하고 답변을 생성하는 대화형 상담 챗봇 장치 및 방법 Download PDF

Info

Publication number
KR20190109614A
KR20190109614A KR1020180023382A KR20180023382A KR20190109614A KR 20190109614 A KR20190109614 A KR 20190109614A KR 1020180023382 A KR1020180023382 A KR 1020180023382A KR 20180023382 A KR20180023382 A KR 20180023382A KR 20190109614 A KR20190109614 A KR 20190109614A
Authority
KR
South Korea
Prior art keywords
query
understanding
answer
conversation
chatbot
Prior art date
Application number
KR1020180023382A
Other languages
English (en)
Other versions
KR102103273B1 (ko
Inventor
김현민
김현태
권우영
Original Assignee
주식회사 와이즈넛
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 와이즈넛 filed Critical 주식회사 와이즈넛
Priority to KR1020180023382A priority Critical patent/KR102103273B1/ko
Priority to PCT/KR2018/014579 priority patent/WO2019168253A1/ko
Publication of KR20190109614A publication Critical patent/KR20190109614A/ko
Application granted granted Critical
Publication of KR102103273B1 publication Critical patent/KR102103273B1/ko

Links

Images

Classifications

    • G06Q50/50
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/30Transportation; Communications
    • G06Q50/40
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H80/00ICT specially adapted for facilitating communication between medical practitioners or patients, e.g. for collaborative diagnosis, therapy or health monitoring

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Multimedia (AREA)
  • Epidemiology (AREA)
  • Public Health (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Biomedical Technology (AREA)
  • Acoustics & Sound (AREA)
  • Pathology (AREA)
  • Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Operations Research (AREA)
  • Economics (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Machine Translation (AREA)

Abstract

본 발명은 사용자 디바이스가 통신 시스템을 통해 질의를 발화하면, 대화 시스템이 구축되어 있는 챗봇 디바이스가 시스템 응답을 하는 방법에 관한 것입니다.
본 발명의 프로세스는, (a) 입력된 텍스트로부터 대화의 목적에 맞는 개체를 추출하고, (b) 추출된 개체를 이용해 기계학습에 필요한 특징 벡터를 생성하며, (c) 생성된 특징 벡터를 이용해 계층적으로 구성된 질의의도, 대화주제 및 질의상황을 추출하여 질의이해를 수행합니다. 또한 (d) 질의의도, 대화주제 및 질의상황의 계층요소에 맞는 답변을 찾아내어 답변을 생성합니다.
이렇게 구성함으로써 계층적으로 사용자 표현을 이해할 수 있으며, 정확한 답변을 생성할 수 있습니다.

Description

계층적으로 사용자 표현을 이해하고 답변을 생성하는 대화형 상담 챗봇 장치 및 방법{METHOD AND APPRARTUS FOR CHATBOTS IN CUSTOMER SERVICE ANALYZING HIERARCHICAL USER EXPRESSION AND GENERATING RESPONSES}
본 발명은 기계학습 기반의 언어 분석 및 처리 기술에 관한 것이며, 특히 대화형 고객상담을 수행하는 챗봇 기술에 관한 것이다.
기계에 의해 사람의 음성을 인식하여 반응하는 기술은 실생활의 여러 분야에서 인공지능 시스템으로 응용되고 있다. 이러한 시스템은 텍스트 마이닝 기술을 바탕으로 사용자의 입력 문장을 분석하여 의미를 파악하고, 그 의도에 맞게 응답을 생성, 출력하게 된다. 이러한 정보처리 기술 및 기계학습 기술의 발달로 상담사를 대신하여 고객의 질의에 대한 답변을 자동화할 수 있는 대화 시스템 (Dialog System) 또는 챗봇 (Chatbot)의 활용이 이곳저곳 시도되고 있다.
현재의 챗봇 시스템은 특정 서비스를 사용자에게 제공하기 위한 대화를 만들어 가는 목적지향 대화 기술과, 목적성이 없는 일상 대화를 제공하는 부분에 주로 활용되는 열린 도메인(Open Domain) 대화 기술로 크게 구분될 수 있다. 목적지향 대화 기술은 미리 정해진 답변이 주어져 있고, 사용자의 의도와 질의내용을 분석해서 가장 적절한 답변을 제공하는 것이다. 제한된 답변 중에 하나를 고르는 문제이기 때문에 비교적 정확한 답변이 가능하다. 그러나 답변을 미리 준비하고 정제하는 과정에 많은 노력이 소요된다. 열린 도메인 대화 기술은 사용자의 표현에 대한 답변을 기계학습 또는 규칙을 활용하여 스스로 만들어 낸다. 이 방식은 별도의 지식구축이 필요 없으며 대화 예제의 확보만으로 대화 시스템의 구현이 가능하다는 장점이 있다. 그러나 답변의 정확도가 떨어지며 의도치 않은 대화가 많이 발생하는 단점이 있다.
상담사를 대신하는 고객상담용 챗봇 시스템은 활용할 도메인이 정해져 있다는 특징이 있으며, 답변의 정확성이 중요하기 때문에 주로 목적지향 대화 기술이 활용되고 있다. 이러한 챗봇 시스템은 사용자의 텍스트 입력에 적합한 시스템 응답을 생성하는 기술이 필수적으로 요구된다. 종래에는 질문-답변으로 구성된 미리 구축된 데이터 집합을 활용하여 질문과 답변간의 매핑관계를 규칙으로 표현하거나, 기계학습으로 배워서 질의의도를 추출하는 모델을 만들었다. 사용자의 질문이 들어왔을 때, 미리 만들어진 모델을 활용하여 사용자의 질문을 가장 잘 표현하는 의도가 무엇인지를 분류한다. 그런 다음에 분류된 의도에 맞는 답변을 제공하는 역할을 수행하는 것이다.
이와 같은 종래의 의도분류 모델은 미리 정의된 질문-답변 데이터 셋에 포함되어 있거나, 유사한 질문에 대한 답변을 생성하기 때문에, 상담사를 대신하는 자동화된 답변 생성이 가능하다는 특징이 있으나, 복잡하고 많은 질문을 처리하는 경우에는 확실히 문제를 보였다.
분류하고자 하는 의도가 많아질 경우가 문제였다. 종래기술은 답변의 정확성에서 문제점을 낳았다. 예를 들어 분류해야 할 의도가 10개인 경우에는 질문에 맞는 답변의 후보가 10개이기 때문에 비교적 정확한 의도분류가 가능해질 수 있겠다. 그러나 분류해야 할 의도가 1000개로 증가하면 대상 후보가 증가하기 때문에 보다 많은 후보들 중에서 정확한 의도를 찾아야 하고, 그로 말미암아 정확도가 크게 떨어져버리는 것이다.
또한, 종래의 방법은 질문의 내용이 복잡하다거나, 질문이 여러 가지 정보를 담고 있는 경우, 질문과 답변간의 적합한 매핑을 찾기 어려워서 답변의 정확도가 떨어졌다.
본 발명의 발명자들은 이러한 종래 기술을 개선하기 위해 오랫동안 연구하고 노력하면서 국가연구개발사업에 참여한 끝에 본 발명을 완성하기에 이르렀다.
상기와 같은 문제점을 해결하기 위한 본 발명의 목적은, 대화 시스템에서 사용자의 복잡하고 다양한 표현을 보다 정확히 이해하고, 많은 종류의 답변 중에서 사용자가 원하는 답변을 높은 정확도로 찾기 위한 방법과, 그런 방법이 구현된 대화 시스템을 제공함에 있다.
한편, 본 발명의 명시되지 않은 또 다른 목적들은 하기의 상세한 설명 및 그 효과로부터 용이하게 추론 할 수 있는 범위 내에서 추가적으로 고려될 것이다.
본 발명의 제1국면은 사용자 디바이스가 통신 시스템을 통해 질의를 발화하면, 대화 시스템이 구축되어 있는 챗봇 디바이스가 시스템 응답을 함에 있어서, 상기 챗봇 디바이스가 수행하는 계층적으로 사용자 표현을 이해하고 답변을 생성하는 대화형 상담 챗봇의 구현 방법에 관한 것이다.
본 발명의 방법은:
(a) 입력된 텍스트로부터 대화의 목적에 맞는 개체를 추출하고,
(b) 추출된 개체를 이용해 기계학습에 필요한 특징 벡터를 생성하며,
(c) 생성된 특징 벡터를 이용해 계층적으로 구성된 질의의도, 대화주제 및 질의상황을 추출하여 질의이해를 수행하고,
(d) 상기 질의의도, 대화주제 및 질의상황의 계층요소에 맞는 답변을 찾아내어 답변을 생성하는 단계를 수행한 후에,
(e) 상기 생성된 답변을 음성을 결합하여 상기 사용자 디바이스에 응답을 전송하는 단계를 포함한다.
또한 본 발명의 바람직한 어느 실시예에 있어서, 상기 챗봇 디바이스는 병원 시스템에 구축될 수 있다.
또한 본 발명의 바람직한 어느 실시예에 있어서, 상기 (a) 단계는 개체 인식 단계이며, 이 단계에서 추출되는 개체는 (개체종류, 대표값)으로 표현되는 N개(N은 1 이상의 정수)의 배열로 추출되도록 할 수 있다.
또한 본 발명은 사용자 디바이스가 통신 시스템을 통해 질의를 발화하면, 대화 시스템이 구축되어 있는 챗봇 디바이스가 시스템 응답을 수행하는 대화형 상담 챗봇 디바이스에 관한다. 이 디바이스는:
입력문장에 대한 전처리를 수행하는 텍스트 전처리기와
상기 텍스트 전처리기에 의해 전처리된 텍스트를 분석 가능한 개체를 추출하는 개체 추출부와,
분석된 개체들과 사전 정의된 단어를 이용해 수치화된 벡터를 생성하는 특징벡터 생성부와
상기 생성된 특징벡터에 대해 질의의도, 대화주제, 질의상황이라는 세 가지 분류 항목으로 이해하도록 구성되는 질의의도 이해부, 대화주제 이해부 및 질의상황 이해부를 포함하고, 질의의도 이해부, 대화주제 이해부 및 질의상황 이해부는 각각 복수의 계층 분류기를 포함하는 것을 특징으로 한다.
위와 같은 과제해결수단을 통해서, 본 발명은 사용자의 질문으로부터 사용자의 의도뿐 아니라 사용자가 원하는 답변의 주제 및 상황을 고려해서 정확한 응답 데이터를 추출할 수 있다는 장점이 있다.
또한, 본 발명은 계층적 분류방법을 활용하여 사용자의 복잡하고 다양한 질문들을 계층적으로 분류하여 답변의 정확도를 높일 수 있다.
사용자의 상담 질문에 대해 질의의도, 대화주제 및 대화 상황에 맞는 답변을 제공하는 본 발명의 챗봇 상담 시스템에 활용한다면, 다양한 분야에서 효과적인 기계 상담을 구현할 수 있을 것이다. 예컨대 만성질환자를 위한 라이프스타일 기반의 대화형 의료문진도 효과적으로 구현할 수 있다.
한편, 여기에서 명시적으로 언급되지 않은 효과라 하더라도, 본 발명의 기술적 특징에 의해 기대되는 이하의 명세서에서 기재된 효과 및 그 잠정적인 효과는 본 발명의 명세서에 기재된 것과 같이 취급됨을 첨언한다.
도 1은 본 발명의 전체 시스템 구성을 개념적으론 나타내는 도면이다.
도 2는 본 발명의 바람직한 어느 실시예에 따른 대화 시스템(100)의 개략적인 시스템 및 프로세스 구성을 나타낸다.
도 3은 본 발명의 일 실시예에 따른 계층적인 분류를 위한 기계학습 절차의 구성을 나타낸다.
도 4는 본 발명에 따른 시스템 시나리오에서 대화주제 계층구조의 예를 나타낸다.
도 5는 본 발명에 따른 시스템 시나리오에서 질의의도 계층구조의 예를 나타낸다.
도 6은 본 발명에 따른 시스템 시나리오에서 질의상황 계층구조의 예를 나타낸다.
도 7은 본 발명에 따른 답변 데이터의 레이블 구조의 예를 나타내는 도면이다.
도 8은 본 발명의 일 실시예에 따른 질문과 답변후보간의 유사성을 계산하는 절차의 구성을 개략적으로 나타낸다.
도 9는 본 발명의 일 실시예에 따른 대화형 상담 챗봇의 구현 방법의 전체 프로세스를 개략적으로 나타낸다.
※ 첨부된 도면은 본 발명의 기술사상에 대한 이해를 위하여 참조로서 예시된 것임을 밝히며, 그것에 의해 본 발명의 권리범위가 제한되지는 아니한다.
이하, 도면을 참조하여 본 발명의 다양한 실시예가 안내하는 본 발명의 구성과 그 구성으로부터 비롯되는 효과에 대해 살펴본다. 본 발명을 설명함에 있어서 관련된 공지기능에 대하여 이 분야의 기술자에게 자명한 사항으로서 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우에는 그 상세한 설명을 생략한다.
도 1은 본 발명의 시스템 구성을 개념적으로 나타내었다. 사용자 디바이스(1)가 통신 시스템을 통해 질의를 발화하면 고객 상담 센터에 구축되어 있는 챗봇 디바이스(10)가 그 질의에 최적화된 응답을 사용자 디바이스(1)에 실시간으로 전한다.
사용자 디바이스(1)는 통신 시스템을 통해 고객 상담 센터로 접속할 수 있는 단말을 의미한다. 예컨대 유무선 통신을 수행하는 다양한 형태의 전화기이다.
챗봇 디바이스(10)는 기업(기관)의 고객 상담 센터에 설치된 1개 이상의 하드웨어 및 소프트웨어로 구성된 전자 디바이스이다. 사용자 디바이스(1)의 질의는 음성으로 챗봇 디바이스(10)에 전송되며, 챗봇 디바이스(10)는 본 발명의 프로세스에 따라 추출된 응답을 음성으로 변환하여 스피커를 통해 사용자 디바이스(1)로 전송한다.
상기 챗봇 디바이스(10)는 특히 본 발명의 방법을 구현함에 있어서, 대화 시스템(100)과 메모리(200)를 포함한다. 대화 시스템(100)은 본 발명의 언어처리를 수행하는 하드웨어/소프트웨어 장비이며, 소프트웨어의 구동과 장비의 입출력과 기능 등을 제어하는 제어장치를 포함한다. 메모리(200)는 미리 구축되어 있는 지식 베이스로 데이터를 저장하고 기계학습에 관련한 다양한 데이터베이스를 보관하는 기능을 수행한다. 챗봇 디바이스(10)는 상기 대화 시스템(100) 및 메모리(200) 장비를 포함하는 것이며, 그 상세한 구성 예는 도 2에 도시되어 있다.
도 2는 본 발명의 바람직한 어느 실시예에 따른 대화 시스템(100)의 개략적인 시스템 및 프로세스 구성을 나타낸다. 본 발명에 따른 계층적 사용자 표현 이해 및 답변 생성 방법이 도시되어 있다.
사용자 디바이스를 통해 표현된 사용자 음성은 입력 텍스트로 변환되어 대화 시스템으로 들어간다. 텍스트 전처리기(101)는 입력 텍스트에 대한 오타 확인 및 수정, 줄바꿈 처리, 특수기호 처리 등을 포함한 전처리를 수행한다.
개체 추출부(103)는 전처리된 텍스트를 분석이 가능한 정보 형태로 추출한다. 즉, 입력된 텍스트로부터 대화의 목적에 맞게 개체(entity)를 추출하는 것이다. 개체 추출부(103)에서 수행되는 개체 인식은 동의어 사전(210), 의미자질 사전(211), 패턴 사전(213) 등의 언어 DB에 저장되어 있는 자원을 이용한다. 사용자의 입력 텍스트에 대한 형태소 분석을 수행하고, 동의어 사전(210) 등을 활용해 의미 단위로 분할하며, 어간 추출, 표제어 변환 등의 자연어 처리를 통해 정제한다. 1차적으로 분석되는 단어는 동의어 사전(210)과 매칭되는 단어가 존재하는지 여부이다. 매칭된 동의어는 어떤 의미를 갖는지 의미자질 사전(211)을 이용해 분석된다. 사전에 포함되지 않은 고유명사나 수치형 데이터는 패턴 분석이나 별도의 개체명 사전을 통해 인식된다.
개체 추출부(103)를 통해 나오는 데이터의 형식은, 인식 가능한 개체의 종류가 N개(N은 1 이상의 정수)라면 개체 종류와 대표값으로 표현되는 N개의 배열로 개체 추출부(103)의 출력이 정해진다. 아래와 같다.
(개체종류1, 대표값1), (개체종류2, 대표값2),…, (개체종류N, 대표값N)
예시 입력문을 통해 이 의미를 살펴 보자. 사용자 질의를 통해 다음과 같은 문장이 입력되었다고 가정하자.
“내일 오전 11시이후에 출발하는 서울역에서 대전역까지 가는 KTX 열차의 시간을 알고 싶어.”
그러면, 본 발명의 개체 추출부(103)는 다음과 같이 분석할 수 있다.
(날짜, 내일), (시간, 오전11시), (출발지, 서울역), (도착지, 대전역), (교통수단, KTX), (주요단어, 시간), (주요단어, 문의)
특징벡터 생성부(110)는 분석된 개체들과 사전 정의된 단어를 이용해 수치화된 벡터를 생성한다. 수치화된 벡터 생성 방법은 예컨대 공지의 기법인 Bag of Word, TF/IDF, word embedding 등의 방법을 활용할 수 있다.
생성된 특징벡터는 기계학습기반 분류를 위해 활용된다. 본 발명에서는 질의의도, 대화주제, 질의상황의 세 가지 측면에서 분류가 행해진다. 또한 기계학습 분류에 사용되는 레이블(label)은 계층구조로서 구성된다. 질의의도 및 대화주제는 1계층 분류기에서 선택된 의도 및 주제를 먼저 선택하고, 각각의 선택된 주제 아래에 하부 분류기가 존재한다면 하위 계층에 대한 분류를 수행한다.
질의의도 이해부(120)는 도시되어 있는 것처럼 1계층 분류기(121), 2계층 분류기(122), 3계층 분류기(123)와 같이 복수의 분류기를 포함할 수 있으며, 분류기의 분류 수행에 있어 계층별로 각각 대응하는 의도 분류 학습모델(221, 222, 223)을 사용한다.
대화주제 이해부(130)는 도시되어 있는 것처럼 1계층 분류기(131), 2계층 분류기(132), 3계층 분류기(133)와 같이 복수의 분류기를 포함할 수 있으며, 분류기의 분류 수행에 있어 계층별로 각각 대응하는 주제 분류 학습모델(231, 232, 233)을 사용한다.
질의상황 이해부(120)는 2계층 및 3계층에 대해서만 계층적 분류를 수행한다.
사용자 표현 이해부(150)는 이와 같이 세 가지 분류에 따라 계층적으로 입력문장의 질의의도, 대화주제 및 질의상황을 추출하여 질의 이해를 수행한다. 그런 다음 답변후보 생성부(160)가 답변 지식(260)을 이용해서 답변후보를 생성한 다음에, 시스템 응답 생성부(170)가 최종 답변을 생성해서 음성과 결합하여 출력한다.
한편, 계층적인 분류를 위한 기계학습 절차는 도 3에 예시되어 있다.
질문 데이터(50)와 계층적 레이블(51, 53, 55)은 각 한 쌍으로 구성되어 있다. 전술한 바와 같이 질문 데이터(50)는 텍스트 전처리, 개체 추출, 특징벡터 생성절차를 거쳐 질문을 표현하는 수치화된 벡터로서 표현되어 자동분류 학습기(180)로 전달된다.
주제 레이블(51), 의도 레이블(53), 상황 레이블(55)은 각각 대화주제, 질문의도, 질문상황에 관한 레이블로 계층적인 구조로 구성되며, 이 3단계에 걸친 레이블도 자동분류 학습기(180)로 전달된다.
즉, 질문을 표현하는 벡터와 레이블을 표현하는 벡터는 자동분류 학습기(180)의 학습 데이터로 활용되는 것이다. 그리고 이 자동분류 학습기(180)는 레이블의 계층에 맞게 1계층, 2계층, 3계층에 대한 분류를 각각 수행하여, 최종적으로 각 계층별 분류 학습모델(281, 282, 283)을 생성하여 도 2에 나타난 구조에 활용된다.
그렇다면, 기계학습 분류에 사용되는 계층구조로서 대화주제, 질의의도, 질의상황에 대한 계층구조 레이블의 의미를 예시된 시나리오를 통해 살펴보자. 도 4 내지 도 6은 본 발명의 챗봇 디바이스가 구축되어 있는 병원 고객센터 시스템에 대해, 만성질환에 관한 질의를 하는 경우에 관한 시나리오이다.
도 4의 대화주제 계층구조에서 보는 것처럼, 대화주제의 경우 질문에 포함된 주제에 대한 내용을 찾는 역할을 수행한다. <건강관리>, <질병 및 증상>, <병원 진료> 등 대화의 내용에 따른 1계층 분류가 구성이 되며, 1계층 분류는 상세 내용에 따라 도시되어 있는 것처럼 세분화된 분류로 나뉠 수 있다.
도 5는 질의의도 계층구조에 관한다. 질의의도는 질문의 내용보다는 질문의 목적을 주로 나타낸다. <문의>, <예약>, <정보조회>가 예시되어 있다. <문의>는 특정항목을 물어보는 1계층 분류가 되며, <방법문의>, <결과문의>, <개념문의>, <예후문의> 등으로 구성되는 2계층 분류, <방법문의>의 경우 <예방방법>, <대처방법> 등으로 구성되는 3계층 분류로 계층화할 수 있다. 병원 예약을 위한 것인지, 단순한 정보조회를 원하는 것인지는 각각 1계층 분류로 <예약>과 <정보조회>로 분류된다.
도 6은 질의상황 계층구조에 관한다. 질의상황은 질문자가 처한 상황을 찾아내는 역할을 한다. 앞선 다른 두 개의 분류와 다르게 1계층의 분류를 수행하지 않고 질의상황을 구성하는 모든 요소를 추출한다. 예시에서 질의상황을 표현하는 1단계 요소는 <문의 대상자>, <환자여부>, <성별>, <연령대>가 있으며 1단계 구성요소에 대해서는 모든 항목이 선택될 수 있도록 분류를 하지 않고 2단계 이상부터 분류를 수행한다.
이제 이러한 계층구조의 계층적인 레이블을 이용해서 답변 데이터를 생성하는 모델에 대해서 좀더 구체적인 시나리오를 통해 이해해 보자. 사용자 디바이스로부터 이런 질의문이 입력되었다고 가정한다.
“저의 할머니가 지난달 당뇨로 입원하고 간단한 수술 뒤 퇴원하셨습니다. 물을 마실 때는 괜찮은데 약을 드시거나 식사를 하시면 바로 다 토하십니다. 어떻게 해야 할까요?"
앞에서 설명한 바에 따란 위와 같은 질문에 대해, 질의의도, 대화주제, 질의상황에 대한 레이블이 계층적으로 결정될 수 있다. 본 발명에 따른 질의 분석은 다음과 같이 이뤄질 것이다.
대화주제:
1계층: 질병 및 증상,
2계층: 만성질환,
3계층: 당뇨
질의의도:
1계층: 문의,
2계층: 방법문의,
3계층: 대처방법
질의상황:
1계층: 문의대상자,
2계층: 가족
1계층: 환자여부,
2계층: 만성질환
1계층: 성별,
2계층: 여성
1계층: 연령대,
2계층: 60대 이상
답변 후보지식은 상기 정의된 질의의도, 대화주제, 질의상황을 기준으로 미리 준비된 답변에 레이블이 할당된다. 답변 데이터의 레이블 구조는 예컨대 도 7과 같다.
사용자의 질문에 맞는 답변후보의 추출은 3개 항목(주제, 의도, 상황) 및 계층구조와의 매칭 정도를 점수화하여 정렬한 후 일정수준 이상의 점수를 갖는 답변을 후보로 추출하는 절차를 거칠 수 있다.
질문과 답변후보간의 유사성을 계산하는 절차는 도 8에 나타나 있다. 질문 데이터로부터 대화주제, 질의의도, 질의상황에 대한 레이블(51, 53, 55)을 분류한 후, 답변에서 정의된 대화주제, 질의의도, 질의상황 레이블(510, 520, 530)과의 매칭 적합도를 계산한다. 각각의 매칭적합도를 합산하여 질문과 답변간의 적합도를 계산하며 적합도가 높은 P개(P는 1 이상의 정수)의 답변이 질문에 대한 답변 후보로 제시될 수 있다.
도 9는 본 발명의 대화형 상담 챗봇의 구현 방법의 전체 프로세스의 구성을 하나의 예시로서 그리고 본 발명의 구성을 다시 한 번 정리한다는 차원에서 나타내고 있다.
사용자가 전화기 등의 사용자 디바이스를 통해 본 발명의 챗봇 디바이스가 구축되어 있는 상담 시스템에 무엇인가를 질의할 것이다(S100).
그러면 개체인식 단계를 수행한다. 텍스트 전처리기를 통해 텍스트 전처리를 수행하고 개체 추출부(103)가 텍스트에서 대화 목적에 맞는 단어를 추출한다(S110).
다음으로 특징벡터를 추출한다. 즉, 특징벡터 생성부가 기계학습에 필요한 특징을 생성한다(S120).
세 가지 요소, 즉 질의의도 이해부, 대화주제 이해부 및 질의상황 이해부가 미리 정의된 계층주조에 의해 사용자 표현(질의)를 이해하는 로직을 수행한다(S130).
그런 다음에 답변을 생성하고(S140), 전술한 것처럼 답변후보의 세 가지 요소의 계층구조와 질문 데이터의 세 가지 요소의 계층구조를 매칭하고, 매칭 적합도를 계산해서 높은 점수를 갖는 답변을 후보로 추출한다(S140). 그리고 음성과 결합해서 사용자 디바이스로 응답한다(S150).
참고로, 본 발명의 일 실시예에 따른 대화형 상담 챗봇의 구현 방법은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독가능매체에 기록될 수 있다. 상기 컴퓨터 판독가능매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 매체에 기록되는 프로그램 명령은 본 발명을 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다.
컴퓨터 판독가능매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체, CD-ROM, DVD와 같은 광기록 매체, 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체, 및 ROM, RAM, 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함될 수 있다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급언어코드를 포함한다. 상술한 하드웨어 장치는 본 발명의 동작을 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다
본 발명의 보호범위가 이상에서 명시적으로 설명한 실시예의 기재와 표현에 제한되는 것은 아니다. 또한, 본 발명이 속하는 기술분야에서 자명한 변경이나 치환으로 말미암아 본 발명이 보호범위가 제한될 수도 없음을 다시 한 번 첨언한다.

Claims (4)

  1. 사용자 디바이스가 통신 시스템을 통해 질의를 발화하면, 대화 시스템이 구축되어 있는 챗봇 디바이스가 시스템 응답을 함에 있어서, 상기 챗봇 디바이스가:
    (a) 입력된 텍스트로부터 대화의 목적에 맞는 개체를 추출하고,
    (b) 추출된 개체를 이용해 기계학습에 필요한 특징 벡터를 생성하며,
    (c) 생성된 특징 벡터를 이용해 계층적으로 구성된 질의의도, 대화주제 및 질의상황을 추출하여 질의이해를 수행하고,
    (d) 상기 질의의도, 대화주제 및 질의상황의 계층요소에 맞는 답변을 찾아내어 답변을 생성하는 단계를 수행한 후에,
    (e) 상기 생성된 답변을 음성을 결합하여 상기 사용자 디바이스에 응답을 전송하는 단계를 포함함으로써 계층적으로 사용자 표현을 이해하고 답변을 생성하는 대화형 상담 챗봇의 구현 방법.
  2. 제1항에 있어서,
    상기 챗봇 디바이스는 병원 시스템에 구축되어 있는 것인, 대화형 상담 챗봇의 구현 방법.
  3. 제1항에 있어서,
    상기 (a) 단계는 개체 인식 단계이며, 이 단계에서 추출되는 개체는 (개체종류, 대표값)으로 표현되는 N개(N은 1 이상의 정수)의 배열로 추출되는 것인 대화형 상담 챗봇의 구현 방법.
  4. 사용자 디바이스가 통신 시스템을 통해 질의를 발화하면, 대화 시스템이 구축되어 있는 챗봇 디바이스가 시스템 응답을 함에 있어서, 상기 챗봇 디바이스는:
    입력문장에 대한 전처리를 수행하는 텍스트 전처리기와
    상기 텍스트 전처리기에 의해 전처리된 텍스트를 분석 가능한 개체를 추출하는 개체 추출부와,
    분석된 개체들과 사전 정의된 단어를 이용해 수치화된 벡터를 생성하는 특징벡터 생성부와
    상기 생성된 특징벡터에 대해 질의의도, 대화주제, 질의상황이라는 세 가지 분류 항목으로 이해하도록 구성되는 질의의도 이해부, 대화주제 이해부 및 질의상황 이해부를 포함하고, 질의의도 이해부, 대화주제 이해부 및 질의상황 이해부는 각각 복수의 계층 분류기를 포함하는 것을 특징으로 하는 계층적으로 사용자 표현을 이해하고 답변을 생성하는 대화형 상담 챗봇 디바이스.
KR1020180023382A 2018-02-27 2018-02-27 계층적으로 사용자 표현을 이해하고 답변을 생성하는 대화형 상담 챗봇 장치 및 방법 KR102103273B1 (ko)

Priority Applications (2)

Application Number Priority Date Filing Date Title
KR1020180023382A KR102103273B1 (ko) 2018-02-27 2018-02-27 계층적으로 사용자 표현을 이해하고 답변을 생성하는 대화형 상담 챗봇 장치 및 방법
PCT/KR2018/014579 WO2019168253A1 (ko) 2018-02-27 2018-11-26 계층적으로 사용자 표현을 이해하고 답변을 생성하는 대화형 상담 챗봇 장치 및 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020180023382A KR102103273B1 (ko) 2018-02-27 2018-02-27 계층적으로 사용자 표현을 이해하고 답변을 생성하는 대화형 상담 챗봇 장치 및 방법

Publications (2)

Publication Number Publication Date
KR20190109614A true KR20190109614A (ko) 2019-09-26
KR102103273B1 KR102103273B1 (ko) 2020-04-22

Family

ID=67806307

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020180023382A KR102103273B1 (ko) 2018-02-27 2018-02-27 계층적으로 사용자 표현을 이해하고 답변을 생성하는 대화형 상담 챗봇 장치 및 방법

Country Status (2)

Country Link
KR (1) KR102103273B1 (ko)
WO (1) WO2019168253A1 (ko)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111063429A (zh) * 2019-10-25 2020-04-24 中国科学院自动化研究所 一种医疗咨询方法、装置、设备和计算机可读存储介质
WO2021100902A1 (ko) * 2019-11-20 2021-05-27 한국과학기술원 문장 패러프레이즈 인식 기반 대화 시스템 답변 방법
KR20210065629A (ko) * 2019-11-27 2021-06-04 주식회사 와이즈넛 챗봇 채널연계 통합을 위한 챗봇 통합 에이전트 플랫폼 시스템 및 그 서비스 방법
KR20210135829A (ko) * 2020-05-06 2021-11-16 송형석 인공지능 기반의 의료 지원 서비스 제공장치 및 방법
KR20210135828A (ko) 2020-05-06 2021-11-16 송형석 인텐츠 기반의 질문/답변 서비스 제공장치 및 방법
WO2021261617A1 (ko) * 2020-06-25 2021-12-30 한국과학기술원 대화 의도 실시간 분석 방법
KR20220003930A (ko) * 2020-07-02 2022-01-11 주식회사 엔씨소프트 생략 복원 학습 방법과 인식 방법 및 이를 수행하기 위한 장치
WO2022015783A1 (en) * 2020-07-14 2022-01-20 Drift.com, Inc. Selecting a response in a multi-turn interaction between a user and a conversational bot
KR20220126493A (ko) * 2021-03-09 2022-09-16 주식회사 마이데이터랩 자연어 의도를 분류하는 뉴럴 네트워크 훈련을 위한 데이터 처리 방법 및 장치
KR20230026065A (ko) * 2021-08-17 2023-02-24 박영철 유저의 의료 관련 질문에 기반한 맞춤형 진단 정보를 제공하는 방법, 장치 및 컴퓨터-판독 가능 기록 매체
WO2023056195A1 (en) * 2021-10-01 2023-04-06 Capital One Services, Llc Systems and methods for generating dynamic conversational responses based on predicted user intents using artificial intelligence models
KR20230142265A (ko) 2022-04-01 2023-10-11 (주)와이즈에이아이 인공지능 전화예약 시스템 및 방법

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11782910B2 (en) 2019-11-15 2023-10-10 Samsung Electronics Co., Ltd. System and method for dynamic inference collaboration
CN110993124A (zh) * 2019-12-09 2020-04-10 上海光电医用电子仪器有限公司 一种具有语音应答的监护系统和方法
KR102374530B1 (ko) 2020-06-22 2022-03-16 (주)와이즈에이아이 최적 질의 응답 시스템 및 방법
CN112656414B (zh) * 2020-12-17 2023-08-08 北京智能工场科技有限公司 一种通过ai对话检测心理状态的系统
WO2023177079A1 (ko) * 2022-03-18 2023-09-21 삼성전자주식회사 합성 벡터에 기반하여 사용자 발화를 처리하는 서버, 전자 장치, 및 이의 동작 방법

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20120109943A (ko) * 2011-03-28 2012-10-09 가톨릭대학교 산학협력단 문장에 내재한 감정 분석을 위한 감정 분류 방법

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20140123369A (ko) * 2013-04-12 2014-10-22 얄리주식회사 음성인식 질의응답 시스템 및 그것의 운용방법
KR101763407B1 (ko) * 2015-10-14 2017-07-31 주식회사 시스트란인터내셔널 음성 대화 시스템 및 그 시스템에서의 음성 대화 방법

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20120109943A (ko) * 2011-03-28 2012-10-09 가톨릭대학교 산학협력단 문장에 내재한 감정 분석을 위한 감정 분류 방법

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111063429A (zh) * 2019-10-25 2020-04-24 中国科学院自动化研究所 一种医疗咨询方法、装置、设备和计算机可读存储介质
WO2021100902A1 (ko) * 2019-11-20 2021-05-27 한국과학기술원 문장 패러프레이즈 인식 기반 대화 시스템 답변 방법
KR20210065629A (ko) * 2019-11-27 2021-06-04 주식회사 와이즈넛 챗봇 채널연계 통합을 위한 챗봇 통합 에이전트 플랫폼 시스템 및 그 서비스 방법
KR20210135829A (ko) * 2020-05-06 2021-11-16 송형석 인공지능 기반의 의료 지원 서비스 제공장치 및 방법
KR20210135828A (ko) 2020-05-06 2021-11-16 송형석 인텐츠 기반의 질문/답변 서비스 제공장치 및 방법
WO2021261617A1 (ko) * 2020-06-25 2021-12-30 한국과학기술원 대화 의도 실시간 분석 방법
KR20220003930A (ko) * 2020-07-02 2022-01-11 주식회사 엔씨소프트 생략 복원 학습 방법과 인식 방법 및 이를 수행하기 위한 장치
WO2022015783A1 (en) * 2020-07-14 2022-01-20 Drift.com, Inc. Selecting a response in a multi-turn interaction between a user and a conversational bot
KR20220126493A (ko) * 2021-03-09 2022-09-16 주식회사 마이데이터랩 자연어 의도를 분류하는 뉴럴 네트워크 훈련을 위한 데이터 처리 방법 및 장치
KR20230026065A (ko) * 2021-08-17 2023-02-24 박영철 유저의 의료 관련 질문에 기반한 맞춤형 진단 정보를 제공하는 방법, 장치 및 컴퓨터-판독 가능 기록 매체
WO2023056195A1 (en) * 2021-10-01 2023-04-06 Capital One Services, Llc Systems and methods for generating dynamic conversational responses based on predicted user intents using artificial intelligence models
US11900062B2 (en) 2021-10-01 2024-02-13 Capital One Services, Llc Systems and methods for generating dynamic conversational responses based on predicted user intents using artificial intelligence models
KR20230142265A (ko) 2022-04-01 2023-10-11 (주)와이즈에이아이 인공지능 전화예약 시스템 및 방법

Also Published As

Publication number Publication date
WO2019168253A1 (ko) 2019-09-06
KR102103273B1 (ko) 2020-04-22

Similar Documents

Publication Publication Date Title
KR102103273B1 (ko) 계층적으로 사용자 표현을 이해하고 답변을 생성하는 대화형 상담 챗봇 장치 및 방법
Rashid et al. A survey paper: areas, techniques and challenges of opinion mining
KR20190125153A (ko) 텍스트 기반 사용자심리상태예측 및 콘텐츠추천 장치 및 그 방법
US11720759B2 (en) Electronic apparatus, controlling method of thereof and non-transitory computer readable recording medium
KR102041621B1 (ko) 인공지능 음성인식 기반 기계학습의 대규모 말뭉치 구축을 위한 대화형 말뭉치 분석 서비스 제공 시스템 및 구축 방법
US20200183928A1 (en) System and Method for Rule-Based Conversational User Interface
Barsever et al. Building a better lie detector with BERT: The difference between truth and lies
Thomas et al. An innovative hybrid approach for extracting named entities from unstructured text data
KR20190072823A (ko) Rnn 문장임베딩과 elm 알고리즘을 이용한 은행업무 관련 고객상담을 위한 도메인 특화 화행분류 방법
Bokka et al. Deep Learning for Natural Language Processing: Solve your natural language processing problems with smart deep neural networks
US20230229860A1 (en) Method and system for hybrid entity recognition
Chandiok et al. CIT: Integrated cognitive computing and cognitive agent technologies based cognitive architecture for human-like functionality in artificial systems
Gupta et al. Lesa: Linguistic encapsulation and semantic amalgamation based generalised claim detection from online content
Yadav et al. A novel automated depression detection technique using text transcript
Varaprasad et al. Applications and Techniques of Natural Language Processing: An Overview.
Lee et al. Anti-drugs chatbot: Chinese BERT-based cognitive intent analysis
Nair et al. Knowledge graph based question answering system for remote school education
Cervone et al. Roving mind: a balancing act between open–domain and engaging dialogue systems
Bellegarda A data-driven affective analysis framework toward naturally expressive speech synthesis
Hicks et al. Content analysis
Chakrabarti Artificial conversations for chatter bots using knowledge representation, learning, and pragmatics
CN113011141A (zh) 佛经注解模型训练方法、佛经注解生成方法及相关设备
Zishumba Sentiment Analysis Based on Social Media Data
Cavalin et al. Towards a Method to Classify Language Style for Enhancing Conversational Systems
CN114818740B (zh) 一种基于领域知识图谱的人机协同方法及系统

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
AMND Amendment
E601 Decision to refuse application
X091 Application refused [patent]
AMND Amendment
X701 Decision to grant (after re-examination)
GRNT Written decision to grant