KR20200052457A - 목표 지향 대화 시스템을 위한 정보이론기반 질문 방법 및 시스템 - Google Patents

목표 지향 대화 시스템을 위한 정보이론기반 질문 방법 및 시스템 Download PDF

Info

Publication number
KR20200052457A
KR20200052457A KR1020180131716A KR20180131716A KR20200052457A KR 20200052457 A KR20200052457 A KR 20200052457A KR 1020180131716 A KR1020180131716 A KR 1020180131716A KR 20180131716 A KR20180131716 A KR 20180131716A KR 20200052457 A KR20200052457 A KR 20200052457A
Authority
KR
South Korea
Prior art keywords
question
answer
approximate
goal
candidate
Prior art date
Application number
KR1020180131716A
Other languages
English (en)
Other versions
KR102201074B1 (ko
Inventor
장병탁
이상우
허유정
Original Assignee
서울대학교산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 서울대학교산학협력단 filed Critical 서울대학교산학협력단
Priority to KR1020180131716A priority Critical patent/KR102201074B1/ko
Priority to PCT/KR2018/014008 priority patent/WO2020091129A1/ko
Priority to US17/263,609 priority patent/US20210319343A1/en
Publication of KR20200052457A publication Critical patent/KR20200052457A/ko
Application granted granted Critical
Publication of KR102201074B1 publication Critical patent/KR102201074B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • G06F40/35Discourse or dialogue representation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0281Customer communication at a business location, e.g. providing product or service information, consulting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/04Inference or reasoning models
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N7/00Computing arrangements based on specific mathematical models
    • G06N7/01Probabilistic graphical models, e.g. probabilistic networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising

Abstract

목표 지향 대화 시스템을 위한 정보이론기반 질문 방법 및 시스템을 제시하며, 정보이론기반 질문제공시스템에 있어서, 상기 목표 지향 대화 시스템을 구성하는 답변모듈의 질문에 대한 답변 생성을 근사하여 근사 답변을 생성하는 근사답변생성부, 상기 답변모듈의 답변에 기초하여 목표에 대한 상기 질문의 근접정도인 의도값을 추론하는 의도추론부 및 상기 의도값에 기초하여 생성된 질문을 상기 답변모듈에 제공하는 질문제공부를 포함할 수 있다.

Description

목표 지향 대화 시스템을 위한 정보이론기반 질문 방법 및 시스템{METHOD AND SYSTEM OF GOAL-ORIENTED DIALOG BASED ON INFORMATION THEORY}
본 명세서에서 개시되는 실시예들은 목표 지향 대화 시스템을 위한 정보이론기반 질문 방법 및 시스템에 관한 것으로, 보다 상세하게는 인공지능의 응용 문제인 목표 지향적 대화를 위해 정보이론기반으로 질문의 적합도를 계산하여 질문을 선택하는 정보이론기반 질문 방법 및 장치에 관한 것이다.
최근 들어 딥러닝을 통한 인공지능이 비약적으로 발전하였다. 이와 같이 인공지능이 발전함에 따라 다양한 분야에서 인공지능을 적용하려고 있다.
특히, 인공지능을 적용하려는 분야 중 디지털 비서, 전화 주문, 온라인 질의 응대 등과 같은 대화 업무에 인공지능을 응용하고 있다.
이러한 대화업무에 응용되는 인공지능은 질문을 생성하고, 생성된 질문을 상대방인 답변자에게 제공함으로써 대화를 수행한다.
이를 위해, 대량의 데이터와 딥러닝 기법을 응용한 인공지능을 이용하여 대화 업무에 응용하였으며, 질문 생성과 생성된 질문에 대한 답변 과정을 1회 수행하는 대화에서 좋은 결과를 보였다.
하지만, 대화가 지속되는 경우, 인공지능이 적합한 질문을 하지 못하는 문제점이 있다. 특히, 질문자 역할을 하는 반복적으로 동일한 질문을 생성하는 문제점이 있다.
관련하여 선행기술 문헌인 한국특허공개번호 제10-2016-0141804호에서는 인공지능을 이용한 대화 장치 및 방법을 개시하는데, 개시된 내용에 따르면 사용자의 음성을 신호화하여 음성 신호로 변환하여 사용자의 정보를 판단하고, 음성 신호에 대응되는 기 저장된 스크립트 신호를 추출하며, 스크립트 신호를 추출하여 음성으로 변환할 뿐, 대화의 내용에 기초하여 적절한 질문을 생성하지 못하는 문제점을 해결할 수 없다.
따라서 상술된 문제점을 해결하기 위한 기술이 필요하게 되었다.
한편, 전술한 배경기술은 발명자가 본 발명의 도출을 위해 보유하고 있었거나, 본 발명의 도출 과정에서 습득한 기술 정보로서, 반드시 본 발명의 출원 전에 일반 공중에게 공개된 공지기술이라 할 수는 없다.
본 명세서에서 개시되는 실시예들은, 질문의 적합도를 계산하여 상대방의 답변에 적합한 질문을 선택하는 정보이론기반 질문 방법 및 시스템을 제시하는데 목적이 있다.
본 명세서에서 개시되는 실시예들은, 답변을 하는 상대방의 의도를 추론하는 정보이론기반 질문 방법 및 시스템을 제시하는데 목적이 있다.
본 명세서에서 개시되는 실시예들은, 학습데이터 기반의 학습을 통해 적합한 질문을 선택하는 정보이론기반 질문 방법 및 시스템을 제시하는데 목적이 있다.
본 명세서에서 개시되는 실시예들은, 자기 대화 방법을 기반으로 학습을 수행하는 정보이론기반 질문 방법 및 시스템을 제시하는데 목적이 있다.
본 명세서에서 개시되는 실시예들은, 학습데이터 기반 질문 후보를 제공하는 정보이론기반 질문 방법 및 시스템을 제시하는데 목적이 있다.
본 명세서에서 개시되는 실시예들은, 딥러닝을 기반으로 질문 후보를 제공하는 정보이론기반 질문 방법 및 시스템을 제시하는데 목적이 있다.
상술한 기술적 과제를 달성하기 위한 기술적 수단으로서, 일 실시예에 따르면, 목표 지향 대화 시스템을 위한 정보이론기반 질문제공시스템에 있어서, 상기 목표 지향 대화 시스템을 구성하는 답변모듈의 질문에 대한 답변 생성을 근사하여 근사 답변을 생성하는 근사답변생성부, 상기 답변모듈의 답변에 기초하여 목표에 대한 상기 질문의 근접정도인 의도값을 추론하는 의도추론부 및 상기 의도값에 기초하여 생성된 질문을 상기 답변모듈에 제공하는 질문제공부를 포함할 수 있다.
다른 실시예에 따르면, 질문제공시스템이 목표 지향 대화 시스템을 위한 정보이론기반 질문제공방법에 있어서, 상기 목표 지향 대화 시스템을 구성하는 답변모듈의 질문에 대한 답변 생성을 근사하여 근사 답변을 생성하는 단계, 상기 답변모듈의 답변에 기초하여 목표에 대한 상기 질문의 근접정도인 의도값을 추론하는 단계 및 상기 의도값에 기초하여 생성된 질문을 상기 답변모듈에 제공하는 단계를 포함할 수 있다.
또 다른 실시예에 따르면, 질문제공방법을 수행하는 프로그램이 기록된 컴퓨터 판독이 가능한 기록매체로서, 상기 목표 지향 대화 시스템을 구성하는 답변모듈의 질문에 대한 답변 생성을 근사하여 근사 답변을 생성하는 단계, 상기 답변모듈의 답변에 기초하여 목표에 대한 상기 질문의 근접정도인 의도값을 추론하는 단계 및 상기 의도값에 기초하여 생성된 질문을 상기 답변모듈에 제공하는 단계를 포함할 수 있다.
다른 실시예에 따르면, 질문제공시스템에 의해 수행되며, 질문제공방법을 수행하기 위해 기록매체에 저장된 컴퓨터프로그램으로서, 상기 목표 지향 대화 시스템을 구성하는 답변모듈의 질문에 대한 답변 생성을 근사하여 근사 답변을 생성하는 단계, 상기 답변모듈의 답변에 기초하여 목표에 대한 상기 질문의 근접정도인 의도값을 추론하는 단계 및 상기 의도값에 기초하여 생성된 질문을 상기 답변모듈에 제공하는 단계를 포함할 수 있다.
전술한 과제 해결 수단 중 어느 하나에 의하면, 질문의 적합도를 계산하여 상대방의 답변에 적합한 질문을 선택하는 정보이론기반 질문 방법 및 시스템을 제시할 수 있다.
전술한 과제 해결 수단 중 어느 하나에 의하면, 답변을 하는 상대방의 의도를 추론하는 정보이론기반 질문 방법 및 시스템을 제시할 수 있다.
전술한 과제 해결 수단 중 어느 하나에 의하면, 학습데이터 기반의 학습을 통해 적합한 질문을 선택하는 정보이론기반 질문 방법 및 시스템을 제시할 수 있다.
전술한 과제 해결 수단 중 어느 하나에 의하면, 자기 대화 방법을 기반으로 학습을 수행하는 정보이론기반 질문 방법 및 시스템을 제시할 수 있다.
전술한 과제 해결 수단 중 어느 하나에 의하면, 학습데이터 기반 질문 후보를 제공하는 정보이론기반 질문 방법 및 시스템을 제시할 수 있다.
전술한 과제 해결 수단 중 어느 하나에 의하면, 딥러닝을 기반으로 질문 후보를 제공하는 정보이론기반 질문 방법 및 시스템을 제시할 수 있다.
개시되는 실시예들에서 얻을 수 있는 효과는 이상에서 언급한 효과들로 제한되지 않으며, 언급하지 않은 또 다른 효과들은 아래의 기재로부터 개시되는 실시예들이 속하는 기술분야에서 통상의 지식을 가진 자에게 명확하게 이해될 수 있을 것이다.
도 1은 일 실시예에 따른 정보이론기반 질문제공시스템을 도시한 블록도이다.
도 2는 일 실시예에 따른 정보이론기반 질문제공방법을 설명하기 위한 순서도이다.
아래에서는 첨부한 도면을 참조하여 다양한 실시예들을 상세히 설명한다. 아래에서 설명되는 실시예들은 여러 가지 상이한 형태로 변형되어 실시될 수도 있다. 실시예들의 특징을 보다 명확히 설명하기 위하여, 이하의 실시예들이 속하는 기술분야에서 통상의 지식을 가진 자에게 널리 알려져 있는 사항들에 관해서 자세한 설명은 생략하였다. 그리고, 도면에서 실시예들의 설명과 관계없는 부분은 생략하였으며, 명세서 전체를 통하여 유사한 부분에 대해서는 유사한 도면 부호를 붙였다.
명세서 전체에서, 어떤 구성이 다른 구성과 "연결"되어 있다고 할 때, 이는 ‘직접적으로 연결’되어 있는 경우뿐 아니라, ‘그 중간에 다른 구성을 사이에 두고 연결’되어 있는 경우도 포함한다. 또한, 어떤 구성이 어떤 구성을 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한, 그 외 다른 구성을 제외하는 것이 아니라 다른 구성들을 더 포함할 수도 있음을 의미한다.
이하 첨부된 도면을 참고하여 실시예들을 상세히 설명하기로 한다.
다만 이를 설명하기에 앞서, 아래에서 사용되는 용어들의 의미를 먼저 정의한다.
‘정보이득(information gain)’은 정답에 대한 힌트의 유무를 비교한 정답의 불확실성의 감소량으로 본 명세서에서 상호 정보량(mutual information)을 지칭하며, 정답의 불확실성은 정답의 엔트로피(entropy)로 측정될 수 있다.
‘목표지향대화시스템’은 인공지능을 이용하여 기계 질문자가 목표로 한 질문을 생성하도록 하는 시스템이다. 이러한 목표지향대화시스템은 질문을 생성하여 제공하는 질문모듈과 질문에 대한 답변을 제공하는 답변모듈로 구성될 수 있다.
위에 정의한 용어 이외에 설명이 필요한 용어는 아래에서 각각 따로 설명한다.
도 1은 일 실시예에 따른 질문제공시스템(10)을 설명하기 위한 구성도이다.
질문제공시스템(10)은 네트워크(N)를 통해 원격지의 서버에 접속하거나, 타 단말 및 서버와 연결 가능한 컴퓨터나 휴대용 단말기, 텔레비전, 웨어러블 디바이스(Wearable Device) 등으로 구현될 수 있다. 여기서, 컴퓨터는 예를 들어, 웹 브라우저(WEB Browser)가 탑재된 노트북, 데스크톱(desktop), 랩톱(laptop)등을 포함하고, 휴대용 단말기는 예를 들어, 휴대성과 이동성이 보장되는 무선 통신 장치로서, PCS(Personal Communication System), PDC(Personal Digital Cellular), PHS(Personal Handyphone System), PDA(Personal Digital Assistant), GSM(Global System for Mobile communications), IMT(International Mobile Telecommunication)-2000, CDMA(Code Division Multiple Access)-2000, W-CDMA(W-Code Division Multiple Access), Wibro(Wireless Broadband Internet), 스마트폰(Smart Phone), 모바일 WiMAX(Mobile Worldwide Interoperability for Microwave Access) 등과 같은 모든 종류의 핸드헬드(Handheld) 기반의 무선 통신 장치를 포함할 수 있다. 또한, 텔레비전은 IPTV(Internet Protocol Television), 인터넷 TV(Internet Television), 지상파 TV, 케이블 TV 등을 포함할 수 있다. 나아가 웨어러블 디바이스는 예를 들어, 시계, 안경, 액세서리, 의복, 신발 등 인체에 직접 착용 가능한 타입의 정보처리장치로서, 직접 또는 다른 정보처리장치를 통해 네트워크를 경유하여 원격지의 서버에 접속하거나 타 단말과 연결될 수 있다.
이러한 질문제공시스템(10)은 목표 지향 대화 시스템의 질문모듈에 구현될 수 있다. 목표 지향 대화 시스템은 질문에 답변을 하는 답변모듈과 질문을 통해 답변자의 의도를 맞추는 질문모듈로 구분될 수 있다.
도 1을 참조하면, 일 실시예에 따른 질문제공시스템(10)은, 입출력부(110), 제어부(120), 통신부(130) 및 메모리(140)를 포함할 수 있다.
입출력부(110)는 사용자로부터 입력을 수신하기 위한 입력부와, 작업의 수행 결과 또는 질문제공시스템(10)의 상태 등의 정보를 표시하기 위한 출력부를 포함할 수 있다. 예를 들어, 입출력부(110)는 사용자 입력을 수신하는 조작 패널(operation panel) 및 화면을 표시하는 디스플레이 패널(display panel) 등을 포함할 수 있다.
구체적으로, 입력부는 키보드, 물리 버튼, 터치 스크린, 카메라 또는 마이크 등과 같이 다양한 형태의 사용자 입력을 수신할 수 있는 장치들을 포함할 수 있다. 또한, 출력부는 디스플레이 패널 또는 스피커 등을 포함할 수 있다. 다만, 이에 한정되지 않고 입출력부(110)는 다양한 입출력을 지원하는 구성을 포함할 수 있다.
제어부(120)는 질문제공시스템(10)의 전체적인 동작을 제어하며, CPU 등과 같은 프로세서를 포함할 수 있다. 제어부(120)는 입출력부(110)를 통해 수신한 사용자 입력에 대응되는 동작을 수행하도록 질문제공시스템(10)에 포함된 다른 구성들을 제어할 수 있다.
예를 들어, 제어부(120)는 메모리(140)에 저장된 프로그램을 실행시키거나, 메모리(140)에 저장된 파일을 읽어오거나, 새로운 파일을 메모리(140)에 저장할 수도 있다.
이러한 제어부(120)는 근사답변생성부(121), 의도추론부(122), 질문추출부(123) 및 질문제공부(124)를 포함할 수 있다.
우선, 근사답변생성부(121)는 목표 지향 대화 시스템을 구성하는 답변모듈의 질문에 대한 답변 생성을 근사하여 근사 답변을 생성할 수 있다.
즉, 근사답변생성부(121)는 목표 지향 대화 시스템의 답변모듈을 근사한 것으로 실제 답변모듈과 상이하며, 답변모듈의 답변확률분포p를 직접적으로 계산할 수 없다.
이에 아래와 같은 답변모듈의 답변확률분포인 p 를 근사한 근사답변확률분포
Figure pat00001
를 생성할 수 있다.
이러한
Figure pat00002
는 답변모듈이 전체 답변확률분포 P의 교차엔트로피(cross-entropy)를 최소화하도록 학습되는 것과 같이 학습데이터의 학습을 통해 획득되거나 또는 답변모듈로부터 추출될 수 있다.
그리고 의도추론부(122)는 답변모듈의 답변에 기초하여 목표에 대한 질문의 근접 정도인 의도값(C)를 추론할 수 있다.
즉, 답변자의 의도값(C)는 아래 수학식 1 을 통해 계산될 수 있다.
[수학식 1]
Figure pat00003
P : 답변모듈의 답변확률분포
하지만, 상술된 바와 같이 답변모듈의 답변확률분포는 계산될 수 없기에 근사답변생성부(121)에서 계산된 근사답변확률분포
Figure pat00004
를 이용한다. 그리고 의도추론부(122)는 아래의 수학식 2 를 이용하여 의도값(C)를 추론할 수 있다.
[수학식 2]
Figure pat00005
Figure pat00006
: 의도값 c 의 사전확률분포
Figure pat00007
(simply
Figure pat00008
): 의도값 c의 사후확률분포
답변자의 답변확률분포
Figure pat00009
가 고정되어 있을 때, 우도
Figure pat00010
가 답변확률분포
Figure pat00011
와 동일할 때, 질문제공시스템(10)의 기능이 최적이 된다.
그리고 질문추출부(123)는 목표 지향 대화 시스템을 구성하는 답변모듈에 제공될 질문의 후보질문을 추출할 수 있다.
하나의 실시예에 따라, 질문추출부(123)는 기 저장된 학습데이터를 통해 후보질문을 추출할 수 있다.
즉, 질문추출부(123)는 사람이 실제 목표 지향 대화를 하여 기 획득된 학습데이터를 이용하여 후보질문을 추출할 수 있다.
예를 들어, 질문추출부(123)는 학습데이터의 질문 중에서 질문을 랜덤으로 추출할 수 있다.
또는 예를 들어, 질문추출부(123)는 학습데이터 중 답변확률분포가 기 설정된 값 이상으로 독립일 것으로 기대되는 후보질문 세트를 추출할 수 있다. 즉, 질문추출부(123)는 아래의 수학식 3 에 충족되도록 후보질문을 추출할 수 있다.
[수학식 3]
Figure pat00012
다시 말해, 질문추출부(123)가 가지고 있는 임의의 두 질문에 대한 답변이 같을 확률을 95% 미만이 되도록 후보질문을 선택될 수 있다.
다른 실시예에 따라, 질문추출부(123)는 RNN(Recurrent Neural Networks)에서 복수의 질문들을 생성하여 확률순으로 후보질문을 추출할 수 있다.
예를 들어, 질문추출부(123)는 기존 대화를 학습하지 않고, 복수의 질문을 생성하여 후보질문으로 이용할 수 있다.
또는 예를 들어, 질문추출부(123)는 학습데이터에 대한 기계학습을 통해 생성된 질문 중 확률에 기초하여 후보질문을 추출할 수 있다. 즉, 질문추출부(123)는 질문과 질문에 대한 답변을 획득할 때마다 기 대화 내용을 학습데이터로서 기계학습하여 질문을 생성하고, 생성된 질문을 후보질문으로 이용할 수 있다.
그리고 질문제공부(124)는 의도값(c)에 기초하여 답변모듈에 질문을 제공할 수 있다.
이를 위해, 질문제공부(124)는 질문추출부(123)에서 추출된 후보질문 별로 정보이득 I를 계산할 수 있다.
즉, 의도추출부(122) 및 질문제공부(124) 각각의 목적함수(Objective function)는
Figure pat00013
Figure pat00014
를 각각 최대화한다.
이때, 질문제공부(124)의 목적함수는 아래의 수학식 4 의 정보이득 I을 최대화한다.
[수학식 4]
Figure pat00015
하지만 상술된 답변확률분포 P는 답변자에 관한 것으로 직접 계산할 수 없다. 이에 질문제공부(124)는 근사답변생성부(121)로부터 계산된 근사답변확률분포
Figure pat00016
를 이용하되, 의도추출부(122)에서 추론된 의도값 C를 이용하여 근사정보이득
Figure pat00017
을 계산할 수 있다.
이때, 질문제공부(124)는 수학식 5 에 따라 질문추출부(123)에서 추출한 후보질문에 대해서 근사정보이득
Figure pat00018
을 계산할 수 있다.
[수학식 5]
Figure pat00019
실시예에 따라, 질문추출부(123)에서 RNN을 사용하여 후보질문을 생성하는 경우 수학식 5 는 수학식 6 으로 대체될 수 있다.
[수학식 6]
Figure pat00020
Figure pat00021
:질문추출부(123)의 RNN이 지칭하는
Figure pat00022
의 확률
그리고 질문제공부(124)는 후보질문 중 근사정보이득 값이 최대인 후보질문을 답변자의 질문으로 제공할 수 있다.
한편, 통신부(130)는 다른 디바이스 또는 네트워크와 유무선 통신을 수행할 수 있다. 이를 위해, 통신부(130)는 다양한 유무선 통신 방법 중 적어도 하나를 지원하는 통신 모듈을 포함할 수 있다. 예를 들어, 통신 모듈은 칩셋(chipset)의 형태로 구현될 수 있다.
통신부(130)가 지원하는 무선 통신은, 예를 들어 Wi-Fi(Wireless Fidelity), Wi-Fi Direct, 블루투스(Bluetooth), UWB(Ultra Wide Band) 또는 NFC(Near Field Communication) 등일 수 있다. 또한, 통신부(130)가 지원하는 유선 통신은, 예를 들어 USB 또는 HDMI(High Definition Multimedia Interface) 등일 수 있다.
메모리(140)에는 파일, 어플리케이션 및 프로그램 등과 같은 다양한 종류의 데이터가 설치 및 저장될 수 있다. 제어부(120)는 메모리(140)에 저장된 데이터에 접근하여 이를 이용하거나, 또는 새로운 데이터를 메모리(140)에 저장할 수도 있다. 또한, 제어부(120)는 메모리(140)에 설치된 프로그램을 실행할 수도 있다. 도 1을 참조하면, 메모리(140)에는 목표지향대화를 수행하기 위한 정보이론기반 질문 제공 프로그램이 설치될 수 있다.
도 2 는 일 실시예에 따른 질문제공방법을 설명하기 위한 순서도이다.
도 2 에 도시된 실시예에 따른 질문제공방법은 도 1 에 도시된 질문제공시스템(10)에서 시계열적으로 처리되는 단계들을 포함한다. 따라서, 이하에서 생략된 내용이라고 하더라도 도 1 에 도시된 질문제공시스템(10)에 관하여 이상에서 기술한 내용은 도 2 에 도시된 실시예에 따른 질문제공방법에도 적용될 수 있다.
우선 질문제공시스템(10)은 목표 지향 대화 시스템을 구성하는 답변모듈의 질문에 대한 답변 생성을 근사하여 근사답변을 생성할 수 있다(S2001).
예를 들어, 질문제공시스템(10)은 기존 대화 내용인
Figure pat00023
기초로 근사답변확률분포
Figure pat00024
를 근사할 수 있다.
그리고 질문제공시스템(10)은 답변모듈의 답변에 기초하여 목표에 대한 질문의 근접정도인 의도값을 추론할 수 있다(S2002).
예를 들어, 질문제공시스템(10)은 답변모듈의 답변확률분포 P를 기초로 질문의 근접정도인 의도값(C)를 계산할 수 있으나, 답변확률분포P를 직접적으로 계산할 수 없기에 근사답변확률분포
Figure pat00025
를 이용하여 의도값(C)를 계산할 수 있다.
이후, 질문제공시스템(10)은 목표 지향 대화 시스템을 구성하는 답변모듈에 제공될 질문의 후보질문을 추출할 수 있다(S2003).
예를 들어, 질문제공시스템(10)은 기존 학습데이터에 포함된 질문 세트 중 후보질문
Figure pat00026
을 기 설정된 방법인 랜덤 또는 확률에 따라 추출할 수 있다.
또는 예를 들어, 질문제공시스템(10)은 RNN을 이용하여 질문을 생성할 수 있고, 생성된 질문을 후보질문으로 추출할 수 있다.
그리고 질문제공시스템(10)은 의도값에 기초하여 답변모듈에 질문을 제공할 수 있다(S2004).
이를 위해, 질문제공시스템(10)은 S2003단계에서 추출된 후보질문에 대해 정보이득을 계산할 수 있다.
예를 들어, 질문제공시스템(10)은 S2001단계에서 근사된 근사답변확률분포
Figure pat00027
와 S2002 단계에서 추론된 의도값(C)에 기초하여 S2003단계에서 추출된 후보질문
Figure pat00028
별로 정보이득인 I를 계산할 수 있다.
그리고 질문제공시스템(10)은 정보이득 I가 가장 높은 질문
Figure pat00029
를 답변자에게 제공할 수 있다.
이후, 질문제공시스템(10)은 근사된 근사답변확률분포를 S2004단계에서 제공한 질문에 대한 답변
Figure pat00030
를 답변자에게 제공할 수 있다.
이후, 질문제공시스템(10)은 근사된 근사답변확률분포를 S2004단계에서 제공한 질문에 대한 답변
Figure pat00031
에 기초하여 갱신할 수 있다.
이상의 실시예들에서 사용되는 '~부'라는 용어는 소프트웨어 또는 FPGA(field programmable gate array) 또는 ASIC 와 같은 하드웨어 구성요소를 의미하며, '~부'는 어떤 역할들을 수행한다. 그렇지만 '~부'는 소프트웨어 또는 하드웨어에 한정되는 의미는 아니다. '~부'는 어드레싱할 수 있는 저장 매체에 있도록 구성될 수도 있고 하나 또는 그 이상의 프로세서들을 재생시키도록 구성될 수도 있다. 따라서, 일 예로서 '~부'는 소프트웨어 구성요소들, 객체지향 소프트웨어 구성요소들, 클래스 구성요소들 및 태스크 구성요소들과 같은 구성요소들과, 프로세스들, 함수들, 속성들, 프로시저들, 서브루틴들, 프로그램특허 코드의 세그먼트들, 드라이버들, 펌웨어, 마이크로코드, 회로, 데이터, 데이터베이스, 데이터 구조들, 테이블들, 어레이들, 및 변수들을 포함한다.
구성요소들과 '~부'들 안에서 제공되는 기능은 더 작은 수의 구성요소들 및 '~부'들로 결합되거나 추가적인 구성요소들과 '~부'들로부터 분리될 수 있다.
뿐만 아니라, 구성요소들 및 '~부'들은 디바이스 또는 보안 멀티미디어카드 내의 하나 또는 그 이상의 CPU 들을 재생시키도록 구현될 수도 있다.
도 2 를 통해 설명된 실시예에 따른 질문제공방법은 컴퓨터에 의해 실행 가능한 명령어 및 데이터를 저장하는, 컴퓨터로 판독 가능한 매체의 형태로도 구현될 수 있다. 이때, 명령어 및 데이터는 프로그램 코드의 형태로 저장될 수 있으며, 프로세서에 의해 실행되었을 때, 소정의 프로그램 모듈을 생성하여 소정의 동작을 수행할 수 있다. 또한, 컴퓨터로 판독 가능한 매체는 컴퓨터에 의해 액세스될 수 있는 임의의 가용 매체일 수 있고, 휘발성 및 비휘발성 매체, 분리형 및 비분리형 매체를 모두 포함한다. 또한, 컴퓨터로 판독 가능한 매체는 컴퓨터 기록 매체일 수 있는데, 컴퓨터 기록 매체는 컴퓨터 판독 가능 명령어, 데이터 구조, 프로그램 모듈 또는 기타 데이터와 같은 정보의 저장을 위한 임의의 방법 또는 기술로 구현된 휘발성 및 비휘발성, 분리형 및 비분리형 매체를 모두 포함할 수 있다.예를 들어, 컴퓨터 기록 매체는 HDD 및 SSD 등과 같은 마그네틱 저장 매체, CD, DVD 및 블루레이 디스크 등과 같은 광학적 기록 매체, 또는 네트워크를 통해 접근 가능한 서버에 포함되는 메모리일 수 있다.
또한 도 2 를 통해 설명된 실시예에 따른 질문제공방법은 컴퓨터에 의해 실행 가능한 명령어를 포함하는 컴퓨터 프로그램(또는 컴퓨터 프로그램 제품)으로 구현될 수도 있다. 컴퓨터 프로그램은 프로세서에 의해 처리되는 프로그래밍 가능한 기계 명령어를 포함하고, 고레벨 프로그래밍 언어(High-level Programming Language), 객체 지향 프로그래밍 언어(Object-oriented Programming Language), 어셈블리 언어 또는 기계 언어 등으로 구현될 수 있다. 또한 컴퓨터 프로그램은 유형의 컴퓨터 판독가능 기록매체(예를 들어, 메모리, 하드디스크, 자기/광학 매체 또는 SSD(Solid-State Drive) 등)에 기록될 수 있다.
따라서 도 2 를 통해 설명된 실시예에 따른 질문제공방법은 상술한 바와 같은 컴퓨터 프로그램이 컴퓨팅 장치에 의해 실행됨으로써 구현될 수 있다. 컴퓨팅 장치는 프로세서와, 메모리와, 저장 장치와, 메모리 및 고속 확장포트에 접속하고 있는 고속 인터페이스와, 저속 버스와 저장 장치에 접속하고 있는 저속 인터페이스 중 적어도 일부를 포함할 수 있다. 이러한 성분들 각각은 다양한 버스를 이용하여 서로 접속되어 있으며, 공통 머더보드에 탑재되거나 다른 적절한 방식으로 장착될 수 있다.
여기서 프로세서는 컴퓨팅 장치 내에서 명령어를 처리할 수 있는데, 이런 명령어로는, 예컨대 고속 인터페이스에 접속된 디스플레이처럼 외부 입력, 출력 장치상에 GUI(Graphic User Interface)를 제공하기 위한 그래픽 정보를 표시하기 위해 메모리나 저장 장치에 저장된 명령어를 들 수 있다. 다른 실시예로서, 다수의 프로세서 및(또는) 다수의 버스가 적절히 다수의 메모리 및 메모리 형태와 함께 이용될 수 있다. 또한 프로세서는 독립적인 다수의 아날로그 및(또는) 디지털 프로세서를 포함하는 칩들이 이루는 칩셋으로 구현될 수 있다.
또한 메모리는 컴퓨팅 장치 내에서 정보를 저장한다. 일례로, 메모리는 휘발성 메모리 유닛 또는 그들의 집합으로 구성될 수 있다. 다른 예로, 메모리는 비휘발성 메모리 유닛 또는 그들의 집합으로 구성될 수 있다. 또한 메모리는 예컨대, 자기 혹은 광 디스크와 같이 다른 형태의 컴퓨터 판독 가능한 매체일 수도 있다.
그리고 저장장치는 컴퓨팅 장치에게 대용량의 저장공간을 제공할 수 있다. 저장 장치는 컴퓨터 판독 가능한 매체이거나 이런 매체를 포함하는 구성일 수 있으며, 예를 들어 SAN(Storage Area Network) 내의 장치들이나 다른 구성도 포함할 수 있고, 플로피 디스크 장치, 하드 디스크 장치, 광 디스크 장치, 혹은 테이프 장치, 플래시 메모리, 그와 유사한 다른 반도체 메모리 장치 혹은 장치 어레이일 수 있다.
상술된 실시예들은 예시를 위한 것이며, 상술된 실시예들이 속하는 기술분야의 통상의 지식을 가진 자는 상술된 실시예들이 갖는 기술적 사상이나 필수적인 특징을 변경하지 않고서 다른 구체적인 형태로 쉽게 변형이 가능하다는 것을 이해할 수 있을 것이다. 그러므로 상술된 실시예들은 모든 면에서 예시적인 것이며 한정적이 아닌 것으로 이해해야만 한다. 예를 들어, 단일형으로 설명되어 있는 각 구성 요소는 분산되어 실시될 수도 있으며, 마찬가지로 분산된 것으로 설명되어 있는 구성 요소들도 결합된 형태로 실시될 수 있다.
본 명세서를 통해 보호 받고자 하는 범위는 상기 상세한 설명보다는 후술하는 특허청구범위에 의하여 나타내어지며, 특허청구범위의 의미 및 범위 그리고 그 균등 개념으로부터 도출되는 모든 변경 또는 변형된 형태를 포함하는 것으로 해석되어야 한다.
10: 질문제공방법.
110: 입출력부
120: 제어부
121: 근사답변생성부 122: 의도출론부
123: 질문추출부 124: 질문제공부
130: 통신부
140: 메모리

Claims (14)

  1. 목표 지향 대화 시스템을 위한 정보이론기반 질문제공시스템에 있어서,
    상기 목표 지향 대화 시스템을 구성하는 답변모듈의 질문에 대한 답변 생성을 근사하여 근사 답변을 생성하는 근사답변생성부;
    상기 답변모듈의 답변에 기초하여 목표에 대한 상기 질문의 근접정도인 의도값을 추론하는 의도추론부; 및
    상기 의도값에 기초하여 상기 답변모듈에 질문을 제공하는 질문제공부를 포함하는 질문제공시스템.
  2. 제 1 항에 있어서,
    상기 의도추론부는,
    상기 근사 답변에 대한 확률분포인 근사답변확률분포에 기초하여 상기 의도값을 계산하는, 질문제공시스템.
  3. 제 1 항에 있어서,
    상기 목표 지향 대화 시스템을 구성하는 답변모듈에 제공될 질문의 후보질문을 추출하는 질문추출부를 더 포함하는, 질문제공시스템.
  4. 제 3 항에 있어서,
    상기 질문추출부는,
    기 저장된 학습데이터에서 상기 후보질문을 추출하는, 질문제공시스템.
  5. 제 3 항에 있어서,
    상기 질문추출부는,
    기 저장된 학습데이터에 대한 기계학습을 통해 생성된 질문 중 확률에 기초하여 상기 후보질문을 추출하는, 질문제공시스템.
  6. 제 3 항에 있어서,
    상기 질문제공부는,
    상기 후보질문에 대한 근사정보이득을 계산하고, 계산된 근사정보이득에 기초하여 상기 답변모듈에 제공할 질문을 선택하는, 질문제공시스템.
  7. 질문제공시스템이 목표 지향 대화 시스템을 위한 정보이론기반 질문제공방법에 있어서,
    상기 목표 지향 대화 시스템을 구성하는 답변모듈의 질문에 대한 답변 생성을 근사하여 근사 답변을 생성하는 단계;
    상기 답변모듈의 답변에 기초하여 목표에 대한 상기 질문의 근접정도인 의도값을 추론하는 단계; 및
    상기 의도값에 기초하여 상기 답변모듈에 질문을 제공하는 단계를 포함하는, 질문제공방법.
  8. 제 7 항에 있어서,
    상기 의도값을 추론하는 단계는,
    상기 근사 답변에 대한 확률분포인 근사답변확률분포에 기초하여 상기 의도값을 계산하는 단계를 포함하는, 질문제공방법.
  9. 제 7 항에 있어서,
    상기 질문제공방법은,
    상기 목표 지향 대화 시스템을 구성하는 답변모듈에 제공될 질문의 후보질문을 추출하는 단계를 포함하는, 질문제공방법.
  10. 제 9 항에 있어서,
    상기 후보질문을 추출하는 단계는,
    기 저장된 학습데이터에서 상기 후보질문을 추출하는 단계를 포함하는, 질문제공방법.
  11. 제 9 항에 있어서,
    상기 후보질문을 추출하는 단계는,
    기 저장된 학습데이터에 대한 기계학습을 통해 생성된 질문 중 확률에 기초하여 상기 후보질문을 추출하는 단계를 포함하는, 질문제공방법.
  12. 제 9 항에 있어서,
    상기 답변모듈에 질문을 제공하는 단계는,
    상기 후보질문에 대한 근사정보이득을 계산하는 단계; 및
    계산된 근사정보이득에 기초하여 상기 답변모듈에 제공할 질문을 선택하는 단계를 포함하는, 질문제공방법.
  13. 제 7 항에 기재된 방법을 수행하는 프로그램이 기록된 컴퓨터 판독 가능한 기록 매체.
  14. 질문제공시스템에 의해 수행되며, 제 7 항에 기재된 방법을 수행하기 위해 매체에 저장된 컴퓨터 프로그램.
KR1020180131716A 2018-10-31 2018-10-31 목표 지향 대화 시스템을 위한 정보이론기반 질문 방법 및 시스템 KR102201074B1 (ko)

Priority Applications (3)

Application Number Priority Date Filing Date Title
KR1020180131716A KR102201074B1 (ko) 2018-10-31 2018-10-31 목표 지향 대화 시스템을 위한 정보이론기반 질문 방법 및 시스템
PCT/KR2018/014008 WO2020091129A1 (ko) 2018-10-31 2018-11-15 목표 지향 대화 시스템을 위한 정보이론기반 질문 방법 및 시스템
US17/263,609 US20210319343A1 (en) 2018-10-31 2018-11-15 Method and system for information theory-based questioning for goal-oriented dialog system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020180131716A KR102201074B1 (ko) 2018-10-31 2018-10-31 목표 지향 대화 시스템을 위한 정보이론기반 질문 방법 및 시스템

Publications (2)

Publication Number Publication Date
KR20200052457A true KR20200052457A (ko) 2020-05-15
KR102201074B1 KR102201074B1 (ko) 2021-01-08

Family

ID=70464148

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020180131716A KR102201074B1 (ko) 2018-10-31 2018-10-31 목표 지향 대화 시스템을 위한 정보이론기반 질문 방법 및 시스템

Country Status (3)

Country Link
US (1) US20210319343A1 (ko)
KR (1) KR102201074B1 (ko)
WO (1) WO2020091129A1 (ko)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20140131307A (ko) * 2014-10-20 2014-11-12 포항공과대학교 산학협력단 어학 학습 시스템 및 학습 방법
KR20180058877A (ko) * 2016-11-24 2018-06-04 주식회사 와이즈넛 채팅봇을 이용한 비즈니스 지원 방법

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6224528B2 (ja) * 2014-06-03 2017-11-01 Kddi株式会社 属性値が付与された情報要素を絞り込んで検索する対話検索プログラム、装置及び方法
KR20170101052A (ko) * 2016-02-26 2017-09-05 삼성전자주식회사 전자 장치 및 전자 장치에서 사용자 입력을 처리하는 방법
KR101775559B1 (ko) * 2017-01-06 2017-09-07 주식회사 피노텍 디스플레이 장치를 이용한 가상 상담 시스템 및 방법
CN108491433B (zh) * 2018-02-09 2022-05-03 平安科技(深圳)有限公司 聊天应答方法、电子装置及存储介质
KR20190133931A (ko) * 2018-05-24 2019-12-04 한국과학기술원 문장 패러프레이즈 인식 기반 대화 시스템 답변 방법
US20200050942A1 (en) * 2018-08-07 2020-02-13 Oracle International Corporation Deep learning model for cloud based technical support automation

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20140131307A (ko) * 2014-10-20 2014-11-12 포항공과대학교 산학협력단 어학 학습 시스템 및 학습 방법
KR20180058877A (ko) * 2016-11-24 2018-06-04 주식회사 와이즈넛 채팅봇을 이용한 비즈니스 지원 방법

Also Published As

Publication number Publication date
US20210319343A1 (en) 2021-10-14
WO2020091129A1 (ko) 2020-05-07
KR102201074B1 (ko) 2021-01-08

Similar Documents

Publication Publication Date Title
US10617959B2 (en) Method and system for training a chatbot
KR101986307B1 (ko) 시각 대화를 통해 객체의 위치를 알아내기 위한 주의 기억 방법 및 시스템
US20190013003A1 (en) Adaptive sound masking using cognitive learning
US11372805B2 (en) Method and device for information processing
JP5795743B2 (ja) 適応的重み付けを用いた様々な文書間類似度計算方法に基づいた文書比較方法および文書比較システム
US11748389B1 (en) Delegated decision tree evaluation
US11600266B2 (en) Network-based learning models for natural language processing
US20160055533A1 (en) Response generation device, response generation method, and non-transitory computer readable storage medium
US20190057414A1 (en) System and method for optimized survey targeting
KR102150953B1 (ko) 블록체인을 이용한 리워드 제공 통합 로그인 방법 및 장치
WO2020181783A1 (zh) 用于发送信息的方法和装置
US20170176956A1 (en) Control system using input-aware stacker
CN109977905B (zh) 用于处理眼底图像的方法和装置
KR20200114230A (ko) 사용자 감정 파악에 따른 응답을 생성하는 시스템 및 방법
US11120115B2 (en) Identification method and apparatus
CN104541304A (zh) 使用多个相机的目标对象角度确定
KR102201074B1 (ko) 목표 지향 대화 시스템을 위한 정보이론기반 질문 방법 및 시스템
US11798540B2 (en) Systems and methods for dynamically updating machine learning models that provide conversational responses
KR20220006301A (ko) 비대면 제품판매와 고객상담이 가능한 ai기반 동영상 챗봇 시스템 제공방법
AU2019200721B2 (en) Online training and update of factorization machines using alternating least squares optimization
KR20200006027A (ko) 정보 수집 방법 및 장치
KR20200057832A (ko) 기초 메타학습장치에 대한 앙상블가중치를 결정하는 방법 및 장치
KR102368193B1 (ko) 음성합성을 이용한 음성인식기능 검증 방법 및 장치
KR102082430B1 (ko) 의약품 검색을 위한 낱알 식별 장치 및 낱알 식별 방법
US20210191951A1 (en) Acquiring entity webpage link based on topological relationship graph

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant