WO2015102124A1

WO2015102124A1 - 대화 서비스 제공 장치 및 방법

Info

Publication number: WO2015102124A1
Application number: PCT/KR2013/012409
Authority: WO
Inventors: 김주희; 신원호
Original assignee: 엘지전자 주식회사
Priority date: 2013-12-31
Filing date: 2013-12-31
Publication date: 2015-07-09

Abstract

본 발명은 대화 서비스 제공 장치 및 방법이 개시된다. 대화 서비스 제공 장치는 사용자 음성을 인식하는 음성 인식부, 상기 인식된 사용자 음성을 이용하여 사용자 발화의 의도를 분석하는 음성 분석부, 상기 분석된 결과를 이용하여 응답에 필요한 데이터를 확인하고, 응답에 필요한 데이터를 가져올 위치의 결정과 제어를 수행하는 제어부, 상기 제어부의 제어에 따라 새로운 외부 데이터를 저장하고, 저장된 데이터 중 응답에 필요한 데이터를 제공하는 저장부, 상기 제어부의 제어에 따라 웹 검색을 수행하여 새로운 외부 데이터를 획득하고 응답에 필요한 데이터로 제공하는 외부 데이터 제공부, 및 상기 제어부의 제어에 따라 상기 저장부와 외부 데이터 제공부 중 하나로부터 응답에 필요한 데이터를 제공받아 응답 데이터를 생성하여 출력하는 응답 생성부를 포함한다.

Description

대화 서비스 제공 장치 및 방법

본 발명은 대화 서비스 제공 장치 및 방법에 관한 것으로서, 더욱 상세하게는 사용자 발화에 대해 좀 더 지능적으로 응답하도록 하는 장치 및 방법에 관한 것이다.

종래의 대화형 어플리케이션으로는 비서 어플리케이션, 지능형 대화 어플리케이션 등이 있다. 이러한 종래의 비서 어플리케이션이나 지능형 대화 어플리케이션은 사용자가 발화하면, 사용자 발화의 의도 분석 작업을 통하여 사용자가 원하는 바를 파악하고, 그에 대한 정보 제공, 특정 작업의 수행, 답변 생성 등을 통하여 응답을 생성하였다.

도 1은 이러한 종래의 대화 서비스 제공 방법의 일 실시예를 보인 흐름도이다.

즉, 사용자 발화가 있으면(S101), 사용자 발화의 의도를 분석한다(S102). 그리고 단계 S102에서 분석된 의도를 기반으로 웹 페이지 등에 접속하여 외부 데이터를 요청한다(S103). 이어 요청된 외부 데이터를 기반으로 응답을 생성하여 출력한다(S104).

도 2는 종래의 대화 서비스 제공 화면의 일 실시예를 보인 도면이다. 즉, 도 2의 (a)의 왼쪽에서와 같이 사용자가 스마트 폰과 같은 단말기에서 대화 서비스를 위해 해당 어플리케이션을 실행시킨 후 “김연아에 대해 알려줘”라고 발화하면, 단말기는 검색을 지원하는 포털 사이트(예, 네이버)에 접속하여 “김연아”에 대해 검색을 수행한다. 그리고 도 2의 (a)의 오른쪽에서와 같이 김연아에 대한 정보가 있는 웹 페이지를 디스플레이한다.

이 후 사용자가 질문 내용을 조금 바꿔 다시 발화하면, 단말기는 새로이 발화된 질문 내용을 기반으로 다시 처음부터 검색을 수행한다. 즉, 도 2의 (b)의 왼쪽에서와 같이 사용자가 “김연아 키 알려줘”라고 발화하면, 단말기는 포털 사이트에 다시 접속하여 “김연아 키”에 대해 검색을 수행한 후, 도 2의 (b)의 오른쪽에서와 같이 김연아에 대한 정보가 있는 웹 페이지를 디스플레이한다.

도 2의 (a), (b)에서 보는 바와 같이 사용자가 발화한 비슷한 질문에 대해 동일한 웹 페이지가 사용자에게 제공되지만, 단말기는 사용자가 발화를 할 때마다 매번 새로이 웹 검색을 수행한다.

이와 같이 사용자의 질문이 다르더라도 똑같은 웹 페이지가 제공되는 경우가 많다. 이 경우 사용자는 자신이 원하는 정보를 얻기 위해 웹 페이지 내에서 다시 해당 정보를 찾아야 하는 번거로움이 있다.

도 3은 종래의 대화 서비스 제공 화면의 다른 실시예를 보인 도면이다. 즉, 도 3의 (a)의 왼쪽에서와 같이 사용자가 스마트 폰과 같은 단말기에서 대화 서비스를 위해 해당 어플리케이션을 실행시킨 후 “토속촌 전화번호 알려줘”라고 발화를 하면, 단말기는 포털 사이트에 접속하여 “토속촌 전화 번호”에 대해 검색을 수행한다. 그리고 도 3의 (a)의 오른쪽에서와 같이 토속촌 전화 번호가 있는 웹 페이지를 디스플레이한다.

이 후 사용자가 질문 내용을 조금 바꿔 다시 발화하면, 예를 들어, 도 3의 (b)와 같이 “토속촌으로 전화 걸어줘”라고 발화하면, 단말기는 토속촌으로 저장된 전화 번호가 없으므로 “토속촌 전화 번호가 없습니다”라고 발화한다. 만일,“토속촌으로 전화 걸어줘”와 같은 기능을 수행하기 위해서는 사용자가 웹 페이지 상에서 본 토속촌의 전화 번호를 수동으로 단말기에 저장시켜야 한다.

이와 같이 종래의 대화 서비스 제공 방법은 웹 검색 등을 통하여 사용자에게 정보를 제공하는데, 이러한 정보는 1회성 정보이며, 재사용이 불가능 하였다. 또한 동일한 질문이나 비슷한 질문과 같이 동일한 웹 페이지로 제공할 수 있는 정보임에도 사용자 발화시마다 웹 검색을 하여 정보를 제공하였다. 이는 사용자로 하여금 더 많은 웹 페이지 접속을 유도하여 더 많은 데이터 사용 요금을 내도록 한다. 또한 웹 검색을 통해 제공한 웹 페이지 속에서 사용자가 원하는 답을 찾도록 하는 불편함이 있다.

본 발명은 상기와 같은 문제점을 해결하기 위한 것으로서, 본 발명의 목적은 외부 데이터를 축적한 후 이용하도록 함으로써, 불필요한 웹 페이지 접속을 줄이고, 좀 더 사용자의 의도에 알맞은 응답을 생성하도록 하는 대화 서비스 제공 장치 및 방법을 제공함에 있다.

상기와 같은 목적을 달성하기 위한 본 발명에 따른 대화 서비스 제공 장치는 사용자 음성을 인식하는 음성 인식부; 상기 음성 인식부에서 인식된 사용자 음성을 이용하여 사용자 발화의 의도를 분석하는 음성 분석부; 상기 음성 분석부에서 분석된 결과를 이용하여 응답에 필요한 데이터를 확인하고, 응답에 필요한 데이터를 가져올 위치의 결정과 제어를 수행하는 제어부; 상기 제어부의 제어에 따라 새로운 외부 데이터를 저장하고, 저장된 데이터 중 응답에 필요한 데이터를 제공하는 저장부; 상기 제어부의 제어에 따라 웹 검색을 수행하여 새로운 외부 데이터를 획득하고 응답에 필요한 데이터로 제공하는 외부 데이터 제공부; 및 상기 제어부의 제어에 따라 상기 저장부와 외부 데이터 제공부 중 하나로부터 응답에 필요한 데이터를 제공받아 응답 데이터를 생성하여 출력하는 응답 생성부를 포함하는 것을 일 실시예로 한다.

상기 제어부의 제어에 따라 웹 검색을 통해 획득한 새로운 외부 데이터를 캡쳐한 후 가공하여 상기 저장부에 저장하는 외부 데이터 캡쳐부를 더 포함하는 것을 일 실시예로 한다.

상기 외부 데이터 캡쳐부는 자동으로 새로운 외부 데이터를 캡쳐 및 가공하여 상기 저장부에 저장하는 것을 일 실시예로 한다.

상기 외부 데이터 캡쳐부는 사용자의 요청에 따라 새로운 외부 데이터를 캡쳐 및 가공하여 상기 저장부에 저장하는 것을 일 실시예로 한다.

상기 외부 데이터 캡쳐부는 새로운 외부 데이터와 상기 저장부에 저장된 데이터와의 중복 여부를 확인하고, 확인 결과에 따라 새로운 외부 데이터를 상기 저장부에 저장하는 것을 일 실시예로 한다.

상기 외부 데이터 캡쳐부는 캡쳐된 새로운 외부 데이터를 머신 비젼 기술과 문자 인식 기술 중 적어도 하나를 이용하여 가공하는 것을 일 실시예로 한다.

본 발명에 따른 저장부를 구비한 대화 서비스 제공 장치의 대화 서비스 제공 방법은 사용자 음성을 인식하고, 인식된 사용자 음성을 이용하여 사용자 발화의 의도를 분석하는 단계; 상기 단계에서 분석된 결과를 이용하여 응답에 필요한 데이터가 상기 저장부에 저장되어 있는지를 확인하는 단계; 상기 응답에 필요한 데이터가 상기 저장부에 저장되어 있으면, 상기 저장부로부터 상기 응답에 필요한 데이터를 추출하여 응답 데이터를 생성한 후 출력하는 단계; 상기 응답에 필요한 데이터가 상기 저장부에 저장되어 있지 않으면, 웹 검색을 통해 새로운 외부 데이터를 획득하여 응답 데이터로 출력하는 단계; 및 상기 새로운 외부 데이터를 상기 저장부에 저장하는 단계를 포함하여 이루어지는 것을 일 실시예로 한다.

상기 웹 검색을 통해 획득한 새로운 외부 데이터는 캡쳐 및 가공되어 상기 저장부에 저장되는 것을 일 실시예로 한다.

상기 새로운 외부 데이터는 자동으로 캡쳐 및 가공되어 상기 저장부에 저장되는 것을 일 실시예로 한다.

상기 새로운 외부 데이터는 사용자의 요청에 따라 캡쳐 및 가공되어 상기 저장부에 저장되는 것을 일 실시예로 한다.

상기 캡쳐된 새로운 외부 데이터는 머신 비젼 기술과 문자 인식 기술 중 적어도 하나를 이용하여 가공되는 것을 일 실시예로 한다.

본 발명은 외부 데이터, 예를 들어 웹 페이지 등으로부터 얻은 외부 데이터를 가공하여 축적한 후 이용함으로써, 사용자 발화에 대한 응답을 생성할 때 불필요한 웹 페이지 접속을 줄이고, 좀 더 사용자의 의도에 알맞은 응답을 생성하는 효과가 있다. 즉, 사용자 발화에 대해 축적된 데이터 내에서 응답이 가능할 경우 별도의 웹 페이지 연동 없이 답변을 수행함으로써, 웹 페이지 접속 횟수를 줄이는 효과가 있다. 특히 사용자가 특정 내용을 물을 경우 웹 페이지를 그대로 제공하는 것이 아니라 축적된 결과 내에서 그에 해당하는 정보만을 사용자에게 제공함으로써, 사용자는 보다 더 편리하게 정보를 얻을 수 있게 된다.

도 1은 종래의 대화 서비스 제공 방법의 일 실시예를 보인 흐름도

도 2의 (a),(b)는 종래의 대화 서비스 제공 화면의 일 예를 보인 도면

도 3의 (a),(b)는 종래의 대화 서비스 제공 화면의 다른 예를 보인 도면

도 4는 본 발명에 따른 대화 서비스 제공 장치의 일 실시예를 보인 구성 블록도

도 5는 본 발명에 따른 대화 서비스 제공 방법의 일 실시예를 보인 흐름도

도 6의 (a),(b)는 본 발명에 따른 대화 서비스 제공 화면의 일 예를 보인 도면

도 7의 (a),(b)는 본 발명에 따른 대화 서비스 제공 화면의 다른 예를 보인 도면

이하 상기의 목적을 구체적으로 실현할 수 있는 본 발명의 바람직한 실시예를 첨부한 도면을 참조하여 상세히 설명한다. 이때 도면에 도시되고 또 이것에 의해서 설명되는 본 발명의 구성과 작용은 적어도 하나의 실시예로서 설명되는 것이며, 이것에 의해서 본 발명의 기술적 사상과 그 핵심 구성 및 작용이 제한되지는 않는다.

본 발명에서 사용되는 용어는 본 발명에서의 기능을 고려하면서 가능한 현재 널리 사용되는 일반적인 용어를 선택하였으나, 이는 당분야에 종사하는 기술자의 의도 또는 관례 또는 새로운 기술의 출현 등에 따라 달라질 수 있다. 또한 특정한 경우는 출원인이 임의로 선정한 용어도 있으며, 이 경우 해당되는 발명의 설명 부분에서 상세히 그 의미를 기재할 것이다. 따라서 본 발명에서 사용되는 용어는 단순한 용어의 명칭이 아닌 그 용어가 가지는 의미와 본 발명의 전반에 걸친 내용을 토대로 정의되어야 함을 밝혀두고자 한다.

또한 본 발명에 개시되어 있는 본 발명의 개념에 따른 실시 예들에 대해서 특정한 구조적 내지 기능적 설명들은 단지 본 발명의 개념에 따른 실시 예를 설명하기 위한 목적으로 예시된 것으로, 본 발명의 개념에 따른 실시 예들은 다양한 형태로 실시될 수 있으며 본 발명에 설명된 실시 예들에 한정되는 것으로 해석되어서는 아니된다.

본 발명의 개념에 따른 실시 예는 다양한 변경을 가할 수 있고 여러 가지 형태를 가질 수 있으므로 특정 실시예들을 도면에 예시하고 본 발명에 상세하게 설명하고자 한다. 그러나, 이는 본 발명의 개념에 따른 실시 예를 특정한 개시 형태에 대해 한정하려는 것이 아니며, 본 발명의 사상 및 기술 범위에 포함되는 모든 변경, 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다.

그리고 본 발명에서 제1 및/또는 제2 등의 용어는 다양한 구성 요소들을 설명하는데 사용될 수 있지만, 상기 구성 요소들은 상기 용어들에 의해 한정되어서는 안된다. 상기 용어들은 하나의 구성 요소를 다른 구성 요소로부터 구별하는 목적으로만, 예컨대 본 발명의 개념에 따른 권리 범위로부터 이탈되지 않은 채, 제1 구성요소는 제2 구성요소로 명명될 수 있고, 유사하게 제2 구성요소는 제1 구성요소로도 명명될 수 있다.

또한 발명 전체에서, 어떤 부분이 어떤 구성 요소를 “포함”한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성 요소를 제외하는 것이 아니라 다른 구성 요소를 더 포함할 수 있는 것을 의미한다. 그리고 발명에 기재된 “…부” 등의 용어는 적어도 하나의 기능이나 동작을 처리하는 단위를 의미하며, 이는 하드웨어나 소프트웨어 또는 하드웨어 및 소프트웨어의 결합으로 구현될 수 있다.

본 발명은 외부 데이터를 축적하고 사용자 발화에 대한 응답을 생성할 때 축적된 외부 데이터를 이용하도록 함으로써, 웹 페이지 접속 횟수를 줄이면서 사용자 발화에 대해 효과적으로 응답을 하도록 하는데 있다.

도 4는 본 발명에 따른 대화 서비스 제공 장치의 일 실시예를 보인 구성 블록도로서, 제어부(400), 음성 인식부(401), 음성 분석부(402), 저장부(403), 외부 데이터 제공부(404), 응답 출력부(405), 및 외부 데이터 캡쳐부(406)를 포함할 수 있다.

본 발명에 따른 대화 서비스 제공 장치는 인터넷 접속이 가능한 단말기는 모두 가능하다. 예를 들면, 스마트 폰과 같은 모바일 폰, 가정용 유/무선 전화기, 스마트 패드, PMP(Portable Multimedia Player), 네비게이션, 디지털 카메라, UMPC(Ultra Mobile PC), 태블릿, 노트북, 데스크 탑, TV 등이 대화 서비스 제공 장치로 이용될 수 있다. 또한 본 발명에서 대화 서비스 제공 장치는 단말기와 혼용하여 사용하기로 한다.

이와 같이 구성된 도 4의 대화 서비스 제공 장치에서 사용자가 대화 서비스를 위해 해당 어플리케이션을 실행시킨 후 발화를 하면 음성 인식부(401)는 사용자의 음성을 인식한다. 상기 음성 인식부(401)에서 사용자의 음성이 인식되면, 상기 음성 분석부(402)는 인식된 사용자 음성을 분석하여 사용자 발화의 의도를 분석한다. 상기 음성 분석부(402)에서 분석된 결과는 상기 제어부(400)로 출력된다.

상기 제어부(400)는 CPU (Central Processing Unit)가 될 수 있으며, 롬(ROM), 램(RAM) 등의 저장 수단을 더 구비할 수도 있다. 상기 롬은 내장 메모리라 하기도 하며, 대화 서비스 제공 장치에서 탈착이 불가능하다.

상기 제어부(400)는 상기 음성 분석부(402)의 분석 결과를 이용하여 응답에 필요한 데이터를 파악하고, 응답에 필요한 데이터를 가져올 위치를 결정한다. 즉, 응답에 필요한 데이터로 단말기 자체 데이터를 사용할지, 웹 검색 등을 통해 외부 데이터를 새로이 획득하여 사용할지, 상기 저장부(403)에 기 저장된 (즉, 축적된) 외부 데이터를 사용할지를 결정한다. 이때 상기 제어부(400)는 단말기 자체 데이터, 새로운 외부 데이터, 및 축적된 외부 데이터 중 하나 이상의 데이터를 조합하여 응답에 필요한 데이터로 이용할 수 있다.

여기서 단말기 자체 데이터는 일 예로, 대화 서비스 제공 장치가 출시될 때 저장되어 있던 데이터이다. 그리고 상기 저장부(403)에 축적된 외부 데이터는 대화 서비스 제공 장치의 출시 이후에 사용자의 발화에 대한 응답으로 이용되었던 외부 데이터이다.

상기 단말기 자체 데이터는 상기 대화 서비스 제공 장치의 내장 메모리 (예, 롬)에 저장되어 있는 것을 일 실시예로 한다.

상기 저장부(403)는 SD나 CF 메모리와 같은 슬롯 형태로서 상기 대화 서비스 제공 장치에 착탈 가능한 것을 일 실시예로 한다. 상기 저장부(403)는 외장 메모리라 하기도 한다.

상기 새로운 외부 데이터는 사용자 발화에 대한 응답으로 사용하기 위해 웹 검색 등을 통해 획득한 데이터이다. 이때 새로운 외부 데이터는 상기 저장부(403)에 저장되는 것을 일 실시예로 한다. 즉, 상기 저장부(403)에 저장된 외부 데이터는 축적된 외부 데이터가 된다. 여기서 외부 데이터의 저장은 자동으로 수행될 수도 있고, 새로운 외부 데이터가 발생할 때마다 사용자에게 저장 유무를 묻고, 사용자의 요청이 있을 때에만 저장할 수도 있다. 또는 사용자가 카메라, 키 등을 이용하여 외부 데이터를 캡쳐하는 경우에만 저장부(403)에 저장할 수도 있다.

상기 저장부(403)에 축적된 외부 데이터는 저장부(403)의 용량에 연동되어 오래된 데이터부터 자동으로 삭제될 수도 있고, 사용자의 요청에 따라 삭제될 수도 있다.

상기 저장부(403)에 축적되는 외부 데이터는 이미지가 될 수도 있고, 텍스트가 될 수도 있으며, 이미지와 텍스트의 조합이 될 수도 있다. 일 예로, 대화 서비스 제공 장치에 장착된 카메라를 통해 화면에 디스플레이된 영상/사진/텍스트 등을 캡쳐하고, 이를 머신 비젼(machine vision) 기술 및 문자 인식 기술 등을 이용하여 가공한 후 저장부(403)에 저장할 수 있다.

이와 같이 상기 제어부(400)는 사용자 발화에 대한 응답에 필요한 데이터를 가져올 위치가 결정되면, 결정된 위치로부터 데이터를 가져와 응답을 생성한다.

이를 위해, 단말기 자체 데이터를 추출하기 위한 단말기 자체 데이터 추출 모듈, 상기 저장부(403)에 축적된 외부 데이터를 추출하기 위한 축적된 외부 데이터 추출 모듈, 웹 검색 등을 통해 외부 데이터를 요청하기 위한 새로운 외부 데이터 요청 모듈이 필요하다. 또한 단말기 자체 데이터, 축적된 외부 데이터, 웹 검색 등을 통해 얻은 새로운 외부 데이터 중 적어도 하나를 이용하여 사용자 발화에 대한 응답을 생성하는 응답 생성 모듈이 필요하다.

본 발명은 단말기 자체 데이터 추출 모듈, 축적된 외부 데이터 추출 모듈, 새로운 외부 데이터 요청 모듈, 및 응답 생성 모듈이 상기 제어부(400) 내부에 구비되는 것을 일 실시예로 한다. 이때 상기 단말기 자체 데이터 추출 모듈, 축적된 외부 데이터 추출 모듈, 새로운 외부 데이터 추출 모듈, 응답 생성 모듈은 각각 펌웨어, 소프트웨어, 하드웨어, 미들웨어 중 어느 하나로 이루어질 수도 있고, 또는 그러한 것 중 적어도 두개의 결합으로 이루어질 수도 있다. 본 발명은 다른 실시예로, 단말기 자체 데이터 추출 모듈, 축적된 외부 데이터 추출 모듈, 새로운 외부 데이터 요청 모듈, 및 응답 생성 모듈 중 적어도 하나는 제어부(400) 외부에 구비될 수도 있다.

상기 단말기 자체 데이터 추출 모듈은 내장 메모리(예, 롬)로부터 응답에 필요한 데이터를 추출하고, 상기 축적된 외부 데이터 추출 모듈은 외장 메모리(예, 저장부(403))로부터 응답에 필요한 데이터를 추출하는 것을 일 실시예로 한다.

상기 새로운 외부 데이터 요청 모듈은 외부 데이터 제공부(404)에 응답에 필요한 데이터를 요청한다. 상기 외부 데이터 제공부(404)는 검색 기능이 있는 특정 포털 사이트의 서버 등이 될 수 있다. 즉, 상기 외부 데이터 제공부(404)는 새로운 외부 데이터 요청 모듈에서 요청하는 데이터에 해당하는 웹 페이지를 검색하여 제어부(400) 및/또는 응답 출력부(405)로 제공한다. 이때 상기 제어부(400) 및/또는 응답 출력부(405)는 상기 외부 데이터 제공부(404)와 인터넷으로 연결되는 것을 일 실시예로 한다.

이와 같이 본 발명은 사용자의 발화가 수신되면, 그 발화로부터 사용자의 의도를 파악하고, 응답을 생성하기 위해 필요한 데이터를 검색한다. 이때, 정보는 3가지로 나눌 수 있는데, 대화 서비스 제공 장치의 내장 메모리(예, 롬)에 저장되어 있는 단말기 자체 데이터, 기존에 외부 데이터를 가공하여 외장 메모리(예, 저장부(403))에 저장해 둔 축적된 외부 데이터, 그리고 웹 연동 등을 이용하여 얻어야 하는 새로운 외부 데이터이다. 즉, 상기 제어부(400)는 응답을 생성하기 위해 필요한 데이터가 내부 메모리에 있는지, 외장 메모리에 있는지, 웹 페이지 연동이 필요한지를 확인하여, 내장 메모리, 외장 메모리, 웹 서버 중 적어도 하나로부터 응답을 생성하기 위해 필요한 데이터를 획득하다.

상기 제어부(400)에서 획득된 데이터를 이용하여 응답 데이터를 생성하고, 생성된 응답 데이터를 상기 응답 출력부(405)를 통해 사용자에게 제공한다. 일 예로, 응답 데이터는 웹 페이지 자체일 수도 있고, 가공되어 축적된 외부 데이터의 일부가 될 수도 있다.

상기 응답 출력부(405)는 스피커와 화면으로 구성되는 것을 일 실시예로 한다. 그리고 응답 데이터는 스피커와 화면 중 적어도 하나를 통해 사용자에게 제공된다.

한편, 새로운 외부 데이터 요청 모듈을 통해 얻어진 새로운 외부 데이터 예를 들어, 웹 페이지는 외부 데이터 캡쳐부(406)에서 캡쳐 수단(예, 카메라)에 의해 캡쳐되고, 캡쳐된 외부 데이터는 머신 비젼/문자 인식 기술에 의해 가공된 후 상기 저장부(403)에 저장된다.

이때 중복 데이터의 저장으로 인해 상기 저장부(403)의 용량이 낭비되는 것을 방지하기 위해, 상기 외부 데이터 캡쳐부(406)는 가공된 외부 데이터가 상기 저장부(403)에 이미 저장되어 있는지를 확인하고, 저장되어 있지 않는 경우에만 가공된 외부 데이터를 상기 저장부(403)에 저장하는 것을 일 실시예로 한다.

이후 사용자의 발화가 입력되고, 사용자의 발화에 대한 응답 데이터를 생성하기 위해 필요한 데이터가 상기 저장부(403)에 저장되어 있으면, 웹 연동 등을 통해 외부로부터 새로운 데이터를 다시 요청하는 것이 아니라 상기 저장부(403)에 가공되어 저장된 데이터를 이용하여 응답 데이터를 생성한다. 이렇게 함으로써, 웹 페이지를 여는 횟수를 줄여 사용자의 데이터 요금을 절감시키고, 또한 가공된 데이터를 사용함으로써 웹 페이지를 띄워주는 것보다 좀 더 사용자의 의도에 맞는 응답을 제공할 수 있게 된다.

도 5는 본 발명에 따른 대화 서비스 제공 방법의 일 실시예를 보인 흐름도이다. 즉, 사용자의 발화가 입력되면(S501), 사용자의 발화로부터 사용자의 의도를 분석한다(S502). 그리고 분석된 사용자 의도를 기반으로 응답에 필요한 데이터를 파악하고, 파악된 데이터가 상기 저장부(403)에 저장되어 있는지를 검색한다(S504). 이때 파악된 데이터가 단말기 자체 데이터에 포함되어 있는지를 동시에 또는 순차적으로 검색할 수도 있다. 단말기 자체 데이터를 이용하는 방법은 전술한 내용을 참조하기로 하고, 여기서는 상세 설명을 생략하기로 한다.

상기 단계 S504에서 응답에 필요한 데이터가 상기 저장부(403)에 저장되어 있다고 확인되면, 상기 저장부(403)에서 응답에 필요한 데이터를 추출하고, 추출된 데이터를 기반으로 응답 데이터를 생성하여 응답 출력부(405)의 화면과 스피커 중 적어도 하나로 출력한다(S505).

한편 상기 단계 S504에서 응답에 필요한 데이터가 상기 저장부(403)에 저장되어 있지 않다고 확인되면, 상기 외부 데이터 제공부(404)에 새로운 외부 데이터를 요청한다(S506).

새로운 외부 데이터의 요청에 따라 상기 외부 데이터 제공부(404)에서 새로운 외부 데이터를 제공하면, 이 데이터를 기반으로 응답 데이터를 생성하여 응답 출력부의 화면과 스피커 중 적어도 하나로 출력한다(S507).

그리고 새로운 외부 데이터는 캡쳐 수단을 이용하여 캡쳐한 후(S508), 머신 비젼/문자 인식 기술에 의해 가공하여 상기 저장부(403)에 저장한다(S509). 이때 새로운 외부 데이터의 캡쳐, 가공, 및 저장은 사용자의 요청이 있을때에만 수행될 수도 있고, 새로운 외부 데이터가 제공될 때마다 자동으로 수행될 수도 있다.

도 6은 본 발명에 따른 대화 서비스 제공 화면의 일 예를 보인 도면이다. 즉, 도 6의 (a)의 왼쪽에서와 같이 사용자가 스마트 폰과 같은 단말기에서 대화 서비스를 위해 해당 어플리케이션을 실행시킨 후 “김연아에 대해 알려줘”라고 발화하고, 김연아에 대한 정보가 저장부(403)에 저장되어 있지 않으면, 상기 제어부(400)는 검색 기능이 있는 특정 포털 사이트(예, 네이버)에 접속하여 “김연아”에 대해 검색을 수행한다. 그리고 도 6의 (a)의 오른쪽에서와 같이 김연아에 대한 정보가 있는 웹 페이지를 사용자에게 제공한다. 이때 사용자에게 제공된 웹 페이지는 캡쳐 및 가공되어 저장부(403)에 저장된다.

이 후 사용자가 질문 내용을 조금 바꿔 다시 발화하면, 상기 제어부(400)는 새로운 발화의 응답에 필요한 데이터가 저장부(403)에 저장되어 있는지를 검색한다. 그리고 저장부(403)에 응답에 필요한 데이터가 저장되어 있으면, 저장된 데이터를 기반으로 응답 데이터를 생성하여 사용자에게 제공한다. 즉, 도 6의 (b)의 왼쪽에서와 같이 사용자가 “김연아 키 알려줘”라고 발화하면, 제어부(400)는 상기 저장부(403)에서 “김연아 키”에 대해 검색을 수행하고, 김연아 키에 대한 정보가 저장부(403)에 저장되어 있으면 이 데이터를 기반으로 응답 데이터를 생성하여 사용자에게 제공한다. 예를 들어, 도 6의 (b)의 오른쪽 화면에서와 같이 “김연아의 키는 164입니다”라고 화면에 표시할 수도 있고, 스피커를 통해 음성으로 출력할 수도 있다. 또는 화면과 스피커를 통해 동시에 “김연아의 키는 164입니다”라는 응답 데이터를 출력할 수도 있다.

이와 같이 도 6의 (a)에 대응하는 첫 번째 사용자 질문에서는 웹 검색을 통해 새로운 외부 데이터를 획득하여 응답 데이터를 생성하고, 동시에 새로운 외부 데이터를 캡쳐 및 가공하여 저장부(403)에 저장한다. 그리고 도 6의 (b)에 대응하는 두 번째 사용자 질문에서는 저장부(403)에 저장된 데이터를 이용하여 응답 데이터를 생성한다. 이렇게 함으로써, 사용자가 원하는 답변만을 제공할 수 있으며, 또한 웹 페이지를 검색하는 횟수도 2회에서 1회를 줄일 수 있어 사용자의 데이터 사용 요금도 절감할 수 있다.

도 7은 본 발명에 따른 대화 서비스 제공 화면의 다른 예를 보인 도면이다. 즉, 도 7의 (a)의 왼쪽에서와 같이 사용자가 스마트 폰과 같은 단말기에서 대화 서비스를 위해 해당 어플리케이션을 실행시킨 후 “토속촌 전화번호 알려줘”라고 발화를 하고, “토속촌 전화 번호”에 대한 정보가 저장부(403)에 저장되어 있지 않으면, 상기 제어부(400)는 검색 기능이 있는 특정 포털 사이트(예, 네이버)에 접속하여 “토속촌 전화 번호”에 대해 검색을 수행한다. 그리고 도 7의 (a)의 오른쪽에서와 같이 토속촌의 전화 번호가 있는 웹 페이지를 사용자에게 제공한다. 이때 사용자에게 제공된 웹 페이지는 캡쳐 및 가공되어 저장부(403)에 저장된다. 예를 들어, 토속촌의 주소, 전화 번호가 텍스트 형태로 가공되어 저장부(403)에 저장된다. 또한 토속촌의 위치 정보가 텍스트 형태로 저장부(403)에 저장될 수도 있고, 이미지 형태로 저장부(403)에 저장될 수도 있다.

이 후 사용자가 질문 내용을 조금 바꿔 다시 발화하면, 예를 들어, 도 7의 (b)와 같이 “토속촌으로 전화 걸어줘”라고 발화하면, 상기 제어부(400)는 새로운 발화의 응답에 필요한 데이터가 저장부(403)에 저장되어 있는지를 검색한다. 이때 응답에 필요한 데이터(즉, 토속촌 전화 번호)가 저장부(403)에 저장되어 있으므로, 상기 제어부(400)는 저장부(403)로부터 응답에 필요한 데이터를 읽어 와 응답 데이터를 생성한 후 사용자에게 제공한다. 즉, 이전에 사용자 발화를 통해 획득한 외부 데이터에 포함된 토속촌의 전화 번호가 캡쳐 및 가공되어 상기 저장부(403)에 저장되어 있기 때문에, “토속촌으로 전화하겠습니다”와 같은 응답 데이터를 생성하여 사용자에게 제공한 후 토속촌으로 전화 걸기를 수행한다. 이때 “토속촌으로 전화하겠습니다”는 화면에 표시할 수도 있고, 스피커를 통해 음성으로 출력할 수도 있다. 또는 화면과 스피커를 통해 동시에 출력할 수도 있다.

이와 같이 본 발명은 웹 검색을 통해 획득한 새로운 외부 데이터를 캡쳐 및 가공하여 저장하기 때문에 데이터에 대한 사용이 편리할 뿐만 아니라, 사용자에게 제공하는 대화 서비스의 성능을 높일 수 있다.

지금까지 설명한 본 발명은 상술한 실시예에 한정되지 않으며, 첨부된 청구범위에서 알 수 있는 바와 같이 본 발명이 속한 분야의 통상의 지식을 가지 자에 의해 변형이 가능하고 이러한 변형은 본 발명의 범위에 속한다.

전술한 바와 같이, 상기 발명의 실시를 위한 최선의 형태에서, 관련된 사항을 기술하였다.

전술한 바와 같이, 본 발명은 음성 인식이 가능하고, 인터넷 접속이 가능한 단말기에는 모두 적용될 수 있다.　

Claims

사용자 음성을 인식하는 음성 인식부;

상기 음성 인식부에서 인식된 사용자 음성을 이용하여 사용자 발화의 의도를 분석하는 음성 분석부;

상기 음성 분석부에서 분석된 결과를 이용하여 응답에 필요한 데이터를 확인하고, 응답에 필요한 데이터를 가져올 위치의 결정과 제어를 수행하는 제어부;

상기 제어부의 제어에 따라 새로운 외부 데이터를 저장하고, 저장된 데이터 중 응답에 필요한 데이터를 제공하는 저장부;

상기 제어부의 제어에 따라 웹 검색을 수행하여 새로운 외부 데이터를 획득하고 응답에 필요한 데이터로 제공하는 외부 데이터 제공부; 및

상기 제어부의 제어에 따라 상기 저장부와 외부 데이터 제공부 중 하나로부터 응답에 필요한 데이터를 제공받아 응답 데이터를 생성하여 출력하는 응답 생성부를 포함하여 구성되는 대화 서비스 제공 장치.
제 1 항에 있어서,

상기 제어부의 제어에 따라 웹 검색을 통해 획득한 새로운 외부 데이터를 캡쳐한 후 가공하여 상기 저장부에 저장하는 외부 데이터 캡쳐부를 더 포함하는 것을 특징으로 하는 대화 서비스 제공 장치.
제 2 항에 있어서, 상기 외부 데이터 캡쳐부는

자동으로 새로운 외부 데이터를 캡쳐 및 가공하여 상기 저장부에 저장하는 것을 특징으로 하는 대화 서비스 제공 장치.
제 2 항에 있어서, 상기 외부 데이터 캡쳐부는

사용자의 요청에 따라 새로운 외부 데이터를 캡쳐 및 가공하여 상기 저장부에 저장하는 것을 특징으로 하는 대화 서비스 제공 장치.
제 2 항에 있어서, 상기 외부 데이터 캡쳐부는

새로운 외부 데이터와 상기 저장부에 저장된 데이터와의 중복 여부를 확인하고, 확인 결과에 따라 새로운 외부 데이터를 상기 저장부에 저장하는 것을 특징으로 하는 대화 서비스 제공 장치.
제 2 항에 있어서,

상기 외부 데이터 캡쳐부는 캡쳐된 새로운 외부 데이터를 머신 비젼 기술과 문자 인식 기술 중 적어도 하나를 이용하여 가공하는 것을 특징으로 하는 대화 서비스 제공 장치.
제 1 항에 있어서, 상기 응답 생성부는

상기 응답 데이터를 스피커와 화면 중 적어도 하나로 출력하는 것을 특징으로 하는 대화 서비스 제공 장치.
제 1 항에 있어서, 상기 응답 생성부는

상기 응답에 필요한 데이터가 상기 외부 데이터 제공부에서 제공되면, 상기 응답 데이터를 웹 페이지 형태로 출력하는 것을 특징으로 하는 대화 서비스 제공 장치.
제 1 항에 있어서, 상기 응답 생성부는

상기 응답에 필요한 데이터가 상기 저장부에서 제공되면, 상기 응답 데이터를 텍스트, 이미지, 음성 중 적어도 하나로 출력하는 것을 특징으로 하는 대화 서비스 제공 장치.
저장부를 구비한 대화 서비스 제공 장치의 대화 서비스 제공 방법에 있어서,

사용자 음성을 인식하고, 인식된 사용자 음성을 이용하여 사용자 발화의 의도를 분석하는 단계;

상기 단계에서 분석된 결과를 이용하여 응답에 필요한 데이터가 상기 저장부에 저장되어 있는지를 확인하는 단계;

상기 응답에 필요한 데이터가 상기 저장부에 저장되어 있으면, 상기 저장부로부터 상기 응답에 필요한 데이터를 추출하여 응답 데이터를 생성한 후 출력하는 단계;

상기 응답에 필요한 데이터가 상기 저장부에 저장되어 있지 않으면, 웹 검색을 통해 새로운 외부 데이터를 획득하여 응답 데이터로 출력하는 단계; 및

상기 새로운 외부 데이터를 상기 저장부에 저장하는 단계를 포함하여 이루어지는 것을 특징으로 하는 대화 서비스 제공 방법.
제 10 항에 있어서,

상기 웹 검색을 통해 획득한 새로운 외부 데이터는 캡쳐 및 가공되어 상기 저장부에 저장되는 것을 특징으로 하는 대화 서비스 제공 방법.
제 11 항에 있어서,

상기 새로운 외부 데이터는 자동으로 캡쳐 및 가공되어 상기 저장부에 저장되는 것을 특징으로 하는 대화 서비스 제공 방법.
제 11 항에 있어서,

상기 새로운 외부 데이터는 사용자의 요청에 따라 캡쳐 및 가공되어 상기 저장부에 저장되는 것을 특징으로 하는 대화 서비스 제공 방법.
제 11 항에 있어서,

상기 새로운 외부 데이터와 상기 저장부에 저장된 데이터와의 중복 여부를 확인하는 단계; 및

상기 확인 결과에 따라 새로운 외부 데이터를 상기 저장부에 저장하는 단계를 더 포함하는 것을 특징으로 하는 대화 서비스 제공 방법.
제 11 항에 있어서,

상기 캡쳐된 새로운 외부 데이터는 머신 비젼 기술과 문자 인식 기술 중 적어도 하나를 이용하여 가공되는 것을 특징으로 하는 대화 서비스 제공 방법.