KR20140115844A - 대화형 서버, 디스플레이 장치 및 제어 방법 - Google Patents

대화형 서버, 디스플레이 장치 및 제어 방법 Download PDF

Info

Publication number
KR20140115844A
KR20140115844A KR1020130031052A KR20130031052A KR20140115844A KR 20140115844 A KR20140115844 A KR 20140115844A KR 1020130031052 A KR1020130031052 A KR 1020130031052A KR 20130031052 A KR20130031052 A KR 20130031052A KR 20140115844 A KR20140115844 A KR 20140115844A
Authority
KR
South Korea
Prior art keywords
vocabulary
execution
execution command
stored
command table
Prior art date
Application number
KR1020130031052A
Other languages
English (en)
Inventor
권오윤
이천성
Original Assignee
삼성전자주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성전자주식회사 filed Critical 삼성전자주식회사
Priority to KR1020130031052A priority Critical patent/KR20140115844A/ko
Publication of KR20140115844A publication Critical patent/KR20140115844A/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/167Audio in a user interface, e.g. using voice commands for navigating, audio feedback

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Telephonic Communication Services (AREA)

Abstract

대화형 서버, 디스플레이 장치 및 제어 방법이 개시된다. 본 발명에 따른 대화형 서버는 디스플레이 장치와 통신을 수행하는 통신부, 디스플레이 장치로부터 수신된 발화 음성으로부터 실행 명령을 나타내는 실행 어휘 및 대상을 나타내는 대상 어휘 중 적어도 하나를 추출하는 추출부, 이전 발화 음성 정보에 포함된 비개체 실행 어휘가 저장된 적어도 하나의 실행 명령 테이블을 저장하는 저장부, 추출된 실행 명령을 나타내는 실행 어휘와 관련된 비개체 실행 어휘가 적어도 하나의 실행 명령 테이블에 저장되어 있는지 여부를 판단하는 판단부, 적어도 하나의 실행 명령 테이블에 저장되어 있으면, 실행 명령 테이블에 설정된 대표 어휘를 실행 어휘로 결정하고, 대표 어휘 및 추출된 대상 어휘에 기초하여 발화 음성에 대응되는 응답 정보를 생성하여 디스플레이 장치로 전송하는 제어부를 포함한다.

Description

대화형 서버, 디스플레이 장치 및 제어 방법{Interactive sever, display apparatus and control method thereof}
본 발명은 대화형 서버, 디스플레이 장치 및 제어 방법에 관한 것으로써, 보다 상세하게는 사용자의 다양한 발화에 대응되는 응답 정보를 제공하기 위한 대화형 서버, 디스플레이 장치 및 제어 방법에 관한 것이다.
일반적으로, 대화형 시스템에서 음성 인식이 가능한 디스플레이 장치는 사용자의 발화 음성을 수집하고, 그 수집한 발화 음성을 네트워크를 통해 연결된 외부 서버로 전송한다. 발화 음성을 수신한 외부 서버는 발화 음성을 분석하여 사용자의 의도를 파악하고, 그에 따른 응답 정보를 생성하여 디스플레이 장치로 전송한다. 이에 따라, 디스플레이 장치는 외부 서버로부터 수신한 응답 정보에 기초하여 사용자의 발화 음성에 대응하는 기능을 실행하거나 정보를 제공할 수 있다.
그러나, 이 같은 종래의 대화형 시스템은 사용자의 발화 음성을 분석하고, 그 분석 결과에 기초하여 사용자의 의도를 파악하는데 한계가 있다. 구체적으로, 외부 서버는 이전 사용자의 발화 음성을 학습하여 각각의 이전 발화 음성을 구성하는 어휘를 말뭉치 데이터베이스 상에 구축하고 있다. 따라서, 사용자의 발화 음성이 입력되면, 외부 서버는 말뭉치 데이터베이스 상에 기구축된 발화 음성별 어휘에 기초하여 사용자의 발화 음성에 대한 응답 정보를 생성한다.
그러나, 사용자의 발화 음성을 구성하는 어휘가 말뭉치 데이터베이스 상에 구축되어 있지 않으면, 외부 서버는 사용자의 의도와 상이한 응답 정보를 생성하거나 혹은 응답 정보를 생성하지 못하는 문제가 있다. 일반적으로, 말뭉치 데이터베이스 상에 구축되는 어휘는 통계적으로 자주 사용되는 것으로써, 사용자의 발화 음성을 구성하는 어휘가 말뭉치 데이터베이스 상에 구축되어 있지 않다면, 자주 사용되는 어휘가 아닐 확률이 높다.
따라서, 이 같이 자주 사용되지 않는 어휘까지 말뭉치 데이터베이스 상에 구축될 경우, 사용자의 다양한 발화 음성에 대해서 오류 없이 응답 정보를 제공할 수 있다. 그러나, 자주 사용되지 않는 어휘까지 말뭉치 데이터베이스 상에 구축될 경우, 말뭉치 데이터베이스 상에 수많은 어휘가 구축됨으로써, 말뭉치 데이터베이스에 부하가 발생할 뿐만 아니라, 추가적인 비용 및 시간이 소요될 수 있는 문제가 있다.
본 발명은 상술한 필요성에 따라 안출된 것으로, 본 발명의 목적은, 대화형 시스템에서 사용자의 다양한 발화 음성에 대한 응답 정보를 보다 효과적으로 제공하도록 함을 목적으로 한다.
이상과 같은 목적을 달성하기 위한 본 발명의 일 실시 예에 따른 대화형 서버는 디스플레이 장치와 통신을 수행하는 통신부, 상기 디스플레이 장치로부터 수신된 발화 음성으로부터 실행 명령을 나타내는 실행 어휘 및 대상을 나타내는 대상 어휘 중 적어도 하나를 추출하는 추출부, 이전 발화 음성 정보에 포함된 비개체 실행 어휘가 저장된 적어도 하나의 실행 명령 테이블을 저장하는 저장부, 상기 추출된 실행 명령을 나타내는 실행 어휘와 관련된 비개체 실행 어휘가 상기 적어도 하나의 실행 명령 테이블에 저장되어 있는지 여부를 판단하는 판단부, 상기 적어도 하나의 실행 명령 테이블에 저장되어 있으면, 실행 명령 테이블에 설정된 대표 어휘를 상기 실행 어휘로 결정하고, 상기 대표 어휘 및 상기 추출된 대상 어휘에 기초하여 상기 발화 음성에 대응되는 응답 정보를 생성하여 상기 디스플레이 장치로 전송하는 제어부를 포함한다.
그리고, 상기 실행 명령 테이블은, 상기 실행 명령 테이블에 저장되는 비개체 실행 어휘별 발화 빈도 수에 기초하여 산출된 확률값에 따라 순차적으로 저장하며, 상기 비개체 실행 어휘 중 가장 높은 확률값을 가지는 비개체 실행 어휘를 상기 실행 명령 테이블의 대표 어휘로 설정할 수 있다.
또한, 상기 제어부는, 상기 추출된 실행 어휘와 관련된 비개체 실행 어휘가 복수의 실행 명령 테이블에 저장되어 있으면, 상기 복수의 실행 명령 테이블 각각에 저장된 비개체 실행 어휘 중 가장 높은 확률값을 가지는 비개체 실행 어휘가 저장된 실행 명령 테이블로부터 대표 어휘를 획득할 수 있다.
그리고, 상기 저장부는, 상기 실행 명령 테이블에 저장된 비개체 실행 어휘를 포함하는 이전 발화 음성 정보로부터 추출된 비개체 대상 어휘와 관련하여 생성된 개체 구성 정보를 저장하는 개체 구성 테이블을 상기 실행 명령 테이블과 매핑하여 더 저장하며, 상기 개체 구성 테이블은, 개체 구성 정보별 생성 비율 및 빈도 수 중 적어도 하나에 기초하여 상기 개체 구성 테이블에 저장되는 개체 구성 정보를 순차적으로 저장할 수 있다.
또한, 상기 제어부는, 상기 복수의 실행 명령 테이블 각각에 저장된 비개체 실행 어휘의 확률값이 동일하면, 상기 추출된 대상 어휘와 관련된 개체 구성 정보를 생성하고, 상기 복수의 실행 명령 테이블 각각에 매핑된 개체 구성 테이블을 참조하여 상기 생성된 개체 구성 정보에 대한 순위가 가장 높은 개체 구성 테이블과 매핑된 실행 명령 테이블로부터 대표 어휘를 획득할 수 있다.
그리고, 상기 제어부는, 상기 추출된 실행 어휘가 상기 적어도 하나의 실행 명령 테이블에 저장되어 있지 않으면, 상기 추출된 대상 어휘와 관련하여 생성된 개체 구성 정보가 저장된 개체 구성 테이블과 매핑된 실행 명령 테이블에 상기 실행 어휘 저장 및 상기 실행 명령 테이블로부터 대표 어휘를 획득할 수 있다.
한편, 본 발명의 일 실시 예에 따르면, 대화형 서버의 제어 방법에 있어서, 상기 방법은 디스플레이 장치로부터 발화 음성을 수신하는 단계, 상기 수신된 발화 음성으로부터 실행 명령을 나타내는 실행 어휘 및 대상을 나타내는 대상 어휘 중 적어도 하나를 추출하는 단계, 이전 발화 음성 정보에 포함된 비개체 실행 어휘가 저장된 적어도 하나의 실행 명령 테이블을 참조하여 상기 추출된 실행 어휘와 관련된 비개체 실행 어휘가 저장되어 있는지 여부를 판단하는 단계, 상기 적어도 하나의 실행 명령 테이블에 저장되어 있으면, 상기 실행 명령 테이블에 설정된 대표 어휘를 상기 실행 어휘로 결정하고, 상기 대표 어휘 및 상기 추출된 대상 어휘에 기초하여 상기 발화 음성에 대응하는 응답 정보를 생성하는 단계 및 상기 생성된 응답 정보를 상기 디스플레이 장치로 전송하는 단계를 포함한다.
그리고, 상기 실행 명령 테이블은, 상기 실행 명령 테이블에 저장되는 비개체 실행 어휘별 발화 빈도 수에 기초하여 산출된 확률값에 따라 순차적으로 저장하며, 상기 비개체 실행 어휘 중 가장 높은 확률값을 가지는 비개체 실행 어휘를 상기 실행 명령 테이블의 대표 어휘로 설정할 수 있다.
또한, 상기 응답 정보를 생성하는 단계는, 상기 추출된 실행 어휘와 관련된 비개체 실행 어휘가 복수의 실행 명령 테이블에 저장되어 있는지 여부를 판단하는 단계 및 상기 복수의 실행 명령 테이블에 저장되어 있으면, 상기 복수의 실행 명령 테이블 각각에 저장된 비개체 실행 어휘 중 가장 높은 확률값을 가지는 비개체 실행 어휘가 저장된 실행 명령 테이블로부터 대표 어휘를 획득하는 단계를 포함할 수 있다.
그리고, 상기 실행 명령 테이블에 저장된 비개체 실행 어휘를 포함하는 이전 발화 음성 정보로부터 추출된 비개체 대상 어휘와 관련하여 생성된 개체 구성 정보를 저장하는 개체 구성 테이블이 상기 실행 명령 테이블과 매핑되어 저장되며, 상기 개체 구성 테이블은, 개체 구성 정보별 생성 비율 및 빈도 수 중 적어도 하나에 기초하여 상기 개체 구성 테이블에 저장되는 개체 구성 정보를 순차적으로 저장할 수 있다.
또한, 상기 대표 어휘를 획득하는 단계, 상기 복수의 실행 명령 테이블 각각에 저장된 비개체 실행 어휘의 확률값이 동일하면, 상기 추출된 대상 어휘와 관련된 개체 구성 정보를 생성하고, 상기 복수의 실행 명령 테이블 각각에 매핑된 개체 구성 테이블을 참조하여 상기 생성된 개체 구성 정보에 대한 순위가 가장 높은 개체 구성 테이블과 매핑된 실행 명령 테이블로부터 대표 어휘를 획득할 수 있다.
그리고, 상기 대표 어휘를 획득하는 단계는, 상기 추출된 실행 어휘가 상기 적어도 하나의 실행 명령 테이블에 저장되어 있지 않으면, 상기 추출된 대상 어휘와 관련하여 생성된 개체 구성 정보가 저장된 개체 구성 테이블과 매핑된 실행 명령 테이블에 상기 추출된 실행 어휘를 저장하고, 상기 실행 명령 테이블로부터 대표 어휘를 획득할 수 있다.
이상과 같이 본 발명의 다양한 실시 예에 따르면, 대화형 시스템에서 대화형 서버는 사용자의 다양한 발화 음성에 대한 응답 정보를 보다 효과적으로 제공할 수 있다.
도 1은 본 발명의 일 실시예에 따른 사용자 발화 음성에 적합한 응답 정보를 제공하는 대화형 시스템의 예시도,
도 2는 본 발명의 일 실시예에 따른 디스플레이 장치의 블록도,
도 3은 본 발명의 일 실시예에 따른 대화형 서버의 블록도,
도 4는 본 발명의 일 실시예에 따른 실행 명령 테이블 및 해당 실행 명령 테이블과 매핑된 개체 구성 테이블의 예시도,
도 5는 본 발명의 일 실시예에 따른 발화 음성으로부터 추출된 실행 어휘와 관련된 비개체 실행 어휘가 복수의 실행 명령 테이블에 저장되는 예시도,
도 6은 본 발명의 일 실시예에 따른 도 5의 복수의 실행 테이블과 각각의 실행 테이블에 매핑된 개체 구성 테이블을 나타내는 예시도,
도 7은 본 발명의 일 실시예에 따른 디스플레이 장치의 제어 방법에 대한 흐름도,
도 8은 본 발명의 일 실시예에 따른 대화형 서버의 제어 방법에 대한 흐름도,
도 9는 본 발명의 일 실시예에 따른 대화형 서버에서 응답 정보를 생성하는 방법의 흐름도이다.
이하 첨부된 도면들을 참조하여 본 발명의 일시 예를 보다 상세하게 설명한다.
도 1은 본 발명의 일 실시예에 따른 사용자 발화 음성에 적합한 응답 정보를 제공하는 대화형 시스템의 예시도이다.
도 1에 도시된 바와 같이, 대화형 시스템은 디스플레이 장치(100) 및 텍스트 서버(200) 및 대화형 서버(300)를 포함한다.
디스플레이 장치(100)는 인터넷이 가능한 장치로써, 스마트 TV, 스마트폰과 같은 휴대폰, 데스크탑 PC, 노트북, 네비게이션 등과 같은 다양한 전자 장치로 구현될 수 있다. 이 같은 디스플레이 장치(100)는 사용자의 발화 음성이 입력되면, 입력된 사용자의 발화 음성에 대응되는 동작을 수행한다. 구체적으로, 디스플레이 장치(100)는 사용자의 발화 음성이 입력되면, 입력된 발화 음성을 분석하여 내부적으로 수행가능한지 여부를 판단하고, 그 판단 결과에 따라 사용자의 발화 음성에 대응되는 동작을 수행하거나 혹은 대화형 서버(300)로부터 수신된 응답 정보에 기초하여 동작을 수행한다.
예를 들어, 사용자의 발화 음성이 "TV 꺼"와 같은 TV 전원 제어 명령이면, 디스플레이 장치(100)는 "TV 꺼"라는 발화 음성에 대응되는 제어 정보가 기저장되어 있는지 여부를 판단한다. 판단 결과, 수신된 발화 음성에 대응되는 제어 정보가 기저장되어 있으면, 디스플레이 장치(100)는 기저장된 제어 정보에 기초하여 TV 전원을 오프할 수 있다.
한편, 사용자의 발화 음성에 대응되는 제어 정보가 기저장되어 있지 않으면, 디스플레이 장치(100)는 수신된 발화 음성을 대화형 서버(300)로 전송한다. 이후, 대화형 서버(300)로부터 사용자의 발화 음성에 대응되는 응답 정보가 수신되면, 디스플레이 장치(100)는 수신된 응답 정보에 기초하여 사용자의 발화 음성에 대응되는 기능을 제어하거나 혹은 응답 메시지를 출력할 수 있다.
예를 들어, 사용자의 발화 음성이 "오늘 저녁에 하는 드라마 찾아줘!"라는 특정 프로그램에 대한 검색을 요청하는 정보이면, 디스플레이 장치(100)는 내부적으로 사용자의 발화 음성에 대응되는 동작의 수행이 불가능한 것으로 판단한다. 이 경우, 디스플레이 장치(100)는 대화형 서버(300)로부터 사용자의 발화 음성에 대응되는 응답 정보를 수신하고, 수신된 응답 정보에 기초하여 "오늘 저녁에 하는 드라마 찾아줘!"라는 사용자의 발화 음성에 대응되는 응답 메시지를 출력할 수 있다.
구체적으로, 전술한 예와 같이, "오늘 저녁에 하는 드라마 찾아줘!"라는 발화 음성이 수신되면, 디스플레이 장치(100)는 수신된 발화 음성을 텍스트 서버(200)로 전송한다. 여기서, 텍스트 서버(200)는 사용자의 발화 음성을 텍스트 정보로 변환하는 서버이다. 실시예에 따라, 텍스트 서버(200)는 STT(Speech to Text) 알고리즘을 이용하여 사용자의 발화 음성을 텍스트 정보로 변환할 수 있다. 따라서, 텍스트 서버(200)는 디스플레이 장치(100)로부터 발화 음성이 수신되면, 수신된 발화 음성을 텍스트 정보로 변환하여 디스플레이 장치(100)로 전송한다. 이후, 디스플레이 장치(100)는 텍스트 서버(200)로부터 수신된 발화 음성에 대한 텍스트 정보를 대화형 서버(300)로 전송한다.
한편, 본 발명은 이에 한정되지 않으며, 텍스트 서버(200)와 후술할 대화형 서버(300)는 하나의 서버로 구축될 수 있다. 이 경우, 대화형 서버(300)는 사용자의 발화 음성을 텍스트 형태로 변환하고, 그 변환된 텍스트 정보에 기초하여 사용자의 발화 음성에 대응되는 응답 정보를 생성할 수 있다. 본 발명에서는, 대화형 서버(300)가 디스플레이 장치(100)로부터 텍스트 정보로 변환된 발화 음성을 수신하는 것에 한정하여 설명하도록 한다.
전술한 바와 같이, 디스플레이 장치(100)로부터 사용자의 발화 음성에 대한 텍스트 정보가 수신되면, 대화형 서버(300)는 수신된 텍스트 정보로 변환된 발화 음성으로부터 형태소 단위의 어휘를 추출한다. 여기서, 형태소 단위의 어휘는 실행 명령을 나타내는 실행 어휘 및 대상을 나타내는 대상 어휘 중 적어도 하나를 포함할 수 있다. 예를 들어, "오늘 하는 드라마 알아봐줘!"라는 발화 음성의 경우, 대화형 서버(300)는 "오늘", "드라마", "알아봐줘"라는 형태소 단위의 어휘를 추출할 수 있다. 이 같은 어휘가 추출되면, 대화형 서버(300)는 기정의된 실행 명령어 중 추출된 어휘 중 "알아봐줘"라는 실행 명령(목적 기능)을 나타내는 실행 어휘와 대응되는 실행 명령어를 획득한다. 또한, 대화형 서버(300)는 기저정의된 실행어 중 "오늘", "드라마"에 대한 대상(주요 특징)을 나타내는 대상 어휘와 대응되는 실행어를 획득한다. 이후, 대화형 서버(300)는 기획득한 실행 명령어와 실행어에 기초하여 서비스 도메인을 결정한다. 서비스 도메인이 결정되면, 대화형 서버(300)는 해당 서비스 도메인 내에서 기획득한 실행 명령어와 실행어에 기초하여 응답 정보를 생성한다.
한편, 대화형 서버(300)는 기정의된 복수의 실행 명령어 중 실행 어휘와 대응되는 실행 명령어를 획득하기 위해 다음과 같은 동작을 수행한다. 구체적으로, 대화형 서버(300)는 기정의된 각각의 실행 명령어별로 설정된 실행 명령 테이블을 참조하여 추출된 실행 어휘와 관련된 대표 어휘를 획득한다. 여기서, 실행 명령 테이블은 이전 발화 음성 정보에 포함된 비개체 실행 어휘를 저장하는 테이블이다. 구체적으로, 이전 발화 음성 정보에 포함된 비개체 실행 어휘는 실행 명령어별로 분류된다. 실행 명령어별로 분류된 비개체 실행 어휘는 각 실행 명령어별로 설정된 실행 명령 테이블에 저장될 수 있다.
따라서, 대화형 서버(300)는 각 실행 명령어별로 설정된 실행 명령 테이블을 참조하여 사용자의 발화 음성으로부터 추출된 실행 어휘와 관련된 비개체 실행 어휘가 저장되어 있는지 여부를 판단한다. 판단 결과, 추출된 실행 어휘와 관련된 비개체 실행 어휘가 적어도 하나의 실행 명령 테이블에 저장되어 있으면, 대화형 서버(300)는 해당 실행 명령 테이블에 설정된 대표 어휘를 사용자의 발화 음성으로부터 추출된 실행 어휘로 판단한다. 전술한 예와 같이, 추출된 실행 어휘는 "알아봐줘"가 될 수 있으며, 이 같은 실행 어휘와 관련된 비개체 실행 어휘가 "Search_Content"라는 실행 명령어의 실행 명령 테이블에 저장될 수 있다. 그리고, 실행 어휘와 관련된 비개체 실행 어휘를 저장하는 실행 명령 테이블의 대표 어휘는 "찾아줘"라는 비개체 실행 어휘가 될 수 있다. 이 경우, 대화형 서버(300)는 사용자의 발화 음성으로부터 추출된 실행 어휘를 "찾아줘"라는 대표 어휘로 결정하고, 해당 실행 명령 테이블로부터 "Search_Content"라는 실행 명령어를 획득할 수 있다. 이후, 대화형 서버(200)는 기정의된 실행어 중 사용자의 발화 음성으로부터 추출된 대상 어휘와 대응되는 실행어를 획득한다. 이와 같이, 사용자의 발화 음성으로부터 추출된 실행 어휘 및 대상 어휘에 대한 실행 명령어 및 실행어가 획득되면, 대화형 서버(200)는 기획득한 실행 명령어 및 실행어에 기초하여 사용자의 발화 음성에 대응되는 응답 정보를 생성할 수 있다.
지금까지, 사용자의 발화 음성에 대응되는 응답 정보를 제공하는 대화형 시스템의 각 구성에 대해서 개략적으로 설명하였다. 이하에서는 전술한 디스플레이 장치(100) 및 대화형 서버(300)의 각 구성에 대해서 상세히 설명하도록 한다.
도 2는 본 발명의 일 실시예에 따른 디스플레이 장치의 블록도이다.
도 2에 도시된 바와 같이, 디스플레이 장치(100)는 통신부(110), 음성 수집부(120), 제어부(130) 및 출력부(140)를 포함한다.
통신부(110)는 사용자의 발화 음성에 적합한 응답 정보를 제공하는 대화형 서버(200)와 통신을 수행한다. 구체적으로, 통신부(110)는 다양한 통신 방식에 따라 대화형 서버(200)와 통신을 수행하여, 사용자의 발화 음성을 대화형 서버(200)로 전송할 수 있다. 이를 위해, 통신부(110)는 근거리 무선 통신 모듈(미도시), 무선 통신 모듈(미도시) 등과 같은 다양한 통신 모듈을 포함할 수 있다. 여기서, 근거리 무선 통신 모듈(미도시)은 근거리에 위치한 외부 기기와 무선 통신을 수행하는 통신 모듈로써, 예를 들어, 블루투스, 지그비 등이 될 수 있다. 무선 통신 모듈(미도시)은 와이파이(WiFi), IEEE 등과 같은 무선 통신 프로토콜에 따라 외부 네트워크에 연결되어 통신을 수행하는 모듈이다. 이 밖에 무선 통신 모듈은 3G(3rd Generation), 3GPP(3rd Generation Partnership Project), LTE(Long Term Evoloution) 등과 같은 다양한 이동 통신 규격에 따라 이동 통신 망에 접속하여 통신을 수행하는 이동 통신 모듈을 더 포함할 수도 있다.
음성 수집부(120)는 마이크(미도시)를 통해 입력된 사용자의 발화 음성을 수집하며, 수집된 사용자의 발화 음성에 대한 신호 처리를 수행한다. 구체적으로, 음성 수집부(120)는 아날로그 형태의 발화 음성이 수집되면, 수집된 발화 음성을 샘플링하여 디지털 신호로 변환한다. 이때, 음성 수집부(120)는 디지털 신호로 변환된 발화 음성에 노이즈가 있는지 여부를 판단하여, 노이즈가 있는 경우, 변환된 디지털 신호로부터 노이즈를 제거하는 것이 바람직하다. 구체적으로, 음성 수집부(120)는 아날로그 형태의 발화 음성이 수집되면, 수집된 아날로그 형태의 발화 음성을 샘플링하여 디지털 신호로 변환한다. 이후, 음성 수집부(120)는 변환된 디지털 신호의 에너지를 계산하여, 디지털 신호의 에너지 크기가 기설정된 임계값 이상인지 여부를 판단한다. 판단 결과, 디지털 신호의 에너지 크기가 기설정된 임계값 이상이면, 음성 수집부(120)는 디지털 신호에서 노이즈 성분을 제거한다. 한편, 디저털 신호의 에너지 크기가 기설정된 임계값 미만이면, 음성 수집부(120)는 디지털 신호에 대해서 별도의 노이즈 성분을 제거하지 않는다.
이 같이, 사용자의 발화 음성이 디지털 신호로 신호 처리되면, 통신부(110)는 디지털 신호로 신호 처리된 사용자의 발화 음성을 텍스트 서버(200)로 전송한다. 이에 따라, 텍스트 서버(200)는 디스플레이 장치(100)로부터 수신된 디지털 신호인 발화 음성을 텍스트 정보로 변환하여 디스플레이 장치(100)로 전송한다. 텍스트 서버(200)로부터 텍스트 정보로 변환된 발화 음성이 수신되면, 통신부(110)는 텍스트 정보로 변환된 발화 음성을 대화형 서버(300)로 전송한다.
이에 따라, 대화형 서버(300)는 텍스트 정보로 변환된 발화 음성을 분석하여 실행 명령을 나타내는 실행 어휘 및 대상을 나타내는 대상 어휘 중 적어도 하나를 추출한다. 이후, 대화형 서버(300)는 텍스트 정보로 변환된 발화 음성으로부터 추출된 실행 어휘 및 대상 어휘와 관련된 실행 명령어 및 실행어를 획득하고, 획득한 실행 명령어 및 실행어에 기초하여 응답 정보를 생성한 후, 이를 디스플레이 장치(100)로 전송한다.
제어부(130)는 디스플레이 장치(100)의 전반적인 동작을 제어한다. 구체적으로, 제어부(130)는 음성 수집부(120)를 통해 사용자의 발화 음성을 수집하고, 수집된 발화 음성을 텍스트 서버(200)로 전송하도록 통신부(110)를 제어한다. 또한, 제어부(130)는 텍스트 정보로 변환된 발화 음성을 텍스트 서버(200)로부터 수신하여 대화형 서버(300)로 전송하도록 통신부(110)를 제어할 수 있다.
특히, 제어부(130)는 통신부(110)를 통해 대화형 서버(200)로부터 수신된 응답 정보에 기초하여 사용자의 발화 음성에 대응되는 응답 메시지를 출력하도록 출력부(140)를 제어한다. 여기서, 응답 정보는 사용자의 발화 음성에 대응되는 응답 메시지를 출력하기 위한 정보이다. 따라서, 이 같은 응답 정보가 수신되면, 제어부(130)는 수신된 응답 정보에 기초하여 사용자의 발화 음성에 대응되는 응답 메시지를 영상 및 음성 중 적어도 하나로 출력하도록 출력부(140)를 제어한다.
이에 따라, 출력부(140)는 사용자의 발화 음성에 대응되는 응답 메시지를 영상 및 음성 중 적어도 하나로 출력한다. 구체적으로, 출력부(140)는 제어부(130)의 제어 명령에 따라, 대화형 서버(200)로부터 수신된 응답 정보에 기초하여 생성된 응답 메시지를 음성 또는 텍스트 형태의 영상으로 출력할 수 있다. 이를 위해 출력부(140)는 디스플레이부(141) 및 오디오 출력부(143)를 포함할 수 있다.
디스플레이부(141)는 액정 표시 장치(Liquid Crystal Display, LCD), 유기 전기 발광 다이오드(Organic Light Emitting Display, OLED) 또는 플라즈마 표시 패널(Plasma Display Panel, PDP) 등으로 구현되어, 디스플레이 장치(100)를 통해 제공 가능한 다양한 디스플레이 화면을 제공할 수 있다. 특히, 디스플레이부(141) 사용자의 발화 음성에 대응되는 응답 메시지가 텍스트 또는 이미지 형태로 디스플레이할 수 있다. 여기서, 디스플레이부(141)는 터치패드와 함께 상호 레이어 구조를 이루는 터치 스크린 형태로 구현될 수 있으며, 터치 스크린은 터치 입력 위치, 면적, 터치 입력의 압력까지도 검출하도록 구성될 수 있다.
그리고, 오디오 출력부(143)는 스피커 또는 잭 등과 같은 출력 포트로 구현되어, 사용자 발화 음성에 대한 응답 메시지를 가청음 형태로 출력할 수 있다. 사용자 발화 음성에 대한 응답 메시지를 가청음 형태로 출력할 경우, 제어부(130)는 TTS 엔진과 같이, 텍스트 정보를 음성 신호로 변화하는 알고리즘을 이용하여 텍스트 형태의 응답 메시지를 음성 신호로 변환할 수 있다. 따라서, 오디오 출력부(143)는 텍스트 형태의 응답 메시지를 음성 신호로 출력할 수 있다.
예를 들어, "오늘 하는 드라마 알려줘"라는 발화 음성에 대해서 대화형 서버(300)는 "오늘 하는 드라마는 ○○○(드라마명)입니다."라는 응답 정보를 생성하여 디스플레이 장치(100)로 전송할 수 있다. 이 경우, 제어부(130)는 "오늘 하는 드라마는 ○○○(드라마명)입니다."라는 응답 정보를 음성 신호로 변환하고, 변환된 음성 신호가 오디오 추력부(143)를 통해 출력되도록 출력부(140)를 제어할 수 있다. 또한, 제어부(130)는 "오늘 하는 드라마는 ○○○(드라마명)입니다."라는 응답 정보를 텍스트 형태의 응답 메시지로 변환하고, 변환된 응답 메시지가 디스플레이부(141)를 통해 영상으로 출력되도록 출력부(140)를 제어할 수 있다.
한편, 제어부(130)는 전술한 바와 같이, 사용자의 발화 음성을 분석하여 사용자의 발화 음성에 대응되는 동작을 수행할 수 있다. 전술한 예와 같이, "TV 꺼"라는 발화 음성이 수집되면, 제어부(130)는 수집된 발화 음성에 대응되는 제어 정보가 저장부(150)에 저장되어 있는지 여부를 판단한다. 판단 결과, 수집된 발화 음성에 대응되는 제어 정보가 저장부(150)에 저장되어 있으면, 제어부(130)는 기저장된 제어 정보에 기초하여 디스플레이 장치(100)의 전원을 오프할 수 있다.
지금까지, 본 발명에 따른 디스플레이 장치(100)의 각 구성에 대해서 상세히 설명하였다. 이하에서는, 본 발명에 따른 대화형 서버(300)의 각 구성에 대해서 상세히 설명하도록 한다.
도 3은 본 발명의 일 실시예에 따른 대화형 서버의 블록도이다.
도 3에 도시된 바와 같이, 대화형 서버(300)는 통신부(310), 추출부(320), 판단부(330), 저장부(340) 및 제어부(350)를 포함한다.
통신부(310)는 디스플레이 장치(100)와 통신을 수행한다. 구체적으로, 통신부(310)는 디스플레이 장치(100)로부터 사용자의 발화 음성에 대한 텍스트 정보를 수신하고, 수신한 텍스트 정보에 대응되는 응답 정보를 디스플레이 장치(100)로 전송한다. 이를 위해, 통신부(310)는 다양한 통신 모듈을 포함할 수 있다.
추출부(320)는 디스플레이 장치(100)로부터 수신된 텍스트 정보의 발화 음성으로부터 형태소 단위의 어휘를 추출한다. 여기서, 형태소 단위의 어휘는 실행 명령을 나타내는 실행 어휘 및 대상을 나타내는 대상 어휘 중 적어도 하나를 포함할 수 있다. 전술한 예와 같이, "오늘 하는 드라마 알아봐줘!"라는 발화 음성의 경우, 추출부(320)는 "알아봐줘"라는 실행 명령(목적 기능)을 나타내는 실행 어휘와 "오늘", "드라마"라는 대상(주요 특징)을 나타내는 대상 어휘를 추출할 수 있다.
이 같이, 사용자의 발화 음성으로부터 실행 명령을 나타내는 실행 어휘와 대상을 나타내는 대상 어휘 중 적어도 하나의 어휘가 추출되면, 판단부(330)는 추출된 실행 명령을 나타내는 실행 어휘와 관련된 비개체 실행 어휘가 적어도 하나의 실행 명령 테이블에 저장되어 있는지 여부를 판단한다.
판단 결과, 적어도 하나의 실행 명령 테이블에 사용자의 발화 음성으로부터 추출된 실행 어휘와 관련된 비개체 실행 어휘가 저장되어 있으면, 제어부(350)는 해당 실행 명령 테이블에 설정된 대표 어휘를 추출된 실행 어휘의 대체 어휘로 결정한다. 이후, 제어부(350)는 대체 어휘로 결정된 대표 어휘 및 추출된 대상 어휘에 기초하여 사용자의 발화 음성에 대응되는 응답 정보를 생성하여 통신부(310)를 통해 디스플레이 장치(100)로 전송한다.
구체적으로, 저장부(340)는 이전 발화 음성 정보에 포함된 비개체 실행 어휘를 저장하는 적어도 하나의 실행 명령 테이블을 저장한다. 이 같이, 저장부(340)에 저장되는 실행 명령 테이블은 실행 명령어별로 분류될 수 있다. 즉, 이전 발화 음성 정보에 포함된 비개체 실행 어휘는 기정의된 실행 명령어 중 적어도 하나의 실행 명령어에 태깅될 수 있으며, 해당 실행 명령어에 태깅된 비개체 실행 어휘는 그 실행 명령어로 분류되는 실행 명령 테이블에 저장될 수 있다.
예를 들어, "Search_Content", "Search_Channel", "Serch_Cast"와 같은 실행 명령어가 설정될 경우, 각각의 실행 명령어별로 분류된 실행 명령 테이블이 저장부(340)에 저장될 수 있다. 따라서, 이전 발화 음성 정보에 포함된 비개체 실행 어휘 중 적어도 하나의 비개체 실행 어휘가 기설정된 복수의 실행 명령어 중 적어도 하나의 실행 명령어에 태깅될 경우, 해당 실행 명령어에 태깅된 비개체 실행 어휘는 그 실행 명령어로 분류된 실행 명령 테이블에 저장될 수 있다. 예를 들어, "검색해줘"라는 비개체 실행 어휘가 "Search_Content" 및 "Serch_Cast"라는 실행 명령어에 각각 태깅될 경우, "검색해줘"라는 비개체 실행 어휘는 "Search_Content" 및 "Serch_Cast"라는 실행 명령어 각각에 분류된 실행 명령 테이블에 저장될 수 있다.
한편, 본 발명의 추가적인 양상에 따라, 이 같은 비개체 실행 어휘를 저장하는 실행 명령 테이블은 기저장된 비개체 실행 어휘별 발화 빈도 수에 기초하여 산출된 확률값에 따라 순차적으로 저장될 수 있다. 또한, 실행 명령 테이블은 확률값에 따라 순차적으로 저장된 비개체 실행 어휘 중 가장 높은 확률값을 가지는 비개체 실행 어휘를 대표 어휘로 설정할 수 있다. 그러나, 본 발명은 이에 한정되지 않으면, 실행 명령 테이블은 제조자 혹은 사용자로부터 설정된 비개체 실행 어휘를 대표 어휘로 설정할 수 있다.
이 같이, 대표 어휘가 설정된 실행 명령 테이블을 저장하는 저장부(340)는 해당 실행 명령 테이블에 저장된 비개체 실행 어휘를 포함하는 이전 발화 음성 정보로부터 추출된 비개체 대상 어휘와 관련하여 생성된 개체 구성 정보를 저장하는 개체 구성 테이블을 실행 명령 테이블과 매핑하여 저장할 수 있다. 여기서, 개체 구성 테이블은 개체 구성 정보별 생성 비율 및 빈도 수 중 적어도 하나에 기초하여 해당 개체 구성 테이블에 저장되는 개체 구성 정보를 순차적으로 저장할 수 있다.
이하에서는, 전술한 실행 명령 테이블 및 해당 실행 명령 테이블과 매핑된 개체 구성 테이블에 대해서 보다 구체적으로 설명하도록 한다.
도 4는 본 발명의 일 실시예에 따른 실행 명령 테이블 및 해당 실행 명령 테이블과 매핑된 개체 구성 테이블의 예시도이다.
도 4 (a)에 도시된 실행 명령 테이블은 "Search_Content"라는 실행 명령어로 분류된 실행 명령 테이블로써, "찾아줘", "검색해줘", "서치해줘", "있어", "없어"와 같은 비개체 실행 어휘가 저장될 수 있다. 그리고, 각각의 비개체 실행 어휘는 이전 발화 음성 정보가 발화된 발화 빈도 수에 기초하여 산출된 확률값이 매칭되어 저장될 수 있다. 도시된 바와 같이, "찾아줘"라는 비개체 실행 어휘는 0.98의 확률값이 산출되며, "검색해줘"라는 비개체 실행 어휘는 0.9의 확률값이 산출되며, "서치해줘"라는 비개체 실행 어휘는 0.8의 확률값이 산출될 수 있다. 또한, "있어"라는 비개체 실행 어휘는 0.77의 확률값이 산출될 수 있으며, "없어"라는 비개체 실행 어휘는 0.45의 확률값이 산출될 수 있다.
이 경우, "Search_Content"라는 실행 명령어로 분류된 실행 명령 테이블에 저장된 각각의 비개체 실행 어휘 중 "찾아줘"라는 비개체 실행 어휘를 포함하는 발화 음성이 사용자에 의해 가장 많이 발화된 것을 알 수 있으며, "없어"라는 비개체 실행 어휘를 포함하는 발화 음성이 사용자에 의해 가장 적게 발화된 것을 알 수 있다. 따라서, "Search_Content"라는 실행 명령어로 분류된 실행 명령 테이블은 "찾아줘"라는 비개체 실행 어휘가 대표 어휘로 설정될 수 있다.
한편, 도 4 (a')에 도시된 개체 구성 테이블은 "Search_Content"라는 실행 명령어로 분류된 실행 명령 테이블과 매핑된 테이블로써, 해당 실행 명령 테이블에 저장된 각각의 비개체 실행 어휘와 함께 이전 발화 음성 정보에 포함된 비개체 대상 어휘와 태깅된 실행어의 조합으로 생성된 개체 구성 정보를 저장한다. 또한, 개체 구성 테이블은 기저장된 개체 구성 정보별 생성 비율 및 빈도 수 중 적어도 하나에 기초하여 해당 개체 구성 테이블에 저장되는 개체 구성 정보를 순차적으로 저장할 수 있다.
예를 들어, "Search_Content"라는 실행 명령어로 분류된 실행 명령 테이블에 저장된 비개체 실행 어휘를 포함하는 이전 발화 음성 정보는 "오늘 하는 영화(드라마) 찾아줘", "○○○(영화명, 드라마명)에 나오는 배우 검색해줘", "○○○(영화명) 찾아줘"가 될 수 있다. 이 경우, 개체 구성 테이블은 이전 발화 음성 정보 각각에 포함된 비개체 대상 어휘로부터 생성된 "Genre+Date", "Genre+Cast", "Genre+Title" 등과 같은 개체 구성 정보를 저장할 수 있다. 한편, "Genre+Date"라는 개체 구성 정보는 0.8%, 120이라는 생성 비율 및 빈도 수가 산출되고, "Genre+Cast"라는 개체 구성 정보는 0.6%, 85라는 생성 비율 및 빈도 수가 산출되며, "Genre+Title"라는 개체 구성 정보는 0.4%, 50이라는 생성 비율 및 빈도 수가 산출될 수 있다. 이 경우, 개체 구성 테이블은 각각의 개체 구성 정보의 생성 비율 및 빈도 수 중 적어도 하나에 기초하여 "Genre+Date", "Genre+Cast", "Genre+Title" 순서대로 저장할 수 있다.
이와 같이, 저장부(340)는 각 실행 명령어별로 분류된 실행 명령 테이블 및 각 실행 명령 테이블과 매핑된 개체 구성 테이블을 저장할 수 있다. 이에 따라, 판단부(330)는 저장부(340)에 저장된 각 실행 명령어별 분류된 실행 명령 테이블을 참조하여 사용자의 발화 음성으로부터 추출된 실행 어휘와 관련된 비개체 실행 어휘가 저장되어 있는지 여부를 판단한다. 예를 들어, "오늘 하는 영화 검색해줘"라는 발화 음성의 경우, 판단부(330)는 "검색해줘"라는 실행 어휘과 관련된 비개체 실행 어휘가 "Search_Content"라는 실행 명령어로 분류된 실행 명령 테이블에 저장된 것으로 판단한다.
따라서, 제어부(350)는 "Search_Content"라는 실행 명령어로 분류된 실행 명령 테이블로부터 "찾아줘"라는 대표 어휘를 획득하고, 획득한 "찾아줘"라는 대표 어휘를 "검색해줘"라는 실행 어휘의 대체 어휘로 결정한다. 이후, 제어부(350)는 "찾아줘"라는 대표 어휘가 설정된 실행 명령 테이블의 실행 명령어와 "오늘", "영화"라는 대상 어휘와 태깅된 실행어에 기초하여 사용자의 발화 음성에 대응되는 응답 정보를 생성한다. 즉, 제어부(350)는 "찾아줘"라는 대표 어휘가 설정된 실행 명령 테이블의 실행 명령어인 "Search_Content"와 "오늘", "영화"라는 대상 어휘와 태깅된 "Genre", "Date"라는 실행어의 조합으로 "Search_Content(Date,Genre)"라는 실행 명령 스크립트를 생성하고, 그 생성된 실행 명령 스크립트에 기초하여 사용자의 발화 음성에 대한 응답 정보를 생성할 수 있다.
한편, 전술한 바와 같이, 사용자의 발화 음성으로부터 추출된 실행 어휘와 관련된 비개체 실행 어휘가 실행 명령 테이블에 저장되어 있는지 여부를 판단하는 판단부(330)는 해당 실행 어휘와 관련된 비개체 실행 어휘가 복수의 실행 명령 테이블에 저장된 것으로 판단할 수 있다. 이 경우, 제어부(350)는 복수의 실행 명령 테이블 각각에 저장된 비개체 실행 어휘 중 가장 높은 확률값을 가지는 비개체 실행 어휘가 저장된 실행 명령 테이블로부터 대표 어휘를 획득할 수 있다.
도 5는 본 발명의 일 실시예에 따른 발화 음성으로부터 추출된 실행 어휘와 관련된 비개체 실행 어휘가 복수의 실행 명령 테이블에 저장되는 예시도이다.
도 5 (a) 및 (b)에 도시된 바와 같이, 저장부(340)는 "Search_Content" 및 "Search_Cast"라는 실행 명령어로 분류된 실행 명령 테이블을 저장할 수 있다. 이 같은 "Search_Content" 및 "Search_Cast"라는 실행 명령어로 분류된 실행 명령 테이블은 "찾아줘", "검색해줘", "서치해줘", "있어", "없어"와 같은 비개체 실행 어휘를 저장할 수 있다. 한편, 판단부(330)는 사용자의 발화 음성으로부터 추출된 실행 어휘와 관련된 비개체 실행 언어가 "Search_Content" 및 "Search_Cast"라는 실행 명령어로 분류된 실행 명령 테이블 각각에 저장된 것으로 판단할 수 있다.
예를 들어, "오늘 하는 영화 찾아줘?"라는 발화 음성의 경우, "찾아줘"라는 실행 어휘와 관련된 비개체 실행 어휘는 "Search_Content" 및 "Search_Cast"라는 실행 명령어로 분류된 실행 명령 테이블에 각각 저장될 수 있다. 이와 같이, "찾아줘"라는 실행 어휘와 관련된 비개체 실행 어휘가 "Search_Content" 및 "Search_Cast"라는 실행 명령어로 분류된 실행 명령 테이블에 각각 저장된 경우, 판단부(330)는 사용자의 발화 음성으로부터 추출된 실행 어휘와 관련된 비개체 실행 언어가 "Search_Content" 및 "Search_Cast"라는 실행 명령어로 분류된 실행 명령 테이블에 각각 저장된 것으로 판단한다.
이와 같이, 복수의 실행 명령 테이블에 기추출된 실행 어휘와 관련된 비개체 실행 어휘가 저장된 것으로 판단되면, 제어부(350)는 각 실행 명령 테이블에 저장된 "찾아줘"라는 실행 어휘와 관련된 비개체 실행 어휘의 확률값을 비교한다. 도시된 바와 같이, "Search_Content"라는 실행 명령어로 분류된 실행 명령 테이블에 저장된 "찾아줘"라는 비개체 실행 어휘는 0.98의 확률값을 가지며, "Search_Cast"라는 실행 명령어로 분류된 실행 명령 테이블에 저장된 "찾아줘"라는 비개체 실행 어휘는 0.8의 확률값을 가질 수 있다. 이 경우, 제어부(350)는 "Search_Content"라는 실행 명령어로 분류된 실행 명령 테이블에 저장된 "찾아줘"라는 비개체 실행 어휘가 "Search_Cast"라는 실행 명령어로 분류된 실행 명령 테이블에 저장된 "찾아줘"라는 비개체 실행 어휘에 비해 높은 확률값을 가지는 것으로 판단한다. 따라서, 제어부(350)는 "Search_Content"라는 실행 명령어로 분류된 실행 명령 테이블에 설정된 대표 어휘를 사용자의 발화 음성으로부터 추출된 실행 어휘의 대체 어휘로 결정할 수 있다.
한편, 사용자의 발화 음성으로부터 추출된 실행 어휘와 관련된 비개체 실행 어휘가 복수의 실행 명령 테이블에 저장되며, 각각의 실행 명령 테이블에 저장된 비개체 실행 어휘의 확률값이 동일할 수 있다. 이 경우, 제어부(350)는 사용자의 발화 음성으로부터 추출된 대상 어휘와 관련된 개체 구성 정보를 생성한다. 이후, 제어부(350)는 기추출된 실행 어휘와 관련된 비개체 실행 어휘를 저장하는 실행 명령 테이블 각각에 매핑된 개체 구성 테이블을 참조하여 기생성된 개체 구성 정보에 대한 순위가 높은 개체 구성 테이블을 선택한다. 이후, 제어부(350)는 기선택한 개체 구성 테이블과 매핑된 실행 명령 테이블에 설정된 대표 어휘를 사용자의 발화 음성으로부터 추출된 실행 어휘의 대체 어휘로 결정할 수 있다.
도 6은 본 발명의 일 실시예에 따른 도 5의 복수의 실행 테이블과 각각의 실행 테이블에 매핑된 개체 구성 테이블을 나타내는 예시도이다.
도 6 (a) 및 (b)에 도시된 바와 같이, 저장부(340)는 "Search_Content" 및 "Search_Cast"라는 실행 명령어로 분류된 실행 명령 테이블을 저장할 수 있다. 이 같은 "Search_Content" 및 "Search_Cast"라는 실행 명령어로 분류된 실행 명령 테이블은 "찾아줘", "검색해줘", "서치해줘", "있어", "없어"와 같은 비개체 실행 어휘를 저장할 수 있다. 또한, 저장부(340)는 "Search_Content" 및 "Search_Cast"라는 실행 명령어로 분류된 실행 명령 테이블 각각에 매핑된 개체 구성 테이블을 저장할 수 있다. 구체적으로, 도 6 (a')에 도시된 개체 구성 테이블은 "Search_Content"라는 실행 명령어로 분류된 실행 명령 테이블과 매핑된 개체 구성 테이블로써, "Cernre+Date", "Genre+Cast", "Genre+Title"와 같은 개체 구성 정보를 저장할 수 있다. 그리고, 도 6 (b')에 도시된 개체 구성 테이블은 "Search_Cast"라는 실행 명령어로 분류된 실행 명령 테이블과 매핑된 개체 구성 테이블로써, "Genre+Pro(Program)", "Genre+Cast", "Genre+Ch(Channel)"과 같은 개체 구성 정보를 저장할 수 있다.
한편, 판단부(330)는 사용자의 발화 음성으로부터 추출된 실행 어휘와 관련된 비개체 실행 언어가 "Search_Content" 및 "Search_Cast"라는 실행 명령어로 분류된 실행 명령 테이블 각각에 저장된 것으로 판단할 수 있다. 예를 들어, "오늘 하는 영화 있어?"라는 발화 음성의 경우, 판단부(330)는 "있어?"라는 실행 어휘와 관련된 비개체 실행 어휘가 "Search_Content" 및 "Search_Cast"라는 실행 명령어로 분류된 실행 명령 테이블에 각각 저장된 것으로 판단될 수 있다.
이와 같이, "있어"라는 실행 어휘와 관련된 비개체 실행 어휘가 "Search_Content" 및 "Search_Cast"라는 실행 명령어로 분류된 실행 명령 테이블에 각각 저장된 것으로 판단되면, 제어부(350)는 각 실행 명령 테이블에 저장된 "있어?"라는 실행 어휘와 관련된 비개체 실행 어휘의 확률값을 비교한다. 도시된 바와 같이, "Search_Content" 및 "Search_Cast"라는 실행 명령어로 분류된 각각의 실행 명령 테이블에 저장된 "있어"라는 비개체 실행 어휘는 0.77의 확률값을 가질 수 있다. 이 경우, 제어부(350)는 "있어?"라는 실행 어휘와 관련된 비개체 실행 어휘의 확률값이 동일한 것으로 판단한다. 따라서, 제어부(350)는 사용자의 발화 음성으로부터 추출된 대상 어휘와 태깅된 실행어의 조합으로 개체 구성 정보를 생성한다. 전술한 예와 같이, "오늘 하는 영화 있어?"라는 발화 음성의 경우 "오늘", "영화"라는 대상 어휘가 추출될 수 있으며, 제어부(350)는 "오늘", "영화"라는 대상 어휘와 태깅된 "Genre", "Date"라는 실행어의 조합으로 "Genre+Date)"라는 개체 구성 정보를 생성할 수 있다. 이 같이, 개체 구성 정보가 생성되면, 제어부(350)는 "Search_Content" 및 "Search_Cast"라는 실행 명령어로 분류된 각각의 실행 명령 테이블과 매핑된 개체 구성 테이블을 참조하여 기생성된 개체 구성 정보가 저장되어 있는지 여부를 판단한다. 판단 결과, "Search_Content"라는 실행 명령어로 분류된 실행 명령 테이블과 매핑된 개체 구성 테이블에 기생성된 개체 구성 정보가 저장된 것으로 판단되면, 제어부(350)는 "Search_Content"라는 실행 명령어로 분류된 실행 명령 테이블에 설정된 "찾아줘"라는 대표 어휘를 "있어?"라는 실행 어휘의 대체 어휘로 결정할 수 있다.
만약, "Search_Content" 및 "Search_Cast"라는 실행 명령어로 분류된 각각의 실행 명령 테이블과 매핑된 개체 구성 테이블에 기생성된 개체 구성 정보가 모두 저장되어 있으면, 제어부(350)는 각 개체 구성 테이블별로 기생성된 개체 구성 정보와 관련하여 산출된 생성 비율 및 빈도 수 중 적어도 하나를 비교하여 기생성된 개체 구성 정보에 대한 생성 비율 혹은 빈도 수가 높은 순위에 해당하는 개체 구성 테이블을 선택할 수 있다.
한편, 사용자의 발화 음성으로부터 추출된 실행 어휘는 적어도 하나의 실행 명령 테이블에 저장되어 있지 않을 수 있다. 이 경우, 제어부(350)는 저장부(340)에 저장된 개체 구성 테이블 중 사용자의 발화 음성으로부터 추출된 대상 어휘와 관련하여 생성된 개체 구성 정보를 저장하는 개체 구성 테이블을 선택한다. 이후, 제어부(350)는 선택한 개체 구성 테이블과 매핑된 실행 명령 테이블에 설정된 대표 어휘를 기추출된 실행 어휘의 대체 어휘로 결정한다. 또한, 제어부(350)는 사용자의 발화 음성 정보로부터 추출된 실행 어휘를 해당 실행 명령 테이블에 저장한다.
예를 들어, "오늘 하는 영화 알아봐줘"라는 발화 음성이 입력될 수 있다. 이 경우, 판단부(330)는 저장부(340)에 저장된 실행 명령 테이블을 참조하여 사용자의 발화 음성으로부터 추출된 "알아봐줘"라는 실행 어휘와 관련된 비개체 실행 어휘가 "Search_Content"라는 실행 명령어로 분류된 실행 명령 테이블에 저장되어 있는지 여부를 판단한다. 판단 결과, "알아봐줘"라는 실행 어휘와 관련된 비개체 실행 어휘가 저장된 실행 명령 테이블이 저장되지 않은 것으로 판단되면, 제어부(350)는 "오늘 하는 영화 알아봐줘"라는 발화 음성으로부터 추출된 "오늘", "영화"라는 대상 어휘와 태깅된 "Genre", "Date"라는 실행어의 조합을 통해 "Genre+Date"라는 개체 구성 정보를 생성한다. 이후, 제어부(350)는 저장부(340)에 저장된 실행 명령 테이블별 매핑된 개체 구성 테이블을 참조하여 "Genre+Date"라는 개체 구성 정보를 저장하는 개체 구성 테이블이 있는지 여부를 판단한다. 판단 결과, 도 4와 같이, "Search_Content"라는 실행 명령어로 분류된 실행 명령 테이블과 매핑된 개체 구성 테이블에 "Genre+Date"라는 개체 구성 정보가 저장된 것으로 판단되면, 제어부(350)는 "Search_Content"라는 실행 명령어로 분류된 실행 명령 테이블에 설정된 대표 어휘를 획득하고, 그 획득한 대표 어휘를 "알아봐줘"라는 실행 어휘의 대체 어휘로 결정한다. 이와 함께, 제어부(350)는 "알아봐줘"라는 실행 어휘를 "Search_Content"라는 실행 명령어로 분류된 실행 명령 테이블에 저장한다. 이후, 제어부(350)는 기설정된 조건에 따라 실행 명령 테이블에 저장된 실행 어휘의 발화 빈도 수를 측정하여, 그 실행 어휘를 해당 실행 명령 테이블의 비개체 실행 어휘로 결정할지 여부를 결정할 수 있다. 뿐만 아니라, 제어부(350)는 각 실행 명령 테이블별 저장된 비개체 실행 어휘의 발화 빈도 수에 기초하여 주기적으로 확률값을 재산출할 수 있다. 따라서, 각 실행 명령 테이블에 저장된 비개체 실행 어휘는 재산출된 확률값에 기초하여 재정렬되며, 또한, 재정렬된 순서에 따라, 각 실행 명령 테이블의 대표 어휘가 변경될 수 있다.
지금까지, 본 발명에 따른 대화형 서버의 각 구성에 대해서 상세히 설명하였다. 이하에서는, 본 발명에 따른 디스플레이 장치 및 대화형 서버의 제어 방법에대해서 보다 구체적으로 설명하도록 한다.
도 7은 본 발명의 일 실시예에 따른 디스플레이 장치의 제어 방법에 대한 흐름도이다.
도 7에 도시된 바와 같이, 디스플레이 장치는 사용자로부터 음성 인식 모드를 개시하기 위한 사용자 명령이 입력되면, 입력된 사용자 명령에 따라 사용자의 음성을 인식할 수 있는 음성 인식 모드로 진입한다. 이 같은 음성 인식 모드로 진입한 상태에서, 디스플레이 장치는 사용자의 발화 음성이 입력되면, 입력된 발화 음성을 수집한다(S710). 사용자의 발화 음성이 수집되면, 디스플레이 장치는 수집된 발화 음성을 디지털 신호로 변환하여 텍스트 서버로 전송한다(S720). 이에 따라, 텍스트 서버는 디스플레이 장치로부터 수신된 발화 음성을 텍스트 정보로 변환하고, 텍스트 정보로 변환된 발화 음성을 디스플레이 장치로 전송한다. 텍스트 서버로부터 텍스트 정보로 변환된 발화 음성이 수신되면, 디스플레이 장치는 텍스트 정보로 변환된 발화 음성을 대화형 서버로 전송한다(S730).
이에 따라, 대화형 서버는 텍스트 정보로 변환된 발화 음성을 분석하여 실행 명령을 나타내는 실행 어휘 및 대상을 나타내는 대상 어휘 중 적어도 하나를 추출한다. 이후, 대화형 서버는 추출된 어휘 중 실행 명령을 나타내는 실행 어휘와 관련된 비개체 실행 어휘가 적어도 하나의 실행 명령 테이블에 저장되어 있는지 여부를 판단한다. 판단 결과, 실행 명령을 나타내는 실행 어휘와 관련된 비개체 실행 어휘가 저장되어 있으면, 대화형 서버는 해당 비개체 실행 어휘가 저장된 실행 명령 테이블에 설정된 대표 어휘를 실행 어휘의 대체 어휘로 결정한다. 이후, 대화형 서버는 대체 어휘로 결정된 대표 어휘에 태깅된 실행 명령어와 발화 음성으로부터 추출된 대상 어휘에 태깅된 실행어에 기초하여 사용자의 발화 음성에 대응되는 응답 정보를 생성하고, 생성된 응답 정보를 디스플레이 장치로 전송한다.
대화형 서버로부터 응답 정보가 수신되면, 디스플레이 장치는 수신된 응답 정보에 기초하여 응답 메시지를 생성하고, 생성된 응답 메시지를 출력한다(S740,S750). 실시예에 따라, 디스플레이 장치는 대화형 서버로부터 수신된 응답 정보에 기초하여 생성된 응답 메시지를 음성 또는 텍스트 형태의 영상으로 출력할 수 있다.
지금까지, 본 발명에 따른 디스플레이 장치의 제어 방법에 대해서 상세히 설명하였다. 이하에서는, 본 발명에 따른 대화형 서버의 제어 방법에 대해서 상세히 설명하도록 한다.
도 8은 본 발명의 일 실시예에 따른 대화형 서버의 제어 방법에 대한 흐름도이다.
도 8에 도시된 바와 같이, 대화형 서버는 디스플레이 장치로부터 사용자의 발화 음성을 수신한다(S810). 여기서, 사용자의 발화 음성은 텍스트 정보로 변환된 음성 정보가 될 수 있다. 그러나, 본 발명은 이에 한정되지 않으면, 사용자의 발화 음성은 디지털 신호로 변환된 음성 신호가 될 수 있다. 이 경우, 대화형 서버는 사용자의 발화 음성을 텍스트 정보로 변환할 수 있다. 본 발명에서는, 대화형 서버가 디스플레이 장치로부터 텍스트 정보로 변환된 발화 음성을 수신하는 것에 한정하여 설명하도록 한다.
이 같은 텍스트 정보로 변환된 발화 음성이 수신되면, 대화형 서버는 텍스트 정보로 변환된 발화 음성으로부터 형태소 단위의 어휘를 추출한다(S820). 여기서, 형태소 단위의 어휘는 실행 명령을 나타내는 실행 어휘 및 대상을 나타내는 대상 어휘 중 적어도 하나를 포함할 수 있다. 이 같이, 사용자의 발화 음성으로부터 실행 명령을 나타내는 실행 어휘와 대상을 나타내는 대상 어휘 중 적어도 하나의 어휘가 추출되면, 대화형 서버는 이전 발화 음성 정보에 포함된 비개체 실행 어휘가 저장된 적어도 하나의 실행 명려 테이블을 참조하여 추출된 실행 명령을 나타내는 실행 어휘와 관련된 비개체 실행 어휘가 저장되어 있는지 여부를 판단한다. 판단 결과, 적어도 하나의 실행 명령 테이블에 사용자의 발화 음성으로부터 추출된 실해 어휘와 관련된 비개체 실행 어휘가 저장되어 있으면, 대화형 서버는 해당 실행 명령 테이블에 설정된 대표 어휘를 추출된 실행 어휘의 대체 어휘로 결정한다. 이후, 대화형 서버는 대체 어휘로 결정된 대표 어휘와 사용자의 발화 음성으로부터 추출된 대상 어휘에 기초하여 응답 정보를 생성하고, 이를 디스플레이 장치로 전송한다(S830,S840).
여기서, 이전 발화 음성 정보에 포함된 비개체 실행 어휘를 저장하는 실행 명령 테이블은 실행 명령어별로 분류되어 저장될 수 있다. 즉, 이전 발화 음성 정보에 포함된 비개체 실행 어휘는 기정의된 실행 명령어 중 적어도 하나의 실행 명령어에 태깅될 수 있으며, 해당 실행 명령어에 태깅된 비개체 실행 어휘는 그 실행 명령어로 분류되는 실행 명령 테이블에 저장될 수 있다. 예를 들어, "Search_Content", "Search_Channel", "Serch_Cast"와 같은 실행 명령어가 설정될 경우, 각각의 실행 명령어별로 분류된 실행 명령 테이블이 저장될 수 있다. 따라서, 이전 발화 음성 정보에 포함된 비개체 실행 어휘 중 적어도 하나의 비개체 실행 어휘가 기설정된 복수의 실행 명령어 중 적어도 하나의 실행 명령어에 태깅될 경우, 해당 실행 명령어에 태깅된 비개체 실행 어휘는 그 실행 명령어로 분류된 실행 명령 테이블에 저장될 수 있다.
예를 들어, "검색해줘"라는 비개체 실행 어휘가 "Search_Content" 및 "Serch_Cast"라는 실행 명령어에 각각 태깅될 경우, "검색해줘"라는 비개체 실행 어휘는 "Search_Content" 및 "Serch_Cast"라는 실행 명령어 각각에 분류된 실행 명령 테이블에 저장될 수 있다.
한편, 본 발명의 추가적인 양상에 따라, 이 같은 비개체 실행 어휘를 저장하는 실행 명령 테이블은 기저장된 비개체 실행 어휘별 발화 빈도 수에 기초하여 산출된 확률값에 따라 순차적으로 저장될 수 있다. 또한, 실행 명령 테이블은 확률값에 따라 순차적으로 저장된 비개체 실행 어휘 중 가장 높은 확률값을 가지는 비개체 실행 어휘를 대표 어휘로 설정할 수 있다. 그러나, 본 발명은 이에 한정되지 않으면, 실행 명령 테이블은 제조자 혹은 사용자로부터 설정된 비개체 실행 어휘를 대표 어휘로 설정할 수 있다.
따라서, 대화형 서버는 사용자의 발화 음성으로부터 추출된 실행 어휘와 관련된 비개체 실행 어휘를 저장한 실행 명령 테이블에 설정된 대표 어휘를 실행 어휘의 대체 어휘로 결정할 수 있다. 이후, 대화형 서버는 해당 대표 어휘가 설정된 실행 명령 테이블의 실행 명령어와 사용자의 발화 음성으로부터 추출된 대상 어휘와 태깅된 실행어에 기초하여 사용자의 발화 음성에 대응되는 응답 정보를 생성할 수 있다.
이하에서는 대화형 서버에서 사용자의 발화 음성에 대응되는 응답 정보를 생성하는 방법에 대해서 보다 구체적으로 설명하도록 한다.
도 9는 본 발명의 일 실시예에 따른 대화형 서버에서 응답 정보를 생성하는 방법의 흐름도이다.
도 9에 도시된 바와 같이, 사용자의 발화 음성으로부터 실행 명령을 나타내는 실행 어휘 및 대상을 나타내는 대상 어휘 중 적어도 하나가 추출되면, 대화형 서버는 추출된 실행 어휘와 관련된 비개체 실행 어휘가 존재하는지 여부를 판단한다(S910). 판단 결과, 추출된 실행 어휘와 관련된 비개체 실행 어휘가 존재하면, 대화형 서버는 해당 비개체 실행 어휘가 복수의 실행 명령 테이블에 저장되는지 여부를 판단한다(S920). 판단 결과, 추출된 실행 어휘와 관련된 비개체 실행 어휘가 단일의 실행 명령 테이블에 저장된 것으로 판단되면, 대화형 서버는 후술할 단계 S950,S960을 통해, 해상 비개체 실행 어휘가 저장된 실행 명령 테이블로부터 대표 어휘를 획득한다. 이후, 대화형 서버는 해당 대표 어휘가 설정된 실행 명령 테이블의 실행 명령어와 사용자의 발화 음성으로부터 추출된 대상 어휘와 태깅된 실행어에 기초하여 사용자의 발화 음성에 대응되는 응답 정보를 생성한다.
한편, 추출된 실행 어휘와 관련된 비개체 실행 어휘가 복수의 실행 명령 테이블에 저장된 것으로 판단되면, 대화형 서버는 복수의 실행 명령 테이블에 저장된 비개체 실행 어휘의 확률값을 비교하여 두 확률값이 동일한지 여부를 판단한다(S930). 판단 결과, 복수의 실행 명령 테이블에 저장된 비개체 실행 어휘의 확률값이 서로 상이하면, 대화형 서버는 복수의 실행 명령 테이블에 저장된 비개체 실행 어휘 중 가장 높은 확률값을 가지는 비개체 실행 어휘가 저장된 실행 명령 테이블을 결정하고, 그 결정된 실행 명령 테이블에 설정된 대표 어휘를 획득한다(S940,S950). 이후, 대화형 서버는 해당 대표 어휘가 설정된 실행 명령 테이블의 실행 명령어와 사용자의 발화 음성으로부터 추출된 대상 어휘와 태깅된 실행어에 기초하여 사용자의 발화 음성에 대응되는 응답 정보를 생성한다(S960).
한편, 단계 S930에서 복수의 실행 명령 테이블에 저장된 비개체 실행 어휘의 확률값이 서로 동일하면, 대화형 서버는 사용자의 발화 음성으로부터 추출된 대상 어휘오 관련된 개체 구성 정보를 생성한다(S970). 이후, 대화형 서버는 기추출된 실행 어휘와 관련된 비개체 실행 어휘를 저장하는 실행 명령 테이블 각각에 매핑된 개체 구성 테이블을 참조하여 기생성된 개체 구성 정보에 대한 순위가 높은 개체 구성 테이블을 선택한다. 이후, 대화형 서버는 기선택된 개체 구성 테이블고 매핑된 실행 명령 테이블에 설정된 대표 어휘를 획득한다(S980). 따라서, 대화형 서버는 그 획득한 대표 어휘를 사용자의 발화 음성으로부터 추출된 실행 어휘의 대체 어휘로 결정할 수 있다. 이후, 대화형 서버는 전술한 단계 S960을 통해 해당 대표 어휘가 설정된 실행 명령 테이블의 실행 명령어와 사용자의 발화 음성으로부터 추출된 대상 어휘와 태깅된 실행어에 기초하여 사용자의 발화 음성에 대응되는 응답 정보를 생성한다
한편, 전술한 개체 구성 테이블은 실행 명령어별로 분류된 각각의 실행 명령 테이블과 매핑되어 저장될 수 있다. 이 같은 개체 구성 테이블은 개체 구성 정보를 저장한다. 여기서, 개체 구성 정보는 개체 구성 테이블과 매핑된 실행 명령 테이블에 저장된 비개체 대상 어휘를 포함하는 이전 발화 음성 정보로부터 추출된 비개체 대상 어휘와 관련하여 생성된 정보이다. 이 같은 개체 구성 정보를 저장하는 개체 구성 테이블은 개체 구성 정보별 생성 비율 및 빈도 수 중 적어도 하나에 기초하여 개체 구성 테이블에 저장되는 개체 구성 정보를 순차적으로 저장할 수 있다.
따라서, 대화형 서버는 동일한 확률값을 가지는 비개체 실행 어휘를 저장하는 각각의 실행 명령 테이블과 매핑된 개체 구성 테이블을 참조하여 각 개체 구성 테이블별로 기생성된 개체 구성 정보와 관련하여 산출된 생성 비율 및 빈도 수 중 적어도 하나를 비교한다. 이에 따라, 대화형 서버는 기생성된 개체 구성 정보에 대한 생성 비율 혹은 빈도 수가 높은 순위에 해당하는 개체 구성 테이블을 선택할 수 있다. 이 같이, 개체 구성 테이블이 선택되면, 대화형 서버는 그 선택된 개체 구성 테이블과 매핑된 실행 명령 테이블에 설정된 대표 어휘를 사용자의 발화 음성으로부터 추출된 실행 어휘의 대체 어휘로 결정할 수 있다.
한편, 단계 S910을 통해 사용자의 발화 음성으로부터 추출된 실행 어휘가 적어도 하나의 실행 명령 테이블에 저장되지 않은 것으로 판단되면, 대화형 서버는 기저장된 개체 구성 테이블 중 사용자의 발화 음성으로부터 추출된 대상 어휘와 관련하여 생성된 개체 구성 정보를 저장하는 개체 구성 테이블을 선택한다. 이후, 대화형 서버는 선택한 개체 구성 테이블과 매핑된 실행 명령 테이블에 설정된 대표 어휘를 기추출된 실행 어휘의 대체 어휘로 결정하고, 그 대표 어휘가 속하는 실행 명령 테이블에 사용자의 발화 음성으로부터 추출된 실행 어휘를 해당 실행 명령 테이블에 저장한다.
이제까지 본 발명에 대하여 그 바람직한 실시예들을 중심으로 살펴보았다.
이상에서는 본 발명의 바람직한 실시예에 대하여 도시하고 설명하였지만, 본 발명은 상술한 특정의 실시예에 한정되지 아니하며, 청구범위에서 청구하는 본 발명의 요지를 벗어남이 없이 당해 발명이 속하는 기술분야에서 통상의 지식을 가진 자에 의해 다양한 변형실시가 가능한 것은 물론이고, 이러한 변형실시들은 본 발명의 기술적 사상이나 전망으로부터 개별적으로 이해되어져서는 안될 것이다.
100 : 디스플레이 장치 110,310 : 통신부
120 : 음성 수집부 130,350 : 제어부
140 : 출력부 141 : 디스플레이부
143 : 오디오 출력부 150,340 : 저장부
200 : 텍스트 서버 300 : 대화형 서버
320 : 추출부 330 : 판단부

Claims (12)

  1. 디스플레이 장치와 통신을 수행하는 통신부;
    상기 디스플레이 장치로부터 수신된 발화 음성으로부터 실행 명령을 나타내는 실행 어휘 및 대상을 나타내는 대상 어휘 중 적어도 하나를 추출하는 추출부;
    이전 발화 음성 정보에 포함된 비개체 실행 어휘가 저장된 적어도 하나의 실행 명령 테이블을 저장하는 저장부;
    상기 추출된 실행 명령을 나타내는 실행 어휘와 관련된 비개체 실행 어휘가 상기 적어도 하나의 실행 명령 테이블에 저장되어 있는지 여부를 판단하는 판단부;
    상기 적어도 하나의 실행 명령 테이블에 저장되어 있으면, 실행 명령 테이블에 설정된 대표 어휘를 상기 실행 어휘로 결정하고, 상기 대표 어휘 및 상기 추출된 대상 어휘에 기초하여 상기 발화 음성에 대응되는 응답 정보를 생성하여 상기 디스플레이 장치로 전송하는 제어부;
    를 포함하는 대화형 서버.
  2. 제 1 항에 있어서,
    상기 실행 명령 테이블은,
    상기 실행 명령 테이블에 저장되는 비개체 실행 어휘별 발화 빈도 수에 기초하여 산출된 확률값에 따라 순차적으로 저장하며,
    상기 비개체 실행 어휘 중 가장 높은 확률값을 가지는 비개체 실행 어휘를 상기 실행 명령 테이블의 대표 어휘로 설정하는 것을 특징으로 하는 대화형 서버.
  3. 제 2 항에 있어서,
    상기 제어부는,
    상기 추출된 실행 어휘와 관련된 비개체 실행 어휘가 복수의 실행 명령 테이블에 저장되어 있으면, 상기 복수의 실행 명령 테이블 각각에 저장된 비개체 실행 어휘 중 가장 높은 확률값을 가지는 비개체 실행 어휘가 저장된 실행 명령 테이블로부터 대표 어휘를 획득하는 것을 특징으로 대화형 서버.
  4. 제 3 항에 있어서,
    상기 저장부는,
    상기 실행 명령 테이블에 저장된 비개체 실행 어휘를 포함하는 이전 발화 음성 정보로부터 추출된 비개체 대상 어휘와 관련하여 생성된 개체 구성 정보를 저장하는 개체 구성 테이블을 상기 실행 명령 테이블과 매핑하여 더 저장하며,
    상기 개체 구성 테이블은,
    개체 구성 정보별 생성 비율 및 빈도 수 중 적어도 하나에 기초하여 상기 개체 구성 테이블에 저장되는 개체 구성 정보를 순차적으로 저장하는 것을 특징으로 하는 대화형 서버.
  5. 제 4 항에 있어서,
    상기 제어부는,
    상기 복수의 실행 명령 테이블 각각에 저장된 비개체 실행 어휘의 확률값이 동일하면, 상기 추출된 대상 어휘와 관련된 개체 구성 정보를 생성하고, 상기 복수의 실행 명령 테이블 각각에 매핑된 개체 구성 테이블을 참조하여 상기 생성된 개체 구성 정보에 대한 순위가 가장 높은 개체 구성 테이블과 매핑된 실행 명령 테이블로부터 대표 어휘를 획득하는 것을 특징으로 하는 대화형 서버.
  6. 제 4 항에 있어서,
    상기 제어부는,
    상기 추출된 실행 어휘가 상기 적어도 하나의 실행 명령 테이블에 저장되어 있지 않으면, 상기 추출된 대상 어휘와 관련하여 생성된 개체 구성 정보가 저장된 개체 구성 테이블과 매핑된 실행 명령 테이블에 상기 실행 어휘 저장 및 상기 실행 명령 테이블로부터 대표 어휘를 획득하는 것을 특징으로 하는 대화형 서버.
  7. 대화형 서버의 제어 방법에 있어서,
    디스플레이 장치로부터 발화 음성을 수신하는 단계;
    상기 수신된 발화 음성으로부터 실행 명령을 나타내는 실행 어휘 및 대상을 나타내는 대상 어휘 중 적어도 하나를 추출하는 단계;
    이전 발화 음성 정보에 포함된 비개체 실행 어휘가 저장된 적어도 하나의 실행 명령 테이블을 참조하여 상기 추출된 실행 어휘와 관련된 비개체 실행 어휘가 저장되어 있는지 여부를 판단하는 단계;
    상기 적어도 하나의 실행 명령 테이블에 저장되어 있으면, 상기 실행 명령 테이블에 설정된 대표 어휘를 상기 실행 어휘로 결정하고, 상기 대표 어휘 및 상기 추출된 대상 어휘에 기초하여 상기 발화 음성에 대응하는 응답 정보를 생성하는 단계; 및
    상기 생성된 응답 정보를 상기 디스플레이 장치로 전송하는 단계;
    를 포함하는 제어 방법.
  8. 제 7 항에 있어서,
    상기 실행 명령 테이블은,
    상기 실행 명령 테이블에 저장되는 비개체 실행 어휘별 발화 빈도 수에 기초하여 산출된 확률값에 따라 순차적으로 저장하며,
    상기 비개체 실행 어휘 중 가장 높은 확률값을 가지는 비개체 실행 어휘를 상기 실행 명령 테이블의 대표 어휘로 설정하는 것을 특징으로 하는 제어 방법.
  9. 제 8 항에 있어서,
    상기 응답 정보를 생성하는 단계는,
    상기 추출된 실행 어휘와 관련된 비개체 실행 어휘가 복수의 실행 명령 테이블에 저장되어 있는지 여부를 판단하는 단계; 및
    상기 복수의 실행 명령 테이블에 저장되어 있으면, 상기 복수의 실행 명령 테이블 각각에 저장된 비개체 실행 어휘 중 가장 높은 확률값을 가지는 비개체 실행 어휘가 저장된 실행 명령 테이블로부터 대표 어휘를 획득하는 단계;
    를 포함하는 것을 특징으로 하는 제어 방법.
  10. 제 9 항에 있어서,
    상기 실행 명령 테이블에 저장된 비개체 실행 어휘를 포함하는 이전 발화 음성 정보로부터 추출된 비개체 대상 어휘와 관련하여 생성된 개체 구성 정보를 저장하는 개체 구성 테이블이 상기 실행 명령 테이블과 매핑되어 저장되며,
    상기 개체 구성 테이블은,
    개체 구성 정보별 생성 비율 및 빈도 수 중 적어도 하나에 기초하여 상기 개체 구성 테이블에 저장되는 개체 구성 정보를 순차적으로 저장하는 것을 특징으로 하는 제어 방법.
  11. 제 10 항에 있어서,
    상기 대표 어휘를 획득하는 단계,
    상기 복수의 실행 명령 테이블 각각에 저장된 비개체 실행 어휘의 확률값이 동일하면, 상기 추출된 대상 어휘와 관련된 개체 구성 정보를 생성하고, 상기 복수의 실행 명령 테이블 각각에 매핑된 개체 구성 테이블을 참조하여 상기 생성된 개체 구성 정보에 대한 순위가 가장 높은 개체 구성 테이블과 매핑된 실행 명령 테이블로부터 대표 어휘를 획득하는 것을 특징으로 하는 제어 방법.
  12. 제 10 항에 있어서,
    상기 대표 어휘를 획득하는 단계는,
    상기 추출된 실행 어휘가 상기 적어도 하나의 실행 명령 테이블에 저장되어 있지 않으면, 상기 추출된 대상 어휘와 관련하여 생성된 개체 구성 정보가 저장된 개체 구성 테이블과 매핑된 실행 명령 테이블에 상기 추출된 실행 어휘를 저장하고, 상기 실행 명령 테이블로부터 대표 어휘를 획득하는 것을 특징으로 하는 대화형 서버.
KR1020130031052A 2013-03-22 2013-03-22 대화형 서버, 디스플레이 장치 및 제어 방법 KR20140115844A (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020130031052A KR20140115844A (ko) 2013-03-22 2013-03-22 대화형 서버, 디스플레이 장치 및 제어 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020130031052A KR20140115844A (ko) 2013-03-22 2013-03-22 대화형 서버, 디스플레이 장치 및 제어 방법

Publications (1)

Publication Number Publication Date
KR20140115844A true KR20140115844A (ko) 2014-10-01

Family

ID=51990076

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020130031052A KR20140115844A (ko) 2013-03-22 2013-03-22 대화형 서버, 디스플레이 장치 및 제어 방법

Country Status (1)

Country Link
KR (1) KR20140115844A (ko)

Similar Documents

Publication Publication Date Title
JP6802305B2 (ja) 対話型サーバ、ディスプレイ装置及びその制御方法
US11854570B2 (en) Electronic device providing response to voice input, and method and computer readable medium thereof
KR102211595B1 (ko) 음성 인식 장치 및 그 제어 방법
KR101456974B1 (ko) 사용자 단말기, 음성인식 서버 및 음성인식 가이드 방법
EP3039531B1 (en) Display apparatus and controlling method thereof
EP2941895B1 (en) Display apparatus and method of controlling a display apparatus in a voice recognition system
KR102084739B1 (ko) 대화형 서버, 디스플레이 장치 및 제어 방법
EP2685453A1 (en) Method for correcting voice recognition error and broadcast receiving apparatus applying the same.
JP2014002383A (ja) 端末装置及び端末装置の制御方法
JP2014089437A (ja) 音声認識装置及び音声認識方法
KR20150089145A (ko) 음성 제어를 수행하는 디스플레이 장치 및 그 음성 제어 방법
KR20160025301A (ko) 음성 인식이 가능한 디스플레이 장치 및 방법
US20130041666A1 (en) Voice recognition apparatus, voice recognition server, voice recognition system and voice recognition method
JP2014093778A (ja) 放送受信装置、サーバおよびその制御方法
US20140019141A1 (en) Method for providing contents information and broadcast receiving apparatus
KR20150100322A (ko) 서버 및 이의 가이드 문장 생성 방법
KR20140115844A (ko) 대화형 서버, 디스플레이 장치 및 제어 방법
KR101660269B1 (ko) 대화형 서버, 그 제어 방법 및 대화형 시스템
KR102049833B1 (ko) 대화형 서버, 디스플레이 장치 및 그 제어 방법
KR20140137263A (ko) 대화형 서버, 디스플레이 장치 및 제어 방법
KR20140026220A (ko) 단말 장치 및 단말 장치의 제어 방법

Legal Events

Date Code Title Description
WITN Withdrawal due to no request for examination