KR20060070605A - 영역별 언어모델과 대화모델을 이용한 지능형 로봇 음성인식 서비스 장치 및 방법 - Google Patents

영역별 언어모델과 대화모델을 이용한 지능형 로봇 음성인식 서비스 장치 및 방법 Download PDF

Info

Publication number
KR20060070605A
KR20060070605A KR1020040109128A KR20040109128A KR20060070605A KR 20060070605 A KR20060070605 A KR 20060070605A KR 1020040109128 A KR1020040109128 A KR 1020040109128A KR 20040109128 A KR20040109128 A KR 20040109128A KR 20060070605 A KR20060070605 A KR 20060070605A
Authority
KR
South Korea
Prior art keywords
model
conversation
area
user
region
Prior art date
Application number
KR1020040109128A
Other languages
English (en)
Inventor
김현숙
김정세
Original Assignee
한국전자통신연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국전자통신연구원 filed Critical 한국전자통신연구원
Priority to KR1020040109128A priority Critical patent/KR20060070605A/ko
Publication of KR20060070605A publication Critical patent/KR20060070605A/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • G10L15/183Speech classification or search using natural language modelling using context dependencies, e.g. language models

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Manipulator (AREA)
  • Machine Translation (AREA)

Abstract

본 발명은 영역별 언어모델과 대화모델을 이용한 지능형 로봇 음성 인식 서비스 장치 및 방법에 관한 것으로, 특히 사용자의 음성 질의에 대해 음성 인식을 수행하는 음성 인식부(100); 사용자의 음성 질의에 대응되는 대화 모델을 이용하여 응답 문장을 생성하는 대화 처리부(200); 상기 응답 문장을 음성으로 변환하여 사용자에게 출력하는 음성 합성부(300); 및 대화 처리부(200)로부터 응답 문장을 입력받아 사용자에게 디스플레이시키는 디스플레이부(400)로 구성된 것을 특징으로 하며, 이러한 본 발명은 사용자 질의에 대한 음성 인식의 성능을 높여주고, 사용자의 다음 질문이나 답변을 예측할 수 있으므로, 보다 향상된 지능형 로봇 음성인식 서비스를 사용자에게 공급할 수 있는 효과가 있다.
지능형 로봇, 음성인식 서비스, 영역별 언어모델, 대화모델,

Description

영역별 언어모델과 대화모델을 이용한 지능형 로봇 음성 인식 서비스 장치 및 방법{USING DOMAIN DIALOGUE MODEL AND LANGUAGE MODEL IN INTELLIGENT ROBOT SPEECH RECOGNITION SERVICE DEVICE AND METHOD}
도 1은 본 발명의 일 실시예에 따른 영역별 언어모델과 대화모델을 이용한 지능형 로봇 음성 인식 서비스 장치의 구성을 나타낸 기능 블록도,
도 2는 도 1에 따른 영역별 언어모델과 대화모델을 이용한 지능형 로봇 음성 인식 서비스 장치에서 음성 인식부의 내부 구성을 나타낸 기능 블록도,
도 3은 도 1에 따른 영역별 언어모델과 대화모델을 이용한 지능형 로봇 음성 인식 서비스 장치에서 대화 처리부의 내부 구성을 나타낸 기능 블록도,
도 4는 도 1에 따른 영역별 언어모델과 대화모델을 이용한 지능형 로봇 음성 인식 서비스 장치에서 대화영역 이력정보 테이블의 모습을 보여주는 도면,
도 5는 본 발명의 일 실시예에 따른 영역별 언어모델과 대화모델을 이용한 지능형 로봇 음성 인식 서비스 방법을 나타낸 동작 플로우챠트,
도 6은 본 발명을 설명하기 위한 지능형 로봇과 사용자와의 대화 내용을 보여주는 예시도이다.
<도면의 주요 부분에 대한 부호의 설명>
100 : 음성 인식부 110 : 특징 추출부
120 : 탐색부 130 : 후처리부
200 : 대화 처리부 210 : 대화영역 구별부
220 : 대화모델 선택부 230 : 응답 처리부
300 : 음성 합성부 400 : 디스플레이부
본 발명은 영역별 언어모델과 대화모델을 이용한 지능형 로봇 음성 인식 서비스 장치 및 방법에 관한 것으로, 더욱 상세하게는 로봇과의 자연스러운 대화를 진행하기 위해, 사용자의 질의가 어느 영역에 속하는지 구별한 후 사용자의 다음 질문을 예측하여 특정 영역의 언어 모델을 사용하고, 사용자 질의에 대한 응답 처리를 위해 특정 영역의 대화 모델을 선정하여 질의에 대한 대답을 생성한 후 사용자에게 대화에 대한 응답을 출력해 줌으로써 음성 인식의 성능을 향상시켜 주는 영역별 언어모델과 대화모델을 이용한 지능형 로봇 음성 인식 서비스 장치 및 방법에 관한 것이다.
주지하다시피, 지능형 로봇과의 자연스러운 의사 소통을 위해서는 사용자의 음성 질의를 로봇이 듣고 이해하여 사용자가 원하는 대답을 음성 또는 디스플레이 화면을 통해 제공할 수 있어야 한다. 이를 위해서는 음성 질의 문장을 인식할 수 있는 음성 인식 기능, 대화 처리를 통해 사용자의 질의에 대한 적절한 응답을 생성하는 기능, 음성 합성을 통해 음성을 결과로 출력하는 기능, 검색된 정보에 대한 디스플레이 기능 등이 필요하다.
따라서, 현재 지능형 로봇 음성 인식 서비스 기술의 연구는 로봇의 음성 인식 성능을 향상하고자 하는 연구에 초점이 맞춰져 있다. 그러므로, 음성 인식 성능의 향상을 위해서는 로봇이 사용자의 질의에 대해 키워드를 인식하고 키워드에 대한 적절한 응답을 제공하면, 음성 인식 성능이 높지 않더라도 대화를 진행하는 사용자가 불편하지 않게 되므로, 음성 인식의 성능 향상에 대한 노력 뿐만 아니라 대화의 자연스러움을 위한 대화 처리에 대한 연구도 병행될 필요가 있다.
하지만, 종래에 개발된 지능형 로봇 음성 인식 서비스 기술로는 사용자의 음성 질의에 대한 로봇의 인식 성능이 높지 않기 때문에 로봇과의 자연스러운 대화의 진행이 어렵고, 이로 인해 지능형 로봇의 품질이 떨어져 사용자에게 질 높은 지능형 로봇의 서비스를 제공할 수 없는 문제점이 있었다.
따라서, 본 발명은 상기와 같은 종래의 문제점을 해결하기 위해 이루어진 것으로서, 본 발명의 목적은 로봇과의 자연스러운 대화를 진행하기 위해, 사용자의 질의가 어느 영역에 속하는지 구별한 후 사용자의 다음 질문을 예측하여 특정 영역의 언어 모델을 사용하고, 사용자 질의에 대한 응답 처리를 위해 특정 영역의 대화 모델을 선정하여 질의에 대한 대답을 생성한 후 사용자에게 대화에 대한 응답을 출력해 줌으로써 음성 인식의 성능을 향상시키기 위한 영역별 언어모델과 대화모델을 이용한 지능형 로봇 음성 인식 서비스 장치 및 방법을 제공하는 데 있다.
상기와 같은 목적을 달성하기 위하여 본 발명 영역별 언어모델과 대화모델을 이용한 지능형 로봇 음성 인식 서비스 장치는, 사용자로부터 음성 질의가 입력되면, 언어모델과 대화모델을 이용한 음성 인식 기능을 수행하여 음성 인식 결과 문장을 출력하는 음성 인식부;
상기 음성 인식부로부터 음성 인식 결과 문장을 입력받으면, 사용자의 음성 질의에 대응되는 대화 모델을 결정한 후 그 대화 모델을 이용하여 사용자 질의에 대한 응답 문장을 생성하여 출력하는 대화 처리부;
상기 대화 처리부로부터 응답 문장을 입력받아 그 응답 문장을 음성으로 변환하여 사용자에게 출력하는 음성 합성부; 및
상기 대화 처리부로부터 응답 문장을 입력받아 사용자에게 디스플레이시키는 디스플레이부로 구성된 것을 특징으로 한다.
또한, 본 발명 영역별 언어모델과 대화모델을 이용한 지능형 로봇 음성 인식 서비스 방법은, 로봇과 사용자의 대화가 처음 시작되면 대화 영역 정보를 초기화하는 제 1 단계;
사용자의 음성 질의문이 입력되면, 기존의 영역 정보가 있는지의 여부를 판단하는 제 2 단계;
상기 제 2 단계에서 기존의 사용자 질의 문장의 영역 정보가 있으면, 이전 문장에 대한 영역 정보를 이용하여 영역별 언어 모델에 가중치를 부여함으로 음성 인식을 수행하는 제 3 단계;
음성 인식된 문장의 명사 키워드를 이용하여 영역별 키워드 사전에서 대화 영역의 정보를 추출하는 제 4 단계;
기존의 영역 정보와 추출된 영역 정보가 동일한지의 여부를 판단하는 제 5 단계; 및
상기 제 5 단계에서 동일하면, 기존 영역의 대화 모델을 사용하여 사용자 질의 문장에 대한 응답 문장을 작성한 후 사용자에게 출력하는 제 6 단계로 이루어진 것을 특징으로 한다.
이하, 본 발명의 일 실시예에 의한 영역별 언어모델과 대화모델을 이용한 지능형 로봇 음성 인식 서비스 장치 및 방법에 대하여 첨부된 도면을 참조하여 상세히 설명하기로 한다.
도 1은 본 발명의 일 실시예에 따른 영역별 언어모델과 대화모델을 이용한 지능형 로봇 음성 인식 서비스 장치의 구성을 나타낸 기능 블록도이다. 사용자로 부터 음성 질의가 입력되면, 음성 인식부(100)는 언어모델 및 대화모델을 이용한 음성 인식 기능을 수행하여 음성 인식 결과 문장을 상기 대화 처리부(200)로 출력한다. 그러면, 상기 대화 처리부(200)는 상기 음성 인식부(100)로부터 음성 인식 결과 문장을 입력받아 사용자의 음성 질의에 대응되는 대화 모델을 결정하고, 이후 그 대화 모델을 이용하여 사용자 질의에 대한 응답 문장을 생성한 후 상기 음성 합성부(300)로 출력한다. 이어서, 상기 음성 합성부(300)는 상기 응답 문장을 음성으로 변환하여 사용자에게 음성을 출력한다. 그리고, 디스플레이부(400)는 검색 정보를 디스플레이할 필요가 있는 경우, 상기 대화 처리부(200)로부터 사용자 질의에 대한 응답으로 검색된 정보를 입력받아 사용자에게 디스플레이한다.
도 2는 본 발명의 일 실시예에 따른 영역별 언어모델과 대화모델을 이용한 지능형 로봇 음성 인식 서비스 장치에서 음성 인식부의 내부 구성을 나타낸 기능 블록도이다. 먼저, 입력된 음성은 특징 추출부(110)에서 인식에 유용한 정보만을 추출한 특징벡터로 변환되고, 이러한 특징벡터로부터 탐색부(120)에서 학습과정에서 미리 구해진 음향 모델(121), 전체영역 언어모델(122), 영역별 언어모델(123) 및 어휘 사전(124)을 이용하여 가장 확률이 높은 단어열을 탐색 알고리즘을 이용하여 탐색한다. 여기서, 인식 대상 어휘들은 트리를 구성하고 있으며, 탐색부(120)는 이러한 트리를 탐색하는 것이다.
후처리부(130)는 탐색 결과로부터 음절단위로 모아 쓰기를 하여 최종 인식 결과를 텍스트로 출력한다. 이 중에서 언어 모델(122, 123)은 상기 음성 인식부 (100)의 문법으로서 단어 단위로 인식된 결과를 문장으로 재구성하는 작업에 사용되며, 음향학적인 모호함 때문에 정확히 인식하지 못하는 부분을 언어 정보를 이용하여 탐색 공간을 줄이는 역할을 한다. 본 발명에서는 전체 영역에 대한 언어 모델(122)과 대화 영역별 언어 모델(123)을 미리 대화 영역별로 구성하여 놓은 후, 대화 영역 정보를 이용하여 언어 모델을 선택한다.
도 3은 본 발명의 일 실시예에 따른 영역별 언어모델과 대화모델을 이용한 지능형 로봇 음성 인식 서비스 장치에서 대화 처리부의 내부 구성을 나타낸 기능 블록도이다.
상기 음성 인식부(100)로부터 음성 인식 결과 문장을 텍스트 형태로 입력받으면, 대화영역 구별부(210)는 음성 인식 결과 문장을 구성하는 명사 키워드를 이용하여 대화 영역별 키워드 사전(211)을 검색하여 사용자의 음성 질의가 속한 대화 영역을 결정한다. 이 때, 대화 영역의 예로는 인사(greeting) 영역, 로봇의 신체 동작 영역, 날씨 검색 영역, 일정 관리 영역, 이메일 처리 영역, 전화 처리 영역 등 일상 생활에서 쓰여지는 영역을 대화 처리에 용이하도록 구분한 영역을 사용할 수 있으며, 대화 영역을 구별하기 위해 영역별 키워드 사전(211)을 구축한다. 여기서, 영역별 키워드 사전(211)은 영역간의 변별력을 높이기 위해, 1개의 키워드는 가장 가까운 영역에 포함시키고, 중복되어 사용될 수 있는 키워드는 영역별 키워드 사전에 포함하지 않는다.
이어서, 대화모델 선택부(220)는 도 4에 도시된 바와 같은 대화 영역 이력 (history) 정보를 이용하여 대화 모델을 선택한 후, 사용자 질의에 대한 응답 문장을 생성하기 위해 영역별 대화 모델(221)을 이용한다. 예를 들면, 날씨 검색 영역의 대화 모델은 인터넷을 이용하여 정보 검색 서버(222)에 접근하여 사용자가 요구한 지역의 날씨를 검색하여 응답 문장을 생성하고, 일정 관리 영역의 대화 모델은 사용자의 일정을 데이터베이스(223)에 등록, 변경, 삭제, 검색하기 위한 기능을 수행한다.
한편, 응답 처리부(230)는 상기 대화모델 선택부(220)로부터 대화 모델 정보를 입력받아, 데이터베이스에 저장된 영역별 대화 모델(221)을 이용하여 사용자 질의에 대한 응답 문장을 생성한다.
한편, 도 4는 대화영역 이력정보 테이블의 모습을 보여주는 도면이며, 다수개의 사용자 질의 문장 번호를 나타내는 정보(11), 및 각 사용자 질의 문장 번호에 대응되는 다수개의 대화 영역 정보(12)로 이루어져 있다. 이 때, 대화 영역 이력 정보는 사용자 질의 문장이 처리된 후에도 영역 정보를 유지하고, 이후 새로 들어오는 사용자 질의 문장이 어느 영역에 속하는지를 판단할 때 사용된다. 사용자는 도 6의 예제와 같이 로봇에게 다수의 질의를 계속할 수 있고, 대화 영역은 최소 1개 이상으로 진행되며, 대화가 다양한 영역으로 이루어질 수 있다. 사용자가 로봇을 호출하여 대화를 진행하는 동안 사용된 대화 영역에 대한 정보는 대화가 진행되는 동안은 유지될 필요가 있다. 대화 영역 정보를 유지함으로써, 연속되는 다음 질의 문장을 인식하기 위한 언어 모델을 선택하는데 이용하고, 사용자 질의에 대해 응답 문장을 생성하는 영역별 대화 모델을 선택할 때에도 대화 영역 이력 정보를 이용한다.
도 6은 지능형 로봇과 사용자와의 대화 예제이다. 이 예제에서는 사용자가 날씨 영역에 대해서는 4문장을 질의하고, 일정 관리 영역에서는 2문장, 전화 처리 영역에서는 3문장을 질의하였다.
그러면, 상기와 같은 구성을 가지는 본 발명의 일 실시예에 따른 의 동작 과정에 대해 첨부된 도면을 참조하여 설명하기로 한다. 도 5는 본 발명의 일 실시예에 따른 영역별 언어모델과 대화모델을 이용한 지능형 로봇 음성 인식 서비스 방법을 나타낸 동작 플로우챠트이다.
먼저, 로봇과 사용자의 대화가 처음 시작되면 대화 영역 정보를 초기화한다(S1). 이어서, 사용자의 음성 질의문이 입력되면, 상기 음성 인식부(100)는 기존의 영역 정보가 있는지의 여부를 판단한다(S2). 이 때, 상기 제 2 단계(S2)에서 도 4의 각 사용자 질의 문장의 영역 정보가 있으면(YES), 상기 음성 인식부(100)는 다음 질의를 처리할 때 이전 문장에 대한 영역 정보를 이용하여 영역별 언어 모델(123)에 가중치를 부여함으로 음성 인식을 수행한다(S3).
한편, 상기 대화 처리부(200)는 음성 인식된 문장의 명사 키워드를 이용하여 영역별 키워드 사전(211)에서 대화 영역의 정보를 추출한다(S4). 단, 인식된 문장의 키워드만으로 영역을 찾을 수 없을 때에는 기존의 영역 정보를 그대로 사용한 다. 예를 들면, 사용자가 "내일 날씨 알려줘"란 질의 후에 "모레는"하고 질의하는 경우에는 "모레 날씨"를 의미하므로 기존의 영역 정보를 이용하도록 한다. 이 때, 영역별 키워드 사전(211)에서 대화 영역의 정보를 추출한 후, 상기 대화 처리부(200)는 기존의 영역 정보와 추출된 영역 정보가 동일한지의 여부를 판단한다(S5). 이 때, 동일하면(YES), 상기 대화 처리부(200)는 기존의 영역의 대화 모델을 사용하여 사용자 질의 문장에 대한 응답 문장을 작성하며, 상기 음성 합성부(300)는 상기 응답 문장을 음성으로 변환하여 사용자에게 음성으로 출력한다(S6).
반면에, 상기 제 2 단계(S2)에서 사용자의 처음 질의로 인해 영역 정보가 없으면(NO), 상기 음성 인식부(100)는 일반적인 언어 모델을 사용하여 음성 인식을 수행한 후 상기 제 4 단계(S4)로 진행한다(S7).
또한, 상기 제 5 단계(S5)에서 동일하지 않으면(NO), 상기 대화 처리부(200)는 대화 영역 이력(history)을 저장하고, 새로운 영역에 대한 대화 모델을 선택하여 사용자 질의 처리에 사용한다. 이후, 사용자 질의 문장에 대한 응답은 영역별 대화 모델(221)을 이용하여 응답 문장을 작성한다. 그러면, 상기 음성 합성부(300)는 상기 응답 문장을 음성으로 변환하여 사용자에게 음성으로 출력하고, 다음 사용자 질의 처리를 시작한다(S8).
상술한 바와 같은 본 발명의 방법은 프로그램으로 구현되어 컴퓨터로 읽을 수 있는 기록매체(씨디롬, 램, 롬, 플로피 디스크, 하드 디스크, 광자기 디스크 등)에 저장될 수 있다.
이상에서 몇 가지 실시예를 들어 본 발명을 더욱 상세하게 설명하였으나, 본 발명은 반드시 이러한 실시예로 국한되는 것이 아니고 본 발명의 기술사상을 벗어나지 않는 범위 내에서 다양하게 변형실시될 수 있다.
상술한 바와 같이 본 발명에 의한 영역별 언어모델과 대화모델을 이용한 지능형 로봇 음성 인식 서비스 장치 및 방법에 의하면, 사용자가 지능형 로봇을 이용할 때 사용자 질의에 대한 음성 인식의 성능을 높여 사용자에게 자연스러운 응답 문장을 제공할 수 있고, 그 뿐만 아니라 사용자 질의 문장에 대한 대화 영역 이력 정보를 유지한 후 그 이력 정보를 이용하여 영역별 대화 모델을 선택하여 사용함으로 사용자의 다음 질문이나 답변을 예측할 수 있도록 해주어, 보다 향상된 지능형 로봇을 사용자에게 공급할 수 있도록 해준다는 뛰어난 효과가 있다.

Claims (11)

  1. 사용자로부터 음성 질의가 입력되면, 언어모델과 대화모델을 이용한 음성 인식 기능을 수행하여 음성 인식 결과 문장을 출력하는 음성 인식부;
    상기 음성 인식부로부터 음성 인식 결과 문장을 입력받으면, 사용자의 음성 질의에 대응되는 대화 모델을 결정한 후 그 대화 모델을 이용하여 사용자 질의에 대한 응답 문장을 생성하여 출력하는 대화 처리부;
    상기 대화 처리부로부터 응답 문장을 입력받아 그 응답 문장을 음성으로 변환하여 사용자에게 출력하는 음성 합성부; 및
    상기 대화 처리부로부터 응답 문장을 입력받아 사용자에게 디스플레이시키는 디스플레이부로 구성된 것을 특징으로 하는 영역별 언어모델과 대화모델을 이용한 지능형 로봇 음성 인식 서비스 장치.
  2. 제 1항에 있어서,
    사용자로부터 음성 질의가 입력되면 그 입력된 음성에서 특징벡터를 추출하는 특징벡터 추출부;
    상기 특징벡터 추출부로부터 특징벡터를 입력받은 후, 학습 과정에서 미리 구해진 음향 모델, 언어모델 및 어휘 사전을 이용하여 가장 확률이 높은 단어열을 탐색하여 출력하는 탐색부; 및
    상기 탐색부의 결과를 음절단위로 모아 쓰기를 하여 최종 음성 인식 결과 문장을 텍스트로 출력하는 후처리부로 구성된 것을 특징으로 하는 영역별 언어모델과 대화모델을 이용한 지능형 로봇 음성 인식 서비스 장치.
  3. 제 2항에 있어서,
    상기 언어모델은, 전체 영역에 대한 언어 모델 및 대화 영역별 언어 모델을 미리 대화 영역별로 구성함을 특징으로 하는 영역별 언어모델과 대화모델을 이용한 지능형 로봇 음성 인식 서비스 장치.
  4. 제 1항에 있어서,
    상기 대화 처리부는, 상기 음성 인식부로부터 음성 인식 결과 문장을 입력받은 후, 그 음성 인식 결과 문장을 구성하는 명사 키워드를 이용해 대화 영역별 키워드 사전을 검색하여 사용자의 음성 질의가 속한 대화 영역을 결정하는 대화영역 구별부;
    상기 대화영역 구별부를 통해 대화 영역이 결정되면, 대화 영역 이력 정보를 이용하여 대화 모델을 선택하는 대화모델 선택부; 및
    상기 대화모델 선택부로부터 대화 모델 정보를 입력받아, 데이터베이스에 저장된 영역별 대화 모델을 이용하여 사용자 질의에 대한 응답 문장을 생성하는 응답 처리부로 구성된 것을 특징으로 하는 영역별 언어모델과 대화모델을 이용한 지능형 로봇 음성 인식 서비스 장치.
  5. 제 4항에 있어서,
    상기 대화영역 구별부에 의해 결정된 대화 영역은, 인사(greeting) 영역, 로봇의 신체 동작 영역, 날씨 검색 영역, 일정 관리 영역, 이메일 처리 영역 및 전화 처리 영역 등과 같은 일상 생활에서 쓰여지는 영역을 대화 처리에 용이하도록 구분한 영역인 것을 특징으로 하는 영역별 언어모델과 대화모델을 이용한 지능형 로봇 음성 인식 서비스 장치.
  6. 제 4항에 있어서,
    상기 영역별 키워드 사전은, 영역간의 변별력을 높이기 위해 1개의 키워드를 가장 가까운 영역에 포함시키며, 중복되어 사용될 수 있는 키워드는 영역별 키워드 사전에 포함하지 않는 것을 특징으로 하는 영역별 언어모델과 대화모델을 이용한 지능형 로봇 음성 인식 서비스 장치.
  7. 제 1항에 있어서,
    상기 대화 영역 이력 정보는, 다수개의 사용자 질의 문장 번호를 나타내는 정보, 및 각 사용자 질의 문장 번호에 대응되는 다수개의 대화 영역 정보로 이루어진 것을 특징으로 하는 영역별 언어모델과 대화모델을 이용한 지능형 로봇 음성 인식 서비스 장치.
  8. 로봇과 사용자의 대화가 처음 시작되면 대화 영역 정보를 초기화하는 제 1 단계;
    사용자의 음성 질의문이 입력되면, 기존의 영역 정보가 있는지의 여부를 판단하는 제 2 단계;
    상기 제 2 단계에서 기존의 사용자 질의 문장의 영역 정보가 있으면, 이전 문장에 대한 영역 정보를 이용하여 영역별 언어 모델에 가중치를 부여함으로 음성 인식을 수행하는 제 3 단계;
    음성 인식된 문장의 명사 키워드를 이용하여 영역별 키워드 사전에서 대화 영역의 정보를 추출하는 제 4 단계;
    기존의 영역 정보와 추출된 영역 정보가 동일한지의 여부를 판단하는 제 5 단계; 및
    상기 제 5 단계에서 동일하면, 기존 영역의 대화 모델을 사용하여 사용자 질의 문장에 대한 응답 문장을 작성한 후 사용자에게 출력하는 제 6 단계로 이루어진 것을 특징으로 하는 영역별 언어모델과 대화모델을 이용한 지능형 로봇 음성 인식 서비스 방법.
  9. 제 8항에 있어서,
    상기 제 2 단계에서 기존의 사용자 질의 문장의 영역 정보가 없으면, 일반적인 언어 모델을 사용하여 음성 인식을 수행한 후 상기 제 4 단계로 진행하는 제 7 단계가 더 추가로 포함됨을 특징으로 하는 영역별 언어모델과 대화모델을 이용한 지능형 로봇 음성 인식 서비스 방법.
  10. 제 8항에 있어서,
    상기 제 4 단계에서, 음성 인식된 문장의 키워드만으로 영역을 찾을 수 없을 경우에는 기존의 영역 정보를 그대로 사용하여 대화 영역의 정보를 추출하는 것을 특징으로 하는 영역별 언어모델과 대화모델을 이용한 지능형 로봇 음성 인식 서비스 방법.
  11. 제 8항에 있어서,
    상기 제 5 단계에서 동일하지 않으면, 대화 영역 이력을 저장하고, 새로운 영역에 대한 대화 모델을 선택하여 사용자 질의 문장에 대한 응답 문장을 작성한 후 사용자에게 출력하는 제 8 단계가 더 추가로 포함됨을 특징으로 하는 영역별 언어모델과 대화모델을 이용한 지능형 로봇 음성 인식 서비스 방법.
KR1020040109128A 2004-12-21 2004-12-21 영역별 언어모델과 대화모델을 이용한 지능형 로봇 음성인식 서비스 장치 및 방법 KR20060070605A (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020040109128A KR20060070605A (ko) 2004-12-21 2004-12-21 영역별 언어모델과 대화모델을 이용한 지능형 로봇 음성인식 서비스 장치 및 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020040109128A KR20060070605A (ko) 2004-12-21 2004-12-21 영역별 언어모델과 대화모델을 이용한 지능형 로봇 음성인식 서비스 장치 및 방법

Publications (1)

Publication Number Publication Date
KR20060070605A true KR20060070605A (ko) 2006-06-26

Family

ID=37164206

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020040109128A KR20060070605A (ko) 2004-12-21 2004-12-21 영역별 언어모델과 대화모델을 이용한 지능형 로봇 음성인식 서비스 장치 및 방법

Country Status (1)

Country Link
KR (1) KR20060070605A (ko)

Cited By (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100792208B1 (ko) * 2005-12-05 2008-01-08 한국전자통신연구원 음성 대화 시스템에서 답변 문장 생성 방법 및 장치
KR100835985B1 (ko) * 2006-12-08 2008-06-09 한국전자통신연구원 핵심어 인식 기반의 탐색 네트워크 제한을 이용한연속음성인식 장치 및 방법
KR100908445B1 (ko) * 2006-09-04 2009-07-21 한국전자통신연구원 응답 문장 생성 장치 및 방법
KR100918644B1 (ko) * 2009-06-17 2009-09-25 김정중 대화 시스템 및 대화 문장 생성 방법
KR20110057659A (ko) * 2009-11-24 2011-06-01 삼성전자주식회사 대화 로봇을 이용한 일정 관리 시스템 및 그 방법
WO2011074771A3 (ko) * 2009-12-16 2011-08-25 포항공과대학교 산학협력단 외국어 학습 장치 및 그 제공 방법.
US9230543B2 (en) 2011-12-20 2016-01-05 Electronics And Telecommunications Research Institute Method and apparatus for providing contents about conversation
WO2018009351A1 (en) * 2016-07-08 2018-01-11 Google Llc Follow-up voice query prediction
WO2018012645A1 (ko) * 2016-07-12 2018-01-18 엘지전자 주식회사 이동 로봇 및 그 제어방법
KR20190079791A (ko) * 2017-12-28 2019-07-08 네이버 주식회사 인공지능 기기에서의 복수의 호출 용어를 이용한 서비스 제공 방법 및 그 시스템
WO2019164144A1 (ko) * 2018-02-22 2019-08-29 삼성전자주식회사 전자 장치 및 이의 자연어 생성 방법
WO2019216551A1 (ko) * 2018-05-11 2019-11-14 경북대학교 산학협력단 대화문장 생성 장치, 이를 포함하는 대화로봇 및 대화문장 생성 방법
WO2020036425A1 (en) * 2018-08-13 2020-02-20 Lg Electronics Inc. Artificial intelligence device
KR20200070198A (ko) * 2020-06-10 2020-06-17 한국전자통신연구원 자동 질문 생성을 이용한 챗봇 장치 및 그 동작방법
KR20200086587A (ko) * 2019-01-09 2020-07-17 주식회사 솔트룩스 모듈형 대화 모델을 위한 시스템 및 방법
CN111587419A (zh) * 2018-02-23 2020-08-25 三星电子株式会社 电子装置及其控制方法
CN112100368A (zh) * 2020-07-21 2020-12-18 深思考人工智能科技(上海)有限公司 对话交互意图的识别方法和装置
KR20210013193A (ko) * 2018-06-27 2021-02-03 구글 엘엘씨 로컬 텍스트-응답 맵을 활용하여 사용자의 음성 발화에 대한 응답 렌더링
WO2021054613A1 (en) * 2019-09-19 2021-03-25 Samsung Electronics Co., Ltd. Electronic device and method for controlling the electronic device thereof
KR102246827B1 (ko) * 2020-06-08 2021-04-30 가천대학교 산학협력단 시니어 사용자용 챗봇을 위한 언어 모델 기반 다빈도 질환의 증상 인식 방법

Cited By (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100792208B1 (ko) * 2005-12-05 2008-01-08 한국전자통신연구원 음성 대화 시스템에서 답변 문장 생성 방법 및 장치
KR100908445B1 (ko) * 2006-09-04 2009-07-21 한국전자통신연구원 응답 문장 생성 장치 및 방법
KR100835985B1 (ko) * 2006-12-08 2008-06-09 한국전자통신연구원 핵심어 인식 기반의 탐색 네트워크 제한을 이용한연속음성인식 장치 및 방법
KR100918644B1 (ko) * 2009-06-17 2009-09-25 김정중 대화 시스템 및 대화 문장 생성 방법
KR20110057659A (ko) * 2009-11-24 2011-06-01 삼성전자주식회사 대화 로봇을 이용한 일정 관리 시스템 및 그 방법
US9767710B2 (en) 2009-12-16 2017-09-19 Postech Academy-Industry Foundation Apparatus and system for speech intent recognition
WO2011074771A3 (ko) * 2009-12-16 2011-08-25 포항공과대학교 산학협력단 외국어 학습 장치 및 그 제공 방법.
US9230543B2 (en) 2011-12-20 2016-01-05 Electronics And Telecommunications Research Institute Method and apparatus for providing contents about conversation
WO2018009351A1 (en) * 2016-07-08 2018-01-11 Google Llc Follow-up voice query prediction
US10026398B2 (en) 2016-07-08 2018-07-17 Google Llc Follow-up voice query prediction
KR20190021338A (ko) * 2016-07-08 2019-03-05 구글 엘엘씨 후속 음성 쿼리 예측
WO2018012645A1 (ko) * 2016-07-12 2018-01-18 엘지전자 주식회사 이동 로봇 및 그 제어방법
KR20190079791A (ko) * 2017-12-28 2019-07-08 네이버 주식회사 인공지능 기기에서의 복수의 호출 용어를 이용한 서비스 제공 방법 및 그 시스템
JP2019120935A (ja) * 2017-12-28 2019-07-22 ネイバー コーポレーションNAVER Corporation 人工知能機器で複数のウェイクワードを利用したサービス提供方法およびそのシステム
WO2019164144A1 (ko) * 2018-02-22 2019-08-29 삼성전자주식회사 전자 장치 및 이의 자연어 생성 방법
US11657237B2 (en) 2018-02-22 2023-05-23 Samsung Electronics Co., Ltd. Electronic device and natural language generation method thereof
KR20190105175A (ko) * 2018-02-22 2019-09-16 삼성전자주식회사 전자 장치 및 이의 자연어 생성 방법
CN111587419A (zh) * 2018-02-23 2020-08-25 三星电子株式会社 电子装置及其控制方法
WO2019216551A1 (ko) * 2018-05-11 2019-11-14 경북대학교 산학협력단 대화문장 생성 장치, 이를 포함하는 대화로봇 및 대화문장 생성 방법
KR20230047514A (ko) * 2018-06-27 2023-04-07 구글 엘엘씨 로컬 텍스트-응답 맵을 활용하여 사용자의 음성 발화에 대한 응답 렌더링
KR20210013193A (ko) * 2018-06-27 2021-02-03 구글 엘엘씨 로컬 텍스트-응답 맵을 활용하여 사용자의 음성 발화에 대한 응답 렌더링
US11164581B2 (en) 2018-08-13 2021-11-02 Lg Electronics Inc. Artificial intelligence device
WO2020036425A1 (en) * 2018-08-13 2020-02-20 Lg Electronics Inc. Artificial intelligence device
KR20200023662A (ko) * 2018-08-13 2020-03-06 엘지전자 주식회사 인공 지능 기기
KR20200086587A (ko) * 2019-01-09 2020-07-17 주식회사 솔트룩스 모듈형 대화 모델을 위한 시스템 및 방법
US11538474B2 (en) 2019-09-19 2022-12-27 Samsung Electronics Co., Ltd. Electronic device and method for controlling the electronic device thereof
WO2021054613A1 (en) * 2019-09-19 2021-03-25 Samsung Electronics Co., Ltd. Electronic device and method for controlling the electronic device thereof
KR102246827B1 (ko) * 2020-06-08 2021-04-30 가천대학교 산학협력단 시니어 사용자용 챗봇을 위한 언어 모델 기반 다빈도 질환의 증상 인식 방법
KR20200070198A (ko) * 2020-06-10 2020-06-17 한국전자통신연구원 자동 질문 생성을 이용한 챗봇 장치 및 그 동작방법
CN112100368A (zh) * 2020-07-21 2020-12-18 深思考人工智能科技(上海)有限公司 对话交互意图的识别方法和装置
CN112100368B (zh) * 2020-07-21 2024-01-26 深思考人工智能科技(上海)有限公司 对话交互意图的识别方法和装置

Similar Documents

Publication Publication Date Title
US11740863B2 (en) Search and knowledge base question answering for a voice user interface
US8768700B1 (en) Voice search engine interface for scoring search hypotheses
KR20060070605A (ko) 영역별 언어모델과 대화모델을 이용한 지능형 로봇 음성인식 서비스 장치 및 방법
US9330661B2 (en) Accuracy improvement of spoken queries transcription using co-occurrence information
US8200491B2 (en) Method and system for automatically detecting morphemes in a task classification system using lattices
JP6013951B2 (ja) 環境音検索装置、環境音検索方法
US6681206B1 (en) Method for generating morphemes
KR101309042B1 (ko) 다중 도메인 음성 대화 장치 및 이를 이용한 다중 도메인 음성 대화 방법
EP2317507B1 (en) Corpus compilation for language model generation
WO2003010754A1 (fr) Systeme de recherche a entree vocale
JP2004005600A (ja) データベースに格納された文書をインデックス付け及び検索する方法及びシステム
JP2009036999A (ja) コンピュータによる対話方法、対話システム、コンピュータプログラムおよびコンピュータに読み取り可能な記憶媒体
KR20110095338A (ko) 검색 용어에 대한 인덱싱 가중치 할당
JP2015219583A (ja) 話題決定装置、発話装置、方法、及びプログラム
JP5753769B2 (ja) 音声データ検索システムおよびそのためのプログラム
JP2008287210A (ja) 音声チャットシステム、情報処理装置、音声認識方法およびプログラム
EP1623412A2 (en) Method for statistical language modeling in speech recognition
JP5073024B2 (ja) 音声対話装置
US7085720B1 (en) Method for task classification using morphemes
JP2011039185A (ja) 音声対話装置及び音声対話プログラム
CN112527973A (zh) 一种搜索疾病信息的方法和系统
KR19990047859A (ko) 도서 문헌 데이터베이스 검색을 위한 자연언어 대화 시스템
Sinha et al. Transforming interactions: mouse-based to voice-based interfaces
JP3663012B2 (ja) 音声による入力装置
CN112767923B (zh) 一种语音识别方法及装置

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E601 Decision to refuse application