KR20060010260A - 음성인식 시스템 및 음성인식 시스템의 에러정정방법 - Google Patents

음성인식 시스템 및 음성인식 시스템의 에러정정방법 Download PDF

Info

Publication number
KR20060010260A
KR20060010260A KR1020040058890A KR20040058890A KR20060010260A KR 20060010260 A KR20060010260 A KR 20060010260A KR 1020040058890 A KR1020040058890 A KR 1020040058890A KR 20040058890 A KR20040058890 A KR 20040058890A KR 20060010260 A KR20060010260 A KR 20060010260A
Authority
KR
South Korea
Prior art keywords
recognition data
error
speech recognition
voice recognition
correction
Prior art date
Application number
KR1020040058890A
Other languages
English (en)
Inventor
신종호
Original Assignee
삼성전자주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성전자주식회사 filed Critical 삼성전자주식회사
Priority to KR1020040058890A priority Critical patent/KR20060010260A/ko
Publication of KR20060010260A publication Critical patent/KR20060010260A/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/23Updating
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • General Health & Medical Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

본 발명은 음성인식 시스템 및 음성인식 시스템의 에러정정방법에 관한 것이다. 본 발명에 따른 음성인식 시스템은 등록 데이터베이스와, 정정 데이터베이스와, 음성인식처리부 및 제어부를 포함한다. 제어부는 등록 데이터베이스 및 정정 데이터베이스에서 제1 음성인식데이터에 대응하는 등록 음성인식데이터 및 에러음성인식데이터가 존재하는지 여부를 검색하고, 제1 음성인식데이터에 대응하는 등록음성인식데이터 및 에러 음성인식데이터가 존재하지 않는 경우 에러 응답을 출력하고, 에러 응답에 대응하여 입력되는 사용자의 에러정정명령에 따라 음성인식처리부에서 생성되는 제2 음성인식데이터에 대응하는 등록 음성인식데이터가 등록 데이터베이스에 존재하는지 여부를 검색하고, 제2 음성인식데이터에 대응하는 등록 음성인식데이터가 존재하는 경우 제2 음성인식데이터에 대응하는 등록 음성인식데이터에 대한 등록 응답데이터를 출력하며, 제1 음성인식데이터 및 출력된 등록 응답데이터를 정정 데이터베이스에 에러 음성인식데이터 및 정정 응답데이터로 업데이트하는 것을 특징으로 한다. 이에 의해, 음성인식의 에러와 에러에 대한 적합한 응답에 대한 정보를 정정 데이터베이스로 지속적으로 구축하여 추후의 동일한 에러의 발생에 능동적으로 대응할 수 있다.

Description

음성인식 시스템 및 음성인식 시스템의 에러정정방법{SPEECH RECOGNITION SYSTEM AND METHOD FOR CORRECTION ERRORS THEREOF}
도 1은 본 발명에 따른 음성인식 시스템의 제어블럭도이고,
도 2는 본 발명의 일 실시예에 따른 음성인식 시스템의 제어블럭도이고,
도 3 및 도 4는 본 발명에 따른 음성인식 시스템의 에러정정방법을 설명하기 위한 제어흐름도이다.
* 도면의 주요 부분에 대한 부호의 설명
10 : 음성인식처리부 11 : 음성인식부
12 : 명령해석부 20 : 제어부
21 : 다이얼로그 매니저 22 : 에러정정부
23 : 에러검색부 24 : 에러업데이터부
30 : 정정 데이터베이스 40 : 등록 데이터베이스
50 : 피제어 디바이스
본 발명은, 음성인식 시스템 및 음성인식 시스템의 에러정정방법에 관한 것 으로서, 사용자의 음성명령의 인식에 에러가 발생한 경우 이를 자동을 정정할 수 있은 음성인식 시스템 및 음성인식 시스템의 에러 정정방법에 관한 것이다.
음성은 일상 생활에서 가장 효과적이고 자연스러운 의사소통방법으로서, 사용자의 음성명령의 처리는 음성인식 기술의 발전과 더블어 인간과 기계 간의 새로운 인터페이스로 제안 및 개발되고 있다.
이러한, 음성인식 기술은 일상생활에서 가전제품을 사용하는데 있어, 사용자의 음성명령을 통하여 가전제품을 제어하는 데에도 널리 사용되고 있다. 예컨대, 미국특허 제4,340,797호, 미국특허 제4,340,798호 등에서는 사용자의 음성명령을 통해 오븐을 제어하는 기술에 대해 개시하고 있다. 또한, 미국특허 제4,520,576호는 사용자의 음성명령을 통해 세탁기를 제어하는 기술에 대해 개시하고 있다.
또한, 상기와 같이 특정 가전제품의 제어에서 더 발전하여, 미국특허 제6,243,707호 및 한국공개특허 제2001-14155호는 브라우저에 기반하여 홈 네트워크 상에서 가전기기들을 제어하는 기술에 대해 개시하고 있다.
이러한 음성인식 기술은 컴퓨터 관련기술의 발전과 함께, 컴퓨터를 통한 다양한 기기의 제어를 가능하게 하고, 인터넷 등의 네트워크와의 접속을 통해 그 활용범위가 점차 늘어가고 있는 추세이다.
또한, 음성인식 기술은 사용자와의 대화형 환경을 제공하는데까지 이르러, 사용자에게 필요한 음성명령의 요구나 다양한 정보를 음성으로 제공하는데 이르렀다.
그러나, 이러한 종래의 음성인식 기술에 있어, 사용자의 음성명령을 인식하 여 인식된 음성명령에 대응하는 프로세스를 수행하는 동안 에러가 발생하는 경우, 발생한 에러에 능동적으로 대응하지 못하는 단점이 있다.
예컨대, 음성인식 시스템에서, 사용자가 "A"라는 음성명령을 입력하였는데도 불구하고 음성인식 시스템이 "A"라는 음성명령을 "B"라고 인식하는 경우 "B"에 대한 응답을 사용자에게 제공하게 된다.
또한, 음성인식 시스템이 "B"라는 음성명령에 대한 응답을 보유하고 있지 않는 경우, 사용자에게 "A"에 대한 응답을 제공하지 못하고 단지 인식 에러라는 정보를 제공하거나 음성명령의 재입력을 요구하는 응답을 제공하는데 그친다.
따라서, 본 발명의 목적은 에러 데이터베이스를 구축하여 음성인식에 에러가 발생하는 경우 에러 데이터베이스에 기초하여 정확한 응답을 사용자에게 제공할 수 있는 음성인식 시스템 및 음성인식 시스템의 에러정정방법을 제공하는 것이다.
상기 목적은, 본 발명에 따라, 음성인식 시스템에 있어서, 등록 음성인식데이터와, 상기 등록 음성인식데이터에 대응하는 등록응답데이터에 대한 등록 데이터베이스와; 에러 음성인식데이터와, 상기 에러 음성인식데이터에 대응하는 정정응답데이터에 대한 정정 데이터베이스와; 사용자의 음성명령을 인식하여 제1 음성인식데이터를 생성하는 음성인식처리부와; 상기 등록 데이터베이스 및 상기 정정 데이터베이스에서 상기 제1 음성인식데이터에 대응하는 등록 음성인식데이터 및 에러음성인식데이터가 존재하는지 여부를 검색하고, 상기 제1 음성인식데이터에 대응하는 상기 등록음성인식데이터 및 상기 에러 음성인식데이터가 존재하지 않는 경우 에러 응답을 출력하고, 상기 에러 응답에 대응하여 입력되는 사용자의 에러정정명령에 따라 상기 음성인식처리부에서 생성되는 제2 음성인식데이터에 대응하는 등록 음성인식데이터가 상기 등록 데이터베이스에 존재하는지 여부를 검색하고, 상기 제2 음성인식데이터에 대응하는 상기 등록 음성인식데이터가 존재하는 경우 상기 제2 음성인식데이터에 대응하는 상기 등록 음성인식데이터에 대한 상기 등록 응답데이터를 출력하며, 상기 제1 음성인식데이터 및 상기 출력된 등록 응답데이터를 상기 정정 데이터베이스에 에러 음성인식데이터 및 정정 응답데이터로 업데이트하는 제어부를 포함하는 것을 특징으로 하는 음성인식 시스템에 의해 달성될 수 있다.
여기서, 상기 정정 데이터베이스에서 상기 제1 음성인식데이터에 대응하는 상기 에러 음성인식데이터를 검색하고, 상기 제1 음성인식데이터 및 상기 출력된 등록 응답데이터를 상기 정정 데이터베이스에 상기 에러 음성인식데이터 및 상기 정정 응답데이터로 업데이트하는 에러정정부와; 상기 등록 데이터베이스에서 상기 제1 음성인식데이터에 대응하는 상기 등록 음성인식데이터를 검색하고, 상기 제1 음성인식데이터에 대응하는 상기 등록 음성인식데이터가 검색되지 않는 경우 상기 에러정정부가 상기 정정 데이터베이스에서 상기 제1 음성인식데이터에 대응하는 상기 에러 음성인식데이터를 검색하도록 제어하는 다이얼로그 매니저를 포함할 수 있다.
그리고, 상기 다이얼로그 매니저는 상기 제1 음성인식데이터에 대응하는 상기 등록 음성인식데이터가 검색된 경우 상기 검색된 등록 음성인식데이터에 대응하 는 등록 응답데이터를 출력하고; 상기 에러정정부는 상기 다이얼로그 매니저의 제어에 따라 상기 정정 데이터베이스에서 상기 제1 음서인식데이터에 대응하는 상기 에러 음성인식데이터가 검색된 경우 상기 검색된 에러 음성인식 데이터에 대응하는 정정 응답데이터를 상기 다이얼로그 매니저에 출력하며; 상기 다이얼로그 매니저는 상기 에러정정부로부터의 상기 정정 응답데이터를 출력할 수 있다.
그리고, 상기 음성처리부는, 상기 음성명령 및 상기 에러정정명령을 인식하여 텍스트 데이터로 변환하는 음성인식부와; 상기 음성인식부로부터 출력되는 상기 텍스트 데이터를 합성하여 상기 제1 음성인식데이터 및 상기 제2 음성인식데이터를 생성하는 명령해석부를 포함할 수 있다.
한편, 상기 목적은 본 발명의 다른 실시예에 따라, 음성인식 시스템의 에러정정방법에 있어서, 등록 음성인식데이터와, 상기 등록 음성인식데이터에 대응하는 등록 응답데이터에 대한 등록 데이터베이스를 구축하는 단계와; 에러 음성인식데이터와, 상기 에러 음성인식데이터에 대응하는 정정 응답데이터에 대한 정정 데이터베이스를 구축하는 단계와; 사용자의 음성명령을 인식하여 제1 음성인식데이터를 생성하는 단계와; 상기 제1 음성인식데이터에 대응하는 등록 음성인식데이터가 상기 등록 데이터베이스에 존재하는지 여부를 검색하는 단계와; 상기 제1 음성인식데이터에 대응하는 상기 등록 음성인식데이터가 검색되지 않은 경우, 상기 제1 음성인식데이터에 대응하는 에러 음성인식데이터가 상기 정정 데이터베이스에 존재하는지 여부를 검색하는 단계와; 상기 제1 음성인식데이터에 대응하는 상기 에러 음성인식데이터가 검색되지 않은 경우, 에러 응답을 출력하는 단계와; 상기 에러 응답 에 대응하여 입력되는 사용자의 에러정정명령을 인식하여 제2 음성인식데이터를 생성하는 단계와; 상기 제2 음성인식데이터에 대응하는 등록 음성인식데이터가 상기 등록 데이터베이스에 존재하는지 여부를 검색하는 단계와; 상기 제2 음성인식데이터에 대응하는 상기 등록 음성인식데이터가 존재하는 경우, 상기 제2 음성인식데이터에 대응하는 상기 등록 음성인식데이터에 대한 상기 등록 응답데이터를 출력하는 단계와; 상기 제1 음성인식데이터 및 상기 출력된 등록 응답데이터를 상기 정정 데이터베이스에 에러 음성인식데이터 및 정정 응답데이터로 업데이트하는 단계를 포함하는 것을 특징으로 하는 음성인식 시스템의 에러정정방법에 의해 달성될 수 있다.
그리고, 상기 제1 음성인식데이터에 대응하는 상기 등록 음성인식데이터가 검색된 경우, 상기 검색된 등록 음성인식데이터에 대응하는 등록 응답데이터를 출력하는 단계를 더 포함할 수 있다.
그리고, 상기 제1 음성인식데이터에 대응하는 상기 에러 음성인식데이터가 검색된 경우, 상기 검색된 에러 음성인식데이터에 대응하는 정정 응답데이터를 출력하는 단계를 더 포함할 수 있다.
이하에서는 첨부도면을 참조하여 본 발명에 대해 상세히 설명한다.
도 1은 본 발명에 따른 음성인식 시스템의 제어블럭도이다. 도면에 도시된 바와 같이, 본 발명에 따른 음성인식 시스템은 음성인식처리부(10), 등록 데이터베이스(40), 정정 데이터베이스(30) 및 제어부(20)를 포함한다.
음성인식처리부(10)는 사용자의 음성명령을 인식하여 음성인식데이터를 출력 한다.
본 발명에 따른 음성인식처리부(10)는, 도 2에 도시된 바와 같이, 음성인식부(11)와 명령해석부(12)를 포함할 수 있다.
음성인식부(11)는 음성인식 시스템으로 입력되는 사용자의 음성명령을 텍스트 데이터로 변환한다. 즉, 음성인식부(11)는 사용자의 음성명령을 입력받아 이를 인식하고, 인식된 바에 따라 음성명령을 문자 형태의 텍스트 데이터로 변환한다.
명령해석부(12)는 음성인식부(11)에서 출력되는 텍스트 데이터를 해석하여 논리적인 형태의 음성인식데이터로 변환한다.
명령해석부(12)는, 예를 들어, 형태소 해석이나, 구문 해석, 의미 해석 등을 통해 음성인식부(11)를 통해 출력된 텍스트 데이터가 갖는 의미를 해석하게 된다. 즉, 명령해석부(12)는 음성인식부(11)를 통해 수신된 텍스트 데이터에 대해 형태소 해석과 구문 해석을 거쳐 동사와 명사, 이들 간의 수식관계를 밝기고, 이에 근거하여 수행해야할 명령과 그 대상을 추출할 수 있다..
그리고, 명령어해석부는 텍스트 데이터의 해석을 통해 음성인식데이터를 생성하여 이를 피제어 디바이스(50) 및/또는 제어부(20)로 출력한다.
여기서, 음성인식처리부(10)는 사용자의 음성명령을 특정 피제어 디바이스(50)의 특정 동작을 수행하는 것으로 인식한 경우, 예컨대, 사용자가 "TV를 켜라"라는 음성명령을 입력한 경우, 이에 대응하는 음성인식데이터를 피제어 디바이스(50)인 TV로 출력함으로서, TV가 켜지도록 한다.
또한, 음성인식처리부(10)는 사용자의 음성명령이 제어부(20)로부터 응답데 이터를 생성하게 하는 것으로 인식하는 경우, 예컨대, "대한민국의 수도는 어디인가"라는 음성명령을 입력한 경우, 이에 대응하는 음성인식데이터를 제어부(20)로 출력한다.
제어부(20)는 음성인식처리부(10)로부터 출력되는 음성인식데이터에 대응하는 적절한 응답을 등록 데이터베이스(40) 또는 정정 데이터베이스(30)에서 검색하여 출력한다.
본 발명에 따른 등록 데이터베이스(40)에는 등록 음성인식데이터와, 등록 음성인식데이터에 대응하는 등록 응답데이터가 등록된다.
여기서, 제어부(20)는 음성인식처리부(10)로부터 출력되는 음성인식데이터에 대응하는 등록 음성인식데이터가 등록 데이터베이스(40)에 존재하는지 여부를 검색한다. 예컨대, 상기와 같이 "대한민국의 수도는 어디인가"라는 음성명령이 입력되고, 입력된 음성명령에 대응하는 음성인식데이터가 음성인식처리부(10)로부터 출력되는 경우 제어부(20)는 음성인식데이터에 대응하는 등록 음성인식데이터를 검색하고, 검색된 등록 음성인식데이터에 대응하는 응답, 예컨대, "서울"이라는 정보를 포함하는 등록 응답데이터를 출력한다.
한편, 본 발명에 따른 정정 데이터베이스(30)에는 에러 음성인식데이터와, 에러 음성인식데이터에 대응하는 정정 응답데이터가 등록된다.
여기서, 제어부(20)는 상기와 같이, 음성인식처리부(10)로부터 출력되는 음성인식데이터에 대응하는 등록 음성인식데이터가 등록 데이터베이스(40)에서 검색되지 않은 경우, 정정 데이터베이스(30)에 음성인식데이터에 대응하는 에러 음성인 식데이터가 존재하는지 여부를 검색한다.
그리고, 제어부(20)는 정정 데이터베이스(30)에 음성인식데이터에 대응하는 에러 음성인식데이터가 검색된 경우, 검색된 에러 음성인식데이터에 대응하는 정정 응답데이터를 출력한다.
반면, 제어부(20)는 정정 데이터베이스(30)에 음성인식데이터에 대응하는 에러 음성인식데이터가 검색되지 않는 경우, 사용자에게 음성명령의 인식에 에러가 났음을 알리는 에러 응답을 출력하고, 에러 응답에 대응하여 입력되는 사용자의 에러정정명령에 따라 정정 데이터베이스(30)를 업데이트한다.
여기서, 정정 데이터베이스(30)는 음성인식처리부(10)로부터 출력되는 음성인식데이터의 에러에 대한 다양한 유형의 에러 음성인식데이터를 포함한다. 예컨대, 상기와 같이, 사용자가 "대한민국의 수도는 어디인가"라는 음성명령을 음성인식 시스템에 입력하였는데, 음성인식처리부(10)가 이를 잘못 인식하여, "대한민국의 수도는 몇시인가", "대한국의 수도는 어디인가", "대한민국의 주도는 어디인가" 등의 형태의 음성인식데이터를 출력하는 경우와 같이, 등록 데이터베이스(40)에 등록된 등록 음성인식데이터에 포함되지 않은 다양한 형태의 인식 오류에 대한 정보가 저장된다.
또한, 정정 데이터베이스(30)의 에러 음성인식데이터에 대응하는 정정 응답데이터는 상기와 같이 음성인식처리부(10)에서 잘못 인식된 다양한 형태의 인식 에러에 대한 적합한 응답에 대한 정보가 저장된다. 예컨대, 상기와 같이, "대한민국의 수도는 몇시인가", "대한국의 수도는 어디인가", "대한민국의 주도는 어디인가" 등의 형태의 에러 음성인식데이터가 등록되는 경우, 이에 대한 적합한 응답인 "수도"라는 정보를 포함하는 정정 응답데이터가 저장된다. 따라서, 사용자가 "대한민국의 수도는 어디인가"라는 음성명령을 입력하였는데, 이를 음성인식처리부(10)가 "대한민국의 수도는 몇시인가", "대한국의 수도는 어디인가", "대한민국의 주도는 어디인가" 중 어느 하나의 형태로 음성인식데이터로 인식한 경우, 제어부(20)는 정정 데이터베이스(30)로부터 상기 형태의 음성인식데이터에 대응하는 에러 음성인식데이터를 검색하고, 검색된 에러 음성인식데이터에 대응하는 적합한 응답, 즉, "서울"이라는 정보를 포함하는 정정 응답데이터를 출력한다.
여기서, 본 발명에 따른 정정 데이터베이스(30)가 업데이트되는 과정에 대한 상세한 설명은 후술한다.
한편, 본 발명에 따른 제어부(20)는, 도 2에 도시된 바와 같이, 다이얼로그 매니저(21)와, 에러정정부(22)를 포함할 수 있다.
다이얼로그 매니저(21)는 음성인식처리부(10)로부터 출력되는 음성인식데이터에 대응하는 등록 음성인식데이터를 등록 데이터베이스(40)에서 검색한다. 그리고, 음성인식데이터에 대응하는 등록 음성인식데이터가 검색되는 경우, 다이얼로그 매니저(21)는 검색된 등록 음성인식데이터에 대응하는 등록 응답데이터를 사용자의 음성명령에 대한 응답으로 출력한다.
반면, 다이얼로그 매니저(21)는 음성인식데이터에 대응하는 등록 음성인식데이터가 검색되지 않는 경우, 에러정정부(22)가 음성인식데이터에 대응하는 에러 음성인식데이터를 검색하도록 제어한다.
한편, 에러정정부(22)는 에러검색부(23)와 에러업데이터부를 포함할 수 있다.
에러검색부(23)는 다이얼로그 매니저(21)의 제어에 따라, 음성인식데이터에 대응하는 에러 음성인식데이터가 정정 데이터베이스(30)에 존재하는지 여부를 검색한다. 그리고, 음성인식데이터에 대응하는 에러 음성인식데이터가 검색되는 경우, 에러검색부(23)는 검색된 에러 음성인식데이터에 대응하는 정정 응답데이터를 다이얼로그 매니저(21)로 출력한다. 그리고, 다이얼로그 매니저(21)는 에러검색부(23)로부터의 정정 응답데이터를 사용자의 음성명령에 대한 응답으로 출력한다.
에러업데이트부(24)는 다이얼로그 매니저(21)의 제어에 따라, 정정 데이터베이스(30)의 에러 음성인식데이터 및 정정 응답데이터를 업데이트한다. 이에 대한 설명은 후술한다.
이하에서는, 상기와 같은 구성에 따라, 본 발명에 따른 음성인식 시스템의 에러정정방법을 도 3 및 도 4를 참조하여 설명한다.
먼저, 등록 데이터베이스(40) 및 정정 데이터베이스(30)가 구축된 상태(S10)에서, 사용자에 의해 음성명령이 입력된다(S11). 여기서, 본 발명의 일 실시예에서는, 사용자가 전술한 바와 같이, "대한민국의 수도는 어디인가"라는 음성명령을 입력하는 것을 일 예로 한다.
이 때, 음성인식처리부(10)는 음성명령을 인식하여 음성인식데이터(이하, "제1 음성인식데이터"라 함)를 생성한다(S12).
그런 다음, 다이얼로그 매니저(21)는 음성인식처리부(10)로부터의 제1 음성 인식데이터에 대응하는 등록 음성인식데이터가 존재하는지 등록 데이터베이스(40)를 검색한다(S13). 여기서, 음성명령의 인식에 오류가 없는 경우에는 S15 단계에서와 같이, 검색되는 등록 음성인식데이터에 대응하는 등록 응답데이터가 사용자의 음성명령에 대한 응답으로 출력된다(S15).
반면, 사용자의 음성명령의 인식에 에러가 발생하여, 예컨대, "대한민국의 주도는 어디인가"라 인식하여, 인식 에러에 대응하는 제1 음성인식데이터가 생성된 경우에는 다이얼로그 매니저(21)에 의해 제1 음성인식데이터에 대응하는 등록 음성인식데이터는 등록 데이터베이스(40)로부터 검색되지 않는다.
이 때, 다이얼로그 매니저(21)는 에러정정부(22)의 에러검색부(23)가 제1 음성인식데이터에 대응하는 에러 음성인식데이터가 존재하는지 정정 데이터베이스(30)를 검색하도록 제어한다(S14). 여기서, 에러가 발생한 제1 음성인식데이터에 대응하는 에러 음성인식데이터가 이미 정정 데이터베이스(30)에 등록되어 있는 경우에는, S16 단계에서와 같이, 검색된 에러 음성인식데이터에 대응하는 정정 응답데이터가 사용자의 음성명령에 대한 응답으로 다이얼로그 매니저(21)에 의해 출력된다(S16).
반면, 에러검색부(23)는 제1 음성인식데이터에 대응하는 에러 음성인식데이터가 검색되지 않는 경우, 이를 다이얼로그 매니저(21)에 알린다. 이 때, 다이얼로그 매니저(21)는 사용자의 음성명령의 인식에 에러가 발생했음을 알리는 에러응답을 출력한다(S17).
이 때, 음성인식 시스템은 사용자가 에러정정명령을 입력하는지 여부를 감지 한다(S18). 여기서, 에러정정명령은 S11단계에서 사용자가 입력한 음성명령, 즉, "대한민국의 수도는 어디인가"와 동일한 음성명령일 수 있다.
그리고, 사용자의 에러정정명령이 입력되면, 음성인식처리부(10)는 에러정정명령을 인식하여 음성인식데이터(이하, "제2 음성인식데이터"라 함)를 생성한다(S19).
그런 다음, 다이얼로그 매니저(21)는 제2 음성인식데이터에 대응하는 등록 음성인식데이터가 등록 데이터베이스(40)에 존재하는지 여부를 검색한다(S20).
여기서, 음성인식처리부(10)가 에러정정명령을 인식하여 제2 음성인식데이터를 출력하는데 있어서, 오류가 발생하지 않는 경우에는 제2 음성인식데이터에 대응하는 등록 음성인식데이터가 등록 데이터베이스(40)에서 검색된다.
이 때, 다이얼로그 매니저(21)는 검색된 등록 데이터베이스(40)에 대응하는 등록 응답데이터를 사용자의 음성명령(또는 에러정정명령)에 대한 응답으로 출력한다(S21).
또한, 다이얼로그 매니저(21)는 제1 음성인식데이터와, S21 단계에서 출력된 등록 응답데이터를 에러정정부(22)의 에러업데이트부(24)로 출력하고, 에러업데이트부(24)가 제1 음성인식데이터와 S21 단계에서 출력된 등록 응답데이터를 각각 정정 데이터베이스(30)의 에러 음성인식데이터 및 정정 응답데이터로 업데이트하도록 제어한다(S22).
이에 따라, 추후에 사용자가 "대한민국의 수도는 어디인가"라는 음성명령을 S11단계에 입력하고, 음성인식처리부(10)가 입력된 음성명령을 전술한 바와 같이, "대한민국의 주도는 어디인가"라고 인식하여 제1 음성인식데이터를 생성하는 경우에도, S14 단계에서 에러검색부(23)가 제1 음성인식데이터에 대응하는 에러 음성인식데이터를 검색하게 되고, S16 단계에서와 같이, 검색된 에러 음성인식데이터에 대응하는 정정 응답데이터를 응답으로 출력할 수 있게 된다.
한편, S20 단계에서 제2 음성인식데이터에 대응하는 등록 음성인식데이터가 존재하지 않는 경우, 다이얼로그 매니저(21)는 다시 에러응답을 출력하여 사용자의 에러정정명령의 재입력을 요구하게 된다.
이에 따라, 본 발명에 따른 음성인식 시스템에서는 사용자의 음성명령의 인식에 에러가 발생하는 경우 상기와 같은 과정을 통해 정정 데이터베이스(30)를 업데이트함으로써, 추후에 동일한 인식 에러 발생하더라도 적합한 응답을 사용자에게 제공할 수 있게 된다.
전술한 실시예에서는 사용자의 음성명령에 대한 음성인식 시스템의 응답이 음성 형태인 것을 일 예로 하였으나, 이미지가 표시되는 디스플레이부에 이미지 형태로 출력될 수 있음은 물론이다.
또한, 전술한 실시예에서의 등록 데이터베이스(40)는 그 명칭을 불문하고 사용자의 음성명령에 대한 응답에 대한 정보를 구비하고 있는 것을 포함한다. 예컨대, 등록 음성인식데이터와 등록 응답데이터가 저장된 메모리 등의 저장매체나, 인터넷 등의 네트워크를 통해 등록 음성인식데이터에 대응하는 등록 응답데이터를 검색할 수 있음은 물론이다.
이와 같이, 등록 데이터베이스(40)와, 정정 데이터베이스(30)와, 사용자의 음성명령을 인식하여 제1 음성인식데이터를 생성하는 음성인식처리부(10) 및 제어부(20)를 마련하고; 제어부(20)가 등록 데이터베이스(40) 및 정정 데이터베이스(30)에서 제1 음성인식데이터에 대응하는 등록 음성인식데이터 및 에러음성인식데이터가 존재하는지 여부를 검색하고, 제1 음성인식데이터에 대응하는 등록음성인식데이터 및 에러 음성인식데이터가 존재하지 않는 경우 에러 응답을 출력하고, 에러 응답에 대응하여 입력되는 사용자의 에러정정명령에 따라 음성인식처리부(10)에서 생성되는 제2 음성인식데이터에 대응하는 등록 음성인식데이터가 등록 데이터베이스(40)에 존재하는지 여부를 검색하고, 제2 음성인식데이터에 대응하는 등록 음성인식데이터가 존재하는 경우 제2 음성인식데이터에 대응하는 등록 음성인식데이터에 대한 등록 응답데이터를 출력하며, 제1 음성인식데이터 및 출력된 등록 응답데이터를 정정 데이터베이스(30)에 에러 음성인식데이터 및 정정 응답데이터로 업데이트함으로써, 음성명령의 인식에서 발생 가능한 다양한 형태의 에러와 그 에러에 대한 적합한 응답에 대한 정보를 정정 데이터베이스(30)로 지속적으로 구축하여 추후의 동일한 에러의 발생에 능동적으로 대응할 수 있게 된다.
이상 설명한 바와 같이, 본 발명에 따르면, 정정 데이터베이스를 구축하여 음성인식에 에러가 발생하는 경우 정정 데이터베이스에 기초하여 적합한 응답을 사용자에게 제공할 수 있는 음성인식 시스템 및 음성인식 시스템의 에러정정방법이 제공된다.

Claims (7)

  1. 음성인식 시스템에 있어서,
    등록 음성인식데이터와, 상기 등록 음성인식데이터에 대응하는 등록응답데이터에 대한 등록 데이터베이스와;
    에러 음성인식데이터와, 상기 에러 음성인식데이터에 대응하는 정정응답데이터에 대한 정정 데이터베이스와;
    사용자의 음성명령을 인식하여 제1 음성인식데이터를 생성하는 음성인식처리부와;
    상기 등록 데이터베이스 및 상기 정정 데이터베이스에서 상기 제1 음성인식데이터에 대응하는 등록 음성인식데이터 및 에러음성인식데이터가 존재하는지 여부를 검색하고, 상기 제1 음성인식데이터에 대응하는 상기 등록음성인식데이터 및 상기 에러 음성인식데이터가 존재하지 않는 경우 에러 응답을 출력하고, 상기 에러 응답에 대응하여 입력되는 사용자의 에러정정명령에 따라 상기 음성인식처리부에서 생성되는 제2 음성인식데이터에 대응하는 등록 음성인식데이터가 상기 등록 데이터베이스에 존재하는지 여부를 검색하고, 상기 제2 음성인식데이터에 대응하는 상기 등록 음성인식데이터가 존재하는 경우 상기 제2 음성인식데이터에 대응하는 상기 등록 음성인식데이터에 대한 상기 등록 응답데이터를 출력하며, 상기 제1 음성인식데이터 및 상기 출력된 등록 응답데이터를 상기 정정 데이터베이스에 에러 음성인식데이터 및 정정 응답데이터로 업데이트하는 제어부를 포함하는 것을 특징으로 하 는 음성인식 시스템.
  2. 제1항에 있어서,
    상기 정정 데이터베이스에서 상기 제1 음성인식데이터에 대응하는 상기 에러 음성인식데이터를 검색하고, 상기 제1 음성인식데이터 및 상기 출력된 등록 응답데이터를 상기 정정 데이터베이스에 상기 에러 음성인식데이터 및 상기 정정 응답데이터로 업데이트하는 에러정정부와;
    상기 등록 데이터베이스에서 상기 제1 음성인식데이터에 대응하는 상기 등록 음성인식데이터를 검색하고, 상기 제1 음성인식데이터에 대응하는 상기 등록 음성인식데이터가 검색되지 않는 경우 상기 에러정정부가 상기 정정 데이터베이스에서 상기 제1 음성인식데이터에 대응하는 상기 에러 음성인식데이터를 검색하도록 제어하는 다이얼로그 매니저를 포함하는 것을 특징으로 하는 음성인식 시스템.
  3. 제2항에 있어서,
    상기 다이얼로그 매니저는 상기 제1 음성인식데이터에 대응하는 상기 등록 음성인식데이터가 검색된 경우 상기 검색된 등록 음성인식데이터에 대응하는 등록 응답데이터를 출력하고;
    상기 에러정정부는 상기 다이얼로그 매니저의 제어에 따라 상기 정정 데이터베이스에서 상기 제1 음서인식데이터에 대응하는 상기 에러 음성인식데이터가 검색된 경우 상기 검색된 에러 음성인식 데이터에 대응하는 정정 응답데이터를 상기 다 이얼로그 매니저에 출력하며;
    상기 다이얼로그 매니저는 상기 에러정정부로부터의 상기 정정 응답데이터를 출력하는 것을 특징으로 하는 음성인식 시스템.
  4. 제1항 내지 제3항 중 어느 한 항에 있어서,
    상기 음성처리부는,
    상기 음성명령 및 상기 에러정정명령을 인식하여 텍스트 데이터로 변환하는 음성인식부와;
    상기 음성인식부로부터 출력되는 상기 텍스트 데이터를 합성하여 상기 제1 음성인식데이터 및 상기 제2 음성인식데이터를 생성하는 명령해석부를 포함하는 것을 특징으로 하는 음성인식 시스템.
  5. 음성인식 시스템의 에러정정방법에 있어서,
    등록 음성인식데이터와, 상기 등록 음성인식데이터에 대응하는 등록 응답데이터에 대한 등록 데이터베이스를 구축하는 단계와;
    에러 음성인식데이터와, 상기 에러 음성인식데이터에 대응하는 정정 응답데이터에 대한 정정 데이터베이스를 구축하는 단계와;
    사용자의 음성명령을 인식하여 제1 음성인식데이터를 생성하는 단계와;
    상기 제1 음성인식데이터에 대응하는 등록 음성인식데이터가 상기 등록 데이터베이스에 존재하는지 여부를 검색하는 단계와;
    상기 제1 음성인식데이터에 대응하는 상기 등록 음성인식데이터가 검색되지 않은 경우, 상기 제1 음성인식데이터에 대응하는 에러 음성인식데이터가 상기 정정 데이터베이스에 존재하는지 여부를 검색하는 단계와;
    상기 제1 음성인식데이터에 대응하는 상기 에러 음성인식데이터가 검색되지 않은 경우, 에러 응답을 출력하는 단계와;
    상기 에러 응답에 대응하여 입력되는 사용자의 에러정정명령을 인식하여 제2 음성인식데이터를 생성하는 단계와;
    상기 제2 음성인식데이터에 대응하는 등록 음성인식데이터가 상기 등록 데이터베이스에 존재하는지 여부를 검색하는 단계와;
    상기 제2 음성인식데이터에 대응하는 상기 등록 음성인식데이터가 존재하는 경우, 상기 제2 음성인식데이터에 대응하는 상기 등록 음성인식데이터에 대한 상기 등록 응답데이터를 출력하는 단계와;
    상기 제1 음성인식데이터 및 상기 출력된 등록 응답데이터를 상기 정정 데이터베이스에 에러 음성인식데이터 및 정정 응답데이터로 업데이트하는 단계를 포함하는 것을 특징으로 하는 음성인식 시스템의 에러정정방법.
  6. 제5항에 있어서,
    상기 제1 음성인식데이터에 대응하는 상기 등록 음성인식데이터가 검색된 경우, 상기 검색된 등록 음성인식데이터에 대응하는 등록 응답데이터를 출력하는 단계를 더 포함하는 것을 특징으로 하는 음성인식 시스템의 에러정정방법.
  7. 제5항 또는 제6항에 있어서,
    상기 제1 음성인식데이터에 대응하는 상기 에러 음성인식데이터가 검색된 경우, 상기 검색된 에러 음성인식데이터에 대응하는 정정 응답데이터를 출력하는 단계를 더 포함하는 것을 특징으로 하는 음성인식 시스템의 에러정정방법.
KR1020040058890A 2004-07-27 2004-07-27 음성인식 시스템 및 음성인식 시스템의 에러정정방법 KR20060010260A (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020040058890A KR20060010260A (ko) 2004-07-27 2004-07-27 음성인식 시스템 및 음성인식 시스템의 에러정정방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020040058890A KR20060010260A (ko) 2004-07-27 2004-07-27 음성인식 시스템 및 음성인식 시스템의 에러정정방법

Publications (1)

Publication Number Publication Date
KR20060010260A true KR20060010260A (ko) 2006-02-02

Family

ID=37120600

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020040058890A KR20060010260A (ko) 2004-07-27 2004-07-27 음성인식 시스템 및 음성인식 시스템의 에러정정방법

Country Status (1)

Country Link
KR (1) KR20060010260A (ko)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109408264A (zh) * 2018-09-28 2019-03-01 北京小米移动软件有限公司 语音助手错误响应的修正方法、装置、设备及存储介质
KR20200118744A (ko) * 2019-04-08 2020-10-16 퓨렌스 주식회사 클라우드 기반의 음성 데이터 텍스트 변환 시스템 및 이의 실행 방법

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109408264A (zh) * 2018-09-28 2019-03-01 北京小米移动软件有限公司 语音助手错误响应的修正方法、装置、设备及存储介质
KR20200118744A (ko) * 2019-04-08 2020-10-16 퓨렌스 주식회사 클라우드 기반의 음성 데이터 텍스트 변환 시스템 및 이의 실행 방법

Similar Documents

Publication Publication Date Title
US10073843B1 (en) Method and apparatus for cross-lingual communication
US7720674B2 (en) Systems and methods for processing natural language queries
KR101099196B1 (ko) 적응형 기계 번역
US7983997B2 (en) Interactive complex task teaching system that allows for natural language input, recognizes a user's intent, and automatically performs tasks in document object model (DOM) nodes
US7698656B2 (en) Methods, apparatus and computer programs supporting shortcuts across a plurality of devices
US20140316764A1 (en) Clarifying natural language input using targeted questions
WO2018045646A1 (zh) 基于人工智能的人机交互方法和装置
US11544448B2 (en) Computer-implemented presentation of synonyms based on syntactic dependency
EP4109324A2 (en) Method and apparatus for identifying noise samples, electronic device, and storage medium
JPH06138815A (ja) 手話/単語変換システム
JP2001209393A (ja) 自然言語入力方法及び装置
EP3608772B1 (en) Method for executing function based on voice and electronic device supporting the same
US9697194B2 (en) Contextual auto-correct dictionary
US20140067731A1 (en) Multi-dimensional information entry prediction
US8775459B2 (en) Method and apparatus for robust input interpretation by conversation systems
US8219905B2 (en) Automatically detecting keyboard layout in order to improve the quality of spelling suggestions
US20150331851A1 (en) Assisted input of rules into a knowledge base
WO2022105754A1 (zh) 输入文字的方法、装置和电子设备
KR102285115B1 (ko) 챗봇 기반의 웹페이지 내비게이션 장치 및 방법
KR20060010260A (ko) 음성인식 시스템 및 음성인식 시스템의 에러정정방법
JP4435144B2 (ja) データ検索システム及びプログラム
US5974370A (en) System for reviewing its processing and method therefor
WO2021153024A1 (ja) 英文添削装置
CN112685126B (zh) 文档内容显示方法及装置
JPH0431966A (ja) 翻訳支援装置

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E601 Decision to refuse application