KR100919225B1 - 음성 대화 시스템에 있어서 다단계 검증을 이용한 대화오류 후처리 장치 및 방법 - Google Patents

음성 대화 시스템에 있어서 다단계 검증을 이용한 대화오류 후처리 장치 및 방법

Info

Publication number
KR100919225B1
KR100919225B1 KR1020070095457A KR20070095457A KR100919225B1 KR 100919225 B1 KR100919225 B1 KR 100919225B1 KR 1020070095457 A KR1020070095457 A KR 1020070095457A KR 20070095457 A KR20070095457 A KR 20070095457A KR 100919225 B1 KR100919225 B1 KR 100919225B1
Authority
KR
South Korea
Prior art keywords
error
conversation
analysis
post
processing
Prior art date
Application number
KR1020070095457A
Other languages
English (en)
Other versions
KR20090030117A (ko
Inventor
오효정
이충희
이창기
황이규
왕지현
장명길
Original Assignee
한국전자통신연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국전자통신연구원 filed Critical 한국전자통신연구원
Priority to KR1020070095457A priority Critical patent/KR100919225B1/ko
Priority to US12/153,896 priority patent/US8050909B2/en
Publication of KR20090030117A publication Critical patent/KR20090030117A/ko
Application granted granted Critical
Publication of KR100919225B1 publication Critical patent/KR100919225B1/ko

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/10Speech classification or search using distance or distortion measures between unknown speech and reference templates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • G06F40/35Discourse or dialogue representation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
    • G10L15/063Training
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/14Speech classification or search using statistical models, e.g. Hidden Markov Models [HMMs]
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • G10L15/1815Semantic context, e.g. disambiguation of the recognition hypotheses based on word meaning
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • Theoretical Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Machine Translation (AREA)

Abstract

본 발명은 음성 대화 시스템에 있어서 다단계 검증을 이용한 대화 오류 후처리 장치 및 방법에 관한 것으로, 음성 인식 결과 분석, 언어 분석, 담화 분석 및 대화 분석을 포함하는 다단계 검증을 통해 현재 사용자의 발화뿐만 아니라 전체 대화 흐름을 고려하여 음성 대화 시스템에서 발생할 수 있는 다양한 오류들을 검출하고 그 오류 유형에 적합한 오류 후처리를 수행함으로써, 음성 인식 오류를 줄일 수 있는 것을 특징으로 한다.

Description

음성 대화 시스템에 있어서 다단계 검증을 이용한 대화 오류 후처리 장치 및 방법{The method and apparatus for post-processing conversation error using multilevel check in voice conversation system}
본 발명은 음성 대화 시스템에 있어서 다단계 검증을 이용한 대화 오류 후처리 장치 및 방법에 관한 것으로, 더 자세하게는 음성 대화 시스템에서 발생할 수 있는 다양한 대화 오류를 다단계로 인식하여 그 대화 오류에 대한 후처리를 효율적으로 수행할 수 있는 기술에 관한 것이다.
본 발명은 정보통신부의 IT신성장동력핵심기술개발사업의 일환으로 수행한 연구로부터 도출된 것이다[과제관리번호: 2006-S-036-02, 과제명: 신성장동력산업용 대용량 대화형 분산 처리 음성인터페이스 기술개발].
음성 인식(Speech Recognition) 기술은 인간의 음성을 기계가 분석하여 이를 인식 또는 이해하는 기술을 말하며, 최근에는 이와 같은 음성 인식 기술이 전화 다이얼링, 사용자 식별, 가전기기 제어 등과 같은 다양한 분야에 응용되고 있다.
하지만, 음성이 발화되는 환경은 여러 잡음 및 소음으로 인하여 보통 열악하기 때문에 기계가 그 내용을 정확히 인식하여 결과를 출력한다는 것은 대단히 어려운 일이다.
따라서, 지금까지 구현된 음성 인식기의 출력은 어느 정도 오류를 포함하고 있으며, 이를 실제 시스템에 적용하기 위해서는 최종 음성 인식 결과를 출력하기 전에 음성 인식 결과에서 오류를 검출하여 이를 보정하는 작업이 필수적으로 필요하다.
이러한 음성 인식 오류를 줄이기 위한 방편으로서, 미국특허 2006/0247931호(발명의 명칭 : Method and Apparatus for multiple value confirmation and correction in spoken dialog systems, 공개일 : 2006.11.02)에는 음성 인식의 다중값에 대하여 사용자의 확인 및 보정을 통해 최종 음성 인식 결과를 출력하는 방법이 개시되어 있으며, US 2006/0149544호(발명의 명칭 : Error Prediction in Spoken Dialog Systems, 공개일 : 2006.07.06)에는 음성 인식 결과에 대한 신뢰도와 사용자 의도와의 매핑 신뢰도를 조합하여 음성 인식 오류를 결정하는 방법이 개시되어 있다.
또한, 연구논문 "Three phase verification for spoken dialog clarification"(Sangkeun Jung, Cheongjae Lee, Gary Geunbae Lee, International conference on intelligent user interfaces, 2006)에는 단어 오류 확인, 발화 확인, 슬롯값 확인 단계를 거쳐 오류 부분 및 오류 유형을 정확하게 인식하는 방법이 개시되어 있으며, 연구논문 "Handling errors and determining confirmation strategies An object-based approach"(Michael McTear, Ian O’Neill, Philip Hanna, Xingkun Liu, IEEE Transactions on speech and audio processing, Vol. 45, NO. 3, pp. 249-269, 2005)에는 객체 기반 접근방법을 기반으로 음향학적 신뢰 점수를 이용하여 오류를 인식하고 발화 전체에 대해 확인을 하거나, 일정 대화가 지난 후에 지금까지 나온 대화를 정리해서 최종적으로 사용자에게 확인해서 오류를 인식해서 보정하는 방법이 개시되어 있다.
하지만, 상기의 종래 기술들은 사용자의 현재 발화문에 대하여 음성학적 측면에서 오류를 검출하여 사용자의 확인 또는 선택에 따라 오류를 보정하는 방법들로서, 전체 대화 내용을 고려하지 않은 상태에서 음성 인식 오류 검출이 이루어지기 때문에 오히려 사용자에게 확인 절차로 인한 불편함을 초래할 수 있다는 문제점이 있다.
따라서, 본 발명은 상기와 같은 문제점을 해결하기 위해 안출한 것으로서, 본 발명의 목적은 다단계 검증을 통해 현재 발화뿐 아니라 전체 대화 흐름을 고려하여 대화 오류 유형을 인식하고 그 오류 유형에 적합한 오류 후처리 방법을 수행하도록 하는 것이다.
상기 목적을 달성하기 위하여 본 발명에 따른 다단계 검증을 이용한 대화 오류 후처리 방법은, (a) 사용자 음성을 인식하여 상기 음성 인식을 통해 얻어진 사용자 발화문에 포함된 음성 인식 오류를 검출하는 단계; (b) 상기 사용자 발화문을 언어적으로 분석하여 언어 분석 결과에 포함된 오류를 검출하는 단계; (c) 문맥을 기반으로 상기 사용자 발화문의 담화 의미를 분석하여 담화 분석 결과에 포함된 오류를 검출하는 단계; (d) 전체 대화 흐름을 기반으로 상기 사용자 발화문의 대화 의미를 분석하여 대화 분석 결과에 포함된 오류를 검출하는 단계; 및 (e) 상기 검출된 오류의 오류 유형을 분석하여 해당 오류 유형에 따라 오류 보정을 위한 오류 후처리를 수행하는 단계를 포함하는 것을 특징으로 한다.
한편, 상기 목적을 달성하기 위하여 본 발명에 따른 다단계 검증을 이용한 대화 오류 후처리 장치는, 사용자 음성을 인식하는 음성 인식부; 상기 음성 인식 결과로부터 얻어진 사용자 발화문을 언어적으로 분석하는 언어 분석부; 문맥을 기반으로 상기 사용자 발화문의 담화 의미를 분석하는 담화 분석부; 전체 대화 흐름을 기반으로 상기 사용자 발화문의 대화 의미를 분석하여 대화 분석 결과에 따라 시스템 대응 처리를 제어하는 대화 분석 및 관리부; 상기 음성 인식 결과, 언어 분석 결과, 담화 분석 결과, 대화 분석 결과로부터 각각 음성 인식 오류, 언어 분석 오류, 담화 분석 오류, 대화 분석 오류를 검출하여 상기 검출된 오류의 오류 유형을 분석하는 오류 검출 및 분석부; 상기 검출된 오류의 오류 유형에 따라 오류 보정을 위한 오류 후처리를 수행하는 오류 후처리부; 및 상기 대화 분석 및 관리부의 제어에 따라 상기 사용자 발화문에 대한 시스템 대응 처리를 수행하는 시스템 대응부를 포함하는 것을 특징으로 한다.
본 발명에 따르면, 현재 발화뿐 아니라 전체 대화 흐름을 고려하여 다단계 검증을 통해 음성 대화 시스템에서 발생할 수 있는 다양한 오류들을 검출하고 그 오류 유형에 적합한 오류 후처리에 따라 음성 인식 오류를 줄여줌으로써 음성 인식의 정확도를 향상시킬 수 있는 효과가 있다.
도 1은 본 발명에 따른 대화 오류 후처리 장치가 적용된 음성 인식 시스템을 나타낸 블록도이다.
도 2는 본 발명에 따른 다단계 검증을 이용한 대화 오류 후처리 방법을 나타낸 흐름도이다.
* 도면의 주요부분에 대한 부호의 설명 *
100 : 대화 오류 후처리 장치
110 : 오류 검출 및 분석부
120 : 언어 분석부
130 : 담화 분석부
140 : 대화 분석 및 관리부
150 : 오류 후처리부
160 : 시스템 대응부
이하, 본 발명에 따른 다단계 검증을 이용한 대화 오류 후처리 장치 및 방법에 대하여 첨부된 도면을 참조하여 상세히 설명하기로 한다.
도 1은 본 발명에 따른 대화 오류 후처리 장치(100)가 적용된 음성 인식 시스템을 나타낸 블록도이다.
도 1에 도시된 바와 같이, 본 발명에 따른 대화 오류 후처리 장치(100)는 음성 인식 결과의 오류를 처리하기 위한 것으로, 오류 검출 및 분석부(110), 언어 분석부(120), 담화 분석부(130), 대화 분석 및 관리부(140), 오류 후처리부(150) 및 시스템 대응부(160)로 구성되어 있다.
우선, 음성 입력부(10)를 통해 입력된 사용자의 음성 신호는 전처리부(30)를 거쳐 음성 인식부(50)로 전달되며, 음성 인식부(50)는 음성 신호의 특징 벡터를 추출하여 음성 인식을 수행한 후 음성 인식을 통해 얻어진 사용자 발화문을 대화 오류 후처리 장치(100)로 전달한다. 여기에서, 음성 인식부(50)는 필요에 따라 대화 오류 후처리 장치(100) 내부에 포함될 수도 있다.
대화 오류 후처리 장치(100)의 오류 검출 및 분석부(110)는 음성 인식부(50)로부터 사용자 발화문이 입력되면 그 사용자 발화문에 포함된 다양한 오류들을 다단계 검증을 통해 검출하는데, 이에 대하여 더 자세히 설명하면 다음과 같다.
우선, 오류 검출 및 분석부(110)는 입력된 사용자 발화문에 음성 인식 오류가 포함되어 있는지를 확인하여 음성 인식 오류가 포함되어 있는 경우 이를 검출한다.
그리고, 언어 분석부(120)가 사용자 발화문을 언어적으로 분석하여 언어 분석 결과를 출력하면, 오류 검출 및 분석부(110)는 그 언어 분석 결과에 포함된 오류를 검출한다.
또한, 담화 분석부(130)가 이전 담화(발화문)의 문맥을 기반으로 사용자 발화문의 세부 의미를 파악하여 담화 분석 결과를 출력하면, 오류 검출 및 분석부(110)는 그 담화 분석 결과에 포함된 오류를 검출하며, 대화 분석 및 관리부(140)가 전체 대화의 흐름을 참조하여 사용자 발화문에 대한 대화 의미를 분석하여 출력하면, 오류 검출 및 분석부(110)는 그 대화 분석 결과에 포함된 오류를 검출한다.
이와 같이 음성 인식 오류, 언어 분석 오류, 담화 분석 오류, 대화 분석 오류 등이 검출되면, 오류 검출 및 분석부(110)는 검출된 오류들의 오류 유형을 분석하여 이를 오류 후처리부(150)로 전달한다.
이 때, 오류 검출 및 분석부(110)로부터 하나의 오류도 검출되지 않은 경우, 대화 분석 및 관리부(140)는 대화 분석 결과에 따른 시스템 대응 처리가 논리적으로 불가능한 예외 상황(예를 들어, 프로그램 녹화 명령인 경우 대화 분석 결과에는 아무런 오류가 없으나 TV가 꺼져있는 상황)인지를 확인하여, 예외 상황인 경우 시스템 대응부(160)를 통해 예외 처리를 수행한다.
한편, 오류 후처리부(150)는 오류 검출 및 분석부(110)를 통해 분석된 오류 유형에 따라 해당 오류 유형에 적합한 후처리를 수행하는데, 이에 대하여 자세히 설명하면 다음과 같다.
우선, 해당 오류 유형이 음성 인식 오류인 경우, 오류 후처리부(150)는 현재 사용자 발화문의 음성 인식 신뢰도를 기반으로 틀린 단어 혹은 문자열을 보정한 후 그 보정 결과를 언어 분석부(120)로 입력한다.
예를 들어, 초기 음성 인식 결과가 "MBC "로 분석되었고, 그 중 ""에 대한 인식 신뢰도가 매우 낮게 분석된 경우, 오류 검출 및 분석부(110)를 통해 음성 인식 오류가 검출되며, 이에 따라 오류 후처리부(150)는 후순위 음성 인식 결과 및 음향 자질을 참고하여 상기 문장을 "MBC 틀어"로 보정하여 오류 보정 결과를 언어 분석부(120)로 입력한다.
그리고, 해당 오류 유형이 언어 분석 오류인 경우, 오류 후처리부(150)는 언어 모델(미도시)에 의해 노이즈 채널을 계산하고 계산된 노이즈 채널에 따라 음성 인식 결과를 재순위하여 언어 분석 오류를 보정한 후 그 보정 결과를 담화 분석부(130)로 입력한다.
예를 들어, 언어 분석부(120)로부터의 언어 분석 결과가 "MBD 틀어"인 경우, 오류 검출 및 분석부(110)를 통해 "MBD"라는 채널이 없다는 오류가 검출되며, 이에 따라 오류 후처리부(150)는 상기 문장을 "MBC 틀어"로 보정하여 오류 보정 결과를 담화 분석부(130)로 입력한다.
만약, 해당 오류 유형이 담화 분석 오류인 경우, 오류 후처리부(150)는 이전 담화(발화문)의 문맥을 참조하여 담화 분석 오류를 보정한 후 그 보정 결과를 대화 분석 및 관리부(140)로 입력한다.
예를 들어, [사용자: 대조영에 누가 나오지?] → [시스템: 최수종, 이덕화, 정보석 등이 출연합니다.] → [사용자: 최수진 나오는 프로가 뭐가 있지?] 와 같은 담화 분석 결과가 출력된 경우, 오류 검출 및 분석부(110)를 통해 "최수진"이 나오는 프로가 없다는 오류가 검출되며, 이에 따라 오류 후처리부(150)는 이전 발화 내용에 "최수종"이 있으므로 1순위 "최수진"보다는 2순위 "최수종"일 확률이 높다고 판단하여 상기 문장을 "최수종 나오는 프로가 뭐가 있지?"로 보정한 후 오류 보정 결과를 대화 분석 및 관리부(140)로 입력한다.
그리고, 해당 오류 유형이 대화 분석 오류인 경우, 오류 후처리부(150)는 전체 대화 흐름을 기반으로 대화 분석 오류를 보정한 후 오류 보정 결과를 대화 분석 및 관리부(140)로 전달한다.
예를 들어, 대화 분석 결과가 [사용자: 대조영이 어디서 하지?] → [시스템: KBS1에서 지금 방송중입니다.] → [사용자: 거기서 뭐해?] 인 경우, 오류 검출 및 분석부(110)를 통해 "거기서 뭐해"라는 질문이 올바르지 않다는 오류가 검출되며, 이에 따라 오류 후처리부(150)는 전체 대화의 흐름상 "거기로 틀어"라는 문장이 더 적합하다고 판단하여 상기 문장을 "거기로 틀어"로 보정한 후 오류 보정 결과를 대화 분석 및 관리부(140)로 전달한다.
즉, 오류 후처리부(150)는 오류가 검출된 각 단계에서 자동으로 해당 오류에 적합한 보정이 이루어지도록 제어하며, 이에 따라 오류 보정된 결과를 기반으로 다시 다단계 검증을 통해 오류 검출 및 오류 후처리가 수행되므로, 음성 인식 오류를 최소화하여 음성 인식 정확도를 향상시킬 수 있게 된다.
한편, 상기와 같은 오류 후처리부(150)의 제어에 의해 자동적으로 오류가 보정된 경우, 대화 분석 및 관리부(140)에서는 시스템 대응부(160)를 통해 최종 대화 분석 결과에 따른 시스템 대응 처리를 수행한다.
만약 자동적으로 오류가 보정될 수 없는 경우, 대화 분석 및 관리부(140)는 시스템 대응부(160)를 제어하여, 예를 들어 사용자에게 후보군을 제시하여 선택하게 하거나 재발성을 유도하는 등의 메시지를 출력부(70)를 통해 사용자에게 전달하며, 이에 따라 사용자로부터 확인 메시지 또는 확인 음성이 입력되면 다시 상기와 같은 오류 검출 및 오류 후처리를 수행한다.
도 2는 본 발명에 따른 다단계 검증을 이용한 대화 오류 후처리 방법을 나타낸 흐름도이다.
우선, 사용자의 음성 신호가 입력되면(S210), 입력된 음성 신호의 특징 벡터를 추출하여 음성 인식을 수행한 후(S220), 음성 인식을 통해 얻어진 사용자 발화문에 음성 인식 오류가 포함되어 있는지를 확인하여 음성 인식 오류가 포함되어 있는 경우 그 음성 인식 오류를 검출한다(S221).
그 다음, 상기 사용자 발화문을 언어적으로 분석한 후(S230), 그 언어 분석 결과에 포함된 오류를 검출한다(S231).
그 다음, 이전 담화(발화문)의 문맥을 기반으로 사용자 발화문의 담화 의미를 분석한 후(S240), 그 담화 분석 결과에 포함된 오류를 검출한다(S241).
그 다음, 전체 대화의 흐름을 참조하여 사용자 발화문에 대한 대화 의미를 분석한 후(S250), 그 대화 분석 결과에 포함된 오류를 검출한다(S251).
그 다음, 상기 각 오류 검출 단계(S221, S231, S241, S251)를 통해 적어도 하나의 오류가 검출되었는지를 확인하여(S260), 검출된 오류가 없으면 대화 분석 결과에 따른 시스템 대응 처리가 논리적으로 불가능한 예외 상황인지를 확인한다(S261).
만약 예외 상황으로 확인된 경우 그에 따른 예외 처리를 수행하며(S263), 예외 상황이 아닌 경우에는 대화 분석 결과에 따른 시스템 대응 처리를 수행한다(S265).
한편, 상기 각 오류 검출 단계(S221, S231, S241, S251)를 통해 적어도 하나의 오류가 검출된 경우, 먼저 그 검출된 오류들의 오류 유형을 분석한 후(S270), 해당 오류 유형에 따른 오류 후처리를 수행하는데(S280), 이에 대하여 자세히 설명하면 다음과 같다.
우선, 해당 오류 유형이 음성 인식 오류인 경우에는 현재 사용자 발화문의 음성 인식 신뢰도를 기반으로 틀린 단어 혹은 문자열을 보정한 후(S281), 음성 인식 오류 보정이 성공한 것으로 확인되면(S290), 오류 보정 결과에 따라 다시 언어 분석이 이루어지도록 한다(S230).
만약 해당 오류 유형이 언어 분석 오류인 경우에는 언어 모델에 의해 노이즈 채널을 계산하고 계산된 노이즈 채널에 따라 음성 인식 결과를 재순위하여 언어 분석 오류를 보정한 후(S283), 언어 분석 오류 보정이 성공한 것으로 확인되면(S290), 오류 보정 결과에 따라 다시 담화 분석이 이루어지도록 한다(S240).
만약 해당 오류 유형이 담화 분석 오류인 경우에는 이전 담화(발화문)의 문맥을 기반으로 담화 분석 오류를 보정한 후(S285), 담화 분석 오류 보정이 성공한 것으로 확인되면(S290), 오류 보정 결과에 따라 다시 대화 분석이 이루어지도록 한다(S250).
만약 해당 오류 유형이 대화 분석 오류인 경우에는 전체 대화 의미를 기반으로 대화 분석 오류를 보정한 후(S287), 대화 분석 오류 보정이 성공한 것으로 확인되면(S290), 오류 보정된 최종 대화 분석 결과에 따라 시스템 대응 처리를 수행한다(S260~S265).
한편, 상기와 같은 오류 후처리 단계(S280)에 의한 오류 보정이 실패하여 오류가 자동적으로 제거되지 않은 경우, 사용자에게 후보군을 제시하여 선택하게 하거나 재발성을 유도하는 등의 확인 요청을 전달하며(S293), 이에 따라 사용자로부터 확인 메시지 또는 확인 음성을 입력받아 이를 기반으로 다시 음성 인식을 수행하는 단계(S220)로 이행한다(S295).
즉, 본 발명에 의하면, 상기와 같은 다단계 검증을 통해 현재 발화뿐 아니라 전체 대화 흐름을 고려하여 대화 오류 유형을 인식하고 그 오류 유형에 적합한 오류 후처리를 수행할 수 있으므로, 현재 발화문만을 대상으로 오류를 검출하고 그 음성 인식 오류를 사용자에게 확인하도록 하는 종래의 오류 후처리 방법에 비하여, 음성 인식 오류를 최소화하여 음성 인식의 정확도를 향상시킬 수 있는 장점이 있다.
이제까지 본 발명에 대하여 그 바람직한 실시예들을 중심으로 살펴보았으며, 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자는 본 발명이 본 발명의 본질적인 특성에서 벗어나지 않는 범위에서 변형된 형태로 구현될 수 있음을 이해할 수 있을 것이다. 그러므로 개시된 실시예들은 한정적인 관점이 아니라 설명적인 관점에서 고려되어야 한다. 본 발명의 범위는 전술한 설명이 아니라 특허청구범위에 나타나 있으며, 그와 동등한 범위 내에 있는 모든 차이점은 본 발명에 포함된 것으로 해석되어야 할 것이다.

Claims (12)

  1. (a) 사용자 음성을 인식하여 상기 음성 인식을 통해 얻어진 사용자 발화문에 포함된 음성 인식 오류를 검출하는 단계;
    (b) 상기 사용자 발화문을 언어적으로 분석하여 언어 분석 결과에 포함된 오류를 검출하는 단계;
    (c) 문맥을 기반으로 상기 사용자 발화문의 담화 의미를 분석하여 담화 분석 결과에 포함된 오류를 검출하는 단계;
    (d) 전체 대화 흐름을 기반으로 상기 사용자 발화문의 대화 의미를 분석하여 대화 분석 결과에 포함된 오류를 검출하는 단계; 및
    (e) 상기 검출된 오류의 오류 유형을 분석하여 해당 오류 유형에 따라 오류 보정을 위한 오류 후처리를 수행하는 단계를 포함하는 것을 특징으로 하는 음성 대화 시스템에 있어서 다단계 검증을 이용한 대화 오류 후처리 방법.
  2. 제 1항에 있어서, 상기 (e) 단계에서,
    (e-1) 상기 검출된 오류의 오류 유형이 음성 인식 오류인 경우, 상기 사용자 발화문에서 틀린 단어 또는 문자열을 보정한 후 상기 (b) 단계로 이행하는 단계를 더 포함하는 것을 특징으로 하는 음성 대화 시스템에 있어서 다단계 검증을 이용한 대화 오류 후처리 방법.
  3. 제 1항에 있어서, 상기 (e) 단계에서,
    (e-2) 상기 검출된 오류의 오류 유형이 언어 분석 오류인 경우, 언어 모델을 기반으로 계산된 노이즈 채널에 따라 언어 분석 오류를 보정한 후 상기 (c) 단계로 이행하는 단계를 더 포함하는 것을 특징으로 하는 음성 대화 시스템에 있어서 다단계 검증을 이용한 대화 오류 후처리 방법.
  4. 제 1항에 있어서, 상기 (e) 단계에서,
    (e-3) 상기 검출된 오류의 오류 유형이 담화 분석 오류인 경우, 이전 담화의 문맥을 기반으로 담화 분석 오류를 보정한 후 상기 (d) 단계로 이행하는 단계를 더 포함하는 것을 특징으로 하는 음성 대화 시스템에 있어서 다단계 검증을 이용한 대화 오류 후처리 방법.
  5. 제 1항에 있어서, 상기 (e) 단계에서,
    (e-4) 상기 검출된 오류의 오류 유형이 대화 분석 오류인 경우, 전체 대화 흐름을 기반으로 대화 분석 오류를 보정한 후 오류 보정된 최종 대화 분석 결과에 따라 시스템 대응 처리를 수행하는 단계를 더 포함하는 것을 특징으로 하는 음성 대화 시스템에 있어서 다단계 검증을 이용한 대화 오류 후처리 방법.
  6. 제 1항에 있어서, 상기 (e) 단계에서,
    상기 (a) 단계 내지 (d) 단계를 통해 적어도 하나의 오류가 검출되지 않은 경우, 예외 상황인지를 확인하여 예외 상황으로 확인되면 해당 예외 처리를 수행하는 단계를 더 포함하는 것을 특징으로 하는 음성 대화 시스템에 있어서 다단계 검증을 이용한 대화 오류 후처리 방법.
  7. 사용자 음성을 인식하는 음성 인식부;
    상기 음성 인식 결과로부터 얻어진 사용자 발화문을 언어적으로 분석하는 언어 분석부;
    문맥을 기반으로 상기 사용자 발화문의 담화 의미를 분석하는 담화 분석부;
    전체 대화 흐름을 기반으로 상기 사용자 발화문의 대화 의미를 분석하여 대화 분석 결과에 따라 시스템 대응 처리를 제어하는 대화 분석 및 관리부;
    상기 음성 인식 결과, 언어 분석 결과, 담화 분석 결과, 대화 분석 결과로부터 각각 음성 인식 오류, 언어 분석 오류, 담화 분석 오류, 대화 분석 오류를 검출하여 상기 검출된 오류의 오류 유형을 분석하는 오류 검출 및 분석부;
    상기 검출된 오류의 오류 유형에 따라 오류 보정을 위한 오류 후처리를 수행하는 오류 후처리부; 및
    상기 대화 분석 및 관리부의 제어에 따라 상기 사용자 발화문에 대한 시스템 대응 처리를 수행하는 시스템 대응부를 포함하는 것을 특징으로 하는 음성 대화 시스템에 있어서 다단계 검증을 이용한 대화 오류 후처리 장치.
  8. 제 7항에 있어서, 상기 오류 후처리부는,
    상기 검출된 오류의 오류 유형이 음성 인식 오류인 경우, 상기 사용자 발화문에서 틀린 단어 또는 문자열을 보정한 후 상기 오류 보정 결과에 따라 상기 언어 분석부를 통해 언어 분석이 다시 수행되도록 하는 것을 특징으로 하는 음성 대화 시스템에 있어서 다단계 검증을 이용한 대화 오류 후처리 장치.
  9. 제 7항에 있어서, 상기 오류 후처리부는,
    상기 검출된 오류의 오류 유형이 언어 분석 오류인 경우, 언어 모델을 기반으로 계산된 노이즈 채널에 따라 언어 분석 오류를 보정한 후 상기 오류 보정 결과에 따라 상기 담화 분석부를 통해 담화 분석이 다시 수행되도록 하는 것을 특징으로 하는 음성 대화 시스템에 있어서 다단계 검증을 이용한 대화 오류 후처리 장치.
  10. 제 7항에 있어서, 상기 오류 후처리부는,
    상기 검출된 오류의 오류 유형이 담화 분석 오류인 경우, 이전 담화의 문맥을 기반으로 담화 분석 오류를 보정한 후 상기 오류 보정 결과에 따라 상기 대화 분석 및 관리부를 통해 상기 사용자 발화문의 대화 의미 분석이 다시 수행되도록 하는 것을 특징으로 하는 음성 대화 시스템에 있어서 다단계 검증을 이용한 대화 오류 후처리 장치.
  11. 제 7항에 있어서, 상기 오류 후처리부는,
    상기 검출된 오류의 오류 유형이 대화 분석 오류인 경우, 전체 대화 흐름을 기반으로 대화 분석 오류를 보정한 후 상기 오류 보정된 최종 대화 분석 결과에 따라 상기 대화 분석 및 관리부를 통해 시스템 대응 처리가 수행되도록 하는 것을 특징으로 하는 음성 대화 시스템에 있어서 다단계 검증을 이용한 대화 오류 후처리 장치.
  12. 제 7항에 있어서, 상기 대화 분석 및 관리부는,
    상기 오류 검출 및 분석부로부터 적어도 하나의 오류가 검출되지 않은 경우, 예외 상황인지를 확인하여 예외 상황으로 확인되면 상기 시스템 대응부를 통해 해당 예외 처리를 수행하는 것을 특징으로 하는 음성 대화 시스템에 있어서 다단계 검증을 이용한 대화 오류 후처리 장치.
KR1020070095457A 2007-09-19 2007-09-19 음성 대화 시스템에 있어서 다단계 검증을 이용한 대화오류 후처리 장치 및 방법 KR100919225B1 (ko)

Priority Applications (2)

Application Number Priority Date Filing Date Title
KR1020070095457A KR100919225B1 (ko) 2007-09-19 2007-09-19 음성 대화 시스템에 있어서 다단계 검증을 이용한 대화오류 후처리 장치 및 방법
US12/153,896 US8050909B2 (en) 2007-09-19 2008-05-27 Apparatus and method for post-processing dialogue error in speech dialogue system using multilevel verification

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020070095457A KR100919225B1 (ko) 2007-09-19 2007-09-19 음성 대화 시스템에 있어서 다단계 검증을 이용한 대화오류 후처리 장치 및 방법

Publications (2)

Publication Number Publication Date
KR20090030117A KR20090030117A (ko) 2009-03-24
KR100919225B1 true KR100919225B1 (ko) 2009-09-28

Family

ID=40455501

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020070095457A KR100919225B1 (ko) 2007-09-19 2007-09-19 음성 대화 시스템에 있어서 다단계 검증을 이용한 대화오류 후처리 장치 및 방법

Country Status (2)

Country Link
US (1) US8050909B2 (ko)
KR (1) KR100919225B1 (ko)

Families Citing this family (148)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8645137B2 (en) 2000-03-16 2014-02-04 Apple Inc. Fast, language-independent method for user authentication by voice
US8677377B2 (en) 2005-09-08 2014-03-18 Apple Inc. Method and apparatus for building an intelligent automated assistant
US9318108B2 (en) 2010-01-18 2016-04-19 Apple Inc. Intelligent automated assistant
US10002189B2 (en) 2007-12-20 2018-06-19 Apple Inc. Method and apparatus for searching using an active ontology
US9330720B2 (en) 2008-01-03 2016-05-03 Apple Inc. Methods and apparatus for altering audio output signals
US8996376B2 (en) 2008-04-05 2015-03-31 Apple Inc. Intelligent text-to-speech conversion
US20100030549A1 (en) 2008-07-31 2010-02-04 Lee Michael M Mobile device having human language translation capability with positional feedback
US8676904B2 (en) 2008-10-02 2014-03-18 Apple Inc. Electronic devices with voice command and contextual data processing capabilities
US8504374B2 (en) * 2009-02-02 2013-08-06 Jerry Lee Potter Method for recognizing and interpreting patterns in noisy data sequences
US10241752B2 (en) 2011-09-30 2019-03-26 Apple Inc. Interface for a virtual digital assistant
US10241644B2 (en) 2011-06-03 2019-03-26 Apple Inc. Actionable reminder entries
US9858925B2 (en) * 2009-06-05 2018-01-02 Apple Inc. Using context information to facilitate processing of commands in a virtual assistant
US9431006B2 (en) 2009-07-02 2016-08-30 Apple Inc. Methods and apparatuses for automatic speech recognition
KR20110036385A (ko) * 2009-10-01 2011-04-07 삼성전자주식회사 사용자 의도 분석 장치 및 방법
US10276170B2 (en) 2010-01-18 2019-04-30 Apple Inc. Intelligent automated assistant
US8682667B2 (en) 2010-02-25 2014-03-25 Apple Inc. User profiling for selecting user specific voice input processing information
US9262612B2 (en) 2011-03-21 2016-02-16 Apple Inc. Device access using voice authentication
US10057736B2 (en) 2011-06-03 2018-08-21 Apple Inc. Active transport based notifications
US8762156B2 (en) * 2011-09-28 2014-06-24 Apple Inc. Speech recognition repair using contextual information
US10134385B2 (en) 2012-03-02 2018-11-20 Apple Inc. Systems and methods for name pronunciation
US9280610B2 (en) 2012-05-14 2016-03-08 Apple Inc. Crowd sourcing information to fulfill user requests
US10417037B2 (en) 2012-05-15 2019-09-17 Apple Inc. Systems and methods for integrating third party services with a digital assistant
US9721563B2 (en) 2012-06-08 2017-08-01 Apple Inc. Name recognition system
US9547647B2 (en) 2012-09-19 2017-01-17 Apple Inc. Voice-based media searching
EP3809407A1 (en) 2013-02-07 2021-04-21 Apple Inc. Voice trigger for a digital assistant
US9256269B2 (en) * 2013-02-20 2016-02-09 Sony Computer Entertainment Inc. Speech recognition system for performing analysis to a non-tactile inputs and generating confidence scores and based on the confidence scores transitioning the system from a first power state to a second power state
WO2014197334A2 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for user-specified pronunciation of words for speech synthesis and recognition
US9582608B2 (en) 2013-06-07 2017-02-28 Apple Inc. Unified ranking with entropy-weighted information for phrase-based semantic auto-completion
WO2014197335A1 (en) 2013-06-08 2014-12-11 Apple Inc. Interpreting and acting upon commands that involve sharing information with remote devices
US10176167B2 (en) 2013-06-09 2019-01-08 Apple Inc. System and method for inferring user intent from speech inputs
KR101922663B1 (ko) 2013-06-09 2018-11-28 애플 인크. 디지털 어시스턴트의 둘 이상의 인스턴스들에 걸친 대화 지속성을 가능하게 하기 위한 디바이스, 방법 및 그래픽 사용자 인터페이스
US20160004502A1 (en) * 2013-07-16 2016-01-07 Cloudcar, Inc. System and method for correcting speech input
KR102191425B1 (ko) * 2013-07-29 2020-12-15 한국전자통신연구원 인터랙티브 캐릭터 기반 외국어 학습 장치 및 방법
US10296160B2 (en) 2013-12-06 2019-05-21 Apple Inc. Method for extracting salient dialog usage from live data
US9430463B2 (en) 2014-05-30 2016-08-30 Apple Inc. Exemplar-based natural language processing
US9966065B2 (en) 2014-05-30 2018-05-08 Apple Inc. Multi-command single utterance input method
US9715875B2 (en) 2014-05-30 2017-07-25 Apple Inc. Reducing the need for manual start/end-pointing and trigger phrases
US10170123B2 (en) 2014-05-30 2019-01-01 Apple Inc. Intelligent assistant for home automation
US9633004B2 (en) 2014-05-30 2017-04-25 Apple Inc. Better resolution when referencing to concepts
US9338493B2 (en) 2014-06-30 2016-05-10 Apple Inc. Intelligent automated assistant for TV user interactions
US9818400B2 (en) 2014-09-11 2017-11-14 Apple Inc. Method and apparatus for discovering trending terms in speech requests
US10074360B2 (en) 2014-09-30 2018-09-11 Apple Inc. Providing an indication of the suitability of speech recognition
US9668121B2 (en) 2014-09-30 2017-05-30 Apple Inc. Social reminders
US10127911B2 (en) 2014-09-30 2018-11-13 Apple Inc. Speaker identification and unsupervised speaker adaptation techniques
US10719115B2 (en) * 2014-12-30 2020-07-21 Avago Technologies International Sales Pte. Limited Isolated word training and detection using generated phoneme concatenation models of audio inputs
US10152299B2 (en) 2015-03-06 2018-12-11 Apple Inc. Reducing response latency of intelligent automated assistants
US9886953B2 (en) 2015-03-08 2018-02-06 Apple Inc. Virtual assistant activation
US9721566B2 (en) 2015-03-08 2017-08-01 Apple Inc. Competing devices responding to voice triggers
US10567477B2 (en) 2015-03-08 2020-02-18 Apple Inc. Virtual assistant continuity
US10460227B2 (en) 2015-05-15 2019-10-29 Apple Inc. Virtual assistant in a communication session
US10083688B2 (en) 2015-05-27 2018-09-25 Apple Inc. Device voice control for selecting a displayed affordance
US9578173B2 (en) 2015-06-05 2017-02-21 Apple Inc. Virtual assistant aided communication with 3rd party service in a communication session
US11025565B2 (en) 2015-06-07 2021-06-01 Apple Inc. Personalized prediction of responses for instant messaging
US20160378747A1 (en) 2015-06-29 2016-12-29 Apple Inc. Virtual assistant for media playback
US10671428B2 (en) 2015-09-08 2020-06-02 Apple Inc. Distributed personal assistant
US10747498B2 (en) 2015-09-08 2020-08-18 Apple Inc. Zero latency digital assistant
US11010550B2 (en) 2015-09-29 2021-05-18 Apple Inc. Unified language modeling framework for word prediction, auto-completion and auto-correction
US10366158B2 (en) 2015-09-29 2019-07-30 Apple Inc. Efficient word encoding for recurrent neural network language models
US11587559B2 (en) 2015-09-30 2023-02-21 Apple Inc. Intelligent device identification
US11956503B2 (en) * 2015-10-06 2024-04-09 Comcast Cable Communications, Llc Controlling a device based on an audio input
US10083685B2 (en) * 2015-10-13 2018-09-25 GM Global Technology Operations LLC Dynamically adding or removing functionality to speech recognition systems
US10691473B2 (en) 2015-11-06 2020-06-23 Apple Inc. Intelligent automated assistant in a messaging environment
US10956666B2 (en) 2015-11-09 2021-03-23 Apple Inc. Unconventional virtual assistant interactions
US10049668B2 (en) 2015-12-02 2018-08-14 Apple Inc. Applying neural network language models to weighted finite state transducers for automatic speech recognition
KR102019757B1 (ko) * 2015-12-15 2019-09-10 한국전자통신연구원 언어 분석 오류 보정 장치 및 방법
US10223066B2 (en) 2015-12-23 2019-03-05 Apple Inc. Proactive assistance based on dialog communication between devices
US10049655B1 (en) * 2016-01-05 2018-08-14 Google Llc Biasing voice correction suggestions
US9971758B1 (en) * 2016-01-06 2018-05-15 Google Llc Allowing spelling of arbitrary words
US10446143B2 (en) 2016-03-14 2019-10-15 Apple Inc. Identification of voice inputs providing credentials
US9934775B2 (en) 2016-05-26 2018-04-03 Apple Inc. Unit-selection text-to-speech synthesis based on predicted concatenation parameters
US9972304B2 (en) 2016-06-03 2018-05-15 Apple Inc. Privacy preserving distributed evaluation framework for embedded personalized systems
US10249300B2 (en) 2016-06-06 2019-04-02 Apple Inc. Intelligent list reading
US11227589B2 (en) 2016-06-06 2022-01-18 Apple Inc. Intelligent list reading
US10049663B2 (en) 2016-06-08 2018-08-14 Apple, Inc. Intelligent automated assistant for media exploration
DK179309B1 (en) 2016-06-09 2018-04-23 Apple Inc Intelligent automated assistant in a home environment
US10067938B2 (en) 2016-06-10 2018-09-04 Apple Inc. Multilingual word prediction
US10509862B2 (en) 2016-06-10 2019-12-17 Apple Inc. Dynamic phrase expansion of language input
US10192552B2 (en) 2016-06-10 2019-01-29 Apple Inc. Digital assistant providing whispered speech
US10586535B2 (en) 2016-06-10 2020-03-10 Apple Inc. Intelligent digital assistant in a multi-tasking environment
US10490187B2 (en) 2016-06-10 2019-11-26 Apple Inc. Digital assistant providing automated status report
DK179049B1 (en) 2016-06-11 2017-09-18 Apple Inc Data driven natural language event detection and classification
DK201670540A1 (en) 2016-06-11 2018-01-08 Apple Inc Application integration with a digital assistant
DK179343B1 (en) 2016-06-11 2018-05-14 Apple Inc Intelligent task discovery
DK179415B1 (en) 2016-06-11 2018-06-14 Apple Inc Intelligent device arbitration and control
US10474753B2 (en) 2016-09-07 2019-11-12 Apple Inc. Language identification using recurrent neural networks
US10043516B2 (en) 2016-09-23 2018-08-07 Apple Inc. Intelligent automated assistant
US11281993B2 (en) 2016-12-05 2022-03-22 Apple Inc. Model and ensemble compression for metric learning
US10593346B2 (en) 2016-12-22 2020-03-17 Apple Inc. Rank-reduced token representation for automatic speech recognition
US10235990B2 (en) 2017-01-04 2019-03-19 International Business Machines Corporation System and method for cognitive intervention on human interactions
US10373515B2 (en) 2017-01-04 2019-08-06 International Business Machines Corporation System and method for cognitive intervention on human interactions
US11204787B2 (en) 2017-01-09 2021-12-21 Apple Inc. Application integration with a digital assistant
US10318639B2 (en) 2017-02-03 2019-06-11 International Business Machines Corporation Intelligent action recommendation
US10417266B2 (en) 2017-05-09 2019-09-17 Apple Inc. Context-aware ranking of intelligent response suggestions
DK201770383A1 (en) 2017-05-09 2018-12-14 Apple Inc. USER INTERFACE FOR CORRECTING RECOGNITION ERRORS
US10395654B2 (en) 2017-05-11 2019-08-27 Apple Inc. Text normalization based on a data-driven learning network
US10726832B2 (en) 2017-05-11 2020-07-28 Apple Inc. Maintaining privacy of personal information
DK201770439A1 (en) 2017-05-11 2018-12-13 Apple Inc. Offline personal assistant
US11301477B2 (en) 2017-05-12 2022-04-12 Apple Inc. Feedback analysis of a digital assistant
DK179745B1 (en) 2017-05-12 2019-05-01 Apple Inc. SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT
DK179496B1 (en) 2017-05-12 2019-01-15 Apple Inc. USER-SPECIFIC Acoustic Models
DK201770429A1 (en) 2017-05-12 2018-12-14 Apple Inc. LOW-LATENCY INTELLIGENT AUTOMATED ASSISTANT
DK201770432A1 (en) 2017-05-15 2018-12-21 Apple Inc. Hierarchical belief states for digital assistants
DK201770431A1 (en) 2017-05-15 2018-12-20 Apple Inc. Optimizing dialogue policy decisions for digital assistants using implicit feedback
US10403278B2 (en) 2017-05-16 2019-09-03 Apple Inc. Methods and systems for phonetic matching in digital assistant services
US10311144B2 (en) 2017-05-16 2019-06-04 Apple Inc. Emoji word sense disambiguation
US10303715B2 (en) 2017-05-16 2019-05-28 Apple Inc. Intelligent automated assistant for media exploration
DK179549B1 (en) 2017-05-16 2019-02-12 Apple Inc. FAR-FIELD EXTENSION FOR DIGITAL ASSISTANT SERVICES
US10657328B2 (en) 2017-06-02 2020-05-19 Apple Inc. Multi-task recurrent neural network architecture for efficient morphology handling in neural language modeling
US10445429B2 (en) 2017-09-21 2019-10-15 Apple Inc. Natural language understanding using vocabularies with compressed serialized tries
US10755051B2 (en) 2017-09-29 2020-08-25 Apple Inc. Rule-based natural language processing
US10636424B2 (en) 2017-11-30 2020-04-28 Apple Inc. Multi-turn canned dialog
US10733982B2 (en) 2018-01-08 2020-08-04 Apple Inc. Multi-directional dialog
US10733375B2 (en) 2018-01-31 2020-08-04 Apple Inc. Knowledge-based framework for improving natural language understanding
US10789959B2 (en) 2018-03-02 2020-09-29 Apple Inc. Training speaker recognition models for digital assistants
US10592604B2 (en) 2018-03-12 2020-03-17 Apple Inc. Inverse text normalization for automatic speech recognition
US10818288B2 (en) 2018-03-26 2020-10-27 Apple Inc. Natural assistant interaction
US10909331B2 (en) 2018-03-30 2021-02-02 Apple Inc. Implicit identification of translation payload with neural machine translation
US11145294B2 (en) 2018-05-07 2021-10-12 Apple Inc. Intelligent automated assistant for delivering content from user experiences
US10928918B2 (en) 2018-05-07 2021-02-23 Apple Inc. Raise to speak
US10984780B2 (en) 2018-05-21 2021-04-20 Apple Inc. Global semantic word embeddings using bi-directional recurrent neural networks
US10892996B2 (en) 2018-06-01 2021-01-12 Apple Inc. Variable latency device coordination
DK201870355A1 (en) 2018-06-01 2019-12-16 Apple Inc. VIRTUAL ASSISTANT OPERATION IN MULTI-DEVICE ENVIRONMENTS
US11386266B2 (en) 2018-06-01 2022-07-12 Apple Inc. Text correction
DK180639B1 (en) 2018-06-01 2021-11-04 Apple Inc DISABILITY OF ATTENTION-ATTENTIVE VIRTUAL ASSISTANT
DK179822B1 (da) 2018-06-01 2019-07-12 Apple Inc. Voice interaction at a primary device to access call functionality of a companion device
US10496705B1 (en) 2018-06-03 2019-12-03 Apple Inc. Accelerated task performance
US11010561B2 (en) 2018-09-27 2021-05-18 Apple Inc. Sentiment prediction from textual data
US10839159B2 (en) 2018-09-28 2020-11-17 Apple Inc. Named entity normalization in a spoken dialog system
US11462215B2 (en) 2018-09-28 2022-10-04 Apple Inc. Multi-modal inputs for voice commands
US11170166B2 (en) 2018-09-28 2021-11-09 Apple Inc. Neural typographical error modeling via generative adversarial networks
US11475898B2 (en) 2018-10-26 2022-10-18 Apple Inc. Low-latency multi-speaker speech recognition
US11638059B2 (en) 2019-01-04 2023-04-25 Apple Inc. Content playback on multiple devices
US11348573B2 (en) 2019-03-18 2022-05-31 Apple Inc. Multimodality in digital assistant systems
US11423908B2 (en) 2019-05-06 2022-08-23 Apple Inc. Interpreting spoken requests
US11475884B2 (en) 2019-05-06 2022-10-18 Apple Inc. Reducing digital assistant latency when a language is incorrectly determined
US11307752B2 (en) 2019-05-06 2022-04-19 Apple Inc. User configurable task triggers
DK201970509A1 (en) 2019-05-06 2021-01-15 Apple Inc Spoken notifications
US11140099B2 (en) 2019-05-21 2021-10-05 Apple Inc. Providing message response suggestions
US11289073B2 (en) 2019-05-31 2022-03-29 Apple Inc. Device text to speech
US11496600B2 (en) 2019-05-31 2022-11-08 Apple Inc. Remote execution of machine-learned models
DK180129B1 (en) 2019-05-31 2020-06-02 Apple Inc. USER ACTIVITY SHORTCUT SUGGESTIONS
US11360641B2 (en) 2019-06-01 2022-06-14 Apple Inc. Increasing the relevance of new available information
US11438452B1 (en) 2019-08-09 2022-09-06 Apple Inc. Propagating context information in a privacy preserving manner
WO2021056255A1 (en) 2019-09-25 2021-04-01 Apple Inc. Text detection using global geometry estimators
JP6841535B1 (ja) * 2020-01-29 2021-03-10 株式会社インタラクティブソリューションズ 会話解析システム
US11605386B2 (en) * 2020-08-24 2023-03-14 International Business Machines Corporation Computerized dialog system improvements based on conversation data
US11574639B2 (en) * 2020-12-18 2023-02-07 Microsoft Technology Licensing, Llc Hypothesis stitcher for speech recognition of long-form audio
US11861521B2 (en) 2021-12-21 2024-01-02 PolyAI Limited System and method for identification and verification

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20050015586A (ko) * 2003-08-06 2005-02-21 삼성전자주식회사 음성 대화 시스템에서의 음성 인식 오류 처리 방법 및 장치
US20060085192A1 (en) * 2004-10-19 2006-04-20 International Business Machines Corporation System and methods for conducting an interactive dialog via a speech-based user interface
KR20060057921A (ko) * 2004-11-24 2006-05-29 한국전자통신연구원 대화형 음성인식 시스템의 인식오류 수정장치 및 그 방법
KR20070060491A (ko) * 2005-12-08 2007-06-13 한국전자통신연구원 대화형 음성 인터페이스 시스템에서의 예외 상황 처리 방법및 장치

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7167832B2 (en) * 2001-10-15 2007-01-23 At&T Corp. Method for dialog management
US20060149544A1 (en) 2005-01-05 2006-07-06 At&T Corp. Error prediction in spoken dialog systems
US7684990B2 (en) 2005-04-29 2010-03-23 Nuance Communications, Inc. Method and apparatus for multiple value confirmation and correction in spoken dialog systems

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20050015586A (ko) * 2003-08-06 2005-02-21 삼성전자주식회사 음성 대화 시스템에서의 음성 인식 오류 처리 방법 및 장치
US20060085192A1 (en) * 2004-10-19 2006-04-20 International Business Machines Corporation System and methods for conducting an interactive dialog via a speech-based user interface
KR20060057921A (ko) * 2004-11-24 2006-05-29 한국전자통신연구원 대화형 음성인식 시스템의 인식오류 수정장치 및 그 방법
KR20070060491A (ko) * 2005-12-08 2007-06-13 한국전자통신연구원 대화형 음성 인터페이스 시스템에서의 예외 상황 처리 방법및 장치

Also Published As

Publication number Publication date
KR20090030117A (ko) 2009-03-24
US20090076798A1 (en) 2009-03-19
US8050909B2 (en) 2011-11-01

Similar Documents

Publication Publication Date Title
KR100919225B1 (ko) 음성 대화 시스템에 있어서 다단계 검증을 이용한 대화오류 후처리 장치 및 방법
US9620110B2 (en) Speech recognition semantic classification training
KR101828273B1 (ko) 결합기반의 음성명령 인식 장치 및 그 방법
US7801726B2 (en) Apparatus, method and computer program product for speech processing
US20060161434A1 (en) Automatic improvement of spoken language
US6138099A (en) Automatically updating language models
US8000962B2 (en) Method and system for using input signal quality in speech recognition
US7818174B1 (en) Speech-recognition grammar analysis
CN111429899A (zh) 基于人工智能的语音响应处理方法、装置、设备及介质
US20020049596A1 (en) Speech recognition apparatus and method
JPH08115093A (ja) 終話検出方法及び装置並びに連続音声認識方法及び装置
JPH05181494A (ja) 音声パターンの識別装置と方法
AU1458401A (en) Method and apparatus for discriminative training of acoustic models of a speech recognition system
CA2575373A1 (en) A system and method for report level confidence
GB2451907A (en) Device for modifying and improving the behavior of speech recognition systems
JP2008009153A (ja) 音声対話システム
JP3124277B2 (ja) 音声認識システム
US8874438B2 (en) User and vocabulary-adaptive determination of confidence and rejecting thresholds
KR100732611B1 (ko) 음성대화 오류검증을 통한 확인대화 방법 및 장치
WO2023148772A1 (en) A system and method to reduce ambiguity in natural language understanding by user expectation handling
KR20050049207A (ko) 대화형 연속 음성인식 시스템 및 이를 이용한 음성끝점검출방법
KR100622019B1 (ko) 음성 인터페이스 시스템 및 방법
JP2000214879A (ja) 音声認識装置の適応化方法
Komatani et al. Restoring incorrectly segmented keywords and turn-taking caused by short pauses
KR100952974B1 (ko) 미등록어 처리를 지원하는 음성 인식 시스템과 방법 및이를 저장한 컴퓨터 판독 가능 기록매체

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20120910

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20130829

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20140827

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20150731

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20160729

Year of fee payment: 8

FPAY Annual fee payment

Payment date: 20180731

Year of fee payment: 10

FPAY Annual fee payment

Payment date: 20190723

Year of fee payment: 11