KR20070113045A - 음성 인식 시스템 및 그 방법 - Google Patents

음성 인식 시스템 및 그 방법 Download PDF

Info

Publication number
KR20070113045A
KR20070113045A KR1020060046768A KR20060046768A KR20070113045A KR 20070113045 A KR20070113045 A KR 20070113045A KR 1020060046768 A KR1020060046768 A KR 1020060046768A KR 20060046768 A KR20060046768 A KR 20060046768A KR 20070113045 A KR20070113045 A KR 20070113045A
Authority
KR
South Korea
Prior art keywords
information
recognition
telephone number
registered
recognition results
Prior art date
Application number
KR1020060046768A
Other languages
English (en)
Inventor
정두경
Original Assignee
엘지전자 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 엘지전자 주식회사 filed Critical 엘지전자 주식회사
Priority to KR1020060046768A priority Critical patent/KR20070113045A/ko
Publication of KR20070113045A publication Critical patent/KR20070113045A/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/221Announcement of recognition results

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Telephonic Communication Services (AREA)

Abstract

본 발명은 사용자 음성의 인식 결과들과 미리 등록된 정보를 비교하여 일치하는 정보를 인식 결과로서 출력함으로써 음성 인식률을 향상시킬 수 있고, 잡음 환경이나, 사용자가 발음을 실수하여도 사용자가 원하는 인식 결과를 정확하게 제공할 수 있는 음성 인식 시스템 및 그 방법에 관한 것이다. 이를 위하여 본 발명의 실시예에 따른 음성 인식 방법은, 사용자 음성 신호의 인식 결과들을 신뢰도 점수가 높은 순서대로 출력하는 단계와; 상기 인식 결과들에 대응하는 정보를 순차적으로 미리 등록된 정보와 비교하는 단계와; 상기 인식 결과들에 대응하는 정보 중에서 상기 미리 등록된 정보와 일치하는 정보를 인식 결과로서 출력하는 단계로 이루어진다.

Description

음성 인식 시스템 및 그 방법{SPEECH RECOGNITION SYSTEM AND METHOD}
도1은 본 발명의 실시예에 따른 음성 인식 시스템을 나타낸 블록 도이다.
도2는 본 발명의 실시예에 따른 음성 인식 방법에 적용된 전화 번호 리스트를 나타낸 도이다.
도3은 본 발명의 실시예에 따른 음성 인식 방법에 따라 출력된 인식 결과 리스트를 나타낸 도이다.
도4는 본 발명의 실시예에 따른 음성 인식 방법을 나타낸 흐름도이다.
도5는 본 발명의 실시예에 따른 음성 인식 시스템 및 그 방법에 따라 전화 번호 리스트를 사용하지 않았을 때와 전화 번호 리스트를 사용했을 때를 비교하여 나타낸 실험 표이다.
***도면의 주요부분에 대한 부호의 설명***
101: 음성 수신부 102: 음성 인식부
103: 제어부 104: 저장부
본 발명은 음성 인식 시스템 및 그 방법에 관한 것이다.
일반적으로, 종래 기술에 따른 음성 인식 시스템은 사용자가 발성(utterance)했을 때 그 발성된 음성 신호를 수신하고, 그 수신된 음성 신호와 미리 결정된 음성 인식 모델들을 비교하고, 그 비교 결과에 따라 사용자 음성을 인식한다. 즉, 종래 기술에 따른 음성 인식 시스템은 신뢰도(confidence) 측정 방법을 통해 사용자 음성을 인식하였다.
그러나, 종래 기술에 따른 음성 인식 시스템이 이동 통신 단말기에 적용되었을 때, 상기 음성 인식 시스템은 이동 통신 단말기의 전화 걸기 모드에서 사용자가 연속적으로 숫자를 발성하면 다양한 환경에 의해 인식 오류가 발생하는 문제점이 자주 발생되었다. 예를 들면, 종래 기술에 따른 음성 인식 시스템은 사용자가 다양하게 발음(감기, 음주 등으로 인한 발음)을 하거나 잡음 환경에서 사용자 음성 인식률이 크게 저하되는 문제점이 있었다.
따라서, 본 발명의 목적은 음성 인식률을 향상시킬 수 있는 음성 인식 시스템 및 그 방법을 제공하는데 있다.
본 발명의 다른 목적은 연속 숫자의 인식률을 향상시킬 수 있는 음성 인식 시스템 및 그 방법을 제공하는데 있다.
본 발명의 또 다른 목적은, 잡음 환경이나, 사용자가 발음을 실수하여도 사용자가 원하는 인식 결과를 정확하게 제공할 수 있는 음성 인식 시스템 및 그 방법을 제공하는데 있다.
상기 목적들을 달성하기 위한 본 발명의 실시예에 따른 음성 인식 방법은, 사용자 음성 신호의 인식 결과들을 신뢰도 점수가 높은 순서대로 출력하는 단계와; 상기 인식 결과들에 대응하는 정보를 순차적으로 미리 등록된 정보와 비교하는 단계와; 상기 인식 결과들에 대응하는 정보 중에서 상기 미리 등록된 정보와 일치하는 정보를 인식 결과로서 출력하는 단계로 이루어진다.
상기 목적들을 달성하기 위한 본 발명의 실시예에 따른 음성 인식 방법은, 사용자 음성 신호의 인식 결과들에 대응하는 전화 번호들을 신뢰도 점수가 높은 순서대로 출력하는 단계와; 상기 인식 결과들에 대응하는 전화 번호들을 순차적으로 미리 등록된 전화 번호 리스트 내의 전화 번호들과 비교하는 단계와; 상기 인식 결과들에 대응하는 전화 번호들 중에서 상기 미리 등록된 전화 번호 리스트 내의 전화 번호들과 일치하는 전화 번호를 인식 결과로서 출력하는 단계로 이루어진다.
상기 목적들을 달성하기 위한 본 발명의 실시예에 따른 음성 인식 방법은, 음성 신호를 수신하는 단계와; 상기 음성 신호를 미리 결정된 음성 인식 모델들과 비교함으로써 상기 음성 신호의 인식 결과들을 발생하는 단계와; 상기 인식 결과들을 신뢰도 점수가 높은 순서대로 출력하는 단계와; 상기 인식 결과들에 대응하는 정보를 순차적으로 미리 등록된 정보와 비교하는 단계와; 상기 인식 결과들에 대응하는 정보 중에서 상기 미리 등록된 정보와 일치하는 정보를 선택하고, 상기 선택된 정보를 인식 결과로서 출력하는 단계로 이루어진다.
상기 목적들을 달성하기 위한 본 발명의 실시예에 따른 음성 인식 시스템은, 사용자 음성 신호의 인식 결과들을 신뢰도 점수가 높은 순서대로 출력하는 음성 인 식부와; 상기 인식 결과들에 대응하는 정보를 순차적으로 미리 등록된 정보와 비교하고, 상기 인식 결과들에 대응하는 정보 중에서 상기 미리 등록된 정보와 일치하는 정보를 인식 결과로서 출력하는 제어부로 구성된다.
상기 목적들을 달성하기 위한 본 발명의 실시예에 따른 음성 인식 시스템은, 이동 통신 단말기의 모드가 전화 걸기 모드일 때 음성 신호를 수신하는 음성 수신부와; 상기 음성 신호를 미리 결정된 음성 인식 모델들과 비교함으로써 상기 음성 신호의 인식 결과들 발생하고, 상기 인식 결과들을 신뢰도 점수가 높은 순서대로 출력하는 음성 인식부와; 상기 인식 결과들에 대응하는 정보를 순차적으로 미리 등록된 정보와 비교하고, 상기 인식 결과들에 대응하는 정보 중에서 상기 미리 등록된 정보와 일치하는 정보를 선택하고, 상기 선택된 정보를 인식 결과로서 출력하는 제어부로 구성된다.
이하에서는, 사용자 음성의 인식 결과들과 미리 등록된 정보를 비교하여 일치하는 정보를 최종 인식 결과로서 출력함으로써 음성 인식률을 향상시킬 수 있고, 잡음 환경이나, 사용자가 발음을 실수하여도 사용자가 원하는 인식 결과를 정확하게 제공할 수 있는 음성 인식 시스템 및 그 방법의 바람직한 실시예를 도1~도5를 참조하여 상세히 설명한다.
도1은 본 발명의 실시예에 따른 음성 인식 시스템을 나타낸 블록도 이다. 이하에서는, 본 발명의 실시예에 따른 음성 인식 시스템이 이동 통신 단말기에 적용되었을 때를 가정하여 설명한다. 본 발명의 실시예에 따른 음성 인식 시스템은 이동 통신 단말기뿐만 아니라 음성 인식이 필요한 모든 장치에 적용될 수도 있다.
도1에 도시한 바와 같이, 본 발명의 실시예에 따른 음성 인식 시스템은, 이동 통신 단말기의 모드가 전화 걸기 모드일 때 입력 음성 신호(사용자 발성(utterance)에 의한 사용자 음성)을 수신하는 음성 수신부(101)와; 상기 사용자 음성 신호를 미리 결정된 음성 인식 모델들과 비교함으로써 상기 사용자 음성 신호의 인식 결과들을 발생하고, 상기 인식 결과들을 신뢰도 점수(confidence score)가 높은 순서대로 출력하는 음성 인식부(102)와; 상기 인식 결과들에 대응하는 정보(예를 들면, 전화 번호들)을 순차적으로 미리 등록된 정보(예를 들면, 전화 번호 리스트 내의 전화 번호들)와 비교하고, 상기 인식 결과들에 대응하는 정보 중에서 상기 미리 등록된 정보와 일치하는 정보를 선택하고, 그 선택된 정보를 최종 인식 결과로서 출력하는 제어부(103)로 구성된다.
상기 제어부(103)는, 상기 정보가 전화 번호일 때, 상기 신뢰도 점수가 가장 높은 제1 인식 결과에 대응하는 전화 번호가 상기 전화 번호 리스트에 없을 때 상기 제1 인식 결과보다 신뢰도 점수가 낮은 제2 인식 결과에 대응하는 전화 번호와 상기 전화 번호 리스트 내의 전화 번호들을 순차적으로 비교하고, 상기 제2 인식 결과에 대응하는 전화 번호가 상기 전화 번호 리스트 내의 전화 번호와 일치하면 그 일치된 전화 번호를 상기 제1 인식 결과에 대응하는 전화 번호 대신에 출력한다.
여기서, 상기 사용자 음성이 전화 번호일 때를 가정하여 본 발명의 실시예에 따른 음성 인식 시스템 및 그 방법을 설명하였지만, 본 발명의 실시예에 따른 음성 인식 시스템 및 그 방법은 전화 번호뿐만 아니라 전화 번호 리스트에 등록된 전화 번호에 링크된 이름, 자주 사용하는 메시지들에 링크된 특정 인식 정보와 같은 다양한 정보를 사용자가 발성했을 때 그 다양한 정보를 인식할 수도 있다.
상기 본 발명의 실시예에 따른 음성 인식 시스템의 저장부(104)는 상기 전화 번호 리스트뿐만 아니라 전화 번호 리스트에 등록된 전화 번호에 링크된 이름, 자주 사용하는 메시지들에 링크된 특정 인식 정보와 같은 다양한 정보를 저장할 수도 있다.
이하에서는, 본 발명의 실시예에 따른 음성 인식 시스템의 동작을 도1을 참조하여 상세히 설명한다.
먼저, 상기 음성 수신부(101)는 이동 통신 단말기의 모드가 전화 걸기 모드로 전환되었을 때 사용자 발성에 의한 사용자 음성 신호(예를 들면, 전화 번호)를 수신하고, 그 수신된 사용자 음성 신호를 상기 음성 인식부(102)에 출력한다.
상기 음성 인식부(102)는 입력 음성과 다수의 모델들 간의 유사도를 나타내는 신뢰도 점수들(confidence scores)을 제공하는 미리결정된 음성 인식 모델들과 상기 음성 수신부(101)로부터 출력되는 사용자 음성 신호를 비교하여 상기 사용자 음성 신호가 임계치(threshold value)보다 높은 신뢰도 점수들에 해당하는 인식 결과들(예를 들면, 3개의 전화 번호들)을 출력한다. 이때, 상기 음성 인식부(102)는 신뢰도 점수가 가장 높은 하나의 인식 결과만을 출력하는 것이 아니라 신뢰도 점수가 높은 순서대로 적어도 둘 이상(예를 들면, 3개의 인식 결과들)의 인식 결과들을 상기 제어부(103)에 출력한다. 예를 들면, 상기 음성 인식부(102)는 상기 미리 결정된 음성 인식 모델들과 상기 사용자 음성 신호를 비교하여 신뢰도 점수가 높은 순서대로 3개의 인식된 전화 번호들을 상기 제어부(103)에 출력한다.
여기서, 상기 신뢰도 점수를 이용하여 사용자 음성을 인식하는 방법은 미국 특허 번호 6,735,562에도 개시되어 있고, 본 발명은 사용자가 특정한 정보를 잘못 발성했어도 초기 인식 결과들과 미리 등록된 정보를 근거로 사용자가 원하는 정보를 검색하여 출력할 수 있는 음성 인식 시스템 및 그 방법이므로, 초기에 사용자 음성을 인식하는 구체적인 방법의 설명은 생략한다.
상기 제어부(103)는 상기 인식 결과들 중에서 가장 높은 신뢰도 점수를 갖는 전화 번호(제1 후보(candidate) 전화 번호)가 상기 저장부(104) 내의 전화 번호 리스트에 등록되었는지를 판단하고, 상기 제1 후보 전화 번호가 상기 저장부(104) 내의 전화 번호 리스트에 등록되었을 때, 상기 제1 후보 전화 번호를 인식 결과로서 출력한다.
반면, 상기 제어부(103)는 상기 제1 후보 전화 번호가 상기 저장부(104) 내의 전화 번호 리스트에 등록되어있지 않을 때, 상기 제1 후보 전화 번호 다음으로 낮은 신뢰도 점수를 갖는 제2 후보 전화 번호와 일치하는 전화 번호가 상기 전화 번호 리스트에 존재하는지를 판단하고, 상기 제2 후보 전화 번호에 일치하는 전화 번호가 상기 전화 번호 리스트에 존재할 때 상기 제1 후보 전화 번호 대신에 상기 제2 후보 전화 번호를 인식 결과로서 출력한다. 또한, 상기 제어부(103)는 상기 제2 후보 전화 번호가 상기 저장부(104) 내의 전화 번호 리스트에 등록되어 있지 않을 때, 상기 제2 후보 전화 번호 다음으로 낮은 신뢰도 점수를 갖는 제3 후보 전화 번호와 일치하는 전화 번호가 상기 전화 번호 리스트에 존재하는지를 판단하고, 상 기 제3 후보 전화 번호와 일치하는 전화 번호가 상기 전화 번호 리스트에 존재할 때 상기 제1 후보 전화 번호 대신에 상기 제3 후보 전화 번호를 인식 결과로서 출력한다.
여기서, 상기 제1 후보 전화 번호, 제2 후보 전화 번호, 제3 후보 전화 번호를 상기 전화 번호 리스트 내의 전화 번호들과 비교할 때, 상기 전화 번호 리스트 내의 전화 번호들을 전화 통화 횟수(사용 횟수)가 많은 순서대로 분류하고, 그 분류된 순서대로 상기 제1 후보 전화 번호, 제2 후보 전화 번호, 제3 후보 전화 번호와 순차적으로 비교함으로써 사용자가 원하는 전화 번호를 빠르고 정확하게 인식할 수도 있다.
따라서, 본 발명의 실시예에 따른 음성 인식 시스템 및 그 방법은 사용자가 017-356-1234에 전화를 걸려고 발성했으나, 사용자의 발음 실수로 017-356-1233을 발음하였을 때 인식 실패로 처리하는 것이 아니라 017-356-1233과 가장 유사한 전화 번호를 전화 번호 리스트로부터 검출하고(예를 들면, 숫자 하나 또는 두 개가 다른 전화 번호), 그 검출된 전화 번호(017-356-1234)를 017-356-1233 대신에 출력한다. 즉, 사용자가 전화 번호를 잘못 발성하여도 사용자가 원하는 전화 번호를 검출하여 출력함으로써 음성 인식률을 향상시킬 수 있고, 잡음 환경이나, 사용자가 발음을 실수하여도 사용자가 원하는 인식 결과를 제공할 수 있다.
도2는 본 발명의 실시예에 따른 음성 인식 방법에 적용된 전화 번호 리스트를 나타낸 도이다.
도2에 도시한 바와 같이, 본 발명의 실시예에 따른 전화 번호 리스트는 순위 와, 전화 번호와, 전화 통화 횟수로 분류된다. 즉, 전화 통화 횟수(사용 횟수)에 따라 전화 번호들의 순위가 결정된다.
도3은 본 발명의 실시예에 따른 음성 인식 방법에 따라 출력된 인식 결과 리스트를 나타낸 도이다.
도3에 도시한 바와 같이, 상기 음성 인식부(102)는 입력 음성과 다수의 모델들 간의 유사도를 나타내는 신뢰도 점수들(confidence scores)을 제공하는 미리 결정된 음성 인식 모델들과 상기 음성 수신부(101)로부터 출력되는 사용자 음성 신호를 비교하여 상기 사용자 음성 신호가 임계치(threshold value)보다 높은 신뢰도 점수들에 해당하는 인식 결과들(예를 들면, 017-356-1233, 017-356-1234, 011-356-1234)을 신뢰도 점수가 높은 순서대로 출력한다.
상기 제어부(103)는 인식 결과 리스트와 상기 전화 번호 리스트 내의 전화 번호들과 비교할 때, 상기 전화 번호 리스트 내의 전화 번호들 중에서 전화 통화 횟수가 가장 많은 전화 번호 순서대로 인식 결과들을 비교함으로써, 빠르고 정확하게 사용자가 원하는 전화 번호를 검출할 수 있다. 예를 들면, 사용자가 017-356-1234에 전화를 걸려고 발성했으나, 발음 실수로 017-356-1233을 발음하였다면 017-356-1233과 가장 유사한 전화 번호들(017-356-1234, 011-356-1234)을 검출하고, 그 검출된 전화 번호들 중에 전화 통화 횟수가 가장 많은 전화 번호(017-356-1234)와 비교함으로써 빠르고 확률적으로 정확하게 사용자가 원하는 전화 번호를 출력할 수 있다.
이하에서는, 본 발명의 실시예에 따른 음성 인식 방법을 도1~도4를 참조하여 상세히 설명한다.
도4는 본 발명의 실시예에 따른 음성 인식 방법을 나타낸 흐름도이다.
먼저, 상기 음성 수신부(101)는 사용자에 의해 이동 통신 단말기의 모드가 전화 걸기 모드로 전환되었을 때 사용자 발성에 의한 사용자 음성 신호(예를 들면, 전화 번호)를 수신하고, 그 수신된 사용자 음성 신호를 상기 음성 인식부(102)에 출력한다(S11).
상기 음성 인식부(102)는 입력 음성과 다수의 모델들 간의 유사도를 나타내는 신뢰도 점수들을 제공하는 미리 결정된 음성 인식 모델들과 상기 음성 수신부(101)로부터 출력되는 사용자 음성 신호를 비교하여 임계치(threshold value)보다 높은 신뢰도 점수들에 해당하는 인식 결과들(예를 들면, 3개의 전화 번호들)을 출력한다. 이때, 상기 음성 인식부(102)는 신뢰도 점수가 가장 높은 하나의 인식 결과만을 출력하는 것이 아니라 신뢰도 점수가 높은 순서대로 적어도 둘 이상(예를 들면, 3개의 전화 번호들)의 인식 결과들을 출력한다. 예를 들면, 상기 음성 인식부(102)는 상기 미리 결정된 음성 인식 모델들과 상기 사용자 음성 신호를 비교하여 신뢰도 점수가 높은 순서대로 3개의 인식된 전화 번호들을 상기 제어부(103)에 출력한다(S12).
상기 제어부(103)는 상기 가장 높은 신뢰도 점수를 갖는 전화 번호(제1 후보 전화 번호)가 상기 저장부(104) 내의 전화 번호 리스트에 등록되었는지를 판단한다(S13).
상기 제어부(103)는 상기 가장 높은 신뢰도 점수를 갖는 제1 후보 전화 번호 가 상기 저장부(104) 내의 전화 번호 리스트에 등록되었을 때, 상기 제1 후보 전화 번호를 인식 결과로서 출력한다(S14).
반면, 상기 제어부(103)는 상기 가장 높은 신뢰도 점수를 갖는 제1 후보 전화 번호가 상기 저장부(104) 내의 전화 번호 리스트에 등록되어 있지 않을 때, 제1 후보 전화 번호 다음으로 낮은 신뢰도 점수를 갖는 제2 후보 전화 번호와 상기 전화 번호 리스트 내의 전화 번호들을 비교한다(S15). 이때, 상기 제어부(103)는 상기 제2 후보 전화 번호를 상기 전화 번호 리스트 내의 전화 번호들과 비교할 때, 상기 전화 번호 리스트 내의 전화 번호들 중에서 전화 통화 횟수가 많은 순서대로 상기 제2 후보 전화 번호와 순차적으로 비교한다.
상기 제어부(103)는 상기 제2 후보 전화 번호와 일치하는 전화 번호가 상기 전화 번호 리스트에 존재할 때 상기 제1 후보 전화 번호 대신에 상기 제2 후보 전화 번호를 인식 결과로서 출력한다(S16).
한편, 상기 제어부(103)는 상기 제2 후보 전화 번호가 상기 저장부(104) 내의 전화 번호 리스트에 등록되어 있지 않을 때, 상기 제2 후보 전화 번호 다음으로 낮은 신뢰도 점수를 갖는 제3 후보 전화 번호와 상기 전화 번호 리스트 내의 전화 번호들을 비교하고, 상기 제3 후보 전화 번호와 일치하는 전화 번호가 상기 전화 번호 리스트에 존재할 때 상기 제1 후보 전화 번호 대신에 상기 제3 후보 전화 번호를 인식 결과로서 출력함으로써 음성 인식률을 향상시킬 수 있다.
이하에서는, 본 발명의 실시예에 따른 음성 인식 시스템 및 그 방법에 따른 인식 결과의 실험치를 도5를 참조하여 설명한다.
도5는 본 발명의 실시예에 따른 음성 인식 시스템 및 그 방법에 따라 전화 번호 리스트를 사용하지 않았을 때와 전화 번호 리스트를 사용했을 때를 비교하여 나타낸 실험 표이다.
본 발명의 실시예에 따른 음성 인식 시스템 및 그 방법은 IBM SDK 4.3c 음성 인식 엔진을 사용하여 인식 결과를 출력하였고, 잡음 환경 내에서 및 주행하는 차량 환경 내에서 전화 번호 리스트를 사용하지 않았을 때와 전화 번호 리스트를 사용했을 때를 비교하였다.
도5에 도시한 바와 같이, 실험 결과, 전화 번호 리스트와 비교되지 않는 제1 후보 전화 번호(종래 기술)의 인식률은 93.92%정도 이었고, 전화 번호 리스트와 비교되는 제2 후보 전화 번호(제1 실시예)의 인식률은 99.83%정도 있었고, 전화 번호 리스트와 비교되는 제3 후보 전화 번호(제2 실시예)의 인식률은 99.95%이었다.
따라서, 제1 후보 전화 번호가 전화 번호 리스트에 없을 때 인식 결과 리스트에서 제1 후보 전화 번호가 아닌 제2 후보 전화 번호 또는 제3 후보 전화 번호를 검출한다. 이때, 제2 후보 전화 번호 또는 제3 후보 전화 번호가 미리 등록된 전화 번호와 일치하면 일치하는 전화 번호를 최종 인식 결과로서 출력한다. 예를 들면, 사용자가 "017-356-1234" 전화 번호를 잘못 발성하여 인식한 결과가 "017-356-1233"으로 나왔을 때, 사용자는 지금까지 "017-356-1234"로 무려 50통의 전화를 했다라는 정보는 있지만 "017-356-1233"으로 전화한 경우가 한번도 없다라고 가정할 때, 상기 인식 결과를 전화 번호 리스트에 존재하는 "017-356-1234"로 대체 해서 인식 결과를 출력한다.
이상에서 상세히 설명한 바와 같이, 본 발명의 실시예에 따른 음성 인식 시스템 및 그 방법은, 사용자 음성 신호에 대한 인식 결과들(전화 번호들)과 미리 등록된 정보(전화 번호 리스트)를 비교함으로써 음성 인식률을 향상시킬 수 있고, 잡음 환경이나, 사용자가 발음을 실수하여도 사용자가 원하는 인식 결과를 빠르고 확률적으로 정확하게 제공할 수 있는 효과가 있다.
본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자라면 본 발명의 본질적인 특성에서 벗어나지 않는 범위에서 다양한 수정 및 변형이 가능할 것이다. 따라서, 본 발명에 개시된 실시예들은 본 발명의 기술 사상을 한정하기 위한 것이 아니라 설명하기 위한 것이고, 이러한 실시예에 의하여 본 발명의 기술 사상의 범위가 한정되는 것은 아니다. 본 발명의 보호 범위는 아래의 청구범위에 의하여 해석되어야 하며, 그와 동등한 범위 내에 있는 모든 기술 사상은 본 발명의 권리범위에 포함되는 것으로 해석되어야 할 것이다.

Claims (16)

  1. 사용자 음성 신호의 인식 결과들을 신뢰도 점수가 높은 순서대로 출력하는 단계와;
    상기 인식 결과들에 대응하는 정보를 순차적으로 미리 등록된 정보와 비교하는 단계와;
    상기 인식 결과들에 대응하는 정보 중에서 상기 미리 등록된 정보와 일치하는 정보를 인식 결과로서 출력하는 단계를 포함하는 것을 특징으로 하는 음성 인식 방법.
  2. 제1항에 있어서,
    상기 비교하는 단계는,
    상기 미리 등록된 정보 중에서 사용 횟수가 많은 순서대로 상기 인식 결과들에 대응하는 정보와 순차적으로 비교하는 단계를 포함하는 것을 특징으로 하는 음성 인식 방법.
  3. 제1항에 있어서,
    상기 인식 결과들을 출력하는 단계는,
    상기 인식 결과들에 대응하는 제1 정보가 상기 미리 등록된 정보에 등록되어 있지 않을 때, 상기 제1 정보 다음으로 낮은 신뢰도 점수를 갖는 제2 정보와 상기 미리 등록된 정보를 비교하고, 상기 제2 정보와 일치하는 정보가 상기 미리 등록된 정보에 존재할 때 상기 제1 정보 대신에 상기 제2 정보를 인식 결과로서 출력하는 것을 특징으로 하는 음성 인식 방법.
  4. 사용자 음성 신호의 인식 결과들에 대응하는 전화 번호들을 신뢰도 점수가 높은 순서대로 출력하는 단계와;
    상기 인식 결과들에 대응하는 전화 번호들을 순차적으로 미리 등록된 전화 번호 리스트 내의 전화 번호들과 비교하는 단계와;
    상기 인식 결과들에 대응하는 전화 번호들 중에서 상기 미리 등록된 전화 번호 리스트 내의 전화 번호들과 일치하는 전화 번호를 인식 결과로서 출력하는 단계를 포함하는 것을 특징으로 하는 음성 인식 방법.
  5. 제4항에 있어서,
    상기 비교하는 단계는,
    상기 전화 번호 리스트 내의 전화 번호들 중에서 사용 횟수가 많은 순서대로 상기 인식 결과들에 대응하는 전화 번호들과 순차적으로 비교하는 단계를 포함하는 것을 특징으로 하는 음성 인식 방법.
  6. 제4항에 있어서,
    상기 인식 결과들을 출력하는 단계는,
    상기 인식 결과들에 대응하는 제1 전화 번호가 상기 미리 등록된 전화 번호 리스트에 등록되어 있지 않을 때, 상기 제1 전화 번호 다음으로 낮은 신뢰도 점수를 갖는 제2 전화 번호와 상기 미리 등록된 전화 번호 리스트 내의 전화 번호들과 비교하고, 상기 제2 전화 번호와 일치하는 전화 번호가 상기 미리 등록된 전화 번호 리스트에 존재할 때 상기 제1 전화 번호 대신에 상기 제2 전화 번호를 인식 결과로서 출력하는 것을 특징으로 하는 음성 인식 방법.
  7. 음성 신호를 수신하는 단계와;
    상기 음성 신호를 미리 결정된 음성 인식 모델들과 비교함으로써 상기 음성 신호의 인식 결과들을 발생하는 단계와;
    상기 인식 결과들을 신뢰도 점수가 높은 순서대로 출력하는 단계와;
    상기 인식 결과들에 대응하는 정보를 순차적으로 미리 등록된 정보와 비교하는 단계와;
    상기 인식 결과들에 대응하는 정보 중에서 상기 미리 등록된 정보와 일치하는 정보를 선택하고, 상기 선택된 정보를 인식 결과로서 출력하는 단계를 포함하는 것을 특징으로 하는 음성 인식 방법.
  8. 제7항에 있어서,
    상기 정보는,
    전화 번호, 메시지, 이름 중에서 어느 하나인 것을 특징으로 하는 음성 인식 방법.
  9. 제7항에 있어서,
    상기 미리 등록된 정보는,
    전화 번호 리스트 내의 전화 번호들, 상기 전화 번호 리스트 내의 전화 번호들에 링크된 이름들, 미리 등록된 메시지들에 링크된 특정 인식 정보 중에서 어느 하나인 것을 특징으로 하는 음성 인식 방법.
  10. 사용자 음성 신호의 인식 결과들을 신뢰도 점수가 높은 순서대로 출력하는 음성 인식부와;
    상기 인식 결과들에 대응하는 정보를 순차적으로 미리 등록된 정보와 비교하고, 상기 인식 결과들에 대응하는 정보 중에서 상기 미리 등록된 정보와 일치하는 정보를 인식 결과로서 출력하는 제어부를 포함하는 것을 특징으로 하는 음성 인식 시스템.
  11. 제10항에 있어서,
    상기 제어부는,
    상기 미리 등록된 정보 중에서 사용 횟수가 많은 순서대로 상기 인식 결과들에 대응하는 정보와 순차적으로 비교하는 것을 특징으로 하는 음성 인식 시스템.
  12. 제10항에 있어서,
    상기 제어부는,
    상기 인식 결과들에 대응하는 제1 정보가 상기 미리 등록된 정보에 등록되어 있지 않을 때, 상기 제1 정보 다음으로 낮은 신뢰도 점수를 갖는 제2 정보와 상기 미리 등록된 정보를 비교하고, 상기 제2 정보와 일치하는 정보가 상기 미리 등록된 정보에 존재할 때 상기 제1 정보 대신에 상기 제2 정보를 인식 결과로서 출력하는 것을 특징으로 하는 음성 인식 시스템.
  13. 이동 통신 단말기의 모드가 전화 걸기 모드일 때 음성 신호를 수신하는 음성 수신부와;
    상기 음성 신호를 미리 결정된 음성 인식 모델들과 비교함으로써 상기 음성 신호의 인식 결과들 발생하고, 상기 인식 결과들을 신뢰도 점수가 높은 순서대로 출력하는 음성 인식부와;
    상기 인식 결과들에 대응하는 정보를 순차적으로 미리 등록된 정보와 비교하고, 상기 인식 결과들에 대응하는 정보 중에서 상기 미리 등록된 정보와 일치하는 정보를 선택하고, 상기 선택된 정보를 인식 결과로서 출력하는 제어부를 포함하는 것을 특징으로 하는 음성 인식 시스템.
  14. 제13항에 있어서,
    상기 정보는,
    전화 번호, 메시지, 이름 중에서 어느 하나인 것을 특징으로 하는 음성 인식 시스템.
  15. 제13항에 있어서,
    상기 미리 등록된 정보는,
    전화 번호 리스트 내의 전화 번호들, 상기 전화 번호 리스트 내의 전화 번호들에 링크된 이름들, 미리 등록된 메시지들에 링크된 특정 인식 정보 중에서 어느 하나인 것을 특징으로 하는 음성 인식 시스템.
  16. 제13항에 있어서,
    상기 제어부는,
    상기 정보가 전화 번호일 때, 상기 신뢰도 점수가 가장 높은 제1 인식 결과에 대응하는 전화 번호가 전화 번호 리스트에 없을 때 상기 제1 인식 결과보다 신뢰도 점수가 낮은 제2 인식 결과에 대응하는 전화 번호와 상기 전화 번호 리스트 내의 전화 번호들을 순차적으로 비교하고, 상기 제2 인식 결과에 대응하는 전화 번호가 상기 전화 번호 리스트 내의 전화 번호와 일치하면 상기 일치된 전화 번호를 상기 제1 인식 결과에 대응하는 전화 번호 대신에 출력하는 것을 특징으로 하는 음성 인식 시스템.
KR1020060046768A 2006-05-24 2006-05-24 음성 인식 시스템 및 그 방법 KR20070113045A (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020060046768A KR20070113045A (ko) 2006-05-24 2006-05-24 음성 인식 시스템 및 그 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020060046768A KR20070113045A (ko) 2006-05-24 2006-05-24 음성 인식 시스템 및 그 방법

Publications (1)

Publication Number Publication Date
KR20070113045A true KR20070113045A (ko) 2007-11-28

Family

ID=39091088

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020060046768A KR20070113045A (ko) 2006-05-24 2006-05-24 음성 인식 시스템 및 그 방법

Country Status (1)

Country Link
KR (1) KR20070113045A (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20200053341A (ko) * 2018-11-08 2020-05-18 현대자동차주식회사 차량 및 그 제어방법

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20200053341A (ko) * 2018-11-08 2020-05-18 현대자동차주식회사 차량 및 그 제어방법

Similar Documents

Publication Publication Date Title
US8700397B2 (en) Speech recognition of character sequences
US6925154B2 (en) Methods and apparatus for conversational name dialing systems
KR100854044B1 (ko) 음성 인식 시스템에서의 발성 끝 검출
US7058573B1 (en) Speech recognition system to selectively utilize different speech recognition techniques over multiple speech recognition passes
US11087764B2 (en) Speech recognition apparatus and speech recognition system
US8355920B2 (en) Natural error handling in speech recognition
US6792408B2 (en) Interactive command recognition enhancement system and method
US8374862B2 (en) Method, software and device for uniquely identifying a desired contact in a contacts database based on a single utterance
TW548630B (en) System and method for automatic voice recognition using mapping
CN109754793B (zh) 用于推荐车辆的功能的装置和方法
RU2393549C2 (ru) Способ и устройство для распознавания речи
EP0128288A1 (en) Method and system for adaptive automatic discrete utterance recognition
EP2221806B1 (en) Speech recognition of a list entry
JP2007504490A (ja) 補足情報を用いた改良型音声認識の方法および装置
JPH09106296A (ja) 音声認識装置及び方法
JP4246703B2 (ja) 自動音声認識の方法
US20070094022A1 (en) Method and device for recognizing human intent
US20210183362A1 (en) Information processing device, information processing method, and computer-readable storage medium
JP2012078650A (ja) 音声入力支援装置
JP2008033198A (ja) 音声対話システム、音声対話方法、音声入力装置、プログラム
US20070129945A1 (en) Voice quality control for high quality speech reconstruction
KR20070113045A (ko) 음성 인식 시스템 및 그 방법
JP2003177788A (ja) 音声対話システムおよびその方法
EP1895748B1 (en) Method, software and device for uniquely identifying a desired contact in a contacts database based on a single utterance
JP4282354B2 (ja) 音声認識装置

Legal Events

Date Code Title Description
WITN Withdrawal due to no request for examination