KR20010026288A - 유사 음소에 기반한 화자 종속형 음성 인식 장치 및 그 방법 - Google Patents

유사 음소에 기반한 화자 종속형 음성 인식 장치 및 그 방법 Download PDF

Info

Publication number
KR20010026288A
KR20010026288A KR1019990037534A KR19990037534A KR20010026288A KR 20010026288 A KR20010026288 A KR 20010026288A KR 1019990037534 A KR1019990037534 A KR 1019990037534A KR 19990037534 A KR19990037534 A KR 19990037534A KR 20010026288 A KR20010026288 A KR 20010026288A
Authority
KR
South Korea
Prior art keywords
word
voice
speaker
predetermined
word model
Prior art date
Application number
KR1019990037534A
Other languages
English (en)
Other versions
KR100358992B1 (ko
Inventor
이봉우
권오일
Original Assignee
윤장진
주식회사 현대오토넷
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 윤장진, 주식회사 현대오토넷 filed Critical 윤장진
Priority to KR1019990037534A priority Critical patent/KR100358992B1/ko
Publication of KR20010026288A publication Critical patent/KR20010026288A/ko
Application granted granted Critical
Publication of KR100358992B1 publication Critical patent/KR100358992B1/ko

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
    • G10L15/065Adaptation
    • G10L15/07Adaptation to the speaker
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/285Memory allocation or algorithm optimisation to reduce hardware requirements
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/04Training, enrolment or model building
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
    • G10L15/063Training
    • G10L2015/0631Creating reference templates; Clustering

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • Telephone Function (AREA)

Abstract

본 발명은 유사 음소에 기반한 화자 종속형 음성 인식 장치 및 그 방법에 관한 것이다.
본 발명은 텍스트 입력기(10)와, 음성 입력기(20)와, 유사 음소(PLU)를 저장하는 ROM(30)과, ROM(30)의 유사 음소(PLU)를 연결하여 만든 웨이브 파일을 이용하여 생성하는 단어 모델을 저장하는 RAM(40)과, 입력 텍스트에 포함되는 단어에 대응하는 ROM(30)의 유사 음소(PLU)를 연결하여 단어에 대한 특징 벡터를 추출하므로써 웨이브 파일을 만들고, 웨이브 파일을 이용하여 대표 벡터를 가지는 단어 모델을 생성하여 등록하며, 음성 입력 시에 입력 음성 데이터의 특징 벡터를 추출한 후, 음성 데이터의 특징 벡터와 RAM(40)에 등록된 단어 모델의 대표 벡터를 매칭시켜 음성 데이터와 단어 모델의 거리를 측정한 결과, 최소 거리값을 가지는 단어 모델을 추출하여 음성 인식 결과로 출력하는 CPU(50), 및 CPU(50)의 출력 단어에 따라서 목표물의 작동을 제어하는 목표 컨트롤러(60)로 구성되며,
이에 따라서, 사용자의 음성을 입력받아 단어 모델을 등록하지 않더라도 간단하고 용이하게 단어를 등록할 수 있다.

Description

유사 음소에 기반한 화자 종속형 음성 인식 장치 및 그 방법 { VOICE RECOGNITION APPARATUS DEPENDED ON SPEAKERS FOR BEING BASED ON THE PHONEME LIKE UNIT AND THE METHOD }
본 발명은 음성 인식 장치에 관한 것이며, 보다 상세히는 유사 음소에 기반한 화자 종속형 음성 인식 장치 및 그 방법에 관한 것이다.
종래의 화자 종속형 음성 인식 장치는 사용자에게서 직접 단어 인식에 필요한 단어 전체를 입력받아 단어 모델을 생성한 후, 음성 입력 시에 해당 단어를 인식한 결과에 따라서 소정의 목표 컨트롤러(예컨대, 핸드폰의 다이얼링 컨트롤러)에 인식된 단어를 전송하도록 되어 있다.
그러나, 상기와 같은 종래의 화자 종속형 음성 인식 장치는 반드시 사용자의 개입이 필요하므로 사용자에 대한 편의성이 떨어지고, 특히 단어 모델을 유지하기 위하여 많은 단어를 메모리에 등록시키면 그 만큼 기억 용량이 증가하는 단점이 있으며, 이로 인해 모빌 컴퓨터(예컨대, 노트북, 랩탑, PDA 등)에 활발하게 적용되지 못하는 문제점이 있다.
따라서, 본 발명은 상술한 종래의 문제점을 극복하기 위한 것으로서, 본 발명의 목적은 등록하려는 단어를 텍스트로 입력받고, 메모리에 미리 구축한 유사 음소(Phoneme Like Unit; 이하 PLU라 한다)를 연결하여 만든 해당 단어의 웨이브 파일을 이용하여 소정의 단어 모델을 생성하도록 된 유사 음소에 기반한 화자 종속형 음성 인식 장치 및 그 방법을 제공하는데 있다.
상기 본 발명의 목적을 달성하기 위한 유사 음소에 기반한 화자 종속형 음성 인식 장치는 음성을 인식하기 위하여 등록하려고 하는 단어를 텍스트로 입력받는 텍스트 입력기와, 화자의 음성을 입력받는 음성 입력기와, 음성 인식용 웨이브 파일을 생성하기 위한 유사 음소(PLU)를 저장하는 ROM과, 상기 ROM의 유사 음소(PLU)를 연결하여 만든 소정의 단어에 대한 웨이브 파일을 이용하여 생성하는 소정의 단어 모델을 저장하는 RAM과, 입력 텍스트에 포함되는 단어에 대응하는 상기 ROM의 유사 음소(PLU)를 연결하여 소정의 단어에 대한 특징 벡터를 추출하므로써 웨이브 파일을 만들고, 상기 웨이브 파일을 이용하여 소정의 대표 벡터를 가지는 단어 모델을 생성한 후 상기 RAM에 등록하며, 화자의 음성 입력 시에 입력 음성 데이터의 특징 벡터를 추출한 후, 상기 음성 데이터의 특징 벡터와 상기 RAM에 등록되어 있는 단어 모델의 대표 벡터를 매칭시켜 음성 데이터와 단어 모델의 거리를 측정한 결과, 최소 거리값을 가지는 단어 모델을 추출하여 음성 인식 결과로 출력하는 CPU, 및 상기 CPU가 화자의 음성을 인식하여 출력하는 단어에 따라서 소정의 목표물의 작동을 제어하는 목표 컨트롤러로 구성된다.
이에 따라서, 본 발명의 유사 음소에 기반한 화자 종속형 음성 인식 장치는 사용자의 음성을 입력받아 단어 모델을 등록하지 않더라도 간단하고 용이하게 단어를 등록할 수 있으며, 단어 모델을 쉽게 생성할 수 있으므로 많은 단어 모델을 저장하기 위한 메모리 공간이 필요없게 된다.
도 1은 본 발명에 따른 유사 음소에 기반한 화자 종속형 음성 인식 장치를 도시한 구성도,
도 2는 본 발명에 따른 유사 음소에 기반한 화자 종속형 음성 인식 장치의 단어 등록 과정을 도시한 플로차트,
도 3은 본 발명에 따른 유사 음소에 기반한 화자 종속형 음성 인식 장치의 단어 인식 과정을 도시한 플로차트,
도 4는 본 발명에 따른 유사 음소에 기반한 화자 종속형 음성 인식 장치의 웨이브 파일의 파형과 화자의 음성 파형을 도시한 파형도이다.
<도면의 주요 부분에 대한 부호의 설명>
10: 텍스트 입력기 20: 음성 입력기
30: ROM 40: RAM
50: CPU 60: 목표 컨트롤러
이하, 본 발명의 실시예를 첨부한 도면을 참조하여 상세히 설명하기로 한다.
도 1을 참조하면, 텍스트 입력기(10)는 음성을 인식하기 위하여 등록하려고 하는 단어를 텍스트로 입력받는다.
음성 입력기(20)는 화자의 음성을 입력받는다.
ROM(30)은 음성 인식용 웨이브 파일을 생성하기 위한 유사 음소(PLU)를 저장한다.
상기 ROM(30)에는 한글 단어를 초성, 중성, 종성으로 구분하여 총 46개의 유사 음소(PLU)가 저장된다.
상기 유사 음소(PLU)는 "ㅃ, ㄸ, ㅔ(ㅐ), ㄲ, 종성 ㅇ, ㅆ, 묵음, ㅡ, ㅓ, ㅉ, ㅏ, ㅂ, 유성음화 ㅂ(예컨대, 아버지의 ㅂ), 불파음화 ㅂ, ㅊ, ㄷ, 유성음화 ㄷ, 불파음화 ㄷ, 받침 ㄱ, 유성음화 ㄱ, 불파음화 ㄱ, ㅎ, 유성음화 ㅎ, ㅣ, ㅑ, ㅒ(ㅖ), ㅛ, ㅠ, ㅕ, ㅋ, 받침 ㄹ, ㅁ, ㄴ, ㅗ, ㅍ, 초성 ㄹ, ㅅ, ㅌ, ㅜ, ㅓ, ㅚ(ㅞ,ㅙ), ㅘ, ㅟ, ㅝ, ㅈ, 유성음화 ㅈ" 으로 구성된다.
RAM(40)은 상기 ROM(30)의 유사 음소(PLU)를 연결하여 만든 소정의 단어에 대한 웨이브 파일을 이용하여 생성하는 소정의 단어 모델을 저장한다.
CPU(50)는 입력 텍스트에 포함되는 단어에 대응하는 상기 ROM(30)의 유사 음소(PLU)를 연결하여 소정의 단어에 대한 특징 벡터를 추출하므로써 웨이브 파일을 만들고, 상기 웨이브 파일을 이용하여 소정의 대표 벡터를 가지는 단어 모델을 생성한 후 상기 RAM(40)에 등록한다.
상기 CPU(50)는 화자의 음성 입력 시에 입력 음성 데이터의 특징 벡터를 추출한 후, 상기 음성 데이터의 특징 벡터와 상기 RAM(40)에 등록되어 있는 단어 모델의 대표 벡터를 매칭시켜 음성 데이터와 단어 모델의 거리를 측정한 결과, 최소 거리값을 가지는 단어 모델을 추출하여 음성 인식 결과로 출력한다.
목표 컨트롤러(60)는 상기 CPU(50)가 화자의 음성을 인식하여 출력하는 단어에 따라서 소정의 목표물(예컨대, 핸드폰 다이얼 장치)의 작동을 제어한다.
상기와 같은 구성에 의해서 본 발명에 따른 유사 음소에 기반한 화자 종속형 음성 인식 장치는 다음과 같이 작동한다.
본 발명에 따른 유사 음소에 기반한 화자 종속형 음성 인식 장치는 기본적으로 단어 등록 과정과 단어 인식 과정을 수행한다.
먼저, 도 2를 참조하여 단어 등록 과정을 설명하면 다음과 같다.
상기 CPU(50)는 상기 텍스트 입력기(10)를 통해 등록시키기 위한 단어를 포함하는 텍스트가 입력되면(S10), 상기 ROM(30)에 저장되어 있는 유사 음소(PLU) 중에서 상기 텍스트에 대응하는 유사 음소(PLU)를 추출한다(S11).
또한, 상기와 같이 입력 텍스트에 대응하는 소정의 유사 음소(PLU)가 추출되면, 상기 CPU(50)는 추출된 소정의 유사 음소(PLU)를 연결하여 소정의 웨이브 파일을 만든다(S12).
이어서, 상기 CPU(50)는 상기 웨이브 파일에 대해 VMS-VQ(Variable multi section-vector quantization) 알고리즘을 적용하여 특징 벡터를 추출하고(S13), 상기 특징 벡터를 분류하여 소정의 벡터군을 생성한다(S14).
상기와 같이, 소정의 벡터군이 생성되면 최종적으로 상기 CPU(50)는 상기 벡터군에 대해 MKM(Modified K-means) 클러스터링 알고리즘을 적용하여 대표 벡터를 추출하고(S15), 소정의 단어 모델을 생성하여 상기 RAM(40)에 저장한다(S16). 이때, 상기 대표 벡터를 추출하기 위하여 생성한 웨이브 파일은 삭제된다.
특히, 본 발명에 따른 유사 음소에 기반한 화자 종속형 음성 인식 장치는 상기와 같은 단어 등록 과정에 있어서, 상기 ROM(30)에 저장되어 있는 유사 음소(PLU)를 이용하여 단어 모델을 생성하도록 되어 있으므로, 상기 유사 음소(PLU)의 DB를 저장하는 ROM(30)의 메모리 공간만 확보해 놓으면 무제한적으로 다양한 단어 모델을 생성하여 상기 RAM(40)에 등록할 수 있다.
상기와 같이 단어 등록 과정이 완료된 상태에서 화자의 음성이 상기 음성 입력기(20)를 통해 입력되면 본 발명에 따른 유사 음소에 기반한 화자 종속형 음성 인식 장치는 단어 인식 과정을 수행한다.
도 3을 참조하여 단어 인식 과정을 설명하면 다음과 같다.
상기 CPU(50)는 상기 음성 입력기(20)를 통해 화자의 음성이 입력되면(S20), 입력 음성의 엔드 포인트, 즉 시작점과 종료점을 검출하여 음성 인식에 필요한 음성 데이터만을 추출한다(S21).
또한, 상기와 같이 소정의 음성 데이터가 추출되면, 상기 CPU(50)는 추출된 상기 음성 데이터에 대한 특징 벡터를 추출한다(S22).
이어서, 상기 음성 데이터에 대한 특징 벡터가 추출되면, 상기 CPU(50)는 상기 음성 데이터의 특징 벡터와 상기 RAM(40)에 등록되어 있는 단어 모델의 대표 벡터에 대해 VMS-VQ 알고리즘을 적용하여, 상기 음성 데이터의 특징 벡터와 상기 RAM(40)에 등록되어 있는 단어 모델의 대표 벡터를 서로 매칭시켜 음성 데이터와 단어 모델의 거리를 측정하고, 측정 결과 최소 거리값을 가지는 단어 모델을 화자의 음성에 대한 인식 단어로 추출한다(S23).
상기와 같이, 소정의 단어 모델, 즉 상기 최소 거리값을 가지는 단어 모델이 추출되면, 상기 CPU(50)는 상기 최소 거리값을 가지는 단어 모델을 음성 인식 결과로 출력하여 상기 목표 컨트롤러(60)로 인가시키며(S24), 이에 따라서 목표 컨트롤러(60)는 상기 CPU(50)가 화자의 음성을 인식하여 출력하는 단어에 따라서 소정의 목표물(예컨대, 핸드폰 다이얼 장치)의 작동을 제어한다.
참고로, 본 발명에 따른 유사 음소에 기반한 화자 종속형 음성 인식 장치에 있어서, "어머니"라는 단어를 상기 RAM(40)에 등록한 후, 화자가 "어머니"라는 음성을 상기 음성 입력기(20)를 통해 상기 CPU(50)로 인가시킬 때, 단어 등록 과정에서 생성되는 상기 "어머니"라는 단어의 대표 벡터를 추출하기 위한 웨이브 파일의 파형은 도 4의 (가)에 도시된 바와 같이 나타나며, 화자가 입력하는 "어머니"라는 단의 음성 파형은 도 4의 (나)에 도시된 바와 같이 나타난다.
도 4에 도시된 파형을 비교해 보면, 실제로 상기 ROM(30)에 저장되는 유소 음소(PLU)를 연결하여 만든 웨이브 파일의 파형과 화자의 음성 파형이 유사함을 알 수 있으며, 이에 따라서 본 발명에 따른 유사 음소에 기반한 화자 종속형 음성 인식 장치가 정확한 음성 인식 기능을 수행할 수 있음을 알 수 있다.
상술한 바와 같이 본 발명에 따른 유사 음소에 기반한 화자 종속형 음성 인식 장치 및 그 방법은 등록하려는 단어를 텍스트로 입력받고, 메모리에 미리 구축한 유사 음소(PLU)를 연결하여 만든 해당 단어의 웨이브 파일을 이용하여 소정의 단어 모델을 생성하도록 되어 있기 때문에, 사용자의 음성을 입력받아 단어 모델을 등록하지 않더라도 간단하고 용이하게 단어를 등록할 수 있으며, 단어 모델을 쉽게 생성할 수 있으므로 많은 단어 모델을 저장하기 위한 메모리 공간이 필요없게 되는 효과가 있다.
이상에서 설명한 것은 본 발명에 따른 유사 음소에 기반한 화자 종속형 음성 인식 장치 및 방법을 실시하기 위한 하나의 실시예에 불과한 것으로서, 본 발명은 상기한 실시예에 한정되지 않고, 이하의 특허청구의 범위에서 청구하는 본 발명의 요지를 벗어남이 없이 당해 발명이 속하는 분야에서 통상의 지식을 가진 자라면 누구든지 다양한 변경 실시가 가능할 것이다.

Claims (3)

  1. 음성을 인식하기 위하여 등록하려고 하는 단어를 텍스트로 입력받는 텍스트 입력기(10)와,
    화자의 음성을 입력받는 음성 입력기(20)와,
    음성 인식용 웨이브 파일을 생성하기 위한 유사 음소(PLU)를 저장하는 ROM(30)과,
    상기 ROM(30)의 유사 음소(PLU)를 연결하여 만든 소정의 단어에 대한 웨이브 파일을 이용하여 생성하는 소정의 단어 모델을 저장하는 RAM(40)과,
    입력 텍스트에 포함되는 단어에 대응하는 상기 ROM(30)의 유사 음소(PLU)를 연결하여 소정의 단어에 대한 특징 벡터를 추출하므로써 웨이브 파일을 만들고, 상기 웨이브 파일을 이용하여 소정의 대표 벡터를 가지는 단어 모델을 생성한 후 상기 RAM(40)에 등록하며, 화자의 음성 입력 시에 입력 음성 데이터의 특징 벡터를 추출한 후, 상기 음성 데이터의 특징 벡터와 상기 RAM(40)에 등록되어 있는 단어 모델의 대표 벡터를 매칭시켜 음성 데이터와 단어 모델의 거리를 측정한 결과, 최소 거리값을 가지는 단어 모델을 추출하여 음성 인식 결과로 출력하는 CPU(50), 및
    상기 CPU(50)가 화자의 음성을 인식하여 출력하는 단어에 따라서 소정의 목표물의 작동을 제어하는 목표 컨트롤러(60)
    로 구성되는 것을 특징으로 하는 유사 음소에 기반한 화자 종속형 음성 인식 장치.
  2. 유사 음소에 기반한 화자 종속형 음성 인식 장치에 있어서, 상기 CPU(50)의 단어 등록 과정은
    상기 텍스트 입력기(10)를 통해 등록시키기 위한 단어를 포함하는 텍스트가 입력되면(S10), 상기 ROM(30)에 저장되어 있는 유사 음소(PLU) 중에서 상기 텍스트에 대응하는 유사 음소(PLU)를 추출하는 단계(S11)와,
    추출된 소정의 유사 음소(PLU)를 연결하여 소정의 웨이브 파일을 만드는 단계(S12)와,
    상기 웨이브 파일에 대해 VMS-VQ 알고리즘을 적용하여 특징 벡터를 추출하고(S13), 상기 특징 벡터를 분류하여 소정의 벡터군을 생성하는 단계(S14), 및
    상기 벡터군에 대해 MKM 클러스터링 알고리즘을 적용하여 대표 벡터를 추출하고(S15), 소정의 단어 모델을 생성하여 상기 RAM(40)에 저장하는 단계(S16)
    로 이루어진 것을 특징으로 하는 유사 음소에 기반한 화자 종속형 음성 인식 방법.
  3. 유사 음소에 기반한 화자 종속형 음성 인식 장치에 있어서, 상기 CPU(50)의 단어 인식 과정은
    상기 음성 입력기(20)를 통해 화자의 음성이 입력되면(S20), 입력 음성의 엔드 포인트를 검출하여 음성 데이터만을 추출하는 단계(S21)와,
    추출된 상기 음성 데이터에 대한 특징 벡터를 추출하는 단계(S22)와,
    상기 음성 데이터의 특징 벡터와 상기 RAM(40)에 등록되어 있는 단어 모델의 대표 벡터에 대해 VMS-VQ 알고리즘을 적용하여, 상기 음성 데이터의 특징 벡터와 상기 RAM(40)에 등록되어 있는 단어 모델의 대표 벡터를 매칭시켜 음성 데이터와 단어 모델의 거리를 측정한 결과, 최소 거리값을 가지는 단어 모델을 추출하는 단계(S23), 및
    상기 최소 거리값을 가지는 단어 모델을 음성 인식 결과로 출력하여 상기 목표 컨트롤러(60)로 인가시키는 단계(S24)
    로 이루어진 것을 특징으로 하는 유사 음소에 기반한 화자 종속형 음성 인식 방법.
KR1019990037534A 1999-09-04 1999-09-04 유사 음소에 기반한 화자 종속형 음성 인식 장치 및 그 방법 KR100358992B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1019990037534A KR100358992B1 (ko) 1999-09-04 1999-09-04 유사 음소에 기반한 화자 종속형 음성 인식 장치 및 그 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1019990037534A KR100358992B1 (ko) 1999-09-04 1999-09-04 유사 음소에 기반한 화자 종속형 음성 인식 장치 및 그 방법

Publications (2)

Publication Number Publication Date
KR20010026288A true KR20010026288A (ko) 2001-04-06
KR100358992B1 KR100358992B1 (ko) 2002-10-30

Family

ID=19610134

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019990037534A KR100358992B1 (ko) 1999-09-04 1999-09-04 유사 음소에 기반한 화자 종속형 음성 인식 장치 및 그 방법

Country Status (1)

Country Link
KR (1) KR100358992B1 (ko)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100560916B1 (ko) * 2001-06-30 2006-03-14 주식회사 케이티 인식 후 거리를 이용한 음성인식 방법
KR100717385B1 (ko) * 2006-02-09 2007-05-11 삼성전자주식회사 인식 후보의 사전적 거리를 이용한 인식 신뢰도 측정 방법및 인식 신뢰도 측정 시스템
CN116705063A (zh) * 2023-08-07 2023-09-05 北京中电慧声科技有限公司 一种基于流形测度的多模型融合的语音鉴伪识别方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100560916B1 (ko) * 2001-06-30 2006-03-14 주식회사 케이티 인식 후 거리를 이용한 음성인식 방법
KR100717385B1 (ko) * 2006-02-09 2007-05-11 삼성전자주식회사 인식 후보의 사전적 거리를 이용한 인식 신뢰도 측정 방법및 인식 신뢰도 측정 시스템
CN116705063A (zh) * 2023-08-07 2023-09-05 北京中电慧声科技有限公司 一种基于流形测度的多模型融合的语音鉴伪识别方法
CN116705063B (zh) * 2023-08-07 2023-10-20 北京中电慧声科技有限公司 一种基于流形测度的多模型融合的语音鉴伪识别方法

Also Published As

Publication number Publication date
KR100358992B1 (ko) 2002-10-30

Similar Documents

Publication Publication Date Title
CN107591155B (zh) 语音识别方法及装置、终端及计算机可读存储介质
US5680510A (en) System and method for generating and using context dependent sub-syllable models to recognize a tonal language
JP5480760B2 (ja) 端末装置、音声認識方法および音声認識プログラム
KR101590724B1 (ko) 음성 인식 오류 수정 방법 및 이를 수행하는 장치
US10650810B2 (en) Determining phonetic relationships
US20050049870A1 (en) Open vocabulary speech recognition
JP5200712B2 (ja) 音声認識装置、音声認識方法及びコンピュータプログラム
US11527240B2 (en) Speech recognition system, speech recognition method and computer program product
US10916246B2 (en) Information processing device, in-vehicle device, and storage medium
JP2019219574A (ja) 話者モデル作成システム、認識システム、プログラムおよび制御装置
CN110827803A (zh) 方言发音词典的构建方法、装置、设备及可读存储介质
KR102394912B1 (ko) 음성 인식을 이용한 주소록 관리 장치, 차량, 주소록 관리 시스템 및 음성 인식을 이용한 주소록 관리 방법
KR100358992B1 (ko) 유사 음소에 기반한 화자 종속형 음성 인식 장치 및 그 방법
JP2011170087A (ja) 音声認識装置
US12002475B2 (en) Electronic device performing speaker recognition and control method thereof
KR100373989B1 (ko) 음절 인식을 이용한 사용자 인증 방법 및 사용자 인증시스템
Barnard et al. Phone recognition for spoken web search
JP3039453B2 (ja) 音声認識装置
JP5336788B2 (ja) 音声認識装置およびプログラム
JP2009053522A (ja) 音声出力装置
KR100347790B1 (ko) 명령어 갱신이 가능한 음성인식 방법 및 그 시스템
JP4445371B2 (ja) 認識語彙の登録装置と音声認識装置および方法
JP2020034832A (ja) 辞書生成装置、音声認識システムおよび辞書生成方法
KR20180124225A (ko) 음성인식 전화연결 시스템 및 방법
JP2004138914A (ja) 音声認識用辞書調整装置及び方法

Legal Events

Date Code Title Description
A201 Request for examination
N231 Notification of change of applicant
E902 Notification of reason for refusal
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20081008

Year of fee payment: 7

LAPS Lapse due to unpaid annual fee