KR100775186B1 - 학습된 모델을 이용한 상태 클러스터링 방법 - Google Patents

학습된 모델을 이용한 상태 클러스터링 방법 Download PDF

Info

Publication number
KR100775186B1
KR100775186B1 KR1020010033447A KR20010033447A KR100775186B1 KR 100775186 B1 KR100775186 B1 KR 100775186B1 KR 1020010033447 A KR1020010033447 A KR 1020010033447A KR 20010033447 A KR20010033447 A KR 20010033447A KR 100775186 B1 KR100775186 B1 KR 100775186B1
Authority
KR
South Korea
Prior art keywords
triphone
learned
cluster
model
observations
Prior art date
Application number
KR1020010033447A
Other languages
English (en)
Other versions
KR20020095503A (ko
Inventor
신원호
Original Assignee
엘지전자 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 엘지전자 주식회사 filed Critical 엘지전자 주식회사
Priority to KR1020010033447A priority Critical patent/KR100775186B1/ko
Publication of KR20020095503A publication Critical patent/KR20020095503A/ko
Application granted granted Critical
Publication of KR100775186B1 publication Critical patent/KR100775186B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • G10L15/183Speech classification or search using natural language modelling using context dependencies, e.g. language models
    • G10L15/19Grammatical context, e.g. disambiguation of the recognition hypotheses based on word sequence rules
    • G10L15/197Probabilistic grammars, e.g. word n-grams
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/14Speech classification or search using statistical models, e.g. Hidden Markov Models [HMMs]
    • G10L15/142Hidden Markov Models [HMMs]
    • G10L15/144Training of HMMs
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L2015/081Search algorithms, e.g. Baum-Welch or Viterbi

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Probability & Statistics with Applications (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Human Computer Interaction (AREA)
  • Mathematical Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Pure & Applied Mathematics (AREA)
  • Computational Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Optimization (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Operations Research (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Algebra (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Machine Translation (AREA)

Abstract

학습된 모델을 이용한 상태 클러스터링 방법에 관하여 게시된다. 본 발명에 따른 학습된 모델을 이용한 상태 클러스터링 방법은 (a) 입력되는 임의의 단어를 다수 개의 트라이폰으로 분류하는 단계; (b) 상기 분류된 트라이폰을 학습된 트라이폰으로 대체하고, 개별 관측값 및 다중 믹스춰(mixture)를 이용하여 확률밀도함수를 구하는 단계; (c) 상기 확률밀도함수를 기초로한 음향학적 질문을 적용하여 최적 질문을 선택하고, 최적 질문을 선택하는 과정에서 상기 학습된 트라이폰의 발생 빈도별 가중치를 부여하는 단계; (d) 상기 선택된 최적의 질문에 따라 클러스터를 분할하여 임계값 이상이 될때까지 분할 과정을 반복하는 단계을 포함한다.
따라서, 학습된 모델을 이용하여 상태 클러스터링을 수행함으로써 많은 데이터에 의해 계산량을 줄일 수 있어 효과적이다.
또한, 개별적인 관측과 다중 믹스춰를 사용하여 클러스터에 속한 모델의 관측 확률 분포를 보다 세밀하게 나타냄으로써 정확한 확률을 구할 수 있는 효과가 있다.
트라이폰, HMM, mixture

Description

학습된 모델을 이용한 상태 클러스터링 방법{METHOD FOR THE STATE 0CLUSTRING USE OF TRAIDED MODEL}
도 1은 종래의 임의의 단어인식을 위한 학습과정을 나타내는 음성인식 시스템을 나타내는 도면이다.
도 2는 본 발명의 바람직한 일실시예에 따른 하나의 클러스터 내의 관측값을 모델링한 것을 나타내는 도면이다.
도 3은 본 발명의 바람직한 일실시예에 따른 상태 클러스터링을 나타내는 순서도이다.
<도면에 나타나는 도면부호에 대한 설명>
101, 103 ; Baum-Welch 102 ; 탑 다운 클러스터링
본 발명은 학습된 모델을 이용한 상태 클러스터링 방법에 관한 것으로서, 더욱 상세하게는 다중 믹스춰(mixture) 및 개개의 클러스터 내의 평균 및 분산을 이용하는 상태 클러스터링을 이용하여 음향 모델링하는 학습된 모델을 이용한 상태 클러스터링 방법에 관한 것이다.
일반적으로, HMM(Hidden Markov Model)을 이용한 음성 인식 시스템에서 음향 모델은 인식 성능을 좌우하는 중요한 요소이다. 상기 음향 모델은 학습 데이터 부족의 보완, 모델 크기의 축소 등에 따른 속도 개선 등을 위하여 모델이나 상태를 공유하는 것이 바람직하며, 최근에는 상태 클러스터링 방식이 많이 이용되고 있다. 상기 상태 클러스터링을 이용한 학습 모델을 추출하기 위해서는 음향학적 질문(phonetic question)을 이용한 탑-다운(top-down)방식의 결정 트리 방법 또는 모델간의 유사도를 이용하여 클러스터링을 수행하는 바텀-업(bottom-up) 방식의 클러스터링 방식이 일반적으로 자주 사용되고 있다.
이러한 경우, 전자는 미학습(unseen) 트라이폰에 대해서도 음향학적 질문을 적용하여 처리할 수 있는 잇점이 있어 보다 자주 이용되고 있으므로, 상기 탑-다운 방식의 결정 트리 방법을 구현하는 음성인식 시스템에 대하여 상세히 설명하기로 한다.
도 1은 종래의 임의의 단어인식을 위한 훈련과정을 나타내는 음성인식 시스템을 나타내는 도면이다.
도 1에 도시된 바와 같이, 음성 인식 시스템은 음성 데이터와 텍스트(text)데이터를 이용하여 Baum-Welch 알고리즘(101)에 의해 HMM 파라미터를 훈련시키고, 탑-다운 클러스터링부(102)는 훈련된 모델들을 디시젼-트리 방법에 의하여 클러스터링하고, Baum-Welch 알고리즘(103)은 클러스터링부(102)에서 구해진 디시젼 트리의 맵핑(mapping) 관계를 이용하여 HMM 파라미터를 재훈련시켜 최종적인 HMM 모델들을 추출한다.
상기와 같은 음성인식 시스템을 이용한 결정 트리 방법은 개개의 클러스터 내의 학습 데이터에 대해 음향학적 질문에 의해 나누어진 데이터의 우도값(likilihood)의 증가분이 큰 질문을 선택하고 이를 이용하여 클러스터를 분할하는 과정을 반복한다. 이러한 경우, 학습 데이터를 이용하여 개개의 클러스터에 할당된 데이터들의 평균 및 분산 값을 구하는 과정을 반복해야 하므로 많은 양의 학습 데이터를 처리할 때 계산량의 부담 및 불편함을 가지고 있다.
또한, 일반적으로 단일 mixture를 기반으로 하므로 다중 mixture를 사용하는 시스템에 비해 정확도가 떨어지는 문제점이 있다.
본 발명은 상기한 종래 기술의 문제점을 효과적으로 해결하기 위해, 학습된 모델을 관측 데이터의 평균 특징으로 대체하여 효율적으로 상태 클러스터링 결과를 생성하는 학습된 모델을 이용한 상태 클러스터링 방법을 제공함에 그 목적이 있다.
상기한 기술적 과제를 달성하기 위한 본 발명은 (a) 입력되는 임의의 단어를 다수 개의 트라이폰으로 분류하는 단계;
(b) 상기 분류된 트라이폰을 학습된 트라이폰으로 대체하고, 개별 관측값 및 다중 믹스춰를 이용하여 확률밀도함수를 구하는 단계;
(c) 상기 확률밀도함수를 기초로한 음향학적 질문을 적용하여 최적 질문을 선택하고, 최적 질문을 선택하는 과정에서 상기 학습된 트라이폰의 발생 빈도별 가중치를 부여하는 단계;
(d) 상기 선택된 최적의 질문에 따라 클러스터를 분할하여 임계값 이상이 될 때까지 분할 과정을 반복하는 단계를 포함한다.
이하, 첨부된 도 2 내지 도 3을 참조하여 본 발명의 바람직한 일실시예에 따른 학습된 모델을 이용한 상태 클러스터링 방법을 설명하고자 한다.
도 2는 본 발명의 바람직한 일실시예에 따른 하나의 클러스터 내의 관측값을 모델링한 것을 나타내는 도면이고, 도 3은 본 발명의 바람직한 일실시예에 따른 상태 클러스터링을 나타내는 순서도이다.
우선, 학습 데이터로 HMM을 학습시킨 다음 음향학적 모델(aucoustic model), 렉시컨(lexicon), 언어 모델(language model)들을 구축한다. 이러한 경우, 새로운 단어가 입력되면 상기 학습된 모델들이 수정되어 각각 새로운 음향학적 모델들과 렉시컨, 언어모델이 된다.
부연하면, 상기 음향학적 모델은 음성인식의 기본 단위인 트라이폰 모델이고, 렉시컨은 단어의 음소구성정보를 저장하는 일종의 단어사전이며, 언어모델은 연속음성인식에 필요하다.
도 2에 도시된 바와 같이, 새로운 단어가 입력되면(s301), 입력된 단어를 n개의 트라이폰으로 분해하여, 학습된 트라이폰인가를 확인하는 단계를 수행한다 (s302).
상기 단계(s302)에서, n개로 분해된 트라이폰이 학습된 트라이폰으로 존재하는 경우, 학습된 트라이폰으로 대체하여 음향학적 질문을 적용한다(s303). 반면에, n개로 분해된 트라이폰이 학습된 트라이폰 중에서 존재하지 않는 경우, 학습된 트라이폰 중에서 가장 근접된 트라이폰을 선택한 다음(s304), 음향학적 질문을 적용 하는 단계 (s303)를 수행한다.
상기와 같이, 새로운 단어가 입력되면 n개의 트라이폰으로 분해한 다음, 저장되어 있는 학습된 트라이폰 중에서 가장 근접한 학습된 트라이폰으로부터 근사치의 관측값을 추출한다.
한편, 음향학적 질문이 적용된 다음, 질문 셋(set) 내에 있는 질문들 중에서 최적의 질문을 선택하는 단계를 수행한다(s305). 이러한 경우, 상기 단계(s305)에서 음향학적 질문으로 나누어진 데이터의 우도값(likelihood)의 증가분이 가장 큰 질문을 선택한다.
따라서, 종래의 방법으로 하나의 클러스터 내에 속한 관측값의 확률밀도함수를 구하는 식은 다음과 같다.
Figure 112001014203319-pat00001
상기 확률 밀도 함수는 학습되는 F프레임들 중에서 상태 S에 속한 관측 값들을 공통 평균 μ(S)과 공통 분산 Σ(S)를 이용하여 나타낸 것이다.
상기에서,
Figure 112001014203319-pat00002
는 관측 값에 대한 사후확률을 나타낸다. 즉, 종래의 방법에서는 클러스터의 평균적인 분포만을 이용하고 있지만, 본 발명에서는 개별 관측 값과 다중 mixture를 이용한다. 따라서, 클러스터에 대한 보다 정확한 분포를 표현하며 이를 클러스터 분할에 이용할 수 있다.
한편, 상기와 같이 개별 관측값과 다중 mixture를 이용하는 경우, 하나의 클 러스터 내의 트라이폰들에 대하여 개별적인 관측 값의 확률 밀도 함수를 구하여 이들의 합으로 나타낸다.
Figure 112001014203319-pat00003
여기에서, oc는 클러스터에 속한 관측값에 대한 변수이며, mc는 모델에 대한 변수를 나타낸다. 물론, 관측값은 트라이폰으로부터 생성되는 값이므로 oc와 mc의 같은 범위 내에서 사용되는 변수이다.
한편, 상기 최적의 질문이 선택되었는지를 판별하는 단계(s305)에서 학습된트라이폰의 통계적 특성을 명확히 하기 위해 각각의 트라이폰 별로 발생빈도를 학습 과정 중에서 구하여 가중치로 사용한다(s307).
이러한 경우, 상기 수학식 2에서의 ocr(oc)는 학습과정에 트라이폰로 추정되었던 데이터의 수를 나타내는데, 이것은 이에 대한 가중치를 나타내게 된다.
이때, 관측 값의 경우 mixture의 가중치를 곱하여 평균적인 관측 값을 이용하거나 아니면 믹스춰 별로 개별적인 관측 값을 그대로 이용할 수 있는데, 먼저 평균적인 값을 이용할 경우 다음의 수학식 3과 같이 나타낼 수 있다.
Figure 112001014203319-pat00004
반면에, mixture 별로 개별적인 관측 값을 이용하는 경우에는 다음의 수학식 4와 같이 나타낸다.
Figure 112001014203319-pat00005
그런 다음, 상기 수학식 2 내지 수학식 4를 기초로하여 클러스터를 분할하는 과정을 수행한다(s306). 이러한 경우, 상기 분할된 클러스터가 임계값보다 더 큰 지를 확인하는 단계를 수행한다(s308).
상기 단계(s308)에서, 분할된 클러스터가 임계값 이상이 되는 경우, 더이상의 클러스터링이 일어나지 않는다.
반면에, 상기 단계(s308)에서, 분할된 클러스터가 임계값보다 작은 경우, 단계(s301)에서부터 재수행하여 적당히 분할된 클러스터를 추출한다.
본 발명은 도면에 도시된 일실시예를 참고로 설명되었으나, 이는 예시적인 것에 불과하며, 본 기술 분야의 통상의 지식을 가진 자라면 이로부터 다양한 변형 및 균등한 타 실시예가 가능하다는 점을 이해할 것이다. 따라서, 본 발명의 진정한 기술적 보호범위는 첨부된 특허청구범위의 기술적 사상에 의해 정해져야 할 것이다.
전술한 바와 같이, 본 발명에 따른 학습 모델을 이용한 상태 클러스터링 방법에 따르면 학습된 모델을 이용하여 상태 클러스터링을 수행함으로써 많은 데이터 에 의해 계산량을 줄일 수 있어 효과적이다.
또한, 개별적인 관측과 다중 믹스춰를 사용하여 클러스터에 속한 모델의 관측 확률 분포를 보다 세밀하게 나타냄으로써 정확한 확률을 구할 수 있는 효과가 있다.

Claims (6)

  1. (a) 입력되는 임의의 단어를 다수 개의 트라이폰으로 분류하는 단계;
    (b) 상기 분류된 트라이폰을 학습된 트라이폰으로 대체하고, 개별 관측값 및 다중 믹스춰(mixture)를 이용하여 확률밀도함수를 구하는 단계;
    (c) 상기 확률밀도함수를 기초로한 음향학적 질문을 적용하여 최적 질문을 선택하고, 최적 질문을 선택하는 과정에서 상기 학습된 트라이폰의 발생 빈도별 가중치를 부여하는 단계;
    (d) 상기 선택된 최적의 질문에 따라 클러스터를 분할하여 임계값 이상이 될때까지 분할 과정을 반복하는 단계를 포함하는 것을 특징으로 하는 학습된 모델을 이용한 상태 클러스터링 방법.
  2. 제 1 항에 있어서, 상기 단계 (a)는
    상기 분류된 트라이폰이 학습되지 않은 트라이폰으로 확인되는 경우, 학습된 트라이폰 중에서 가장 근접된 트라이폰으로 선택되는 단계를 더 포함하는 것을 특징으로 하는 학습된 모델을 이용한 상태 클러스터링 방법.
  3. 삭제
  4. 제 1 항에 있어서,
    상기 확률밀도함수는
    Figure 112007054345877-pat00006
    를 이용하여 구하며, OC는 클러스터에 속한 관측값에 대한 변수, mc는 모델에 대한 변수인 것을 특징으로 하는 학습된 모델을 이용한 상태 클러스터링 방법.
  5. 제 4 항에 있어서,
    상기 mixture의 가중치를 곱하여 평균적인 관측값을 구하는 식은
    Figure 112007054345877-pat00007
    을 이용하며, OC는 클러스터에 속한 관측값에 대한 변수, mc는 모델에 대한 변수인 것을 특징으로 하는 학습된 모델을 이용한 상태 클러스터링 방법.
  6. 제 4 항에 있어서,
    상기 믹스춰(mixture)의 개별적인 관측값을 이용하여 구하는 식은
    Figure 112007054345877-pat00008
    을 이용하며, OC는 클러스터에 속한 관측값에 대한 변수, mc는 모델에 대한 변수인 것을 특징으로 하는 학습된 모델을 이용한 상태 클러스터링 방법.
KR1020010033447A 2001-06-14 2001-06-14 학습된 모델을 이용한 상태 클러스터링 방법 KR100775186B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020010033447A KR100775186B1 (ko) 2001-06-14 2001-06-14 학습된 모델을 이용한 상태 클러스터링 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020010033447A KR100775186B1 (ko) 2001-06-14 2001-06-14 학습된 모델을 이용한 상태 클러스터링 방법

Publications (2)

Publication Number Publication Date
KR20020095503A KR20020095503A (ko) 2002-12-27
KR100775186B1 true KR100775186B1 (ko) 2007-11-12

Family

ID=27709118

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020010033447A KR100775186B1 (ko) 2001-06-14 2001-06-14 학습된 모델을 이용한 상태 클러스터링 방법

Country Status (1)

Country Link
KR (1) KR100775186B1 (ko)

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR970002853A (ko) * 1995-06-29 1997-01-28 김광호 가변정보율 모델을 이용한 음성인식방법 및 정보율 학습방법
KR970007791A (ko) * 1995-07-13 1997-02-21 김광호 관찰벡터의 디스토션 확률밀도(Distortion density)를 가진 은닉 마코프 모델(Hidden Markov Model)을 이용한 음성인식 방법
JPH101997A (ja) * 1991-08-21 1998-01-06 Toto Ltd トイレ装置
JPH101999A (ja) * 1996-06-17 1998-01-06 Kyowa Plast Sangyo Kk 便器用接続フランジおよび同フランジと便器との連結構造
JPH101998A (ja) * 1996-06-17 1998-01-06 Matsushita Electric Ind Co Ltd 衛生洗浄装置
KR980011008A (ko) * 1996-07-27 1998-04-30 구자홍 음성 인식 시스템의 음소 모델링 방법
KR19980036956A (ko) * 1996-11-20 1998-08-05 김영환 히든 마크오프 모델(hmm)을 이용한 음성인식 방법
KR19990017120A (ko) * 1997-08-21 1999-03-15 구자홍 새로운 단어에 대한 음성인식 단위 모델링 방법
KR19990017119A (ko) * 1997-08-21 1999-03-15 구자홍 임의의 단어인식을 위한 음성인식 시스템의클러스터링 방법
KR19990033536A (ko) * 1997-10-24 1999-05-15 정선종 텍스트/음성변환기에서의 최적 합성단위열 선정 방법

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH101997A (ja) * 1991-08-21 1998-01-06 Toto Ltd トイレ装置
KR970002853A (ko) * 1995-06-29 1997-01-28 김광호 가변정보율 모델을 이용한 음성인식방법 및 정보율 학습방법
KR970007791A (ko) * 1995-07-13 1997-02-21 김광호 관찰벡터의 디스토션 확률밀도(Distortion density)를 가진 은닉 마코프 모델(Hidden Markov Model)을 이용한 음성인식 방법
JPH101999A (ja) * 1996-06-17 1998-01-06 Kyowa Plast Sangyo Kk 便器用接続フランジおよび同フランジと便器との連結構造
JPH101998A (ja) * 1996-06-17 1998-01-06 Matsushita Electric Ind Co Ltd 衛生洗浄装置
KR980011008A (ko) * 1996-07-27 1998-04-30 구자홍 음성 인식 시스템의 음소 모델링 방법
KR19980036956A (ko) * 1996-11-20 1998-08-05 김영환 히든 마크오프 모델(hmm)을 이용한 음성인식 방법
KR19990017120A (ko) * 1997-08-21 1999-03-15 구자홍 새로운 단어에 대한 음성인식 단위 모델링 방법
KR19990017119A (ko) * 1997-08-21 1999-03-15 구자홍 임의의 단어인식을 위한 음성인식 시스템의클러스터링 방법
KR19990033536A (ko) * 1997-10-24 1999-05-15 정선종 텍스트/음성변환기에서의 최적 합성단위열 선정 방법

Non-Patent Citations (7)

* Cited by examiner, † Cited by third party
Title
10-1997-2853
10-1997-7791
10-1998-11008
10-1998-36956
10-1999-017120
10-1999-17119
10-1999-33536

Also Published As

Publication number Publication date
KR20020095503A (ko) 2002-12-27

Similar Documents

Publication Publication Date Title
US5812975A (en) State transition model design method and voice recognition method and apparatus using same
EP1400952B1 (en) Speech recognition adapted to environment and speaker
EP0771461B1 (en) Method and apparatus for speech recognition using optimised partial probability mixture tying
EP0847041B1 (en) Method and apparatus for speech recognition performing noise adaptation
Halberstadt et al. Heterogeneous acoustic measurements for phonetic classification 1.
US9058811B2 (en) Speech synthesis with fuzzy heteronym prediction using decision trees
JP4590692B2 (ja) 音響モデル作成装置及びその方法
EP0755046B1 (en) Speech recogniser using a hierarchically structured dictionary
US7412093B2 (en) Hybrid apparatus for recognizing answer type
KR100904049B1 (ko) 음성 인식에 대한 통계적 의미 분류 시스템 및 방법
US6224636B1 (en) Speech recognition using nonparametric speech models
CN105654940B (zh) 一种语音合成方法和装置
US5950158A (en) Methods and apparatus for decreasing the size of pattern recognition models by pruning low-scoring models from generated sets of models
US5963902A (en) Methods and apparatus for decreasing the size of generated models trained for automatic pattern recognition
Nock et al. A comparative study of methods for phonetic decision-tree state clustering.
US7680664B2 (en) Parsimonious modeling by non-uniform kernel allocation
KR100703697B1 (ko) 어휘 그룹 트리를 이용한 어휘 인식 방법 및 장치
JP3444108B2 (ja) 音声認識装置
KR100775186B1 (ko) 학습된 모델을 이용한 상태 클러스터링 방법
Imperl et al. Clustering of triphones using phoneme similarity estimation for the definition of a multilingual set of triphones
Foote Decision-tree probability modeling for HMM speech recognition
JP2965529B2 (ja) 音声認識装置
Zen et al. Decision tree-based simultaneous clustering of phonetic contexts, dimensions, and state positions for acoustic modeling.
JP3029803B2 (ja) 音声認識のための単語モデル生成装置及び音声認識装置
Deng et al. Hierarchical partition of the articulatory state space for overlapping-feature based speech recognition

Legal Events

Date Code Title Description
N231 Notification of change of applicant
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20100929

Year of fee payment: 4

LAPS Lapse due to unpaid annual fee