KR970050115A - 한국어 변이음 집단화 수형도를 이용한 변이음 단위의 음성인식 방법 - Google Patents

한국어 변이음 집단화 수형도를 이용한 변이음 단위의 음성인식 방법 Download PDF

Info

Publication number
KR970050115A
KR970050115A KR1019950055840A KR19950055840A KR970050115A KR 970050115 A KR970050115 A KR 970050115A KR 1019950055840 A KR1019950055840 A KR 1019950055840A KR 19950055840 A KR19950055840 A KR 19950055840A KR 970050115 A KR970050115 A KR 970050115A
Authority
KR
South Korea
Prior art keywords
phoneme
vowel
classifying
group
consonant
Prior art date
Application number
KR1019950055840A
Other languages
English (en)
Other versions
KR0173204B1 (ko
Inventor
서영주
성철재
이정철
한민수
Original Assignee
양승택
한국전자통신연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 양승택, 한국전자통신연구원 filed Critical 양승택
Priority to KR1019950055840A priority Critical patent/KR0173204B1/ko
Publication of KR970050115A publication Critical patent/KR970050115A/ko
Application granted granted Critical
Publication of KR0173204B1 publication Critical patent/KR0173204B1/ko

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • G10L15/183Speech classification or search using natural language modelling using context dependencies, e.g. language models
    • G10L15/187Phonemic context, e.g. pronunciation rules, phonotactical constraints or phoneme n-grams
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/02Feature extraction for speech recognition; Selection of recognition unit
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/02Feature extraction for speech recognition; Selection of recognition unit
    • G10L2015/025Phonemes, fenemes or fenones being the recognition units

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

본 발명은 한국어 변이음 집단화 수형도를 이용한 변이음 단위의 음성인식 방법에 관한 것으로, 삼음소열 또는 이에 해당하는 코드열을 입력받아 중음소가 자음, 모음, 묵음중 어느 것인가 판단하는 제1단계; 상기 중음소가 자음이면 좌음소와 우음소 모음군 부류화 또는 좌음소 모음군 부류화를 수행하는 제2단계; 상기 중음소가 모음이면 좌음소가 우음소에 따라 우음소 초성, 종성 좌음군 부류화, 우음소 SIL(silence)노드화, 좌음소 초성 자음군 부류화를 수행하는 제3단계; 및 상기 중음소가 묵음이면 SIL 노드화하는 제4단계를 포함하는 것을 특징으로 하여 음소단위나 트라이폰 단위를 기반으로 하는 음성인식, 음성합성에 보다 유용한 모델링 및 분석 단위로 사용할 수 있는 효과가 있다.

Description

한국어 변이음 집단화 수형도를 이용한 변이음 단위의 음성인식 방법
본 내용은 요부공개 건이므로 전문내용을 수록하지 않았음
제1도는 본 발명이 적용되는 음성인식 시스템의 하드웨어 구성도.
제3도는 본 발명에 따른 변이음 단위의 음성인식 처리 흐름도.

Claims (7)

  1. 전처리부, 음성인식부, 단어사전부, 텍스트-변이음 변환 및 검색부, 인식결과처리부로 구성되는 음성인식 시스템에 적용되는 변이음 단위의 음성인식 방법에 있어서, 삼음소열 또는 이에 해당하는 코드열을 입력받아 중음소가 자음, 모음, 묵음중 어느 것인가 판단하는 제1단계; 상기 중음소가 자음이면 좌음소와 우음소에 따라 우음소 모음군 부류화 또는 좌음소 모음군 부류화를 수행하는 제2단계; 상기 중음소가 모음이면 좌음소와 우음소에 따라 우음소 초성, 종성 자음군 부류화, 우음소 SIL(silence)노드화, 좌음소 초성 자음군 부류화를수행하는 제3단계; 및 상기 중음소가 묵음이면 SIL 노드화하는 제4단계를 포함하는 것을 특징으로 하는 한국어 변이음 집단화 수형도를 이용한 변이음 단위의 음성인식 방법.
  2. 제1항에 있어서, 상기 제2단계는, 상기 중음소가 자음이면 좌음소가 모음인가 판단하는 제5단계; 상기 좌음소가 모음이 아니면 좌음소 유성/무성자음을 구분하고 우음소의 모음여부에 따라 오류 검정(ELSE) 노드화 하거나 우음소 모음군을 부류화하는 제6단계; 상기 좌음소가 모음이면 우음소의 모음여부에 따라 우음소 모음군을 부류화하거나 우음소 유성/무성자음을 구분하는 제7단계; 및 상기 제7단계 수행 후, 좌음소가 단모음이면 좌음소 모음군을 부류화하고, 좌음소가 단모음이 아니면 좌음소를 이중모음-단모음 변환하고 좌음소 모음군을 부류화하여 중음소 음소를 식별하는 제8단계를 포함하는 것을 특징으로 하는 한국어 변이음 집단화 수형도를 이용한 변이음 단위의 음성인식 방법.
  3. 제2항에 있어서, 상기 제6단계는, 상기 좌음소가 모음이 아니면 좌음소 유성/무성자음을 구분하고 우음소의 모음여부를 판단하는 제9단계; 상기 우음소가 모음이 아니면 오류 검정(ELSE) 노드화 하고 모음이면 우음소가 단모음인가 판단하는 제10단계; 및 상기 우음소가 단모음이면 우음소 모음군을 부류화하고, 단모음이 아니면 우음소를 이중모음-단모음 변환하고 우음소 모음군을 부류화하여 중음소 음소를 식별하는 제11단계를 포함하는 것을 특징으로 하는 한국어 변이음 집단화 수형도를 이용한 변이음 단위의 음성인식 방법.
  4. 제2항에 있어서, 상기 제7단계는, 상기 좌음소가 모음이면 우음소가 모음인가 단모음인가 판단하는 제9단계; 및 상기 우음소가 모음이 아니면 우음소 유성/무성자음을 구분하고 단모음이면 우음소 모음군을 부류화하고 단모음이 아니면 우음소를 이중모음-단모음 변화하고 우음소 모음군을 부류화하는 제10단계를 포함하는 것을 특징으로 하는 한국어 변이음 집단화 수형도를 이용한 변이음 단위의 음성인식 방법.
  5. 제1항에 있어서, 상기 제3단계는, 상기 중음소가 모음이면 좌음소가 모음인가 판단하는 제5단계; 상기 좌음소가 모음이면 우음소에 따라 우음소 초, 종성 자음군을 부류화하거나 모음-모음-모음(V-V-V) 노드화 또는 모음-모음-묵음(V-V-SIL) 노드화하는 제6단계; 상기 좌음소가 모음이 아니면 우음소가 모음인가 판단하는 제7단계; 상기 우음소가 모음이면 좌음소의 초성여부를 판단하여 초성이면 좌음소 초성 자음군을 부류화하고 초성이 아니면 묵음-모음-모음(SIL-V-V)노드화하여 중음소 음소를 식별하는 제8단계; 및 상기 우음소가 모음이 아니면 좌음소화 우음소에 따라 좌음소 초성 자음군을 부류화하거나 우음소 초, 종성 자음군을 부류화하거나 우음소 묵음 노드화하는 제9단계를 포함하는 것을 특징으로 하는 한국어 변이음 집단화 수형도를 이용한 변이음 단위의 음성인식 방법.
  6. 제5항에 있어서, 상기 제6단계는, 상기 좌음소가 모음이면 우음소가 모음인가 판단하는 제10단계; 상기 우음소가 모음이면 모음-모음-모음(V-V-V) 노드화하여 중음소 음소를 식별하는 제11단계; 상기 우음소가 모음이 아니면 우음소가 초/종성, 묵음인가 판단하는 제12단계; 상기 우음소가 초성이면 우음소 초성 자음군을 부류화하여 중음소 음소를 식별하는 제13단계; 상기 우음소가 종성이면 우음소 종성 자음군을 부류화하여 중음소 음소를 식별하는 제14단계; 및 상기 우음소가 묵음이면 모음-모음-묵은(V-V-SIL) 노드화하하여 중음소 음소를 식별하는 제15단계를 포함하는 것을 특징으로 하는 한국어 변이음 집단화 수형도를 이용한 변이음 단위의 음성인식 방법.
  7. 제5항에 있어서, 상기 제9단계는, 상기 우음소가 모음이 아니면 좌음소가 초성인가 판단하는 제10단계; 상기 좌음소가 초성이면 좌음소 초성 자음군을 부류화하고, 초성이 아니면 좌음소를 묵음화하는 제11단계; 상기 제11단계 수행 후, 우음소가 초/종성, 묵음인가 판단하는 제12단계; 상기 우음소가 초성이면 우음소 초성 자음군을 부류화하여 중음소 음소를 식별하는 제13단계; 상기 우음소가 종성이면 우음소 종성 자음군을 부류화하여 중음소 음소를 식별하는 제14단계; 및 상기 우음소가 묵음이면 우음소 묵은 노드화하여 중음소 음소를 식별하는 제15단계를 포함하는 것을 특징으로 하는 한국어 변이음 집단화 수형도를 이용한 변이음 단위의 음성 인식 방법.
    ※ 참고사항 : 최초출원 내용에 의하여 공개하는 것임.
KR1019950055840A 1995-12-23 1995-12-23 한국어 변이음 집단화 수형도를 이용한 변이음 단위의 음성인식 방법 KR0173204B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1019950055840A KR0173204B1 (ko) 1995-12-23 1995-12-23 한국어 변이음 집단화 수형도를 이용한 변이음 단위의 음성인식 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1019950055840A KR0173204B1 (ko) 1995-12-23 1995-12-23 한국어 변이음 집단화 수형도를 이용한 변이음 단위의 음성인식 방법

Publications (2)

Publication Number Publication Date
KR970050115A true KR970050115A (ko) 1997-07-29
KR0173204B1 KR0173204B1 (ko) 1999-03-30

Family

ID=19444004

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019950055840A KR0173204B1 (ko) 1995-12-23 1995-12-23 한국어 변이음 집단화 수형도를 이용한 변이음 단위의 음성인식 방법

Country Status (1)

Country Link
KR (1) KR0173204B1 (ko)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100443247B1 (ko) * 2001-12-26 2004-08-04 주식회사 케이티 공명음과 /ㅎ/음 인접부에서의 발음 모델링 시스템 및 그방법
KR100736496B1 (ko) * 2001-06-26 2007-07-06 엘지전자 주식회사 연속 음성인식기의 성능 개선 방법

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100704509B1 (ko) * 2004-12-14 2007-04-09 한국전자통신연구원 Db 구축 방법과 이를 이용한 음성 합성 방법

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100736496B1 (ko) * 2001-06-26 2007-07-06 엘지전자 주식회사 연속 음성인식기의 성능 개선 방법
KR100443247B1 (ko) * 2001-12-26 2004-08-04 주식회사 케이티 공명음과 /ㅎ/음 인접부에서의 발음 모델링 시스템 및 그방법

Also Published As

Publication number Publication date
KR0173204B1 (ko) 1999-03-30

Similar Documents

Publication Publication Date Title
Vergin et al. Generalized mel frequency cepstral coefficients for large-vocabulary speaker-independent continuous-speech recognition
JP5208352B2 (ja) 声調言語用分節声調モデリング
JPH09500223A (ja) 多言語音声認識システム
China Bhanja et al. A pre-classification-based language identification for Northeast Indian languages using prosody and spectral features
Heldner Spectral emphasis as an additional source of information in accent detection
Streefkerk et al. Acoustical features as predictors for prominence in read aloud dutch sentences used in ANN's.
KR970050115A (ko) 한국어 변이음 집단화 수형도를 이용한 변이음 단위의 음성인식 방법
Abdullaeva et al. Uzbek Speech synthesis using deep learning algorithms
Hillenbrand The acoustics and perception of North American English vowels
Liang et al. An hmm-based bilingual (mandarin-english) tts
Tunalı A speaker dependent, large vocabulary, isolated word speech recognition system for turkish
Iyanda et al. Development of a Yorúbà Textto-Speech System Using Festival
Maghbouleh A logistic regression model for detecting prominences
Hasan et al. Bangla triphone hmm based word recognition
Rapp Automatic labelling of German prosody.
Deketelaere et al. Speech Processing for Communications: what's new?
Wang et al. A novel method for automatic tonal and non-tonal language classification
Mahmud Performance Analysis of Different Acoustic Features Based on LSTM for Bangla Speech Recognition
Huckvale 14 An Introduction to Phonetic Technology
JP3110025B2 (ja) 発声変形検出装置
Bhattachajee et al. An experimental analysis of speech features for tone speech recognition
Thubthong et al. Stress and tone recognition of polysyllabic words in Thai speech
Jitapunkul et al. Recent advances of Thai speech recognition in Thailand
Narupiyakul et al. A stochastic knowledge-based Thai text-to-speech system
Pisarn et al. Improving Thai spelling recognition with tone features

Legal Events

Date Code Title Description
A201 Request for examination
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20070919

Year of fee payment: 10

LAPS Lapse due to unpaid annual fee