KR970050115A - 한국어 변이음 집단화 수형도를 이용한 변이음 단위의 음성인식 방법 - Google Patents
한국어 변이음 집단화 수형도를 이용한 변이음 단위의 음성인식 방법 Download PDFInfo
- Publication number
- KR970050115A KR970050115A KR1019950055840A KR19950055840A KR970050115A KR 970050115 A KR970050115 A KR 970050115A KR 1019950055840 A KR1019950055840 A KR 1019950055840A KR 19950055840 A KR19950055840 A KR 19950055840A KR 970050115 A KR970050115 A KR 970050115A
- Authority
- KR
- South Korea
- Prior art keywords
- phoneme
- vowel
- classifying
- group
- consonant
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract 13
- 238000006243 chemical reaction Methods 0.000 claims 2
- 230000015572 biosynthetic process Effects 0.000 abstract 1
- 238000003786 synthesis reaction Methods 0.000 abstract 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/183—Speech classification or search using natural language modelling using context dependencies, e.g. language models
- G10L15/187—Phonemic context, e.g. pronunciation rules, phonotactical constraints or phoneme n-grams
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/02—Feature extraction for speech recognition; Selection of recognition unit
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/02—Feature extraction for speech recognition; Selection of recognition unit
- G10L2015/025—Phonemes, fenemes or fenones being the recognition units
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
Abstract
본 발명은 한국어 변이음 집단화 수형도를 이용한 변이음 단위의 음성인식 방법에 관한 것으로, 삼음소열 또는 이에 해당하는 코드열을 입력받아 중음소가 자음, 모음, 묵음중 어느 것인가 판단하는 제1단계; 상기 중음소가 자음이면 좌음소와 우음소 모음군 부류화 또는 좌음소 모음군 부류화를 수행하는 제2단계; 상기 중음소가 모음이면 좌음소가 우음소에 따라 우음소 초성, 종성 좌음군 부류화, 우음소 SIL(silence)노드화, 좌음소 초성 자음군 부류화를 수행하는 제3단계; 및 상기 중음소가 묵음이면 SIL 노드화하는 제4단계를 포함하는 것을 특징으로 하여 음소단위나 트라이폰 단위를 기반으로 하는 음성인식, 음성합성에 보다 유용한 모델링 및 분석 단위로 사용할 수 있는 효과가 있다.
Description
본 내용은 요부공개 건이므로 전문내용을 수록하지 않았음
제1도는 본 발명이 적용되는 음성인식 시스템의 하드웨어 구성도.
제3도는 본 발명에 따른 변이음 단위의 음성인식 처리 흐름도.
Claims (7)
- 전처리부, 음성인식부, 단어사전부, 텍스트-변이음 변환 및 검색부, 인식결과처리부로 구성되는 음성인식 시스템에 적용되는 변이음 단위의 음성인식 방법에 있어서, 삼음소열 또는 이에 해당하는 코드열을 입력받아 중음소가 자음, 모음, 묵음중 어느 것인가 판단하는 제1단계; 상기 중음소가 자음이면 좌음소와 우음소에 따라 우음소 모음군 부류화 또는 좌음소 모음군 부류화를 수행하는 제2단계; 상기 중음소가 모음이면 좌음소와 우음소에 따라 우음소 초성, 종성 자음군 부류화, 우음소 SIL(silence)노드화, 좌음소 초성 자음군 부류화를수행하는 제3단계; 및 상기 중음소가 묵음이면 SIL 노드화하는 제4단계를 포함하는 것을 특징으로 하는 한국어 변이음 집단화 수형도를 이용한 변이음 단위의 음성인식 방법.
- 제1항에 있어서, 상기 제2단계는, 상기 중음소가 자음이면 좌음소가 모음인가 판단하는 제5단계; 상기 좌음소가 모음이 아니면 좌음소 유성/무성자음을 구분하고 우음소의 모음여부에 따라 오류 검정(ELSE) 노드화 하거나 우음소 모음군을 부류화하는 제6단계; 상기 좌음소가 모음이면 우음소의 모음여부에 따라 우음소 모음군을 부류화하거나 우음소 유성/무성자음을 구분하는 제7단계; 및 상기 제7단계 수행 후, 좌음소가 단모음이면 좌음소 모음군을 부류화하고, 좌음소가 단모음이 아니면 좌음소를 이중모음-단모음 변환하고 좌음소 모음군을 부류화하여 중음소 음소를 식별하는 제8단계를 포함하는 것을 특징으로 하는 한국어 변이음 집단화 수형도를 이용한 변이음 단위의 음성인식 방법.
- 제2항에 있어서, 상기 제6단계는, 상기 좌음소가 모음이 아니면 좌음소 유성/무성자음을 구분하고 우음소의 모음여부를 판단하는 제9단계; 상기 우음소가 모음이 아니면 오류 검정(ELSE) 노드화 하고 모음이면 우음소가 단모음인가 판단하는 제10단계; 및 상기 우음소가 단모음이면 우음소 모음군을 부류화하고, 단모음이 아니면 우음소를 이중모음-단모음 변환하고 우음소 모음군을 부류화하여 중음소 음소를 식별하는 제11단계를 포함하는 것을 특징으로 하는 한국어 변이음 집단화 수형도를 이용한 변이음 단위의 음성인식 방법.
- 제2항에 있어서, 상기 제7단계는, 상기 좌음소가 모음이면 우음소가 모음인가 단모음인가 판단하는 제9단계; 및 상기 우음소가 모음이 아니면 우음소 유성/무성자음을 구분하고 단모음이면 우음소 모음군을 부류화하고 단모음이 아니면 우음소를 이중모음-단모음 변화하고 우음소 모음군을 부류화하는 제10단계를 포함하는 것을 특징으로 하는 한국어 변이음 집단화 수형도를 이용한 변이음 단위의 음성인식 방법.
- 제1항에 있어서, 상기 제3단계는, 상기 중음소가 모음이면 좌음소가 모음인가 판단하는 제5단계; 상기 좌음소가 모음이면 우음소에 따라 우음소 초, 종성 자음군을 부류화하거나 모음-모음-모음(V-V-V) 노드화 또는 모음-모음-묵음(V-V-SIL) 노드화하는 제6단계; 상기 좌음소가 모음이 아니면 우음소가 모음인가 판단하는 제7단계; 상기 우음소가 모음이면 좌음소의 초성여부를 판단하여 초성이면 좌음소 초성 자음군을 부류화하고 초성이 아니면 묵음-모음-모음(SIL-V-V)노드화하여 중음소 음소를 식별하는 제8단계; 및 상기 우음소가 모음이 아니면 좌음소화 우음소에 따라 좌음소 초성 자음군을 부류화하거나 우음소 초, 종성 자음군을 부류화하거나 우음소 묵음 노드화하는 제9단계를 포함하는 것을 특징으로 하는 한국어 변이음 집단화 수형도를 이용한 변이음 단위의 음성인식 방법.
- 제5항에 있어서, 상기 제6단계는, 상기 좌음소가 모음이면 우음소가 모음인가 판단하는 제10단계; 상기 우음소가 모음이면 모음-모음-모음(V-V-V) 노드화하여 중음소 음소를 식별하는 제11단계; 상기 우음소가 모음이 아니면 우음소가 초/종성, 묵음인가 판단하는 제12단계; 상기 우음소가 초성이면 우음소 초성 자음군을 부류화하여 중음소 음소를 식별하는 제13단계; 상기 우음소가 종성이면 우음소 종성 자음군을 부류화하여 중음소 음소를 식별하는 제14단계; 및 상기 우음소가 묵음이면 모음-모음-묵은(V-V-SIL) 노드화하하여 중음소 음소를 식별하는 제15단계를 포함하는 것을 특징으로 하는 한국어 변이음 집단화 수형도를 이용한 변이음 단위의 음성인식 방법.
- 제5항에 있어서, 상기 제9단계는, 상기 우음소가 모음이 아니면 좌음소가 초성인가 판단하는 제10단계; 상기 좌음소가 초성이면 좌음소 초성 자음군을 부류화하고, 초성이 아니면 좌음소를 묵음화하는 제11단계; 상기 제11단계 수행 후, 우음소가 초/종성, 묵음인가 판단하는 제12단계; 상기 우음소가 초성이면 우음소 초성 자음군을 부류화하여 중음소 음소를 식별하는 제13단계; 상기 우음소가 종성이면 우음소 종성 자음군을 부류화하여 중음소 음소를 식별하는 제14단계; 및 상기 우음소가 묵음이면 우음소 묵은 노드화하여 중음소 음소를 식별하는 제15단계를 포함하는 것을 특징으로 하는 한국어 변이음 집단화 수형도를 이용한 변이음 단위의 음성 인식 방법.※ 참고사항 : 최초출원 내용에 의하여 공개하는 것임.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1019950055840A KR0173204B1 (ko) | 1995-12-23 | 1995-12-23 | 한국어 변이음 집단화 수형도를 이용한 변이음 단위의 음성인식 방법 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1019950055840A KR0173204B1 (ko) | 1995-12-23 | 1995-12-23 | 한국어 변이음 집단화 수형도를 이용한 변이음 단위의 음성인식 방법 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR970050115A true KR970050115A (ko) | 1997-07-29 |
KR0173204B1 KR0173204B1 (ko) | 1999-03-30 |
Family
ID=19444004
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1019950055840A KR0173204B1 (ko) | 1995-12-23 | 1995-12-23 | 한국어 변이음 집단화 수형도를 이용한 변이음 단위의 음성인식 방법 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR0173204B1 (ko) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100443247B1 (ko) * | 2001-12-26 | 2004-08-04 | 주식회사 케이티 | 공명음과 /ㅎ/음 인접부에서의 발음 모델링 시스템 및 그방법 |
KR100736496B1 (ko) * | 2001-06-26 | 2007-07-06 | 엘지전자 주식회사 | 연속 음성인식기의 성능 개선 방법 |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100704509B1 (ko) * | 2004-12-14 | 2007-04-09 | 한국전자통신연구원 | Db 구축 방법과 이를 이용한 음성 합성 방법 |
-
1995
- 1995-12-23 KR KR1019950055840A patent/KR0173204B1/ko not_active IP Right Cessation
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100736496B1 (ko) * | 2001-06-26 | 2007-07-06 | 엘지전자 주식회사 | 연속 음성인식기의 성능 개선 방법 |
KR100443247B1 (ko) * | 2001-12-26 | 2004-08-04 | 주식회사 케이티 | 공명음과 /ㅎ/음 인접부에서의 발음 모델링 시스템 및 그방법 |
Also Published As
Publication number | Publication date |
---|---|
KR0173204B1 (ko) | 1999-03-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Vergin et al. | Generalized mel frequency cepstral coefficients for large-vocabulary speaker-independent continuous-speech recognition | |
JP5208352B2 (ja) | 声調言語用分節声調モデリング | |
JPH09500223A (ja) | 多言語音声認識システム | |
China Bhanja et al. | A pre-classification-based language identification for Northeast Indian languages using prosody and spectral features | |
Heldner | Spectral emphasis as an additional source of information in accent detection | |
Streefkerk et al. | Acoustical features as predictors for prominence in read aloud dutch sentences used in ANN's. | |
KR970050115A (ko) | 한국어 변이음 집단화 수형도를 이용한 변이음 단위의 음성인식 방법 | |
Abdullaeva et al. | Uzbek Speech synthesis using deep learning algorithms | |
Hillenbrand | The acoustics and perception of North American English vowels | |
Liang et al. | An hmm-based bilingual (mandarin-english) tts | |
Tunalı | A speaker dependent, large vocabulary, isolated word speech recognition system for turkish | |
Iyanda et al. | Development of a Yorúbà Textto-Speech System Using Festival | |
Maghbouleh | A logistic regression model for detecting prominences | |
Hasan et al. | Bangla triphone hmm based word recognition | |
Rapp | Automatic labelling of German prosody. | |
Deketelaere et al. | Speech Processing for Communications: what's new? | |
Wang et al. | A novel method for automatic tonal and non-tonal language classification | |
Mahmud | Performance Analysis of Different Acoustic Features Based on LSTM for Bangla Speech Recognition | |
Huckvale | 14 An Introduction to Phonetic Technology | |
JP3110025B2 (ja) | 発声変形検出装置 | |
Bhattachajee et al. | An experimental analysis of speech features for tone speech recognition | |
Thubthong et al. | Stress and tone recognition of polysyllabic words in Thai speech | |
Jitapunkul et al. | Recent advances of Thai speech recognition in Thailand | |
Narupiyakul et al. | A stochastic knowledge-based Thai text-to-speech system | |
Pisarn et al. | Improving Thai spelling recognition with tone features |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20070919 Year of fee payment: 10 |
|
LAPS | Lapse due to unpaid annual fee |