KR970002851A - 음성합성에 있어서의 음소길이 결정방법 및 음소길이 결정트리의 학습방법 - Google Patents
음성합성에 있어서의 음소길이 결정방법 및 음소길이 결정트리의 학습방법 Download PDFInfo
- Publication number
- KR970002851A KR970002851A KR1019950019064A KR19950019064A KR970002851A KR 970002851 A KR970002851 A KR 970002851A KR 1019950019064 A KR1019950019064 A KR 1019950019064A KR 19950019064 A KR19950019064 A KR 19950019064A KR 970002851 A KR970002851 A KR 970002851A
- Authority
- KR
- South Korea
- Prior art keywords
- phoneme
- length
- attributes
- classified
- phoneme length
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 19
- 230000015572 biosynthetic process Effects 0.000 title claims abstract 6
- 238000003786 synthesis reaction Methods 0.000 title claims abstract 6
- 238000003066 decision tree Methods 0.000 title abstract description 4
- 238000001308 synthesis method Methods 0.000 abstract description 2
- 238000010586 diagram Methods 0.000 description 2
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/02—Feature extraction for speech recognition; Selection of recognition unit
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/06—Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
- G10L15/063—Training
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/02—Feature extraction for speech recognition; Selection of recognition unit
- G10L2015/025—Phonemes, fenemes or fenones being the recognition units
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/06—Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
- G10L15/063—Training
- G10L2015/0635—Training updating or merging of old and new templates; Mean values; Weighting
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Machine Translation (AREA)
Abstract
음소의 구문론적 속성을 이용하여 음소길이를 음소길이를 결정하는 방법 및 음소길이 결정트리의 학습방법이 개시된다.
본 발명에 따른 음성합성방법은 구문론적인 속성들에 의해 음성합성의 단위가 되는 음소의 길이를 결정하는 방법이 있어서,(a) 학습대상이 되는 음소들 각각에 부여된 구문론적인 속성들을 분석하는 과정; (b) 상기 속성들에 의해 음소들을 분류하고 고유의 음소길이를 학습시키는 과정; 및 (c) 상기 (b) 과정에서 결정된 음소길이를 참조하여 음성합성의 대상이 되는 음소의 길이를 결정하는 과정을 포함함을 특징으로 한다.
본 발명에 따른 음소길이 결정방법은 음소길이의 예측에 다양한 구문론적인 속성간의 영향을 고려하여 통계적으로 음절의 길이를 결정함으로써 자연스러운 합성음을 발생시킬 수 있는 음절길이 결정방법을 제공하는 효과를 갖는다.
Description
본 내용은 요부공개 건이므로 전문내용을 수록하지 않았음
제2도는 본 발명에 따른 음성합성방법의 개념을 보이기 위한 모식도이다. 제3도는 음소길이 결정트리 생성과정을 보이는 흐름도이다. 제4도는 제3도에 도시된 방법에 의해 생성된 음소길이 결정트리의 일예를 보이는 도면이다.
Claims (5)
- 구문론적인 속성들에 의해 음성합성의 단위가 되는 음소의 길이를 결정하는 방법에 있어서, (a) 학습대상이 되는 음소들 각각에 부여된 구문론적인 속성들을 분석하는 과정; (b) 상기 속성들에 의해 음소들을 분류하는 고유의 음소길이를 학습시키는 과정; 및 (c) 상기 (d)과정에서 결정된 음소길이를 참조하여 음성합성의 대상이 되는 음소의 길이를 결정하는 과정을 포함하는 음소길이 결정 방법.
- 제1항에 있어서, 상기 (d)과정은 (d) 상기 음소들을 임의의 속성에 의해 분류하고, 분류된 집단의 평균오차를 구하는 과정; (e) 상기 (d)과정을 모든 속성들에 반복적용하여 분류된 집단의 평균오차가 가장 작은 값을 보이는 속성을 결정하는 과정; (f) 상기 (e)과정에서 결정된 속성에 의해 분류된 집합들을 상기 결정된 속성을 제외시킨 나머지의 속성들에 의해 재차 분류하고, 분류된 집단의 평균오차를 구하는 과정; (g) 상기 (e)과정과 (f)과정을 더 이상 적용시킬 속성이 남아있지 않거나 혹은 분류된 집단의 평균오차가 소정의 값보다 작을 때까지 적용하여 반복적으로 적용시켜 트리구조의 음소길이 결정테이블을 구하는 과정; 및 (h) 상기 (g)과정에 의해 분류된 음소길이 결정테이블의 종단노드에 각 집단들의 평균음소길이를 할당시키는 과정을 포함하는 음소길이 결정방법.
- 제2항에 있어서, 상기 평균오차는 하기의 식으로 결정됨을 특징으로 하는 음소길이 결정방법.
- 복수개의 문장을 구성하는 음소들의 구문론적 특성에 따라 분류하여 음성합성의 단위가 되는 음소의 길이를 결정하는 데 사용되는 음소길이 결정트리를 학습하는 방법에 있어서, (o) 상기 음소들을 임의의 속성에 의해 분류하고, 분류된 집단의 평균오차를 구하는 과정; (p) 상기 (o)과정을 모든 속성들에 반복적용하여 분류된 집단의 평균오차가 가장 작은 값을 보이는 속성을 결정하는 과정; (q) 상기(p)과정에서 결정된 속성에 의해 분류된 집합들을 상기 결정된 속성을 제외시킨 나머지의 속성들에 의해 재차 분류하고, 분류된 집단의 평균오차를 구하는 과정; (r) 상기 (p)과정과 (q)과정을 더 이상 적용시킬 속성이 남아있지 않거나 혹은 분류된 집단의 평균오차가 소정의 값보다 작을 때까지 적용하여 반복적으로 적용시켜 트리구조의 음소길이 결정테이블을 구하는 과정; 및 (s) 상기 (r)과정에 의해 분류된 음소길이 결정테이블의 종단노드에 각 집단들의 평균음소길이를 할당시키는 과정을 포함하는 음소길이 결정트리의 학습방법.
- 제4항에 있어서, 상기 평균오차는 하기의 식으로 결정됨을 특징으로 하는 음소길이 결정트리의 학습방법.여기서, Si는 학습대상이 된 음소들이고, mk는 집단에 소속된 음소의 길이 LEN(Si)를 평균한 값이다.※ 참고사항 : 최초출원 내용에 의하여 공개하는 것임.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1019950019064A KR100355393B1 (ko) | 1995-06-30 | 1995-06-30 | 음성합성에있어서의음소길이결정방법및음소길이결정트리의학습방법 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1019950019064A KR100355393B1 (ko) | 1995-06-30 | 1995-06-30 | 음성합성에있어서의음소길이결정방법및음소길이결정트리의학습방법 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR970002851A true KR970002851A (ko) | 1997-01-28 |
KR100355393B1 KR100355393B1 (ko) | 2002-12-26 |
Family
ID=37489454
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1019950019064A KR100355393B1 (ko) | 1995-06-30 | 1995-06-30 | 음성합성에있어서의음소길이결정방법및음소길이결정트리의학습방법 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR100355393B1 (ko) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100509797B1 (ko) * | 1998-04-29 | 2005-08-23 | 마쯔시다덴기산교 가부시키가이샤 | 결정 트리에 의한 스펠형 문자의 복합 발음 발생과 스코어를위한 장치 및 방법 |
-
1995
- 1995-06-30 KR KR1019950019064A patent/KR100355393B1/ko not_active IP Right Cessation
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100509797B1 (ko) * | 1998-04-29 | 2005-08-23 | 마쯔시다덴기산교 가부시키가이샤 | 결정 트리에 의한 스펠형 문자의 복합 발음 발생과 스코어를위한 장치 및 방법 |
Also Published As
Publication number | Publication date |
---|---|
KR100355393B1 (ko) | 2002-12-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7127396B2 (en) | Method and apparatus for speech synthesis without prosody modification | |
US7024362B2 (en) | Objective measure for estimating mean opinion score of synthesized speech | |
US7263488B2 (en) | Method and apparatus for identifying prosodic word boundaries | |
US7386451B2 (en) | Optimization of an objective measure for estimating mean opinion score of synthesized speech | |
US8566099B2 (en) | Tabulating triphone sequences by 5-phoneme contexts for speech synthesis | |
Torkkola | An efficient way to learn English grapheme-to-phoneme rules automatically | |
US8099281B2 (en) | System and method for word-sense disambiguation by recursive partitioning | |
JP2007249212A (ja) | テキスト音声合成のための方法、コンピュータプログラム及びプロセッサ | |
KR950704772A (ko) | 시스템 트레이닝 방법, 트레이닝된 장치 및 그 사용 방법(A method for training a system, the resulting apparatus, and method of use thereof) | |
KR20070077042A (ko) | 음성처리장치 및 방법 | |
Navarro et al. | Automatic generation of chord progressions with an artificial immune system | |
EP0239394A1 (en) | Speech synthesis system | |
US20020087317A1 (en) | Computer-implemented dynamic pronunciation method and system | |
CN106843523A (zh) | 基于人工智能的文字输入方法和装置 | |
US20040172249A1 (en) | Speech synthesis | |
KR970002851A (ko) | 음성합성에 있어서의 음소길이 결정방법 및 음소길이 결정트리의 학습방법 | |
KR0146549B1 (ko) | 한국어 텍스트/음성 변환 방법 | |
JP6840124B2 (ja) | 言語処理装置、言語処理プログラムおよび言語処理方法 | |
Hinterleitner et al. | Text-to-speech synthesis | |
KR100275777B1 (ko) | 음소별 코드북 매핑에 의한 음색변환방법 | |
Ueberla | An extended clustering algorithm for statistical language models | |
Hoffmann et al. | Employing Sentence Structure: Syntax Trees as Prosody Generators. | |
KR0173340B1 (ko) | 텍스트/음성변환기에서 억양패턴 정규화와 신경망 학습을 이용한 억양 생성 방법 | |
JP2001075585A5 (ko) | ||
EP1777697B1 (en) | Method for speech synthesis without prosody modification |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20100830 Year of fee payment: 9 |
|
LAPS | Lapse due to unpaid annual fee |