KR970002851A - 음성합성에 있어서의 음소길이 결정방법 및 음소길이 결정트리의 학습방법 - Google Patents

음성합성에 있어서의 음소길이 결정방법 및 음소길이 결정트리의 학습방법 Download PDF

Info

Publication number
KR970002851A
KR970002851A KR1019950019064A KR19950019064A KR970002851A KR 970002851 A KR970002851 A KR 970002851A KR 1019950019064 A KR1019950019064 A KR 1019950019064A KR 19950019064 A KR19950019064 A KR 19950019064A KR 970002851 A KR970002851 A KR 970002851A
Authority
KR
South Korea
Prior art keywords
phoneme
length
attributes
classified
phoneme length
Prior art date
Application number
KR1019950019064A
Other languages
English (en)
Other versions
KR100355393B1 (ko
Inventor
곽동후
기석철
Original Assignee
김광호
삼성전자 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 김광호, 삼성전자 주식회사 filed Critical 김광호
Priority to KR1019950019064A priority Critical patent/KR100355393B1/ko
Publication of KR970002851A publication Critical patent/KR970002851A/ko
Application granted granted Critical
Publication of KR100355393B1 publication Critical patent/KR100355393B1/ko

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/02Feature extraction for speech recognition; Selection of recognition unit
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
    • G10L15/063Training
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/02Feature extraction for speech recognition; Selection of recognition unit
    • G10L2015/025Phonemes, fenemes or fenones being the recognition units
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
    • G10L15/063Training
    • G10L2015/0635Training updating or merging of old and new templates; Mean values; Weighting

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Machine Translation (AREA)

Abstract

음소의 구문론적 속성을 이용하여 음소길이를 음소길이를 결정하는 방법 및 음소길이 결정트리의 학습방법이 개시된다.
본 발명에 따른 음성합성방법은 구문론적인 속성들에 의해 음성합성의 단위가 되는 음소의 길이를 결정하는 방법이 있어서,(a) 학습대상이 되는 음소들 각각에 부여된 구문론적인 속성들을 분석하는 과정; (b) 상기 속성들에 의해 음소들을 분류하고 고유의 음소길이를 학습시키는 과정; 및 (c) 상기 (b) 과정에서 결정된 음소길이를 참조하여 음성합성의 대상이 되는 음소의 길이를 결정하는 과정을 포함함을 특징으로 한다.
본 발명에 따른 음소길이 결정방법은 음소길이의 예측에 다양한 구문론적인 속성간의 영향을 고려하여 통계적으로 음절의 길이를 결정함으로써 자연스러운 합성음을 발생시킬 수 있는 음절길이 결정방법을 제공하는 효과를 갖는다.

Description

음성합성에 있어서의 음소길이 결정방법 및 음소길이 결정트리의 학습방법
본 내용은 요부공개 건이므로 전문내용을 수록하지 않았음
제2도는 본 발명에 따른 음성합성방법의 개념을 보이기 위한 모식도이다. 제3도는 음소길이 결정트리 생성과정을 보이는 흐름도이다. 제4도는 제3도에 도시된 방법에 의해 생성된 음소길이 결정트리의 일예를 보이는 도면이다.

Claims (5)

  1. 구문론적인 속성들에 의해 음성합성의 단위가 되는 음소의 길이를 결정하는 방법에 있어서, (a) 학습대상이 되는 음소들 각각에 부여된 구문론적인 속성들을 분석하는 과정; (b) 상기 속성들에 의해 음소들을 분류하는 고유의 음소길이를 학습시키는 과정; 및 (c) 상기 (d)과정에서 결정된 음소길이를 참조하여 음성합성의 대상이 되는 음소의 길이를 결정하는 과정을 포함하는 음소길이 결정 방법.
  2. 제1항에 있어서, 상기 (d)과정은 (d) 상기 음소들을 임의의 속성에 의해 분류하고, 분류된 집단의 평균오차를 구하는 과정; (e) 상기 (d)과정을 모든 속성들에 반복적용하여 분류된 집단의 평균오차가 가장 작은 값을 보이는 속성을 결정하는 과정; (f) 상기 (e)과정에서 결정된 속성에 의해 분류된 집합들을 상기 결정된 속성을 제외시킨 나머지의 속성들에 의해 재차 분류하고, 분류된 집단의 평균오차를 구하는 과정; (g) 상기 (e)과정과 (f)과정을 더 이상 적용시킬 속성이 남아있지 않거나 혹은 분류된 집단의 평균오차가 소정의 값보다 작을 때까지 적용하여 반복적으로 적용시켜 트리구조의 음소길이 결정테이블을 구하는 과정; 및 (h) 상기 (g)과정에 의해 분류된 음소길이 결정테이블의 종단노드에 각 집단들의 평균음소길이를 할당시키는 과정을 포함하는 음소길이 결정방법.
  3. 제2항에 있어서, 상기 평균오차는 하기의 식으로 결정됨을 특징으로 하는 음소길이 결정방법.
  4. 복수개의 문장을 구성하는 음소들의 구문론적 특성에 따라 분류하여 음성합성의 단위가 되는 음소의 길이를 결정하는 데 사용되는 음소길이 결정트리를 학습하는 방법에 있어서, (o) 상기 음소들을 임의의 속성에 의해 분류하고, 분류된 집단의 평균오차를 구하는 과정; (p) 상기 (o)과정을 모든 속성들에 반복적용하여 분류된 집단의 평균오차가 가장 작은 값을 보이는 속성을 결정하는 과정; (q) 상기(p)과정에서 결정된 속성에 의해 분류된 집합들을 상기 결정된 속성을 제외시킨 나머지의 속성들에 의해 재차 분류하고, 분류된 집단의 평균오차를 구하는 과정; (r) 상기 (p)과정과 (q)과정을 더 이상 적용시킬 속성이 남아있지 않거나 혹은 분류된 집단의 평균오차가 소정의 값보다 작을 때까지 적용하여 반복적으로 적용시켜 트리구조의 음소길이 결정테이블을 구하는 과정; 및 (s) 상기 (r)과정에 의해 분류된 음소길이 결정테이블의 종단노드에 각 집단들의 평균음소길이를 할당시키는 과정을 포함하는 음소길이 결정트리의 학습방법.
  5. 제4항에 있어서, 상기 평균오차는 하기의 식으로 결정됨을 특징으로 하는 음소길이 결정트리의 학습방법.
    여기서, Si는 학습대상이 된 음소들이고, mk는 집단에 소속된 음소의 길이 LEN(Si)를 평균한 값이다.
    ※ 참고사항 : 최초출원 내용에 의하여 공개하는 것임.
KR1019950019064A 1995-06-30 1995-06-30 음성합성에있어서의음소길이결정방법및음소길이결정트리의학습방법 KR100355393B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1019950019064A KR100355393B1 (ko) 1995-06-30 1995-06-30 음성합성에있어서의음소길이결정방법및음소길이결정트리의학습방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1019950019064A KR100355393B1 (ko) 1995-06-30 1995-06-30 음성합성에있어서의음소길이결정방법및음소길이결정트리의학습방법

Publications (2)

Publication Number Publication Date
KR970002851A true KR970002851A (ko) 1997-01-28
KR100355393B1 KR100355393B1 (ko) 2002-12-26

Family

ID=37489454

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019950019064A KR100355393B1 (ko) 1995-06-30 1995-06-30 음성합성에있어서의음소길이결정방법및음소길이결정트리의학습방법

Country Status (1)

Country Link
KR (1) KR100355393B1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100509797B1 (ko) * 1998-04-29 2005-08-23 마쯔시다덴기산교 가부시키가이샤 결정 트리에 의한 스펠형 문자의 복합 발음 발생과 스코어를위한 장치 및 방법

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100509797B1 (ko) * 1998-04-29 2005-08-23 마쯔시다덴기산교 가부시키가이샤 결정 트리에 의한 스펠형 문자의 복합 발음 발생과 스코어를위한 장치 및 방법

Also Published As

Publication number Publication date
KR100355393B1 (ko) 2002-12-26

Similar Documents

Publication Publication Date Title
US7127396B2 (en) Method and apparatus for speech synthesis without prosody modification
US7024362B2 (en) Objective measure for estimating mean opinion score of synthesized speech
US7263488B2 (en) Method and apparatus for identifying prosodic word boundaries
US7386451B2 (en) Optimization of an objective measure for estimating mean opinion score of synthesized speech
US8566099B2 (en) Tabulating triphone sequences by 5-phoneme contexts for speech synthesis
Torkkola An efficient way to learn English grapheme-to-phoneme rules automatically
US8099281B2 (en) System and method for word-sense disambiguation by recursive partitioning
JP2007249212A (ja) テキスト音声合成のための方法、コンピュータプログラム及びプロセッサ
KR950704772A (ko) 시스템 트레이닝 방법, 트레이닝된 장치 및 그 사용 방법(A method for training a system, the resulting apparatus, and method of use thereof)
KR20070077042A (ko) 음성처리장치 및 방법
Navarro et al. Automatic generation of chord progressions with an artificial immune system
EP0239394A1 (en) Speech synthesis system
US20020087317A1 (en) Computer-implemented dynamic pronunciation method and system
CN106843523A (zh) 基于人工智能的文字输入方法和装置
US20040172249A1 (en) Speech synthesis
KR970002851A (ko) 음성합성에 있어서의 음소길이 결정방법 및 음소길이 결정트리의 학습방법
KR0146549B1 (ko) 한국어 텍스트/음성 변환 방법
JP6840124B2 (ja) 言語処理装置、言語処理プログラムおよび言語処理方法
Hinterleitner et al. Text-to-speech synthesis
KR100275777B1 (ko) 음소별 코드북 매핑에 의한 음색변환방법
Ueberla An extended clustering algorithm for statistical language models
Hoffmann et al. Employing Sentence Structure: Syntax Trees as Prosody Generators.
KR0173340B1 (ko) 텍스트/음성변환기에서 억양패턴 정규화와 신경망 학습을 이용한 억양 생성 방법
JP2001075585A5 (ko)
EP1777697B1 (en) Method for speech synthesis without prosody modification

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20100830

Year of fee payment: 9

LAPS Lapse due to unpaid annual fee