KR20040079099A - 미등록어 합성 기능을 이용한 음성합성기 및 그 방법 - Google Patents
미등록어 합성 기능을 이용한 음성합성기 및 그 방법 Download PDFInfo
- Publication number
- KR20040079099A KR20040079099A KR1020030014024A KR20030014024A KR20040079099A KR 20040079099 A KR20040079099 A KR 20040079099A KR 1020030014024 A KR1020030014024 A KR 1020030014024A KR 20030014024 A KR20030014024 A KR 20030014024A KR 20040079099 A KR20040079099 A KR 20040079099A
- Authority
- KR
- South Korea
- Prior art keywords
- synthesis
- processor
- word
- text data
- information
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 20
- 238000012545 processing Methods 0.000 title claims description 63
- 230000015572 biosynthetic process Effects 0.000 claims abstract description 73
- 238000003786 synthesis reaction Methods 0.000 claims abstract description 73
- 230000006870 function Effects 0.000 claims abstract description 29
- 230000002194 synthesizing effect Effects 0.000 claims abstract description 16
- 230000033764 rhythmic process Effects 0.000 claims abstract description 11
- 239000000284 extract Substances 0.000 claims abstract description 5
- 238000001308 synthesis method Methods 0.000 claims description 9
- 239000000203 mixture Substances 0.000 claims description 2
- 230000011218 segmentation Effects 0.000 abstract description 4
- 230000000877 morphologic effect Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 4
- 238000002372 labelling Methods 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 238000011160 research Methods 0.000 description 4
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000003780 insertion Methods 0.000 description 2
- 230000037431 insertion Effects 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- 238000009825 accumulation Methods 0.000 description 1
- 230000001010 compromised effect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000000284 resting effect Effects 0.000 description 1
- 238000007493 shaping process Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/06—Elementary speech units used in speech synthesisers; Concatenation rules
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/211—Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/268—Morphological analysis
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Acoustics & Sound (AREA)
- Human Computer Interaction (AREA)
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
Abstract
Description
Claims (7)
- 미등록어 합성 기능을 이용한 음성합성기에 있어서,형태소 분석 및 구문 분석에서 처리되지 않은 예외적인 단어들이 저장되어 있는 제 1 저장수단;음절단위로 합성하기 위하여 이용되는 데이터가 저장되어 있는 제 2 저장수단;합성단위로 합성하기 위하여 이용되는 데이터가 저장되어 있는 제 3 저장수단;외부로부터 텍스트 데이터를 입력받아 형태소 및 구문 분석을 수행하여 그 결과를 출력하고, 형태소 및 구문 분석에 의하여 처리되지 않으며 상기 제 1 저장수단에도 등록되어 있지 않은 미등록어를 추출하여 출력하기 위한 언어처리수단;상기 언어처리수단으로부터 입력받은 미등록어에 끊어읽기 정보를 삽입하여 출력하기 위한 미등록어처리수단;상기 언어처리수단에서 분석된 텍스트 데이터 및 상기 미등록어처리수단에서 처리된 텍스트 데이터를 입력받아 운율 모델링을 수행하여 요구되는 운율 및 통사 정보를 삽입하기 위한 운율처리수단;상기 운율처리수단에서 처리된 텍스트 데이터를 입력받아 상기 제 2 저장수단 또는 상기 제 3 저장수단을 탐색하여 합성단위 정보를 삽입하기 위한 합성단위처리수단; 및상기 합성단위처리수단에서 처리된 텍스트 데이터를 입력받아 합성음을 생성하여 출력하기 위한 합성음생성수단을 포함하는 미등록어 합성 기능을 이용한 음성합성기.
- 제 1 항에 있어서,상기 미등록어처리수단은,상기 언어처리수단으로부터 입력받은 미등록어가 숫자열인지 확인하여, 미등록어가 숫자열이면 숫자 단위로 분절하여 분절된 숫자 사이에 약경계 끊어읽기 정보를 삽입하고, 미등록어가 숫자열이 아니면 음절 단위로 분절하여 분절된 음절 사이에 약경계 끊어읽기 정보를 삽입한 후, 상기 약경계 끊어읽기 정보가 삽입된 미등록어의 양쪽 경계에 강경계 끊어읽기 정보를 삽입하는 것을 특징으로 하는 미등록어 합성 기능을 이용한 음성합성기.
- 제 1 항 또는 제 2 항에 있어서,상기 합성음생성수단은,외부로부터 입력받은 합성음 출력 형태 선택 신호에 따라 미등록어처리합성음과 일반합성음을 일정한 휴지구간(강경계의 2배 이상)을 두어 순차적으로 출력하거나, 미등록어처리합성음만을 출력하거나, 일반합성음만을 출력하는 것을 특징으로 하는 미등록어 합성 기능을 이용한 음성합성기.
- 미등록어 합성 기능을 이용한 음성 합성 방법에 있어서,언어처리부가 외부로부터 텍스트 데이터를 입력받아 형태소 및 구문 분석을 수행하여 그 결과를 운율처리부로 출력하고, 형태소 및 구문 분석에 의하여 처리되지 않으며 예외사전에도 등록되지 않은 미등록어를 추출하여 미등록어처리부로 출력하는 제 1 단계;상기 미등록어처리부가 상기 언어처리부로부터 입력받은 미등록어에 끊어읽기 정보를 삽입하여 상기 운율처리부로 전달하는 제 2 단계;상기 운율처리부가 상기 언어처리부에서 분석된 텍스트 데이터 및 상기 미등록어처리부에서 처리된 텍스트 데이터를 입력받아 운율 모델링을 수행하여 요구되는 운율 및 통사 정보를 삽입하는 제 3 단계;합성단위처리부가 상기 운율처리부에서 처리된 텍스트 데이터를 입력받아 음절 데이터베이스 또는 합성 데이터베이스를 탐색하여 합성단위 정보를 삽입하는 제 4 단계; 및합성필터가 상기 합성단위처리부에서 처리된 텍스트 데이터를 입력받아 합성음을 생성하여 출력하는 제 5 단계를 포함하는 미등록어 합성 기능을 이용한 음성 합성 방법.
- 제 4 항에 있어서,상기 제 2 단계는,상기 미등록어처리부가 상기 언어처리부로부터 입력받은 미등록어가 숫자열인지 확인하는 제 6 단계;상기 제 6 단계의 확인 결과, 미등록어가 숫자열이면 숫자 단위로 분절하여 분절된 숫자 사이에 약경계 끊어읽기 정보를 삽입하는 제 7 단계;상기 제 6 단계의 확인 결과, 미등록어가 숫자열이 아니면 음절 단위로 분절하여 분절된 음절 사이에 약경계 끊어읽기 정보를 삽입하는 제 8 단계; 및상기 미등록어처리부가 약경계 끊어읽기 정보가 삽입된 미등록어의 양쪽 경계에 강경계 끊어읽기 정보를 삽입하는 제 9 단계를 포함하는 미등록어 합성 기능을 이용한 음성 합성 방법.
- 제 4 항 또는 제 5 항에 있어서,상기 제 5 단계는,합성필터가 외부로부터 합성음 출력 형태 선택 신호를 입력받는 제 10 단계; 및입력받은 합성음 출력 형태에 따라 미등록어처리합성음과 일반합성음을 일정한 휴지구간(강경계의 2배 이상)을 두어 순차적으로 출력하거나, 미등록어처리합성음만을 출력하거나, 일반합성음만을 출력하는 제 11 단계를 포함하는 미등록어 합성 기능을 이용한 음성 합성 방법.
- 프로세서를 구비한 음성합성기에,언어처리부가 외부로부터 텍스트 데이터를 입력받아 형태소 및 구문 분석을 수행하여 그 결과를 운율처리부로 출력하고, 형태소 및 구문 분석에 의하여 처리되지 않으며 예외사전에도 등록되지 않은 미등록어를 추출하여 미등록어처리부로 출력하는 제 1 기능;상기 미등록어처리부가 상기 언어처리부로부터 입력받은 미등록어에 끊어읽기 정보를 삽입하여 상기 운율처리부로 전달하는 제 2 기능;상기 운율처리부가 상기 언어처리부에서 분석된 텍스트 데이터 및 상기 미등록어처리부에서 처리된 텍스트 데이터를 입력받아 운율 모델링을 수행하여 요구되는 운율 및 통사 정보를 삽입하는 제 3 기능;합성단위처리부가 상기 운율처리부에서 처리된 텍스트 데이터를 입력받아 음절 데이터베이스 또는 합성 데이터베이스를 탐색하여 합성단위 정보를 삽입하는 제 4 기능; 및합성필터가 상기 합성단위처리부에서 처리된 텍스트 데이터를 입력받아 합성음을 생성하여 출력하는 제 5 기능을 실현시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020030014024A KR100959494B1 (ko) | 2003-03-06 | 2003-03-06 | 미등록어 합성 기능을 이용한 음성합성기 및 그 방법 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020030014024A KR100959494B1 (ko) | 2003-03-06 | 2003-03-06 | 미등록어 합성 기능을 이용한 음성합성기 및 그 방법 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20040079099A true KR20040079099A (ko) | 2004-09-14 |
KR100959494B1 KR100959494B1 (ko) | 2010-05-26 |
Family
ID=37364155
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020030014024A KR100959494B1 (ko) | 2003-03-06 | 2003-03-06 | 미등록어 합성 기능을 이용한 음성합성기 및 그 방법 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR100959494B1 (ko) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111667816B (zh) * | 2020-06-15 | 2024-01-23 | 北京百度网讯科技有限公司 | 模型训练方法、语音合成方法、装置、设备和存储介质 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08185197A (ja) * | 1994-12-28 | 1996-07-16 | Fujitsu Ltd | 日本語解析装置、及び日本語テキスト音声合成装置 |
-
2003
- 2003-03-06 KR KR1020030014024A patent/KR100959494B1/ko not_active IP Right Cessation
Also Published As
Publication number | Publication date |
---|---|
KR100959494B1 (ko) | 2010-05-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Bulyko et al. | A bootstrapping approach to automating prosodic annotation for limited-domain synthesis | |
JP4038211B2 (ja) | 音声合成装置,音声合成方法および音声合成システム | |
Patil et al. | A syllable-based framework for unit selection synthesis in 13 Indian languages | |
Mache et al. | Review on text-to-speech synthesizer | |
Wu et al. | Automatic generation of synthesis units and prosodic information for Chinese concatenative synthesis | |
JP4811557B2 (ja) | 音声再生装置及び発話支援装置 | |
Tseng | Syllable contractions in a Mandarin conversational dialogue corpus | |
Tamiru et al. | Sentence-level automatic speech segmentation for amharic | |
Demenko et al. | JURISDIC: Polish Speech Database for Taking Dictation of Legal Texts. | |
Zine et al. | Novel approach for quality enhancement of Arabic text to speech synthesis | |
Zine et al. | Towards a high-quality lemma-based text to speech system for the Arabic language | |
KR100959494B1 (ko) | 미등록어 합성 기능을 이용한 음성합성기 및 그 방법 | |
JP2000172289A (ja) | 自然言語処理方法,自然言語処理用記録媒体および音声合成装置 | |
Levow | Prosody-based topic segmentation for mandarin broadcast news | |
Soman et al. | Corpus driven malayalam text-to-speech synthesis for interactive voice response system | |
Shirbahadurkar et al. | Marathi language speech synthesizer using concatenative synthesis strategy (spoken in Maharashtra, India) | |
Nguyen | Hmm-based vietnamese text-to-speech: Prosodic phrasing modeling, corpus design system design, and evaluation | |
JPH0962286A (ja) | 音声合成装置および音声合成方法 | |
Mahar et al. | WordNet based Sindhi text to speech synthesis system | |
JP2010085581A (ja) | 歌詞データ表示装置、歌詞データ表示方法、歌詞データ表示プログラム | |
Shirbahadurkar et al. | Speech synthesizer using concatenative synthesis strategy for Marathi language (spoken in Maharashtra, India) | |
JPH08185197A (ja) | 日本語解析装置、及び日本語テキスト音声合成装置 | |
JP2004138661A (ja) | 音声素片データベース作成方法、音声合成方法、音声素片データベース作成装置、音声合成装置、音声データベース作成プログラム、音声合成プログラム | |
Orhan et al. | The framework of the Turkish Syllable-based concatenative text-to-speech system with exceptional case handling | |
Mesa et al. | Development of Tagalog speech corpus |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20130430 Year of fee payment: 4 |
|
FPAY | Annual fee payment |
Payment date: 20140508 Year of fee payment: 5 |
|
FPAY | Annual fee payment |
Payment date: 20150507 Year of fee payment: 6 |
|
FPAY | Annual fee payment |
Payment date: 20160503 Year of fee payment: 7 |
|
FPAY | Annual fee payment |
Payment date: 20170504 Year of fee payment: 8 |
|
FPAY | Annual fee payment |
Payment date: 20180503 Year of fee payment: 9 |
|
LAPS | Lapse due to unpaid annual fee |