KR100769033B1 - 스피치 합성 방법 - Google Patents
스피치 합성 방법 Download PDFInfo
- Publication number
- KR100769033B1 KR100769033B1 KR1020067006170A KR20067006170A KR100769033B1 KR 100769033 B1 KR100769033 B1 KR 100769033B1 KR 1020067006170 A KR1020067006170 A KR 1020067006170A KR 20067006170 A KR20067006170 A KR 20067006170A KR 100769033 B1 KR100769033 B1 KR 100769033B1
- Authority
- KR
- South Korea
- Prior art keywords
- speech
- rhyme
- pitch
- match
- segment
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 37
- 230000002194 synthesizing effect Effects 0.000 title description 3
- 230000015572 biosynthetic process Effects 0.000 claims abstract description 7
- 238000003786 synthesis reaction Methods 0.000 claims abstract description 7
- 238000001308 synthesis method Methods 0.000 claims 6
- 238000012795 verification Methods 0.000 claims 1
- 230000001360 synchronised effect Effects 0.000 abstract description 2
- 238000004422 calculation algorithm Methods 0.000 description 6
- 230000033764 rhythmic process Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 230000000116 mitigating effect Effects 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000010304 firing Methods 0.000 description 1
- 230000002040 relaxant effect Effects 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/06—Elementary speech units used in speech synthesisers; Concatenation rules
- G10L13/07—Concatenation rules
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/08—Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination
- G10L13/10—Prosody rules derived from text; Stress or intonation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/06—Elementary speech units used in speech synthesisers; Concatenation rules
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
Abstract
Description
Claims (12)
- 전자 디바이스 상에서, 텍스트 세그먼트에 대해 스피치 합성(speech synthesis)을 수행하기 위한 방법에 있어서,복수의 스피치 파형 샘플들을 포함하는 발화 파형 코퍼스(utterance waveform corpus)와 텍스트 세그먼트를 비교하는 단계,상기 텍스트 세그먼트 내의 연속 음절들(consecutive syllables)과 샘플링된 스피치 파형 발화들과 관련된 속성들 사이의 최상의 매칭을 결정하는 단계로서, 상기 최상의 매칭은 상기 파형 발화들 각각의 속성들 및 속성 위치들과 일치하는 최대 수의 연속 음절을 식별함으로써 결정되는, 상기 최상 매칭 결정 단계;상기 텍스트 세그먼트 내의 매칭되지 않은 각 음절에 대한 적절한 매칭을 확인하는 단계로서, 매칭되지 않은 각 음절은 상기 연속 음절들 중 하나가 아닌 음절이며, 상기 적절한 매칭은 샘플링된 스피치 파형 발화들과 관련된 상기 속성들을 운율 특징 그룹(prosodic features group)의 운율 특징들과 비교하여 결정되고, 상기 확인 단계는 상기 적절한 매칭이 존재할 때까지 상기 운율 특징 그룹으로부터 상기 운율 특징들을 연속적으로 제거하는 것을 특징으로 하는, 상기 적절한 매칭 확인 단계, 및상기 코퍼스 내의 상기 스피치 파형 샘플들을 사용함으로써 상기 텍스트 세그먼트를 위한 연쇄 합성 스피치를 생성하는 단계로서, 상기 스피치 파형 샘플들은 매칭되지 않은 각 음절들에 대한 적절한 매칭과 연속 음절들 사이의 최상의 매칭으로부터 선택되는, 상기 생성 단계를 포함하는, 스피치 합성 방법.
- 제 1 항에 있어서, 상기 운율 특징들은 텍스트 문맥(text context), 병음(pinyin), 음조 문맥(tone context), 동시조음(co-articulation), 음절 위치(syllable position), 어구 위치(phrase position), 캐릭터 심볼(character symbol) 및 어구 길이(length of phrase)로 구성되는 그룹으로부터 선택된 특징들을 포함하는, 스피치 합성 방법.
- 제 1 항에 있어서, 상기 운율 특징들은 음조 문맥, 동시조음, 음절 위치, 어구 위치 및 캐릭터 심볼을 포함하는, 스피치 합성 방법.
- 제 1 항에 있어서, 상기 모든 다른 운율 특징들이 연속적으로 제거된 이후에 병음에만 기초한 기본 표음 매칭(basic phonetic match)을 수행하는 단계를 더 포함하는, 스피치 합성 방법.
- 제 1 항에 있어서, 상기 결정 단계는 수학식에 의해 다수의 최상의 매칭들이 발견될 때, 최적의 문맥 표음 혼성 매칭을 선택하는 단계를 포함하고,여기서, Wp = 상기 스피치 세그먼트의 피치(pitch)의 가중치;Wd = 상기 스피치 세그먼트의 지속 기간의 가중치;diff = 상기 최적의 문맥 표음 혼성 매칭을 선택하기 위한 미분값;pitch = 상기 스피치 세그먼트의 피치;BestPitch = 이상적 스피치 세그먼트의 피치;dur = 상기 스피치 세그먼트의 지속 기간;BestDur = 상기 이상적 스피치 세그먼트의 지속 기간인, 스피치 합성 방법.
- 제 5 항에 있어서, 상기 BsetPitch는 수학식BestPitch = pitchtone - nIndex x empiricalvalue을 사용하여 결정되고,여기서, pitchtone = 상기 발화 파형 코퍼스의 음조를 포함하는 평균 피치;nIndex = 운율 어구의 상기 스피치 세그먼트의 인덱스;empircalvalue = 상기 발화 파형 코퍼스에 기초한 경험값인, 스피치 합성 방법.
- 제 5 항에 있어서, 상기 BestDur은 수학식BestDur = durs x fs - nIndex x empiricalvalue을 사용하여 결정되고,여기서, durs = 음조가 없는 상기 스피치 세그먼트의 평균 지속 기간;nIndex = 운율 어구의 상기 스피치 세그먼트의 인덱스;fs = 운율 위치를 위한 계수; 및empircalvalue = 상기 발화 파형 코퍼스에 기초한 경험값인, 스피치 합성 방법.
- 제 1 항에 있어서, 상기 결정 단계는 수학식을 사용하여 다수의 적절한 매칭들이 발견될 때, 최적의 문맥 표음 혼성 매칭을 선택하는 단계를 포함하고,여기서, Wp = 상기 스피치 세그먼트의 피치의 가중치;Wd = 상기 스피치 세그먼트의 지속 기간의 가중치;diff = 상기 최적의 문맥 표음 혼성 매칭을 선택하기 위한 미분값;pitch = 상기 스피치 세그먼트의 피치;BestPitch = 이상적 스피치 세그먼트의 피치;dur = 상기 스피치 세그먼트의 지속 기간; 및BestDur = 상기 이상적 스피치 세그먼트의 지속 기간인, 스피치 합성 방법.
- 제 8 항에 있어서, 상기 최적의 문맥 표음 혼성 매칭은 최저 미분값(diff)을 갖는 매칭인 스피치 합성 방법.
- 제 8 항에 있어서, 상기 최적의 문맥 표음 혼성 매칭을 선택하기 위한 상기 미분값(diff)은 미리 설정된 임계값과 비교되는, 스피치 합성 방법.
- 제 8 항에 있어서, 상기 BsetPitch는 수학식BestPitch = pitchtone - nIndex x empiricalvalue을 사용하여 결정되고,여기서, pitchtone = 상기 발화 파형 코퍼스의 음조를 포함하는 평균 피치;nIndex = 운율 어구의 상기 스피치 세그먼트의 인덱스;empircalvalue = 상기 발화 파형 코퍼스에 기초한 경험값인, 스피치 합성 방법.
- 제 8 항에 있어서, 상기 BestDur은 수학식BestDur = durs x fs - nIndex x empiricalvalue을 사용하여 결정되고,여기서, durs = 음조가 없는 상기 스피치 세그먼트의 평균 지속 기간;nIndex = 운율 어구의 상기 스피치 세그먼트의 인덱스;fs = 운율 위치를 위한 계수; 및empircalvalue = 상기 발화 파형 코퍼스에 기초한 경험값인, 스피치 합성 방법.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN03132698.6 | 2003-09-29 | ||
CNB031326986A CN1260704C (zh) | 2003-09-29 | 2003-09-29 | 语音合成方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20060066121A KR20060066121A (ko) | 2006-06-15 |
KR100769033B1 true KR100769033B1 (ko) | 2007-10-22 |
Family
ID=34398359
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020067006170A KR100769033B1 (ko) | 2003-09-29 | 2004-09-17 | 스피치 합성 방법 |
Country Status (5)
Country | Link |
---|---|
EP (1) | EP1668628A4 (ko) |
KR (1) | KR100769033B1 (ko) |
CN (1) | CN1260704C (ko) |
MX (1) | MXPA06003431A (ko) |
WO (1) | WO2005034082A1 (ko) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20210109222A (ko) | 2020-02-27 | 2021-09-06 | 주식회사 케이티 | 음성을 합성하는 장치, 방법 및 컴퓨터 프로그램 |
Families Citing this family (59)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8677377B2 (en) | 2005-09-08 | 2014-03-18 | Apple Inc. | Method and apparatus for building an intelligent automated assistant |
US9318108B2 (en) | 2010-01-18 | 2016-04-19 | Apple Inc. | Intelligent automated assistant |
US8996376B2 (en) | 2008-04-05 | 2015-03-31 | Apple Inc. | Intelligent text-to-speech conversion |
US10241752B2 (en) | 2011-09-30 | 2019-03-26 | Apple Inc. | Interface for a virtual digital assistant |
US10241644B2 (en) | 2011-06-03 | 2019-03-26 | Apple Inc. | Actionable reminder entries |
US9431006B2 (en) | 2009-07-02 | 2016-08-30 | Apple Inc. | Methods and apparatuses for automatic speech recognition |
TWI421857B (zh) * | 2009-12-29 | 2014-01-01 | Ind Tech Res Inst | 產生詞語確認臨界值的裝置、方法與語音辨識、詞語確認系統 |
US8682667B2 (en) | 2010-02-25 | 2014-03-25 | Apple Inc. | User profiling for selecting user specific voice input processing information |
US10134385B2 (en) | 2012-03-02 | 2018-11-20 | Apple Inc. | Systems and methods for name pronunciation |
US9721563B2 (en) | 2012-06-08 | 2017-08-01 | Apple Inc. | Name recognition system |
KR20140008870A (ko) * | 2012-07-12 | 2014-01-22 | 삼성전자주식회사 | 컨텐츠 정보 제공 방법 및 이를 적용한 방송 수신 장치 |
US9547647B2 (en) | 2012-09-19 | 2017-01-17 | Apple Inc. | Voice-based media searching |
WO2014197334A2 (en) | 2013-06-07 | 2014-12-11 | Apple Inc. | System and method for user-specified pronunciation of words for speech synthesis and recognition |
US9430463B2 (en) | 2014-05-30 | 2016-08-30 | Apple Inc. | Exemplar-based natural language processing |
US9338493B2 (en) | 2014-06-30 | 2016-05-10 | Apple Inc. | Intelligent automated assistant for TV user interactions |
US9668121B2 (en) | 2014-09-30 | 2017-05-30 | Apple Inc. | Social reminders |
CN105989833B (zh) * | 2015-02-28 | 2019-11-15 | 讯飞智元信息科技有限公司 | 多语种混语文本字音转换方法及系统 |
US10567477B2 (en) | 2015-03-08 | 2020-02-18 | Apple Inc. | Virtual assistant continuity |
CN106157948B (zh) * | 2015-04-22 | 2019-10-18 | 科大讯飞股份有限公司 | 一种基频建模方法及系统 |
US9578173B2 (en) | 2015-06-05 | 2017-02-21 | Apple Inc. | Virtual assistant aided communication with 3rd party service in a communication session |
CN105096934B (zh) * | 2015-06-30 | 2019-02-12 | 百度在线网络技术(北京)有限公司 | 构建语音特征库的方法、语音合成方法、装置及设备 |
US10747498B2 (en) | 2015-09-08 | 2020-08-18 | Apple Inc. | Zero latency digital assistant |
US10671428B2 (en) | 2015-09-08 | 2020-06-02 | Apple Inc. | Distributed personal assistant |
US10366158B2 (en) | 2015-09-29 | 2019-07-30 | Apple Inc. | Efficient word encoding for recurrent neural network language models |
US11010550B2 (en) | 2015-09-29 | 2021-05-18 | Apple Inc. | Unified language modeling framework for word prediction, auto-completion and auto-correction |
US10691473B2 (en) | 2015-11-06 | 2020-06-23 | Apple Inc. | Intelligent automated assistant in a messaging environment |
US10049668B2 (en) | 2015-12-02 | 2018-08-14 | Apple Inc. | Applying neural network language models to weighted finite state transducers for automatic speech recognition |
US10223066B2 (en) | 2015-12-23 | 2019-03-05 | Apple Inc. | Proactive assistance based on dialog communication between devices |
US10446143B2 (en) | 2016-03-14 | 2019-10-15 | Apple Inc. | Identification of voice inputs providing credentials |
US9934775B2 (en) | 2016-05-26 | 2018-04-03 | Apple Inc. | Unit-selection text-to-speech synthesis based on predicted concatenation parameters |
US9972304B2 (en) | 2016-06-03 | 2018-05-15 | Apple Inc. | Privacy preserving distributed evaluation framework for embedded personalized systems |
US10249300B2 (en) | 2016-06-06 | 2019-04-02 | Apple Inc. | Intelligent list reading |
US10049663B2 (en) | 2016-06-08 | 2018-08-14 | Apple, Inc. | Intelligent automated assistant for media exploration |
DK179588B1 (en) | 2016-06-09 | 2019-02-22 | Apple Inc. | INTELLIGENT AUTOMATED ASSISTANT IN A HOME ENVIRONMENT |
US10509862B2 (en) | 2016-06-10 | 2019-12-17 | Apple Inc. | Dynamic phrase expansion of language input |
US10490187B2 (en) | 2016-06-10 | 2019-11-26 | Apple Inc. | Digital assistant providing automated status report |
US10067938B2 (en) | 2016-06-10 | 2018-09-04 | Apple Inc. | Multilingual word prediction |
US10586535B2 (en) | 2016-06-10 | 2020-03-10 | Apple Inc. | Intelligent digital assistant in a multi-tasking environment |
US10192552B2 (en) | 2016-06-10 | 2019-01-29 | Apple Inc. | Digital assistant providing whispered speech |
DK201670540A1 (en) | 2016-06-11 | 2018-01-08 | Apple Inc | Application integration with a digital assistant |
DK179415B1 (en) | 2016-06-11 | 2018-06-14 | Apple Inc | Intelligent device arbitration and control |
DK179049B1 (en) | 2016-06-11 | 2017-09-18 | Apple Inc | Data driven natural language event detection and classification |
DK179343B1 (en) | 2016-06-11 | 2018-05-14 | Apple Inc | Intelligent task discovery |
US10043516B2 (en) | 2016-09-23 | 2018-08-07 | Apple Inc. | Intelligent automated assistant |
CN106534528A (zh) * | 2016-11-04 | 2017-03-22 | 广东欧珀移动通信有限公司 | 一种文本信息的处理方法、装置及移动终端 |
US10593346B2 (en) | 2016-12-22 | 2020-03-17 | Apple Inc. | Rank-reduced token representation for automatic speech recognition |
DK201770439A1 (en) | 2017-05-11 | 2018-12-13 | Apple Inc. | Offline personal assistant |
DK179745B1 (en) | 2017-05-12 | 2019-05-01 | Apple Inc. | SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT |
DK179496B1 (en) | 2017-05-12 | 2019-01-15 | Apple Inc. | USER-SPECIFIC Acoustic Models |
DK201770432A1 (en) | 2017-05-15 | 2018-12-21 | Apple Inc. | Hierarchical belief states for digital assistants |
DK201770431A1 (en) | 2017-05-15 | 2018-12-20 | Apple Inc. | Optimizing dialogue policy decisions for digital assistants using implicit feedback |
DK179560B1 (en) | 2017-05-16 | 2019-02-18 | Apple Inc. | FAR-FIELD EXTENSION FOR DIGITAL ASSISTANT SERVICES |
CN107481713B (zh) * | 2017-07-17 | 2020-06-02 | 清华大学 | 一种混合语言语音合成方法及装置 |
CN109948124B (zh) * | 2019-03-15 | 2022-12-23 | 腾讯科技(深圳)有限公司 | 语音文件切分方法、装置及计算机设备 |
CN110942765B (zh) * | 2019-11-11 | 2022-05-27 | 珠海格力电器股份有限公司 | 一种构建语料库的方法、设备、服务器和存储介质 |
CN111128116B (zh) * | 2019-12-20 | 2021-07-23 | 珠海格力电器股份有限公司 | 一种语音处理方法、装置、计算设备及存储介质 |
US20210350788A1 (en) * | 2020-05-06 | 2021-11-11 | Samsung Electronics Co., Ltd. | Electronic device for generating speech signal corresponding to at least one text and operating method of the electronic device |
CN112530406A (zh) * | 2020-11-30 | 2021-03-19 | 深圳市优必选科技股份有限公司 | 一种语音合成方法、语音合成装置及智能设备 |
CN113393829B (zh) * | 2021-06-16 | 2023-08-29 | 哈尔滨工业大学(深圳) | 一种融合韵律和个人信息的中文语音合成方法 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6449622A (en) * | 1987-08-19 | 1989-02-27 | Jsp Corp | Resin foaming particle containing crosslinked polyolefin-based resin and manufacture thereof |
KR19990033536A (ko) * | 1997-10-24 | 1999-05-15 | 정선종 | 텍스트/음성변환기에서의 최적 합성단위열 선정 방법 |
KR20010020871A (ko) * | 1999-05-21 | 2001-03-15 | 팔머 카알 알. | 개선된 어구 저장, 사용, 변환, 전달 및 인식을 갖춘 음성제어된 디바이스를 위한 방법 및 장치 |
KR20030074473A (ko) * | 2002-03-15 | 2003-09-19 | 소니 가부시끼 가이샤 | 스피치 합성 방법 및 장치, 프로그램, 기록 매체, 억제정보 생성 방법 및 장치, 및 로봇 장치 |
KR20030079460A (ko) * | 2002-04-04 | 2003-10-10 | 삼성전자주식회사 | 텍스트/음성 변환 장치 및 방법 |
WO2003088208A1 (en) * | 2002-04-02 | 2003-10-23 | Canon Kabushiki Kaisha | Text structure for voice synthesis, voice synthesis method, voice synthesis apparatus, and computer program thereof |
WO2003094150A1 (en) * | 2002-05-01 | 2003-11-13 | Seiko Epson Corporation | A method of encoding text data to include enhanced speech data for use in a text to speech (tts) system, a method of decoding, a tts system and a mobile phone including said tts system |
KR20060056403A (ko) * | 2003-09-29 | 2006-05-24 | 모토로라 인코포레이티드 | 텍스트 문자열에서 자연 스피치 포즈 식별 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5970454A (en) * | 1993-12-16 | 1999-10-19 | British Telecommunications Public Limited Company | Synthesizing speech by converting phonemes to digital waveforms |
US5704007A (en) * | 1994-03-11 | 1997-12-30 | Apple Computer, Inc. | Utilization of multiple voice sources in a speech synthesizer |
US6134528A (en) * | 1997-06-13 | 2000-10-17 | Motorola, Inc. | Method device and article of manufacture for neural-network based generation of postlexical pronunciations from lexical pronunciations |
-
2003
- 2003-09-29 CN CNB031326986A patent/CN1260704C/zh not_active Expired - Lifetime
-
2004
- 2004-09-17 EP EP04784355A patent/EP1668628A4/en not_active Withdrawn
- 2004-09-17 WO PCT/US2004/030467 patent/WO2005034082A1/en active Application Filing
- 2004-09-17 MX MXPA06003431A patent/MXPA06003431A/es not_active Application Discontinuation
- 2004-09-17 KR KR1020067006170A patent/KR100769033B1/ko active IP Right Grant
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6449622A (en) * | 1987-08-19 | 1989-02-27 | Jsp Corp | Resin foaming particle containing crosslinked polyolefin-based resin and manufacture thereof |
KR19990033536A (ko) * | 1997-10-24 | 1999-05-15 | 정선종 | 텍스트/음성변환기에서의 최적 합성단위열 선정 방법 |
KR20010020871A (ko) * | 1999-05-21 | 2001-03-15 | 팔머 카알 알. | 개선된 어구 저장, 사용, 변환, 전달 및 인식을 갖춘 음성제어된 디바이스를 위한 방법 및 장치 |
KR20030074473A (ko) * | 2002-03-15 | 2003-09-19 | 소니 가부시끼 가이샤 | 스피치 합성 방법 및 장치, 프로그램, 기록 매체, 억제정보 생성 방법 및 장치, 및 로봇 장치 |
WO2003088208A1 (en) * | 2002-04-02 | 2003-10-23 | Canon Kabushiki Kaisha | Text structure for voice synthesis, voice synthesis method, voice synthesis apparatus, and computer program thereof |
KR20030079460A (ko) * | 2002-04-04 | 2003-10-10 | 삼성전자주식회사 | 텍스트/음성 변환 장치 및 방법 |
WO2003094150A1 (en) * | 2002-05-01 | 2003-11-13 | Seiko Epson Corporation | A method of encoding text data to include enhanced speech data for use in a text to speech (tts) system, a method of decoding, a tts system and a mobile phone including said tts system |
KR20060056403A (ko) * | 2003-09-29 | 2006-05-24 | 모토로라 인코포레이티드 | 텍스트 문자열에서 자연 스피치 포즈 식별 |
Non-Patent Citations (5)
Title |
---|
10-2006-0056403 |
특0149622 |
특2001-0020871 |
특2003-0074473 |
특2003-0079460 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20210109222A (ko) | 2020-02-27 | 2021-09-06 | 주식회사 케이티 | 음성을 합성하는 장치, 방법 및 컴퓨터 프로그램 |
Also Published As
Publication number | Publication date |
---|---|
CN1260704C (zh) | 2006-06-21 |
MXPA06003431A (es) | 2006-06-20 |
EP1668628A4 (en) | 2007-01-10 |
EP1668628A1 (en) | 2006-06-14 |
WO2005034082A1 (en) | 2005-04-14 |
KR20060066121A (ko) | 2006-06-15 |
CN1604182A (zh) | 2005-04-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100769033B1 (ko) | 스피치 합성 방법 | |
US6029132A (en) | Method for letter-to-sound in text-to-speech synthesis | |
US5949961A (en) | Word syllabification in speech synthesis system | |
US6823309B1 (en) | Speech synthesizing system and method for modifying prosody based on match to database | |
KR900009170B1 (ko) | 규칙합성형 음성합성시스템 | |
US6505158B1 (en) | Synthesis-based pre-selection of suitable units for concatenative speech | |
JP3481497B2 (ja) | 綴り言葉に対する複数発音を生成し評価する判断ツリーを利用する方法及び装置 | |
EP1168299A2 (en) | Method and system for preselection of suitable units for concatenative speech | |
EP1221693A2 (en) | Prosody template matching for text-to-speech systems | |
WO1996023298A2 (en) | System amd method for generating and using context dependent sub-syllable models to recognize a tonal language | |
US6477495B1 (en) | Speech synthesis system and prosodic control method in the speech synthesis system | |
JP2008134475A (ja) | 入力された音声のアクセントを認識する技術 | |
US20080147405A1 (en) | Chinese prosodic words forming method and apparatus | |
WO2004012183A2 (en) | Concatenative text-to-speech conversion | |
JP2005257954A (ja) | 音声検索装置、音声検索方法および音声検索プログラム | |
JP3576066B2 (ja) | 音声合成システム、および音声合成方法 | |
JP6998017B2 (ja) | 音声合成用データ生成装置、音声合成用データ生成方法及び音声合成システム | |
Akinwonmi | Development of a prosodic read speech syllabic corpus of the Yoruba language | |
JP3366253B2 (ja) | 音声合成装置 | |
Hendessi et al. | A speech synthesizer for Persian text using a neural network with a smooth ergodic HMM | |
JP3758241B2 (ja) | 音声情報検索装置 | |
Kaur et al. | BUILDING AText-TO-SPEECH SYSTEM FOR PUNJABI LANGUAGE | |
JP2005534968A (ja) | 漢字語の読みの決定 | |
JP2000172286A (ja) | 中国語音声合成のための同時調音処理装置 | |
KR100932643B1 (ko) | 한국어 tts 시스템을 위한 형태소, 구문 분석 없는음소열-발음열 변환방법 및 장치 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
G170 | Publication of correction | ||
FPAY | Annual fee payment |
Payment date: 20120927 Year of fee payment: 6 |
|
FPAY | Annual fee payment |
Payment date: 20130927 Year of fee payment: 7 |
|
FPAY | Annual fee payment |
Payment date: 20141007 Year of fee payment: 8 |
|
FPAY | Annual fee payment |
Payment date: 20151006 Year of fee payment: 9 |
|
FPAY | Annual fee payment |
Payment date: 20161011 Year of fee payment: 10 |
|
FPAY | Annual fee payment |
Payment date: 20181010 Year of fee payment: 12 |
|
FPAY | Annual fee payment |
Payment date: 20191002 Year of fee payment: 13 |