CN101051459A - 基频和停顿预测及语音合成的方法和装置 - Google Patents
基频和停顿预测及语音合成的方法和装置 Download PDFInfo
- Publication number
- CN101051459A CN101051459A CNA200610073145XA CN200610073145A CN101051459A CN 101051459 A CN101051459 A CN 101051459A CN A200610073145X A CNA200610073145X A CN A200610073145XA CN 200610073145 A CN200610073145 A CN 200610073145A CN 101051459 A CN101051459 A CN 101051459A
- Authority
- CN
- China
- Prior art keywords
- pause
- mentioned
- model
- fundamental frequency
- prediction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/08—Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination
- G10L13/10—Prosody rules derived from text; Stress or intonation
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Electrically Operated Instructional Devices (AREA)
- Machine Translation (AREA)
Priority Applications (3)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CNA200610073145XA CN101051459A (zh) | 2006-04-06 | 2006-04-06 | 基频和停顿预测及语音合成的方法和装置 |
| US11/692,392 US20070239439A1 (en) | 2006-04-06 | 2007-03-28 | Method and apparatus for training f0 and pause prediction model, method and apparatus for f0 and pause prediction, method and apparatus for speech synthesis |
| JP2007099948A JP2007279744A (ja) | 2006-04-06 | 2007-04-06 | F0および休止予測モデルを訓練する方法および装置、f0および休止予測方法および装置、音声合成方法および装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CNA200610073145XA CN101051459A (zh) | 2006-04-06 | 2006-04-06 | 基频和停顿预测及语音合成的方法和装置 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| CN101051459A true CN101051459A (zh) | 2007-10-10 |
Family
ID=38576533
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| CNA200610073145XA Pending CN101051459A (zh) | 2006-04-06 | 2006-04-06 | 基频和停顿预测及语音合成的方法和装置 |
Country Status (3)
| Country | Link |
|---|---|
| US (1) | US20070239439A1 (https=) |
| JP (1) | JP2007279744A (https=) |
| CN (1) | CN101051459A (https=) |
Cited By (8)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN102231276A (zh) * | 2011-06-21 | 2011-11-02 | 北京捷通华声语音技术有限公司 | 一种语音合成单元时长的预测方法及装置 |
| CN103680491A (zh) * | 2012-09-10 | 2014-03-26 | 财团法人交大思源基金会 | 语速相依韵律讯息产生装置及语速相依的阶层式韵律模块 |
| CN104538026A (zh) * | 2015-01-12 | 2015-04-22 | 北京理工大学 | 一种用于参数化语音合成的基频建模方法 |
| CN105679306A (zh) * | 2016-02-19 | 2016-06-15 | 上海语知义信息技术有限公司 | 语音合成中预测基频帧的方法及系统 |
| CN107039034A (zh) * | 2016-02-04 | 2017-08-11 | 科大讯飞股份有限公司 | 一种韵律预测方法及系统 |
| CN109036376A (zh) * | 2018-10-17 | 2018-12-18 | 南京理工大学 | 一种闽南语语音合成方法 |
| CN113453072A (zh) * | 2021-06-29 | 2021-09-28 | 王瑶 | 按级别拼合和播放多语言影音文件的方法、系统和介质 |
| CN119724204A (zh) * | 2024-12-23 | 2025-03-28 | 中电信人工智能科技(北京)有限公司 | 时序重复感知惩罚采样方法、装置、电子设备及存储介质 |
Families Citing this family (9)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN1953052B (zh) * | 2005-10-20 | 2010-09-08 | 株式会社东芝 | 训练时长预测模型、时长预测和语音合成的方法及装置 |
| CN101452699A (zh) * | 2007-12-04 | 2009-06-10 | 株式会社东芝 | 韵律自适应及语音合成的方法和装置 |
| CN104021784B (zh) * | 2014-06-19 | 2017-06-06 | 百度在线网络技术(北京)有限公司 | 基于大语料库的语音合成方法和装置 |
| TWI595478B (zh) * | 2016-04-21 | 2017-08-11 | 國立臺北大學 | 可學習不同語言及模仿不同語者說話方式之韻律參數語速正規化器、語速相依韻律模型建立器、可控語速之韻律訊息產生裝置及韻律訊息產生方法 |
| CA3128973A1 (en) | 2019-03-04 | 2020-09-10 | Bhaskar Bhattacharyya | Data compression and communication using machine learning |
| US20230005468A1 (en) * | 2019-11-26 | 2023-01-05 | Nippon Telegraph And Telephone Corporation | Pose estimation model learning apparatus, pose estimation apparatus, methods and programs for the same |
| CN111667816B (zh) * | 2020-06-15 | 2024-01-23 | 北京百度网讯科技有限公司 | 模型训练方法、语音合成方法、装置、设备和存储介质 |
| CN114153968B (zh) * | 2021-11-09 | 2024-08-13 | 浙江大学 | 基于词属性位置关系与贝叶斯的少样本金融文本分类系统 |
| CN117454186B (zh) * | 2023-12-22 | 2024-05-14 | 宁德时代新能源科技股份有限公司 | 模型训练、电池性能预测方法、装置、设备及存储介质 |
Family Cites Families (8)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH0237402A (ja) * | 1988-07-27 | 1990-02-07 | Yamatake Honeywell Co Ltd | パラメータ推定方式 |
| US6064960A (en) * | 1997-12-18 | 2000-05-16 | Apple Computer, Inc. | Method and apparatus for improved duration modeling of phonemes |
| US6810378B2 (en) * | 2001-08-22 | 2004-10-26 | Lucent Technologies Inc. | Method and apparatus for controlling a speech synthesis system to provide multiple styles of speech |
| US7412377B2 (en) * | 2003-12-19 | 2008-08-12 | International Business Machines Corporation | Voice model for speech processing based on ordered average ranks of spectral features |
| CN1953052B (zh) * | 2005-10-20 | 2010-09-08 | 株式会社东芝 | 训练时长预测模型、时长预测和语音合成的方法及装置 |
| CN101051464A (zh) * | 2006-04-06 | 2007-10-10 | 株式会社东芝 | 说话人认证的注册和验证方法及装置 |
| CN101154380B (zh) * | 2006-09-29 | 2011-01-26 | 株式会社东芝 | 说话人认证的注册及验证的方法和装置 |
| CN101465123B (zh) * | 2007-12-20 | 2011-07-06 | 株式会社东芝 | 说话人认证的验证方法和装置以及说话人认证系统 |
-
2006
- 2006-04-06 CN CNA200610073145XA patent/CN101051459A/zh active Pending
-
2007
- 2007-03-28 US US11/692,392 patent/US20070239439A1/en not_active Abandoned
- 2007-04-06 JP JP2007099948A patent/JP2007279744A/ja not_active Ceased
Cited By (11)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN102231276A (zh) * | 2011-06-21 | 2011-11-02 | 北京捷通华声语音技术有限公司 | 一种语音合成单元时长的预测方法及装置 |
| CN103680491A (zh) * | 2012-09-10 | 2014-03-26 | 财团法人交大思源基金会 | 语速相依韵律讯息产生装置及语速相依的阶层式韵律模块 |
| CN103680491B (zh) * | 2012-09-10 | 2016-09-21 | 财团法人交大思源基金会 | 语速相依韵律讯息产生装置及语速相依的阶层式韵律模块 |
| CN104538026A (zh) * | 2015-01-12 | 2015-04-22 | 北京理工大学 | 一种用于参数化语音合成的基频建模方法 |
| CN104538026B (zh) * | 2015-01-12 | 2018-10-23 | 北京理工大学 | 一种用于参数化语音合成的基频建模方法 |
| CN107039034A (zh) * | 2016-02-04 | 2017-08-11 | 科大讯飞股份有限公司 | 一种韵律预测方法及系统 |
| CN105679306A (zh) * | 2016-02-19 | 2016-06-15 | 上海语知义信息技术有限公司 | 语音合成中预测基频帧的方法及系统 |
| CN105679306B (zh) * | 2016-02-19 | 2019-07-09 | 云知声(上海)智能科技有限公司 | 语音合成中预测基频帧的方法及系统 |
| CN109036376A (zh) * | 2018-10-17 | 2018-12-18 | 南京理工大学 | 一种闽南语语音合成方法 |
| CN113453072A (zh) * | 2021-06-29 | 2021-09-28 | 王瑶 | 按级别拼合和播放多语言影音文件的方法、系统和介质 |
| CN119724204A (zh) * | 2024-12-23 | 2025-03-28 | 中电信人工智能科技(北京)有限公司 | 时序重复感知惩罚采样方法、装置、电子设备及存储介质 |
Also Published As
| Publication number | Publication date |
|---|---|
| US20070239439A1 (en) | 2007-10-11 |
| JP2007279744A (ja) | 2007-10-25 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| CN101051459A (zh) | 基频和停顿预测及语音合成的方法和装置 | |
| CN100347741C (zh) | 移动语音合成方法 | |
| CN1160699C (zh) | 语音识别系统 | |
| CN101650942B (zh) | 基于韵律短语的韵律结构生成方法 | |
| CN100524457C (zh) | 文本至语音转换以及调整语料库的装置和方法 | |
| TWI471854B (zh) | 引導式語者調適語音合成的系統與方法及電腦程式產品 | |
| CN1183510C (zh) | 根据基音信息识别声调语言的方法与设备 | |
| CN101271687B (zh) | 字音转换预测以及语音合成的方法和装置 | |
| Narendra et al. | Automatic assessment of intelligibility in speakers with dysarthria from coded telephone speech using glottal features | |
| CN1622195A (zh) | 语音合成方法和语音合成系统 | |
| CN101452699A (zh) | 韵律自适应及语音合成的方法和装置 | |
| CN111326170B (zh) | 联合时频域扩张卷积的耳语音向正常音转换方法及其装置 | |
| CN1953052B (zh) | 训练时长预测模型、时长预测和语音合成的方法及装置 | |
| CN1171592A (zh) | 采用连续密度隐藏式马尔克夫模型的语音识别方法和系统 | |
| CN115910026A (zh) | 一种韵律迁移语音合成方法和系统 | |
| CN1870130A (zh) | 音调模式生成方法及其装置 | |
| Zarazaga et al. | Speaker-independent neural formant synthesis | |
| Zhang et al. | Tcsinger 2: Customizable multilingual zero-shot singing voice synthesis | |
| CN1490786A (zh) | 语音识别置信度评价方法和系统及应用该方法的听写装置 | |
| Li et al. | Diverse and expressive speech prosody prediction with denoising diffusion probabilistic model | |
| TWI503813B (zh) | 可控制語速的韻律訊息產生裝置及語速相依之階層式韻律模組 | |
| CN1841496A (zh) | 测量语速的方法和装置以及录音设备 | |
| Liou et al. | Estimation of hidden speaking rate | |
| JP4684770B2 (ja) | 韻律生成装置及び音声合成装置 | |
| Sun et al. | Energy-based models for speech synthesis |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| C06 | Publication | ||
| PB01 | Publication | ||
| C10 | Entry into substantive examination | ||
| SE01 | Entry into force of request for substantive examination | ||
| AD01 | Patent right deemed abandoned |
Effective date of abandoning: 20071010 |
|
| C20 | Patent right or utility model deemed to be abandoned or is abandoned |