CN115798454A - 音码标记声纹拼接编码方法及其音码 - Google Patents

音码标记声纹拼接编码方法及其音码 Download PDF

Info

Publication number
CN115798454A
CN115798454A CN202211439181.9A CN202211439181A CN115798454A CN 115798454 A CN115798454 A CN 115798454A CN 202211439181 A CN202211439181 A CN 202211439181A CN 115798454 A CN115798454 A CN 115798454A
Authority
CN
China
Prior art keywords
sound
key
keyboard
vowel
code
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211439181.9A
Other languages
English (en)
Inventor
张进
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Tianli Network Technology Co ltd
Original Assignee
Shanghai Tianli Network Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Tianli Network Technology Co ltd filed Critical Shanghai Tianli Network Technology Co ltd
Priority to CN202211439181.9A priority Critical patent/CN115798454A/zh
Publication of CN115798454A publication Critical patent/CN115798454A/zh
Pending legal-status Critical Current

Links

Images

Abstract

音码标记声纹拼接编码方法及其音码涉及软件领域。音码标记声纹拼接编码方法,包括音码识别编码方法、语音合成文本标注音码方法,所述音码识别编码方法包括如下步骤:步骤1)、收集某人的语音素材;步骤2)、识别语音素材中的汉字、数字、标点、音高、音长;步骤3)、将汉字、数字、标点、音高、音长生成为音码,并将汉字、数字、标点关联音高、音长后生成为对应音码的音频文件;步骤4)、根据已生成的音码和音频文件,建立语音库。本发明在建立语音库时,通过六键编码的标注,这样每一个汉字都可以保存和使用高达112,500种以上不同的发音。

Description

音码标记声纹拼接编码方法及其音码
技术领域
本发明涉及软件领域,具体涉及语音合成技术。
背景技术
目前市场上主流的语音合成系统是基于文字转语音的技术(称为TTS,从文本到语音Text To Speech),需要先准备好一段文字,然后将这一段文字转换为语音,如科大讯飞的语音合成技术。由于受文字信息量的限制,无法表达文字原创者,即作者的本意,比如语气、语调、音长、音高等。换句话说,如果对语音合成的某些字词感觉不满意,想换个更合适的语音,主流的语音合成系统目前无法实现这个功能。
本专利申请人在先申请的专利,申请号为202010880919.X,名称为《语音合成方法及装置》的专利,提供了一种三键音码编码技术,增加了音调码,使语音更加丰富,但在需要播报一份新闻稿或者是朗读一本书时,三键音码编码方案无法满足丰富的语音表达需求。
发明内容
本发明的目的在于提供一种音码标记声纹拼接法编码方法,以解决上述技术问题。
本发明的目的还在于提供一种音码标记声纹拼接编码方法用音码。
本发明所解决的技术问题可以采用以下技术方案来实现:
音码标记声纹拼接编码方法,包括音码识别编码方法,所述音码识别编码方法包括如下步骤:
步骤1)、收集某人的语音素材;
步骤2)、识别语音素材中的汉字、数字、标点、音高、音长;
步骤3)、将汉字、数字、标点、音高、音长生成为音码,并将汉字、数字、标点关联音高、音长后生成为对应音码的音频文件;
步骤4)、根据已生成的音码和音频文件,建立语音库。
音码标记声纹拼接编码方法,还包括语音合成文本标注音码方法,所述语音合成文本标注音码方法是根据所选择的音码,调取该音码所对应的音频文件。
在步骤1)中,优选在同一录音设施环境下获得的语音素材。
在步骤2)中,还可以包括识别语音素材中的汉字、数字的位置。可以通过人工听播方式,校对和修正错误或者不准确的汉字、数字、标点、音高、音长、位置。
当步骤2)识别汉字、数字、标点的位置时,步骤3)将汉字、数字、标点的位置也生成为音码。
此外,音码标记声纹拼接编码方法,还可以根据一部新书的文本文件,自动匹配语音库的音码并合成相应的语音。还可以通过人工听播合成语音,对于没有充分表达作者本意的发音进行修正,对个别字词标注音码,调取更合适的语音,从而改变发音方式。
音码标记声纹拼接编码方法,对于新书中常出现的新词,采用造词系统产生大量的新词发音,替换自动合成的不自然的发音。音码标记声纹拼接编码方法,可以人通过工智能自动学习人工修改标注音码和造词。
音码标记声纹拼接编码方法用音码,其特征在于:包括标注声母的第一音码,所述第一音码包括声母“ch”、声母“zh”、声母“sh”,其中声母“ch”关联键盘上的U键,声母“zh”关联键盘上的I键,声母“sh”关联键盘上的V键。
音码标记声纹拼接编码方法用音码,还包括标注韵母的第二音码,所述第二音码包括韵母“in”、韵母“ou”、韵母“ing”、韵母“ong”、韵母“iong”、韵母“ue”、韵母“ve”、韵母“uai”、韵母“uo”、韵母“ie”、韵母“iu”、韵母“ang”、韵母“ao”、韵母“eng”、韵母“ei”、韵母“ia”、韵母“ua”、韵母“ian”、韵母“iang”、韵母“uang”、韵母“un”、韵母“uan”、韵母“an”、韵母“ui”、韵母“ai”、韵母“en”、韵母“iao”,其中韵母“in”关联键盘上的Q键,韵母“ou”关联键盘上的W键,韵母“ing”关联键盘上的R键,韵母“ong”、韵母“iong”关联键盘上的T键,韵母“ue”、韵母“ve”、韵母“uai”关联键盘上的Y键,韵母“uo”关联键盘上的O键,韵母“ie”关联键盘上的P键,韵母“iu”关联键盘上的S键,韵母“ang”关联键盘上的D键,韵母“ao”关联键盘上的F键,韵母“eng”关联键盘上的G键,韵母“ei”关联键盘上的H键,韵母“ia”、韵母“ua”关联键盘上的J键,韵母“ian”关联键盘上的K键,韵母“iang”、韵母“uang”关联键盘上的L键,韵母“un”关联键盘上的A键,韵母“uan”关联键盘上的X键,韵母“an”关联键盘上的C键,韵母“ui”关联键盘上的V键,韵母“ai”关联键盘上的B键,韵母“en”关联键盘上的N键,韵母“iao”关联键盘上的M键。
音码标记声纹拼接编码方法用音码,还包括标注声调的第三音码,所述第三音码有五个区,分别是一声区、二声区、三声区、四声区、轻声区,每个区都包括一声“ˉ”、二声“ˊ”、三声“ˇ”、四声“ˋ”、轻声“˙”,其中,一声区的一声“ˉ”关联键盘上的U键、二声“ˊ”关联键盘上的I键、三声“ˇ”关联键盘上的O键、四声“ˋ”关联键盘上的P键、轻声“˙”关联键盘上的Y键;二声区的一声“ˉ”关联键盘上的J键、二声“ˊ”关联键盘上的K键、三声“ˇ”关联键盘上的L键、四声“ˋ”关联键盘上的M键、轻声“˙”关联键盘上的H键;三声区的一声“ˉ”关联键盘上的R键、二声“ˊ”关联键盘上的E键、三声“ˇ”关联键盘上的W键、四声“ˋ”关联键盘上的Q键、轻声“˙”关联键盘上的T键;四声区的一声“ˉ”关联键盘上的F键、二声“ˊ”关联键盘上的D键、三声“ˇ”关联键盘上的S键、四声“ˋ”关联键盘上的A键、轻声“˙”关联键盘上的G键;轻声区的一声“ˉ”关联键盘上的V键、二声“ˊ”关联键盘上的C键、三声“ˇ”关联键盘上的X键、四声“ˋ”关联键盘上的Z键、轻声“˙”关联键盘上的B键。
所述第三音码还包括句首区,所述句首区的一声“ˉ”关联键盘上的数字1键、二声“ˊ”关联键盘上的数字2键、三声“ˇ”关联键盘上的数字3键、四声“ˋ”关联键盘上的数字4键、轻声“˙”关联键盘上的数字0键。
音码标记声纹拼接编码方法用音码,还包括标注前一个音的性质的第四音码,前一个音如果是汉字,就标注这个汉字的韵母;如果是数字,就直接标注该数字;如果是标点符号就直接标注该标点符号。常用的标点为:,。?!、:等。
音码标记声纹拼接编码方法用音码,还包括标注后一个音的性质的第五音码,后一个音如果是汉字,就标注这个汉字的韵母;如果是数字,就直接标注该数字;如果是标点符号就直接标注该标点符号。常用的标点为:,。?!、:等。
音码标记声纹拼接编码方法用音码,还包括标注音高和音长的第六音码。所述第六音码有五个区,分别是超低音区、低音区、中音区、高音区、超高音区,每个区都包括超短音“-2”、短音“-1”、中音“0”、长音“+1”、超长音“+2”,其中,超低音区的超短音“-2”关联键盘上的Z键、短音“-1”关联键盘上的X键、中音“0”关联键盘上的C键、长音“+1”关联键盘上的V键、超长音“+2”关联键盘上的B键;低音区的超短音“-2”关联键盘上的H键、短音“-1”关联键盘上的J键、中音“0”关联键盘上的K键、长音“+1”关联键盘上的L键、超长音“+2”关联键盘上的M键;中音区的超短音“-2”关联键盘上的A键、短音“-1”关联键盘上的S键、中音“0”关联键盘上的D键、长音“+1”关联键盘上的F键、超长音“+2”关联键盘上的G键;高音区的超短音“-2”关联键盘上的Q键、短音“-1”关联键盘上的W键、中音“0”关联键盘上的E键、长音“+1”关联键盘上的R键、超长音“+2”关联键盘上的T键;超高音区的超短音“-2”关联键盘上的Y键、短音“-1”关联键盘上的U键、中音“0”关联键盘上的I键、长音“+1”关联键盘上的O键、超长音“+2”关联键盘上的P键。
有益效果:在主流的语音合成系统中,对于很难组合成词组的,但又常用的单字处理上,自然度都不高,比如数字(1、2、3)、连词(和、跟)等。因为这些单字音在实际使用时,常常会和上下语音形成连读,却和其它字没有形成常用词组,所以无法以词组形式建语音库和进行语音合成,基本上都是单独使用,和上下文形成不了连读,听起来就是不自然。本发明在建立语音库时,通过六键编码的标注,这样每一个汉字都可以保存和使用高达112,500种以上不同的发音(第三键的5种*第四键的30种以上*第五键的30种以上*第六键的25种=5*30*30*25=112,500),足可以将每个字的不同发音充分表达出来。特别是本发明标注了这些字词的前面一个发音的韵母,后面一个发音的声母;在使用时,仍然调取相同的前韵母、后声母,可以达到较好的自然度。
附图说明
图1为第一音码在键盘上的位置布局图;
图2为第二音码在键盘上的位置布局图;
图3为第三音码在键盘上的位置布局图;
图4为第六音码在键盘上的位置布局图。
具体实施方式
为了使本发明实现的技术手段、创作特征、达成目的与功效易于明白了解,下面结合具体图示进一步阐述本发明。
音码标记声纹拼接编码方法,包括音码识别编码方法、语音合成文本标注音码方法。
音码识别编码方法包括如下步骤:
步骤1)、收集某人的语音素材;
步骤2)、识别语音素材中的汉字、数字、标点、音高、音长;
步骤3)、将汉字、数字、标点、音高、音长生成为音码,并将汉字、数字、标点关联音高、音长后生成为对应音码的音频文件;
步骤4)、根据已生成的音码和音频文件,建立语音库。
在步骤1)中,优选在同一录音设施环境下获得的语音素材。在步骤2)中,还可以包括识别语音素材中的汉字、数字、标点的位置。可以通过人工听播方式,校对和修正错误或者不准确的汉字、数字、标点、音高、音长、位置。
音码标记声纹拼接编码方法,还包括语音合成文本标注音码方法,所述语音合成文本标注音码方法是根据所选择的音码,调取该音码所对应的音频文件。
当步骤2)识别汉字、数字、标点的位置时,步骤3)将汉字、数字的位置也生成为音码。
此外,音码标记声纹拼接编码方法,还可以根据一部新书的文本文件,自动匹配语音库的音码并合成相应的语音。还可以通过人工听播合成语音,对于没有充分表达作者本意的发音进行修正,对个别字词标注音码,从而改变发音方式。
音码标记声纹拼接编码方法,对于新书中常出现的新词,采用造词系统产生大量的新词发音,替换自动合成的不自然的发音。音码标记声纹拼接编码方法,可以人通过工智能自动学习人工修改标注音码和造词。
音码标记声纹拼接编码方法用音码,包括标注声母的第一音码,第一音码包括声母“ch”、声母“zh”、声母“sh”,其中声母“ch”关联键盘上的U键,声母“zh”关联键盘上的I键,声母“sh”关联键盘上的V键,如图1所示。
音码标记声纹拼接编码方法用音码,还包括标注韵母的第二音码,第二音码包括韵母“in”、韵母“ou”、韵母“ing”、韵母“ong”、韵母“iong”、韵母“ue”、韵母“ve”、韵母“uai”、韵母“uo”、韵母“ie”、韵母“iu”、韵母“ang”、韵母“ao”、韵母“eng”、韵母“ei”、韵母“ia”、韵母“ua”、韵母“ian”、韵母“iang”、韵母“uang”、韵母“un”、韵母“uan”、韵母“an”、韵母“ui”、韵母“ai”、韵母“en”、韵母“iao”,其中韵母“in”关联键盘上的Q键,韵母“ou”关联键盘上的W键,韵母“ing”关联键盘上的R键,韵母“ong”、韵母“iong”关联键盘上的T键,韵母“ue”、韵母“ve”、韵母“uai”关联键盘上的Y键,韵母“uo”关联键盘上的O键,韵母“ie”关联键盘上的P键,韵母“iu”关联键盘上的S键,韵母“ang”关联键盘上的D键,韵母“ao”关联键盘上的F键,韵母“eng”关联键盘上的G键,韵母“ei”关联键盘上的H键,韵母“ia”、韵母“ua”关联键盘上的J键,韵母“ian”关联键盘上的K键,韵母“iang”、韵母“uang”关联键盘上的L键,韵母“un”关联键盘上的A键,韵母“uan”关联键盘上的X键,韵母“an”关联键盘上的C键,韵母“ui”关联键盘上的V键,韵母“ai”关联键盘上的B键,韵母“en”关联键盘上的N键,韵母“iao”关联键盘上的M键,如图2所示。本发明对位置对位置进行了优化,将K键代表的两个韵母(ian/uai)中的一个韵母(uai)分配给Y键(ue/ve),这样Y键就包含了三个韵母(ue/ve/uai),经过验证,不会产生冲突问题。
音码标记声纹拼接编码方法用音码,还包括标注声调的第三音码。参照图3,第三音码有五个区,分别是一声区、二声区、三声区、四声区、轻声区,每个区都包括一声“ˉ”、二声“ˊ”、三声“ˇ”、四声“ˋ”、轻声“˙”,其中,一声区的一声“ˉ”关联键盘上的U键、二声“ˊ”关联键盘上的I键、三声“ˇ”关联键盘上的O键、四声“ˋ”关联键盘上的P键、轻声“˙”关联键盘上的Y键;二声区的一声“ˉ”关联键盘上的J键、二声“ˊ”关联键盘上的K键、三声“ˇ”关联键盘上的L键、四声“ˋ”关联键盘上的M键、轻声“˙”关联键盘上的H键;三声区的一声“ˉ”关联键盘上的R键、二声“ˊ”关联键盘上的E键、三声“ˇ”关联键盘上的W键、四声“ˋ”关联键盘上的Q键、轻声“˙”关联键盘上的T键;四声区的一声“ˉ”关联键盘上的F键、二声“ˊ”关联键盘上的D键、三声“ˇ”关联键盘上的S键、四声“ˋ”关联键盘上的A键、轻声“˙”关联键盘上的G键;轻声区的一声“ˉ”关联键盘上的V键、二声“ˊ”关联键盘上的C键、三声“ˇ”关联键盘上的X键、四声“ˋ”关联键盘上的Z键、轻声“˙”关联键盘上的B键。第三音码还包括句首区,句首区的一声“ˉ”关联键盘上的数字1键、二声“ˊ”关联键盘上的数字2键、三声“ˇ”关联键盘上的数字3键、四声“ˋ”关联键盘上的数字4键、轻声“˙”关联键盘上的数字0键。
音码标记声纹拼接编码方法用音码,还包括标注前一个音的性质的第四音码,前一个音如果是汉字,就标注这个汉字的韵母;如果是数字,就直接标注该数字;如果是标点符号就直接标注该标点符号。常用的标点为:,。?!、:等。音码标记声纹拼接编码方法用音码,还包括标注后一个音的性质的第五音码,后一个音如果是汉字,就标注这个汉字的韵母;如果是数字,就直接标注该数字;如果是标点符号就直接标注该标点符号。常用的标点为:,。?!、:等。单字音码的第四键和第五键编码方案让每个单字音的语音库变得更为丰富,在语音合成时也有更丰富的选择。同时记录前后音的关系,也有利于提高造新词的语音自然度。
音码标记声纹拼接编码方法用音码,还包括标注音高和音长的第六音码。参照图4,第六音码有五个区,分别是超低音区、低音区、中音区、高音区、超高音区,每个区都包括超短音“-2”、短音“-1”、中音“0”、长音“+1”、超长音“+2”,其中,超低音区的超短音“-2”关联键盘上的Z键、短音“-1”关联键盘上的X键、中音“0”关联键盘上的C键、长音“+1”关联键盘上的V键、超长音“+2”关联键盘上的B键;低音区的超短音“-2”关联键盘上的H键、短音“-1”关联键盘上的J键、中音“0”关联键盘上的K键、长音“+1”关联键盘上的L键、超长音“+2”关联键盘上的M键;中音区的超短音“-2”关联键盘上的A键、短音“-1”关联键盘上的S键、中音“0”关联键盘上的D键、长音“+1”关联键盘上的F键、超长音“+2”关联键盘上的G键;高音区的超短音“-2”关联键盘上的Q键、短音“-1”关联键盘上的W键、中音“0”关联键盘上的E键、长音“+1”关联键盘上的R键、超长音“+2”关联键盘上的T键;超高音区的超短音“-2”关联键盘上的Y键、短音“-1”关联键盘上的U键、中音“0”关联键盘上的I键、长音“+1”关联键盘上的O键、超长音“+2”关联键盘上的P键。
具体实施例
举例,“我是中国人。”这句话的“我”字,可以标注成音码为:wo3.v(a-z),其中前两个字母wo代表该字的声母和韵母;3代表句首第三声;.代表句首;v代表后一个字的声母;(a-z)是机器根据第六键的编码规则,以及实际发音的音高和音长确定的字母。
“是”字,可以标注音码为:viqoi(a-z),其中vi是该字的声母和韵母;q是前一个字的第三声和本字的第四声决定的字母;o是前一个字的韵母;i是后一个字的声母;(a-z)是机器根据第六键的编码规则,以及实际发音的音高和音长确定的字母。
该句话的中间两个字就不再举例,最后再举句尾的字“人”,可以标注音码为:rnko.(a-z)。其中,rn是该字的声母和韵母;k是前一个字的第三声和本字的第四声决定的字母;o是前一个字的韵母;.是句尾的标点符号;(a-z)是机器根据第六键的编码规则,以及实际发音的音高和音长确定的字母。
语音识别音码对于双字词和多字词的编码方案如下:
双字词:第一个字的声母+韵母+第二个字的声母+韵母+第一个字的声调与第二个字的声调排列组合(第三键规则)+前一个音的韵母+后一个音的声母+音高值与音长的排列组合(a-z)。仍然用上文的那句话“我是中国人。”举例,有三个常用双字词:“我是”,“中国”,“国人”。编码如下:
“我是”:woviq.i(a-z)。其中wo是第一个字的声母和韵母;vi是第二个字的声母和韵母;q是第一个字的第三声与第二个字的第四声确定的字母;.是代表句首;i代表后面跟着的字的声母;(a-z)25个字母(N除外)是由该双字词的音高和音长决定的字母。
“中国”:itgoiir(a-z)。其中it是第一个字的声母和韵母;go是第二个字的声母和韵母;第五个字母i是第一个字的第三声与第二个字的第四声确定的字母;第六个字母i是前一字的韵母;r代表后面跟着的字的声母;(a-z)25个字母(N除外)是由该双字词的音高和音长决定的字母。
“国人。”:gornkz.(a-z)。其中go是第一个字的声母和韵母;rn是第二个字的声母和韵母;k是第一个字的第三声与第二个字的第四声确定的字母;z是前一字的韵母;.代表着是句尾的句号;(a-z)25个字母(N除外)是由该双字词的音高和音长决定的字母。
三字词:第一个字的声母+韵母+第二个字的声母+韵母+第三个字的声母+韵母+前一个音的韵母+后一个音的声母+音高值与音长的排列组合(a-z)。注意,这里没有标三个字之间的声调,是因为双字词如果不标声调,很容易混淆,但三字词不标声调,不容易产生混淆。仍然用上文的那句话“我是中国人。”举例,有一个常用三字词:“中国人”。编码如下:
itgorni.(a-z)。其中it是第一个字的声母和韵母;go是第二个字的声母和韵母;rn是第三个字的声母和韵母;i是前一字的韵母;.代表着是句尾的句号;(a-z)25个字母(N除外)是由该双字词的音高和音长决定的字母。
三字词以上词的编码规则同三字词。
采用该音码标注方法能够实现机器自动识别语音并标注成音码。而在使用时,即合成语音时,机器也会根据前后句、前后音之间的关系,自动匹配并调用合适的语音,如果合成的某一语音不是作者想表达的意思,也只需要通过某一字词音码的最后一码(a-z,25个字母,n除外)标注,从而改变机器默认发音,进行人工干预,以更合适的发音替代。
以上显示和描述了本发明的基本原理和主要特征以及本发明的优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是说明本发明的原理,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求书及其等效物界定。

Claims (10)

1.音码标记声纹拼接编码方法,包括音码识别编码方法,音码识别编码方法包括如下步骤:
步骤1)、收集某人的语音素材;
步骤2)、识别语音素材中的汉字、数字、标点、音高、音长;
步骤3)、将汉字、数字、标点、音高、音长生成为音码,并将汉字、数字、标点关联音高、音长后生成为对应音码的音频文件;
步骤4)、根据已生成的音码和音频文件,建立语音库。
2.根据权利要求1所述的音码标记声纹拼接编码方法,其特征在于:在步骤1)中,在同一录音设施环境下获得的语音素材。
3.根据权利要求1所述的音码标记声纹拼接编码方法,其特征在于:还包括语音合成文本标注音码方法,所述语音合成文本标注音码方法是根据所选择的音码,调取该音码所对应的音频文件。
4.根据权利要求3所述的音码标记声纹拼接编码方法,其特征在于:在步骤2)中,包括识别语音素材中的汉字、数字的位置。
5.根据权利要求4所述的音码标记声纹拼接编码方法,其特征在于:步骤3)将汉字、数字的位置也生成为音码。
6.音码标记声纹拼接编码方法用音码,其特征在于:包括标注声母的第一音码,所述第一音码包括声母“ch”、声母“zh”、声母“sh”,其中声母“ch”关联键盘上的U键,声母“zh”关联键盘上的I键,声母“sh”关联键盘上的V键;
还包括标注韵母的第二音码,所述第二音码包括韵母“in”、韵母“ou”、韵母“ing”、韵母“ong”、韵母“iong”、韵母“ue”、韵母“ve”、韵母“uai”、韵母“uo”、韵母“ie”、韵母“iu”、韵母“ang”、韵母“ao”、韵母“eng”、韵母“ei”、韵母“ia”、韵母“ua”、韵母“ian”、韵母“iang”、韵母“uang”、韵母“un”、韵母“uan”、韵母“an”、韵母“ui”、韵母“ai”、韵母“en”、韵母“iao”,其中韵母“in”关联键盘上的Q键,韵母“ou”关联键盘上的W键,韵母“ing”关联键盘上的R键,韵母“ong”、韵母“iong”关联键盘上的T键,韵母“ue”、韵母“ve”、韵母“uai”关联键盘上的Y键,韵母“uo”关联键盘上的O键,韵母“ie”关联键盘上的P键,韵母“iu”关联键盘上的S键,韵母“ang”关联键盘上的D键,韵母“ao”关联键盘上的F键,韵母“eng”关联键盘上的G键,韵母“ei”关联键盘上的H键,韵母“ia”、韵母“ua”关联键盘上的J键,韵母“ian”关联键盘上的K键,韵母“iang”、韵母“uang”关联键盘上的L键,韵母“un”关联键盘上的A键,韵母“uan”关联键盘上的X键,韵母“an”关联键盘上的C键,韵母“ui”关联键盘上的V键,韵母“ai”关联键盘上的B键,韵母“en”关联键盘上的N键,韵母“iao”关联键盘上的M键。
7.根据权利要求6所述的音码标记声纹拼接编码方法用音码,其特征在于:还包括标注声调的第三音码,所述第三音码有五个区,分别是一声区、二声区、三声区、四声区、轻声区,每个区都包括一声“ˉ”、二声“ˊ”、三声“ˇ”、四声“ˋ”、轻声“˙”,其中,一声区的一声“ˉ”关联键盘上的U键、二声“ˊ”关联键盘上的I键、三声“ˇ”关联键盘上的O键、四声“ˋ”关联键盘上的P键、轻声“˙”关联键盘上的Y键;二声区的一声“ˉ”关联键盘上的J键、二声“ˊ”关联键盘上的K键、三声“ˇ”关联键盘上的L键、四声“ˋ”关联键盘上的M键、轻声“˙”关联键盘上的H键;三声区的一声“ˉ”关联键盘上的R键、二声“ˊ”关联键盘上的E键、三声“ˇ”关联键盘上的W键、四声“ˋ”关联键盘上的Q键、轻声“˙”关联键盘上的T键;四声区的一声“ˉ”关联键盘上的F键、二声“ˊ”关联键盘上的D键、三声“ˇ”关联键盘上的S键、四声“ˋ”关联键盘上的A键、轻声“˙”关联键盘上的G键;轻声区的一声“ˉ”关联键盘上的V键、二声“ˊ”关联键盘上的C键、三声“ˇ”关联键盘上的X键、四声“ˋ”关联键盘上的Z键、轻声“˙”关联键盘上的B键;
所述第三音码还包括句首区,所述句首区的一声“ˉ”关联键盘上的数字1键、二声“ˊ”关联键盘上的数字2键、三声“ˇ”关联键盘上的数字3键、四声“ˋ”关联键盘上的数字4键、轻声“˙”关联键盘上的数字0键。
8.根据权利要求6所述的音码标记声纹拼接编码方法用音码,其特征在于:还包括标注前一个音的性质的第四音码,前一个音如果是汉字,就标注这个汉字的韵母;如果是数字,就直接标注该数字;如果是标点符号就直接标注该标点符号。
9.根据权利要求6所述的音码标记声纹拼接编码方法用音码,其特征在于:还包括标注后一个音的性质的第五音码,后一个音如果是汉字,就标注这个汉字的韵母;如果是数字,就直接标注该数字;如果是标点符号就直接标注该标点符号。
10.根据权利要求6所述的音码标记声纹拼接编码方法用音码,其特征在于:还包括标注音高和音长的第六音码,所述第六音码有五个区,分别是超低音区、低音区、中音区、高音区、超高音区,每个区都包括超短音“-2”、短音“-1”、中音“0”、长音“+1”、超长音“+2”,其中,超低音区的超短音“-2”关联键盘上的Z键、短音“-1”关联键盘上的X键、中音“0”关联键盘上的C键、长音“+1”关联键盘上的V键、超长音“+2”关联键盘上的B键;低音区的超短音“-2”关联键盘上的H键、短音“-1”关联键盘上的J键、中音“0”关联键盘上的K键、长音“+1”关联键盘上的L键、超长音“+2”关联键盘上的M键;中音区的超短音“-2”关联键盘上的A键、短音“-1”关联键盘上的S键、中音“0”关联键盘上的D键、长音“+1”关联键盘上的F键、超长音“+2”关联键盘上的G键;高音区的超短音“-2”关联键盘上的Q键、短音“-1”关联键盘上的W键、中音“0”关联键盘上的E键、长音“+1”关联键盘上的R键、超长音“+2”关联键盘上的T键;超高音区的超短音“-2”关联键盘上的Y键、短音“-1”关联键盘上的U键、中音“0”关联键盘上的I键、长音“+1”关联键盘上的O键、超长音“+2”关联键盘上的P键。
CN202211439181.9A 2022-11-17 2022-11-17 音码标记声纹拼接编码方法及其音码 Pending CN115798454A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211439181.9A CN115798454A (zh) 2022-11-17 2022-11-17 音码标记声纹拼接编码方法及其音码

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211439181.9A CN115798454A (zh) 2022-11-17 2022-11-17 音码标记声纹拼接编码方法及其音码

Publications (1)

Publication Number Publication Date
CN115798454A true CN115798454A (zh) 2023-03-14

Family

ID=85438379

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211439181.9A Pending CN115798454A (zh) 2022-11-17 2022-11-17 音码标记声纹拼接编码方法及其音码

Country Status (1)

Country Link
CN (1) CN115798454A (zh)

Similar Documents

Publication Publication Date Title
JP3142803B2 (ja) テキストを音声に変換するシンセサイザ
EP1143415B1 (en) Generation of multiple proper name pronunciations for speech recognition
US6233553B1 (en) Method and system for automatically determining phonetic transcriptions associated with spelled words
US6853971B2 (en) Two-way speech recognition and dialect system
Lee et al. Spoken language resources for Cantonese speech processing
KR100509797B1 (ko) 결정 트리에 의한 스펠형 문자의 복합 발음 발생과 스코어를위한 장치 및 방법
KR20060043825A (ko) 문자 대 음성 변환을 위한 단어 분절 방법
JP2006039120A (ja) 対話装置および対話方法、並びにプログラムおよび記録媒体
US8155963B2 (en) Autonomous system and method for creating readable scripts for concatenative text-to-speech synthesis (TTS) corpora
CN114746935A (zh) 基于注意力的时钟层次变分编码器
Van Bael et al. Automatic phonetic transcription of large speech corpora
Stöber et al. Speech synthesis using multilevel selection and concatenation of units from large speech corpora
KR20180025559A (ko) 발음 사전 학습 방법 및 장치
Demuynck et al. Automatic generation of phonetic transcriptions for large speech corpora.
KR20000071227A (ko) 시각적으로 손상된 사용자에게 다중 바이트 문자의 청각적출력 방법 및 시스템
CN115798454A (zh) 音码标记声纹拼接编码方法及其音码
Ngugi et al. Swahili text-to-speech system
Sečujski et al. An overview of the AlfaNum text-to-speech synthesis system
JPH10269204A (ja) 中国語文書自動校正方法及びその装置
Kominek Tts from zero: Building synthetic voices for new languages
Akinwonmi Development of a prosodic read speech syllabic corpus of the Yoruba language
Dijkstra et al. Frisian TTS, an example of bootstrapping TTS for minority languages
Kato et al. Multilingualization of Speech Processing
Kaur et al. BUILDING AText-TO-SPEECH SYSTEM FOR PUNJABI LANGUAGE
JPH096378A (ja) テキスト音声変換装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination