CN104239579A - 构建多语言音标数据库的方法、多语言注音的方法及装置 - Google Patents

构建多语言音标数据库的方法、多语言注音的方法及装置 Download PDF

Info

Publication number
CN104239579A
CN104239579A CN201410535621.XA CN201410535621A CN104239579A CN 104239579 A CN104239579 A CN 104239579A CN 201410535621 A CN201410535621 A CN 201410535621A CN 104239579 A CN104239579 A CN 104239579A
Authority
CN
China
Prior art keywords
phonetic
phonetic symbol
chinese
notation
pronunciation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201410535621.XA
Other languages
English (en)
Other versions
CN104239579B (zh
Inventor
鲁冠军
马方旭
宫宸
Original Assignee
BEIJING GENERAL PINYIN Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by BEIJING GENERAL PINYIN Inc filed Critical BEIJING GENERAL PINYIN Inc
Priority to CN201410535621.XA priority Critical patent/CN104239579B/zh
Publication of CN104239579A publication Critical patent/CN104239579A/zh
Application granted granted Critical
Publication of CN104239579B publication Critical patent/CN104239579B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/68Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/683Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content

Abstract

本发明公开了一种构建多语言音标数据库的方法,多语言注音方法及多语言语音合成装置,多语言注音的方法(国际拼音-GP)包括:根据汉语拼音声韵调理论构建基础音标数据库;获取汉语以外的至少一种外语的标准发音的音节;针对所述外语的每一个音节,识别出该音节的元音/辅音/声调;对于识别出的每一个元音/辅音,若其与基础音标数据库中的汉语拼音的发音相同,则确定其音标为共用音标;若其与基础音标数据库中的任一汉语拼音的发音均不同,则确定其音标为非共用音标;将共用音标采用与其发音相同的汉语拼音进行替代,并将非共用音标以预设方式加入基础音标数据库中,以形成扩展音标数据库,利用扩展音标数据库对所述外语进行注音。

Description

构建多语言音标数据库的方法、多语言注音的方法及装置
技术领域
本发明涉及语音处理领域,具体而言,涉及一种基于汉语拼音构建多语言音标数据库的方法、一种多语言注音方法和一种多语言语音合成装置。
背景技术
语言学习一直是一个重要的领域,通常,学习者受到语言环境的影响,学习语言环境相关的语言比较快,如母语。但,当语言环境无法有效的帮助学习者学习语言的时候,则会导致学习者无法有效的认知和读出某一种语言中的词语、或者字。
应对于对词语或者字的朗读问题,大部分语言配置了相应的音标,来帮助学习者来认读字和词。音标如英文音标,中文拼音等。随着需要学习的语言增加,学习者需要针对每一种语言单独的学习一种与该语言相对应的音标,并且,虽然每种语言是不同,但每种语言发音的基础单元(音标,或拼音)却有着部分相似的特征,也就是不同语言的音标符号相同,但发音不同;或者是不同语言的音标发音相同,但符号不同。这样,会导致学习者在进行音标的认读时造成混淆,大大降低学习效率和学习的准确性。如汉字中,拼音的声母和韵母有一些是与英文音标中的元音音标,或辅音音标的发音是相同的,但其表达方式却是不相同的。而且,当待学习的语言增加时,符号相同,发音不同和发音相同,符号不同的音标会越来越多,这样会加大学习者的学习难度。
综上所述,现有的每种语言的音标没有相通性,无法在学习一种语言音标的基础上,在学习另一种语言的音标。
发明内容
本发明的目的在于提供一种基于汉语拼音构建多语言音标数据库的方法、一种多语言注音方法和一种多语言语音合成装置,以解决上述的问题。
在本发明的实施例中提供了一种基于汉语拼音构建多语言音标数据库的方法,包括:
根据汉语拼音构建基础音标数据库;
获取汉语以外的至少一种外语的标准发音的音节;
针对外语的每一个音节,识别出该音节的每一个元音和辅音;
对于识别出的每一个元音或辅音,若其与基础音标数据库中的汉语拼音的发音相同,则确定其音标为共用音标;若其与基础音标数据库中的任一汉语拼音的发音均不同,则确定其音标为非共用音标;
将共用音标采用与其发音相同的汉语拼音进行替代,并将非共用音标进行预设处理后加入基础音标数据库中,以形成扩展音标数据库。
优选的,包括:将非共用音标进行预设处理后加入基础音标数据库中,包括:
对于每个非共用音标,判断其发音与基础音标数据库中的汉语拼音的发音的相似度是否满足预设条件,若是,则将其替代为发音相似度满足预设条件的汉语拼音;否则,直接将其加入基础音标数据库中。
本发明实施例还提供了一种多语言注音方法,包括基于汉语拼音构建多语言音标数据库的方法,还包括:
利用扩展音标数据库对外语进行注音。
优选的,利用扩展音标数据库对外语进行注音,包括:
获取外语的待注音单元;其中,待注音单元为待注音的单词或句子;
针对待注音单元的每个音节,从扩展音标数据库中查找其音标,并确定其声调;
根据待注音单元的每个音节的音标及声调,对待注音单元进行注音。
优选的,声调包括基本声调和合成声调,基本声调包括:高调、低调、升调和降调,合成声调包括基本声调合成的声调;其中,高调对应汉语拼音中的一声,低调对应汉语拼音中的轻声,升调对应汉语拼音中的二声,降调对应汉语拼音中的四声。
优选的,利用扩展音标数据库对外语进行注音,包括:
按照汉语拼音的声韵调顺序对外语进行注音。
优选的,至少一种外语包括英语;
利用扩展音标数据库对英语和德语进行注音,包括:
将待注音的英语,德语单元中的重音转化为高调或降调,轻音转化为低调。
优选的,利用扩展音标数据库对外语进行注音,包括:
根据扩展音标数据库中的辅音音标,生成待注音单元的辅音音标或辅音串音标。
本发明实施例另提供了一种多语言语音合成装置,包括:采用基于汉语拼音构建多语言音标数据库的方法所构建的扩展音标数据库,还包括:
构建模块,用于针对汉语及至少一种外语的每个音节,根据扩展音标数据库确定其音标,根据音节的音标和声调,形成带调音节,针对每一个带调音节,采集相应的标准发音以形成语音数据库,语音数据库是针对每个带调音节的,可能的组合包括带调的单个元音;带调的单个辅音;带调的辅音元音组合;
查询模块,用于获取待合成的多语言单元的每个音节,并查询语音数据库以获取该音节的语音;其中多语言单元包括以下中的一种或多种:汉语、至少一种外语;
播放模块,用于将获取的多语言单元的语音进行播放。
优选的,标准发音为音节的音标和声调组合的发音。
本发明提供的技术方案,基于汉语拼音构建多语言音标数据库,以实现多语音的注音及合成。本发明的技术方法,基于同一数据库对多语言进行注音,能够提高多语言注音的效率,也就能够相应提高多语言语音合成的效率;另外,采用汉语拼音的声韵调顺序对多语言进行注音,还能够提高多语言注音的灵活性和准确性,不仅利于国人学习外语,还能进一步使汉语拼音方式得到推广。
附图说明
图1示出了本发明实施例的一种基于汉语拼音构建多语言音标数据库的流程图;
图2示出了本发明实施例的一种多语言注音方法的流程图;
图3示出了采用本发明的多语言注音方法进行注音的示意图;
图4示出了本发明实施例的一种多语言语音合成装置流程图。
具体实施方式
下面通过具体的实施例子并结合附图对本发明做进一步的详细描述。
国人常用的语言是汉语,但随着中国与其他国家沟通的增加,使用其他国家的语言进行交流的机会也明显增加了,进而需要加快学习其他种类语言(如英语、日语等)的效率。学习外语时,首先需要学习对应的音标。但各种语言的音标基本没有相同的(指音标的符号形式),虽然音标有差别,不同种类的语言音标的发音与汉语拼音的发音还是比较相似的,至少每种语言的全部音标中,有一部分音标与汉语拼音的发音是相类似的。那么在学习新语言的音标时,或者是对新语言的字词通过音标进行注音的时候,可以使用发音相同或相似的汉语拼音来进行注音,这样对新语言的注音就是由汉语拼音所构成。需要说明的是,任何一门新语言都存在与汉语拼音的发音不同的音标,即非共用的音标,这需要学习者单独进行学习,而通常非公用的音标的数量比较少,因此,本发明考虑基于汉语拼音建立基础音标数据库,在此基础上加入新语言的音标以实现数据库的扩展,依靠扩展后的数据库对汉语及其他语言进行注音。
本发明实施例1提供了一种基于汉语拼音构建多语言音标数据库的方法,如图1所示,包括如下步骤S101-S105:
S101:根据汉语拼音构建基础音标数据库。
步骤S101中,构建基础音标的数据库可以包括汉语拼音的全部声母和韵母和四种声调,在此基础上还可以包括声母和韵母组合所形成的音标。
S102:获取汉语以外的至少一种外语的标准发音的音节。
S103:针对外语的每一个音节,识别出该音节的每一个元音和辅音;
音节是很多国外语言发音的基本单位,外语的音节包括元音和辅音,部分元音和辅音与汉语的声母和韵母的发音相同,但也有不同的。
S104:对于识别出的每一个元音或辅音,若其与基础音标数据库中的汉语拼音的发音相同,则确定其音标为共用音标;若其与基础音标数据库中的任一汉语拼音的发音均不同,则确定其音标为非共用音标;
S105:将共用音标采用与其发音相同的汉语拼音进行替代,并将非共用音标进行预设处理后加入基础音标数据库中,以形成扩展音标数据库。
步骤S102中,获取汉语以外的至少一种外语的标准发音的音节是指,获取需要进行注音的一种或多种外语的音节,如需要进行汉语、英语和法语注音,则步骤S102中需要获取英语和法语的每个音节。对于音节来说,汉语中一个汉字一般一个音节,每个音节由声母、韵母和声调三个部分组成;英语中一个元音可构成一个音节,一个元音和一个或几个辅音结合也可以构成一个音节。步骤102中需要获取的这些外语的全部音节。
步骤S104中,如果步骤S103所确定的元音或辅音与基础音标数据库中的汉语拼音的发音相同,则可以使用相应的汉语拼音的音标来替代该元音或辅音的音标。如英语中的与汉语拼音中的[ou]发音相同,则可以使用[ou]替代
进一步的,同一种发音,在不同种类的语言中的表现形式是通过不同的元音、辅音、声母或韵母的符号来体现的。也就是在每种语言中可能存在不同的音标对应的是同一种发音,由此,可以通过发音是否相同来确定是否可以使用汉语拼音来替代外语的元音或辅音的符号。
当然,其他语言中除了有与汉语拼音发音相同的元音或辅音,还有与汉语拼音中发音不同的元音或辅音,这些不同的元音或辅音则是非共用音标。汉语拼音中的声母和韵母的发音并不一定与元音或辅音的发音能够一一对应上,还可以是多个声母和韵母的组合能够与一个元音或辅音对应上,那么在对发音进行辨识的时候,还应考虑到是否需要将声母韵母的组合拼音与一个元音或辅音进行对应,以减少非共用音标的数量。
步骤S105中,需要将公用音标采用相应的汉语拼音进行替代,非公用音标以预设的方式加入基础音标数据库中,以使扩展后的音标数据库中能够查询到新语言的全部音标,进而形成扩展音标数据库。具体的,预设方式是基于弹性注标或非弹性注标所采用的方式,弹性注标即将非共用音标采用与其发音相近的音标替代,如英语中的/θ/与汉语中的[s],发音虽然不同,但非常的相似,则可以采用汉语中的[s;]替代英语中的/θ/,弹性注标判断发音的相似程度可以采用人工判断,也可以采用语音识别机器进行判断。
弹性注标的方式中,非公用音标以预设的方式加入基础音标数据库中即:判断非共用音标的发音与基础音标数据库中的汉语拼音的发音的相似度是否达到一定程度,若是,则将其替代为发音相似度满足所述预设条件的汉语拼音;否则,直接将其加入所述基础音标数据库中。汉语拼音的发音和外语音标的发音可能存在不完全相同的情况,但只要二者的差别在合理的范围内(如不仔细听无法分别,在拼读的时候,容易忽略掉差别),那么便可以使用发音相似的汉语拼音来替代该音标。这样,便可以进一步在合理的范围内减少非公用音标的数量,也就使学习新语言的人可以更少的学习新语言的音标,从而简化学习过程,也可以进一步简化多语言语音合成器的设计。在非弹性注标的方式中,则是将所有的非共用音标都直接加入基础音标数据库中。
将非共用音标加入基础音标数据库中后就形成了扩展音标数据库,利用该扩展音标数据库,就能对上述的多种语言进行准音。
根据该扩展音标数据库对外语进行注音后,大部分的音标是熟知汉语的人员所认识的,只有少部分非共用音标需要进行学习,从而在学习一种新语言的时候,可以降低需要学习的音标的数量,提高学习效率。另一方面,还可以降低对外语注音的复杂程度,如只需要通过少量的音标便能够完成对多种语言进行注音,在采用上述步骤S101-步骤S105将所有的国际语言的音标都加入扩展音标数据库后,就可以对全部国际语言采用汉语拼音的方式进行注音,因此,基于上述扩展音标数据库进行注音的方式可以作为国际拼音使用,使用国际拼音一方面能够提高外语学习效率,另一方面还能减少多语言的注音难度,且能够使得汉语拼音的注音方式得到国际性的推广。
本发明实施例所提供的基于汉语拼音构建多语言音标数据库的方法,通过对新语言的每个音节的元音和辅音的发音进行辨别,区分出与基础音标数据库中的汉语拼音中发音相同和发音不同的音标,以确定公用音标和非共用音标,并且将非公用音标以预设方式加入到基础音标数据库中,从而扩展了注音的语言种类,且能够降低学习新语言的难度和提高新语言学习的效率,并且使相应的注音设备的设计简化,解决了现有技术中的不足。
基于上述方法构建了多种语言的扩展音标数据库,就能够利用该扩展音标数据库对多种语言进行注音。参见图2所示为本发明实施例提供的一种多语言注音方法的流程图,图3所示为采用该方法进行多语言注音的示意图。如图2所示,该方法包括:
S201,获取外语的待注音单元;其中,待注音单元为待注音的单词或句子;
S202,针对待注音单元的每个音节,从扩展音标数据库中查找其音标,并确定其声调;
S203,根据待注音单元的每个音节的音标及声调,对待注音单元进行注音。
步骤S202中,需要在扩展音标数据库中查找对应的音标,汉语的注音在此不多做解释,对于汉语以外的,且其音标已加入音标数据库的新语言,在对该新语言的单词或句子进行注音时,先识别每个其中的每个音节,并在扩展音标数据库中查找每个音节的音标,由于扩展数据库已经录入该新语言的全部音标,所以从该扩展音标数据库能够查到该新语言的单词或句子的音节的音标。
此外,还需要确定待注音的单词或句子的声调,并按照汉语拼音的声韵调顺序对所述外语进行注音。国际拼音中有四种声调,高低升降,而英语或其他部分语种是只区分重音,不区分声调的,这会对认知某种语言的音标造成一定的困难,由此,还需要确定音节的声调。具体的声调可以分为四种,如高调(汉语中的1声),低调(汉语中的轻声),升调(汉语中的2声),降调(汉语中的4声)。
具体的,声调包括基本声调和合成声调,基本声调包括:高调、低调、升调和降调,合成声调包括基本声调合成的声调;其中,高调对应汉语拼音中的一声,低调对应汉语拼音中的轻声,升调对应对应汉语拼音中的二声,降调对应汉语拼音中的四声;低调和升调的合成的声调,相当于汉语拼音中的三声。
其中,在进行注音时,低调可进行省略,其他声调不进行省略。
步骤S203中,需要根据步骤S202所获取到的音标和声调对每个待注音单元进行注音。对于辅音串,在注音时可以使用相应的辅音串音标进行注音。
进一步,利用扩展音标数据库对外语进行注音,包括:
按照汉语拼音的声韵调顺序对外语进行注音。
英语是现在社会中学习范围最广泛的一种语言,由此,至少一种外语包括英语;
利用扩展音标数据库对英语进行注音,包括:
将待注音的英语单元中的重音转化为高调或降调,轻音转化为低调。
英语中,音标的重音与汉语中的高调或降调是相同的,英语中的轻音与汉语中的低调是相同的。
进一步,利用扩展音标数据库对外语进行注音,包括:
根据扩展音标数据库中的辅音音标,生成待注音单元的辅音音标或辅音串音标。
实施例2所提供的多语言注音方法还可以细化为如下步骤(当已掌握语言为汉语时):
1,确定待学习语言的类别;
2,按照该语言的音节的听觉效果和发音标准,识别音节的种类和音节数量;
3,对每一个音节进行分析,识别发音里的元音(韵母)和辅音(声母)和声调;
4,确定这些元音,辅音,哪些是与扩展音标数据库里面的元音和辅音是相同的或者不同的;
5,对于与扩展音标数据库相同的元音,辅音,用扩展音标数据库里的符号表达;对于那些不同的元音,辅音,采用新的的音标表示,并将其加入扩展音标数据库;
6,按照汉语拼音的声韵调方式进行书写,允许辅音,辅音串单独书写。为了便于输机和显示,只使用26个英文字母和少数符号“,”“;”“.”“’”逗号,分号,点号和撇号。例如desk[dai,4sk],sk,属于辅音串;bike[bai4k],k是辅音,可单独存在;
7,重复以上步骤,可是实现对相应语言词汇注音,并形成建相应语言的单词音标数据库;
8,调用数据库,显示在学习机,电脑,智能终端上,便于学习。
相关技术中,有关语言注音、学习和合成方面主要有两方面的缺点:
1,相关技术中的系统和方法未能与中国现行的汉语拼音系统相结合,各个系统和方法之间互相独立,重复浪费资源(学习每种语言的时候,需要对每种语言针对性的进行学习,各种学习之间不具有相关联性),致使中国人学习难度大,效率低,浪费资源;目前英文音标,只标重音,没有声调,不利于中国人学习;用到太多的特殊音标,例如等,不易于输入计算机,影响人们使用和学习。
2,对于语音合成方面,英文系统只针对英文,汉语系统只针对汉语,不能资源共享,系统资源浪费严重;现有的语音合成系统,由于没有严格的精确的音节声调设计,语音生硬难懂。
本发明所提供的扩展音标数据库具有如下特点:
1,方便中国人学习外语。因为该系统(扩展音标数据库)和注音方法可以是以汉语拼音为基础,汉语拼音在中国是家喻户晓的,有广大的用户和市场。
2,如果该方法得到推广和发扬,将奠定汉语拼音的国际地位,对于外语学习而言,提供了一个非常有利的学习系统和方法。国际音标产生于1886年,汉语拼音方案产生于1958,汉语拼音产生较晚,本身就克服了国际音标的很多缺点,国际拼音注音方法和系统是建立在这个了两个方案的基础上,综合了他们的优点,摒弃他们的缺点,建立的一个新的方法和系统。
3,发展了中国的声调理论,将声调理论引入外语学习,使音标所能够表达的信息更加完整。
本发明实施例3提供了一种多语言语音合成装置,包括:采用实施例1所提供的基于汉语拼音构建多语言音标数据库的方法所构建的扩展音标数据库,如图4所示,还包括:
构建模块,用于针对汉语及至少一种外语的每个音节,根据扩展音标数据库确定其音标,根据音节的音标和声调,形成带调音节,针对每一个带调音节,采集相应的标准发音以形成语音数据库。其中,可以将每个音节的语音形式按国际拼音进行语音编码,以便以后调用。语音数据库是针对每个带调音节的,可能的组合包括带调的单个元音,例如a的四种发音,a1(高调),a(低调),a2(升调),a4(降调);带调的单个辅音,例如s的四种发音,s1(高调),s(低调),s2(升调),s4(降调);带调的辅音元音组合,例如sa的四种发音,sa1(高调),sa(低调),sa2(升调),sa4(降调)
查询模块,用于获取待合成的多语言单元的每个音节,并查询语音数据库以获取该音节的语音;其中多语言单元包括以下中的一种或多种:汉语、至少一种外语;
播放模块,用于将获取的多语言单元的语音进行播放。
上述的多语言语音合成装置,实现了多种语言的语音合成,且语言合成是建立使用者所熟悉的语言(汉语)的基础上进行的,由此,不仅提高了语音合成的效率,也能够使得合成的语言能更接近使用者的要求。
本发明所提供的语音合成器具有如下特点:
语音合成器(多语言语音合成装置),由于引进了四种基本声调,效果好,成本低廉,性价比高。目前对于一个拥有10万词的汉语或者是英文系统而言,至少需要录音10万次,工作量很大;国际拼音语音合成器,只需要录音1800次,性价比很高,提高了效率。
本发明实施例1提供了以汉语拼音所做成的数据库(国际拼音注音系统的数据库)作为基础音标数据库,以英语作为待学习的语言,所形成使用汉语拼音替代英语音标的替代关系。
经过本发明所提供的多语言注音方法的相应步骤,使汉语拼音和国际音标(英语音标)按照如下几个表格进行替代,其中对于不同学习阶段的人群,还可以分为两种不同的方案,一是英文音标与汉语拼音不严格对应的注音方式,也就是相似的音标采用同一个声母,或者韵母来替代,即宽式音标;二是音标与拼音严格对应的注音方式,也就是每种音标只与一种声母,或者韵母相对应,对发音上有严格的区分,即严式音标。同时也提供了德语的音标数据库。具体音标数据格式如下:
声调(表1)
英语辅音,元音替换表和单词举例(表2,3,4,5)
德语辅音,元音替换表和单词举例(表6和表7)
表1—声调符号
声调 符号
1声 '
2声
轻声 省略
4声 .
表2-辅音-英语(宽式)
表3-元音-英语(宽式)
表4-辅音-英语(严式)
表5-元音-英语(严式)
表6-辅音-德语(严式)
表7-元音-德语(严式)
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种基于汉语拼音构建多语言音标数据库的方法,其特征在于,包括:
根据汉语拼音构建基础音标数据库;
获取汉语以外的至少一种外语的标准发音的音节;
针对所述外语的每一个音节,识别出该音节的每一个元音和辅音;
对于识别出的每一个所述元音或辅音,若其与所述基础音标数据库中的汉语拼音的发音相同,则确定其音标为共用音标;若其与所述基础音标数据库中的任一汉语拼音的发音均不同,则确定其音标为非共用音标;
将所述共用音标采用与其发音相同的汉语拼音进行替代,并将所述非共用音标以预设方式加入所述基础音标数据库中,以形成扩展音标数据库。
2.根据权利要求1所述的方法,其特征在于,包括:将所述非共用音标以预设方式加入所述基础音标数据库中,包括:
对于每个所述非共用音标,判断其发音与所述基础音标数据库中的汉语拼音的发音的相似度是否满足预设条件,若是,则将其替代为发音相似度满足所述预设条件的汉语拼音;否则,直接将其加入所述基础音标数据库中。
3.一种多语言注音方法,包括如权利要求1-2任一所述的基于汉语拼音构建多语言音标数据库的方法,其特征在于,还包括:
利用所述扩展音标数据库对所述外语进行注音。
4.根据权利要求3所述的方法,其特征在于,利用所述扩展音标数据库对所述外语进行注音,包括:
获取所述外语的待注音单元;其中,所述待注音单元为待注音的单词或句子;
针对所述待注音单元的每个音节,从所述扩展音标数据库中查找其音标,并确定其声调;
根据所述待注音单元的每个音节的音标及声调,对所述待注音单元进行注音。
5.根据权利要求4所述的方法,其特征在于,所述声调包括基本声调和合成声调,所述基本声调包括4种:高调、低调、升调和降调;所述合成声调包括所述基本声调合成的声调;其中,所述高调对应汉语拼音中的一声,所述低调对应汉语拼音中的轻声,所述升调对应汉语拼音中的二声,所述降调对应汉语拼音中的四声。
6.根据权利要求5所述的方法,其特征在于,利用所述扩展音标数据库对所述外语进行注音,包括:
按照汉语拼音的声韵调顺序对所述外语进行注音。
7.根据权利要求6所述的方法,其特征在于,所述至少一种外语包括英语;
利用所述扩展音标数据库对英语进行注音,包括:
将待注音的英语单元中的重音转化为高调或降调,轻音转化为低调。
8.根据权利要求3所述的方法,其特征在于,利用所述扩展音标数据库对所述外语进行注音,包括:
根据所述扩展音标数据库中的辅音音标,生成待注音单元的辅音音标或辅音串音标。
9.一种多语言语音合成装置,包括:采用如权利要求1-2所述的方法所构建的扩展音标数据库,其特征在于,还包括:
构建模块,用于针对汉语及所述至少一种外语的每个音节,根据所述扩展音标数据库确定其音标,根据所述音节的音标和声调,形成带调音节,针对每一个带调音节,采集相应的标准发音以形成语音数据库;
查询模块,用于获取待合成的多语言单元的每个音节,并查询所述语音数据库以获取该音节的语音;其中所述多语言单元包括以下中的一种或多种:汉语、所述至少一种外语;
播放模块,用于将获取的所述多语言单元的语音进行播放。
10.根据权利要求9所述的装置,其特征在于,所述标准发音为所述音节的音标和声调组合的发音。
CN201410535621.XA 2014-10-11 2014-10-11 构建多语言音标数据库的方法、多语言注音的方法及装置 Active CN104239579B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410535621.XA CN104239579B (zh) 2014-10-11 2014-10-11 构建多语言音标数据库的方法、多语言注音的方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410535621.XA CN104239579B (zh) 2014-10-11 2014-10-11 构建多语言音标数据库的方法、多语言注音的方法及装置

Publications (2)

Publication Number Publication Date
CN104239579A true CN104239579A (zh) 2014-12-24
CN104239579B CN104239579B (zh) 2017-05-31

Family

ID=52227638

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410535621.XA Active CN104239579B (zh) 2014-10-11 2014-10-11 构建多语言音标数据库的方法、多语言注音的方法及装置

Country Status (1)

Country Link
CN (1) CN104239579B (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105303909A (zh) * 2015-10-23 2016-02-03 广东小天才科技有限公司 一种基于振动学习英文的方法、装置和系统
CN108109610A (zh) * 2017-11-06 2018-06-01 芋头科技(杭州)有限公司 一种模拟发声方法及模拟发声系统
CN108352126A (zh) * 2015-11-11 2018-07-31 株式会社Mglish 外语读音及标记装置及其方法,包括利用其装置和方法的基于外语节奏动作传感器的运动学习装置、运动学习方法以及对其进行记录的电子媒体和学习教材
CN110211562A (zh) * 2019-06-05 2019-09-06 深圳前海达闼云端智能科技有限公司 一种语音合成的方法、电子设备及可读存储介质
CN110950201A (zh) * 2020-02-26 2020-04-03 菱王电梯股份有限公司 一种基于语音比对的呼梯登记方法及其呼梯登记装置
CN113706938A (zh) * 2021-07-15 2021-11-26 都建彬 基于汉语拼音的快速学习八门外语的方法、装置

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1196533A (zh) * 1997-04-14 1998-10-21 英业达股份有限公司 英语句型文字的音标合成方法
KR20060021721A (ko) * 2004-09-03 2006-03-08 전홍석 외국어 단어의 한글 표기와 이를 통한 사전 검색 방법
CN101261831A (zh) * 2007-03-05 2008-09-10 凌阳科技股份有限公司 一种音标分解与合成方法
CN101465078A (zh) * 2007-12-17 2009-06-24 蔡文生 英语拼音教学辅助工具及其工业应用方法
CN101739866A (zh) * 2008-11-26 2010-06-16 陈爱文 英语定音记号及使用记号的键盘和出版物
CN102460538A (zh) * 2009-06-16 2012-05-16 富兰克林电子出版商公司 第二语言发音和拼写

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1196533A (zh) * 1997-04-14 1998-10-21 英业达股份有限公司 英语句型文字的音标合成方法
KR20060021721A (ko) * 2004-09-03 2006-03-08 전홍석 외국어 단어의 한글 표기와 이를 통한 사전 검색 방법
CN101261831A (zh) * 2007-03-05 2008-09-10 凌阳科技股份有限公司 一种音标分解与合成方法
CN101465078A (zh) * 2007-12-17 2009-06-24 蔡文生 英语拼音教学辅助工具及其工业应用方法
CN101739866A (zh) * 2008-11-26 2010-06-16 陈爱文 英语定音记号及使用记号的键盘和出版物
CN102460538A (zh) * 2009-06-16 2012-05-16 富兰克林电子出版商公司 第二语言发音和拼写

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105303909A (zh) * 2015-10-23 2016-02-03 广东小天才科技有限公司 一种基于振动学习英文的方法、装置和系统
CN108352126A (zh) * 2015-11-11 2018-07-31 株式会社Mglish 外语读音及标记装置及其方法,包括利用其装置和方法的基于外语节奏动作传感器的运动学习装置、运动学习方法以及对其进行记录的电子媒体和学习教材
CN108109610A (zh) * 2017-11-06 2018-06-01 芋头科技(杭州)有限公司 一种模拟发声方法及模拟发声系统
CN108109610B (zh) * 2017-11-06 2021-06-18 芋头科技(杭州)有限公司 一种模拟发声方法及模拟发声系统
CN110211562A (zh) * 2019-06-05 2019-09-06 深圳前海达闼云端智能科技有限公司 一种语音合成的方法、电子设备及可读存储介质
CN110950201A (zh) * 2020-02-26 2020-04-03 菱王电梯股份有限公司 一种基于语音比对的呼梯登记方法及其呼梯登记装置
CN113706938A (zh) * 2021-07-15 2021-11-26 都建彬 基于汉语拼音的快速学习八门外语的方法、装置
CN113706938B (zh) * 2021-07-15 2023-08-18 都建彬 基于汉语拼音的快速学习八门外语的方法、装置

Also Published As

Publication number Publication date
CN104239579B (zh) 2017-05-31

Similar Documents

Publication Publication Date Title
Welby French intonational structure: Evidence from tonal alignment
CN104239579B (zh) 构建多语言音标数据库的方法、多语言注音的方法及装置
CN105244022B (zh) 音视频字幕生成方法及装置
CN102184167B (zh) 一种文本数据处理方法和装置
CN110473523A (zh) 一种语音识别方法、装置、存储介质及终端
CN103680498A (zh) 一种语音识别方法和设备
CN104575497B (zh) 一种声学模型建立方法及基于该模型的语音解码方法
CN103632668B (zh) 一种基于中文语音信息训练英文语音模型的方法与设备
CN105404621A (zh) 一种用于盲人读取汉字的方法及系统
CN102439660A (zh) 基于置信度得分的语音标签方法和装置
CN109147762A (zh) 一种语音识别方法及系统
CN102970618A (zh) 基于音节识别的视频点播方法
CN105895076B (zh) 一种语音合成方法及系统
Mishra et al. Intonational phrase break prediction for text-to-speech synthesis using dependency relations
US20070061143A1 (en) Method for collating words based on the words' syllables, and phonetic symbols
Vazhenina et al. State-of-the-art speech recognition technologies for Russian language
CN109473007A (zh) 一种音素结合声旁的英语自然拼读教学方法及系统
Juan et al. Analysis of malay speech recognition for different speaker origins
Remijsen Tone
KR101777141B1 (ko) 한글 입력 키보드를 이용한 훈민정음 기반 중국어 및 외국어 입력 장치 및 방법
Rouas et al. Language and variety verification on broadcast news for Portuguese
van de Weijer Affricates in English as a natural class
Thangthai et al. Automatic syllable-pattern induction in statistical Thai text-to-phone transcription.
Dhore et al. Issues in hindi to english and marathi to english machine transliteration of named entities
Saychum et al. Efficient Thai Grapheme-to-Phoneme Conversion Using CRF-Based Joint Sequence Modeling.

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20210609

Address after: 710000 No.3, 19th floor, unit 3, building 6, No.82, Chang'an South Road, Yanta District, Xi'an City, Shaanxi Province

Patentee after: Lu Guanjun

Address before: Room 1537, 15 / F, building 5, yard 36, Guangqu Road, Chaoyang District, Beijing

Patentee before: BEIJING GENERAL PINYIN Inc.

TR01 Transfer of patent right