CN101894547A - 一种语音合成方法和系统 - Google Patents
一种语音合成方法和系统 Download PDFInfo
- Publication number
- CN101894547A CN101894547A CN2010102234937A CN201010223493A CN101894547A CN 101894547 A CN101894547 A CN 101894547A CN 2010102234937 A CN2010102234937 A CN 2010102234937A CN 201010223493 A CN201010223493 A CN 201010223493A CN 101894547 A CN101894547 A CN 101894547A
- Authority
- CN
- China
- Prior art keywords
- syllable
- spectrum parameter
- text
- parameter
- sequence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Abstract
本发明提供了一种语音合成方法和系统,其中的方法具体包括:接收用户输入的文本;进行文本分析,获得与所述文本对应的音节序列,以及,该音节序列中每个音节的音节名称;针对所述音节序列中每个音节,根据其音节名称及上下文环境,结合统计参数模型,规划得到相应的时长参数和基频参数;针对所述音节序列中每个音节,根据其音节名称及上下文环境、时长参数及基频参数,从谱参数数据库中匹配得到对应的谱参数;根据所述音节序列中每个音节的时长参数、基频参数和谱参数,利用合成器得到与所述音节序列对应的语音数据。本发明能够应用于嵌入式设备,且在具有好的音质效果下有效降低数据存储空间占用。
Description
技术领域
本发明涉及语音合成技术领域,特别是涉及一种语音合成方法和系统。
背景技术
语音合成技术,又称文语转换(TTS,Text To Speech)技术,其能将任意文字信息转化为标准流畅的语音朗读出来,
目前的语音合成中,主要有两种方法:
一是波形拼接方法;
其基本思想是,预先录制一个语音库,在合成时,根据文本分析和韵律预测的结果,直接从语音库中选择出合适的录音片段,最后将所选的录音片段拼接在一起。
由于使用了原始录音,合成语音的音质可以得到保证;但是,要得到较好的合成结果,语音库需要事先存储大量的语音数据,合成结果与存储数据量的大小直接相关,即当语音库大幅减小后,其音质也会大幅下降。
例如,有些语音库至少需要1G以上的存储空间,这对于智能手机、车载终端、PDA(个人数码助理,Personal Digital Assistant)等嵌入式设备来说,是非常大的开销。
二是参数合成方法。
参数合成方法首先根据语音数据统计出一个参数模型,在合成时,根据用户的输入文本,结合参数模型规划出参数,然后再将这些参数用合成器合成。
由于所述参数模型经参数提取、模型统计得到,相对于预存储语音数据而言,此方法可以将存储空间压缩下来;但是,在参数提取、模型统计过程中会损失一些语音信息,所以,会导致合成语音的音质下降。
总之,需要本领域技术人员迫切解决的一个技术问题就是:如何能够提供一种在嵌入式设备上使用的具有好的音质效果的语音合成方法。
发明内容
本发明所要解决的技术问题是提供一种语音合成方法和系统,能够应用于嵌入式设备,且在具有好的音质效果下有效降低数据存储空间占用。
为了解决上述问题,本发明公开了一种语音合成方法,包括:
接收用户输入的文本;
进行文本分析,获得与所述文本对应的音节序列,以及,该音节序列中每个音节的音节名称;
针对所述音节序列中每个音节,根据其音节名称及上下文环境,结合统计参数模型,规划得到相应的时长参数和基频参数;
针对所述音节序列中每个音节,根据其音节名称及上下文环境、时长参数及基频参数,从谱参数数据库中匹配得到对应的谱参数;
根据所述音节序列中每个音节的时长参数、基频参数和谱参数,利用合成器得到与所述音节序列对应的语音数据。
优选的,所述谱参数数据库为通过以下步骤建立的数据库:
从原始录音数据中提取谱参数;
根据音节名称、上下文环境以及时长参数、基频参数,将对应的谱参数保存至谱参数数据库。
优选的,在保存谱参数前,所述建立数据库的步骤还包括:
对所述谱参数进行矢量量化压缩,以压缩后的谱参数进行保存操作;
所述方法还包括:
利用与压缩算法相对应的解压缩算法对匹配得到的谱参数进行还原,以解压缩后的谱参数进行语音数据的合成操作。
优选的,所述保存步骤包括:
分别对时长参数、基频参数进行分类;
根据音节名称、上下文环境以及所属的时长参数类别、基频参数类别,将对应的谱参数保存至谱参数数据库。
优选的,所述文本分析步骤包括:
对所述文本进行分词操作;
将所述文本中的数字符号转换为文字;
依据分词结果,对数字符号转换后的文本进行韵律预测;
根据韵律预测结果,将文本转换为音节序列,以及,基于音节映射表,得到该音节序列中每个音节的音节名称。
本发明还公开了一种语音合成系统,包括:
接口模块,用于接收用户输入的文本;
文本分析模块,用于进行文本分析,获得与所述文本对应的音节序列,以及,该音节序列中每个音节的音节名称;
参数规划模块,用于针对所述音节序列中每个音节,根据其音节名称及上下文环境,结合统计参数模型,规划得到相应的时长参数和基频参数;
谱参数数据库,用于根据音节名称、上下文环境以及时长参数、基频参数,存储音节所对应的谱参数;
谱参数匹配模块,用于针对所述音节序列中每个音节,根据其音节名称及上下文环境、时长参数及基频参数,从所述谱参数数据库中匹配得到对应的谱参数;
合成模块,用于根据所述音节序列中每个音节的时长参数、基频参数和谱参数,利用合成器得到与所述音节序列对应的语音数据。
优选的,所述谱参数为经过矢量量化压缩的谱参数;
所述系统还包括:
解压缩模块,用于利用与压缩算法相对应的解压缩算法对匹配得到的谱参数进行还原,所述解压缩后的谱参数作为所述合成模块的输入谱参数。
优选的,所述文本分析模块包括:
分词单元,用于对所述文本进行分词操作;
数字符号处理单元,用于将所述文本中的数字符号转换为文字;
韵律预测单元,用于依据分词结果,对数字符号转换后的文本进行韵律预测;
音节转换单元,用于根据韵律预测结果,将文本转换为音节序列,以及,基于音节映射表,得到该音节序列中每个音节的音节名称。
与现有技术相比,本发明具有以下优点:
本发明采用谱参数数据库存储特定音节的谱参数,这样,在用户输入文本时,可以从所述谱参数数据库中匹配得到与文本中音节对应的谱参数,然后将所述谱参数以及规划的时长参数、基频参数,利用合成器得到所述文本的语音数据。
由于相对于时长参数、基频参数而言,谱参数是最能表现发音人特色的音频参数,而且相对于特定音节来说也是最稳定的参数,其没有经过统计量化,因而,相对于现有技术采用经过统计训练的谱参数,本发明合成的语音数据更接近真人发音,音色更饱满圆润;而且,由于所述谱参数数据库仅需存储每个音节的若干个谱参数,故相对于现有的语音库,本发明可以大大降低数据存储空间。
进一步,本发明还可以在保证听感不受损失的前提下,对谱参数进行矢量量化压缩,以进一步降低数据存储空间。
附图说明
图1是本发明一种语音合成方法实施例的流程图;
图2是本发明一种语音合成系统实施例的结构图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
本发明实施例的核心构思之一在于,采用谱参数数据库存储特定音节的谱参数,这样,在用户在线输入文本时,可以根据文本中音节名称和上下文环境,以及,基于统计参数模型规划出的时长、基频参数,从所述谱参数数据库中匹配得到对应的谱参数,然后利用合成器得到所述文本的语音数据。
参照图1,示出了本发明一种语音合成方法实施例的流程图,具体可以包括:
步骤101、接收用户输入的文本;
所述用户输入的文本可以包括文字和数字符号,其中,所述文字可以是汉字、日文、韩文、英文等,或者,上述多种文字中的一种或者几种,如汉英组合等等,本发明对具体的文本不加以限制,以下主要以汉字为例。
步骤102、进行文本分析,获得与所述文本对应的音节序列,以及,该音节序列中每个音节的音节名称;
以下具体的文本“北京在2008-8-8举行了盛大的奥运会开幕式”为例,对所述文本分析步骤进行说明,具体可以包括:
子步骤A1、对所述文本进行分词操作;
分词结果:北京/在/2008-8-8/举行/了/盛大/的/奥运会/开幕式
子步骤A2、将所述文本中的数字符号转换为文字;
对应本例,所述数字符号转换也即,将“2008-8-8”转换为“二零零八年八月八日”,数字符号转换后的文本为“北京在二零零八年八月八日举行了盛大的奥运会开幕式”。
子步骤A3、依据分词结果,对数字符号转换后的文本进行韵律预测;
韵律预测结果:北京在二零零八年八月八日/举行了盛大的奥运会开幕式
子步骤A4、根据韵律预测结果,将文本转换为音节序列,以及,基于音节映射表,得到该音节序列中每个音节的音节名称。
音节序列:bei3 jing1 zai4 er4 ling2 ling2 ba1 nian2 ba1 yue 4 ba1 ri4Ju3 xing2 le5 sheng4 da4 de5 ao4 yun4 hui4 kai1 mu4 shi4
其中,数字12345代表声调,分别为一声、二声、三声、四声、轻声。在实际中,汉字音节的音节名称可通过查询汉字音节映射表得到,例如上例中的“bei3”即是音节名称。
步骤103、针对所述音节序列中每个音节,根据其音节名称及上下文环境,结合统计参数模型,规划得到相应的时长参数和基频参数;
所述上下文环境主要是指音节的位置信息,可以包括句首、句中和句末;对应上例,“bei3”的上下文环境是句首,而“ling2”的上下文环境则是句中。
在实际中,所述统计参数模型可通过离线训练得到,其存储有音节在不同上下文环境下所对应的参数。
例如,离线时,针对时长参数训练第一统计模型,针对基频参数训练第二统计模型;那么,在线规划时,可以直接从所述第一统计模型得到与音节相应的时长参数,以及,从所述第二统计模型得到与音节相应的基频参数。
步骤104、针对所述音节序列中每个音节,根据其音节名称及上下文环境、时长参数及基频参数,从谱参数数据库中匹配得到对应的谱参数;
在实际中,可通过以下离线步骤建立谱参数数据库:
步骤B1、从原始录音数据中提取谱参数;
作为录音素材,所述原始录音数据可直接从现有语音库中得到,本发明对此不加以限制。
谱参数可以用多种方法来描述,由于在量化特征和内插特性方面具有明显的优势,LSP(线谱对,Line Spectrum Pair)在编码中得到广泛的应用,故本发明实施例优先选用LSP来描述谱参数。
步骤B2、根据音节名称、上下文环境以及时长参数、基频参数,将对应的谱参数保存至谱参数数据库。
在具体实现中,所述子步骤B2可以进一步包括:
子步骤C1、分别对时长参数、基频参数进行分类;
子步骤C2、根据音节名称、上下文环境以及所属的时长参数类别、基频参数类别,将对应的谱参数保存至谱参数数据库。
例如,时长参数1到2为一类,2到3为一类;然后将音节名称、上下文环境以及所属的时长参数类别、基频参数类别等组合对应一个谱参数。相应地,在匹配时,应分别获取音节的时长参数及基频参数所属的类别,然后,从所述谱参数数据库中得到与该音节相应的谱参数。
由于所述谱参数数据库仅需存储音节的谱参数,具体地,对于一个音节而言,仅需存储其在不同上下文环境下的若干个谱参数,因而,相对于现有的语音库,可以降低数据存储空间。
步骤105、根据所述音节序列中每个音节的时长参数、基频参数和谱参数,利用合成器得到与所述音节序列对应的语音数据。
例如,可以采用LPC(线性预测编码,linear predictive coding)滤波器作为合成器,本发明对具体的合成器不加以限制。
为进一步降低数据存储空间,在本发明的一种优选实施例中,在步骤B2前,所述建立谱参数数据库的步骤还可以包括如下步骤:
对所述谱参数进行矢量量化压缩,以压缩后的谱参数进行保存操作;
相应地,所述语音合成方法还可以包括:
利用与压缩算法相对应的解压缩算法对匹配得到的谱参数进行还原,以解压缩后的谱参数进行语音数据的合成操作。
离线时,可首先将所述谱参数压缩成码字序列,然后为该码字序列建立一个索引标记,并将该索引标记和码字序列一起放入所述谱参数数据库中,其中,可以采用拼音、一些特殊符号的字符等符号来表示所述索引标记,可以使用HASH(哈希)表等方式建立索引表。
在线匹配时,可以首先查阅所述索引表得到索引标记,也即得到音节的码字序列,然后,通过与编码压缩相应的解压缩算法还原出未经压缩的谱参数。
本发明所采用的压缩算法可以是任意一种能够满足嵌入式设备存储空间要求、且能够达到听觉要求(用户满意)的算法。因此,本优选实施例能够在听感不受损失的前提下,进一步降低数据存储空间。
参照图2,示出了本发明一种语音合成系统实施例的结构图,具体可以包括:
接口模块201,用于接收用户输入的文本;
文本分析模块202,用于进行文本分析,获得与所述文本对应的音节序列,以及,该音节序列中每个音节的音节名称;
参数规划模块203,用于针对所述音节序列中每个音节,根据其音节名称及上下文环境,结合统计参数模型,规划得到相应的时长参数和基频参数;
谱参数数据库204,用于根据音节名称、上下文环境以及时长参数、基频参数,存储音节所对应的谱参数;
谱参数匹配模块205,用于针对所述音节序列中每个音节,根据其音节名称及上下文环境、时长参数及基频参数,从所述谱参数数据库中匹配得到对应的谱参数;
合成模块206,用于根据所述音节序列中每个音节的时长参数、基频参数和谱参数,利用合成器得到与所述音节序列对应的语音数据。
在实际中,所述文本分析模块202可以进一步包括:
分词单元,用于对所述文本进行分词操作;
数字符号处理单元,用于将所述文本中的数字符号转换为文字;
韵律预测单元,用于依据分词结果,对数字符号转换后的文本进行韵律预测;
音节转换单元,用于根据韵律预测结果,将文本转换为音节序列,以及,基于音节映射表,得到该音节序列中每个音节的音节名称。
本发明可以采用如下离线装置建立所述谱参数数据库204,所述离线装置具体可以包括:
提取模块D1,用于从原始录音数据中提取谱参数;
保存模块D2,用于根据音节名称、上下文环境以及时长参数、基频参数,将对应的谱参数保存至谱参数数据库。
在具体实现中,所述保存模块D2可以进一步包括如下单元结构:
分类单元E1,用于分别对时长参数、基频参数进行分类;
保存单元E2,根据音节名称、上下文环境以及所属的时长参数类别、基频参数类别,将对应的谱参数保存至谱参数数据库。
由于所述谱参数数据库仅需存储一个音节的若干个谱参数,因而,相对于现有的语音库,可以降低数据存储空间。
为进一步降低数据存储空间,在本发明的一种优选实施例中,可对所述谱参数进行矢量量化压缩;
此时,所述系统还可以包括:
解压缩模块,用于利用与压缩算法相对应的解压缩算法对匹配得到的谱参数进行还原,所述解压缩后的谱参数作为所述合成模块的输入信号。
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。对于系统实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本发明实施例无需过大的存储空间,可以应用于智能手机、车载终端、PDA等嵌入式设备中,且可以提供更接近真人发音、音色饱满圆润的语音。
以上对本发明所提供的一种语音合成方法和系统,进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。
Claims (8)
1.一种语音合成方法,其特征在于,包括:
接收用户输入的文本;
进行文本分析,获得与所述文本对应的音节序列,以及,该音节序列中每个音节的音节名称;
针对所述音节序列中每个音节,根据其音节名称及上下文环境,结合统计参数模型,规划得到相应的时长参数和基频参数;
针对所述音节序列中每个音节,根据其音节名称及上下文环境、时长参数及基频参数,从谱参数数据库中匹配得到对应的谱参数;
根据所述音节序列中每个音节的时长参数、基频参数和谱参数,利用合成器得到与所述音节序列对应的语音数据。
2.如权利要求1所述的方法,其特征在于,所述谱参数数据库为通过以下步骤建立的数据库:
从原始录音数据中提取谱参数;
根据音节名称、上下文环境以及时长参数、基频参数,将对应的谱参数保存至谱参数数据库。
3.如权利要求2所述的方法,其特征在于,在保存谱参数前,所述建立数据库的步骤还包括:
对所述谱参数进行矢量量化压缩,以压缩后的谱参数进行保存操作;
所述方法还包括:
利用与压缩算法相对应的解压缩算法对匹配得到的谱参数进行还原,以解压缩后的谱参数进行语音数据的合成操作。
4.如权利要求2所述的方法,其特征在于,所述保存步骤包括:
分别对时长参数、基频参数进行分类;
根据音节名称、上下文环境以及所属的时长参数类别、基频参数类别,将对应的谱参数保存至谱参数数据库。
5.如权利要求1所述的方法,其特征在于,所述文本分析步骤包括:
对所述文本进行分词操作;
将所述文本中的数字符号转换为文字;
依据分词结果,对数字符号转换后的文本进行韵律预测;
根据韵律预测结果,将文本转换为音节序列,以及,基于音节映射表,得到该音节序列中每个音节的音节名称。
6.一种语音合成系统,其特征在于,包括:
接口模块,用于接收用户输入的文本;
文本分析模块,用于进行文本分析,获得与所述文本对应的音节序列,以及,该音节序列中每个音节的音节名称;
参数规划模块,用于针对所述音节序列中每个音节,根据其音节名称及上下文环境,结合统计参数模型,规划得到相应的时长参数和基频参数;
谱参数数据库,用于根据音节名称、上下文环境以及时长参数、基频参数,存储音节所对应的谱参数;
谱参数匹配模块,用于针对所述音节序列中每个音节,根据其音节名称及上下文环境、时长参数及基频参数,从所述谱参数数据库中匹配得到对应的谱参数;
合成模块,用于根据所述音节序列中每个音节的时长参数、基频参数和谱参数,利用合成器得到与所述音节序列对应的语音数据。
7.如权利要求6所述的系统,其特征在于,所述谱参数为经过矢量量化压缩的谱参数;
所述系统还包括:
解压缩模块,用于利用与压缩算法相对应的解压缩算法对匹配得到的谱参数进行还原,所述解压缩后的谱参数作为所述合成模块的输入谱参数。
8.如权利要求6所述的系统,其特征在于,所述文本分析模块包括:
分词单元,用于对所述文本进行分词操作;
数字符号处理单元,用于将所述文本中的数字符号转换为文字;
韵律预测单元,用于依据分词结果,对数字符号转换后的文本进行韵律预测;
音节转换单元,用于根据韵律预测结果,将文本转换为音节序列,以及,基于音节映射表,得到该音节序列中每个音节的音节名称。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2010102234937A CN101894547A (zh) | 2010-06-30 | 2010-06-30 | 一种语音合成方法和系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2010102234937A CN101894547A (zh) | 2010-06-30 | 2010-06-30 | 一种语音合成方法和系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN101894547A true CN101894547A (zh) | 2010-11-24 |
Family
ID=43103718
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2010102234937A Pending CN101894547A (zh) | 2010-06-30 | 2010-06-30 | 一种语音合成方法和系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN101894547A (zh) |
Cited By (146)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102063897A (zh) * | 2010-12-09 | 2011-05-18 | 北京宇音天下科技有限公司 | 一种用于嵌入式语音合成系统的音库压缩及使用方法 |
CN102201232A (zh) * | 2011-06-01 | 2011-09-28 | 北京宇音天下科技有限公司 | 一种用于嵌入式语音合成系统的音库结构压缩及使用方法 |
CN102413248A (zh) * | 2011-12-21 | 2012-04-11 | 广东步步高电子工业有限公司 | 手机编辑界面语音朗读方法 |
CN103077704A (zh) * | 2010-12-09 | 2013-05-01 | 北京宇音天下科技有限公司 | 一种用于嵌入式语音合成系统的音库压缩及使用方法 |
CN103117062A (zh) * | 2013-01-22 | 2013-05-22 | 武汉大学 | 语音解码器中帧差错隐藏的谱参数代替方法及系统 |
CN104380373A (zh) * | 2012-03-02 | 2015-02-25 | 苹果公司 | 用于名称发音的系统和方法 |
CN104538024A (zh) * | 2014-12-01 | 2015-04-22 | 百度在线网络技术(北京)有限公司 | 语音合成方法、装置及设备 |
CN105206257A (zh) * | 2015-10-14 | 2015-12-30 | 科大讯飞股份有限公司 | 一种声音转换方法及装置 |
CN105244022A (zh) * | 2015-09-28 | 2016-01-13 | 科大讯飞股份有限公司 | 音视频字幕生成方法及装置 |
CN105895076A (zh) * | 2015-01-26 | 2016-08-24 | 科大讯飞股份有限公司 | 一种语音合成方法及系统 |
CN105895075A (zh) * | 2015-01-26 | 2016-08-24 | 科大讯飞股份有限公司 | 提高合成语音韵律自然度的方法及系统 |
US9668024B2 (en) | 2014-06-30 | 2017-05-30 | Apple Inc. | Intelligent automated assistant for TV user interactions |
CN106920547A (zh) * | 2017-02-21 | 2017-07-04 | 腾讯科技(上海)有限公司 | 语音转换方法和装置 |
CN107273359A (zh) * | 2017-06-20 | 2017-10-20 | 北京四海心通科技有限公司 | 一种文本相似度确定方法 |
US9865248B2 (en) | 2008-04-05 | 2018-01-09 | Apple Inc. | Intelligent text-to-speech conversion |
CN107564511A (zh) * | 2017-09-25 | 2018-01-09 | 平安科技(深圳)有限公司 | 电子装置、语音合成方法和计算机可读存储介质 |
CN107705782A (zh) * | 2017-09-29 | 2018-02-16 | 百度在线网络技术(北京)有限公司 | 用于确定音素发音时长的方法和装置 |
CN107749301A (zh) * | 2017-09-18 | 2018-03-02 | 得理电子(上海)有限公司 | 一种音色样本重构方法及系统、存储介质及终端设备 |
US9934775B2 (en) | 2016-05-26 | 2018-04-03 | Apple Inc. | Unit-selection text-to-speech synthesis based on predicted concatenation parameters |
US9966060B2 (en) | 2013-06-07 | 2018-05-08 | Apple Inc. | System and method for user-specified pronunciation of words for speech synthesis and recognition |
US9972304B2 (en) | 2016-06-03 | 2018-05-15 | Apple Inc. | Privacy preserving distributed evaluation framework for embedded personalized systems |
US9971774B2 (en) | 2012-09-19 | 2018-05-15 | Apple Inc. | Voice-based media searching |
US9986419B2 (en) | 2014-09-30 | 2018-05-29 | Apple Inc. | Social reminders |
US10043516B2 (en) | 2016-09-23 | 2018-08-07 | Apple Inc. | Intelligent automated assistant |
US10049668B2 (en) | 2015-12-02 | 2018-08-14 | Apple Inc. | Applying neural network language models to weighted finite state transducers for automatic speech recognition |
US10049675B2 (en) | 2010-02-25 | 2018-08-14 | Apple Inc. | User profiling for voice input processing |
US10049663B2 (en) | 2016-06-08 | 2018-08-14 | Apple, Inc. | Intelligent automated assistant for media exploration |
US10067938B2 (en) | 2016-06-10 | 2018-09-04 | Apple Inc. | Multilingual word prediction |
US10079014B2 (en) | 2012-06-08 | 2018-09-18 | Apple Inc. | Name recognition system |
US10083690B2 (en) | 2014-05-30 | 2018-09-25 | Apple Inc. | Better resolution when referencing to concepts |
CN108573694A (zh) * | 2018-02-01 | 2018-09-25 | 北京百度网讯科技有限公司 | 基于人工智能的语料扩充及语音合成系统构建方法及装置 |
US10089072B2 (en) | 2016-06-11 | 2018-10-02 | Apple Inc. | Intelligent device arbitration and control |
US10108612B2 (en) | 2008-07-31 | 2018-10-23 | Apple Inc. | Mobile device having human language translation capability with positional feedback |
US10169329B2 (en) | 2014-05-30 | 2019-01-01 | Apple Inc. | Exemplar-based natural language processing |
US10192552B2 (en) | 2016-06-10 | 2019-01-29 | Apple Inc. | Digital assistant providing whispered speech |
CN109326270A (zh) * | 2018-09-18 | 2019-02-12 | 平安科技(深圳)有限公司 | 音频文件的生成方法、终端设备及介质 |
US10223066B2 (en) | 2015-12-23 | 2019-03-05 | Apple Inc. | Proactive assistance based on dialog communication between devices |
US10249300B2 (en) | 2016-06-06 | 2019-04-02 | Apple Inc. | Intelligent list reading |
US10269345B2 (en) | 2016-06-11 | 2019-04-23 | Apple Inc. | Intelligent task discovery |
US10297253B2 (en) | 2016-06-11 | 2019-05-21 | Apple Inc. | Application integration with a digital assistant |
US10303715B2 (en) | 2017-05-16 | 2019-05-28 | Apple Inc. | Intelligent automated assistant for media exploration |
US10311871B2 (en) | 2015-03-08 | 2019-06-04 | Apple Inc. | Competing devices responding to voice triggers |
US10311144B2 (en) | 2017-05-16 | 2019-06-04 | Apple Inc. | Emoji word sense disambiguation |
US10318871B2 (en) | 2005-09-08 | 2019-06-11 | Apple Inc. | Method and apparatus for building an intelligent automated assistant |
US10332518B2 (en) | 2017-05-09 | 2019-06-25 | Apple Inc. | User interface for correcting recognition errors |
US10356243B2 (en) | 2015-06-05 | 2019-07-16 | Apple Inc. | Virtual assistant aided communication with 3rd party service in a communication session |
US10354011B2 (en) | 2016-06-09 | 2019-07-16 | Apple Inc. | Intelligent automated assistant in a home environment |
US10366158B2 (en) | 2015-09-29 | 2019-07-30 | Apple Inc. | Efficient word encoding for recurrent neural network language models |
US10381016B2 (en) | 2008-01-03 | 2019-08-13 | Apple Inc. | Methods and apparatus for altering audio output signals |
US10395654B2 (en) | 2017-05-11 | 2019-08-27 | Apple Inc. | Text normalization based on a data-driven learning network |
US10403278B2 (en) | 2017-05-16 | 2019-09-03 | Apple Inc. | Methods and systems for phonetic matching in digital assistant services |
US10403283B1 (en) | 2018-06-01 | 2019-09-03 | Apple Inc. | Voice interaction at a primary device to access call functionality of a companion device |
US10410637B2 (en) | 2017-05-12 | 2019-09-10 | Apple Inc. | User-specific acoustic models |
US10417266B2 (en) | 2017-05-09 | 2019-09-17 | Apple Inc. | Context-aware ranking of intelligent response suggestions |
US10417405B2 (en) | 2011-03-21 | 2019-09-17 | Apple Inc. | Device access using voice authentication |
US10431204B2 (en) | 2014-09-11 | 2019-10-01 | Apple Inc. | Method and apparatus for discovering trending terms in speech requests |
US10438595B2 (en) | 2014-09-30 | 2019-10-08 | Apple Inc. | Speaker identification and unsupervised speaker adaptation techniques |
US10446143B2 (en) | 2016-03-14 | 2019-10-15 | Apple Inc. | Identification of voice inputs providing credentials |
US10445429B2 (en) | 2017-09-21 | 2019-10-15 | Apple Inc. | Natural language understanding using vocabularies with compressed serialized tries |
US10453443B2 (en) | 2014-09-30 | 2019-10-22 | Apple Inc. | Providing an indication of the suitability of speech recognition |
US10474753B2 (en) | 2016-09-07 | 2019-11-12 | Apple Inc. | Language identification using recurrent neural networks |
US10482874B2 (en) | 2017-05-15 | 2019-11-19 | Apple Inc. | Hierarchical belief states for digital assistants |
US10490187B2 (en) | 2016-06-10 | 2019-11-26 | Apple Inc. | Digital assistant providing automated status report |
US10496705B1 (en) | 2018-06-03 | 2019-12-03 | Apple Inc. | Accelerated task performance |
US10497365B2 (en) | 2014-05-30 | 2019-12-03 | Apple Inc. | Multi-command single utterance input method |
US10509862B2 (en) | 2016-06-10 | 2019-12-17 | Apple Inc. | Dynamic phrase expansion of language input |
US10521466B2 (en) | 2016-06-11 | 2019-12-31 | Apple Inc. | Data driven natural language event detection and classification |
US10529332B2 (en) | 2015-03-08 | 2020-01-07 | Apple Inc. | Virtual assistant activation |
US10567477B2 (en) | 2015-03-08 | 2020-02-18 | Apple Inc. | Virtual assistant continuity |
US10593346B2 (en) | 2016-12-22 | 2020-03-17 | Apple Inc. | Rank-reduced token representation for automatic speech recognition |
US10592604B2 (en) | 2018-03-12 | 2020-03-17 | Apple Inc. | Inverse text normalization for automatic speech recognition |
US10636424B2 (en) | 2017-11-30 | 2020-04-28 | Apple Inc. | Multi-turn canned dialog |
US10643611B2 (en) | 2008-10-02 | 2020-05-05 | Apple Inc. | Electronic devices with voice command and contextual data processing capabilities |
US10657961B2 (en) | 2013-06-08 | 2020-05-19 | Apple Inc. | Interpreting and acting upon commands that involve sharing information with remote devices |
US10657328B2 (en) | 2017-06-02 | 2020-05-19 | Apple Inc. | Multi-task recurrent neural network architecture for efficient morphology handling in neural language modeling |
US10671428B2 (en) | 2015-09-08 | 2020-06-02 | Apple Inc. | Distributed personal assistant |
US10684703B2 (en) | 2018-06-01 | 2020-06-16 | Apple Inc. | Attention aware virtual assistant dismissal |
US10691473B2 (en) | 2015-11-06 | 2020-06-23 | Apple Inc. | Intelligent automated assistant in a messaging environment |
US10699717B2 (en) | 2014-05-30 | 2020-06-30 | Apple Inc. | Intelligent assistant for home automation |
US10706841B2 (en) | 2010-01-18 | 2020-07-07 | Apple Inc. | Task flow identification based on user intent |
US10714117B2 (en) | 2013-02-07 | 2020-07-14 | Apple Inc. | Voice trigger for a digital assistant |
US10726832B2 (en) | 2017-05-11 | 2020-07-28 | Apple Inc. | Maintaining privacy of personal information |
US10733982B2 (en) | 2018-01-08 | 2020-08-04 | Apple Inc. | Multi-directional dialog |
US10733375B2 (en) | 2018-01-31 | 2020-08-04 | Apple Inc. | Knowledge-based framework for improving natural language understanding |
US10733993B2 (en) | 2016-06-10 | 2020-08-04 | Apple Inc. | Intelligent digital assistant in a multi-tasking environment |
US10741185B2 (en) | 2010-01-18 | 2020-08-11 | Apple Inc. | Intelligent automated assistant |
US10748546B2 (en) | 2017-05-16 | 2020-08-18 | Apple Inc. | Digital assistant services based on device capabilities |
US10747498B2 (en) | 2015-09-08 | 2020-08-18 | Apple Inc. | Zero latency digital assistant |
US10755703B2 (en) | 2017-05-11 | 2020-08-25 | Apple Inc. | Offline personal assistant |
US10755051B2 (en) | 2017-09-29 | 2020-08-25 | Apple Inc. | Rule-based natural language processing |
US10769385B2 (en) | 2013-06-09 | 2020-09-08 | Apple Inc. | System and method for inferring user intent from speech inputs |
CN111653265A (zh) * | 2020-04-26 | 2020-09-11 | 北京大米科技有限公司 | 语音合成方法、装置、存储介质和电子设备 |
CN111681641A (zh) * | 2020-05-26 | 2020-09-18 | 微软技术许可有限责任公司 | 基于短语的端对端文本到语音(tts)合成 |
US10789959B2 (en) | 2018-03-02 | 2020-09-29 | Apple Inc. | Training speaker recognition models for digital assistants |
US10789945B2 (en) | 2017-05-12 | 2020-09-29 | Apple Inc. | Low-latency intelligent automated assistant |
US10791176B2 (en) | 2017-05-12 | 2020-09-29 | Apple Inc. | Synchronization and task delegation of a digital assistant |
US10795541B2 (en) | 2009-06-05 | 2020-10-06 | Apple Inc. | Intelligent organization of tasks items |
US10810274B2 (en) | 2017-05-15 | 2020-10-20 | Apple Inc. | Optimizing dialogue policy decisions for digital assistants using implicit feedback |
US10818288B2 (en) | 2018-03-26 | 2020-10-27 | Apple Inc. | Natural assistant interaction |
US10839159B2 (en) | 2018-09-28 | 2020-11-17 | Apple Inc. | Named entity normalization in a spoken dialog system |
US10892996B2 (en) | 2018-06-01 | 2021-01-12 | Apple Inc. | Variable latency device coordination |
US10909331B2 (en) | 2018-03-30 | 2021-02-02 | Apple Inc. | Implicit identification of translation payload with neural machine translation |
US10928918B2 (en) | 2018-05-07 | 2021-02-23 | Apple Inc. | Raise to speak |
US10984780B2 (en) | 2018-05-21 | 2021-04-20 | Apple Inc. | Global semantic word embeddings using bi-directional recurrent neural networks |
US11010550B2 (en) | 2015-09-29 | 2021-05-18 | Apple Inc. | Unified language modeling framework for word prediction, auto-completion and auto-correction |
US11010127B2 (en) | 2015-06-29 | 2021-05-18 | Apple Inc. | Virtual assistant for media playback |
US11010561B2 (en) | 2018-09-27 | 2021-05-18 | Apple Inc. | Sentiment prediction from textual data |
US11025565B2 (en) | 2015-06-07 | 2021-06-01 | Apple Inc. | Personalized prediction of responses for instant messaging |
US11023513B2 (en) | 2007-12-20 | 2021-06-01 | Apple Inc. | Method and apparatus for searching using an active ontology |
US11048473B2 (en) | 2013-06-09 | 2021-06-29 | Apple Inc. | Device, method, and graphical user interface for enabling conversation persistence across two or more instances of a digital assistant |
US11080012B2 (en) | 2009-06-05 | 2021-08-03 | Apple Inc. | Interface for a virtual digital assistant |
US11120372B2 (en) | 2011-06-03 | 2021-09-14 | Apple Inc. | Performing actions associated with task items that represent tasks to perform |
US11127397B2 (en) | 2015-05-27 | 2021-09-21 | Apple Inc. | Device voice control |
US11133008B2 (en) | 2014-05-30 | 2021-09-28 | Apple Inc. | Reducing the need for manual start/end-pointing and trigger phrases |
US11140099B2 (en) | 2019-05-21 | 2021-10-05 | Apple Inc. | Providing message response suggestions |
US11145294B2 (en) | 2018-05-07 | 2021-10-12 | Apple Inc. | Intelligent automated assistant for delivering content from user experiences |
US11170166B2 (en) | 2018-09-28 | 2021-11-09 | Apple Inc. | Neural typographical error modeling via generative adversarial networks |
US11204787B2 (en) | 2017-01-09 | 2021-12-21 | Apple Inc. | Application integration with a digital assistant |
US11217251B2 (en) | 2019-05-06 | 2022-01-04 | Apple Inc. | Spoken notifications |
US11227589B2 (en) | 2016-06-06 | 2022-01-18 | Apple Inc. | Intelligent list reading |
US11231904B2 (en) | 2015-03-06 | 2022-01-25 | Apple Inc. | Reducing response latency of intelligent automated assistants |
US11237797B2 (en) | 2019-05-31 | 2022-02-01 | Apple Inc. | User activity shortcut suggestions |
US11269678B2 (en) | 2012-05-15 | 2022-03-08 | Apple Inc. | Systems and methods for integrating third party services with a digital assistant |
US11281993B2 (en) | 2016-12-05 | 2022-03-22 | Apple Inc. | Model and ensemble compression for metric learning |
US11289073B2 (en) | 2019-05-31 | 2022-03-29 | Apple Inc. | Device text to speech |
US11301477B2 (en) | 2017-05-12 | 2022-04-12 | Apple Inc. | Feedback analysis of a digital assistant |
US11307752B2 (en) | 2019-05-06 | 2022-04-19 | Apple Inc. | User configurable task triggers |
US11314370B2 (en) | 2013-12-06 | 2022-04-26 | Apple Inc. | Method for extracting salient dialog usage from live data |
US11350253B2 (en) | 2011-06-03 | 2022-05-31 | Apple Inc. | Active transport based notifications |
US11348573B2 (en) | 2019-03-18 | 2022-05-31 | Apple Inc. | Multimodality in digital assistant systems |
US11360641B2 (en) | 2019-06-01 | 2022-06-14 | Apple Inc. | Increasing the relevance of new available information |
US11388291B2 (en) | 2013-03-14 | 2022-07-12 | Apple Inc. | System and method for processing voicemail |
US11386266B2 (en) | 2018-06-01 | 2022-07-12 | Apple Inc. | Text correction |
US11423908B2 (en) | 2019-05-06 | 2022-08-23 | Apple Inc. | Interpreting spoken requests |
US11462215B2 (en) | 2018-09-28 | 2022-10-04 | Apple Inc. | Multi-modal inputs for voice commands |
US11468282B2 (en) | 2015-05-15 | 2022-10-11 | Apple Inc. | Virtual assistant in a communication session |
US11475898B2 (en) | 2018-10-26 | 2022-10-18 | Apple Inc. | Low-latency multi-speaker speech recognition |
US11475884B2 (en) | 2019-05-06 | 2022-10-18 | Apple Inc. | Reducing digital assistant latency when a language is incorrectly determined |
US11488406B2 (en) | 2019-09-25 | 2022-11-01 | Apple Inc. | Text detection using global geometry estimators |
US11495218B2 (en) | 2018-06-01 | 2022-11-08 | Apple Inc. | Virtual assistant operation in multi-device environments |
US11496600B2 (en) | 2019-05-31 | 2022-11-08 | Apple Inc. | Remote execution of machine-learned models |
US11532306B2 (en) | 2017-05-16 | 2022-12-20 | Apple Inc. | Detecting a trigger of a digital assistant |
US11638059B2 (en) | 2019-01-04 | 2023-04-25 | Apple Inc. | Content playback on multiple devices |
US11657813B2 (en) | 2019-05-31 | 2023-05-23 | Apple Inc. | Voice identification in digital assistant systems |
US11755276B2 (en) | 2020-05-12 | 2023-09-12 | Apple Inc. | Reducing description length based on confidence |
US11798547B2 (en) | 2013-03-15 | 2023-10-24 | Apple Inc. | Voice activated device for use with a voice-based digital assistant |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1179587A (zh) * | 1996-09-30 | 1998-04-22 | 微软公司 | 具有语音合成所使用的基本频率模板的韵律数据库 |
CN1271216A (zh) * | 1999-04-16 | 2000-10-25 | 松下电器产业株式会社 | 语音声音通信系统 |
CN1559068A (zh) * | 2001-09-25 | 2004-12-29 | Ħ��������˾ | 通信系统中文本到话音的本地编码 |
GB2405066A (en) * | 2003-05-13 | 2005-02-16 | Intellprop Ltd | Auditory assistance with language learning and pronunciation via a text to speech translation in a mobile communications device |
CN101452699A (zh) * | 2007-12-04 | 2009-06-10 | 株式会社东芝 | 韵律自适应及语音合成的方法和装置 |
-
2010
- 2010-06-30 CN CN2010102234937A patent/CN101894547A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1179587A (zh) * | 1996-09-30 | 1998-04-22 | 微软公司 | 具有语音合成所使用的基本频率模板的韵律数据库 |
CN1271216A (zh) * | 1999-04-16 | 2000-10-25 | 松下电器产业株式会社 | 语音声音通信系统 |
CN1559068A (zh) * | 2001-09-25 | 2004-12-29 | Ħ��������˾ | 通信系统中文本到话音的本地编码 |
GB2405066A (en) * | 2003-05-13 | 2005-02-16 | Intellprop Ltd | Auditory assistance with language learning and pronunciation via a text to speech translation in a mobile communications device |
CN101452699A (zh) * | 2007-12-04 | 2009-06-10 | 株式会社东芝 | 韵律自适应及语音合成的方法和装置 |
Cited By (206)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10318871B2 (en) | 2005-09-08 | 2019-06-11 | Apple Inc. | Method and apparatus for building an intelligent automated assistant |
US11928604B2 (en) | 2005-09-08 | 2024-03-12 | Apple Inc. | Method and apparatus for building an intelligent automated assistant |
US11023513B2 (en) | 2007-12-20 | 2021-06-01 | Apple Inc. | Method and apparatus for searching using an active ontology |
US10381016B2 (en) | 2008-01-03 | 2019-08-13 | Apple Inc. | Methods and apparatus for altering audio output signals |
US9865248B2 (en) | 2008-04-05 | 2018-01-09 | Apple Inc. | Intelligent text-to-speech conversion |
US10108612B2 (en) | 2008-07-31 | 2018-10-23 | Apple Inc. | Mobile device having human language translation capability with positional feedback |
US10643611B2 (en) | 2008-10-02 | 2020-05-05 | Apple Inc. | Electronic devices with voice command and contextual data processing capabilities |
US11348582B2 (en) | 2008-10-02 | 2022-05-31 | Apple Inc. | Electronic devices with voice command and contextual data processing capabilities |
US10795541B2 (en) | 2009-06-05 | 2020-10-06 | Apple Inc. | Intelligent organization of tasks items |
US11080012B2 (en) | 2009-06-05 | 2021-08-03 | Apple Inc. | Interface for a virtual digital assistant |
US10706841B2 (en) | 2010-01-18 | 2020-07-07 | Apple Inc. | Task flow identification based on user intent |
US10741185B2 (en) | 2010-01-18 | 2020-08-11 | Apple Inc. | Intelligent automated assistant |
US11423886B2 (en) | 2010-01-18 | 2022-08-23 | Apple Inc. | Task flow identification based on user intent |
US10049675B2 (en) | 2010-02-25 | 2018-08-14 | Apple Inc. | User profiling for voice input processing |
US10692504B2 (en) | 2010-02-25 | 2020-06-23 | Apple Inc. | User profiling for voice input processing |
CN102063897A (zh) * | 2010-12-09 | 2011-05-18 | 北京宇音天下科技有限公司 | 一种用于嵌入式语音合成系统的音库压缩及使用方法 |
CN103077704A (zh) * | 2010-12-09 | 2013-05-01 | 北京宇音天下科技有限公司 | 一种用于嵌入式语音合成系统的音库压缩及使用方法 |
CN102063897B (zh) * | 2010-12-09 | 2013-07-03 | 北京宇音天下科技有限公司 | 一种用于嵌入式语音合成系统的音库压缩及使用方法 |
US10417405B2 (en) | 2011-03-21 | 2019-09-17 | Apple Inc. | Device access using voice authentication |
CN102201232A (zh) * | 2011-06-01 | 2011-09-28 | 北京宇音天下科技有限公司 | 一种用于嵌入式语音合成系统的音库结构压缩及使用方法 |
US11120372B2 (en) | 2011-06-03 | 2021-09-14 | Apple Inc. | Performing actions associated with task items that represent tasks to perform |
US11350253B2 (en) | 2011-06-03 | 2022-05-31 | Apple Inc. | Active transport based notifications |
CN102413248A (zh) * | 2011-12-21 | 2012-04-11 | 广东步步高电子工业有限公司 | 手机编辑界面语音朗读方法 |
US10134385B2 (en) | 2012-03-02 | 2018-11-20 | Apple Inc. | Systems and methods for name pronunciation |
CN104380373A (zh) * | 2012-03-02 | 2015-02-25 | 苹果公司 | 用于名称发音的系统和方法 |
US11069336B2 (en) | 2012-03-02 | 2021-07-20 | Apple Inc. | Systems and methods for name pronunciation |
CN104380373B (zh) * | 2012-03-02 | 2017-08-25 | 苹果公司 | 用于名称发音的系统和方法 |
US11269678B2 (en) | 2012-05-15 | 2022-03-08 | Apple Inc. | Systems and methods for integrating third party services with a digital assistant |
US10079014B2 (en) | 2012-06-08 | 2018-09-18 | Apple Inc. | Name recognition system |
US9971774B2 (en) | 2012-09-19 | 2018-05-15 | Apple Inc. | Voice-based media searching |
CN103117062B (zh) * | 2013-01-22 | 2014-09-17 | 武汉大学 | 语音解码器中帧差错隐藏的谱参数代替方法及系统 |
CN103117062A (zh) * | 2013-01-22 | 2013-05-22 | 武汉大学 | 语音解码器中帧差错隐藏的谱参数代替方法及系统 |
US10714117B2 (en) | 2013-02-07 | 2020-07-14 | Apple Inc. | Voice trigger for a digital assistant |
US10978090B2 (en) | 2013-02-07 | 2021-04-13 | Apple Inc. | Voice trigger for a digital assistant |
US11388291B2 (en) | 2013-03-14 | 2022-07-12 | Apple Inc. | System and method for processing voicemail |
US11798547B2 (en) | 2013-03-15 | 2023-10-24 | Apple Inc. | Voice activated device for use with a voice-based digital assistant |
US9966060B2 (en) | 2013-06-07 | 2018-05-08 | Apple Inc. | System and method for user-specified pronunciation of words for speech synthesis and recognition |
US10657961B2 (en) | 2013-06-08 | 2020-05-19 | Apple Inc. | Interpreting and acting upon commands that involve sharing information with remote devices |
US11727219B2 (en) | 2013-06-09 | 2023-08-15 | Apple Inc. | System and method for inferring user intent from speech inputs |
US11048473B2 (en) | 2013-06-09 | 2021-06-29 | Apple Inc. | Device, method, and graphical user interface for enabling conversation persistence across two or more instances of a digital assistant |
US10769385B2 (en) | 2013-06-09 | 2020-09-08 | Apple Inc. | System and method for inferring user intent from speech inputs |
US11314370B2 (en) | 2013-12-06 | 2022-04-26 | Apple Inc. | Method for extracting salient dialog usage from live data |
US10417344B2 (en) | 2014-05-30 | 2019-09-17 | Apple Inc. | Exemplar-based natural language processing |
US10083690B2 (en) | 2014-05-30 | 2018-09-25 | Apple Inc. | Better resolution when referencing to concepts |
US10497365B2 (en) | 2014-05-30 | 2019-12-03 | Apple Inc. | Multi-command single utterance input method |
US11133008B2 (en) | 2014-05-30 | 2021-09-28 | Apple Inc. | Reducing the need for manual start/end-pointing and trigger phrases |
US11257504B2 (en) | 2014-05-30 | 2022-02-22 | Apple Inc. | Intelligent assistant for home automation |
US10878809B2 (en) | 2014-05-30 | 2020-12-29 | Apple Inc. | Multi-command single utterance input method |
US10714095B2 (en) | 2014-05-30 | 2020-07-14 | Apple Inc. | Intelligent assistant for home automation |
US10169329B2 (en) | 2014-05-30 | 2019-01-01 | Apple Inc. | Exemplar-based natural language processing |
US10657966B2 (en) | 2014-05-30 | 2020-05-19 | Apple Inc. | Better resolution when referencing to concepts |
US10699717B2 (en) | 2014-05-30 | 2020-06-30 | Apple Inc. | Intelligent assistant for home automation |
US10904611B2 (en) | 2014-06-30 | 2021-01-26 | Apple Inc. | Intelligent automated assistant for TV user interactions |
US9668024B2 (en) | 2014-06-30 | 2017-05-30 | Apple Inc. | Intelligent automated assistant for TV user interactions |
US10431204B2 (en) | 2014-09-11 | 2019-10-01 | Apple Inc. | Method and apparatus for discovering trending terms in speech requests |
US10453443B2 (en) | 2014-09-30 | 2019-10-22 | Apple Inc. | Providing an indication of the suitability of speech recognition |
US10438595B2 (en) | 2014-09-30 | 2019-10-08 | Apple Inc. | Speaker identification and unsupervised speaker adaptation techniques |
US10390213B2 (en) | 2014-09-30 | 2019-08-20 | Apple Inc. | Social reminders |
US9986419B2 (en) | 2014-09-30 | 2018-05-29 | Apple Inc. | Social reminders |
CN104538024A (zh) * | 2014-12-01 | 2015-04-22 | 百度在线网络技术(北京)有限公司 | 语音合成方法、装置及设备 |
CN104538024B (zh) * | 2014-12-01 | 2019-03-08 | 百度在线网络技术(北京)有限公司 | 语音合成方法、装置及设备 |
CN105895076B (zh) * | 2015-01-26 | 2019-11-15 | 科大讯飞股份有限公司 | 一种语音合成方法及系统 |
CN105895076A (zh) * | 2015-01-26 | 2016-08-24 | 科大讯飞股份有限公司 | 一种语音合成方法及系统 |
CN105895075B (zh) * | 2015-01-26 | 2019-11-15 | 科大讯飞股份有限公司 | 提高合成语音韵律自然度的方法及系统 |
CN105895075A (zh) * | 2015-01-26 | 2016-08-24 | 科大讯飞股份有限公司 | 提高合成语音韵律自然度的方法及系统 |
US11231904B2 (en) | 2015-03-06 | 2022-01-25 | Apple Inc. | Reducing response latency of intelligent automated assistants |
US10529332B2 (en) | 2015-03-08 | 2020-01-07 | Apple Inc. | Virtual assistant activation |
US10567477B2 (en) | 2015-03-08 | 2020-02-18 | Apple Inc. | Virtual assistant continuity |
US11087759B2 (en) | 2015-03-08 | 2021-08-10 | Apple Inc. | Virtual assistant activation |
US10930282B2 (en) | 2015-03-08 | 2021-02-23 | Apple Inc. | Competing devices responding to voice triggers |
US10311871B2 (en) | 2015-03-08 | 2019-06-04 | Apple Inc. | Competing devices responding to voice triggers |
US11468282B2 (en) | 2015-05-15 | 2022-10-11 | Apple Inc. | Virtual assistant in a communication session |
US11127397B2 (en) | 2015-05-27 | 2021-09-21 | Apple Inc. | Device voice control |
US10681212B2 (en) | 2015-06-05 | 2020-06-09 | Apple Inc. | Virtual assistant aided communication with 3rd party service in a communication session |
US10356243B2 (en) | 2015-06-05 | 2019-07-16 | Apple Inc. | Virtual assistant aided communication with 3rd party service in a communication session |
US11025565B2 (en) | 2015-06-07 | 2021-06-01 | Apple Inc. | Personalized prediction of responses for instant messaging |
US11010127B2 (en) | 2015-06-29 | 2021-05-18 | Apple Inc. | Virtual assistant for media playback |
US11500672B2 (en) | 2015-09-08 | 2022-11-15 | Apple Inc. | Distributed personal assistant |
US10671428B2 (en) | 2015-09-08 | 2020-06-02 | Apple Inc. | Distributed personal assistant |
US11126400B2 (en) | 2015-09-08 | 2021-09-21 | Apple Inc. | Zero latency digital assistant |
US10747498B2 (en) | 2015-09-08 | 2020-08-18 | Apple Inc. | Zero latency digital assistant |
CN105244022A (zh) * | 2015-09-28 | 2016-01-13 | 科大讯飞股份有限公司 | 音视频字幕生成方法及装置 |
CN105244022B (zh) * | 2015-09-28 | 2019-10-18 | 科大讯飞股份有限公司 | 音视频字幕生成方法及装置 |
US10366158B2 (en) | 2015-09-29 | 2019-07-30 | Apple Inc. | Efficient word encoding for recurrent neural network language models |
US11010550B2 (en) | 2015-09-29 | 2021-05-18 | Apple Inc. | Unified language modeling framework for word prediction, auto-completion and auto-correction |
CN105206257B (zh) * | 2015-10-14 | 2019-01-18 | 科大讯飞股份有限公司 | 一种声音转换方法及装置 |
CN105206257A (zh) * | 2015-10-14 | 2015-12-30 | 科大讯飞股份有限公司 | 一种声音转换方法及装置 |
US10691473B2 (en) | 2015-11-06 | 2020-06-23 | Apple Inc. | Intelligent automated assistant in a messaging environment |
US11526368B2 (en) | 2015-11-06 | 2022-12-13 | Apple Inc. | Intelligent automated assistant in a messaging environment |
US10354652B2 (en) | 2015-12-02 | 2019-07-16 | Apple Inc. | Applying neural network language models to weighted finite state transducers for automatic speech recognition |
US10049668B2 (en) | 2015-12-02 | 2018-08-14 | Apple Inc. | Applying neural network language models to weighted finite state transducers for automatic speech recognition |
US10942703B2 (en) | 2015-12-23 | 2021-03-09 | Apple Inc. | Proactive assistance based on dialog communication between devices |
US10223066B2 (en) | 2015-12-23 | 2019-03-05 | Apple Inc. | Proactive assistance based on dialog communication between devices |
US10446143B2 (en) | 2016-03-14 | 2019-10-15 | Apple Inc. | Identification of voice inputs providing credentials |
US9934775B2 (en) | 2016-05-26 | 2018-04-03 | Apple Inc. | Unit-selection text-to-speech synthesis based on predicted concatenation parameters |
US9972304B2 (en) | 2016-06-03 | 2018-05-15 | Apple Inc. | Privacy preserving distributed evaluation framework for embedded personalized systems |
US10249300B2 (en) | 2016-06-06 | 2019-04-02 | Apple Inc. | Intelligent list reading |
US11227589B2 (en) | 2016-06-06 | 2022-01-18 | Apple Inc. | Intelligent list reading |
US11069347B2 (en) | 2016-06-08 | 2021-07-20 | Apple Inc. | Intelligent automated assistant for media exploration |
US10049663B2 (en) | 2016-06-08 | 2018-08-14 | Apple, Inc. | Intelligent automated assistant for media exploration |
US10354011B2 (en) | 2016-06-09 | 2019-07-16 | Apple Inc. | Intelligent automated assistant in a home environment |
US10192552B2 (en) | 2016-06-10 | 2019-01-29 | Apple Inc. | Digital assistant providing whispered speech |
US10067938B2 (en) | 2016-06-10 | 2018-09-04 | Apple Inc. | Multilingual word prediction |
US10490187B2 (en) | 2016-06-10 | 2019-11-26 | Apple Inc. | Digital assistant providing automated status report |
US11037565B2 (en) | 2016-06-10 | 2021-06-15 | Apple Inc. | Intelligent digital assistant in a multi-tasking environment |
US10509862B2 (en) | 2016-06-10 | 2019-12-17 | Apple Inc. | Dynamic phrase expansion of language input |
US10733993B2 (en) | 2016-06-10 | 2020-08-04 | Apple Inc. | Intelligent digital assistant in a multi-tasking environment |
US10089072B2 (en) | 2016-06-11 | 2018-10-02 | Apple Inc. | Intelligent device arbitration and control |
US10942702B2 (en) | 2016-06-11 | 2021-03-09 | Apple Inc. | Intelligent device arbitration and control |
US10580409B2 (en) | 2016-06-11 | 2020-03-03 | Apple Inc. | Application integration with a digital assistant |
US11152002B2 (en) | 2016-06-11 | 2021-10-19 | Apple Inc. | Application integration with a digital assistant |
US10297253B2 (en) | 2016-06-11 | 2019-05-21 | Apple Inc. | Application integration with a digital assistant |
US10269345B2 (en) | 2016-06-11 | 2019-04-23 | Apple Inc. | Intelligent task discovery |
US10521466B2 (en) | 2016-06-11 | 2019-12-31 | Apple Inc. | Data driven natural language event detection and classification |
US10474753B2 (en) | 2016-09-07 | 2019-11-12 | Apple Inc. | Language identification using recurrent neural networks |
US10043516B2 (en) | 2016-09-23 | 2018-08-07 | Apple Inc. | Intelligent automated assistant |
US10553215B2 (en) | 2016-09-23 | 2020-02-04 | Apple Inc. | Intelligent automated assistant |
US11281993B2 (en) | 2016-12-05 | 2022-03-22 | Apple Inc. | Model and ensemble compression for metric learning |
US10593346B2 (en) | 2016-12-22 | 2020-03-17 | Apple Inc. | Rank-reduced token representation for automatic speech recognition |
US11204787B2 (en) | 2017-01-09 | 2021-12-21 | Apple Inc. | Application integration with a digital assistant |
US11656884B2 (en) | 2017-01-09 | 2023-05-23 | Apple Inc. | Application integration with a digital assistant |
CN106920547A (zh) * | 2017-02-21 | 2017-07-04 | 腾讯科技(上海)有限公司 | 语音转换方法和装置 |
US10417266B2 (en) | 2017-05-09 | 2019-09-17 | Apple Inc. | Context-aware ranking of intelligent response suggestions |
US10332518B2 (en) | 2017-05-09 | 2019-06-25 | Apple Inc. | User interface for correcting recognition errors |
US10741181B2 (en) | 2017-05-09 | 2020-08-11 | Apple Inc. | User interface for correcting recognition errors |
US10847142B2 (en) | 2017-05-11 | 2020-11-24 | Apple Inc. | Maintaining privacy of personal information |
US11599331B2 (en) | 2017-05-11 | 2023-03-07 | Apple Inc. | Maintaining privacy of personal information |
US10755703B2 (en) | 2017-05-11 | 2020-08-25 | Apple Inc. | Offline personal assistant |
US10395654B2 (en) | 2017-05-11 | 2019-08-27 | Apple Inc. | Text normalization based on a data-driven learning network |
US10726832B2 (en) | 2017-05-11 | 2020-07-28 | Apple Inc. | Maintaining privacy of personal information |
US11380310B2 (en) | 2017-05-12 | 2022-07-05 | Apple Inc. | Low-latency intelligent automated assistant |
US10791176B2 (en) | 2017-05-12 | 2020-09-29 | Apple Inc. | Synchronization and task delegation of a digital assistant |
US11301477B2 (en) | 2017-05-12 | 2022-04-12 | Apple Inc. | Feedback analysis of a digital assistant |
US10789945B2 (en) | 2017-05-12 | 2020-09-29 | Apple Inc. | Low-latency intelligent automated assistant |
US11405466B2 (en) | 2017-05-12 | 2022-08-02 | Apple Inc. | Synchronization and task delegation of a digital assistant |
US10410637B2 (en) | 2017-05-12 | 2019-09-10 | Apple Inc. | User-specific acoustic models |
US10810274B2 (en) | 2017-05-15 | 2020-10-20 | Apple Inc. | Optimizing dialogue policy decisions for digital assistants using implicit feedback |
US10482874B2 (en) | 2017-05-15 | 2019-11-19 | Apple Inc. | Hierarchical belief states for digital assistants |
US10403278B2 (en) | 2017-05-16 | 2019-09-03 | Apple Inc. | Methods and systems for phonetic matching in digital assistant services |
US10311144B2 (en) | 2017-05-16 | 2019-06-04 | Apple Inc. | Emoji word sense disambiguation |
US10748546B2 (en) | 2017-05-16 | 2020-08-18 | Apple Inc. | Digital assistant services based on device capabilities |
US11217255B2 (en) | 2017-05-16 | 2022-01-04 | Apple Inc. | Far-field extension for digital assistant services |
US10303715B2 (en) | 2017-05-16 | 2019-05-28 | Apple Inc. | Intelligent automated assistant for media exploration |
US11532306B2 (en) | 2017-05-16 | 2022-12-20 | Apple Inc. | Detecting a trigger of a digital assistant |
US10909171B2 (en) | 2017-05-16 | 2021-02-02 | Apple Inc. | Intelligent automated assistant for media exploration |
US10657328B2 (en) | 2017-06-02 | 2020-05-19 | Apple Inc. | Multi-task recurrent neural network architecture for efficient morphology handling in neural language modeling |
CN107273359A (zh) * | 2017-06-20 | 2017-10-20 | 北京四海心通科技有限公司 | 一种文本相似度确定方法 |
CN107749301A (zh) * | 2017-09-18 | 2018-03-02 | 得理电子(上海)有限公司 | 一种音色样本重构方法及系统、存储介质及终端设备 |
CN107749301B (zh) * | 2017-09-18 | 2021-03-09 | 得理电子(上海)有限公司 | 一种音色样本重构方法及系统、存储介质及终端设备 |
US10445429B2 (en) | 2017-09-21 | 2019-10-15 | Apple Inc. | Natural language understanding using vocabularies with compressed serialized tries |
WO2019056500A1 (zh) * | 2017-09-25 | 2019-03-28 | 平安科技(深圳)有限公司 | 电子装置、语音合成方法和计算机可读存储介质 |
CN107564511A (zh) * | 2017-09-25 | 2018-01-09 | 平安科技(深圳)有限公司 | 电子装置、语音合成方法和计算机可读存储介质 |
CN107705782A (zh) * | 2017-09-29 | 2018-02-16 | 百度在线网络技术(北京)有限公司 | 用于确定音素发音时长的方法和装置 |
US10755051B2 (en) | 2017-09-29 | 2020-08-25 | Apple Inc. | Rule-based natural language processing |
US10636424B2 (en) | 2017-11-30 | 2020-04-28 | Apple Inc. | Multi-turn canned dialog |
US10733982B2 (en) | 2018-01-08 | 2020-08-04 | Apple Inc. | Multi-directional dialog |
US10733375B2 (en) | 2018-01-31 | 2020-08-04 | Apple Inc. | Knowledge-based framework for improving natural language understanding |
CN108573694A (zh) * | 2018-02-01 | 2018-09-25 | 北京百度网讯科技有限公司 | 基于人工智能的语料扩充及语音合成系统构建方法及装置 |
CN108573694B (zh) * | 2018-02-01 | 2022-01-28 | 北京百度网讯科技有限公司 | 基于人工智能的语料扩充及语音合成系统构建方法及装置 |
US10789959B2 (en) | 2018-03-02 | 2020-09-29 | Apple Inc. | Training speaker recognition models for digital assistants |
US10592604B2 (en) | 2018-03-12 | 2020-03-17 | Apple Inc. | Inverse text normalization for automatic speech recognition |
US10818288B2 (en) | 2018-03-26 | 2020-10-27 | Apple Inc. | Natural assistant interaction |
US11710482B2 (en) | 2018-03-26 | 2023-07-25 | Apple Inc. | Natural assistant interaction |
US10909331B2 (en) | 2018-03-30 | 2021-02-02 | Apple Inc. | Implicit identification of translation payload with neural machine translation |
US10928918B2 (en) | 2018-05-07 | 2021-02-23 | Apple Inc. | Raise to speak |
US11169616B2 (en) | 2018-05-07 | 2021-11-09 | Apple Inc. | Raise to speak |
US11145294B2 (en) | 2018-05-07 | 2021-10-12 | Apple Inc. | Intelligent automated assistant for delivering content from user experiences |
US11854539B2 (en) | 2018-05-07 | 2023-12-26 | Apple Inc. | Intelligent automated assistant for delivering content from user experiences |
US10984780B2 (en) | 2018-05-21 | 2021-04-20 | Apple Inc. | Global semantic word embeddings using bi-directional recurrent neural networks |
US10684703B2 (en) | 2018-06-01 | 2020-06-16 | Apple Inc. | Attention aware virtual assistant dismissal |
US10720160B2 (en) | 2018-06-01 | 2020-07-21 | Apple Inc. | Voice interaction at a primary device to access call functionality of a companion device |
US10984798B2 (en) | 2018-06-01 | 2021-04-20 | Apple Inc. | Voice interaction at a primary device to access call functionality of a companion device |
US10892996B2 (en) | 2018-06-01 | 2021-01-12 | Apple Inc. | Variable latency device coordination |
US11495218B2 (en) | 2018-06-01 | 2022-11-08 | Apple Inc. | Virtual assistant operation in multi-device environments |
US10403283B1 (en) | 2018-06-01 | 2019-09-03 | Apple Inc. | Voice interaction at a primary device to access call functionality of a companion device |
US11431642B2 (en) | 2018-06-01 | 2022-08-30 | Apple Inc. | Variable latency device coordination |
US11386266B2 (en) | 2018-06-01 | 2022-07-12 | Apple Inc. | Text correction |
US11009970B2 (en) | 2018-06-01 | 2021-05-18 | Apple Inc. | Attention aware virtual assistant dismissal |
US10944859B2 (en) | 2018-06-03 | 2021-03-09 | Apple Inc. | Accelerated task performance |
US10496705B1 (en) | 2018-06-03 | 2019-12-03 | Apple Inc. | Accelerated task performance |
US10504518B1 (en) | 2018-06-03 | 2019-12-10 | Apple Inc. | Accelerated task performance |
CN109326270A (zh) * | 2018-09-18 | 2019-02-12 | 平安科技(深圳)有限公司 | 音频文件的生成方法、终端设备及介质 |
US11010561B2 (en) | 2018-09-27 | 2021-05-18 | Apple Inc. | Sentiment prediction from textual data |
US10839159B2 (en) | 2018-09-28 | 2020-11-17 | Apple Inc. | Named entity normalization in a spoken dialog system |
US11462215B2 (en) | 2018-09-28 | 2022-10-04 | Apple Inc. | Multi-modal inputs for voice commands |
US11170166B2 (en) | 2018-09-28 | 2021-11-09 | Apple Inc. | Neural typographical error modeling via generative adversarial networks |
US11475898B2 (en) | 2018-10-26 | 2022-10-18 | Apple Inc. | Low-latency multi-speaker speech recognition |
US11638059B2 (en) | 2019-01-04 | 2023-04-25 | Apple Inc. | Content playback on multiple devices |
US11348573B2 (en) | 2019-03-18 | 2022-05-31 | Apple Inc. | Multimodality in digital assistant systems |
US11307752B2 (en) | 2019-05-06 | 2022-04-19 | Apple Inc. | User configurable task triggers |
US11475884B2 (en) | 2019-05-06 | 2022-10-18 | Apple Inc. | Reducing digital assistant latency when a language is incorrectly determined |
US11423908B2 (en) | 2019-05-06 | 2022-08-23 | Apple Inc. | Interpreting spoken requests |
US11217251B2 (en) | 2019-05-06 | 2022-01-04 | Apple Inc. | Spoken notifications |
US11140099B2 (en) | 2019-05-21 | 2021-10-05 | Apple Inc. | Providing message response suggestions |
US11496600B2 (en) | 2019-05-31 | 2022-11-08 | Apple Inc. | Remote execution of machine-learned models |
US11289073B2 (en) | 2019-05-31 | 2022-03-29 | Apple Inc. | Device text to speech |
US11360739B2 (en) | 2019-05-31 | 2022-06-14 | Apple Inc. | User activity shortcut suggestions |
US11657813B2 (en) | 2019-05-31 | 2023-05-23 | Apple Inc. | Voice identification in digital assistant systems |
US11237797B2 (en) | 2019-05-31 | 2022-02-01 | Apple Inc. | User activity shortcut suggestions |
US11360641B2 (en) | 2019-06-01 | 2022-06-14 | Apple Inc. | Increasing the relevance of new available information |
US11488406B2 (en) | 2019-09-25 | 2022-11-01 | Apple Inc. | Text detection using global geometry estimators |
CN111653265A (zh) * | 2020-04-26 | 2020-09-11 | 北京大米科技有限公司 | 语音合成方法、装置、存储介质和电子设备 |
CN111653265B (zh) * | 2020-04-26 | 2023-08-18 | 北京大米科技有限公司 | 语音合成方法、装置、存储介质和电子设备 |
US11755276B2 (en) | 2020-05-12 | 2023-09-12 | Apple Inc. | Reducing description length based on confidence |
CN111681641A (zh) * | 2020-05-26 | 2020-09-18 | 微软技术许可有限责任公司 | 基于短语的端对端文本到语音(tts)合成 |
CN111681641B (zh) * | 2020-05-26 | 2024-02-06 | 微软技术许可有限责任公司 | 基于短语的端对端文本到语音(tts)合成 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101894547A (zh) | 一种语音合成方法和系统 | |
CN101095287B (zh) | 基于短消息的话音服务 | |
US20060069567A1 (en) | Methods, systems, and products for translating text to speech | |
US20070106513A1 (en) | Method for facilitating text to speech synthesis using a differential vocoder | |
US6681208B2 (en) | Text-to-speech native coding in a communication system | |
CN1212601C (zh) | 一种嵌入式语音合成方法及系统 | |
CN101901598A (zh) | 一种哼唱合成方法和系统 | |
CN108417222B (zh) | 加权有限状态变换器解码系统以及语音识别系统 | |
CN109102796A (zh) | 一种语音合成方法及装置 | |
US20060235685A1 (en) | Framework for voice conversion | |
CN111435592B (zh) | 一种语音识别方法、装置及终端设备 | |
US20060224385A1 (en) | Text-to-speech conversion in electronic device field | |
CN113436609B (zh) | 语音转换模型及其训练方法、语音转换方法及系统 | |
CN102109815A (zh) | 一种闹钟系统及使用该闹钟系统的手机 | |
CN113053357A (zh) | 语音合成方法、装置、设备和计算机可读存储介质 | |
CN111199160A (zh) | 即时通话语音的翻译方法、装置以及终端 | |
JP2002258894A (ja) | 音声データ圧縮・解凍装置及び方法 | |
CN110767233A (zh) | 一种语音转换系统及方法 | |
CN114242093A (zh) | 语音音色转换方法、装置、计算机设备和存储介质 | |
CN112580335A (zh) | 多音字消歧方法及装置 | |
CN112614482A (zh) | 移动端外语翻译方法、系统及存储介质 | |
CN106256001A (zh) | 信号分类方法和装置以及使用其的音频编码方法和装置 | |
WO2007076279A2 (en) | Method for classifying speech data | |
CN114038484B (zh) | 语音数据处理方法、装置、计算机设备和存储介质 | |
JP2010224419A (ja) | 音声合成装置、方法およびプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C02 | Deemed withdrawal of patent application after publication (patent law 2001) | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20101124 |