CN101894547A - 一种语音合成方法和系统 - Google Patents

一种语音合成方法和系统 Download PDF

Info

Publication number
CN101894547A
CN101894547A CN2010102234937A CN201010223493A CN101894547A CN 101894547 A CN101894547 A CN 101894547A CN 2010102234937 A CN2010102234937 A CN 2010102234937A CN 201010223493 A CN201010223493 A CN 201010223493A CN 101894547 A CN101894547 A CN 101894547A
Authority
CN
China
Prior art keywords
syllable
spectrum parameter
text
parameter
sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2010102234937A
Other languages
English (en)
Inventor
李健
张连毅
武卫东
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
JIETONG HUASHENG SPEECH TECHNOLOGY Co Ltd
Beijing Sinovoice Technology Co Ltd
Original Assignee
JIETONG HUASHENG SPEECH TECHNOLOGY Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by JIETONG HUASHENG SPEECH TECHNOLOGY Co Ltd filed Critical JIETONG HUASHENG SPEECH TECHNOLOGY Co Ltd
Priority to CN2010102234937A priority Critical patent/CN101894547A/zh
Publication of CN101894547A publication Critical patent/CN101894547A/zh
Pending legal-status Critical Current

Links

Images

Abstract

本发明提供了一种语音合成方法和系统,其中的方法具体包括:接收用户输入的文本;进行文本分析,获得与所述文本对应的音节序列,以及,该音节序列中每个音节的音节名称;针对所述音节序列中每个音节,根据其音节名称及上下文环境,结合统计参数模型,规划得到相应的时长参数和基频参数;针对所述音节序列中每个音节,根据其音节名称及上下文环境、时长参数及基频参数,从谱参数数据库中匹配得到对应的谱参数;根据所述音节序列中每个音节的时长参数、基频参数和谱参数,利用合成器得到与所述音节序列对应的语音数据。本发明能够应用于嵌入式设备,且在具有好的音质效果下有效降低数据存储空间占用。

Description

一种语音合成方法和系统
技术领域
本发明涉及语音合成技术领域,特别是涉及一种语音合成方法和系统。
背景技术
语音合成技术,又称文语转换(TTS,Text To Speech)技术,其能将任意文字信息转化为标准流畅的语音朗读出来,
目前的语音合成中,主要有两种方法:
一是波形拼接方法;
其基本思想是,预先录制一个语音库,在合成时,根据文本分析和韵律预测的结果,直接从语音库中选择出合适的录音片段,最后将所选的录音片段拼接在一起。
由于使用了原始录音,合成语音的音质可以得到保证;但是,要得到较好的合成结果,语音库需要事先存储大量的语音数据,合成结果与存储数据量的大小直接相关,即当语音库大幅减小后,其音质也会大幅下降。
例如,有些语音库至少需要1G以上的存储空间,这对于智能手机、车载终端、PDA(个人数码助理,Personal Digital Assistant)等嵌入式设备来说,是非常大的开销。
二是参数合成方法。
参数合成方法首先根据语音数据统计出一个参数模型,在合成时,根据用户的输入文本,结合参数模型规划出参数,然后再将这些参数用合成器合成。
由于所述参数模型经参数提取、模型统计得到,相对于预存储语音数据而言,此方法可以将存储空间压缩下来;但是,在参数提取、模型统计过程中会损失一些语音信息,所以,会导致合成语音的音质下降。
总之,需要本领域技术人员迫切解决的一个技术问题就是:如何能够提供一种在嵌入式设备上使用的具有好的音质效果的语音合成方法。
发明内容
本发明所要解决的技术问题是提供一种语音合成方法和系统,能够应用于嵌入式设备,且在具有好的音质效果下有效降低数据存储空间占用。
为了解决上述问题,本发明公开了一种语音合成方法,包括:
接收用户输入的文本;
进行文本分析,获得与所述文本对应的音节序列,以及,该音节序列中每个音节的音节名称;
针对所述音节序列中每个音节,根据其音节名称及上下文环境,结合统计参数模型,规划得到相应的时长参数和基频参数;
针对所述音节序列中每个音节,根据其音节名称及上下文环境、时长参数及基频参数,从谱参数数据库中匹配得到对应的谱参数;
根据所述音节序列中每个音节的时长参数、基频参数和谱参数,利用合成器得到与所述音节序列对应的语音数据。
优选的,所述谱参数数据库为通过以下步骤建立的数据库:
从原始录音数据中提取谱参数;
根据音节名称、上下文环境以及时长参数、基频参数,将对应的谱参数保存至谱参数数据库。
优选的,在保存谱参数前,所述建立数据库的步骤还包括:
对所述谱参数进行矢量量化压缩,以压缩后的谱参数进行保存操作;
所述方法还包括:
利用与压缩算法相对应的解压缩算法对匹配得到的谱参数进行还原,以解压缩后的谱参数进行语音数据的合成操作。
优选的,所述保存步骤包括:
分别对时长参数、基频参数进行分类;
根据音节名称、上下文环境以及所属的时长参数类别、基频参数类别,将对应的谱参数保存至谱参数数据库。
优选的,所述文本分析步骤包括:
对所述文本进行分词操作;
将所述文本中的数字符号转换为文字;
依据分词结果,对数字符号转换后的文本进行韵律预测;
根据韵律预测结果,将文本转换为音节序列,以及,基于音节映射表,得到该音节序列中每个音节的音节名称。
本发明还公开了一种语音合成系统,包括:
接口模块,用于接收用户输入的文本;
文本分析模块,用于进行文本分析,获得与所述文本对应的音节序列,以及,该音节序列中每个音节的音节名称;
参数规划模块,用于针对所述音节序列中每个音节,根据其音节名称及上下文环境,结合统计参数模型,规划得到相应的时长参数和基频参数;
谱参数数据库,用于根据音节名称、上下文环境以及时长参数、基频参数,存储音节所对应的谱参数;
谱参数匹配模块,用于针对所述音节序列中每个音节,根据其音节名称及上下文环境、时长参数及基频参数,从所述谱参数数据库中匹配得到对应的谱参数;
合成模块,用于根据所述音节序列中每个音节的时长参数、基频参数和谱参数,利用合成器得到与所述音节序列对应的语音数据。
优选的,所述谱参数为经过矢量量化压缩的谱参数;
所述系统还包括:
解压缩模块,用于利用与压缩算法相对应的解压缩算法对匹配得到的谱参数进行还原,所述解压缩后的谱参数作为所述合成模块的输入谱参数。
优选的,所述文本分析模块包括:
分词单元,用于对所述文本进行分词操作;
数字符号处理单元,用于将所述文本中的数字符号转换为文字;
韵律预测单元,用于依据分词结果,对数字符号转换后的文本进行韵律预测;
音节转换单元,用于根据韵律预测结果,将文本转换为音节序列,以及,基于音节映射表,得到该音节序列中每个音节的音节名称。
与现有技术相比,本发明具有以下优点:
本发明采用谱参数数据库存储特定音节的谱参数,这样,在用户输入文本时,可以从所述谱参数数据库中匹配得到与文本中音节对应的谱参数,然后将所述谱参数以及规划的时长参数、基频参数,利用合成器得到所述文本的语音数据。
由于相对于时长参数、基频参数而言,谱参数是最能表现发音人特色的音频参数,而且相对于特定音节来说也是最稳定的参数,其没有经过统计量化,因而,相对于现有技术采用经过统计训练的谱参数,本发明合成的语音数据更接近真人发音,音色更饱满圆润;而且,由于所述谱参数数据库仅需存储每个音节的若干个谱参数,故相对于现有的语音库,本发明可以大大降低数据存储空间。
进一步,本发明还可以在保证听感不受损失的前提下,对谱参数进行矢量量化压缩,以进一步降低数据存储空间。
附图说明
图1是本发明一种语音合成方法实施例的流程图;
图2是本发明一种语音合成系统实施例的结构图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
本发明实施例的核心构思之一在于,采用谱参数数据库存储特定音节的谱参数,这样,在用户在线输入文本时,可以根据文本中音节名称和上下文环境,以及,基于统计参数模型规划出的时长、基频参数,从所述谱参数数据库中匹配得到对应的谱参数,然后利用合成器得到所述文本的语音数据。
参照图1,示出了本发明一种语音合成方法实施例的流程图,具体可以包括:
步骤101、接收用户输入的文本;
所述用户输入的文本可以包括文字和数字符号,其中,所述文字可以是汉字、日文、韩文、英文等,或者,上述多种文字中的一种或者几种,如汉英组合等等,本发明对具体的文本不加以限制,以下主要以汉字为例。
步骤102、进行文本分析,获得与所述文本对应的音节序列,以及,该音节序列中每个音节的音节名称;
以下具体的文本“北京在2008-8-8举行了盛大的奥运会开幕式”为例,对所述文本分析步骤进行说明,具体可以包括:
子步骤A1、对所述文本进行分词操作;
分词结果:北京/在/2008-8-8/举行/了/盛大/的/奥运会/开幕式
子步骤A2、将所述文本中的数字符号转换为文字;
对应本例,所述数字符号转换也即,将“2008-8-8”转换为“二零零八年八月八日”,数字符号转换后的文本为“北京在二零零八年八月八日举行了盛大的奥运会开幕式”。
子步骤A3、依据分词结果,对数字符号转换后的文本进行韵律预测;
韵律预测结果:北京在二零零八年八月八日/举行了盛大的奥运会开幕式
子步骤A4、根据韵律预测结果,将文本转换为音节序列,以及,基于音节映射表,得到该音节序列中每个音节的音节名称。
音节序列:bei3 jing1 zai4 er4 ling2 ling2 ba1 nian2 ba1 yue 4 ba1 ri4Ju3 xing2 le5 sheng4 da4 de5 ao4 yun4 hui4 kai1 mu4 shi4
其中,数字12345代表声调,分别为一声、二声、三声、四声、轻声。在实际中,汉字音节的音节名称可通过查询汉字音节映射表得到,例如上例中的“bei3”即是音节名称。
步骤103、针对所述音节序列中每个音节,根据其音节名称及上下文环境,结合统计参数模型,规划得到相应的时长参数和基频参数;
所述上下文环境主要是指音节的位置信息,可以包括句首、句中和句末;对应上例,“bei3”的上下文环境是句首,而“ling2”的上下文环境则是句中。
在实际中,所述统计参数模型可通过离线训练得到,其存储有音节在不同上下文环境下所对应的参数。
例如,离线时,针对时长参数训练第一统计模型,针对基频参数训练第二统计模型;那么,在线规划时,可以直接从所述第一统计模型得到与音节相应的时长参数,以及,从所述第二统计模型得到与音节相应的基频参数。
步骤104、针对所述音节序列中每个音节,根据其音节名称及上下文环境、时长参数及基频参数,从谱参数数据库中匹配得到对应的谱参数;
在实际中,可通过以下离线步骤建立谱参数数据库:
步骤B1、从原始录音数据中提取谱参数;
作为录音素材,所述原始录音数据可直接从现有语音库中得到,本发明对此不加以限制。
谱参数可以用多种方法来描述,由于在量化特征和内插特性方面具有明显的优势,LSP(线谱对,Line Spectrum Pair)在编码中得到广泛的应用,故本发明实施例优先选用LSP来描述谱参数。
步骤B2、根据音节名称、上下文环境以及时长参数、基频参数,将对应的谱参数保存至谱参数数据库。
在具体实现中,所述子步骤B2可以进一步包括:
子步骤C1、分别对时长参数、基频参数进行分类;
子步骤C2、根据音节名称、上下文环境以及所属的时长参数类别、基频参数类别,将对应的谱参数保存至谱参数数据库。
例如,时长参数1到2为一类,2到3为一类;然后将音节名称、上下文环境以及所属的时长参数类别、基频参数类别等组合对应一个谱参数。相应地,在匹配时,应分别获取音节的时长参数及基频参数所属的类别,然后,从所述谱参数数据库中得到与该音节相应的谱参数。
由于所述谱参数数据库仅需存储音节的谱参数,具体地,对于一个音节而言,仅需存储其在不同上下文环境下的若干个谱参数,因而,相对于现有的语音库,可以降低数据存储空间。
步骤105、根据所述音节序列中每个音节的时长参数、基频参数和谱参数,利用合成器得到与所述音节序列对应的语音数据。
例如,可以采用LPC(线性预测编码,linear predictive coding)滤波器作为合成器,本发明对具体的合成器不加以限制。
为进一步降低数据存储空间,在本发明的一种优选实施例中,在步骤B2前,所述建立谱参数数据库的步骤还可以包括如下步骤:
对所述谱参数进行矢量量化压缩,以压缩后的谱参数进行保存操作;
相应地,所述语音合成方法还可以包括:
利用与压缩算法相对应的解压缩算法对匹配得到的谱参数进行还原,以解压缩后的谱参数进行语音数据的合成操作。
离线时,可首先将所述谱参数压缩成码字序列,然后为该码字序列建立一个索引标记,并将该索引标记和码字序列一起放入所述谱参数数据库中,其中,可以采用拼音、一些特殊符号的字符等符号来表示所述索引标记,可以使用HASH(哈希)表等方式建立索引表。
在线匹配时,可以首先查阅所述索引表得到索引标记,也即得到音节的码字序列,然后,通过与编码压缩相应的解压缩算法还原出未经压缩的谱参数。
本发明所采用的压缩算法可以是任意一种能够满足嵌入式设备存储空间要求、且能够达到听觉要求(用户满意)的算法。因此,本优选实施例能够在听感不受损失的前提下,进一步降低数据存储空间。
参照图2,示出了本发明一种语音合成系统实施例的结构图,具体可以包括:
接口模块201,用于接收用户输入的文本;
文本分析模块202,用于进行文本分析,获得与所述文本对应的音节序列,以及,该音节序列中每个音节的音节名称;
参数规划模块203,用于针对所述音节序列中每个音节,根据其音节名称及上下文环境,结合统计参数模型,规划得到相应的时长参数和基频参数;
谱参数数据库204,用于根据音节名称、上下文环境以及时长参数、基频参数,存储音节所对应的谱参数;
谱参数匹配模块205,用于针对所述音节序列中每个音节,根据其音节名称及上下文环境、时长参数及基频参数,从所述谱参数数据库中匹配得到对应的谱参数;
合成模块206,用于根据所述音节序列中每个音节的时长参数、基频参数和谱参数,利用合成器得到与所述音节序列对应的语音数据。
在实际中,所述文本分析模块202可以进一步包括:
分词单元,用于对所述文本进行分词操作;
数字符号处理单元,用于将所述文本中的数字符号转换为文字;
韵律预测单元,用于依据分词结果,对数字符号转换后的文本进行韵律预测;
音节转换单元,用于根据韵律预测结果,将文本转换为音节序列,以及,基于音节映射表,得到该音节序列中每个音节的音节名称。
本发明可以采用如下离线装置建立所述谱参数数据库204,所述离线装置具体可以包括:
提取模块D1,用于从原始录音数据中提取谱参数;
保存模块D2,用于根据音节名称、上下文环境以及时长参数、基频参数,将对应的谱参数保存至谱参数数据库。
在具体实现中,所述保存模块D2可以进一步包括如下单元结构:
分类单元E1,用于分别对时长参数、基频参数进行分类;
保存单元E2,根据音节名称、上下文环境以及所属的时长参数类别、基频参数类别,将对应的谱参数保存至谱参数数据库。
由于所述谱参数数据库仅需存储一个音节的若干个谱参数,因而,相对于现有的语音库,可以降低数据存储空间。
为进一步降低数据存储空间,在本发明的一种优选实施例中,可对所述谱参数进行矢量量化压缩;
此时,所述系统还可以包括:
解压缩模块,用于利用与压缩算法相对应的解压缩算法对匹配得到的谱参数进行还原,所述解压缩后的谱参数作为所述合成模块的输入信号。
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。对于系统实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本发明实施例无需过大的存储空间,可以应用于智能手机、车载终端、PDA等嵌入式设备中,且可以提供更接近真人发音、音色饱满圆润的语音。
以上对本发明所提供的一种语音合成方法和系统,进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (8)

1.一种语音合成方法,其特征在于,包括:
接收用户输入的文本;
进行文本分析,获得与所述文本对应的音节序列,以及,该音节序列中每个音节的音节名称;
针对所述音节序列中每个音节,根据其音节名称及上下文环境,结合统计参数模型,规划得到相应的时长参数和基频参数;
针对所述音节序列中每个音节,根据其音节名称及上下文环境、时长参数及基频参数,从谱参数数据库中匹配得到对应的谱参数;
根据所述音节序列中每个音节的时长参数、基频参数和谱参数,利用合成器得到与所述音节序列对应的语音数据。
2.如权利要求1所述的方法,其特征在于,所述谱参数数据库为通过以下步骤建立的数据库:
从原始录音数据中提取谱参数;
根据音节名称、上下文环境以及时长参数、基频参数,将对应的谱参数保存至谱参数数据库。
3.如权利要求2所述的方法,其特征在于,在保存谱参数前,所述建立数据库的步骤还包括:
对所述谱参数进行矢量量化压缩,以压缩后的谱参数进行保存操作;
所述方法还包括:
利用与压缩算法相对应的解压缩算法对匹配得到的谱参数进行还原,以解压缩后的谱参数进行语音数据的合成操作。
4.如权利要求2所述的方法,其特征在于,所述保存步骤包括:
分别对时长参数、基频参数进行分类;
根据音节名称、上下文环境以及所属的时长参数类别、基频参数类别,将对应的谱参数保存至谱参数数据库。
5.如权利要求1所述的方法,其特征在于,所述文本分析步骤包括:
对所述文本进行分词操作;
将所述文本中的数字符号转换为文字;
依据分词结果,对数字符号转换后的文本进行韵律预测;
根据韵律预测结果,将文本转换为音节序列,以及,基于音节映射表,得到该音节序列中每个音节的音节名称。
6.一种语音合成系统,其特征在于,包括:
接口模块,用于接收用户输入的文本;
文本分析模块,用于进行文本分析,获得与所述文本对应的音节序列,以及,该音节序列中每个音节的音节名称;
参数规划模块,用于针对所述音节序列中每个音节,根据其音节名称及上下文环境,结合统计参数模型,规划得到相应的时长参数和基频参数;
谱参数数据库,用于根据音节名称、上下文环境以及时长参数、基频参数,存储音节所对应的谱参数;
谱参数匹配模块,用于针对所述音节序列中每个音节,根据其音节名称及上下文环境、时长参数及基频参数,从所述谱参数数据库中匹配得到对应的谱参数;
合成模块,用于根据所述音节序列中每个音节的时长参数、基频参数和谱参数,利用合成器得到与所述音节序列对应的语音数据。
7.如权利要求6所述的系统,其特征在于,所述谱参数为经过矢量量化压缩的谱参数;
所述系统还包括:
解压缩模块,用于利用与压缩算法相对应的解压缩算法对匹配得到的谱参数进行还原,所述解压缩后的谱参数作为所述合成模块的输入谱参数。
8.如权利要求6所述的系统,其特征在于,所述文本分析模块包括:
分词单元,用于对所述文本进行分词操作;
数字符号处理单元,用于将所述文本中的数字符号转换为文字;
韵律预测单元,用于依据分词结果,对数字符号转换后的文本进行韵律预测;
音节转换单元,用于根据韵律预测结果,将文本转换为音节序列,以及,基于音节映射表,得到该音节序列中每个音节的音节名称。
CN2010102234937A 2010-06-30 2010-06-30 一种语音合成方法和系统 Pending CN101894547A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2010102234937A CN101894547A (zh) 2010-06-30 2010-06-30 一种语音合成方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2010102234937A CN101894547A (zh) 2010-06-30 2010-06-30 一种语音合成方法和系统

Publications (1)

Publication Number Publication Date
CN101894547A true CN101894547A (zh) 2010-11-24

Family

ID=43103718

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2010102234937A Pending CN101894547A (zh) 2010-06-30 2010-06-30 一种语音合成方法和系统

Country Status (1)

Country Link
CN (1) CN101894547A (zh)

Cited By (146)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102063897A (zh) * 2010-12-09 2011-05-18 北京宇音天下科技有限公司 一种用于嵌入式语音合成系统的音库压缩及使用方法
CN102201232A (zh) * 2011-06-01 2011-09-28 北京宇音天下科技有限公司 一种用于嵌入式语音合成系统的音库结构压缩及使用方法
CN102413248A (zh) * 2011-12-21 2012-04-11 广东步步高电子工业有限公司 手机编辑界面语音朗读方法
CN103077704A (zh) * 2010-12-09 2013-05-01 北京宇音天下科技有限公司 一种用于嵌入式语音合成系统的音库压缩及使用方法
CN103117062A (zh) * 2013-01-22 2013-05-22 武汉大学 语音解码器中帧差错隐藏的谱参数代替方法及系统
CN104380373A (zh) * 2012-03-02 2015-02-25 苹果公司 用于名称发音的系统和方法
CN104538024A (zh) * 2014-12-01 2015-04-22 百度在线网络技术(北京)有限公司 语音合成方法、装置及设备
CN105206257A (zh) * 2015-10-14 2015-12-30 科大讯飞股份有限公司 一种声音转换方法及装置
CN105244022A (zh) * 2015-09-28 2016-01-13 科大讯飞股份有限公司 音视频字幕生成方法及装置
CN105895076A (zh) * 2015-01-26 2016-08-24 科大讯飞股份有限公司 一种语音合成方法及系统
CN105895075A (zh) * 2015-01-26 2016-08-24 科大讯飞股份有限公司 提高合成语音韵律自然度的方法及系统
US9668024B2 (en) 2014-06-30 2017-05-30 Apple Inc. Intelligent automated assistant for TV user interactions
CN106920547A (zh) * 2017-02-21 2017-07-04 腾讯科技(上海)有限公司 语音转换方法和装置
CN107273359A (zh) * 2017-06-20 2017-10-20 北京四海心通科技有限公司 一种文本相似度确定方法
US9865248B2 (en) 2008-04-05 2018-01-09 Apple Inc. Intelligent text-to-speech conversion
CN107564511A (zh) * 2017-09-25 2018-01-09 平安科技(深圳)有限公司 电子装置、语音合成方法和计算机可读存储介质
CN107705782A (zh) * 2017-09-29 2018-02-16 百度在线网络技术(北京)有限公司 用于确定音素发音时长的方法和装置
CN107749301A (zh) * 2017-09-18 2018-03-02 得理电子(上海)有限公司 一种音色样本重构方法及系统、存储介质及终端设备
US9934775B2 (en) 2016-05-26 2018-04-03 Apple Inc. Unit-selection text-to-speech synthesis based on predicted concatenation parameters
US9966060B2 (en) 2013-06-07 2018-05-08 Apple Inc. System and method for user-specified pronunciation of words for speech synthesis and recognition
US9972304B2 (en) 2016-06-03 2018-05-15 Apple Inc. Privacy preserving distributed evaluation framework for embedded personalized systems
US9971774B2 (en) 2012-09-19 2018-05-15 Apple Inc. Voice-based media searching
US9986419B2 (en) 2014-09-30 2018-05-29 Apple Inc. Social reminders
US10043516B2 (en) 2016-09-23 2018-08-07 Apple Inc. Intelligent automated assistant
US10049668B2 (en) 2015-12-02 2018-08-14 Apple Inc. Applying neural network language models to weighted finite state transducers for automatic speech recognition
US10049675B2 (en) 2010-02-25 2018-08-14 Apple Inc. User profiling for voice input processing
US10049663B2 (en) 2016-06-08 2018-08-14 Apple, Inc. Intelligent automated assistant for media exploration
US10067938B2 (en) 2016-06-10 2018-09-04 Apple Inc. Multilingual word prediction
US10079014B2 (en) 2012-06-08 2018-09-18 Apple Inc. Name recognition system
US10083690B2 (en) 2014-05-30 2018-09-25 Apple Inc. Better resolution when referencing to concepts
CN108573694A (zh) * 2018-02-01 2018-09-25 北京百度网讯科技有限公司 基于人工智能的语料扩充及语音合成系统构建方法及装置
US10089072B2 (en) 2016-06-11 2018-10-02 Apple Inc. Intelligent device arbitration and control
US10108612B2 (en) 2008-07-31 2018-10-23 Apple Inc. Mobile device having human language translation capability with positional feedback
US10169329B2 (en) 2014-05-30 2019-01-01 Apple Inc. Exemplar-based natural language processing
US10192552B2 (en) 2016-06-10 2019-01-29 Apple Inc. Digital assistant providing whispered speech
CN109326270A (zh) * 2018-09-18 2019-02-12 平安科技(深圳)有限公司 音频文件的生成方法、终端设备及介质
US10223066B2 (en) 2015-12-23 2019-03-05 Apple Inc. Proactive assistance based on dialog communication between devices
US10249300B2 (en) 2016-06-06 2019-04-02 Apple Inc. Intelligent list reading
US10269345B2 (en) 2016-06-11 2019-04-23 Apple Inc. Intelligent task discovery
US10297253B2 (en) 2016-06-11 2019-05-21 Apple Inc. Application integration with a digital assistant
US10303715B2 (en) 2017-05-16 2019-05-28 Apple Inc. Intelligent automated assistant for media exploration
US10311871B2 (en) 2015-03-08 2019-06-04 Apple Inc. Competing devices responding to voice triggers
US10311144B2 (en) 2017-05-16 2019-06-04 Apple Inc. Emoji word sense disambiguation
US10318871B2 (en) 2005-09-08 2019-06-11 Apple Inc. Method and apparatus for building an intelligent automated assistant
US10332518B2 (en) 2017-05-09 2019-06-25 Apple Inc. User interface for correcting recognition errors
US10356243B2 (en) 2015-06-05 2019-07-16 Apple Inc. Virtual assistant aided communication with 3rd party service in a communication session
US10354011B2 (en) 2016-06-09 2019-07-16 Apple Inc. Intelligent automated assistant in a home environment
US10366158B2 (en) 2015-09-29 2019-07-30 Apple Inc. Efficient word encoding for recurrent neural network language models
US10381016B2 (en) 2008-01-03 2019-08-13 Apple Inc. Methods and apparatus for altering audio output signals
US10395654B2 (en) 2017-05-11 2019-08-27 Apple Inc. Text normalization based on a data-driven learning network
US10403278B2 (en) 2017-05-16 2019-09-03 Apple Inc. Methods and systems for phonetic matching in digital assistant services
US10403283B1 (en) 2018-06-01 2019-09-03 Apple Inc. Voice interaction at a primary device to access call functionality of a companion device
US10410637B2 (en) 2017-05-12 2019-09-10 Apple Inc. User-specific acoustic models
US10417266B2 (en) 2017-05-09 2019-09-17 Apple Inc. Context-aware ranking of intelligent response suggestions
US10417405B2 (en) 2011-03-21 2019-09-17 Apple Inc. Device access using voice authentication
US10431204B2 (en) 2014-09-11 2019-10-01 Apple Inc. Method and apparatus for discovering trending terms in speech requests
US10438595B2 (en) 2014-09-30 2019-10-08 Apple Inc. Speaker identification and unsupervised speaker adaptation techniques
US10446143B2 (en) 2016-03-14 2019-10-15 Apple Inc. Identification of voice inputs providing credentials
US10445429B2 (en) 2017-09-21 2019-10-15 Apple Inc. Natural language understanding using vocabularies with compressed serialized tries
US10453443B2 (en) 2014-09-30 2019-10-22 Apple Inc. Providing an indication of the suitability of speech recognition
US10474753B2 (en) 2016-09-07 2019-11-12 Apple Inc. Language identification using recurrent neural networks
US10482874B2 (en) 2017-05-15 2019-11-19 Apple Inc. Hierarchical belief states for digital assistants
US10490187B2 (en) 2016-06-10 2019-11-26 Apple Inc. Digital assistant providing automated status report
US10496705B1 (en) 2018-06-03 2019-12-03 Apple Inc. Accelerated task performance
US10497365B2 (en) 2014-05-30 2019-12-03 Apple Inc. Multi-command single utterance input method
US10509862B2 (en) 2016-06-10 2019-12-17 Apple Inc. Dynamic phrase expansion of language input
US10521466B2 (en) 2016-06-11 2019-12-31 Apple Inc. Data driven natural language event detection and classification
US10529332B2 (en) 2015-03-08 2020-01-07 Apple Inc. Virtual assistant activation
US10567477B2 (en) 2015-03-08 2020-02-18 Apple Inc. Virtual assistant continuity
US10593346B2 (en) 2016-12-22 2020-03-17 Apple Inc. Rank-reduced token representation for automatic speech recognition
US10592604B2 (en) 2018-03-12 2020-03-17 Apple Inc. Inverse text normalization for automatic speech recognition
US10636424B2 (en) 2017-11-30 2020-04-28 Apple Inc. Multi-turn canned dialog
US10643611B2 (en) 2008-10-02 2020-05-05 Apple Inc. Electronic devices with voice command and contextual data processing capabilities
US10657961B2 (en) 2013-06-08 2020-05-19 Apple Inc. Interpreting and acting upon commands that involve sharing information with remote devices
US10657328B2 (en) 2017-06-02 2020-05-19 Apple Inc. Multi-task recurrent neural network architecture for efficient morphology handling in neural language modeling
US10671428B2 (en) 2015-09-08 2020-06-02 Apple Inc. Distributed personal assistant
US10684703B2 (en) 2018-06-01 2020-06-16 Apple Inc. Attention aware virtual assistant dismissal
US10691473B2 (en) 2015-11-06 2020-06-23 Apple Inc. Intelligent automated assistant in a messaging environment
US10699717B2 (en) 2014-05-30 2020-06-30 Apple Inc. Intelligent assistant for home automation
US10706841B2 (en) 2010-01-18 2020-07-07 Apple Inc. Task flow identification based on user intent
US10714117B2 (en) 2013-02-07 2020-07-14 Apple Inc. Voice trigger for a digital assistant
US10726832B2 (en) 2017-05-11 2020-07-28 Apple Inc. Maintaining privacy of personal information
US10733982B2 (en) 2018-01-08 2020-08-04 Apple Inc. Multi-directional dialog
US10733375B2 (en) 2018-01-31 2020-08-04 Apple Inc. Knowledge-based framework for improving natural language understanding
US10733993B2 (en) 2016-06-10 2020-08-04 Apple Inc. Intelligent digital assistant in a multi-tasking environment
US10741185B2 (en) 2010-01-18 2020-08-11 Apple Inc. Intelligent automated assistant
US10748546B2 (en) 2017-05-16 2020-08-18 Apple Inc. Digital assistant services based on device capabilities
US10747498B2 (en) 2015-09-08 2020-08-18 Apple Inc. Zero latency digital assistant
US10755703B2 (en) 2017-05-11 2020-08-25 Apple Inc. Offline personal assistant
US10755051B2 (en) 2017-09-29 2020-08-25 Apple Inc. Rule-based natural language processing
US10769385B2 (en) 2013-06-09 2020-09-08 Apple Inc. System and method for inferring user intent from speech inputs
CN111653265A (zh) * 2020-04-26 2020-09-11 北京大米科技有限公司 语音合成方法、装置、存储介质和电子设备
CN111681641A (zh) * 2020-05-26 2020-09-18 微软技术许可有限责任公司 基于短语的端对端文本到语音(tts)合成
US10789959B2 (en) 2018-03-02 2020-09-29 Apple Inc. Training speaker recognition models for digital assistants
US10789945B2 (en) 2017-05-12 2020-09-29 Apple Inc. Low-latency intelligent automated assistant
US10791176B2 (en) 2017-05-12 2020-09-29 Apple Inc. Synchronization and task delegation of a digital assistant
US10795541B2 (en) 2009-06-05 2020-10-06 Apple Inc. Intelligent organization of tasks items
US10810274B2 (en) 2017-05-15 2020-10-20 Apple Inc. Optimizing dialogue policy decisions for digital assistants using implicit feedback
US10818288B2 (en) 2018-03-26 2020-10-27 Apple Inc. Natural assistant interaction
US10839159B2 (en) 2018-09-28 2020-11-17 Apple Inc. Named entity normalization in a spoken dialog system
US10892996B2 (en) 2018-06-01 2021-01-12 Apple Inc. Variable latency device coordination
US10909331B2 (en) 2018-03-30 2021-02-02 Apple Inc. Implicit identification of translation payload with neural machine translation
US10928918B2 (en) 2018-05-07 2021-02-23 Apple Inc. Raise to speak
US10984780B2 (en) 2018-05-21 2021-04-20 Apple Inc. Global semantic word embeddings using bi-directional recurrent neural networks
US11010550B2 (en) 2015-09-29 2021-05-18 Apple Inc. Unified language modeling framework for word prediction, auto-completion and auto-correction
US11010127B2 (en) 2015-06-29 2021-05-18 Apple Inc. Virtual assistant for media playback
US11010561B2 (en) 2018-09-27 2021-05-18 Apple Inc. Sentiment prediction from textual data
US11025565B2 (en) 2015-06-07 2021-06-01 Apple Inc. Personalized prediction of responses for instant messaging
US11023513B2 (en) 2007-12-20 2021-06-01 Apple Inc. Method and apparatus for searching using an active ontology
US11048473B2 (en) 2013-06-09 2021-06-29 Apple Inc. Device, method, and graphical user interface for enabling conversation persistence across two or more instances of a digital assistant
US11080012B2 (en) 2009-06-05 2021-08-03 Apple Inc. Interface for a virtual digital assistant
US11120372B2 (en) 2011-06-03 2021-09-14 Apple Inc. Performing actions associated with task items that represent tasks to perform
US11127397B2 (en) 2015-05-27 2021-09-21 Apple Inc. Device voice control
US11133008B2 (en) 2014-05-30 2021-09-28 Apple Inc. Reducing the need for manual start/end-pointing and trigger phrases
US11140099B2 (en) 2019-05-21 2021-10-05 Apple Inc. Providing message response suggestions
US11145294B2 (en) 2018-05-07 2021-10-12 Apple Inc. Intelligent automated assistant for delivering content from user experiences
US11170166B2 (en) 2018-09-28 2021-11-09 Apple Inc. Neural typographical error modeling via generative adversarial networks
US11204787B2 (en) 2017-01-09 2021-12-21 Apple Inc. Application integration with a digital assistant
US11217251B2 (en) 2019-05-06 2022-01-04 Apple Inc. Spoken notifications
US11227589B2 (en) 2016-06-06 2022-01-18 Apple Inc. Intelligent list reading
US11231904B2 (en) 2015-03-06 2022-01-25 Apple Inc. Reducing response latency of intelligent automated assistants
US11237797B2 (en) 2019-05-31 2022-02-01 Apple Inc. User activity shortcut suggestions
US11269678B2 (en) 2012-05-15 2022-03-08 Apple Inc. Systems and methods for integrating third party services with a digital assistant
US11281993B2 (en) 2016-12-05 2022-03-22 Apple Inc. Model and ensemble compression for metric learning
US11289073B2 (en) 2019-05-31 2022-03-29 Apple Inc. Device text to speech
US11301477B2 (en) 2017-05-12 2022-04-12 Apple Inc. Feedback analysis of a digital assistant
US11307752B2 (en) 2019-05-06 2022-04-19 Apple Inc. User configurable task triggers
US11314370B2 (en) 2013-12-06 2022-04-26 Apple Inc. Method for extracting salient dialog usage from live data
US11350253B2 (en) 2011-06-03 2022-05-31 Apple Inc. Active transport based notifications
US11348573B2 (en) 2019-03-18 2022-05-31 Apple Inc. Multimodality in digital assistant systems
US11360641B2 (en) 2019-06-01 2022-06-14 Apple Inc. Increasing the relevance of new available information
US11388291B2 (en) 2013-03-14 2022-07-12 Apple Inc. System and method for processing voicemail
US11386266B2 (en) 2018-06-01 2022-07-12 Apple Inc. Text correction
US11423908B2 (en) 2019-05-06 2022-08-23 Apple Inc. Interpreting spoken requests
US11462215B2 (en) 2018-09-28 2022-10-04 Apple Inc. Multi-modal inputs for voice commands
US11468282B2 (en) 2015-05-15 2022-10-11 Apple Inc. Virtual assistant in a communication session
US11475898B2 (en) 2018-10-26 2022-10-18 Apple Inc. Low-latency multi-speaker speech recognition
US11475884B2 (en) 2019-05-06 2022-10-18 Apple Inc. Reducing digital assistant latency when a language is incorrectly determined
US11488406B2 (en) 2019-09-25 2022-11-01 Apple Inc. Text detection using global geometry estimators
US11495218B2 (en) 2018-06-01 2022-11-08 Apple Inc. Virtual assistant operation in multi-device environments
US11496600B2 (en) 2019-05-31 2022-11-08 Apple Inc. Remote execution of machine-learned models
US11532306B2 (en) 2017-05-16 2022-12-20 Apple Inc. Detecting a trigger of a digital assistant
US11638059B2 (en) 2019-01-04 2023-04-25 Apple Inc. Content playback on multiple devices
US11657813B2 (en) 2019-05-31 2023-05-23 Apple Inc. Voice identification in digital assistant systems
US11755276B2 (en) 2020-05-12 2023-09-12 Apple Inc. Reducing description length based on confidence
US11798547B2 (en) 2013-03-15 2023-10-24 Apple Inc. Voice activated device for use with a voice-based digital assistant

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1179587A (zh) * 1996-09-30 1998-04-22 微软公司 具有语音合成所使用的基本频率模板的韵律数据库
CN1271216A (zh) * 1999-04-16 2000-10-25 松下电器产业株式会社 语音声音通信系统
CN1559068A (zh) * 2001-09-25 2004-12-29 Ħ��������˾ 通信系统中文本到话音的本地编码
GB2405066A (en) * 2003-05-13 2005-02-16 Intellprop Ltd Auditory assistance with language learning and pronunciation via a text to speech translation in a mobile communications device
CN101452699A (zh) * 2007-12-04 2009-06-10 株式会社东芝 韵律自适应及语音合成的方法和装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1179587A (zh) * 1996-09-30 1998-04-22 微软公司 具有语音合成所使用的基本频率模板的韵律数据库
CN1271216A (zh) * 1999-04-16 2000-10-25 松下电器产业株式会社 语音声音通信系统
CN1559068A (zh) * 2001-09-25 2004-12-29 Ħ��������˾ 通信系统中文本到话音的本地编码
GB2405066A (en) * 2003-05-13 2005-02-16 Intellprop Ltd Auditory assistance with language learning and pronunciation via a text to speech translation in a mobile communications device
CN101452699A (zh) * 2007-12-04 2009-06-10 株式会社东芝 韵律自适应及语音合成的方法和装置

Cited By (206)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10318871B2 (en) 2005-09-08 2019-06-11 Apple Inc. Method and apparatus for building an intelligent automated assistant
US11928604B2 (en) 2005-09-08 2024-03-12 Apple Inc. Method and apparatus for building an intelligent automated assistant
US11023513B2 (en) 2007-12-20 2021-06-01 Apple Inc. Method and apparatus for searching using an active ontology
US10381016B2 (en) 2008-01-03 2019-08-13 Apple Inc. Methods and apparatus for altering audio output signals
US9865248B2 (en) 2008-04-05 2018-01-09 Apple Inc. Intelligent text-to-speech conversion
US10108612B2 (en) 2008-07-31 2018-10-23 Apple Inc. Mobile device having human language translation capability with positional feedback
US10643611B2 (en) 2008-10-02 2020-05-05 Apple Inc. Electronic devices with voice command and contextual data processing capabilities
US11348582B2 (en) 2008-10-02 2022-05-31 Apple Inc. Electronic devices with voice command and contextual data processing capabilities
US10795541B2 (en) 2009-06-05 2020-10-06 Apple Inc. Intelligent organization of tasks items
US11080012B2 (en) 2009-06-05 2021-08-03 Apple Inc. Interface for a virtual digital assistant
US10706841B2 (en) 2010-01-18 2020-07-07 Apple Inc. Task flow identification based on user intent
US10741185B2 (en) 2010-01-18 2020-08-11 Apple Inc. Intelligent automated assistant
US11423886B2 (en) 2010-01-18 2022-08-23 Apple Inc. Task flow identification based on user intent
US10049675B2 (en) 2010-02-25 2018-08-14 Apple Inc. User profiling for voice input processing
US10692504B2 (en) 2010-02-25 2020-06-23 Apple Inc. User profiling for voice input processing
CN102063897A (zh) * 2010-12-09 2011-05-18 北京宇音天下科技有限公司 一种用于嵌入式语音合成系统的音库压缩及使用方法
CN103077704A (zh) * 2010-12-09 2013-05-01 北京宇音天下科技有限公司 一种用于嵌入式语音合成系统的音库压缩及使用方法
CN102063897B (zh) * 2010-12-09 2013-07-03 北京宇音天下科技有限公司 一种用于嵌入式语音合成系统的音库压缩及使用方法
US10417405B2 (en) 2011-03-21 2019-09-17 Apple Inc. Device access using voice authentication
CN102201232A (zh) * 2011-06-01 2011-09-28 北京宇音天下科技有限公司 一种用于嵌入式语音合成系统的音库结构压缩及使用方法
US11120372B2 (en) 2011-06-03 2021-09-14 Apple Inc. Performing actions associated with task items that represent tasks to perform
US11350253B2 (en) 2011-06-03 2022-05-31 Apple Inc. Active transport based notifications
CN102413248A (zh) * 2011-12-21 2012-04-11 广东步步高电子工业有限公司 手机编辑界面语音朗读方法
US10134385B2 (en) 2012-03-02 2018-11-20 Apple Inc. Systems and methods for name pronunciation
CN104380373A (zh) * 2012-03-02 2015-02-25 苹果公司 用于名称发音的系统和方法
US11069336B2 (en) 2012-03-02 2021-07-20 Apple Inc. Systems and methods for name pronunciation
CN104380373B (zh) * 2012-03-02 2017-08-25 苹果公司 用于名称发音的系统和方法
US11269678B2 (en) 2012-05-15 2022-03-08 Apple Inc. Systems and methods for integrating third party services with a digital assistant
US10079014B2 (en) 2012-06-08 2018-09-18 Apple Inc. Name recognition system
US9971774B2 (en) 2012-09-19 2018-05-15 Apple Inc. Voice-based media searching
CN103117062B (zh) * 2013-01-22 2014-09-17 武汉大学 语音解码器中帧差错隐藏的谱参数代替方法及系统
CN103117062A (zh) * 2013-01-22 2013-05-22 武汉大学 语音解码器中帧差错隐藏的谱参数代替方法及系统
US10714117B2 (en) 2013-02-07 2020-07-14 Apple Inc. Voice trigger for a digital assistant
US10978090B2 (en) 2013-02-07 2021-04-13 Apple Inc. Voice trigger for a digital assistant
US11388291B2 (en) 2013-03-14 2022-07-12 Apple Inc. System and method for processing voicemail
US11798547B2 (en) 2013-03-15 2023-10-24 Apple Inc. Voice activated device for use with a voice-based digital assistant
US9966060B2 (en) 2013-06-07 2018-05-08 Apple Inc. System and method for user-specified pronunciation of words for speech synthesis and recognition
US10657961B2 (en) 2013-06-08 2020-05-19 Apple Inc. Interpreting and acting upon commands that involve sharing information with remote devices
US11727219B2 (en) 2013-06-09 2023-08-15 Apple Inc. System and method for inferring user intent from speech inputs
US11048473B2 (en) 2013-06-09 2021-06-29 Apple Inc. Device, method, and graphical user interface for enabling conversation persistence across two or more instances of a digital assistant
US10769385B2 (en) 2013-06-09 2020-09-08 Apple Inc. System and method for inferring user intent from speech inputs
US11314370B2 (en) 2013-12-06 2022-04-26 Apple Inc. Method for extracting salient dialog usage from live data
US10417344B2 (en) 2014-05-30 2019-09-17 Apple Inc. Exemplar-based natural language processing
US10083690B2 (en) 2014-05-30 2018-09-25 Apple Inc. Better resolution when referencing to concepts
US10497365B2 (en) 2014-05-30 2019-12-03 Apple Inc. Multi-command single utterance input method
US11133008B2 (en) 2014-05-30 2021-09-28 Apple Inc. Reducing the need for manual start/end-pointing and trigger phrases
US11257504B2 (en) 2014-05-30 2022-02-22 Apple Inc. Intelligent assistant for home automation
US10878809B2 (en) 2014-05-30 2020-12-29 Apple Inc. Multi-command single utterance input method
US10714095B2 (en) 2014-05-30 2020-07-14 Apple Inc. Intelligent assistant for home automation
US10169329B2 (en) 2014-05-30 2019-01-01 Apple Inc. Exemplar-based natural language processing
US10657966B2 (en) 2014-05-30 2020-05-19 Apple Inc. Better resolution when referencing to concepts
US10699717B2 (en) 2014-05-30 2020-06-30 Apple Inc. Intelligent assistant for home automation
US10904611B2 (en) 2014-06-30 2021-01-26 Apple Inc. Intelligent automated assistant for TV user interactions
US9668024B2 (en) 2014-06-30 2017-05-30 Apple Inc. Intelligent automated assistant for TV user interactions
US10431204B2 (en) 2014-09-11 2019-10-01 Apple Inc. Method and apparatus for discovering trending terms in speech requests
US10453443B2 (en) 2014-09-30 2019-10-22 Apple Inc. Providing an indication of the suitability of speech recognition
US10438595B2 (en) 2014-09-30 2019-10-08 Apple Inc. Speaker identification and unsupervised speaker adaptation techniques
US10390213B2 (en) 2014-09-30 2019-08-20 Apple Inc. Social reminders
US9986419B2 (en) 2014-09-30 2018-05-29 Apple Inc. Social reminders
CN104538024A (zh) * 2014-12-01 2015-04-22 百度在线网络技术(北京)有限公司 语音合成方法、装置及设备
CN104538024B (zh) * 2014-12-01 2019-03-08 百度在线网络技术(北京)有限公司 语音合成方法、装置及设备
CN105895076B (zh) * 2015-01-26 2019-11-15 科大讯飞股份有限公司 一种语音合成方法及系统
CN105895076A (zh) * 2015-01-26 2016-08-24 科大讯飞股份有限公司 一种语音合成方法及系统
CN105895075B (zh) * 2015-01-26 2019-11-15 科大讯飞股份有限公司 提高合成语音韵律自然度的方法及系统
CN105895075A (zh) * 2015-01-26 2016-08-24 科大讯飞股份有限公司 提高合成语音韵律自然度的方法及系统
US11231904B2 (en) 2015-03-06 2022-01-25 Apple Inc. Reducing response latency of intelligent automated assistants
US10529332B2 (en) 2015-03-08 2020-01-07 Apple Inc. Virtual assistant activation
US10567477B2 (en) 2015-03-08 2020-02-18 Apple Inc. Virtual assistant continuity
US11087759B2 (en) 2015-03-08 2021-08-10 Apple Inc. Virtual assistant activation
US10930282B2 (en) 2015-03-08 2021-02-23 Apple Inc. Competing devices responding to voice triggers
US10311871B2 (en) 2015-03-08 2019-06-04 Apple Inc. Competing devices responding to voice triggers
US11468282B2 (en) 2015-05-15 2022-10-11 Apple Inc. Virtual assistant in a communication session
US11127397B2 (en) 2015-05-27 2021-09-21 Apple Inc. Device voice control
US10681212B2 (en) 2015-06-05 2020-06-09 Apple Inc. Virtual assistant aided communication with 3rd party service in a communication session
US10356243B2 (en) 2015-06-05 2019-07-16 Apple Inc. Virtual assistant aided communication with 3rd party service in a communication session
US11025565B2 (en) 2015-06-07 2021-06-01 Apple Inc. Personalized prediction of responses for instant messaging
US11010127B2 (en) 2015-06-29 2021-05-18 Apple Inc. Virtual assistant for media playback
US11500672B2 (en) 2015-09-08 2022-11-15 Apple Inc. Distributed personal assistant
US10671428B2 (en) 2015-09-08 2020-06-02 Apple Inc. Distributed personal assistant
US11126400B2 (en) 2015-09-08 2021-09-21 Apple Inc. Zero latency digital assistant
US10747498B2 (en) 2015-09-08 2020-08-18 Apple Inc. Zero latency digital assistant
CN105244022A (zh) * 2015-09-28 2016-01-13 科大讯飞股份有限公司 音视频字幕生成方法及装置
CN105244022B (zh) * 2015-09-28 2019-10-18 科大讯飞股份有限公司 音视频字幕生成方法及装置
US10366158B2 (en) 2015-09-29 2019-07-30 Apple Inc. Efficient word encoding for recurrent neural network language models
US11010550B2 (en) 2015-09-29 2021-05-18 Apple Inc. Unified language modeling framework for word prediction, auto-completion and auto-correction
CN105206257B (zh) * 2015-10-14 2019-01-18 科大讯飞股份有限公司 一种声音转换方法及装置
CN105206257A (zh) * 2015-10-14 2015-12-30 科大讯飞股份有限公司 一种声音转换方法及装置
US10691473B2 (en) 2015-11-06 2020-06-23 Apple Inc. Intelligent automated assistant in a messaging environment
US11526368B2 (en) 2015-11-06 2022-12-13 Apple Inc. Intelligent automated assistant in a messaging environment
US10354652B2 (en) 2015-12-02 2019-07-16 Apple Inc. Applying neural network language models to weighted finite state transducers for automatic speech recognition
US10049668B2 (en) 2015-12-02 2018-08-14 Apple Inc. Applying neural network language models to weighted finite state transducers for automatic speech recognition
US10942703B2 (en) 2015-12-23 2021-03-09 Apple Inc. Proactive assistance based on dialog communication between devices
US10223066B2 (en) 2015-12-23 2019-03-05 Apple Inc. Proactive assistance based on dialog communication between devices
US10446143B2 (en) 2016-03-14 2019-10-15 Apple Inc. Identification of voice inputs providing credentials
US9934775B2 (en) 2016-05-26 2018-04-03 Apple Inc. Unit-selection text-to-speech synthesis based on predicted concatenation parameters
US9972304B2 (en) 2016-06-03 2018-05-15 Apple Inc. Privacy preserving distributed evaluation framework for embedded personalized systems
US10249300B2 (en) 2016-06-06 2019-04-02 Apple Inc. Intelligent list reading
US11227589B2 (en) 2016-06-06 2022-01-18 Apple Inc. Intelligent list reading
US11069347B2 (en) 2016-06-08 2021-07-20 Apple Inc. Intelligent automated assistant for media exploration
US10049663B2 (en) 2016-06-08 2018-08-14 Apple, Inc. Intelligent automated assistant for media exploration
US10354011B2 (en) 2016-06-09 2019-07-16 Apple Inc. Intelligent automated assistant in a home environment
US10192552B2 (en) 2016-06-10 2019-01-29 Apple Inc. Digital assistant providing whispered speech
US10067938B2 (en) 2016-06-10 2018-09-04 Apple Inc. Multilingual word prediction
US10490187B2 (en) 2016-06-10 2019-11-26 Apple Inc. Digital assistant providing automated status report
US11037565B2 (en) 2016-06-10 2021-06-15 Apple Inc. Intelligent digital assistant in a multi-tasking environment
US10509862B2 (en) 2016-06-10 2019-12-17 Apple Inc. Dynamic phrase expansion of language input
US10733993B2 (en) 2016-06-10 2020-08-04 Apple Inc. Intelligent digital assistant in a multi-tasking environment
US10089072B2 (en) 2016-06-11 2018-10-02 Apple Inc. Intelligent device arbitration and control
US10942702B2 (en) 2016-06-11 2021-03-09 Apple Inc. Intelligent device arbitration and control
US10580409B2 (en) 2016-06-11 2020-03-03 Apple Inc. Application integration with a digital assistant
US11152002B2 (en) 2016-06-11 2021-10-19 Apple Inc. Application integration with a digital assistant
US10297253B2 (en) 2016-06-11 2019-05-21 Apple Inc. Application integration with a digital assistant
US10269345B2 (en) 2016-06-11 2019-04-23 Apple Inc. Intelligent task discovery
US10521466B2 (en) 2016-06-11 2019-12-31 Apple Inc. Data driven natural language event detection and classification
US10474753B2 (en) 2016-09-07 2019-11-12 Apple Inc. Language identification using recurrent neural networks
US10043516B2 (en) 2016-09-23 2018-08-07 Apple Inc. Intelligent automated assistant
US10553215B2 (en) 2016-09-23 2020-02-04 Apple Inc. Intelligent automated assistant
US11281993B2 (en) 2016-12-05 2022-03-22 Apple Inc. Model and ensemble compression for metric learning
US10593346B2 (en) 2016-12-22 2020-03-17 Apple Inc. Rank-reduced token representation for automatic speech recognition
US11204787B2 (en) 2017-01-09 2021-12-21 Apple Inc. Application integration with a digital assistant
US11656884B2 (en) 2017-01-09 2023-05-23 Apple Inc. Application integration with a digital assistant
CN106920547A (zh) * 2017-02-21 2017-07-04 腾讯科技(上海)有限公司 语音转换方法和装置
US10417266B2 (en) 2017-05-09 2019-09-17 Apple Inc. Context-aware ranking of intelligent response suggestions
US10332518B2 (en) 2017-05-09 2019-06-25 Apple Inc. User interface for correcting recognition errors
US10741181B2 (en) 2017-05-09 2020-08-11 Apple Inc. User interface for correcting recognition errors
US10847142B2 (en) 2017-05-11 2020-11-24 Apple Inc. Maintaining privacy of personal information
US11599331B2 (en) 2017-05-11 2023-03-07 Apple Inc. Maintaining privacy of personal information
US10755703B2 (en) 2017-05-11 2020-08-25 Apple Inc. Offline personal assistant
US10395654B2 (en) 2017-05-11 2019-08-27 Apple Inc. Text normalization based on a data-driven learning network
US10726832B2 (en) 2017-05-11 2020-07-28 Apple Inc. Maintaining privacy of personal information
US11380310B2 (en) 2017-05-12 2022-07-05 Apple Inc. Low-latency intelligent automated assistant
US10791176B2 (en) 2017-05-12 2020-09-29 Apple Inc. Synchronization and task delegation of a digital assistant
US11301477B2 (en) 2017-05-12 2022-04-12 Apple Inc. Feedback analysis of a digital assistant
US10789945B2 (en) 2017-05-12 2020-09-29 Apple Inc. Low-latency intelligent automated assistant
US11405466B2 (en) 2017-05-12 2022-08-02 Apple Inc. Synchronization and task delegation of a digital assistant
US10410637B2 (en) 2017-05-12 2019-09-10 Apple Inc. User-specific acoustic models
US10810274B2 (en) 2017-05-15 2020-10-20 Apple Inc. Optimizing dialogue policy decisions for digital assistants using implicit feedback
US10482874B2 (en) 2017-05-15 2019-11-19 Apple Inc. Hierarchical belief states for digital assistants
US10403278B2 (en) 2017-05-16 2019-09-03 Apple Inc. Methods and systems for phonetic matching in digital assistant services
US10311144B2 (en) 2017-05-16 2019-06-04 Apple Inc. Emoji word sense disambiguation
US10748546B2 (en) 2017-05-16 2020-08-18 Apple Inc. Digital assistant services based on device capabilities
US11217255B2 (en) 2017-05-16 2022-01-04 Apple Inc. Far-field extension for digital assistant services
US10303715B2 (en) 2017-05-16 2019-05-28 Apple Inc. Intelligent automated assistant for media exploration
US11532306B2 (en) 2017-05-16 2022-12-20 Apple Inc. Detecting a trigger of a digital assistant
US10909171B2 (en) 2017-05-16 2021-02-02 Apple Inc. Intelligent automated assistant for media exploration
US10657328B2 (en) 2017-06-02 2020-05-19 Apple Inc. Multi-task recurrent neural network architecture for efficient morphology handling in neural language modeling
CN107273359A (zh) * 2017-06-20 2017-10-20 北京四海心通科技有限公司 一种文本相似度确定方法
CN107749301A (zh) * 2017-09-18 2018-03-02 得理电子(上海)有限公司 一种音色样本重构方法及系统、存储介质及终端设备
CN107749301B (zh) * 2017-09-18 2021-03-09 得理电子(上海)有限公司 一种音色样本重构方法及系统、存储介质及终端设备
US10445429B2 (en) 2017-09-21 2019-10-15 Apple Inc. Natural language understanding using vocabularies with compressed serialized tries
WO2019056500A1 (zh) * 2017-09-25 2019-03-28 平安科技(深圳)有限公司 电子装置、语音合成方法和计算机可读存储介质
CN107564511A (zh) * 2017-09-25 2018-01-09 平安科技(深圳)有限公司 电子装置、语音合成方法和计算机可读存储介质
CN107705782A (zh) * 2017-09-29 2018-02-16 百度在线网络技术(北京)有限公司 用于确定音素发音时长的方法和装置
US10755051B2 (en) 2017-09-29 2020-08-25 Apple Inc. Rule-based natural language processing
US10636424B2 (en) 2017-11-30 2020-04-28 Apple Inc. Multi-turn canned dialog
US10733982B2 (en) 2018-01-08 2020-08-04 Apple Inc. Multi-directional dialog
US10733375B2 (en) 2018-01-31 2020-08-04 Apple Inc. Knowledge-based framework for improving natural language understanding
CN108573694A (zh) * 2018-02-01 2018-09-25 北京百度网讯科技有限公司 基于人工智能的语料扩充及语音合成系统构建方法及装置
CN108573694B (zh) * 2018-02-01 2022-01-28 北京百度网讯科技有限公司 基于人工智能的语料扩充及语音合成系统构建方法及装置
US10789959B2 (en) 2018-03-02 2020-09-29 Apple Inc. Training speaker recognition models for digital assistants
US10592604B2 (en) 2018-03-12 2020-03-17 Apple Inc. Inverse text normalization for automatic speech recognition
US10818288B2 (en) 2018-03-26 2020-10-27 Apple Inc. Natural assistant interaction
US11710482B2 (en) 2018-03-26 2023-07-25 Apple Inc. Natural assistant interaction
US10909331B2 (en) 2018-03-30 2021-02-02 Apple Inc. Implicit identification of translation payload with neural machine translation
US10928918B2 (en) 2018-05-07 2021-02-23 Apple Inc. Raise to speak
US11169616B2 (en) 2018-05-07 2021-11-09 Apple Inc. Raise to speak
US11145294B2 (en) 2018-05-07 2021-10-12 Apple Inc. Intelligent automated assistant for delivering content from user experiences
US11854539B2 (en) 2018-05-07 2023-12-26 Apple Inc. Intelligent automated assistant for delivering content from user experiences
US10984780B2 (en) 2018-05-21 2021-04-20 Apple Inc. Global semantic word embeddings using bi-directional recurrent neural networks
US10684703B2 (en) 2018-06-01 2020-06-16 Apple Inc. Attention aware virtual assistant dismissal
US10720160B2 (en) 2018-06-01 2020-07-21 Apple Inc. Voice interaction at a primary device to access call functionality of a companion device
US10984798B2 (en) 2018-06-01 2021-04-20 Apple Inc. Voice interaction at a primary device to access call functionality of a companion device
US10892996B2 (en) 2018-06-01 2021-01-12 Apple Inc. Variable latency device coordination
US11495218B2 (en) 2018-06-01 2022-11-08 Apple Inc. Virtual assistant operation in multi-device environments
US10403283B1 (en) 2018-06-01 2019-09-03 Apple Inc. Voice interaction at a primary device to access call functionality of a companion device
US11431642B2 (en) 2018-06-01 2022-08-30 Apple Inc. Variable latency device coordination
US11386266B2 (en) 2018-06-01 2022-07-12 Apple Inc. Text correction
US11009970B2 (en) 2018-06-01 2021-05-18 Apple Inc. Attention aware virtual assistant dismissal
US10944859B2 (en) 2018-06-03 2021-03-09 Apple Inc. Accelerated task performance
US10496705B1 (en) 2018-06-03 2019-12-03 Apple Inc. Accelerated task performance
US10504518B1 (en) 2018-06-03 2019-12-10 Apple Inc. Accelerated task performance
CN109326270A (zh) * 2018-09-18 2019-02-12 平安科技(深圳)有限公司 音频文件的生成方法、终端设备及介质
US11010561B2 (en) 2018-09-27 2021-05-18 Apple Inc. Sentiment prediction from textual data
US10839159B2 (en) 2018-09-28 2020-11-17 Apple Inc. Named entity normalization in a spoken dialog system
US11462215B2 (en) 2018-09-28 2022-10-04 Apple Inc. Multi-modal inputs for voice commands
US11170166B2 (en) 2018-09-28 2021-11-09 Apple Inc. Neural typographical error modeling via generative adversarial networks
US11475898B2 (en) 2018-10-26 2022-10-18 Apple Inc. Low-latency multi-speaker speech recognition
US11638059B2 (en) 2019-01-04 2023-04-25 Apple Inc. Content playback on multiple devices
US11348573B2 (en) 2019-03-18 2022-05-31 Apple Inc. Multimodality in digital assistant systems
US11307752B2 (en) 2019-05-06 2022-04-19 Apple Inc. User configurable task triggers
US11475884B2 (en) 2019-05-06 2022-10-18 Apple Inc. Reducing digital assistant latency when a language is incorrectly determined
US11423908B2 (en) 2019-05-06 2022-08-23 Apple Inc. Interpreting spoken requests
US11217251B2 (en) 2019-05-06 2022-01-04 Apple Inc. Spoken notifications
US11140099B2 (en) 2019-05-21 2021-10-05 Apple Inc. Providing message response suggestions
US11496600B2 (en) 2019-05-31 2022-11-08 Apple Inc. Remote execution of machine-learned models
US11289073B2 (en) 2019-05-31 2022-03-29 Apple Inc. Device text to speech
US11360739B2 (en) 2019-05-31 2022-06-14 Apple Inc. User activity shortcut suggestions
US11657813B2 (en) 2019-05-31 2023-05-23 Apple Inc. Voice identification in digital assistant systems
US11237797B2 (en) 2019-05-31 2022-02-01 Apple Inc. User activity shortcut suggestions
US11360641B2 (en) 2019-06-01 2022-06-14 Apple Inc. Increasing the relevance of new available information
US11488406B2 (en) 2019-09-25 2022-11-01 Apple Inc. Text detection using global geometry estimators
CN111653265A (zh) * 2020-04-26 2020-09-11 北京大米科技有限公司 语音合成方法、装置、存储介质和电子设备
CN111653265B (zh) * 2020-04-26 2023-08-18 北京大米科技有限公司 语音合成方法、装置、存储介质和电子设备
US11755276B2 (en) 2020-05-12 2023-09-12 Apple Inc. Reducing description length based on confidence
CN111681641A (zh) * 2020-05-26 2020-09-18 微软技术许可有限责任公司 基于短语的端对端文本到语音(tts)合成
CN111681641B (zh) * 2020-05-26 2024-02-06 微软技术许可有限责任公司 基于短语的端对端文本到语音(tts)合成

Similar Documents

Publication Publication Date Title
CN101894547A (zh) 一种语音合成方法和系统
CN101095287B (zh) 基于短消息的话音服务
US20060069567A1 (en) Methods, systems, and products for translating text to speech
US20070106513A1 (en) Method for facilitating text to speech synthesis using a differential vocoder
US6681208B2 (en) Text-to-speech native coding in a communication system
CN1212601C (zh) 一种嵌入式语音合成方法及系统
CN101901598A (zh) 一种哼唱合成方法和系统
CN108417222B (zh) 加权有限状态变换器解码系统以及语音识别系统
CN109102796A (zh) 一种语音合成方法及装置
US20060235685A1 (en) Framework for voice conversion
CN111435592B (zh) 一种语音识别方法、装置及终端设备
US20060224385A1 (en) Text-to-speech conversion in electronic device field
CN113436609B (zh) 语音转换模型及其训练方法、语音转换方法及系统
CN102109815A (zh) 一种闹钟系统及使用该闹钟系统的手机
CN113053357A (zh) 语音合成方法、装置、设备和计算机可读存储介质
CN111199160A (zh) 即时通话语音的翻译方法、装置以及终端
JP2002258894A (ja) 音声データ圧縮・解凍装置及び方法
CN110767233A (zh) 一种语音转换系统及方法
CN114242093A (zh) 语音音色转换方法、装置、计算机设备和存储介质
CN112580335A (zh) 多音字消歧方法及装置
CN112614482A (zh) 移动端外语翻译方法、系统及存储介质
CN106256001A (zh) 信号分类方法和装置以及使用其的音频编码方法和装置
WO2007076279A2 (en) Method for classifying speech data
CN114038484B (zh) 语音数据处理方法、装置、计算机设备和存储介质
JP2010224419A (ja) 音声合成装置、方法およびプログラム

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20101124