CN106205602A - 语音播放方法和系统 - Google Patents

语音播放方法和系统 Download PDF

Info

Publication number
CN106205602A
CN106205602A CN201510228084.9A CN201510228084A CN106205602A CN 106205602 A CN106205602 A CN 106205602A CN 201510228084 A CN201510228084 A CN 201510228084A CN 106205602 A CN106205602 A CN 106205602A
Authority
CN
China
Prior art keywords
voice
target subject
sound bank
text message
described target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201510228084.9A
Other languages
English (en)
Inventor
郝飞
刘旺
石英乔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
SAIC Motor Corp Ltd
Original Assignee
SAIC Motor Corp Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SAIC Motor Corp Ltd filed Critical SAIC Motor Corp Ltd
Priority to CN201510228084.9A priority Critical patent/CN106205602A/zh
Publication of CN106205602A publication Critical patent/CN106205602A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Electrically Operated Instructional Devices (AREA)

Abstract

一种语音播放方法和系统,所述方法包括:确定待播放语音对应的文本信息;判断预设的目标主体语音库中是否存在所述文本信息对应的语音;其中,采用所述目标主体的语音文件对预设的语音库进行重建得到所述目标主体语音库;当确定所述预设的目标主体语音库中存在所述文本信息对应的语音时,将所述语音作为待播放语音进行播放;当确定所述预设的目标主体语音库中不存在所述文本信息对应的语音时采用所述目标主体的语音特征和所述文本信息进行语音合成,得到所述待播放语音并播放。上述的方案可以提高语音播放的个性化程度,提升用户的使用体验。

Description

语音播放方法和系统
技术领域
本发明涉及语音技术领域,特别是涉及一种语音播放方法和系统。
背景技术
车载信息娱乐系统(In-Vehicle Infotainment,IVI),是采用车载专用中央处理器,基于车身总线系统和互联网服务,形成的车载综合信息处理系统。车载信息娱乐系统能够实现包括三维导航、实时路况、交互式网络电视(IPTV)、辅助驾驶、故障检测、车辆信息、车身控制、移动办公、无线通讯、基于在线的娱乐功能及关键服务提供者(Telematics Service Provider,TSP)服务等一系列应用,极大的提升的车辆电子化、网络化和智能化水平。
随着车载信息娱乐系统的功能的发展,车载信息娱乐系统中的语音交互也变得越来越频繁。除了传统的导航语音之外,车载信息娱乐系统中还增加了诸如语音搜索交互、车与外界(Vehicle to X,V2X)语音交互等不同的需求。众多的语音交互场景,使得驾驶员和乘客对于语音交互的流畅度、准确性和使用体验的要求也逐步提高。
现有技术中,已经出现使用明星声音进行语音交互的车载信息娱乐系统,例如,车载导航系统。但是,这种车载信息娱乐系统语音,无法满足不同用户的个性化需求。因此,现有技术中的车载语音交互系统存在着个性化程度较差的问题。
发明内容
本发明实施例解决的是如何提高语音播放的个性化程度,提升用户的使用体验。
为解决上述问题,本发明实施例提供了一种语音播放方法,所述方法包括:
确定待播放语音对应的文本信息;
判断预设的目标主体语音库中是否存在所述文本信息对应的语音;其中,采用所述目标主体的语音文件对预设的语音库进行重建得到所述目标主体语音库;
当确定所述预设的目标主体语音库中存在所述文本信息对应的语音时,将所述语音作为待播放语音进行播放;
当确定所述预设的目标主体语音库中不存在所述文本信息对应的语音时,采用所述目标主体的语音特征和所述文本信息进行语音合成,得到所述待播放语音并播放。
可选地,所述采用所述目标主体的语音文件对预设的语音库进行重建得到所述目标用户语音库,包括:
采集所述目标主体的语音数据,构成所述目标主体的语音训练样本集;
对所采集的所述目标用户的语音训练样本集进行训练,得到所述目标主体的语音特征,并采用所得到的目标主体的语音特征对预设的语音库进行语音分析合成处理,得到所述目标主体的语音库。
可选地,所述采集所述目标主体的语音数据,包括:采用车载信息娱乐系统的麦克风、移动终端或者个人电脑采集所述目标主体的语音数据。
可选地,所述对所采集的所述目标用户的语音训练样本集进行训练,得到所述目标主体的语音特征,并采用所得到的目标主体的语音特征对预设的语音库进行语音分析合成处理,得到所述目标主体的语音库,包括:采用车载信息娱乐系统或者云端服务器对所采集的所述目标用户的语音训练样本集进行训练,得到所述目标主体的语音特征,并采用所得到的目标主体的语音特征对预设的语音库进行语音分析合成处理,得到所述目标主体的语音库。
可选地,所述采用所述目标主体的语音文件对预设的语音库进行重建得到所述目标用户语音库,还包括:
获取用户对所述目标主体语音库中语音的调节参数的信息;
采用所获取的调节参数的信息,对所述目标主体语音库中的语音进行调节,得到最终的目标主体语音库中的语音。
可选地,所述调节参数包括以下至少一种:基频、频谱、语速和断句间隔。
本发明实施中的一种语音播放系统,所述系统包括:
确定单元,适于确定待播放语音对应的文本信息;
判断单元,适于判断预设的目标主体语音库中是否存在所述文本信息对应的语音;
语音库生成单元,适于采用所述目标主体的语音文件对预设的语音库进行重建得到所述目标主体语音库;
播放单元,适于当确定所述预设的目标主体语音库中存在所述文本信息对应的语音时,将所述语音作为待播放语音进行播放;当确定所述预设的目标主体语音库中不存在所述文本信息对应的语音时,采用合成单元得到的所述待播放语音并播放;
合成单元,适于当确定所述预设的目标主体语音库中不存在所述文本信息对应的语音时,采用所述目标主体的语音特征和所述文本信息进行语音合成,得到所述待播放语音并播放。
可选地,所述语音库生成单元包括:
采集子单元,适于采集所述目标主体的语音数据,构成所述目标主体的语音训练样本集;
训练生成子单元,适于对所采集的所述目标主体的语音训练样本集进行训练,得到所述目标主体的语音特征,并采用所得到的目标主体的语音特征对预设的语音库进行语音分析合成处理,得到所述目标主体的语音库。
可选地,所述语音库生成单元还包括:
获取子单元,适于获取用户对所述目标主体语音库中语音的调节参数的信息;
调节子单元,适于采用所获取的调节参数的信息,对所述目标主体语音库中的语音进行调节,得到最终的目标用户语音库中的语音。
可选地,所述训练生成子单元、获取子单元和调节子单元集成于车载信息娱乐系统或者云端服务器中。
可选地,所述调节参数包括以下至少一种:基频、频谱、语速和断句间隔。
可选地,所述采集子单元为车载信息娱乐系统的麦克风、移动终端或者个人电脑。
与现有技术相比,本发明的技术方案具有以下的优点:
上述的方案,使用目标主体的语音作为车载信息娱乐系统的语音进行播放,可以根据用户的不同需求,制作出不同的目标主体的语音库进行车载信息娱乐系统的语音播放,可以满足不同用户对于语音播放的需求,提升用户的使用体验。
进一步地,当使用目标主体的语音文件生成所述目标用户的语音库之后,接收并采用用户对所述目标主体的语音库中的语音的调节参数的信息,对所述目标主体语音库中的语音进行调节,得到最终的目标主体语音库中的语音,使得所述目标主体语音库中的语音更能满足用户的需求,因而可以进一步提升用户的使用体验。
进一步地,使用云端服务器采用目标主体的语音文件对预设的语音库进行重建得到所述目标主体的语音库,并传输至车载信息娱乐系统中进行存储,以用户车载信息娱乐系统的语音播放,可以节省车载信息娱乐系统的资源。
附图说明
图1是本发明实施例中的一种语音播放方法的流程图;
图2是本发明实施例中的采用所述目标主体的语音文件对预设的语音库进行重建得到所述目标用户语音库的流程图;
图3是本发明实施例中的一种语音播放系统的结构示意图;
图4是本发明实施例中的另一种语音播放系统的结构示意图;
图5是本发明实施例中的又一种语音播放系统的结构示意图。
具体实施方式
现有技术中,已经出现使用明星声音进行语音交互的车载信息娱乐系统,例如,车载导航系统。但是,这种车载信息娱乐系统语音,无法满足不同用户的个性化需求。因此,现有技术中的车载语音交互系统存在着个性化程度较低的问题。
为解决现有技术中存在的上述问题,本发明实施例采用的技术方案使用目标用户的语音作为车载信息娱乐系统的语音进行播放,可以根据用户的不同需求,制作出不同的目标用户的语音库进行车载信息娱乐系统的语音播放,可以满足不同用户对于语音播放的需求,提升用户的使用体验。
为使本发明的上述目的、特征和优点能够更为明显易懂,下面结合附图对本发明的具体实施例作详细的说明。
图1示出了本发明实施例中的一种语音播放方法的流程图。如图1所示的语音播放方法,可以包括:
步骤S101:确定待播放语音对应的文本信息。
在具体实施中,用户在使用车载信息娱乐系统中的导航、音乐播放等功能时,车载信息娱乐系统可以不同的应用场景,得到当前待播放语音对应的文本信息。例如,用户在使用车载导航仪将用户从起始位置出发导航至目的位置的过程中,车载导航仪可以根据用户驾驶车辆的实时位置、驾驶和路况等信息,首先可以确定待播放语音对应的文本信息,例如,“直行100米后左转”、“当前路段限速80公里,您已超速,请减速慢行”等文本信息。
步骤S102:判断预设的目标主体语音库中是否存在所述文本信息对应的语音。
在具体实施中,所述目标主体语音库为用户事先选定的目标主体的语音库。例如,目标主体语音库中可以包括多个不同的语音主体的语音库,用户在车辆行驶前,或者在需要使用车载信息娱乐系统的某个功能时,首先选取特定的目标主体对应的目标主体语音库。当用户选取要使用的目标主体语音库后,用户在车辆运行过程中并可以使用所选确定的目标主体的语音库,进行相应的语音播放。
具体而言,目标主体语音库中的语音文件与文本信息之间具有相应的对应关系,当车载信息娱乐系统确定待播放的语音对应的文本信息之后,便可以通过所述文本信息与待播放语音之间的对应关系,确定在用户所选取的目标主体语音库中是否存在对应的语音。
在具体实施中,当判断结果为是时,可以执行步骤S103,反之,则可以执行步骤S104。
步骤S103:将所述语音作为待播放语音进行播放。
在具体实施中,当预设的目标主体语音库中存在所述文本信息对应的语音时,则可以播放所述语音。
步骤S104:采用所述目标主体的语音特征和所述文本信息进行语音合成,得到所述待播放语音并播放。
在具体实施中,当确定所述预设的目标主体语音库中不存在所述文本信息对应的语音时,可以采用从文本到语音(Text To Speech,TTS)芯片采用用户所选取的目标主体的语音特征和所述文本信息进行语音分析合成,得到所述文本信息对应的所述目标主体的语音并播放。
在具体实施中,本发明实施例中的目标主体语音库可以根据用户的实际需要进行生成,下面将进行详细的介绍。
图2示出了本发明实施例中的采用所述目标主体的语音文件对预设的语音库进行重建得到所述目标用户语音库的流程图。如图2所示的采用所述目标主体的语音文件对预设的语音库进行重建得到所述目标用户语音库,可以包括:
步骤201:采集所述目标主体的语音数据,构成所述目标主体的语音训练样本集。
在具体实施中,为了满足不同用户的语音播放需求,生成不同目标主体对应的语音库,及目标主体语音库。
其中,所述目标主体可以为用户的家人、亲戚或者朋友等。例如,当用户希望在导航过程中听见使用自己儿子声音的导航语音时,则用户可以首先采集多条自己儿子的声音数据,形成自己儿子的语音训练样本集。
在具体实施中,为了提高所生成的目标主体语音库中的语音的质量,在采集目标主体的语音数据时,可以让目标主体在无环境噪音,无背景音乐的情况下,大声清晰的朗读给定语音文本模板上的文字信息。其中,所述语音文本模板中可以包括车载信息娱乐系统中常用语音,例如车载导航、通讯以及用户与车载信息娱乐交互时的常用语音。当采集得到所述目标主体的语音训练样本集时,可以通过蓝牙、无线网络(Wireless-Fidelity,WIFI)、通用串行总线(Universal Serial Bus,USB)等将目标主体的语音训练样本集导入相应的语音训练模块中,语音训练样本集的语音数据支持mp3、音频压缩格式(ogg)、数字音乐无损压缩格式(ape)等格式。
在具体实施中,为了使得所得到的目标主体语音库中的语音更加贴合目标主体的语音特征,当采集得到目标主体用户的语音数据时,可以根据所得到的目标主体的语音数据的质量进行判断,例如,可以通过对所得到的各条语音数据的语音长度、噪声掩蔽比、谐波失真结构等参数,对相应的语音数据的音频质量进行判断。当判断目标主体的语音数据的质量达到预设的质量阈值时,将所得到的语音数据用于语音训练,反之,则舍弃所得到的语音数据,并生成相应的重新录制提醒信息。这样,便可以使得所采集到的语音数据更加贴合相应目标主体的语音特征,从而使得训练得到的目标主体语音库中的语音更能贴合目标主体的语音特征,进而可以提升用户的使用体验。
步骤202:对所采集的所述目标主体的语音训练样本集进行训练,得到所述目标主体的语音特征,并采用所得到的目标主体的语音特征对预设的语音库进行语音分析合成处理,得到所述目标主体的语音库。
在具体实施中,当得到目标主体的语音训练样本集之后,便可以采用所得到的目标主体的语音训练样本集进行语音训练,得到目标主体语音库。
在具体实施中,可以根据实际的需要采用不同的语音训练方法对目标主体的语音训练样本集进行训练。在本发明一实施例中,采用神经网络的方法对目标主体的语音训练样本集进行训练,得到目标主体语音库。具体而言,将目标主体的各个语音文件划分得到多段语音片段,例如,划分得到100段语音片段。其中,采用其中80%数量的语音片段作为训练样本,20%数量的语音片段作为对比样本,利用神经网络智能语音训练方式,得到目标主体的语音特征,包含基频、频谱、平均语速、平均断句间隔时间等。
在具体实施中,当得到目标主体的语音特征之后,可以采用所得到的目标主体的语音特征对预设的标准语音库进行重建,得到所述目标主体对应的目标主体语音库。具体而言,根据所得到的目标主体的语音特征,并用基于(Speech Transformation And Representation Based On Adaptive Interpolation OfWeighted Spectrogram,STRAIGHT)分析的语音合成算法对预设的标准语音库进行重建,得到目标主体语音库。
在具体实施中,本发明实施例中的采用所述目标主体的语音文件对预设的语音库进行重建得到所述目标用户语音库,还可以包括:
步骤203:获取用户对所述目标主体语音库中语音的调节参数的信息。
在具体实施中,由于采用目标主体的语音特征对预设的语音库进行重建得到的语音,与实际的目标主体的语音之间会存在一定的差别。为了使得所述目标主体语音库中的语音更加贴合目标主体的语音特征,可以将经过语音训练后得到的目标主体的语音库中的语音播放展示给用户,并提供相应的语音参数调节界面,接收用户对各条语音的调节参数,如基频、频谱、语速和断句间隔等,以在后续的步骤中对相应的语音进行调节。
步骤204:采用所获取的调节参数的信息,对所述目标主体语音库中的语音进行调节,得到最终的目标主体语音库中的语音。
在具体实施中,当获取到用户对目标主体语音库中的相应的语音的调节参数时,并可以采用所述调节参数对相应的语音进行调节,从而可以使得最终得到的目标主体语音库中的语音更加贴合相应目标主体的语音特征,从而可以提升用户的使用体验。
图3示出了本发明实施例中的一种语音播放系统的结构示意图。如图3所示的语音播放系统300,可以包括确定单元301、判断单元302、语音库生成单元303、播放单元304和合成单元305,其中:
确定单元301,适于确定待播放语音对应的文本信息。
判断单元302,适于判断预设的目标主体语音库中是否存在所述文本信息对应的语音。
语音库生成单元303,适于采用所述目标主体的语音文件对预设的语音库进行重建得到所述目标主体语音库。
播放单元304,适于当确定所述预设的目标主体语音库中存在所述文本信息对应的语音时,将所述语音作为待播放语音进行播放;当确定所述预设的目标主体语音库中不存在所述文本信息对应的语音时,采用合成单元得到的所述待播放语音并播放;
合成单元305,适于当确定所述预设的目标主体语音库中不存在所述文本信息对应的语音时,采用所述目标主体的语音特征和所述文本信息进行语音合成,得到所述待播放语音并播放。
在具体实施中,本发明实施例中的语音库生成单元303可以包括:
采集子单元3031,适于采集所述目标主体的语音数据,构成所述目标主体的语音训练样本集。
训练生成子单元3032,适于对所采集的所述目标用户的语音训练样本集进行训练,得到所述目标主体的语音特征,并采用所得到的目标主体的语音特征对预设的语音库进行语音分析合成处理,得到所述目标主体的语音库。
在具体实施中,本发明实施例中的语音库生成单元303可以包括:
获取子单元3033,适于获取用户对所述目标主体语音库中语音的调节参数的信息。
调节子单元3034,适于采用所获取的调节参数的信息,对所述目标主体语音库中的语音进行调节,得到最终的目标用户语音库中的语音。
在具体实施中,根据语音库生成单元中的采集子单元、训练生成子单元、获取子单元和调节子单元所在的主体不同,可以分别得到如图4和图5所示的语音播放系统。
图4示出了本发明实施例中的一种语音播放系统的结构示意图。如图4所述的语音播放系统,为在图3所示的语音播放系统的基础上,将语音库生成单元中采集子单元4011、训练生成子单元4012、获取子单元4013和调节子单元4014。其中,采集子单元4011可以为车载信息娱乐系统400的麦克风、训练生成子单元4012、获取子单元4013和调节子单元4014可以集成在车载信息娱乐系统400的中央处理器(Central Processing Unit,CPU)中,训练生成子单元4032得到的目标主体语音库可以存储在载信息娱乐系统400的存储器4015中。
图5示出了本发明实施例中的另一种语音播放系统的结构示意图。其中,图5所示的语音播放系统与如4所示的语音播放系统不同的是,语音库生成单元的采集子单元可以集成于移动终端(或者个人电脑)500中,同时,语音库生成单元中的训练生成子单元、获取子单元和调节子单元则均集成于云端服务器501上,当云端服务器501得到目标主体语音库中以后,车载信息娱乐系统502可以通过蓝牙、WIFI或者USB等下载云端中的目标主体语音库,以备使用。
这里需要指出的是,如图4和图5所示的语音播放系统中各个组成单元或者子单元的工作原理请参照图3中的相应介绍,在此不再赘述。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于计算机可读存储介质中,存储介质可以包括:ROM、RAM、磁盘或光盘等。
以上对本发明实施例的方法及系统做了详细的介绍,本发明并不限于此。任何本领域技术人员,在不脱离本发明的精神和范围内,均可作各种更动与修改,因此本发明的保护范围应当以权利要求所限定的范围为准。

Claims (12)

1.一种语音播放方法,其特征在于,包括:
确定待播放语音对应的文本信息;
判断预设的目标主体语音库中是否存在所述文本信息对应的语音;其中,采用所述目标主体的语音文件对预设的语音库进行重建得到所述目标主体语音库;
当确定所述预设的目标主体语音库中存在所述文本信息对应的语音时,将所述语音作为待播放语音进行播放;
当确定所述预设的目标主体语音库中不存在所述文本信息对应的语音时,采用所述目标主体的语音特征和所述文本信息进行语音合成,得到所述待播放语音并播放。
2.根据权利要求1所述的语音播放方法,其特征在于,所述采用所述目标主体的语音文件对预设的语音库进行重建得到所述目标用户语音库,包括:
采集所述目标主体的语音数据,构成所述目标主体的语音训练样本集;对所采集的所述目标用户的语音训练样本集进行训练,得到所述目标主体的语音特征,并采用所得到的目标主体的语音特征对预设的语音库进行语音分析合成处理,得到所述目标主体的语音库。
3.根据权利要求2所述的语音播放方法,其特征在于,所述采集所述目标主体的语音数据,包括:采用车载信息娱乐系统的麦克风、移动终端或者个人电脑采集所述目标主体的语音数据。
4.根据权利要求2所述的语音播放方法,其特征在于,所述对所采集的所述目标主体的语音训练样本集进行训练,得到所述目标主体的语音特征,并采用所得到的目标主体的语音特征对预设的语音库进行语音分析合成处理,得到所述目标主体的语音库,包括:采用车载信息娱乐系统或者云端服务器对所采集的所述目标用户的语音训练样本集进行训练,得到所述目标主体的语音特征,并采用所得到的目标主体的语音特征对预设的语音库进行语音分析合成处理,得到所述目标主体的语音库。
5.根据权利要求2所述的语音播放方法,其特征在于,所述采用所述目标用户的语音文件对预设的语音库进行重建得到所述目标用户语音库,还包括:
获取用户对所述目标主体语音库中语音的调节参数的信息;
采用所获取的调节参数的信息,对所述目标主体语音库中的语音进行调节,得到最终的目标主体语音库中的语音。
6.根据权利要求5所述的语音播放方法,其特征在于,所述调节参数包括以下至少一种:基频、频谱、语速和断句间隔。
7.一种语音播放系统,其特征在于,包括:
确定单元,适于确定待播放语音对应的文本信息;
判断单元,适于判断预设的目标主体语音库中是否存在所述文本信息对应的语音;
语音库生成单元,适于采用所述目标主体的语音文件对预设的语音库进行重建得到所述目标主体语音库;
播放单元,适于当确定所述预设的目标主体语音库中存在所述文本信息对应的语音时,将所述语音作为待播放语音进行播放;当确定所述预设的目标主体语音库中不存在所述文本信息对应的语音时,采用合成单元得到的所述待播放语音并播放;
合成单元,适于当确定所述预设的目标主体语音库中不存在所述文本信息对应的语音时,采用所述目标主体的语音特征和所述文本信息进行语音合成,得到所述待播放语音并播放。
8.根据权利要求7所述的语音播放系统,其特征在于,所述语音库生成单元包括:
采集子单元,适于采集所述目标主体的语音数据,构成所述目标主体的语音训练样本集;
训练生成子单元,适于对所采集的所述目标主体的语音训练样本集进行训练,得到所述目标主体的语音特征,并采用所得到的目标主体的语音特征对预设的语音库进行语音分析合成处理,得到所述目标主体的语音库。
9.根据权利要求8所述的语音播放系统,其特征在于,所述语音库生成单元还包括:
获取子单元,适于获取用户对所述目标主体语音库中语音的调节参数的信息;
调节子单元,适于采用所获取的调节参数的信息,对所述目标主体语音库中的语音进行调节,得到最终的目标用户语音库中的语音。
10.根据权利要求9所述的语音播放系统,其特征在于,所述训练生成子单元、获取子单元和调节子单元集成于车载信息娱乐系统或者云端服务器中。
11.根据权利要求9所述的语音播放系统,其特征在于,所述调节参数包括以下至少一种:基频、频谱、语速和断句间隔。
12.根据权利要求8所述的语音播放系统,其特征在于,所述采集子单元为车载信息娱乐系统的麦克风、移动终端或者个人电脑。
CN201510228084.9A 2015-05-06 2015-05-06 语音播放方法和系统 Pending CN106205602A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510228084.9A CN106205602A (zh) 2015-05-06 2015-05-06 语音播放方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510228084.9A CN106205602A (zh) 2015-05-06 2015-05-06 语音播放方法和系统

Publications (1)

Publication Number Publication Date
CN106205602A true CN106205602A (zh) 2016-12-07

Family

ID=57459201

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510228084.9A Pending CN106205602A (zh) 2015-05-06 2015-05-06 语音播放方法和系统

Country Status (1)

Country Link
CN (1) CN106205602A (zh)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106652996A (zh) * 2016-12-23 2017-05-10 北京奇虎科技有限公司 一种提示音生成方法和装置、移动终端
CN107274884A (zh) * 2017-02-15 2017-10-20 赵思聪 一种基于文本解析和语音合成的信息获取方法
CN109213468A (zh) * 2018-08-23 2019-01-15 阿里巴巴集团控股有限公司 一种语音播放方法和装置
CN109215629A (zh) * 2018-11-22 2019-01-15 Oppo广东移动通信有限公司 语音处理方法、装置及终端
CN109246214A (zh) * 2018-09-10 2019-01-18 北京奇艺世纪科技有限公司 一种提示音获取方法、装置、终端及服务器
CN109935225A (zh) * 2017-12-15 2019-06-25 富泰华工业(深圳)有限公司 文字信息处理装置及方法、计算机存储介质及移动终端
CN110930977A (zh) * 2019-11-12 2020-03-27 北京搜狗科技发展有限公司 一种数据处理方法、装置和电子设备
CN110930999A (zh) * 2018-09-19 2020-03-27 上海博泰悦臻电子设备制造有限公司 语音互动方法、装置及车辆
CN111681638A (zh) * 2020-04-20 2020-09-18 深圳奥尼电子股份有限公司 车载智能语音控制方法及系统
WO2021169825A1 (zh) * 2020-02-25 2021-09-02 阿里巴巴集团控股有限公司 语音合成方法、装置、设备和存储介质
CN113674731A (zh) * 2021-05-14 2021-11-19 北京搜狗科技发展有限公司 语音合成处理方法、装置和介质
CN114785772A (zh) * 2022-04-27 2022-07-22 广州宸祺出行科技有限公司 一种基于下载速率下载相应码率网约车音频的方法及装置

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101860617A (zh) * 2009-04-12 2010-10-13 比亚迪股份有限公司 一种具有语音处理效果的移动终端及方法
CN102117614A (zh) * 2010-01-05 2011-07-06 索尼爱立信移动通讯有限公司 个性化文本语音合成和个性化语音特征提取
CN103093753A (zh) * 2012-12-14 2013-05-08 沈阳美行科技有限公司 一种导航系统用户语音自定义方法
CN103366732A (zh) * 2012-04-06 2013-10-23 上海博泰悦臻电子设备制造有限公司 语音播报方法及装置、车载系统
CN103856626A (zh) * 2012-11-29 2014-06-11 北京千橡网景科技发展有限公司 个性声音的定制方法和装置
US8886537B2 (en) * 2007-03-20 2014-11-11 Nuance Communications, Inc. Method and system for text-to-speech synthesis with personalized voice
CN104200803A (zh) * 2014-09-16 2014-12-10 北京开元智信通软件有限公司 一种语音播放方法、装置及系统
CN104464716A (zh) * 2014-11-20 2015-03-25 北京云知声信息技术有限公司 一种语音播报系统和方法
US20150095034A1 (en) * 2000-06-30 2015-04-02 At&T Intellectual Property Ii, L.P. Personalized text-to-speech services
CN104575487A (zh) * 2014-12-11 2015-04-29 百度在线网络技术(北京)有限公司 一种语音信号的处理方法及装置

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150095034A1 (en) * 2000-06-30 2015-04-02 At&T Intellectual Property Ii, L.P. Personalized text-to-speech services
US8886537B2 (en) * 2007-03-20 2014-11-11 Nuance Communications, Inc. Method and system for text-to-speech synthesis with personalized voice
CN101860617A (zh) * 2009-04-12 2010-10-13 比亚迪股份有限公司 一种具有语音处理效果的移动终端及方法
CN102117614A (zh) * 2010-01-05 2011-07-06 索尼爱立信移动通讯有限公司 个性化文本语音合成和个性化语音特征提取
CN103366732A (zh) * 2012-04-06 2013-10-23 上海博泰悦臻电子设备制造有限公司 语音播报方法及装置、车载系统
CN103856626A (zh) * 2012-11-29 2014-06-11 北京千橡网景科技发展有限公司 个性声音的定制方法和装置
CN103093753A (zh) * 2012-12-14 2013-05-08 沈阳美行科技有限公司 一种导航系统用户语音自定义方法
CN104200803A (zh) * 2014-09-16 2014-12-10 北京开元智信通软件有限公司 一种语音播放方法、装置及系统
CN104464716A (zh) * 2014-11-20 2015-03-25 北京云知声信息技术有限公司 一种语音播报系统和方法
CN104575487A (zh) * 2014-12-11 2015-04-29 百度在线网络技术(北京)有限公司 一种语音信号的处理方法及装置

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106652996A (zh) * 2016-12-23 2017-05-10 北京奇虎科技有限公司 一种提示音生成方法和装置、移动终端
CN107274884A (zh) * 2017-02-15 2017-10-20 赵思聪 一种基于文本解析和语音合成的信息获取方法
CN107274884B (zh) * 2017-02-15 2020-11-06 赵思聪 一种基于文本解析和语音合成的信息获取方法
CN109935225A (zh) * 2017-12-15 2019-06-25 富泰华工业(深圳)有限公司 文字信息处理装置及方法、计算机存储介质及移动终端
CN109213468A (zh) * 2018-08-23 2019-01-15 阿里巴巴集团控股有限公司 一种语音播放方法和装置
CN109246214B (zh) * 2018-09-10 2022-03-04 北京奇艺世纪科技有限公司 一种提示音获取方法、装置、终端及服务器
CN109246214A (zh) * 2018-09-10 2019-01-18 北京奇艺世纪科技有限公司 一种提示音获取方法、装置、终端及服务器
CN110930999A (zh) * 2018-09-19 2020-03-27 上海博泰悦臻电子设备制造有限公司 语音互动方法、装置及车辆
CN109215629A (zh) * 2018-11-22 2019-01-15 Oppo广东移动通信有限公司 语音处理方法、装置及终端
CN109215629B (zh) * 2018-11-22 2021-01-01 Oppo广东移动通信有限公司 语音处理方法、装置及终端
CN110930977A (zh) * 2019-11-12 2020-03-27 北京搜狗科技发展有限公司 一种数据处理方法、装置和电子设备
CN110930977B (zh) * 2019-11-12 2022-07-08 北京搜狗科技发展有限公司 一种数据处理方法、装置和电子设备
WO2021169825A1 (zh) * 2020-02-25 2021-09-02 阿里巴巴集团控股有限公司 语音合成方法、装置、设备和存储介质
CN111681638A (zh) * 2020-04-20 2020-09-18 深圳奥尼电子股份有限公司 车载智能语音控制方法及系统
CN113674731A (zh) * 2021-05-14 2021-11-19 北京搜狗科技发展有限公司 语音合成处理方法、装置和介质
CN114785772A (zh) * 2022-04-27 2022-07-22 广州宸祺出行科技有限公司 一种基于下载速率下载相应码率网约车音频的方法及装置

Similar Documents

Publication Publication Date Title
CN106205602A (zh) 语音播放方法和系统
JP6799574B2 (ja) 音声対話の満足度の確定方法及び装置
Pieren et al. Auralization of accelerating passenger cars using spectral modeling synthesis
DE102013222507B4 (de) Verfahren zum Adaptieren eines Sprachsystems
DE102012217160B4 (de) Verfahren zum Korrigieren unverständlicher synthetischer Sprache
CN106997767A (zh) 基于人工智能的语音处理方法及装置
CN109378010A (zh) 神经网络模型的训练方法、语音去噪方法及装置
CN106816149A (zh) 车辆自动语音识别系统的优先化内容加载
CN104200803A (zh) 一种语音播放方法、装置及系统
CN103714812A (zh) 一种语音识别方法及装置
CN108281138A (zh) 年龄判别模型训练及智能语音交互方法、设备及存储介质
CN107861957B (zh) 一种数据分析方法及装置
CN110286745A (zh) 对话处理系统、具有对话处理系统的车辆及对话处理方法
CN106101168A (zh) 车载终端、云服务设备、车载系统及信息处理方法和装置
CN111402879B (zh) 车辆导航提示语音控制方法、装置、设备及介质
Ambrosini et al. Deep neural networks for road surface roughness classification from acoustic signals
CN113409798B (zh) 车内含噪语音数据生成方法、装置以及设备
CN114694651A (zh) 智能终端控制方法、装置、电子设备及存储介质
CN112905001B (zh) 一种基于脑电信号的驾驶声音模式切换方法及系统
CN110120845A (zh) 电台播放方法与云端服务器
CN116055553B (zh) 车辆推送信息的处理方法、系统和装置
CN109119089A (zh) 对音乐进行通透处理的方法及设备
CN113536028A (zh) 音乐的推荐方法和装置
CN104954369A (zh) 多媒体内容的发送、生成和传输、播放方法和对应装置
Koch et al. Real-Time Capable Wind and Rolling Noise Synthesis for a More Realistic Vehicle Simulator Experience

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20161207

RJ01 Rejection of invention patent application after publication