WO2024087727A1

WO2024087727A1 - 基于车载语音ai的语音数据处理方法及相关设备

Info

Publication number: WO2024087727A1
Application number: PCT/CN2023/105292
Authority: WO
Inventors: 张贵海; 卢放; 周冰; 李平; 唐马政; 杨锦; 苗宇栋
Original assignee: 岚图汽车科技有限公司
Priority date: 2022-10-28
Filing date: 2023-06-30
Publication date: 2024-05-02
Also published as: CN115938340A

Abstract

本文公开了一种基于车载语音AI的语音数据处理方法及相关设备，上述方法包括：获取目标歌曲的音频特征和歌词特征；基于所述音频特征和所述歌词特征生成所述目标歌曲的车载语音AI歌声数据；同时播放所述目标歌曲和所述车载语音AI歌声数据；实时采集并播放目标用户的音频数据。

Description

基于车载语音AI的语音数据处理方法及相关设备

相关申请的交叉引用

本申请要求于2022年10月28日提交、申请号为202211335986.9的中国专利申请的优先权，其全部内容通过引用合并于此。

技术领域

本公开属于智能语音技术领域，涉及一种基于车载语音AI的语音数据处理方法及相关设备。

背景技术

随着人们生活水平的提高和对美好生活的向往，开车自驾的娱乐需求与日俱增。目前在车辆内部，大部分车载座舱已配置成熟的K歌软件，用户可以利用K歌软件，通过麦克风自己演唱或与其他用户一起演唱。这类K歌软件可以将用户的声音经过效果处理和混合后生成带混响的效果人声，再和歌曲伴奏混合，进而发出歌唱的声音。但用户利用这类K歌软件无法实现和AI助手合唱或对唱，只能切原唱进行演唱，即用户并不能和AI助手同时合唱用户喜欢的歌曲，在娱乐演唱方面与AI助手的交互性较低，从而导致配置该类K歌软件智能座舱的产品竞争力不高。

发明内容

鉴于上述问题，本公开提出了一种基于车载语音AI的语音数据处理方法及相关设备，提升了用户与AI助手的交互性以及车内智能座舱的娱乐性和产品竞争力。

依据本公开的第一方面，提供了一种基于车载语音AI的语音数据处理方法，该方法包括：获取目标歌曲的音频特征和歌词特征；基于音频特征和歌词特征生成目标歌曲的车载语音AI歌声数据；同时播放目标歌曲和车载语音AI歌声数据；以及实时采集并播放目标用户的音频数据。

依据本公开的第二方面，提供了一种基于车载语音AI的语音数据处理装置，包括：获取单元，用于获取目标歌曲的音频特征和歌词特征；生成单元，用于基于歌曲音频特征和歌词特征生成目标歌曲的车载语音AI歌声数据；扬声单元，用于同时播放目标歌曲和车载语音AI歌声数据；以及采播单元，用于实时采集并播放目标用户的音频数据。

依据本公开的第三方面，提供了一种计算机可读存储介质，上述计算机可读存储介质包括存储的程序，上述程序在被处理器执行时促使处理器实现上述的基于车载语音AI的语音数据处理方法。

依据本公开的的第四方面，提供了一种电子设备，包括至少一个处理器、以及与上述处理器连接的至少一个存储器；上述处理器用于调用上述存储器中的程序指令，并执行上述的基于车载语音AI的语音数据处理方法。

上述说明仅是本公开技术方案的概述，为了能够更清楚了解本公开的技术手段，而可依照说明书的内容予以实施，并且为了让本公开的上述和其它目的、特征和优点能够更明显易懂，以下特举本公开的具体实施方式。

附图说明

通过阅读下文实施方式的详细描述，各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出本公开的一些实施方式，而并不认为是对本公开的限制。而且在整个附图中，用相同的参考符号表示相同的部件。在附图中：

图1示出了依据本公开一些实施例的一种基于车载语音AI的语音数据处理方法的流程示意图；

图2示出了依据本公开一些实施例的一种基于车载语音AI的语音数据处理装置的结构框图；

图3示出了依据本公开一些实施例的一种电子设备的结构框图。

具体实施方式

下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例，然而应当理解，可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反，提供这些实施例是为了能够更透彻地理解本公开，并且能够将本公开的范围完整的传达给本领域的技术人员。

为了解决目前用户利用K歌软件无法实现和AI助手合唱或对唱，只能切原唱进行合唱，进而用户不能和AI助手同时合唱喜欢的歌曲，在娱乐演唱方面与AI助手的交互性较低，从而导致配置该类K歌软件的智能座舱的产品竞争力不高的问题，本公开实施例提供了一种基于车载语音AI的语音数据处理方法，如图1所示，该方法可以包括步骤S101至步骤S104。

在步骤S101，获取目标歌曲的音频特征和歌词特征。

在一些实施例中，上述实际应用场景可以是，当车辆处于启动状态时，用户通过操作安装于车辆的车载信息娱乐系统中的K歌应用，先选择合唱模式，合唱模式下有多首已分类的歌曲，合唱模式可以是对唱模式或跟唱模式；再选定要合唱的歌曲。

可以理解的是，目标歌曲可以是用户选定的合唱歌曲，车载信息娱乐系统可以获取上述选定的合唱歌曲的音频特征和歌词特征。音频特征可以是选定的合唱歌曲的音素信息、声调信息、韵律边界文本信息、音符信息、节拍信息、连音符乐谱信息等。歌词特征可以是选定的合唱歌曲对应的文本数据中存储的歌词信息，也可以是对选定的合唱歌曲对应的音频数据进行分析后得到的歌词信息。

在步骤S102，基于音频特征和歌词特征生成目标歌曲的车载语音AI歌声数据。

可以理解的是，AI助手为车载信息娱乐系统中配置的一种车载语音AI应用，在实现过程中，可以基于音频特征、歌词特征和车载语音AI应用生成目标歌曲的车载语音AI歌声数据，例如基于音频特征、歌词特征以及AI助手中配置的AI歌声合成方案模型生成车载语音AI歌声数据。

需要说明的是，AI助手可以根据步骤S101所获取的目标歌曲的音素信息、声调信息、韵律边界文本信息，音符信息、节拍信息、连音符乐谱信息和歌词信息，通过配置深度学习神经网络算法的AI歌声合成方案模型生成目标歌曲的车载语音AI歌声数据。在一些实施例中，该AI歌声合成方案模型是使用海量数据进行模型训练后配置的。

以用户在车载信息娱乐系统中选定的合唱歌曲是《好运来》为例，AI助手可以基于《好运来》歌曲的歌词信息，歌词信息中文本对应的音素信息、声调信息、韵律边界文本信息，《好运来》歌曲的伴奏音频的音符信息、节拍信息、连音符乐谱信息，以及AI歌声合成方案模型，生成《好运来》歌曲的车载语音AI歌声数据。

应当理解的是，音素是根据语音的自然属性划分出来的最小语音单位，如果依据音节里的发音动作来分析，则一个发音动作构成一个音素。音素分为元音与辅音两大类，如汉语音节啊(ā)只有一个音素，爱(ài)有两个音素，代(dài)有三个音素。

声调是指语言的音调的变化，是汉语音节中所固有的，有区别意义的声音的高低。声调的音高是相对的，不是绝对；声调的变化是滑动的，而不是像从一个音阶到另一个音阶那样跳跃式地移动。声调的高低通常用五度标记法。

韵律边界对语言表达的自然度以及准确度这两个指标起着重要作用。在人们交流中，语句间停顿的部分即为韵律边界。

在步骤S103，同时播放目标歌曲和车载语音AI歌声数据。

在一些实施例中，可以基于车载信息娱乐系统中的K歌应用将选定的目标歌曲与车载语音AI歌声数据进行音频处理，然后通过车载信息娱乐系统中的扬声设备输出。在实现过程中，可以通过开启原唱或者关闭原唱的方式，对应实现输出带有原唱的目标歌曲或者输出只有伴奏的目标歌曲。

通过同时播放车载语音AI歌声数据和带有原唱的目标歌曲，或者同时播放车载语音AI歌声数据和只有伴奏的目标歌曲，可以为后续用户合唱奠定良好的基础，使整体音频输出体验更佳，并且通过自由开启原唱的方式也可以在后续用户输入音源时实现三种声线同时合唱，提升了演唱方式的丰富性。

在步骤S104，实时采集并播放目标用户的音频数据。

需要说明的是，车载信息娱乐系统可以外接或内置声源采集设备。在目标歌曲和车载语音AI歌声数据播放的同时，实时采集当前使用K歌应用的用户通过声源采集设备输入的声音信息，将声音信息作为目标用户的音频数据，并通过扬声设备播放。当然，还可以将采集到的声音信息通过回声消除技术处理，得到目标用户的音频数据后，通过扬声设备输出该音频数据。

在一些实施例中，用户在使用K歌应用时可以将外置麦克风连接至车载信息娱乐系统的USB接口，选择自己偏好的合唱模式对应的歌曲后，在合理角度和声源采集范围内进行演唱，以输入人声声源。此时，车载信息娱乐系统的扬声器会播放步骤S103中的歌曲伴奏和车载语音AI歌声数据，车载信息娱乐系统对上述扬声器输出的音源，使用声音回声消除技术进行过滤处理，并将用户输入的人声声源与经过滤处理后的音源进行低延迟的二次输出。

可以理解的是，回声消除是通过消除或者移除本地话筒中拾取到的远端的音频信号来阻止远端的声音返回去的一种处理方法，这种音频信号的移除都是通过数字信号处理来完成的。回声消除的基本原理是以扬声器信号与由它产生的多路径回声的相关性为基础，建立远端信号的语音模型，利用它对回声进行估计，并不断修改滤波器的系数，使得估计值更加逼近真实的回声。然后，将回声估计值从话筒的输入信号中减去，从而达到消除回声的目的。

上述方案可以解决目前在车辆内部，基于大部分车载座舱已配置的成熟的K歌软件，用户可以通过麦克风自己演唱或与其他用户一起演唱，这类应用软件可以将用户的声音经过效果处理和混合后生成带混响效果的人声，再和歌曲伴奏混合，进而发出歌唱的声音，但用户利用这类应用软件无法实现和AI助手合唱或对唱，只能切原唱进行合唱，即用户并不能和AI助手同时合唱用户喜欢的歌曲，在娱乐演唱方面与AI助手的交互性较低，从而导致智能座舱的产品竞争力不高的问题。根据本公开的上述方法，用户可以通过在K歌应用上选择合唱的模式，进而选择要合唱的歌曲。车载信息娱乐系统可以对用户选择的目标歌曲提取音频特征和歌词特征，生成目标歌曲的车载语音AI歌声数据，播放目标歌曲和车载语音AI歌声数据，并实时采集目标用户的音频数据，最终混合播放上述三种音频，实现了提升用户与AI助手的交互性以及车内智能座舱的娱乐性和产品竞争力的效果。

在一些实施例中，上述方法在执行时候，步骤S101：获取目标歌曲的音频特征和歌词特征，可以包括步骤S201-A或者S201-B。

在步骤S201-A，基于K歌应用获取目标歌曲的音频特征和歌词特征。

需要说明的是，步骤S101里所提及的目标歌曲的音频特征和歌词特征可以通过K歌应用直接分析得出，在一些实施例中，K歌应用可以直接调用内部已缓存或根据下载得到的目标歌曲的K歌音频文件，并对K歌音频文件进行分析，得到上述音频文件的音频特征和歌词特征。

在步骤S201-B，基于K歌应用获取目标歌曲的音频数据；以及基于车载语音AI应用和目标歌曲的音频数据，确定目标歌曲的音频特征和歌词特征。

需要说明的是，步骤S201-B相对于步骤S201-A的区别在于，步骤S201-B先基于K歌应用将内部已缓存或根据下载得到的目标歌曲的K歌音频文件传输至车载语音AI应用，再由车载语音AI应用(即AI助手)对上述K歌音频文件进行分析，得到目标歌曲的音频特征和歌词特征。

上述实施例设计了两种方式对K歌音频文件进行分析，在实现过程中，可以根据进程的忙碌状态决定由K歌应用对目标歌曲的K歌音频文件进行解析，还是由车载语音AI应用对目标歌曲的K歌音频文件进行解析，如此使得车载信息娱乐系统在使用过程中更为流畅。

可以理解的是，上述方法分为A与B两种，在执行时执行其中任意一种，均可达到获取目标歌曲的歌曲音频特征和歌词特征的目的。

在一些实施例中，上述方法在执行时，还可以包括步骤S301：车载语音AI歌声数据的AI歌声的声线与车载语音AI应用当前设定的语音声线相同。

需要说明的是，车载信息娱乐系统所配置的车载语音AI应用的声线多种多样，可以是男声、女声、方言等，而方言可以是粤语，四川话，东北话等。在日常使用中，用户往往对其设定的车载语音AI应用的声音较为熟悉，有一种熟悉的陪伴感。车载信息娱乐系统可以通过同步声线特征，将车载语音AI歌声数据的AI歌声的声线与车载语音AI应用当前设定的语音声线同步至同一种声线，如此能给用户带来自己在与朝夕相处陪伴的声音合唱的体验感，拉近与用户之间的距离，让AI歌声之于用户而言不再是冰冷的陪伴，增添了整体合唱的协调性，提升了用户演唱体验，同时避免了车载信息娱乐系统输出某些提示音时，由于存在两种不同声线，破坏整体车内娱乐演唱的氛围。

在一些实施例中，可以将车载语音AI应用设定的语音声线设置为温柔女声，并将上述AI歌声的声线设置为同步至车载语音AI当前应用设定的语音声线。设置完成后，扬声器根据AI歌声的声线特征播放的车载语音AI歌声数据是基于温柔女声声线的音频。

在一些实施例中，上述方法在执行时，还可以包括步骤S401至步骤S402。

在步骤S401，基于目标用户的历史K歌数据，确定目标用户的演唱偏好。

需要说明的是，在用户每次演唱的过程中，车载信息娱乐系统根据用户通过声源采集设备输入的音源，记录用户的演唱习惯和情绪起伏，并经由神经网络算法的AI歌声合成方案模型分析后，得到用户的演唱偏好，并保存该演唱偏好至数据库。可以通过设置不同的储存名称对演唱偏好进行个性化分类储存。

例如，用户为驾驶员A、乘客B和宝宝C。车载信息娱乐系统可以提醒用户是否进行分类存储，在执行进行分类存储后，K歌应用再次启动，并且用户通过K歌应用与AI助手合唱时，车载信息娱乐系统可以通过用户的声线特征自动匹配已储存的演唱偏好，以提高演唱体验。

在步骤S402，根据演唱偏好调整车载语音AI歌声数据。

需要说明的是，车载信息娱乐系统会根据步骤S401所确定的演唱偏好，在合唱过程中适配用户的演唱偏好，使整个合唱更为和谐以及动听。上述演唱偏好可以是用户演唱的情绪表达，可以是高亢的、兴奋的、失落的、伤感的等，并根据上述演唱偏好自适应调整车载语音AI歌声数据的AI歌声的情绪表达和音量。

在一些实施例中，数据库中记录的用户A的历史K歌数据多为伤感类型歌曲，演唱偏好多为声音音量较低，声调起伏不大，当用户A使用K歌应用选择合唱模式与AI助手合唱《珊瑚海》时，AI助手则会适应用户A的演唱偏好，将声调、韵律边界等参数调整与用户A类似，以便于更好的完成歌曲的合作演唱。

在一些实施例中，上述方法在执行时，步骤S102：基于音频特征和歌词特征生成目标歌曲的车载语音AI歌声数据，可以包括步骤S501：基于安卓接口定义语言AIDL将车载语音AI歌声数据传输至K歌应用。

可以理解的是，根据步骤S102，在AI助手根据音频特征和歌词特征通过配置深度学习神经网络算法的AI歌声合成方案模型生成目标歌曲的车载语音AI歌声数据后，需要将上述车载语音AI歌声数据传输至K歌应用，进而能与目标歌曲一同混合播出，K歌应用和AI助手在车载信息娱乐系统内分属两个独立的进程程序，故需要将车载语音AI歌声数据进行跨进程传输。

安卓接口定义语言(Android Interface Definition Language，AIDL)是一种基于Android编译的接口定义语言，因为在Android中，不同的应用程序运行在各自独立的进程里，应用程序之间并不能访问对方的内存空间。为了实现进程间的通信，要用到定义局部总线的标准(Peripheral Component Interconnect，PCI)机制。Android支持PCI机制，但需要具备Android可读取的序列化数据，AIDL则是为了描述上述数据而使用的。

在一些实施例中，上述方法在执行时，还可以包括步骤S601：基于目标用户的声线偏好，调整车载语音AI应用当前设定的语音声线。

需要说明的是，不同的用户对车载语音AI应用设定的语音声线的偏好大概率不同，由步骤S301可知，车载语音AI歌声数据的AI歌声的声线可以伴随车载语音AI应用当前设定的语音声线而改变，那么根据用户设定的声线偏好，调整车载语音AI应用的语音声线设置，可以实现同步AI歌声的声线至用户偏好的声线。该声线可以是温柔女声、低沉男声等。

在一些实施例中，用户A在使用K歌应用合唱的过程中，车载信息娱乐系统会识别用户A为男声或者女声，并且自适应切换AI歌声的性别声线特征。若AI歌声的声线已预先被设置为与车载语音AI应用当前设定的语音声线相同，但车载语音AI应用当前设定的的语音声线与自适应切换AI歌声的性别声线特征不同，此时本步骤的优先级默认大于步骤S301，进行声线设置覆盖，以达到提高合唱体验的目的。

在一些实施例中，上述方法在执行时，还可以包括步骤S701：基于车载语音AI歌声数据的AI歌声的声线和/或目标歌曲的音频特征自适应调整车辆内部的环境氛围。

需要说明的是，车内的灯光和遮光设备可以根据AI歌声的声线和/或目标歌曲的音频特征自适应调整，将场景与选定的目标歌曲所属的氛围感进行更好的融合，使得车内智能座舱不再只是合唱歌曲的载体，而是整体演唱氛围的一部分。

例如，用户通过K歌应用选择歌曲《发如雪》进行与AI助手的合唱时，车载信息娱乐系统控制自动关闭车窗的遮阳装置，自适应调整车辆玻璃的灰度，降低车辆玻璃的透光率以及饱和度，将车内氛围灯伴随调整为冰蓝色，模拟雪天氛围场景，调整扬声设备的低频、中频、高频参数，以达到良好的演唱环境氛围。

需要说明的是，作为对上述图1及相关的多种实施例所示方法的实现，本公开实施例还提供了一种基于车载语音AI的语音数据处理装置，用于对上述图1以及上述多个实施例所示的方法进行实现。该装置实施例与前述方法实施例对应，并且能够对应实现前述方法实施例中的全部内容。如图2所示，该装置可以包括：获取单元21，用于获取目标歌曲的音频特征和歌词特征；生成单元22，用于基于音频特征和歌词特征生成目标歌曲的车载语音AI歌声数据；扬声单元23，用于同时播放目标歌曲和车载语音AI歌声数据；采播单元24，用于实时采集并播放目标用户的音频数据。

在一些实施例中，获取单元21，还用于基于K歌应用获取目标歌曲的音频特征和歌词特征；或，基于K歌应用获取目标歌曲的音频数据；基于车载语音AI应用和目标歌曲的音频数据，确定目标歌曲的音频特征和歌词特征。

在一些实施例中，车载语音AI歌声数据的AI歌声的声线与车载语音AI应用当前设定的语音声线相同。

在一些实施例中，该装置还可以包括声线调整单元(图未示)，用于基于目标用户的声线偏好，调整车载语音AI应用当前设定的语音声线。

在一些实施例中，生成单元22，还用于基于目标用户的历史K歌数据，确定目标用户的演唱偏好；根据演唱偏好调整车载语音AI歌声数据。

在一些实施例中，该装置还可以包括传输单元(图未示)，用于基于安卓接口定义语言AIDL将车载语音AI歌声数据传输至K歌应用。

在一些实施例中，该装置还可以包括氛围调整单元(图未示)，用于基于车载语音AI歌声数据的AI歌声的声线和/或目标歌曲的音频特征自适应调整车辆内部的环境氛围。

借由上述技术方案，本公开提供了一种基于车载语音AI的语音数据处理方法，解决了目前在车辆内部，大部分车载座舱已配置的成熟的K歌软件，可以使用户人声通过麦克风经过效果处理和混合后生成带混响的效果人声，再和歌曲伴奏混合进而发出歌唱的声音，但无法和AI助手合唱或对唱，只能切原唱进行合唱，即用户并不能和AI助手同时合唱用户喜欢的歌曲，在娱乐演唱方面与AI助手的交互性较低，从而导致智能座舱的产品竞争力不高的问题。本公开通过对用户选择的目标歌曲提取音频特征和歌词特征，生成目标歌曲的车载语音AI歌声数据，播放目标歌曲和车载语音AI歌声数据，并实时采集目标用户的音频数据，最终混合播放上述三种音频，实现了提升用户与AI助手的交互性以及车内智能座舱的娱乐性和产品竞争力的效果。

处理器中包含内核，由内核去存储器中调取相应的程序单元。内核可以设置一个或以上，通过调整内核参数来实现一种基于车载语音AI的语音数据处理方法，以解决现有技术中用户无法和AI助手合唱或对唱，只能切原唱，用户并不能和AI助手同时合唱用户喜欢的歌曲，在娱乐演唱方面与AI助手的交互性较低的问题。

本公开实施例提供了一种存储介质，其上存储有程序，该程序被处理器执行时实现基于车载语音AI的语音数据处理方法。

本公开实施例提供了一种处理器，处理器用于运行程序，程序运行时执行基于车载语音AI的语音数据处理方法。

本公开实施例提供了一种电子设备30，如图3所示，电子设备包括至少一个处理器31、以及与处理器连接的至少一个存储器32、总线33；其中，处理器31、存储器32通过总线33完成相互间的通信；处理器31用于调用存储器中的程序指令，以执行上述的基于车载语音AI的语音数据处理方法。

本公开中的电子设备可以是服务器、PC、PAD、手机等。

本公开还提供了一种计算机程序产品，当在数据处理设备上执行时，适于执行初始化有如下方法步骤的程序：获取目标歌曲的音频特征和歌词特征；基于音频特征和歌词特征生成目标歌曲的车载语音AI歌声数据；同时播放目标歌曲和车载语音AI歌声数据；实时采集并播放目标用户的音频数据。

在一些实施例中，获取目标歌曲的音频特征和歌词特征，包括：基于K歌应用获取目标歌曲的歌曲音频特征和歌词特征；或，基于K歌应用获取目标歌曲的音频数据；基于车载语音AI应用和目标歌曲的音频数据，确定目标歌曲的音频特征和歌词特征。

在一些实施例中，上述方法还包括：车载语音AI歌声数据的AI歌声的声线与车载语音AI应用当前设定的语音声线相同。

在一些实施例中，上述方法还包括：基于目标用户的历史K歌数据，确定目标用户的演唱偏好；根据演唱偏好调整车载语音AI歌声数据。

在一些实施例中，上述方法还包括：基于安卓接口定义语言AIDL车载语音AI歌声数据传输至K歌应用。

在一些实施例中，上述方法还包括：基于目标用户的声线偏好，调整车载语音AI应用当前设定的语音声线。

在一些实施例中，上述方法还包括：基于车载语音AI歌声数据的AI歌声的声线特征和/或目标歌曲的歌曲音频特征自适应调整车辆内部的环境氛围。

本公开是参照根据本公开实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

在一个典型的配置中，设备包括一个或多个处理器(CPU)、存储器和总线。设备还可以包括输入/输出接口、网络接口等。

存储器可能包括计算机可读介质中的非永久性存储器，随机存取存储器(RAM)和/或非易失性内存等形式，如只读存储器(ROM)或闪存(flash RAM)，存储器包括至少一个存储芯片。存储器是计算机可读介质的示例。

计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括，但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器 (CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带，磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质，可用于存储可以被计算设备访问的信息。按照本公开中的界定，计算机可读介质不包括暂存电脑可读媒体(transitorymedia)，如调制的数据信号和载波。

还需要说明的是，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。

本领域技术人员应明白，本公开的实施例可提供为方法、系统或计算机程序产品。因此，本公开可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且，本公开可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

以上仅为本公开的实施例而已，并不用于限制本公开。对于本领域技术人员来说，本公开可以有各种更改和变化。凡在本公开的精神和原理之内所作的任何修改、等同替换、改进等，均应包含在本公开的权利要求范围之内。

Claims

一种基于车载语音AI的语音数据处理方法，包括：

获取目标歌曲的音频特征和歌词特征；

基于所述音频特征和所述歌词特征生成所述目标歌曲的车载语音AI歌声数据；

同时播放所述目标歌曲和所述车载语音AI歌声数据；以及

实时采集并播放目标用户的音频数据。
根据权利要求1所述的方法，其中，所述获取目标歌曲的音频特征和歌词特征，包括：

基于K歌应用获取所述目标歌曲的所述音频特征和所述歌词特征；或，

基于所述K歌应用获取所述目标歌曲的音频数据；

基于车载语音AI应用和所述目标歌曲的音频数据，确定所述目标歌曲的所述音频特征和所述歌词特征。
根据权利要求2所述的方法，其中，所述车载语音AI歌声数据的AI歌声的声线与所述车载语音AI应用当前设定的语音声线相同。
根据权利要求2所述的方法，还包括：

基于所述目标用户的声线偏好，调整所述车载语音AI应用当前设定的语音声线。
根据权利要求1所述的方法，还包括：

基于所述目标用户的历史K歌数据，确定所述目标用户的演唱偏好；

根据所述演唱偏好调整所述车载语音AI歌声数据。
根据权利要求1所述的方法，，还包括：

基于安卓接口定义语言AIDL将所述车载语音AI歌声数据传输至K歌应用。
根据权利要求1所述的方法，还包括：

基于所述车载语音AI歌声数据的AI歌声的声线和/或所述目标歌曲的所述音频特征自适应调整车辆内部的环境氛围。
一种基于车载语音AI的语音数据处理装置，包括：

获取单元，用于获取目标歌曲的音频特征和歌词特征；

生成单元，用于基于所述音频特征和所述歌词特征生成所述目标歌曲的车载语音AI歌声数据；

扬声单元，用于同时播放所述目标歌曲和所述车载语音AI歌声数据；以及

采播单元，用于实时采集并播放目标用户的音频数据。
一种计算机可读存储介质，包括存储的程序，所述程序在被处理器执行时促使所述处理器实现如权利要求1至权利要求7中任一项所述的基于车载语音AI的语音数据处理方法。
一种电子设备，包括至少一个处理器、以及与所述处理器连接的至少一个存储器；所述处理器用于调用所述存储器中的程序指令，并执行如权利要求1至权利要求7中任一项所述的基于车载语音AI的语音数据处理方法。