CN114071318A

CN114071318A - 语音处理方法、终端设备及车辆

Info

Publication number: CN114071318A
Application number: CN202111341904.7A
Authority: CN
Inventors: 彭经伟
Original assignee: Apollo Intelligent Connectivity Beijing Technology Co Ltd
Current assignee: Apollo Intelligent Connectivity Beijing Technology Co Ltd
Priority date: 2021-11-12
Filing date: 2021-11-12
Publication date: 2022-02-18
Anticipated expiration: 2041-11-12
Also published as: CN114071318B

Abstract

本公开提供了一种语音处理方法、终端设备及车辆，涉及人工智能技术中自动驾驶技术，具体涉及车联网技术和智能座舱技术领域，该方法应用于车辆中的终端设备，车辆中设置有多个音频采集器，不同的音频采集器对应于车辆中的不同位置区域，音频采集器与终端设备连接，方法包括：在终端设备处于通话状态的过程中，接收车载语音应用程序发送的音频数据，获取待切换的音频采集器的第一标识，根据音频数据中的与第一标识对应的音频，进行通话处理，避免了若终端设备处于通话状态时，车载语音应用程序停止工作造成的多音频采集器相较于单音频采集器的优势丧失，无法进行各音频采集器之间的切换的弊端，实现了通话的灵活性和多样性。

Description

语音处理方法、终端设备及车辆

技术领域

本公开涉及人工智能技术中自动驾驶技术，具体涉及车联网技术和语音技术，尤其涉及一种语音处理方法、终端设备及车辆。

背景技术

随着科学技术的发展，车辆的音频采集器的配置由单音频采集器配置发展为了多音频采集器配置，多音频采集器配置可以为双音频采集器配置，也可以为四音频采集器配置等。

在现有技术中，当车辆的终端设备通话时(即运行于终端设备的车载通话应用程序)被使用时，通常默认基于主驾驶位置的音频采集器所采集的音频数据进行通话，相应的，车载语音应用程序需停止采集音频数据，以避免通话被其他音频采集器的音频数据干扰。

然而，采用上述方法，车载语音应用程序在车载通话应用程序使用时无法正常使用的，导致多音频采集器相较于单音频采集器的优势丧失，无法进行各音频采集器之间的切换。

发明内容

本公开提供了一种语音处理方法、终端设备及车辆。

根据本公开的第一方面，提供了一种语音处理方法，所述方法应用于车辆中的终端设备，所述车辆中设置有多个音频采集器，不同的音频采集器对应于所述车辆中的不同位置区域，所述音频采集器与所述终端设备连接，所述方法包括：

在所述终端设备处于通话状态的过程中，接收车载语音应用程序发送的音频数据，其中，所述音频数据中包括各音频采集器采集的音频；

获取待切换的音频采集器的第一标识；其中，所述第一标识与第二标识不同，所述第二标识为所述终端设备当前实现通话的音频采集器的标识；

根据所述音频数据中的与所述第一标识对应的音频，进行通话处理。

根据本公开的第二方面，提供了一种语音处理方法，所述方法应用于车辆中的终端设备，所述车辆中设置有多个音频采集器，不同的音频采集器对应于所述车辆中的不同位置区域，所述音频采集器与所述终端设备连接，所述方法包括：

在所述终端设备处于通话状态的过程中，基于车载语音应用程序采集音频数据，其中，所述音频数据中包括各音频采集器采集的音频；

将所述音频数据发送给车载通话应用程序；其中，所述音频数据用于为所述终端设备提供与第一标识对应的音频以进行通话处理；所述第一标识为待切换的音频采集器的标识，所述第一标识与第二标识不同，所述第二标识为所述终端设备当前实现通话的音频采集器的标识。

根据本公开的第三方面，提供了一种语音处理装置，所述装置应用于车辆中的终端设备，所述车辆中设置有多个音频采集器，不同的音频采集器对应于所述车辆中的不同位置区域，所述音频采集器与所述终端设备连接，所述装置包括：

接收单元，用于在所述终端设备处于通话状态的过程中，接收车载语音应用程序发送的音频数据，其中，所述音频数据中包括各音频采集器采集的音频；

获取单元，用于获取待切换的音频采集器的第一标识；其中，所述第一标识与第二标识不同，所述第二标识为所述终端设备当前实现通话的音频采集器的标识；

通话单元，用于根据所述音频数据中的与所述第一标识对应的音频，进行通话处理。

根据本公开的第四方面，提供了一种语音处理装置，所述装置应用于车辆中的终端设备，所述车辆中设置有多个音频采集器，不同的音频采集器对应于所述车辆中的不同位置区域，所述音频采集器与所述终端设备连接，所述装置包括：

采集单元，用于在所述终端设备处于通话状态的过程中，基于车载语音应用程序采集音频数据，其中，所述音频数据中包括各音频采集器采集的音频；

第一发送单元，用于将所述音频数据发送给车载通话应用程序；其中，所述音频数据用于为所述终端设备提供与第一标识对应的音频以进行通话处理；所述第一标识为待切换的音频采集器的标识，所述第一标识与第二标识不同，所述第二标识为所述终端设备当前实现通话的音频采集器的标识。

根据本公开的第五方面，提供了一种电子设备，包括：

至少一个处理器；以及

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行第一方面所述的方法；或者，以使所述至少一个处理器能够执行第二方面所述的方法。

根据本公开的第六方面，提供了一种计算机程序产品，所述计算机程序产品包括：计算机程序，所述计算机程序存储在可读存储介质中，电子设备的至少一个处理器可以从所述可读存储介质读取所述计算机程序，所述至少一个处理器执行所述计算机程序使得电子设备执行第一方面或第二方面所述的方法。

根据本公开的第七方面，提供了一种车辆，包括：如第四或第五方面所述的语音处理装置。

应当理解，本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征，也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。

附图说明

附图用于更好地理解本方案，不构成对本公开的限定。其中：

图1是可以实现本公开实施例的语音处理方法的场景图；

图2是根据本公开第一实施例的示意图；

图3是根据本公开第二实施例的示意图；

图4是根据本公开第三实施例的示意图；

图5是根据本公开第四实施例的示意图；

图6是根据本公开第五实施例的示意图；

图7是根据本公开第六实施例的示意图；

图8是根据本公开第七实施例的示意图；

图9是根据本公开第八实施例的示意图；

图10是根据本公开第九实施例的示意图；

图11是用来实现本公开实施例的语音处理方法的电子设备的框图。

具体实施方式

以下结合附图对本公开的示范性实施例做出说明，其中包括本公开实施例的各种细节以助于理解，应当将它们认为仅仅是示范性的。因此，本领域普通技术人员应当认识到，可以对这里描述的实施例做出各种改变和修改，而不会背离本公开的范围和精神。同样，为了清楚和简明，以下的描述中省略了对公知功能和结构的描述。

车辆上可以设置音频系统，音频系统是指，基于音频采集器和音频输出器组成的用于实现语音通信的系统。其中，音频采集器可以为麦克风，音频输出器可以为扬声器。即音频系统可以为基于麦克风阵列和扬声器阵列组成的用于实现语音通信的系统。

其中，麦克风阵列和扬声器阵列所包含的各个麦克风和扬声器分别设置于车辆内的各个区域。车辆内的各个区域包括，车辆内各个乘客座位区域。

例如，如图1所示，车辆101包括四个乘车用户座位区域，分别为主驾驶区域、副驾驶区域、左后排区域、右后排区域。

在各个区域分别设置麦克风和扬声器，分别用于在各个区域采集音频数据以及播放音频。

例如，在主驾驶区域设置麦克风和扬声器，以基于该麦克风采集主驾驶区域的音频数据，并基于该扬声器播放音频。

一般而言，车辆中设置有终端设备，终端设备可以为设置于车辆的计算机、车载终端、服务器、处理器、芯片等，终端设备中运行有车载通话应用程序和车载语音应用程序，通过结合车载通话应用程序和车载语音应用程序，车辆中的乘车用户可以基于终端设备实现与远端用户的通话。

在相关技术中，当车载终端的车载通话应用程序被使用时，通常默认由主驾驶区域对应的音频采集器，对主驾驶区域的音频数据进行采集，相应的，车载语音应用程序需停止采集音频数据，以避免通话被其他区域(如副驾驶区域)的音频数据干扰。

然而，采用上述方法，车载语音应用程序在车载通话应用程序使用时无法正常使用的，导致用于实现终端设备的通话音频无切换，如无法将主驾驶区域的主驾驶用户与远端用户的通话，切换至由副驾驶区域的副驾驶用户与远端用户的通话。

为了避免上述问题，本公开的发明人经过创造性的劳动，得到了本公开的发明构思：在车载通话应用程序被使用时，车载语音应用程序不停止工作，即车载语音应用程序仍然处于对音频数据进行采集的状态，并在有切换需求时，切换由不同的音频采集器所采集的音频数据，以切换用于实现与远端用户通话的音频数据。

基于上述发明构思，本公开提供一种语音处理方法、终端设备及车辆，应用于人工智能技术中自动驾驶技术，具体涉及车联网技术和语音技术，以满足通话的可靠性和有效性。

图2是根据本公开第一实施例的示意图，其中，本公开实施例提供了一种语音处理方法，该方法应用于车辆中的终端设备，车辆中设置有多个音频采集器，不同的音频采集器对应于车辆中的不同位置区域，音频采集器与终端设备连接。

如图2所示，本公开的语音处理方法，包括：

S201：在终端设备处于通话状态的过程中，接收车载语音应用程序发送的音频数据。

其中，音频数据中包括各音频采集器采集的音频。

示例性的，本实施例的语音处理方法可以应用于如图1所示的应用场景。

例如，若音频采集器的数量为两个，且分别主驾驶区域对应的音频采集器和副驾驶区域对应的音频采集器，则当车载通话应用程序处于通话状态时，即当某乘车用户(如主驾驶用户)基于终端设备(具体为基于运行于终端设备的车载通话应用程序)与远端用户进行远端通话时，车载语音应用程序仍然获取主驾驶区域对应的音频采集器采集的音频和副驾驶区域对应的音频采集器采集的音频，并将采集到的音频数据(包括主驾驶区域对应的音频采集器采集到的音频和副驾驶区域对应的音频采集器采集到的音频)传输给车载通话应用程序。

S202：获取待切换的音频采集器的第一标识。

其中，第一标识与第二标识不同，第二标识为终端设备当前实现通话的音频采集器的标识。

示例性的，音频采集器的数量可以为多个，且为了对不同的音频采集器进行区分，不同的音频采集器可以具有不同的标识，即可以通过标识对音频采集器进行区分。

例如，为了对主驾驶区域对应的音频采集器与副驾驶区域对应的音频采集器进行区分，分别为主驾驶区域对应的音频采集器与副驾驶区域对应的音频采集器设置相应的标识。

其中，待切换的音频采集器是指，从终端设备当前实现通话的音频对应的音频采集器即将切换至的音频采集器。

例如，结合图1和上述实施例，终端设备当前实现通话的音频对应的音频采集器为主驾驶区域对应的音频采集器，待切换的音频采集器为副驾驶区域对应的音频采集器。也就是说，在切换前，终端设备是基于主驾驶区域对应的音频采集器所采集的音频数据，实现与远端用户的通话；在切换后，终端设备是基于副驾驶区域对应的音频采集器所采集的音频数据，实现与远端用户的通话。

值得说明的是，本实施例对车载通话应用程序获取第一标识的方法不做限定。例如：

在一些实施例中，车载通话应用程序可以基于乘车用户(如主驾驶用户或者副驾驶用户等)的指示(如触控操作指令而产生的指示，或者，语音控制指令而产生的指示灯)获取第一标识。

在另一些实施例中，车载通话应用程序也可以基于车载语音应用程序的指示获取第一标识。

S203：根据音频数据中的与第一标识对应的音频，进行通话处理。

结合上述实施例，终端设备当前实现通话的音频对应的音频采集器为主驾驶区域对应的音频采集器，待切换的音频采集器为副驾驶区域对应的音频采集器，则车载通话应用程序从音频数据(即主驾驶区域对应的音频采集器所采集的音频和副驾驶区域对应的音频采集器所采集的音频)中，选择与副驾驶区域对应的音频采集器所采集的音频，以基于该音频实现与远端用户的通话。

也就是说，在本实施例中，可以实现由不同区域的乘车用户与远端用户之间的通话，即可以实现切换与远端用户进行通话的乘车用户，如通过本公开实施例提供的方法，在主驾驶用户与远端用户进行通话时，可以切换至由副驾驶用户与远端用户进行通话，从而实现通话的灵活性和多样性的技术效果。

基于上述分析可知，本公开实施例提供了一种语音处理方法，该方法应用于车辆中的终端设备，车辆中设置有多个音频采集器，不同的音频采集器对应于车辆中的不同位置区域，音频采集器与终端设备连接，该方法包括：在终端设备处于通话状态的过程中，接收车载语音应用程序发送的音频数据，其中，音频数据中包括各音频采集器采集的音频，获取待切换的音频采集器的第一标识，其中，第一标识与第二标识不同，第二标识为终端设备当前所处理的音频对应的音频采集器的标识，根据音频数据中的与第一标识对应的音频，进行通话处理，在本实施例中，引入了：在终端设备处于通话状态的过程中，车载语音应用程序仍然处于工作状态，以使车载通话应用程序接收车载语音应用程序发送的音频数据，以便在车载通话应用程序获取到第一标识时，基于音频数据中与第一标识对应的音频实现通话处理的技术特征，避免了相关技术中，若终端设备(具体为终端设备中的车载通话应用程序)处于通话状态时，车载语音应用程序停止工作造成的多音频采集器相较于单音频采集器的优势丧失，无法进行各音频采集器之间的切换的弊端，实现了在与远端用户通话时，在不同的用户(如主驾驶用户和副驾驶用户)之间进行切换，从而实现通话的灵活性和多样性的技术效果。

图3是根据本公开第二实施例的示意图，其中，本公开实施例提供了一种语音处理方法，该方法应用于车辆中的终端设备，车辆中设置有多个音频采集器，不同的音频采集器对应于车辆中的不同位置区域，音频采集器与终端设备连接。

如图3所示，本公开的语音处理方法，包括：

S301：在终端设备处于通话状态的过程中，接收车载语音应用程序发送的降噪处理后音频数据。

示例性的，车载语音应用程序采集音频数据。其中，音频数据中包括各音频采集器采集的音频。

且车载语音应用程序对音频数据进行降噪处理。

例如，车载语音应用程序中预先部署有降噪算法，并基于降噪算法对音频数据进行降噪处理。本实施例对降噪算法不做限定。

在车载语音应用程序对音频数据进行降噪处理后，车载语音应用程序向终端设备(具体为终端设备中运行的车载通话应用程序)发送降噪后的音频数据。

相应的，终端设备(具体为终端设备中运行的车载通话应用程序)接收由车载语音应用程序发送的降噪后的音频数据。

其中，降噪后的音频数据用于为终端设备提供与第一标识对应的音频以便终端设备基于第一标识对应的音频进行通话处理；第一标识为待切换的音频处理器的标识，第一标识与第二标识不同，第二标识为终端设备当前实现通话的音频采集器的标识。

在一些实施例中，车载通话应用程序与车载语音应用程序之间，基于接口定义语言(Android Interface Definition Language，AIDL)构建的通信链路进行通信，以便基于该通信链路实现车载通话应用程序与车载语音应用程序之间的信息传输。

例如，车载语音应用程序通过基于该通信链路将降噪处理后的音频数据发送给车载通话应用程序。

S302：根据降噪后的音频数据中的与第一标识对应的音频，进行通话处理。

值得说明的是，在本实施例中，通过由车载语音应用程序对音频数据进行降噪处理，以将降噪后的音频数据发送给车载通话应用程序，使得车载通话应用程序无需对降噪后的音频数据进行降噪处理，实现了节约资源，提高了资源的合理利用的技术效果。

图4是根据本公开第三实施例的示意图，其中，本公开实施例提供了一种语音处理方法，该方法应用于车辆中的终端设备，车辆中设置有多个音频采集器，不同的音频采集器对应于车辆中的不同位置区域，音频采集器与终端设备连接。

如图4所示，本公开的语音处理方法，包括：

S401：在终端设备处于通话状态的过程中，接收车载语音应用程序发送的音频数据，并接收车载语音应用程序发送的音频检测信息。

其中，音频数据中包括各音频采集器的音频。

其中，音频检测信息是，基于对音频采集器各自采集的音频进行监听确定的。

示例性的，可以基于车载语音应用程序中的各唤醒引擎对各自对应的音频采集器的音频进行监听。

其中，车载语音应用程序部署有多个唤醒引擎，音频采集器与唤醒引擎之间为一一对应关系，如一个音频采集器对应一个唤醒引擎。

响应于第一音频采集器对应的唤醒引擎监听到预设唤醒词，由第一音频采集器对应的唤醒引擎生成并向终端设备(具体为运行于终端设备的车载通话应用程序)发送音频检测信息。

其中，音频检测信息中包括第一标识，第一标识为待切换的音频采集器的标识，第一标识与第二标识不同，第二标识为终端设备当前实现通话的音频采集器的标识。

例如，结合图1所示的应用场景和上述实施例，副驾驶区域对应的音频采集器采集副驾驶用户的音频，并当该音频中包括预设唤醒词时，由副驾驶区域对应的唤醒引擎生成音频检测信息，该音频检测信息中包括副驾驶区域对应的音频采集器的标识(即第一标识)，并将该第一标识发送给终端设备(具体为运行于终端设备的车载通话应用程序)。

相应的，车载通话应用程序接收由副驾驶区域对应的音频采集器的唤醒引擎发送的第一标识。

在另一些实施例中，车载通话应用程序部署有识别引擎，若各唤醒引擎均未监听到预设唤醒词，则由识别引擎对音频数据进行识别，得到识别结果，以控制车辆执行相应的控制操作。

例如，若识别结果为“播放音乐”，则终端设备根据该识别结果播放音乐。

S402：根据第一标识，从音频数据中确定与第一标识对应的音频，并基于该音频进行通话处理。

其中，关于S402的实现原理，可以参见上述实施例，此处不再赘述。

在另一些实施例中，在各唤醒引擎对各自对应的音频采集器的音频进行监听之后，响应于第一音频采集器对应的唤醒引擎监听到预设唤醒词，确定终端设备当前实现通话的音频对应的音频采集器的第二标识，若第一标识与第二标识不同，则生成并向终端设备(具体为运行于终端设备的车载通话应用程序)发送第二切换指令，第二切换指令中包括待切换的音频采集器的第一标识。

相应的，车载通话应用程序接收第二切换指令，并根据第二切换指令中的第一标识，从音频数据中确定与第一标识对应的音频，以便终端设备基于该音频进行通话处理。

在另一些实施例中，还可以由终端设备(具体为运行于终端设备的车载通话应用程序)确定是否需要对音频采集器进行切换，以实现由不同的乘车用户与远端用户之间的通话。例如：

音频检测信息中包括第一标识，终端设备确定终端设备当前实现通话的音频对应的音频采集器的标识为第二标识，终端设备(具体为运行于终端设备的车载通话应用程序)确定第一标识与第二标识是否相同，如确定第一标识与第二标识不同，则终端设备根据音频数据中的与第一标识对应的音频，进行通话处理。

通过该实施例，可以实现终端设备用于与远端通话的音频，为由不同的音频采集器所采集的音频，以满足切换不同的乘车用户与远端用户进行通话，即满足通话在不同乘车用户之间的切换，从而提高通话的灵活性和可靠性的技术效果。

在一些实施例中，若确定第一标识与第二标识不同，则根据音频数据中的与所述第一标识对应的音频，进行通话处理可以包括：

生成第一切换指令，第一切换指令用于指示切音频采集器，并根据第一切换指令从音频数据中提取与第一标识对应的音频，以根据提取出的音频进行通话处理。

也就是说，在本实施例中，当终端设备当前实现通话的音频对应的音频采集器的标识(即第二标识)与待切换的音频采集器的标识(即第一标识)不相同时，则终端设备可以生成第一切换指令，以基于该第一切换指令将用于与远端用户的通话的音频采集器进行切换，如从主驾驶用户的音频采集器切换至副驾驶用户的音频采集器，从而实现通话在不同乘车用户之间的切换，提高通话的灵活性和可靠性的技术效果。

在另一些实施例中，还可以基于乘车用户的指示在不同的音频采集器之间进行切换，以实现由不同的乘车用户与远端用户进行通话。例如：

终端设备响应于用户的触发操作，确定触发操作所指示的待切换的音频采集器，并确定待切换的音频采集器的第一标识，以便根据第一标识从音频数据中确定与第一标识对应的音频，并基于该音频进行通话处理。

在本实施例中，通过用户的触发操作，实现音频采集器之间的切换，可以满足切换的灵活性和多样性的技术效果。

其中，本公开实施例对触发操作不做限定，例如，触发操作可以为以下的任意一种：触控操作、语音操作、红外遥控操作。

示例性的，终端设备包括显示器，显示器上可以对不同的音频采集器进行虚拟显示，乘车用户可以通过触控操作的方式选择相应的音频采集器，以实现不同音频采集器之间的切换，从而实现基于乘车用户的指示在不同的音频采集器之间进行切换，以实现由不同的乘车用户与远端用户进行通话。

值得说明的是，结合上述分析可知，在一些实施例中，车载语音应用程序可以将包括各音频采集器各自对应的音频的音频数发送给车载通话应用程序，以由车载通话应用程序基于当前用于与远端用户进行通话的音频采集器从音频数据中选取相应的音频数据。

在另一些实施例中，车载语音应用程序也可以基于终端设备当前用于与远端用户进行通话的音频采集器，向终端设备发送与该音频采集器对应的音频数据。

也就是说，可以由车载语音应用程序提取用于与远端用户进行通话的音频数据，也可以由终端设备提取用于与远端用户进行通话的音频数据，从而实现提取用于与远端用户进行通话的音频数据的灵活性的技术效果。

基于上述分析可知，在一些实施例中，可以由终端设备(具体为运行于终端设备的车载通话应用程序)确定是否在音频采集器间进行切换，也可以由车载语音应用程序确定是否在音频采集器间进行切换，还可以基于乘车用户的指示确定是否在音频采集器间进行切换，以提高切换的灵活性和多样性，满足由不同的乘车用户与远端用户进行通话，实现通话的灵活性，满足乘车用户的通话体验。

图5是根据本公开第四实施例的示意图，其中方法应用于车辆中的终端设备，车辆中设置有多个音频采集器，不同的音频采集器对应于车辆中的不同位置区域，音频采集器与终端设备连接。

如图5所示，本公开的语音处理方法，包括：

S501：在终端设备处于通话状态的过程中，基于车载语音应用程序采集音频数据。

其中，音频数据中包括与各音频采集器采集的音频。

S502：将音频数据发送给车载通话应用程序。

其中，音频数据用于为终端设备提供与第一标识对应的音频以进行通话处理；第一标识为待切换的音频采集器的标识，第一标识与第二标识不同，第二标识为终端设备当前实现通话的音频采集器的标识。

在一些实施例中，在车载语音应用程序将音频数据发送给车载通话应用程序之后，车载语音应用程序还可以向车载通话应用程序发送音频检测信息，音频检测信息中包括第一标识。

其中，车载语音应用程序向车载通话应用程序发送音频检测信息，包括：若音频数据中包括预设唤醒词，则生成并向车载通话应用程序发送音频检测信息。

在一些实施例中，车载语音应用程序部署有多个唤醒引擎，音频采集器与唤醒引擎之间一一对应；若音频数据中包括预设唤醒词，则生成并向车载通话应用程序发送音频检测信息，包括如下步骤：

第一步骤：基于各唤醒引擎对各自对应的音频采集器的音频进行监听。

第二步骤：响应于第一音频采集器对应的唤醒引擎监听到预设唤醒词，生成并向车载通话应用程序发送音频检测信息。

在另一些实施例中，在第一步骤之后，还可以包括如下步骤：

第三步骤：响应于第一音频采集器对应的唤醒引擎监听到预设唤醒词，确定终端设备当前用于实现通话的音频采集器的第二标识。

第四步骤：若第一标识与第二标识不同，则生成并向车载通话应用程序发送第二切换指令，第二切换指令中包括待切换的音频采集器的第一标识。

在一些实施例中，车载语音应用程序发送给车载通话应用程序的音频数据为：降噪处理后的音频数据。

在一些实施例中，车载语音应用程序发送给车载通话应用程序的音频数据为：在确定出车载通话应用程序当前所处理的音频对应的音频采集器之后，将音频数据中与确定出的音频采集器对应的音频数据。

图6是根据本公开第五实施例的示意图，如图6所示，语音处理装置600，包括：

接收单元601，用于在终端设备处于通话状态的过程中，接收车载语音应用程序发送的音频数据，其中，音频数据中包括各音频采集器采集的音频。

其中，语音处理装置应用于车辆中的终端设备，车辆中设置有多个音频采集器，不同的音频采集器对应于车辆中的不同位置区域，音频采集器与终端设备连接。

获取单元602，用于获取待切换的音频采集器的第一标识；其中，第一标识与第二标识不同，第二标识为终端设备当前实现通话的音频采集器的标识。

通话单元603，用于根据音频数据中的与第一标识对应的音频，进行通话处理。

图7是根据本公开第六实施例的示意图，如图7所示，基于语音处理装置700，包括：

接收单元701，用于在终端设备处于通话状态的过程中，接收车载语音应用程序发送的音频数据，其中，音频数据中包括各音频采集器采集的音频。

在一些实施例中，音频数据为降噪处理后的音频数据。

处理单元702，用于丢弃音频数据中的其他标识所对应的音频采集器的音频，其中，其他标识为与第一标识不同的标识。

降噪单元703，用于对音频数据进行降噪处理，得到降噪后的音频数据。

获取单元704，用于获取待切换的音频采集器的第一标识；其中，第一标识与第二标识不同，第二标识为终端设备当前实现通话的音频采集器的标识。

在一些实施例中，结合图7可知，获取单元704，包括：

第一确定子单元7041，用于响应于用户的触发操作，确定触发操作所指示的待切换的音频采集器。

第二确定子单元7042，用于确定待切换的音频采集器的第一标识。

在一些实施例中，触发操作为以下的任意一种：触控操作、语音操作、红外遥控操作。

在一些实施例中，获取单元704用于，接收车载语音应用程序发送的第二切换指令，其中，第二切换指令中包括待切换的音频采集器的第一标识，第二切换指令为确定第一标识与第二标识不同时所生成的。

在一些实施例中，第一标识为确定采集到的音频中包括预设唤醒词时所确定的，且第一标识为与采集到的音频对应的音频采集器的标识。

通话单元705，用于根据音频数据中的与第一标识对应的音频，进行通话处理。

在一些实施例中，获取单元704用于，接收车载语音应用程序发送的音频检测信息，音频检测信息中包括第一标识。

相应的，通话单元705用于，若确定第一标识与第二标识不同，则根据音频数据中的与第一标识对应的音频，进行通话处理。

在一些实施例中，音频检测信息为确定采集到的音频中包括预设唤醒词时所生成的。

在一些实施例中，若确定第一标识与所述第二标识不同，通话单元705，包括：

第一生成子单元7051，用于若确定第一标识与第二标识不同，则生成第一切换指令，第一切换指令用于指示切换音频采集器。

提取子单元7052，用于根据第一切换指令，提取音频数据中的与第一标识对应的音频。

通话子单元7053，用于根据与第一标识对应的音频，进行通话处理。

图8是根据本公开第七实施例的示意图，如图8所示，基于语音处理装置800，包括：

采集单元801，用于在终端设备处于通话状态的过程中，采集音频数据，其中，音频数据中包括各音频采集器采集的音频。

其中，语音处理装置应用于车辆中的终端设备，所述车辆中设置有多个音频采集器，不同的音频采集器对应于所述车辆中的不同位置区域，所述音频采集器与所述终端设备连接。

第一发送单元802，用于将音频数据发送给车载通话应用程序；其中，音频数据用于为车载通话应用程序提供与第一标识对应的音频以进行通话处理；第一标识为待切换的音频采集器的标识，第一标识与第二标识不同，第二标识为终端设备当前实现通话的音频采集器的标识。

图9是根据本公开第八实施例的示意图，如图9所示，语音处理装置900，包括：

采集单元901，用于在终端设备处于通话状态的过程中，采集音频数据，其中，音频数据中包括各音频采集器采集的音频。

第一发送单元902，用于将音频数据发送给车载通话应用程序；其中，音频数据用于为终端设备提供与第一标识对应的音频以进行通话处理；第一标识为待切换的音频采集器的标识，第一标识与第二标识不同，第二标识为终端设备当前实现通话的音频采集器的标识。

在一些实施例中，结合图9可知，第一发送单元902，包括：

降噪子单元9021，用于对音频数据进行降噪处理。

第二发送子单元9022，用于将降噪处理后的音频数据发送给载通话应用程序。

第三确定子单元9023，用于确定终端设备当前实现通话的音频对应的音频采集器。

第三发送子单元9024，用于将音频数据中与确定出的音频采集器对应的音频数据发送给车载通话应用程序。

第二发送单元903，用于向车载通话应用程序发送音频检测信息，音频检测信息中包括第一标识。

在一些实施例中，结合图9可知，第二发送单元903，包括：

第二生成子单元9031，用于若音频数据中包括预设唤醒词，则生成音频检测信息。

在一些实施例中，车载语音应用程序部署有多个唤醒引擎，音频采集器与唤醒引擎之间一一对应；若音频数据中包括预设唤醒词，第二生成子单元9031，包括：

监听模块，用于基于各唤醒引擎对各自对应的音频采集器的音频进行监听。

第一生成模块，用于响应于第一音频采集器对应的唤醒引擎监听到预设唤醒词，生成音频检测信息。

确定模块，用于响应于第一音频采集器对应的唤醒引擎监听到预设唤醒词，确定终端设备当前实现通话的音频对应的音频采集器的第二标识。

第二生成模块，用于若第一标识与第二标识不同，则生成第二切换指令，第二切换指令中包括待切换的音频采集器的第一标识。

第一发送子单元9032，用于向车载通话应用程序发送音频检测信息。

图10是根据本公开第九实施例的示意图，如图10所示，本公开中的电子设备1000可以包括：处理器1001和存储器1002。

存储器1002，用于存储程序；存储器1002，可以包括易失性存储器(英文：volatilememory)，例如随机存取存储器(英文：random-access memory，缩写：RAM)，如静态随机存取存储器(英文：static random-access memory，缩写：SRAM)，双倍数据率同步动态随机存取存储器(英文：Double Data Rate Synchronous Dynamic Random Access Memory，缩写：DDR SDRAM)等；存储器也可以包括非易失性存储器(英文：non-volatile memory)，例如快闪存储器(英文：flash memory)。存储器1002用于存储计算机程序(如实现上述方法的应用程序、功能模块等)、计算机指令等，上述的计算机程序、计算机指令等可以分区存储在一个或多个存储器1002中。并且上述的计算机程序、计算机指令、数据等可以被处理器1001调用。

上述的计算机程序、计算机指令等可以分区存储在一个或多个存储器1002中。并且上述的计算机程序、计算机指据等可以被处理器1001调用。

处理器1001，用于执行存储器1002存储的计算机程序，以实现上述实施例涉及的方法中的各个步骤。

具体可以参见前面方法实施例中的相关描述。

处理器1001和存储器1002可以是独立结构，也可以是集成在一起的集成结构。当处理器1001和存储器1002是独立结构时，存储器1002、处理器1001可以通过总线1003耦合连接。

本实施例的电子设备可以执行上述方法中的技术方案，其具体实现过程和技术原理相同，此处不再赘述。

根据本公开实施例的另一个方面，本公开实施例还提供了一种车辆，包括上述实施例所述的语音处理装置。

根据本公开的实施例，本公开还提供了一种电子设备、一种可读存储介质和一种计算机程序产品。

根据本公开的实施例，本公开还提供了一种计算机程序产品，计算机程序产品包括：计算机程序，计算机程序存储在可读存储介质中，电子设备的至少一个处理器可以从可读存储介质读取计算机程序，至少一个处理器执行计算机程序使得电子设备执行上述任一实施例提供的方案。

图11示出了可以用来实施本公开的实施例的示例电子设备1100的示意性框图。电子设备旨在表示各种形式的数字计算机，诸如，膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置，诸如，个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例，并且不意在限制本文中描述的和/或者要求的本公开的实现。

如图11所示，设备1100包括计算单元1101，其可以根据存储在只读存储器(ROM)1102中的计算机程序或者从存储单元1108加载到随机访问存储器(RAM)1103中的计算机程序，来执行各种适当的动作和处理。在RAM 1103中，还可存储设备1100操作所需的各种程序和数据。计算单元1101、ROM 1102以及RAM 1103通过总线1104彼此相连。输入/输出(I/O)接口1105也连接至总线1104。

设备1100中的多个部件连接至I/O接口1105，包括：输入单元1106，例如键盘、鼠标等；输出单元1107，例如各种类型的显示器、扬声器等；存储单元1108，例如磁盘、光盘等；以及通信单元1109，例如网卡、调制解调器、无线通信收发机等。通信单元1109允许设备1100通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。

计算单元1101可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元1101的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元1101执行上文所描述的各个方法和处理，例如语音处理方法。例如，在一些实施例中，语音处理方法可被实现为计算机软件程序，其被有形地包含于机器可读介质，例如存储单元1108。在一些实施例中，计算机程序的部分或者全部可以经由ROM 1102和/或通信单元1109而被载入和/或安装到设备1100上。当计算机程序加载到RAM 1103并由计算单元1101执行时，可以执行上文描述的语音处理方法的一个或多个步骤。备选地，在其他实施例中，计算单元1101可以通过其他任何适当的方式(例如，借助于固件)而被配置为执行语音处理方法。

本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、负载可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括：实施在一个或者多个计算机程序中，该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释，该可编程处理器可以是专用或者通用可编程处理器，可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令，并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。

用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器，使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行，作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。

在本公开的上下文中，机器可读介质可以是有形的介质，其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备，或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。

为了提供与用户的交互，可以在计算机上实施此处描述的系统和技术，该计算机具有：用于向用户显示信息的显示装置(例如，CRT(阴极射线管)或者LCD(液晶显示器)监视器)；以及键盘和指向装置(例如，鼠标或者轨迹球)，用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互；例如，提供给用户的反馈可以是任何形式的传感反馈(例如，视觉反馈、听觉反馈、或者触觉反馈)；并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。

可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如，作为数据服务器)、或者包括中间件部件的计算系统(例如，应用服务器)、或者包括前端部件的计算系统(例如，具有图形用户界面或者网络浏览器的用户计算机，用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如，通信网络)来将系统的部件相互连接。通信网络的示例包括：局域网(LAN)、广域网(WAN)和互联网。

计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器，又称为云计算服务器或云主机，是云计算服务体系中的一项主机产品，以解决了传统物理主机与VPS服务("Virtual Private Server"，或简称"VPS")中，存在的管理难度大，业务扩展性弱的缺陷。服务器也可以为分布式系统的服务器，或者是结合了区块链的服务器。

应该理解，可以使用上面所示的各种形式的流程，重新排序、增加或删除步骤。例如，本发公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行，只要能够实现本公开公开的技术方案所期望的结果，本文在此不进行限制。

上述具体实施方式，并不构成对本公开保护范围的限制。本领域技术人员应该明白的是，根据设计要求和其他因素，可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等，均应包含在本公开保护范围之内。

Claims

1.一种语音处理方法，所述方法应用于车辆中的终端设备，所述车辆中设置有多个音频采集器，不同的音频采集器对应于所述车辆中的不同位置区域，所述音频采集器与所述终端设备连接，所述方法包括：

2.根据权利要求1所述的方法，其中，获取待切换的音频采集器的第一标识，包括：接收所述车载语音应用程序发送的音频检测信息，所述音频检测信息中包括所述第一标识；

根据所述音频数据中的与所述第一标识对应的音频，进行通话处理，包括：

若确定所述第一标识与所述第二标识不同，则根据所述音频数据中的与所述第一标识对应的音频，进行通话处理。

3.根据权利要求2所述的方法，其中，若确定所述第一标识与所述第二标识不同，则根据所述音频数据中的与所述第一标识对应的音频，进行通话处理，包括：

若确定所述第一标识与所述第二标识不同，则生成第一切换指令，所述第一切换指令用于指示切换音频采集器；

根据所述第一切换指令，提取所述音频数据中的与所述第一标识对应的音频；并根据与所述第一标识对应的音频，进行通话处理。

4.根据权利要求2或3所述的方法，其中，所述音频检测信息为确定采集到的音频中包括预设唤醒词时所生成的。

5.根据权利要求1所述的方法，其中，所述获取待切换的音频采集器的第一标识，包括：

响应于用户的触发操作，确定所述触发操作所指示的所述待切换的音频采集器，并确定所述待切换的音频采集器的第一标识。

6.根据权利要求5所述的方法，其中，所述触发操作为以下的任意一种：触控操作、语音操作、红外遥控操作。

7.根据权利要求1所述的方法，其中，所述获取待切换的音频采集器的第一音频标识，包括：

接收所述车载语音应用程序发送的第二切换指令，其中，所述第二切换指令中包括所述待切换的音频采集器的第一标识，所述第二切换指令为确定所述第一标识与所述第二标识不同时所生成的。

8.根据权利要求7所述的方法，其中，所述第一标识为确定采集到的音频中包括预设唤醒词时所确定的，且所述第一标识为与采集到的音频对应的音频采集器的标识。

9.根据权利要求1-8任一项所述的方法，其中，所述音频数据为降噪处理后的音频数据。

10.根据权利要求1-8任一项所述的方法，其中，在接收车载语音应用程序发送的音频数据之后，还包括：

对所述音频数据进行降噪处理，得到降噪后的音频数据。

11.根据权利要求1-10任一项所述的方法，还包括：

丢弃所述音频数据中的其他标识所对应的音频采集器的音频，其中，其他标识为与所述第一标识不同的标识。

12.一种语音处理方法，所述方法应用于车辆中的终端设备，所述车辆中设置有多个音频采集器，不同的音频采集器对应于所述车辆中的不同位置区域，所述音频采集器与所述终端设备连接，所述方法包括：

13.根据权利要求12所述的方法，其中，在将所述音频数据发送给车载通话应用程序之后，还包括：

向所述车载通话应用程序发送音频检测信息，所述音频检测信息中包括所述第一标识。

14.根据权利要求13所述的方法，其中，向所述车载通话应用程序发送音频检测信息，包括：

若所述音频数据中包括预设唤醒词，则生成并向所述车载通话应用程序发送音频检测信息。

15.根据权利要求14所述的方法，其中，所述车载语音应用程序部署有多个唤醒引擎，音频采集器与唤醒引擎之间一一对应；若所述音频数据中包括预设唤醒词，则生成并向所述车载通话应用程序发送音频检测信息，包括：

基于各唤醒引擎对各自对应的音频采集器的音频进行监听；

响应于第一音频采集器对应的唤醒引擎监听到预设唤醒词，生成并向所述车载通话应用程序发送音频检测信息。

16.根据权利要求15所述的方法，其中，在基于各唤醒引擎对各自对应的音频采集器的音频进行监听之后，还包括：

响应于所述第一音频采集器对应的唤醒引擎监听到预设唤醒词，确定所述终端设备当前实现通话的音频对应的音频采集器的第二标识；

若所述第一标识与所述第二标识不同，则生成并向所述车载通话应用程序发送第二切换指令，所述第二切换指令中包括所述待切换的音频采集器的第一标识。

17.根据权利要求12-16中任一项所述的方法，其中，将所述音频数据发送给所述车载通话应用程序，包括：

对所述音频数据进行降噪处理，并将降噪处理后的音频数据发送给所述载通话应用程序。

18.根据权利要求12-17中任一项所述的方法，其中，将所述音频数据发送给所述车载通话应用程序，包括：

确定所述终端设备当前实现通话的音频对应的音频采集器，将所述音频数据中与确定出的音频采集器对应的音频数据发送给所述车载通话应用程序。

19.一种语音处理装置，所述装置应用于车辆中的终端设备，所述车辆中设置有多个音频采集器，不同的音频采集器对应于所述车辆中的不同位置区域，所述音频采集器与所述终端设备连接，所述装置包括：

20.根据权利要求19所述的装置，其中，所述获取单元用于，接收所述车载语音应用程序发送的音频检测信息，所述音频检测信息中包括所述第一标识；

所述通话单元用于，若确定所述第一标识与所述第二标识不同，则根据所述音频数据中的与所述第一标识对应的音频，进行通话处理。

21.根据权利要求20所述的装置，其中，所述通话单元，包括：

第一生成子单元，用于若确定所述第一标识与所述第二标识不同，则生成第一切换指令，所述第一切换指令用于指示切换音频采集器；

提取子单元，用于根据所述第一切换指令，提取所述音频数据中的与所述第一标识对应的音频；

通话子单元，用于根据与所述第一标识对应的音频，进行通话处理。

22.根据权利要求20或21所述的装置，其中，所述音频检测信息为确定采集到的音频中包括预设唤醒词时所生成的。

23.根据权利要求19所述的装置，其中，所述获取单元，包括：

第一确定子单元，用于响应于用户的触发操作，确定所述触发操作所指示的所述待切换的音频采集器；

第二确定子单元，用于确定所述待切换的音频采集器的第一标识。

24.根据权利要求23所述的装置，其中，所述触发操作为以下的任意一种：触控操作、语音操作、红外遥控操作。

25.根据权利要求19所述的装置，其中，所述获取单元用于，接收所述车载语音应用程序发送的第二切换指令，其中，所述第二切换指令中包括所述待切换的音频采集器的第一标识，所述第二切换指令为确定所述第一标识与所述第二标识不同时所生成的。

26.根据权利要求25所述的装置，其中，所述第一标识为确定采集到的音频中包括预设唤醒词时所确定的，且所述第一标识为与采集到的音频对应的音频采集器的标识。

27.根据权利要求19-26任一项所述的装置，其中，所述音频数据为降噪处理后的音频数据。

28.根据权利要求19-26任一项所述的装置，还包括：

降噪单元，用于对所述音频数据进行降噪处理，得到降噪后的音频数据。

29.根据权利要求19-28任一项所述的装置，还包括：

处理单元，用于丢弃所述音频数据中的其他标识所对应的音频采集器的音频，其中，其他标识为与所述第一标识不同的标识。

30.一种语音处理装置，车辆中的终端设备，所述车辆中设置有多个音频采集器，不同的音频采集器对应于所述车辆中的不同位置区域，所述音频采集器与所述终端设备连接，所述装置包括：

31.根据权利要求30所述的装置，还包括：

第二发送单元，用于向所述车载通话应用程序发送音频检测信息，所述音频检测信息中包括所述第一标识。

32.根据权利要求31所述的装置，其中，所述第二发送单元，包括：

第二生成子单元，用于若所述音频数据中包括预设唤醒词，则生成音频检测信息；

第一发送子单元，用于向所述车载通话应用程序发送所述音频检测信息。

33.根据权利要求32所述的装置，其中，所述车载语音应用程序部署有多个唤醒引擎，音频采集器与唤醒引擎之间一一对应；若所述音频数据中包括预设唤醒词，所述第二生成子单元，包括：

监听模块，用于基于各唤醒引擎对各自对应的音频采集器的音频进行监听；

34.根据权利要求33所述的装置，其中，所述第二生成子单元，还包括：

确定模块，用于响应于所述第一音频采集器对应的唤醒引擎监听到预设唤醒词，确定所述终端设备当前实现通话的音频对应的音频采集器的第二标识；

第二生成模块，用于若所述第一标识与所述第二标识不同，则生成第二切换指令，所述第二切换指令中包括所述待切换的音频采集器的第一标识。

35.根据权利要求30-34中任一项所述的装置，其中，所述第一发送单元，包括：

降噪子单元，用于对所述音频数据进行降噪处理；

第二发送子单元，用于将降噪处理后的音频数据发送给所述载通话应用程序。

36.根据权利要求30-35中任一项所述的装置，其中，所述第一发送单元，包括：

第三确定子单元，用于确定所述终端设备当前实现通话的音频对应的音频采集器；

第三发送子单元，用于将所述音频数据中与确定出的音频采集器对应的音频数据发送给所述车载通话应用程序。

37.一种电子设备，包括：

至少一个处理器；以及

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行权利要求1-11中任一项所述的方法；或者，以使所述至少一个处理器能够执行权利要求12-18中任一项所述的方法。

38.一种存储有计算机指令的非瞬时计算机可读存储介质，其中，所述计算机指令用于使所述计算机执行根据权利要求1-11中任一项所述的方法；或者，所述计算机指令用于使所述计算机执行根据权利要求12-18中任一项所述的方法。

39.一种计算机程序产品，包括计算机程序，该计算机程序被处理器执行时实现权利要求1-11中任一项所述方法的步骤；或者，该计算机程序被处理器执行时实现权利要求12-18中任一项所述方法的步骤。

40.一种车辆，包括：如权利要求19-36中任一项所述的语音处理装置。