CN111179930B

CN111179930B - 实现驾驶过程中的智能语音交互的方法及系统

Info

Publication number: CN111179930B
Application number: CN201911422066.9A
Authority: CN
Inventors: 占必强; 李毅昌
Original assignee: Sipic Technology Co Ltd
Current assignee: Sipic Technology Co Ltd
Priority date: 2019-12-31
Filing date: 2019-12-31
Publication date: 2023-04-25
Anticipated expiration: 2039-12-31
Also published as: CN111179930A

Abstract

本发明公开了一种实现驾驶过程中的智能语音交互的方法及系统，该方法包括：在车内配置用于捕获用户语音指令的语音媒介；对语音媒介进行配网处理，以将语音媒介连接至相应的显示媒介；向语音媒介发出用户语音指令，并根据语音媒介对用户语音指令的处理，通过语音媒介或显示媒介输出对用户语音指令的响应结果。通过在车内配置能够捕获用户语音指令的语音媒介，可以实现对用户的语音交互，以使得传统的汽车或低配的汽车也能够快速、方便地实现语音交互功能，而不必再依赖手机进行智能辅助，且通过将语音媒介连接至显示媒介，可以根据用户语音指令的类型，选择通过语音媒介进行交互响应，或通过显示媒介进行交互响应，从而更好地满足用户的多种语音交互需求，提高车机的智能交互性。

Description

实现驾驶过程中的智能语音交互的方法及系统

技术领域

本发明涉及车机语音交互技术领域，特别是一种用于实现驾驶过程中的智能语音交互的方法及系统。

背景技术

目前，在驾驶过程中，利用车机的智能化来满足各种用户需求已经是非常普通的现象，例如通过导航来辅助行程规划、驾驶途中听音乐等等，这对于配置了智能车机系统和车载音响的高配汽车来说，很容易满足用户的这些需求。但是，基于成本和技术的考量，一些比较旧的车型或低配的车型并没有配套智能车机系统和/或车载音响。针对这类没有智能车机系统的汽车，要利用导航或听音乐的场景下，目前常用的解决方案都是通过手机来辅助，而通过手机来辅助的方式，需要通过手动输入所需的信息，以启动手机应用提供相应功能，这在驾驶过程中非常不方便，也不利于驾驶安全。

发明内容

本发明的其中一个目的在于提供一种能够精准实现车内语音交互的解决方案，以使得没有装载智能车机系统或车载音响的汽车也具备智能语音交互功能，从而方便地完成驾驶过程中的例如导航、听音乐等用户需求。

本发明的另一目的还在于在提供语音交互功能的基础上，还能够使得用户随时获取车厂数据，以基于语音交互在驾驶过程中方便地获取汽车状态。

根据本发明的第一方面，提供了一种实现驾驶过程中的智能语音交互的方法，其包括：在车内配置用于捕获用户语音指令的语音媒介；对语音媒介进行配网处理，以将语音媒介连接至相应的显示媒介；向语音媒介发出用户语音指令，并根据语音媒介对用户语音指令的处理，通过语音媒介或显示媒介输出对用户语音指令的响应结果。通过在车内配置能够捕获用户语音指令的语音媒介，可以实现对用户的语音交互，以使得传统的汽车或低配的汽车也能够快速、方便地实现语音交互功能，而不必再依赖手机进行智能辅助，且通过将语音媒介连接至显示媒介，可以根据用户语音指令的类型，选择通过语音媒介进行交互响应，或通过显示媒介进行交互响应，从而更好地满足用户的多种语音交互需求，提高车机的智能交互性。

在一些实施方式中，语音媒介为对麦克风进行了抗噪性处理的智能音箱。由此，就可以通过在车上配置具有精确的拾音效果的智能音箱来实现与用户的语音交互，对于驾驶过程中车内噪声较大的特殊环境来说，拾音效果精确，可以减少误操作，大幅提升与用户语音交互的体验。

在一些实施方式中，智能音箱的电源还配置有反接保护电路。在将智能音箱配置到车内时，主要是将音箱接入到车机电路，以通过车机为音箱的电源供电，在实际应用过程中，发明人注意到将音箱接入到车机时，由于没有插头是直接将音箱电源电路接电，因而很容易发生电路反接从而导致音箱电源烧毁的问题，这对于人工操作来说既是挑战，也会因为电路烧毁而造成资源浪费，基于此发现，发明人通过在音箱电源设置反接保护电路，实现可以轻松地在车机内配置智能音箱，克服了该缺陷，使得配置智能音箱变得简单、易行。

在一些实施方式中，显示媒介为带有显示屏的移动终端，对语音媒介进行配网处理包括：在移动终端建立语音媒介与移动终端的蓝牙连接；通过移动终端输入用于建立语音媒介与移动终端的网络连接的配网信息，并将配网信息通过蓝牙连接传输至语音媒介；接收语音媒介传输的设备信息存储。为了更好地实现对配置的智能音箱的利用，以满足更多的用户语音交互需求，发明人想到将智能音箱与移动终端以及云端服务器进行互联互通，然而智能音箱比较通用的数据传输方式是蓝牙，由于智能音箱本身在配置网络时存在不方便操作(没有可视化界面)的特征，因而如何将智能音箱接入网络，是更好地扩展其应用性的难题。为了解决该困境，发明人经过反复的思考和尝试，最终想到通过移动终端对智能音箱进行配网来解决。由此，语音媒介即智能音箱就可以利用收到的配网信息，与其他设备如移动终端、云端服务器等建立网络通信，从而实现更丰富、更满足用户需求的功能。

在一些实施方式中，在通过移动终端输入配网信息时，还同时输入语音媒介所在的车机的车身码，并将车身码与配网信息一起传输至语音媒介；语音媒介输出的对用户语音指令的响应结果还包括与车身码对应的车厂数据信息。由此，语音媒介还可以基于车身码和配网信息与相应的服务器平台进行通信，以获取到对应的车机的车厂数据信息进行播放，以方便用户及时了解车的情况。

根据本发明的第二个方面，提供了一种实现驾驶过程中的智能语音交互的系统，其包括配置于车内的用于接收用户语音指令的语音媒介；和放置于车内的能够与语音媒介通信的显示媒介；其中，语音媒介根据接收到的用户语音指令，通过语音媒介自身或通过显示媒介进行语音响应。通过在车内配置能够捕获用户语音指令的语音媒介，可以实现对用户的语音交互，以使得传统的汽车或低配的汽车也能够快速、方便地实现语音交互功能，而不必再依赖手机进行智能辅助，且通过将语音媒介连接至显示媒介，可以根据用户语音指令的类型，选择通过语音媒介进行交互响应，或通过显示媒介进行交互响应，从而更好地满足用户的多种语音交互需求，提高车机的智能交互性。

在一些实施方式中，语音媒介包括进行了抗噪性处理的麦克风；和设计有反接保护电路的电源接口。由此，不但能够满足车辆驾驶环境下噪音较大的语音交互场景需求，实现精准的语音识别，提高语音交互精准度；而且，还能够方便、安全地实现语音媒介的配置，大幅提升用户体验。

在一些实施方式中，语音媒介和显示媒介均包括蓝牙模块，且显示媒介还包括配网模块，用于获取配网信息通过蓝牙模块输出至语音媒介；语音媒介还用于通过配网信息建立与显示媒介的通信连接，以通过显示媒介进行语音响应。由此，可以通过显示媒介对语音媒介进行配网，同时显示媒介又可以作为语音响应的介质，实现资源共享。并且通过配网，使得语音媒介能够连接至特定的智能终端或服务平台，方便实现功能定制化和功能扩展，进而能够满足用户驾驶过程中的多种交互需求。

在一些实施方式中，配网模块还用于获取车身码输出至语音媒介；语音媒介还用于根据用户语音指令和车身码输出包括车厂数据信息的语音响应结果。由此，可以使得语音媒介能够通过车身码获取车机的车厂数据进行播报或展示，满足用户的特定需求。

在一些实施方式中，该系统还包括用于进行语音识别处理的云端服务器，语音媒介还通过所述配网信息与云端服务器建立双向通信；其中，语音媒介还用于将接收到的用户语音指令输出至云端服务器进行语音识别处理，并根据云端服务器的处理结果，通过语音媒介自身或通过显示媒介进行语音响应。通过将语音媒介与语音识别云端服务器建立通信，可以方便地实现对语音媒介的语音交互功能的扩展和定制化，且能够方便程序开发和维护。同时，还能够降低对语音媒介的性能要求。

附图说明

图1为本发明一实施方式的实现驾驶过程中的智能语音交互的方法的方法流程图；

图2为图1所示的方法中的进行配网处理的方法流程图；

图3为本发明一实施方式的实现驾驶过程中的智能语音交互的系统的框图；

图4为本发明另一种实施方式的实现驾驶过程中的智能语音交互的系统的框图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

需要说明的是，在不冲突的情况下，本申请中的实施例及实施例中的特征可以相互组合。

本发明可以在由计算机执行的计算机可执行指令的一般上下文中描述，例如程序模块。一般地，程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、元件、数据结构等等。也可以在分布式计算环境中实践本发明，在这些分布式计算环境中，由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中，程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。

在本发明中，“模块”、“装置”、“系统”等指应用于计算机的相关实体，如硬件、硬件和软件的组合、软件或执行中的软件等。详细地说，例如，元件可以、但不限于是运行于处理器的过程、处理器、对象、可执行元件、执行线程、程序和/或计算机。还有，运行于服务器上的应用程序或脚本程序、服务器都可以是元件。一个或多个元件可在执行的过程和/或线程中，并且元件可以在一台计算机上本地化和/或分布在两台或多台计算机之间，并可以由各种计算机可读介质运行。元件还可以根据具有一个或多个数据包的信号，例如，来自一个与本地系统、分布式系统中另一元件交互的，和/或在因特网的网络通过信号与其它系统交互的数据的信号通过本地和/或远程过程来进行通信。

最后，还需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”，不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

本发明实施例的实现驾驶过程中的智能语音交互的方法可以应用于任何需要使其具备智能语音交互功能的汽车上，例如，应用到低配置家庭轿车中，本发明对此不作限制，从而使得用户能够通过该技术方案方便、高效地对原有的汽车进行改造，使其具备智能语音交互功能，满足用户在驾驶过程中通过语音进行安全交互操作的需求。

下面结合附图对本发明作进一步详细的说明。

图1示意性地显示了根据本发明一实施方式的实现驾驶过程中的智能语音交互的方法的流程，如图1所示，本实施例包括如下步骤：

步骤S101：在车内配置用于捕获用户语音指令的语音媒介。具体地，可以将具有语音处理功能的专用语音处理设备配置在要改造的车内，配置方式对于需要外部电源供电的语音媒介可以是接入车机供电接口，对于具有独立供电电源的语音媒介则可以是放置在车内的合适位置。其中，语音媒介可以是任何具备智能语音模块和麦克风的智能语音交互设备，示例性地，作为一种优选实现方式，语音媒介为对麦克风进行了抗噪性处理且安装有智能语音应用软件的智能音箱，其中，在车内配置该智能音箱是通过将智能音箱的电源接入车机的供电接口。由于车内环境相对其他应用场景，噪声会比较大，通过采用专用语音处理设备或对智能音箱的麦克风进行抗噪性处理，不但能够方便地实现对传统或低档车型的改进，使其具备智能语音交互功能，还能够实现精准的语音交互，大幅提高用户体验。

汽车内部声学环境比较恶劣，存在各种噪声的干扰和人机交互，需要对采集到的麦克风信号做处理，后续的唤醒识别模块才能有性能保证。具体地，对智能音箱的麦克风进行的抗噪性处理实现为通过回声消除算法和降噪算法对用户音频进行语音增强处理，以提高用户的有效音频信号，去除噪声干扰。其中，回声消除指全面声学回声消除(AcousticEcho Cancellation,AEC)。声学回声是指设备自身扬声器播放的声音经不同路径一次或多次反射后进入麦克风所产生的回声集合，也可称为设备自噪声。用户通过语音同设备进行交互时，回声信号和干净的语音信号混合，这会恶化采集到的语音信号的信噪比，严重干扰后续的信号处理算法和唤醒识别模块的性能。所以原始麦克风信号要先通过回声消除算法模块，消除设备自噪声，以达到提升信噪比的目的。降噪算法实现为采用专为车载噪声特点设计的噪声跟踪算法，实时动态估计目前车内噪声特征，然后利用降噪算法把估计出的噪声抑制掉，达到增强用户语音的目的，最终提升在车载噪声环境下的语音系统性能。其中，回声消除算法和降噪算法可以选用现有技术中常用的算法实现。

作为一种更优的实现例，在配置语音媒介时，还对接入车机的语音媒介进行反接保护电路设置。以智能音箱为例，在将智能音箱的电源接入车机的电路时，由于是通过人工进行操作，而且接入电路时智能音箱并不是通过插头接入，而是直接接电，因而会很容易出现反接的现象，导致音箱烧坏。为了克服实际操作中发现的这种缺陷，发明人还对智能音箱的电源进行改造，为其配置防反接保护电路。其中，防反接保护电路实现为：供电端口设计为采用防呆端口，确保客户在正常取电情况下不会存在反接的情况。或者实现为：在音箱电源的电源端和接地端之间设置增强型NMOS管保护电路，以利用MOS管的开关特性，控制电路的导通和断开来设计防反接保护电路。具体地，增强型NMOS管保护电路设计为将保护用NMOS场效应管的栅极和源极分别连接被保护电路的电源端和接地端，其漏极连接至被保护电路中NMOS元件的衬底。这样，一旦被保护电路的电源极性反接，保护用NMOS场效应管会形成断路，防止电流烧毁电路中的场效应管元件，保护整体电路。

本领域技术人员应当可以理解的是，对语音媒介进行的抗噪性处理和电源改造都可以根据实际的应用需求选择性采用。

步骤S102：对语音媒介进行配网处理，以将语音媒介连接至相应的显示媒介。通过对语音媒介进行配网，可以使得语音媒介通过配网信息连接至显示媒介或其他所需的平台，能够实现对语音媒介语音处理功能的定制化，丰富与用户的语音交互的功能范围，真正实现驾驶过程中的智能语音交互。

以语音媒介选用具有蓝牙模块和无线通信模块的智能音箱、显示媒介为带有显示屏的移动终端为例，智能音箱虽然能够很好地实现拾音和音频播放功能，但要使得智能音箱通过物联网功能进行功能扩展和定制化，就会由于智能音箱本身存在不方便进行网络配置的固有缺陷，而无法更好地将其应用到智能语音交互环境中。对此，本发明实施例将智能移动终端如手机选取为车内的显示媒介，并利用智能音箱和智能手机都具备的蓝牙通信功能，为智能音箱进行符合用户需求的配网操作，以使得智能音箱能够方便地根据用户指定的配网信息连接至特定的网络，从而实现符合需求的语音交互操作。具体地，图2显示了一种实现方式的对智能音箱进行配网处理的方法流程，其包括如下步骤：

步骤S201：建立智能音箱与移动终端的蓝牙连接。在将智能音箱接入车机后，在移动终端上通过蓝牙模块找到对应的智能音箱，将两者之间首先通过蓝牙进行连接。

步骤S202：通过移动终端输入用于建立语音媒介与移动终端的网络连接的配网信息。这里的移动终端是指配置了用于进行配网的终端应用的智能移动设备如智能手机。这样，通过启动移动终端上的配网应用，就可以进入用户输入界面，通过该界面用户即可方便直观地输入需要将智能音箱连接至的网络，该网络通过配网信息来体现，具体地根据需求配网信息只要包括能够将智能音箱连接至相应网络所需的参数数据即可。示例性地，以智能音箱的网络模块为WiFi无线通信模块为例，此时配网信息包括需要连接至的WiFi热点信息，如WiFi热点的名称和密码。

步骤S203：将输入的配网信息通过蓝牙连接传输至相应的智能音箱。在设置好配网信息后，通过移动终端用户界面上的相应操作选项如提交，即可将用户设置的配网信息通过蓝牙传输至智能音箱。

之后，智能音箱即可根据获取到的配网信息建立网络连接，具体地，可以是通过其WiFi无线通信模块与移动终端建立无线网络连接，这样，在后续的语音交互中，就可以通过该指定网络与移动终端进行通信，而不再使用蓝牙连接，以保证数据传输的效率和可靠性。而在其他具体实现中，还可以根据需求将智能音箱与特定的云端服务器如语音处理平台建立通信(例如通过智能音箱的WiFi无线网络，基于其上安装的语音应用软件与语音处理平台的交互功能建立于云端服务器的通信)，以基于语音处理平台的数据处理结果，在智能音箱上进行响应，这样就能更好地扩展智能音箱的功能，以更好地满足用户在驾驶过程中的语音交互需求。更优地，智能音箱还可以根据接收到的配网信息分别与移动终端和特定的云端服务平台建立通信，这样就可以根据云端服务平台和移动终端的功能可定制性更好地扩展智能音箱的功能。

步骤S103：向语音媒介发出用户语音指令，并根据语音媒介对用户语音指令的处理，通过语音媒介或显示媒介输出对用户语音指令的响应结果。

在配置好语音媒介，且对其进行了配网处理后，就可以通过语音媒介来监听用户发出的语音指令，以对语音指令进行响应处理。其中，对监听到的语音指令进行响应是基于语音识别处理结果和功能定制情况来响应的。由于语音媒介能够通过配网处理连接至指定的其他应用端，如云端服务平台或移动终端，因而可以基于需求进行功能定制。示例性地，可以在语音媒介上实现语音识别处理，这样就不需要将语音媒介连接至云端语音处理平台，而可以直接在语音媒介上对接收到的语音指令进行识别处理和基于识别处理结果进行响应。其中，对于响应结果是语音的场景可以直接通过语音媒介进行响应处理，例如对于用户发出的“播放音乐”的语音指令，可以通过语音媒介的语音识别处理后，直接在语音媒介上进行音乐播放的响应处理；而对于需要通过显示媒介来进行响应的结果，例如对于响应结果是进行地图显示的场景则可以有语音媒介向显示媒介(本实施例中为移动终端)发送相应的控制指令，以控制显示媒介进行相应响应，例如对于用户发出的“开启导航”的语音指令，可以通过语音媒介的语音识别处理后，通过语音媒介向移动终端发送开启导航的控制指令，来在移动终端上展示导航界面，这时移动终端作为显示媒介能够方便地向用户展示导航情况。

作为其他实现例，也可以仅在语音媒介上进行强交互的语音处理，例如仅仅设置语音唤醒功能，而不进行复杂的语音识别处理，而是通过配网将语音媒介连接至云端语音处理服务平台，由云端语音处理服务平台进行语音识别处理后，将对应的响应指令发送给语音媒介或显示媒介，以通过语音媒介或显示媒介进行适配的响应。示例性地，对于“下一曲”这样的强交互场景，可以通过在语音媒介上设置唤醒词来实现语音交互，而对于“我饿了”这样复杂的交互，则通过发送语音指令到云端语音处理服务平台来进行语音识别和语义解析，从而得到相应的处理指令反馈给语音媒介。这样，能够有利于语音媒介的功能扩展和定制化，且避免对语音媒介数据处理能力要求过高。

示例性地，在进行导航交互的场景下，可以通过在移动终端安装现有的导航软件来实现导航处理，语音媒介仅仅通过语音交互功能向移动终端的相应接口发送对导航软件的处理需求指令即可。具体交互过程例如为：用户在唤醒语音媒介的智能语音应用软件即智能语音模块后，语音输入“导航到大梅沙”的指令，语音媒介通过麦克风采集该音频数据经过其智能语音模块进行语音处理后(包括语音识别和语义解析处理，可参照现有技术，为智能语音软件的现有功能)，会得到用户意图，用户意图包括操作和对象，即操作为导航，对象为大梅沙的目的地，将用户意图基于MQTT协议发送到移动终端。移动终端接收到用户意图后基于MQTT协议进行解析，得到导航信息，之后调用导航软件如高德地图的sdk查询poi(point of interest，兴趣点)并返回给语音媒介端，同时会在移动终端显示该导航界面和poi列表，语音媒介通过语音播报接收到的poi供用户选择，语音媒介在获取到用户选择语音指令后，将选择的导航终点发送到移动终端，移动终端调用高德地图sdk进行导航，并实时将导航信息发送到语音媒介进行语音播报实现语音导航，同时在移动终端会显示导航地图界面，实现有屏语音导航。

示例性地，在进行音乐播放的场景下，可以通过云端语音处理服务平台进行音乐搜索等复杂功能，仅仅在语音媒介进行播放功能等。

示例性地，还可以通过语音媒介和移动终端的语音交互方案，实现通过向语音媒介发送语音指令来控制移动终端进行发微信、打电话等交互处理，其中，发微信功能可以基于android平台的无障碍服务权限和虚拟点击功能实现。

其中，作为一种优选实现例，上述智能音箱与移动终端可以实现为采用MQTT协议进行通信(在其他实现例中也可以选用其他iot通信协议)，以订阅定制化功能，其具体实现可参照MQTT通信的相关现有技术。

作为一种优选实现例，在通过移动终端输入配网信息时，还同时输入语音媒介所在的车机的车身码(即车辆VIN码)，并将车身码与配网信息一起传输至语音媒介。在其他实现例中，也可以通过无线通信利用MQTT协议从移动终端获取语音媒介所在车机的车机码。这样，语音媒介就可以根据具体的设定或用户的语音请求，通过配网信息连接车厂数据服务平台，并通过车身码请求数据，从而获取与车身码对应的车厂数据，并通过语音媒介或显示媒介来输出获取到的与车身码对应的车厂数据信息。具体的车厂数据信息例如可以是车辆的剩余电量、GPS位置信息、车门车灯、车窗关闭情况、行驶里程等，同时还可以通过将语音媒介连接至车机电路，实现通过智能语音模块的语音处理结果，来发送操作指令至车机中控以控制车门、车窗和车灯的开关。

图3示意性地显示了一种实施方式的实现驾驶过程中的智能语音交互的系统的框架结构，如图3所示其包括

能够接收用户语音指令的语音媒介1，该语音媒介需要具有拾音功能，通过将其配置于车内，即可通过该语音媒介进行用户语音的采集，具体地，其可以是具有语音交互功能的智能音箱；和

能够与语音媒介1通信的显示媒介2，在具体使用时，将该显示媒介2放置在车内，并将其配置成能够接收语音媒介的相应操作指令，即可基于语音媒介1接收到的用户语音指令，利用语音媒介自身或显示媒介来进行语音响应。

示例性地，显示媒介2实现为智能手机，这样就可以通过智能手机的麦克风和手机屏来作为响应的媒介。此时，可以通过显示媒介2对语音媒介1进行配网处理，从而使得语音媒介1能够方便地连接到指定网络，以进行语音处理。具体地，在语音媒介为智能音箱、显示媒介为智能手机的实现例中，智能音箱和智能手机均包括蓝牙模块，这样就可以首先将智能手机与智能音箱通过蓝牙进行连接。此外，还在显示媒介2上配置有配网模块21，用于获取配网信息通过蓝牙模块输出至语音媒介1。这样，语音媒介1就可以通过配网信息建立与显示媒介2的通信连接，以通过显示媒介进行语音响应。其中，进行配网处理的具体实现方法可以参照前文方法部分的叙述，在此不再赘述。

优选地，语音媒介可以是通过进行了抗噪性处理的麦克风进行拾音。

优选地，语音媒介可以包括设计有反接保护电路的电源接口，以通过该电源接口接入车机电路。

作为一种优选实现例，配网模块在获取配网信息输出给语音媒介1时，还可以同时获取车身码输出至语音媒介1。这样，语音媒介1还可以根据用户语音指令和车身码输出包括车厂数据信息的语音响应结果。其具体实现，可以参照前文方法部分的叙述，在此不再赘述。

图4示意性地显示了本发明另一种实现方式的实现驾驶过程中的智能语音交互的系统的框架结构，如图4所示，在图3所示的实施例的基础上，本实施例的系统还包括用于进行语音识别处理的云端服务器3，语音媒介1还通过配网信息与云端服务器3建立双向通信。这样，语音媒介1还可以根据需求配置成将接收到的用户语音指令输出至云端服务器3进行语音识别处理，并根据云端服务器3的处理结果，通过语音媒介1自身或通过显示媒介2进行语音响应。在该实现例中，显示媒介可以是配置了配网模块21的智能手机，语音媒介2可以是智能音箱。其中，具体在语音媒介、云端服务器和显示媒介上设置的功能，可以参照前文方法部分的叙述。

这样，通过上述的方法和系统，用户就可以通过在车内配置智能音箱来实现让传统或低配的车机具有智能语音交互功能，进而就可以根据需求来定制语音服务，实现驾驶过程中的智能语音交互，以更好地为用户进行服务。

在具体实现例中，选用的语音媒介只要具备集成了蓝牙和无线通信模块(如WiFi)、智能语音软件(即智能语音模块)、麦克风和音频播放的软硬件条件即可，可以不局限为上述实施例的智能音箱。

上述本发明实施例的实现驾驶过程中的智能语音交互的系统可用于执行本发明实施例的实现驾驶过程中的智能语音交互的方法，并相应的达到上述本发明实施例的实现驾驶过程中的智能语音交互的方法所达到的技术效果，这里不再赘述。本发明实施例中可以通过硬件处理器(hardware processor)来实现相关功能模块。

以上所描述的装置实施例仅仅是示意性的，其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到各实施方式可借助软件加通用硬件平台的方式来实现，当然也可以通过硬件。基于这样的理解，上述技术方案本质上或者说对相关技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品可以存储在计算机可读存储介质中，如ROM/RAM、磁碟、光盘等，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。

最后应说明的是：以上实施例仅用以说明本申请的技术方案，而非对其限制；尽管参照前述实施例对本申请进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。

Claims

1.实现驾驶过程中的智能语音交互的方法，其特征在于，包括

在车内配置用于捕获用户语音指令的语音媒介，所述语音媒介为对麦克风进行了抗噪性处理且包括有用于进行语音处理的智能语音模块的智能音箱，对于需要外部电源供电的智能音箱，在车内配置智能音箱具体是将智能音箱接入车机电路以通过车机为智能音箱的电源供电，对于具有独立供电电源的智能音箱，在车内配置智能音箱具体是将智能音箱放置在车内合适的位置；

对所述语音媒介进行配网处理，以将语音媒介连接至相应的显示媒介，所述显示媒介为带有显示屏的移动终端；

向所述语音媒介发出用户语音指令，并根据所述语音媒介对用户语音指令的处理，通过所述语音媒介或显示媒介输出对用户语音指令的响应结果；

其中，所述用户语音指令包括用于导航的语音指令，所述根据所述语音媒介对用户语音指令的处理，通过所述语音媒介或显示媒介输出对用户语音指令的响应结果，包括：

通过语音媒介对用户语音指令的语音处理获取对应的用户意图；

通过语音媒介基于MQTT协议将所述用户意图发送至所述显示媒介，并通过语音媒介接收所述显示媒介返回的POI信息进行语音播报，和在所述显示媒介上显示导航界面和POI信息列表；

通过语音媒介获取用户对POI信息的语音播报的用户选择语音指令，并通过语音媒介根据用户选择语音指令将用户选择的导航终点发送到所述显示媒介进行显示导航地图界面的导航；以及

通过语音媒介实时接收所述显示媒介发送的导航信息进行语音播报。

2.根据权利要求1所述的方法，其特征在于，所述用户语音指令包括用于控制显示媒介进行发微信交互处理的语音指令和用于控制显示媒介进行打电话交互处理的语音指令，所述语音媒介是基于android平台的无障碍服务权限和虚拟点击功能实现对所述显示媒介的控制。

3. 根据权利要求2所述的方法，其特征在于，所述智能音箱的电源还配置有防反接保护电路。

4.根据权利要求2或3所述的方法，其特征在于，所述智能音箱还包括蓝牙模块，对所述语音媒介进行配网处理包括

在移动终端建立所述智能音箱与所述移动终端的蓝牙连接；

通过所述移动终端输入用于建立智能音箱与移动终端的网络连接的配网信息，并将所述配网信息通过所述蓝牙连接传输至所述智能音箱。

5.根据权利要求4所述的方法，其特征在于，在通过所述移动终端输入所述配网信息时，还同时输入语音媒介所在的车机的车身码，并将所述车身码与配网信息一起传输至所述语音媒介；

所述语音媒介输出的对用户语音指令的响应结果还包括与所述车身码对应的车厂数据信息。

6. 根据权利要求4所述的方法，其中，所述智能音箱还包括WiFi无线通信模块，所述输入的配网信息为WiFi热点信息。

7. 实现驾驶过程中的智能语音交互的系统，其特征在于，包括

配置于车内的用于接收用户语音指令的语音媒介，其中，所述语音媒介为对麦克风进行了抗噪性处理且包括有用于进行语音处理的智能语音模块的智能音箱，对于需要外部电源供电的智能音箱，在车内配置智能音箱具体是将智能音箱接入车机电路以通过车机为智能音箱的电源供电，对于具有独立供电电源的智能音箱，在车内配置智能音箱具体是将智能音箱放置在车内合适的位置；和

放置于车内的能够与所述语音媒介通信的显示媒介；其中，

所述语音媒介根据接收到的用户语音指令，通过语音媒介自身或通过所述显示媒介进行交互响应，在所述用户语音指令为用于导航的语音指令时，其实现为包括：

8.根据权利要求7所述的系统，其特征在于，所述语音媒介和所述显示媒介均包括蓝牙模块，且所述显示媒介还包括

配网模块，用于获取配网信息通过所述蓝牙模块输出至所述语音媒介；

所述语音媒介还用于通过所述配网信息建立与所述显示媒介的通信连接，以通过所述显示媒介进行交互响应。

9.根据权利要求8所述的系统，其特征在于，所述配网模块还用于获取车身码输出至所述语音媒介；

所述语音媒介还用于根据用户语音指令和所述车身码输出包括车厂数据信息的语音响应结果。

10.根据权利要求8所述的系统，其特征在于，所述系统还包括用于进行语音识别处理的云端服务器，所述语音媒介还通过所述配网信息与所述云端服务器建立双向通信；其中，

所述语音媒介还用于将接收到的用户语音指令输出至所述云端服务器进行语音识别处理，并根据所述云端服务器的处理结果，通过语音媒介自身或通过所述显示媒介进行交互响应。

11.根据权利要求7所述的系统，其特征在于，在所述用户语音指令为用于控制显示媒介进行发微信交互处理的语音指令或用于控制显示媒介进行打电话交互处理的语音指令时，所述语音媒介基于android平台的无障碍服务权限和虚拟点击功能实现对所述显示媒介的控制。