CN111768774A

CN111768774A - 一种语音导航方法、装置及存储设备

Info

Publication number: CN111768774A
Application number: CN202010534997.4A
Authority: CN
Inventors: 徐长军; 徐茂森; 占必强
Original assignee: AI Speech Ltd
Current assignee: AI Speech Ltd
Priority date: 2020-06-12
Filing date: 2020-06-12
Publication date: 2020-10-13

Abstract

本发明公开了一种语音导航方法、装置及计算机存储设备，首先接收由语音设备接收的语音信息；解析所述语音信息，获得至少包括导航意图的导航信息；转发所述导航信息至终端设备，以指示所述终端设备根据所述导航信息进行一次导航搜索，得到一次导航搜索结果。

Description

一种语音导航方法、装置及存储设备

技术领域

本发明涉及语音处理技术，尤其涉及一种语音导航方法、装置及计算机存储设备。

背景技术

随着人工智能在交通运输领域的不断发展和深化，其在性能和设备兼容性上也有了长足的发展。然而，导航仍然是车载场景下的最大刚需。

目前，局限于智能语音设备的性能，故无法单独靠其本身来满足用户的导航需求。具体来讲主要受限于如下几个方面：1)开发成本较大，一般智能设备为嵌入式开发，集成现有成熟导航软件和解决方案比较困难，且一般周期较长；2)性能较差，当前车载行业上，为了降低整车的制造成本，对于芯片的选取和周边配料的采购都以成本优先，所以满足主要的智能化功能后，无足够性能和运算支持导航等其他功能；3)无屏幕或者屏幕较差，行业内对于低端的车辆为了拉开代际差，可能不配备显示屏，或者使用断码屏等老旧的技术类型屏幕，并不能支撑好导航上的地图信息和诱导信息的展示。

发明内容

本发明实施例为了有效克服现有的智能语音设备无法满足用户的导航需求所存在的种种问题，创造性地提供一种语音导航方法、装置及计算机存储设备。

根据本发明实施例第一方面，提供一种语音导航方法，应用于云平台，该方法包括：接收由语音设备接收的语音信息；解析所述语音信息，获得至少包括导航意图的导航信息；转发所述导航信息至终端设备，以指示所述终端设备根据所述导航信息进行一次导航搜索，得到一次导航搜索结果。

根据本发明一实施方式，所述方法还包括：接收来自所述终端设备的一次导航搜索结果；反馈所述一次导航搜索结果给所述语音设备，以由所述语音设备对所述一次导航搜索结果进行语音播报。

根据本发明一实施方式，所述方法还包括：接收由所述语音设备接收的针对所述一次导航搜索结果的语音选择结果；转发所述语音选择结果，以指示根据所述语音选择结果进行二次导航搜索，得到二次导航搜索结果。

根据本发明一实施方式，所述转发所述导航信息至终端设备，包括：通过互联网网络接口传输所述导航信息至终端设备。

根据本发明一实施方式，所述方法还包括：由所述终端设备显示所述一次导航搜索结果或二次导航搜索结果。

根据本发明一实施方式，所述显示所述一次导航搜索结果或二次导航搜索结果，包括：通过列表方式或地图上展示的方式显示所述一次导航搜索结果或二次导航搜索结果。

根据本发明第二方面，还提供了一种语音导航装置，应用于云平台，所述装置包括：接收模块，用于接收由语音设备接收的语音信息；解决模块，用于解析所述语音信息，获得至少包括导航意图的导航信息；转发模块，用于转发所述导航信息至终端设备，以指示所述终端设备根据所述导航信息进行一次导航搜索，得到一次导航搜索结果。

根据本发明一实施方式，所述接收模块，还用于接收来自所述终端设备的一次导航搜索结果；反馈模块，用于反馈所述一次导航搜索结果给所述语音设备，以由所述语音设备对所述一次导航搜索结果进行语音播报。

根据本发明一实施方式，所述接收模块，还用于接收由所述语音设备接收的针对所述一次导航搜索结果的语音选择结果；所述转发模块，还用于转发所述语音选择结果，以指示根据所述语音选择结果进行二次导航搜索，得到二次导航搜索结果。

根据本发明一实施方式，所述转发模块，具体用于通过互联网网络接口传输所述导航信息至终端设备。

根据本发明实施例第三方面，又提供一种计算机存储设备，所述存储设备包括一组计算机可执行指令，当所述指令被执行时用于执行上述任一项所述的语音导航方法。

本发明实施例语音导航方法、装置及计算机存储设备，首先接收由语音设备接收的语音信息；解析所述语音信息，获得至少包括导航意图的导航信息；转发所述导航信息至终端设备，以指示所述终端设备根据所述导航信息进行一次导航搜索，得到一次导航搜索结果。如此，本发明基于语音全链路及云服务的优势，在原来智能语音设备、云服务的系统中，引入诸如手机之类的终端设备的运算和APP，利用了终端设备强大的算力支撑进行跨设备导航的实现，满足了用户在性能差的智能语音设备下的导航需求。

附图说明

通过参考附图阅读下文的详细描述，本发明示例性实施方式的上述以及其他目的、特征和优点将变得易于理解。在附图中，以示例性而非限制性的方式示出了本发明的若干实施方式，其中：

在附图中，相同或对应的标号表示相同或对应的部分。

图1示出了本发明实施例语音导航方法的实现流程示意图一；

图2示出了本发明一应用实例语音导航方法的实现流程示意图；

图3示出了本发明实施例语音导航方法的实现流程示意图二；

图4示出了本发明实施例语音导航方法的实现流程示意图三；

图5示出了本发明实施例语音导航装置的组成结构示意图。

具体实施方式

为使本发明的目的、特征、优点能够更加的明显和易懂，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而非全部实施例。基于本发明中的实施例，本领域技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

在本说明书的描述中，参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。而且，描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外，在不相互矛盾的情况下，本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。

此外，术语“第一”、“第二”仅用于描述目的，而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此，限定有“第一”、“第二”的特征可以明示或隐含地包括至少一个该特征。在本发明的描述中，“多个”的含义是两个或两个以上，除非另有明确具体的限定。

图1示出了本发明实施例语音导航方法的实现流程示意图一；图2示出了本发明一应用实例语音导航方法的实现流程示意图。

参考图1，本发明实施例语音导航方法包括：操作101，接收由语音设备接收的语音信息；操作102，解析所述语音信息，获得至少包括导航意图的导航信息；操作103，转发所述导航信息至终端设备，以指示所述终端设备根据所述导航信息进行一次导航搜索，得到一次导航搜索结果。

本申请实施例中，语音设备和云平台之间主要执行语音链路处理DUI，所述DUI具备信号处理、语音识别、NLP、对话管理、TTS等语音交互技术。

在操作101～102，以语音设备为音箱为例，参考图2，云端服务DUI全链路主要将用户的自然语言处理成程序理解的可执行的语言，从而理解用户关于导航相关的意图，并通过webHook服务将信息发送到APP端执行。其中，主要处理包括如下几种情况：a)带有目的地的导航意图，如“我要去世界之窗”解析出导航意图及目的地世界之窗；b)不带目的地的导航意图，如“帮我导航”解析出导航意图；c)在地图上当前定位周边搜索，如“搜一下周边的洗车店”解析出导航意图，周边搜索行为，洗车店类别；d)在导航功能流程中的信息点POI列表选择，如第1/2/3个，最上面那个，最下面那个；e)在导航功能流程中的POI列表翻页操作，上一页，下一页，第1/2/3页。

在操作103，参考图2，当云平台，即云端服务层通过解析识别到至少包括导航意图的导航信息后，在智能语音对话系统云端服务流程内，将导航信息转发至以手机APP为例的终端设备。在转发至终端设备之后，即可通过终端设备，如手机APP来根据所述导航信息进行一次导航搜索，得到一次导航搜索结果。

具体地，云平台通过互联网网络接口按照MQTT协议(该协议为开源协议)传输所述导航信息至终端设备。举例来说，采用return方式，保证手机APP至少成功收到1次，以保证数据的有效性。

本领域技术人员应该理解的是，在云平台通过互联网网络接口传输导航信息至终端设备时，可以按照包括MQTT在内的任意传输协议进行导航信息的传输。

进一步地，手机APP利用集成的高德SDK，进行导航POI搜索和周边信息的搜索，如世界之窗的目的地或者周边的洗车店中的“洗车店”类型。

本发明实施例语音导航方法，首先接收由语音设备接收的语音信息；解析所述语音信息，获得至少包括导航意图的导航信息；转发所述导航信息至终端设备，以指示所述终端设备根据所述导航信息进行一次导航搜索，得到一次导航搜索结果。如此，本发明基于语音全链路及云服务的优势，在原来智能语音设备、云服务的系统中，引入诸如手机之类的终端设备的运算和APP，利用了终端设备强大的算力支撑进行跨设备导航的实现，满足了用户在性能差的智能语音设备下的导航需求。

图3示出了本发明实施例语音导航方法的实现流程示意图二。

参考图3，本发明实施例语音导航方法，应用于云平台，包括：操作301，接收由语音设备接收的语音信息；操作302，解析所述语音信息，获得至少包括导航意图的导航信息；操作303，转发所述导航信息至终端设备，以指示所述终端设备根据所述导航信息进行一次导航搜索，得到一次导航搜索结果；操作304，由所述终端设备显示所述一次导航搜索结果。

在操作301～302，以语音设备为音箱为例，参考图2，云端服务DUI全链路主要将用户的自然语言处理成程序理解的可执行的语言，从而理解用户关于导航相关的意图，并通过webHook服务将信息发送到APP端执行。其中，主要处理包括如下几种情况：a)带有目的地的导航意图，如“我要去世界之窗”解析出导航意图及目的地世界之窗；b)不带目的地的导航意图，如“帮我导航”解析出导航意图；c)在地图上当前定位周边搜索，如“搜一下周边的洗车店”解析出导航意图，周边搜索行为，洗车店类别；d)在导航功能流程中的信息点POI列表选择，如第1/2/3个，最上面那个，最下面那个；e)在导航功能流程中的POI列表翻页操作，上一页，下一页，第1/2/3页。

在操作303，参考图2，当云平台，即云端服务层通过解析识别到至少包括导航意图的导航信息后，在智能语音对话系统云端服务流程内，将导航信息转发至以手机APP为例的终端设备。在转发至终端设备之后，即可通过终端设备，如手机APP来根据所述导航信息进行一次导航搜索，得到一次导航搜索结果。

具体地，云平台通过互联网网络接口按照MQTT协议(该协议为开源协议)传输所述导航信息至终端设备。举例来说，采用return方式，保证手机APP至少成功收到1次，以保证数据的有效性。进一步地，手机APP利用集成的高德SDK，进行导航POI搜索和周边信息的搜索，如世界之窗的目的地或者周边的洗车店中的“洗车店”类型。

在操作304，具体地，手机APP主要完成导航搜索、结果展示，用户交互以及执行导航，如对搜索的结果进行列表显示及地图上展示；列表可与用户进行交互，支持语音选择和语音翻页。

本发明实施例语音导航方法，首先接收由语音设备接收的语音信息；解析所述语音信息，获得至少包括导航意图的导航信息；转发所述导航信息至终端设备，以指示所述终端设备根据所述导航信息进行一次导航搜索，得到一次导航搜索结果；进一步地，由终端设备显示所述一次导航搜索结果。如此，本发明基于语音全链路及云服务的优势，在原来智能语音设备、云服务的系统中，引入诸如手机之类的终端设备的运算和APP，“虚拟”出了手机屏幕为智能语音设备的屏幕，利用了终端设备强大的算力支撑进行跨设备导航的实现，满足了用户在性能差及无屏幕智能语音设备下的导航需求。

图4示出了本发明实施例语音导航方法的实现流程示意图三。

参考图4，本发明实施例语音导航方法，应用于云平台，包括：操作401，接收由语音设备接收的语音信息；操作402，解析所述语音信息，获得至少包括导航意图的导航信息；操作403，转发所述导航信息至终端设备，以指示所述终端设备根据所述导航信息进行一次导航搜索，得到一次导航搜索结果；操作404，接收来自所述终端设备的一次导航搜索结果；操作405，反馈所述一次导航搜索结果给所述语音设备，以由所述语音设备对所述一次导航搜索结果进行语音播报。

在操作401～402，以语音设备为音箱为例，参考图2，云端服务DUI全链路主要将用户的自然语言处理成程序理解的可执行的语言，从而理解用户关于导航相关的意图，并通过webHook服务将信息发送到APP端执行。其中，主要处理包括如下几种情况：a)带有目的地的导航意图，如“我要去世界之窗”解析出导航意图及目的地世界之窗；b)不带目的地的导航意图，如“帮我导航”解析出导航意图；c)在地图上当前定位周边搜索，如“搜一下周边的洗车店”解析出导航意图，周边搜索行为，洗车店类别；d)在导航功能流程中的信息点POI列表选择，如第1/2/3个，最上面那个，最下面那个；e)在导航功能流程中的POI列表翻页操作，上一页，下一页，第1/2/3页。

在操作403，参考图2，当云平台，即云端服务层通过解析识别到至少包括导航意图的导航信息后，在智能语音对话系统云端服务流程内，将导航信息转发至以手机APP为例的终端设备。在转发至终端设备之后，即可通过终端设备，如手机APP来根据所述导航信息进行一次导航搜索，得到一次导航搜索结果。

在操作404～405，如图2所示，云端服务等待手机APP端的一次导航搜索结果，并将一次导航搜索结果反馈给语音设备如音箱，以由语音设备通过TTS这一语音合成技术对该一次导航搜索结果加以语音播报，从而用拟人化的音色向用户传达导航搜索结果。

具体地，如图2所示，语音设备如音箱可以根据用户对一次导航搜索结果的语音选择命令，向DUI云平台上传语音选择结果，以由DUI云平台转发语音选择结果至终端设备，如手机APP，以指示终端设备根据所述语音选择结果进行二次导航搜索，得到二次导航搜索结果。

本发明实施例语音导航方法，首先接收由语音设备接收的语音信息；解析所述语音信息，获得至少包括导航意图的导航信息；转发所述导航信息至终端设备，以指示所述终端设备根据所述导航信息进行一次导航搜索，得到一次导航搜索结果；进一步地，接收来自所述终端设备的一次导航搜索结果；反馈所述一次导航搜索结果给所述语音设备，以由所述语音设备对所述一次导航搜索结果进行语音播报。如此，通过语音设备的智能语音系统来协同云平台及终端设备之间交互执行一轮又一轮的交互处理，如开启下一轮会话或者结束当前会话。

同样，基于如上文所述语音导航方法，本发明实施例又提供一种计算机可读存储介质，所述计算机可读存储介质存储有程序，当所述程序被处理器执行时，使得所述处理器至少执行如下所述的操作步骤：操作101，接收由语音设备接收的语音信息；操作102，解析所述语音信息，获得至少包括导航意图的导航信息；操作103，转发所述导航信息至终端设备，以指示所述终端设备根据所述导航信息进行一次导航搜索，得到一次导航搜索结果。

进一步地，基于如上文所述语音导航方法，本发明还提供一种语音导航装置，应用于云平台，如图5所示，该装置50包括：接收模块501，用于接收由语音设备接收的语音信息；解决模块502，用于解析所述语音信息，获得至少包括导航意图的导航信息；转发模块503，用于转发所述导航信息至终端设备，以指示所述终端设备根据所述导航信息进行一次导航搜索，得到一次导航搜索结果。

根据本发明一实施方式，转发模块503，具体用于通过互联网网络接口按照MQTT协议传输所述导航信息至终端设备。

以语音设备为音箱为例，参考图2，云端服务DUI全链路主要将用户的自然语言处理成程序理解的可执行的语言，从而理解用户关于导航相关的意图，并通过webHook服务将信息发送到APP端执行。其中，解析模块502主要处理包括如下几种情况：a)带有目的地的导航意图，如“我要去世界之窗”解析出导航意图及目的地世界之窗；b)不带目的地的导航意图，如“帮我导航”解析出导航意图；c)在地图上当前定位周边搜索，如“搜一下周边的洗车店”解析出导航意图，周边搜索行为，洗车店类别；d)在导航功能流程中的信息点POI列表选择，如第1/2/3个，最上面那个，最下面那个；e)在导航功能流程中的POI列表翻页操作，上一页，下一页，第1/2/3页。

当云平台，即云端服务层的解析模块503通过解析识别到至少包括导航意图的导航信息后，在智能语音对话系统云端服务流程内，将导航信息转发至以手机APP为例的终端设备。在转发至终端设备之后，即可通过终端设备，如手机APP来根据所述导航信息进行一次导航搜索，得到一次导航搜索结果。

具体地，云平台的转发模块503通过互联网网络接口按照MQTT协议(该协议为开源协议)传输所述导航信息至终端设备。举例来说，采用return方式，保证手机APP至少成功收到1次，以保证数据的有效性。进一步地，手机APP利用集成的高德SDK，进行导航POI搜索和周边信息的搜索，如世界之窗的目的地或者周边的洗车店中的“洗车店”类型。

根据本发明一实施方式，如图5所示，装置50还包括：接收模块501，还用于接收来自所述终端设备的一次导航搜索结果；反馈模块504，用于反馈所述一次导航搜索结果给所述语音设备，以由所述语音设备对所述一次导航搜索结果进行语音播报。

如图2所示，云端服务的接收模块501等待手机APP端的一次导航搜索结果，并由反馈模块504将一次导航搜索结果反馈给语音设备如音箱，以由语音设备通过TTS这一语音合成技术对该一次导航搜索结果加以语音播报，从而用拟人化的音色向用户传达导航搜索结果。

根据本发明一实施方式，接收模块501，还用于接收由所述语音设备接收的针对所述一次导航搜索结果的语音选择结果；转发模块503，还用于转发所述语音选择结果，以指示根据所述语音选择结果进行二次导航搜索，得到二次导航搜索结果。

具体地，如图2所示，语音设备如音箱可以根据用户对一次导航搜索结果的语音选择命令，向DUI云平台上传语音选择结果，以由DUI云平台的转发模块503转发语音选择结果至终端设备，如手机APP，以指示终端设备根据所述语音选择结果进行二次导航搜索，得到二次导航搜索结果。如此，通过语音设备的智能语音系统来协同云平台及终端设备之间交互执行一轮又一轮的交互处理，如开启下一轮会话或者结束当前会话。

本发明基于语音全链路及云服务的优势，在原来智能语音设备、云服务的系统中，引入诸如手机之类的终端设备的运算和APP，“虚拟”出了手机屏幕为智能语音设备的屏幕，利用了终端设备强大的算力支撑进行跨设备导航的实现，满足了用户在性能差及无屏幕智能语音设备下的导航需求。

这里需要指出的是：对于本发明语音导航装置实施例中未披露的技术细节，请参照本发明前述图1至4所示的方法实施例的描述而理解，为节约篇幅，因此不再赘述。

需要说明的是，在本文中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。

在本申请所提供的几个实施例中，应该理解到，所揭露的设备和方法，可以通过其它的方式实现。以上所描述的设备实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，如：多个单元或组件可以结合，或可以集成到另一个装置，或一些特征可以忽略，或不执行。另外，所显示或讨论的各组成部分相互之间的耦合、或直接耦合、或通信连接可以是通过一些接口，设备或单元的间接耦合或通信连接，可以是电性的、机械的或其它形式的。

上述作为分离部件说明的单元可以是、或也可以不是物理上分开的，作为单元显示的部件可以是、或也可以不是物理单元；既可以位于一个地方，也可以分布到多个网络单元上；可以根据实际的需要选择其中的部分或全部单元来实现本实施例方案的目的。

另外，在本发明各实施例中的各功能单元可以全部集成在一个处理单元中，也可以是各单元分别单独作为一个单元，也可以两个或两个以上单元集成在一个单元中；上述集成的单元既可以利用硬件的形式实现，也可以利用硬件加软件功能单元的形式实现。

本领域普通技术人员可以理解：实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成，前述的程序可以存储于计算机可读取存储介质中，该程序在执行时，执行包括上述方法实施例的步骤；而前述的存储介质包括：移动存储设备、只读存储器(Read OnlyMemory，ROM)、磁碟或者光盘等各种可以存储程序代码的介质。

或者，本发明上述集成的单元如果以软件功能模块的形式实现并作为独立的产品销售或使用时，也可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明实施例的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机、服务器、或者网络设备等)执行本发明各个实施例所述方法的全部或部分。而前述的存储介质包括：移动存储设备、ROM、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述，仅为本发明的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应以权利要求的保护范围为准。

Claims

1.一种语音导航方法，其特征在于，应用于云平台，所述方法包括：

接收由语音设备接收的语音信息；

解析所述语音信息，获得至少包括导航意图的导航信息；

转发所述导航信息至终端设备，以指示所述终端设备根据所述导航信息进行一次导航搜索，得到一次导航搜索结果。

2.根据权利要求1所述的方法，其特征在于，所述方法还包括：

接收来自所述终端设备的一次导航搜索结果；

反馈所述一次导航搜索结果给所述语音设备，以由所述语音设备对所述一次导航搜索结果进行语音播报。

3.根据权利要求1所述的方法，其特征在于，所述方法还包括：

接收由所述语音设备接收的针对所述一次导航搜索结果的语音选择结果；

转发所述语音选择结果，以指示根据所述语音选择结果进行二次导航搜索，得到二次导航搜索结果。

4.根据权利要求1所述的方法，其特征在于，所述转发所述导航信息至终端设备，包括：

通过互联网网络接口传输所述导航信息至终端设备。

5.根据权利要求1至4任一项所述的方法，其特征在于，所述方法还包括：

由所述终端设备显示所述一次导航搜索结果或二次导航搜索结果。

6.根据权利要求5所述的方法，其特征在于，所述显示所述一次导航搜索结果或二次导航搜索结果，包括：

通过列表方式或地图上展示的方式显示所述一次导航搜索结果或二次导航搜索结果。

7.一种语音导航装置，其特征在于，应用于云平台，所述装置包括：

接收模块，用于接收由语音设备接收的语音信息；

解决模块，用于解析所述语音信息，获得至少包括导航意图的导航信息；

转发模块，用于转发所述导航信息至终端设备，以指示所述终端设备根据所述导航信息进行一次导航搜索，得到一次导航搜索结果。

8.根据权利要求7所述的装置，其特征在于，所述装置还包括：

所述接收模块，还用于接收来自所述终端设备的一次导航搜索结果；

反馈模块，用于反馈所述一次导航搜索结果给所述语音设备，以由所述语音设备对所述一次导航搜索结果进行语音播报。

9.根据权利要求7所述的装置，其特征在于，

所述接收模块，还用于接收由所述语音设备接收的针对所述一次导航搜索结果的语音选择结果；

所述转发模块，还用于转发所述语音选择结果，以指示根据所述语音选择结果进行二次导航搜索，得到二次导航搜索结果。

10.一种计算机存储介质，其特征在于，所述存储介质包括一组计算机可执行指令，当所述指令被执行时用于执行权利要求1至6任一项所述的语音导航方法。