CN102254557B

CN102254557B - 基于自然语音识别的导航方法和系统

Info

Publication number: CN102254557B
Application number: CN2011101855376A
Authority: CN
Inventors: 沈嘉鑫; 王力劭; 许军; 庞泽耀; 王力勃
Original assignee: SHENZHEN VCYBER TECHNOLOGY Co Ltd
Current assignee: Chengdu Cheyin Intelligent Technology Co ltd
Priority date: 2011-07-04
Filing date: 2011-07-04
Publication date: 2013-07-24
Anticipated expiration: 2031-07-04
Also published as: CN102254557A

Abstract

本发明公开一种基于自然语音识别的导航方法和系统，涉及通信领域。只需按动一键，便可以通过终端设备连接到网络侧的云计算平台服务器，通过云计算平台服务器进行语音导航。其中，云计算平台服务器采用非特定人语音识别技术以及自然语音识别技术对用户输入的导航位置语音信息进行语音识别，获取用户进行导航的目的地址，并将该导航目的地址通过自动导航控制信息发送给终端设备，以使得终端设备根据该自动导航控制信息自动启动导航功能，从导航服务器获取导航目的地址的导航结果，并将该结果显示给用户。本发明实施例提供的技术方案可以应用在语音导航系统中。

Description

基于自然语音识别的导航方法和系统

技术领域

本发明涉及通信领域，尤其涉及一种基于自然语音识别的导航方法和系统。

背景技术

在现有技术中，用户一般采用手动控制的方法进行导航操作，例如：用户手动点击导航设备的显示屏幕或者按键，通过显示屏幕或者按键输入导航目的地址，通过导航系统获取当前位置到导航目的地址的导航路线信息。然而，在用户驾驶车辆的过程中，手动操作需要转移视线到导航终端上，会分散用户的精力，使得用户驾驶车辆的危险性大大增强。

为解决上述技术问题，现有技术公开了一些语音导航技术，对于不同的语言，语音导航技术所采用的语音识别方法各不相同，例如：对于英文而言，句中的单词均由26个字母表中的字母构成，在进行语音导航服务时，语音导航系统需要对语句中的字母以及句子的语法结构进行识别，才能识别出语音信息对应的文本信息，从而根据该识别出的文本信息进行相关的导航服务操作。

中文与英文最大的区别在于，中文汉字数量较大，目前，汉字的总数已经超过了8万，其中常用汉字大约有3500字左右，面对如此庞大的中文汉字库，传统的中文语音导航技术采用基于关键词的语音识别方法进行语音识别。语音导航系统需要将用户发送的语音内容从头到尾按字/词的方式与词表中预先存储的文本内容进行逐一匹配，只有语音内容与词表中存储的某条文本内容完全匹配时，语音导航系统才能识别出用户发送的语音内容的含义，成功进行语音识别，并根据识别出的内容进行相关的导航服务，否则，语音识别失败，语音导航系统无法为用户提供导航服务。

然而，在实际的生活中，中文语言表述形式是多种多样的，对于同一事物每个人或者同一人在不同时期的表述各不相同，例如：导航到“天安门广场”就有如下几种表述方式：请问到天安门广场怎么走；我想去天安门广场；从这里驾车到天安门怎么走；带我去天安门广场等等。为了提高语音导航系统的语音识别成功率与准确率，语音导航系统需要尽可能地将同一事物的所有表述形式均存储到词表中，这使得词表规模非常庞大，维护不方便，并且由于词表规模庞大，使得语音导航系统进行语音识别的速度较慢，从而使得语音导航服务延迟较大，用户进行语音导航服务的服务体验较差。另外，由于人们的语言表述形式千差万别，随着时代的发展，语言表达方式也在不断更新，无法在词表中穷尽同一事物的所有表述形式，使得采用关键词方式进行语音识别的成功率较低，进而使得语音导航系统无法为用户提供正常的导航服务。

在申请号为CN00130067.9、CN03123123.3以及CN03138149.9等中国专利中公开了与语音识别相关的技术方案，然而上述技术方案只能进行语音合成或者将语音转换成文字，而无法实现对语音转换成文字信息的识别，使得以上技术方案无法应用在语音导航技术中，实现语音导航服务；并且，上述技术方案是针对英文语音识别设计的，根据以上分析可知，英文语言和中文语言从词语数量以及语法特点上大不相同，使得上述技术方案即使应用在语音导航服务中也无法对中文进行有效的识别，语音识别的成功率较低；在申请号为CN99813093.1的中国专利中，公开了一种采用语音识别和自然语言处理的交互式用户界面，虽然能够实现对语音转换成文字信息的识别，然而该技术方案也是针对英文语言设计的，在进行语音识别的过程中需要考虑语法等因素的影响，仍然无法有效地应用在中文语音导航服务中。

发明内容

为解决上述技术问题，本发明的实施例提供一种基于自然语音识别的导航方法和系统，能够提高中文语音识别速度，以及语音识别的成功率，进而提高语音导航服务的可靠性以及用户使用语音导航服务的服务体验。

一种基于自然语音识别的导航系统，包括：一键式控制装置、终端设备以及云计算平台服务器；

所述一键式控制装置，安装在车辆的固定部件上，用于在用户按下启动键以后，通过直接或短距离通信方式与所述终端设备建立连接，并通过直接或短距离通信方式驱动所述终端设备与所述云计算平台服务器建立连接；

所述终端设备，用于与所述一键式控制装置建立连接以后，通过语音电话交换网络或多种无线数据网络与所述云计算平台服务器建立连接，接收用户发送的导航位置语音信息，将所述导航位置语音信息发送给所述云计算平台服务器，接收所述云计算平台服务器返回的包含导航目的地址的自动导航控制信息，根据该自动导航控制信息启动导航功能，与导航服务器建立连接，从所述导航服务器获取所述导航目的地址的导航结果，将该导航结果显示给所述用户；

所述云计算平台服务器，位于网络侧，包括：

非特定人语音识别模块，用于对所述终端设备发送的导航位置语音信息进行识别、解析，获取该导航位置语音信息对应的拼音；

自然语音识别模块，用于采用预先设置的词典对所述非特定人语音识别模块获取的拼音进行分词处理，获取分词后的词语拼音串，从所述词典中查找所述词语拼音串对应的待识别词语，根据所述待识别词语查找兴趣点POI数据库，获取与所述待识别词语匹配度最高的目标POI信息，其中，所述词典用于存储待进行语音识别的目标词语以及目标词语对应的拼音；

通信模块，用于获取自然语音识别模块获取的目标POI信息对应的导航目的地址，将所述导航目的地址携带在自动导航控制信息中发送给所述终端设备。

一种基于自然语音识别的导航方法，包括：在用户按下一键式控制装置的启动按键以后，所述一键式控制装置通过直接或短距离通信方式与终端设备建立连接，其中，所述一键式控制装置设置在车辆的固定部位上，直接或者通过短距离通信方式驱动所述终端设备与网络侧的云计算平台服务器建立连接；所述终端设备通过语音电话交换网络或多种无线数据网络与所述云计算平台服务器建立语音会话连接；所述终端设备接收所述用户发送的导航位置语音信息，将所述导航位置语音信息发送给所述云计算平台服务器；所述云计算平台服务器采用非特定人语音识别技术对所述导航位置语音信息进行识别、解析，获取所述导航位置语音信息对应的拼音；所述云计算平台服务器采用预先设置的词典对所述拼音进行分词处理，获取分词后的词语拼音串，其中，所述词典用于存储待进行语音识别的目标词语以及目标词语对应的拼音；所述云计算平台服务器从所述词典中查找所述词语拼音串对应的待识别词语；所述云计算平台服务器根据所述待识别词语查找POI数据库，从所述POI数据库中获取与所述待识别词语匹配度最高的目标POI信息；所述云计算平台服务器获取所述目标POI信息对应的导航目的地址，将该导航目的地址携带在自动导航控制信息中发送给所述终端设备；所述终端设备根据所述自动导航控制信息启动导航功能，与导航服务器建立连接，从所述导航服务器获取所述导航目的地址的导航结果，将该结果显示给所述用户。

本发明实施例提供的基于自然语音识别的导航方法和系统，用户按下设置在车辆方向盘上的一键式控制装置的启动键后，终端设备与云计算平台服务器建立语音会话连接，系统进行自动语音导航状态。当用户通过终端设备向云计算平台服务器发送导航位置语音信息时，云计算平台服务器可以先采用非特定人语音识别技术对导航位置语音信息进行识别解析，获取对应的拼音，然后对拼音进行分词，获取分词后的词语拼音串，并从词典中获取词语拼音串对应的待识别词语，采用待识别词语进行信息匹配，将POI数据库中与待识别词语匹配度最高的POI信息作为对导航位置语音信息识别得到的目标POI信息，云计算平台服务器不需要对用户发送的导航位置语音信息进行完全匹配即可获得目标POI信息，提高了中文语音识别的成功率，进而提高了语音导航服务的可靠性以及用户使用语音导航服务的服务体验。解决了现有技术采用对语音信息进行完全匹配方法进行语音识别，造成由于表述方式不一致而使语音识别失败，语音识别成功率低，致使语音导航服务的可靠性差，用户使用语音导航服务的服务体验不好的问题，由于本发明实施例提供的技术方案中云计算平台服务器采用词语匹配的方式进行语音识别，只需要在词典中存储目标词语和目标词语对应的拼音串，并在POI数据库中存储标准POI信息即可，不需要对同一事物按照语言表述方式存储大量不同形式的文本信息，词典和POI数据库的数据规模较小，便于进行查找，进而提高了语音导航系统的语音识别速度，解决了现有技术需要在词表中对同一事物存储大量不同表述形式的文本信息，造成词表规模庞大，不便于查找，进行语音识别的速度较慢，致使语音导航服务系统延迟较大的问题。本发明实施例提供的技术方案中云计算平台服务器采用的自然语音识别技术不同于英文语音识别技术，该自然语音识别技术针对中文语言文字量大，语句中词语连贯、无停顿的特点，采用对语句按拼音分词，并根据词语查找的方式进行语音识别，对中文语音识别的成功率以及识别速度较高。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明实施例提供的基于自然语音识别的导航系统结构示意图一；

图2为本发明实施例提供的基于自然语音识别的导航系统结构示意图二；

图3为本发明实施例提供的基于自然语音识别的导航方法流程图一；

图4为图3所示的本发明实施例提供的基于自然语音识别的导航方法步骤307的流程图一；

图5为图3所示的本发明实施例提供的基于自然语音识别的导航方法步骤307的流程图二；

图6为本发明实施例提供的基于自然语音识别的导航方法流程图二。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

为了解决中文语音导航服务系统语音识别成功率较低的问题，本发明实施例提供一种基于自然语音识别的导航方法和系统。

如图1所示，本发明实施例提供的基于自然语音识别的导航系统，包括：一键式控制装置101、终端设备102以及云计算平台服务器103；

一键式控制装置101，安装在车辆的固定部件上，用于在用户按下启动键以后，通过直接或短距离通信方式与终端设备102建立连接，并通过直接或短距离通信方式驱动终端设备102与云计算平台服务器103建立连接；

终端设备102，用于与一键式控制装置101建立连接以后，通过语音电话交换网络或多种无线数据网络与云计算平台服务器103建立连接，接收用户发送的导航位置语音信息，将导航位置语音信息发送给云计算平台服务器103，接收云计算平台服务器103返回的包含导航目的地址的自动导航控制信息，根据该自动导航控制信息启动导航功能，与导航服务器建立连接，从导航服务器获取所述导航目的地址的导航结果，将该导航结果显示给用户；

云计算平台服务器103，位于网络侧，包括：

非特定人语音识别模块1031，用于对终端设备102发送的导航位置语音信息进行识别、解析，获取该导航位置语音信息对应的拼音；

自然语音识别模块1032，用于采用预先设置的词典对非特定人语音识别模块1031获取的拼音进行分词处理，获取分词后的词语拼音串，从词典中查找词语拼音串对应的待识别词语，根据该待识别词语查找兴趣点（Point of Interest，POI）数据库，获取与待识别词语匹配度最高的目标POI信息，其中，词典用于存储待进行语音识别的目标词语以及目标词语对应的拼音；

在本实施例中，词典中存储的目标词语可以是广义范围的词语，具体地，可以从日常生活和工作能够接触到的信息中获取目标词语并形成词典，例如：可以从每天新闻报道的信息中提取词语，形成词典；词典中存储的目标词语也可以是狭义范围的词语，具体地，可以从POI数据库中存储的POI信息获取目标词语并形成词典。需要说明的是，不论是广义范围的词语还是狭义范围的词语，词典中的目标词语均是唯一的，各个目标词语之间不重复。

为了减小词典中目标词语的冗余量，节省词典的存储空间，提高语音识别的速度，本发明实施例优选地将词典中的目标词语设置为根据POI数据库设置的狭义范围词语，但不限于上述设置方式，本领域技术人员公知的是，对于该识别技术所应用的每个行业领域，所述行业的技术人员均可根据其行业特点，进行合理设置其POI数据库。

在本实施例中，自然语音识别模块1032可以根据非特定人语音识别模块1031获取的拼音查找词典，将拼音按照出现顺序与词典中包含的目标词语的拼音进行匹配，当查找到与目标词语的拼音完全匹配的词语拼音串时，将该词语拼音串从拼音中分割出来，继续循环上述查找的动作，直到结束为止，从而实现对拼音的分词处理。

需要说明的是，为了提高调用数据的速度，加快语音识别速度，优选地，在本实施例中，POI数据库以及词典均存储在云计算平台服务器103中（图1未示出）。

进一步地，在本实施例中，自然语音识别模块1032可以通过两种方式从POI数据库中获取与待识别词语匹配度最高的目标POI信息，下面对这两种方式进行分别介绍：

1、权重系数判决法

自然语音识别模块1032，具体用于如果词典还用于存储目标词语对应的权重等级n以及权重等级范围N，根据词典获取待识别词语对应的权重等级，根据待识别词语查找POI数据库，从POI信息数据库中获取与待识别词语中的任意一个或多个词语匹配的POI信息组成的POI信息集合，根据待识别词语对应的权重等级，对POI信息集合中的每条POI信息分别进行处理，获取每条POI信息的权重系数，从POI信息集合中选取权重系数最高的POI信息为目标POI信息，其中，n、N均为整数，N≥2，n∈[1，N]，第n级的目标词语在待识别词语中的重要性要比第n+1级得目标词语在待识别词语中的重要性大。当然，其重要性与权重等级n的关系也可以相反，本领域技术人员可以自己根据需要定义，本实施方式按照前者进行示例。

在本实施例中，自然语音识别模块1032可以采用加权平均算法获取每条POI信息的权重系数，当然也可以采用其他算法获取每条POI信息的权重信息，此处不作一一赘述。

需要说明的是，为了保证自然语音识别模块1032获取的目标POI信息的准确性，提高语音识别质量，在本实施例中，自然语音识别模块1032对拼音分词之后获得的待识别词语中应包含至少一个权重等级为1的词语，如果经分词处理以后，待识别词语中不存在权重等级为1的词语，则自然语音识别模块1032，还用于重新对拼音进行分词处理，以获取至少一个权重等级为1的词语。

进一步地，自然语音识别模块1032，还用于将上述获取的至少一个权重等级为1的词语以及该词语对应的拼音串添加到词典中。

需要说明的是，本发明实施例对权重等级高低的划分进行具体的举例，在实际的使用过程中还可以通过其他规则设置权重等级的高低属性，例如：当权重等级范围为3时，可以设置权重等级为3最高，权重等级为1最低，以上方法是本领域技术人员能够在不付出创造性劳动的前提下轻易联想到的，此处不再一一赘述。

2、嵌套查找法

自然语音识别模块1032，具体用于对待识别词语进行排序，按照排序的结果，从待识别词语中获取第一个词语，从POI信息数据库中获取与第一个词语匹配的POI信息，从待识别词语中获取第二个词语，从与第一个词语匹配的POI信息组成的POI信息集合中获取与第二个词语匹配的POI信息，以此类推，从待识别词语中获取最后一个词语，从与最后一个词语相邻的上一个词语匹配的POI信息组成的POI信息集合中获取与最后一个词语匹配的目标POI信息。

在本实施例中，自然语音识别模块1032可以将词语按照在文字信息中出现的先后顺序进行排序，优选地，为了提高查找速度，自然语音识别模块1032可以先获取待识别词语中的关键词，然后将待识别词语按照关键词、后辅助词和前辅助词的顺序进行排序。

其中，关键词是具有专有指代意义的词语，后辅助词是文字信息中位于关键词之后的词语，前辅助词是文字信息中位于关键词之前的词语。

在本实施例中，云计算平台服务器103（具体为自然语音识别模块1032）可以预先设置关键词表，该关键词表可以根据POI数据库中存储的信息设置，自然语音识别模块1032在获取待识别词语后，对所包含的每个词语分别查找关键词表，获取与关键词表中存储的关键词匹配的词语为待识别词语包含的关键词。

需要说明的是，如果经查找后获知待识别词语中不存在关键词，则自然语音识别模块1032按照待识别词语出现的先后顺序进行排序；进一步地，如果经查找后获待识别词语中包含两个以上关键词，则后辅助词为待识别词语中第一个关键词以后的非关键词，自然语音识别模块1032仍然按照关键词、后辅助词以及前辅助词的顺序进行排序。

自然语音识别模块1032通过将待识别词语按照关键词、后辅助词和前辅助词的顺序进行排序，使得后续按照词语顺序进行查找匹配时，重点信息突出，能够大幅度的缩短词语查找匹配的时间，进行提高语音识别的速度。

需要说明的是，如果自然语音识别模块1032未查找到与当前词语匹配的信息，则可以将当前词语的匹配信息设置为与该当前词语相邻的上一个词语匹配的信息，如果，当前词语为第一个词语，则该第一个词语匹配的信息为整个POI数据库中包含的POI信息。

为了使本领域技术人员能够对以上所述的嵌套查找法有更深刻的认识，下面通过具体的例子对嵌套查找法的具体实现进行说明：

例如：当用户输入的导航位置语音信息为：北京石景山区八角东路小肥羊火锅店时，非特定人语音识别模块1031获取与该导航位置语音信息对应的拼音，该拼音包括：beijingshijingshanqubajiaodongluxiaofeiyanghuoguodian；自然语音识别模块1032根据词典对该拼音进行分词，获取词语拼音串，包括：beijing，shijingshanqu，bajiao，donglu，xiaofeiyang，huoguodian；自然语音识别模块1032根据词语拼音串查找词典获取待识别词语，包括：北京，石景山区，八角，东路，（小肥羊、小沸羊），火锅店；如果xiaofeiyang对应的待识别词语（小肥羊和小沸羊）为关键词，按照关键词、后辅助词和前辅助词排序为：（小肥羊、小沸羊），火锅店，北京，石景山区，八角，东路；当POI数据库包括：北京小肥羊超市，北京小沸羊火锅店，上海小沸羊餐饮公司，北京石景山区小沸羊烤肉店，石景山区古城路小肥羊火锅店，北京东来顺火锅店，北京八角北路东来顺火锅店，北京八角小肥羊火锅店等信息时，按照上述嵌套查找法，首先，自然语音识别模块1032从目标信息POI数据库中获取与“小肥羊和小沸羊”组成的关键词集合匹配的POI信息，形成第一POI信息库，该第一POI信息库包括：北京小肥羊超市，北京小沸羊火锅店，上海小沸羊餐饮公司，北京石景山区小沸羊烤肉店，石景山区古城路小肥羊火锅店，北京八角小肥羊火锅店，然后，自然语音识别模块1032从第一POI信息库中获取与“火锅店”匹配的POI信息，形成第二POI信息库，该第二POI信息库包括：北京小沸羊火锅店，石景山区古城路小肥羊火锅店，北京八角小肥羊火锅店，第三，自然语音识别模块1032从第二POI信息库中获取与“北京”匹配的POI信息，形成第三POI信息库，该第三POI信息库包括：北京小沸羊火锅店，北京八角小肥羊火锅店，第四，自然语音识别模块1032从第三POI信息库中获取与“八角”匹配的POI信息，形成第四POI信息库，该第四POI信息库包括：北京八角小肥羊火锅店，第五，自然语音识别模块1032从第四POI信息库中获取与“东路”匹配的目标POI信息，由于第四POI信息库中没有与“东路”匹配的POI信息，所以目标POI信息为第四POI信息库中包含的全部POI信息，即北京八角小肥羊火锅店。

通过以上所述的权重系数判决法以及嵌套查找法，自然语音识别模块1032能够准确地查找到与待识别词语匹配度最高的目标POI信息，实现对用户输入的导航位置语音信息的识别。当然，在实际的使用过程中，自然语音识别模块1032还可以采用其他方式获取与待识别词语匹配度最高的目标POI信息，此处不作一一赘述。

通信模块1033，用于获取自然语音识别模块1032获取的目标POI信息对应的导航目的地址，将该导航目的地址携带在自动导航控制信息中发送给终端设备102。

进一步地，如果自然语音识别模块1032选取了两条以上目标POI信息，为了提高语音识别的准确定，如图1所示，终端设备102，还可以用于接收云计算平台服务器103发送的两条以上目标POI信息，将该两条以上目标POI信息显示给用户，接收用户根据所述两条以上目标POI信息发送的POI信息选取指示，将POI信息选取指示发送给云计算平台服务器103；

具体地，终端设备102可以接收用户通过语音或者按键或者文字输入等方式发送的POI信息选取指示。需要说明的是，如果用户通过语音方式发送POI信息选取指示，则云计算平台服务器103需要采用非特定人语音识别模块1031对该POI信息选取指示进行识别、解析，获取对应的控制指令。

云计算平台服务器103，还可以用于如果自然语音识别模块1032查找到两条以上目标POI信息，通信模块1033将两条以上目标POI信息发送给终端设备102，接收终端设备102返回的POI信息选取指示，根据该POI信息选取指示从两条以上目标POI信息中选取优选目标POI信息，并获取该优选目标POI信息对应的导航目的地址。

或者，如图2所示，云计算平台服务器103，还包括：

统计模块1034，用于导航数据进行统计，保存导航数据统计结果；

在本实施例中，统计模块1034可以对用户每次进行语音识别的POI信息进行统计，该统计可以是针对特定用户个人的，也可以是针对特定用户群体的。进一步地，该语音识别统计数据可以是对用户的一个或者多个目标POI信息进行语音识别的次数或者频率统计的结果，也可以是对多个用户最后一次进行语音识别的目标POI信息的统计结果，当然还可以为其他与语音识别相关的统计结果，此处不作一一赘述。

通信模块1033，还可以用于如果自然语音识别模块1032查找到两条以上目标POI信息，从统计模块1034获取导航数据统计结果，根据该导航数据统计结果从两条以上目标POI信息中选取优选目标POI信息，并获取该优选目标POI信息对应的导航目的地址。

例如：当导航数据统计结果为对用户的多个目标POI信息进行语音识别的次数进行统计的结果时，如果用户输入的导航位置语音信息对应的拼音为xiaofeiyanghuoguodian，自然语音识别模块1032获取了4条目标POI信息，包括：海淀区小肥羊火锅店，海淀区中关村小肥羊火锅店，石景山八角东路小肥羊火锅店，以及西直门嘉茂小沸羊火锅店时，通信模块1033可以获取4条目标POI信息对应的语音识别统计数据，如“海淀区小肥羊火锅店”进行语音识别3次，“海淀区中关村小肥羊火锅店”进行语音识别5次，“石景山八角东路小肥羊火锅店”进行语音识别40次，“西直门嘉茂小沸羊火锅店”进行语音识别1次，则通信模块1033可以根据统计结果，从4条目标POI信息中选取“石景山八角东路小肥羊火锅店”为优选目标POI信息。

可选地，为了进一步缩短语音识别的时间，提高语音识别速度，在本实施例中，自然语音识别模块1032，还可以用于根据文字信息包含的词语查找口语词库，根据查找结果，从文字信息包含的词语中删除口语词，其中，口语词库用于存储口语词，口语词中不包括涉及到用户输入的导航位置语音信息中具有实质性含义的文字信息。

在本实施例中，可以采用统计的方法预先设置口语词库，该口语词库中可以包括人们日常使用的口语词，例如：“我想去”、“我想要”、“请问”、“是不是”、“对不对”、“可不可以”以及“怎么”等等，此处不对口语词库中包含的口语词进行一一赘述。

进一步地，为了使本发明实施例提供的基于自然语音识别的导航系统能够适用于发音吐字不清楚以及发音规范不同的人群，提高语音识别的成功率与准确率，在以上图1和2所示的技术方案基础上，自然语音识别模块1032，还可以用于对非特定人语音识别模块1031获取的拼音进行模糊音匹配处理，获取模糊匹配后的拼音，采用词典对模糊匹配后的拼音进行分词处理，获取分词后的词语拼音串。

具体地，可以预先设置拼音模糊匹配表，在该拼音模糊匹配表中定义匹配规则，例如：z=zh，c=ch，s=sh，l=n，f＝h，r=l，an=ang，en=eng，in=ing，ian=iang，uan=uang，iong=ing等，此处不作一一赘述，根据所述规则对非特定人语音识别模块1031获取的拼音进行模糊音匹配处理。

通过对拼音进行模糊匹配，解决了由于用户口齿不清、发音不准确造成的语音识别失败或者识别错误等问题，进而提高了本发明实施例提供基于自然语音识别的导航系统进行语音识别的成功率与准确率。

本发明实施例提供的基于自然语音识别的导航系统，用户按下设置在车辆方向盘上的一键式控制装置的启动键后，终端设备与云计算平台服务器建立语音会话连接，系统进行自动语音导航状态。当用户通过终端设备向云计算平台服务器发送导航位置语音信息时，云计算平台服务器可以先采用非特定人语音识别技术对导航位置语音信息进行识别解析，获取对应的拼音，然后对拼音进行分词，获取分词后的词语拼音串，并从词典中获取词语拼音串对应的待识别词语，采用待识别词语进行信息匹配，将POI数据库中与待识别词语匹配度最高的POI信息作为对导航位置语音信息识别得到的目标POI信息，云计算平台服务器不需要对用户发送的导航位置语音信息进行完全匹配即可获得目标POI信息，提高了中文语音识别的成功率，进而提高了语音导航服务的可靠性以及用户使用语音导航服务的服务体验。解决了现有技术采用对语音信息进行完全匹配方法进行语音识别，造成由于表述方式不一致而使语音识别失败，语音识别成功率低，致使语音导航服务的可靠性差，用户使用语音导航服务的服务体验不好的问题，由于本发明实施例提供的技术方案中云计算平台服务器采用词语匹配的方式进行语音识别，只需要在词典中存储目标词语和目标词语对应的拼音串，并在POI数据库中存储标准POI信息即可，不需要对同一事物按照语言表述方式存储大量不同形式的文本信息，词典和POI数据库的数据规模较小，便于进行查找，进而提高了语音导航系统的语音识别速度，解决了现有技术需要在词表中对同一事物存储大量不同表述形式的文本信息，造成词表规模庞大，不便于查找，进行语音识别的速度较慢，致使语音导航服务系统延迟较大的问题。本发明实施例提供的技术方案中云计算平台服务器采用的自然语音识别技术不同于英文语音识别技术，该自然语音识别技术针对中文语言文字量大，语句中词语连贯、无停顿的特点，采用对语句按拼音分词，并根据词语查找的方式进行语音识别，对中文语音识别的成功率以及识别速度较高。

如图3所示，本发明实施例还提供一种基于自然语音识别的导航方法，包括：

步骤301，在用户按下一键式控制装置的启动按键以后，一键式控制装置通过直接或短距离通信方式与终端设备建立连接，其中，一键式控制装置设置在车辆的固定部位上，直接或者通过短距离通信方式驱动终端设备与网络侧的云计算平台服务器建立连接；

步骤302，终端设备通过语音电话交换网络或多种无线数据网络与云计算平台服务器建立语音会话连接；

步骤303，终端设备接收用户发送的导航位置语音信息，将导航位置语音信息发送给云计算平台服务器；

步骤304，云计算平台服务器采用非特定人语音识别技术对导航位置语音信息进行识别、解析，获取导航位置语音信息对应的拼音；

步骤305，云计算平台服务器采用预先设置的词典对拼音进行分词处理，获取分词后的词语拼音串，其中，词典用于存储待进行语音识别的目标词语以及目标词语对应的拼音；

步骤306，云计算平台服务器从词典中查找词语拼音串对应的待识别词语；

步骤307，云计算平台服务器根据待识别词语查找POI数据库，从POI数据库中获取与待识别词语匹配度最高的目标POI信息；

步骤308，云计算平台服务器获取目标POI信息对应的导航目的地址，将该导航目的地址携带在自动导航控制信息中发送给终端设备；

步骤309，终端设备根据自动导航控制信息启动导航功能，与导航服务器建立连接，从导航服务器获取导航目的地址的导航结果，将该结果显示给用户。

进一步地，本发明实施例提供的基于自然语音识别的导航方法还可以包括：如果词典还用于存储目标词语对应的权重等级n以及权重等级范围N，云计算平台服务器根据所述词典获取所述待识别词语对应的权重等级，其中，n、N均为整数，N≥2，n∈[1，N]，第n级的目标词语在待识别词语中的重要性要比第n+1级的目标词语在待识别词语中的重要性大；

则如图4所示，步骤307可以包括：

步骤3071，云计算平台服务器根据待识别词语查找POI数据库，从POI数据库中获取与待识别词语包含的任意一个或多个词语匹配的POI信息组成的POI信息集合；

步骤3072，云计算平台服务器根据待识别词语对应的权重等级，对POI信息集合中的每条POI信息分别进行处理，获取每条POI信息的权重系数；

步骤3073，云计算平台服务器从POI信息集合中选取权重系数最高的POI信息为目标POI信息。

进一步地，为了提高语音识别的准确性，本发明实施例提供的基于自然语音识别的导航方法还可以包括：如果所述待识别词语中不存在权重等级为1的词语，所述云计算平台服务器重新对所述拼音进行分词处理，以获取至少一个权重等级为1的词语。则此时，步骤307为：云计算平台服务器根据从新分词后的待识别词语查找POI数据库，从POI数据库中获取与待识别词语匹配度最高的目标POI信息。

在此基础上，本发明实施例提供的基于自然语音识别的导航方法还可以包括：云计算平台服务器将至少一个权重等级为1的词语以及该词语对应的拼音串添加到词典中。

进一步地，如图5所示，步骤307可以包括：

步骤3074，云计算平台服务器对待识别词语进行排序；

具体地，步骤3074可以包括：云计算平台服务器获取待识别词语中的关键词；云计算平台服务器将待识别词语按照关键词、后辅助词以及前辅助词的顺序进行排序；其中，后辅助词为待识别词语中位于关键词之后的词语，前辅助词为待识别词语中位于关键词之前的词语。

需要说明的是，如果待识别词语中有两个以上关键词，后辅助词为待识别词语中第一个关键词以后的非关键词。

步骤3075，云计算平台服务器按照排序的结果，从待识别词语中获取第一个词语，从POI数据库中获取与第一个词语匹配的POI信息；

步骤3076，云计算平台服务器从待识别词语中获取第二个词语，从与第一个词语匹配的POI信息组成的POI信息集合中获取与第二个词语匹配的POI信息；

以此类推，步骤3077，云计算平台服务器从待识别词语中获取最后一个词语，从与最后一个词语相邻的上一个词语匹配的POI信息组成的POI信息集合中获取与最后一个词语匹配的目标POI信息。

进一步地，如果在步骤307中云计算平台服务器查找到两条以上目标POI信息，本发明实施例提供的基于自然语音识别的导航方法还可以包括：云计算平台服务器向终端设备发送两条以上目标POI信息；终端设备将两条以上目标POI信息显示给用户，接收用户根据两条以上目标POI信息发送的POI信息选取指示；终端设备将POI信息选取指示发送给云计算平台服务器；云计算平台服务器根据POI信息选取指示从两条以上目标POI信息中选取优选目标POI信息，并获取该优选目标POI信息对应的导航目的地址。

或者，本发明实施例提供的基于自然语音识别的导航方法还可以包括：云计算平台服务器获取导航数据统计结果；云计算平台服务器根据导航数据统计结果从所述两条以上目标POI信息中选取优选目标POI信息。

可选地，为了进一步提高云计算平台服务器进行语音识别的速度，如图6所示，在步骤306之后，步骤307之前，还可以包括：

步骤3010，云计算平台服务器根据待识别词语查找口语词库，根据查找结果，从待识别词语中删除口语词，其中，口语词库用于存储口语词，口语词中不包括涉及到用户输入的导航位置语音信息中具有实质性含义的文字信息。

进一步地，为了使本发明实施例提供的基于自然语音识别的导航方法能够适用于发音吐字不清楚以及发音规范不同的人群，提高语音识别的成功率与准确率，在以上图3-6所示的技术方案基础上，本发明实施例提供的基于自然语音识别的导航方法还可以包括：云计算平台服务器对拼音进行模糊音匹配处理，获取模糊匹配后的拼音的步骤，则此时步骤305具体为：云计算平台服务器采用词典对模糊匹配后的拼音进行分词处理，获取分词后的词语拼音串。

具体地，可以预先设置拼音模糊匹配表，在该拼音模糊匹配表中定义匹配规则，例如：z=zh，c=ch，s=sh，l=n，f＝h，r=l，an=ang，en=eng，in=ing，ian=iang，uan=uang，iong=ing等，此处不作一一赘述，根据所述规则对拼音进行模糊音匹配处理。

通过对拼音进行模糊匹配，解决了由于用户口齿不清、发音不准确造成的语音识别失败或者识别错误等问题，进而提高了本发明实施例提供基于自然语音识别的导航方法的语音识别成功率与准确率。

本发明实施例提供的基于自然语音识别的导航方法的具体实现过程可以参见本发明实施例提供的基于自然语音识别的导航系统所述，此处不再赘述。

本发明实施例提供的基于自然语音识别的导航方法，用户按下设置在车辆方向盘上的一键式控制装置的启动键后，终端设备与云计算平台服务器建立语音会话连接，系统进行自动语音导航状态。当用户通过终端设备向云计算平台服务器发送导航位置语音信息时，云计算平台服务器可以先采用非特定人语音识别技术对导航位置语音信息进行识别解析，获取对应的拼音，然后对拼音进行分词，获取分词后的词语拼音串，并从词典中获取词语拼音串对应的待识别词语，采用待识别词语进行信息匹配，将POI数据库中与待识别词语匹配度最高的POI信息作为对导航位置语音信息识别得到的目标POI信息，云计算平台服务器不需要对用户发送的导航位置语音信息进行完全匹配即可获得目标POI信息，提高了中文语音识别的成功率，进而提高了语音导航服务的可靠性以及用户使用语音导航服务的服务体验。解决了现有技术采用对语音信息进行完全匹配方法进行语音识别，造成由于表述方式不一致而使语音识别失败，语音识别成功率低，致使语音导航服务的可靠性差，用户使用语音导航服务的服务体验不好的问题，由于本发明实施例提供的技术方案中云计算平台服务器采用词语匹配的方式进行语音识别，只需要在词典中存储目标词语和目标词语对应的拼音串，并在POI数据库中存储标准POI信息即可，不需要对同一事物按照语言表述方式存储大量不同形式的文本信息，词典和POI数据库的数据规模较小，便于进行查找，进而提高了语音导航系统的语音识别速度，解决了现有技术需要在词表中对同一事物存储大量不同表述形式的文本信息，造成词表规模庞大，不便于查找，进行语音识别的速度较慢，致使语音导航服务系统延迟较大的问题。本发明实施例提供的技术方案中云计算平台服务器采用的自然语音识别技术不同于英文语音识别技术，该自然语音识别技术针对中文语言文字量大，语句中词语连贯、无停顿的特点，采用对语句按拼音分词，并根据词语查找的方式进行语音识别，对中文语音识别的成功率以及识别速度较高。

本发明实施例提供的基于自然语音识别的导航方法和系统，可以应用在导航领域中。

以上所述，仅为本发明的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应所述以权利要求的保护范围为准。

Claims

1.一种基于自然语音识别的导航系统，其特征在于，包括：一键式控制装置、终端设备以及云计算平台服务器；

所述云计算平台服务器，位于网络侧，包括：

通信模块，用于获取自然语音识别模块获取的目标POI信息对应的导航目的地址，将所述导航目的地址携带在自动导航控制信息中发送给所述终端设备；

进一步地，所述自然语音识别模块，具体用于如果所述词典还用于存储所述目标词语对应的权重等级n以及权重等级范围N，根据所述词典获取所述待识别词语对应的权重等级，根据所述待识别词语查找POI数据库，从所述POI数据库中获取与待识别词语中的任意一个或多个词语匹配的POI信息组成的POI信息集合，根据所述待识别词语对应的权重等级，对所述POI信息集合中的每条POI信息分别进行处理，获取每条POI信息的权重系数，从所述POI信息集合中选取权重系数最高的POI信息为目标POI信息，其中，n、N均为整数，N≥2，n∈[1，N]，第n级的目标词语在所述待识别词语中的重要性要比第n+1级的目标词语在所述待识别词语中的重要性大。

2.根据权利要求1所述的系统，其特征在于，所述自然语音识别模块，还用于如果所述待识别词语中不存在权重等级为1的词语，重新对所述拼音进行分词处理，以获取至少一个权重等级为1的词语。

3、根据权利要求2所述的系统，其特征在于，所述自然语音识别模块，还用于将所述至少一个权重等级为1的词语以及该词语对应的拼音串添加到所述词典中。

4、根据权利要求1所述的系统，其特征在于，所述自然语音识别模块，还用于根据所述待识别词语查找口语词库，根据查找结果，从所述待识别词语中删除口语词，其中，口语词库用于存储口语词，所述口语词中不包括涉及到所述用户输入的导航位置语音信息中具有实质性含义的文字信息。

5、根据权利要求1所述的系统，其特征在于，

所述终端设备，还用于接收所述云计算平台服务器发送的两条以上目标POI信息，将所述两条以上目标POI信息显示给所述用户，接收用户根据所述两条以上目标POI信息发送的POI信息选取指示，将所述POI信息选取指示发送给所述云计算平台服务器；

所述云计算平台服务器，还用于如果自然语音识别模块查找到两条以上目标POI信息，所述通信模块将所述两条以上目标POI信息发送给所述终端设备，接收所述终端设备返回的POI信息选取指示，根据该POI信息选取指示从所述两条以上目标POI信息中选取优选目标POI信息，并获取该优选目标POI信息对应的导航目的地址。

6、根据权利要求1所述的系统，其特征在于，所述云计算平台服务器，还包括：

统计模块，用于导航数据进行统计，保存导航数据统计结果；

所述通信模块，还用于如果所述自然语音识别模块查找到两条以上目标POI信息，从所述统计模块获取导航数据统计结果，根据该导航数据统计结果从所述两条以上目标POI信息中选取优选目标POI信息，并获取该优选目标POI信息对应的导航目的地址。

7、根据权利要求1-6中任意一项所述的系统，其特征在于，所述自然语音识别模块，还用于对所述拼音进行模糊音匹配处理，获取模糊匹配后的拼音，采用所述预先设置的词典对所述模糊匹配后的拼音进行分词处理，获取分词后的词语拼音串。

8、一种基于自然语音识别的导航系统，其特征在于，包括：一键式控制装置、终端设备以及云计算平台服务器；

所述云计算平台服务器，位于网络侧，包括：

进一步地，所述自然语音识别模块，具体用于对所述待识别词语进行排序，按照所述排序的结果，从所述待识别词语中获取第一个词语，从所述POI数据库中获取与所述第一个词语匹配的POI信息，从所述待识别词语中获取第二个词语，从所述与第一个词语匹配的POI信息组成的POI信息集合中获取与所述第二个词语匹配的POI信息，以此类推，从所述待识别词语中获取最后一个词语，从与所述最后一个词语相邻的上一个词语匹配的POI信息组成的POI信息集合中获取与所述最后一个词语匹配的目标POI信息；

进一步地，所述自然语音识别模块，具体用于获取所述待识别词语中的关键词，将所述待识别词语按照关键词、后辅助词以及前辅助词的顺序进行排序，其中，后辅助词为所述待识别词语中位于关键词之后的词语，前辅助词为所述待识别词语中位于关键词之前的词语。

9、根据权利要求8所述的系统，其特征在于，所述自然语音识别模块，还用于对所述拼音进行模糊音匹配处理，获取模糊匹配后的拼音，采用所述预先设置的词典对所述模糊匹配后的拼音进行分词处理，获取分词后的词语拼音串。

10、一种基于自然语音识别的导航方法，其特征在于，包括：

在用户按下一键式控制装置的启动按键以后，所述一键式控制装置通过直接或短距离通信方式与终端设备建立连接，其中，所述一键式控制装置设置在车辆的固定部位上，直接或者通过短距离通信方式驱动所述终端设备与网络侧的云计算平台服务器建立连接；

所述终端设备通过语音电话交换网络或多种无线数据网络与所述云计算平台服务器建立语音会话连接；

所述终端设备接收所述用户发送的导航位置语音信息，将所述导航位置语音信息发送给所述云计算平台服务器；

所述云计算平台服务器采用非特定人语音识别技术对所述导航位置语音信息进行识别、解析，获取所述导航位置语音信息对应的拼音；

所述云计算平台服务器采用预先设置的词典对所述拼音进行分词处理，获取分词后的词语拼音串，其中，所述词典用于存储待进行语音识别的目标词语以及目标词语对应的拼音；

所述云计算平台服务器从所述词典中查找所述词语拼音串对应的待识别词语；

如果所述词典还用于存储所述目标词语对应的权重等级n以及权重等级范围N，所述云计算平台服务器根据所述词典获取所述待识别词语对应的权重等级，其中，n、N均为整数，N≥2，n∈[1，N]，第n级的目标词语在所述待识别词语中的重要性要比第n+1级的目标词语在所述待识别词语中的重要性大；

所述云计算平台服务器根据所述待识别词语查找POI数据库，从所述POI数据库中获取与所述待识别词语包含的任意一个或多个词语匹配的POI信息组成的POI信息集合；

所述云计算平台服务器根据所述待识别词语对应的权重等级，对所述POI信息集合中的每条POI信息分别进行处理，获取每条POI信息的权重系数；

所述云计算平台服务器从所述POI信息集合中选取权重系数最高的POI信息为目标POI信息；

所述云计算平台服务器获取所述目标POI信息对应的导航目的地址，将该导航目的地址携带在自动导航控制信息中发送给所述终端设备；

所述终端设备根据所述自动导航控制信息启动导航功能，与导航服务器建立连接，从所述导航服务器获取所述导航目的地址的导航结果，将该结果显示给所述用户。

11、根据权利要求10所述的方法，其特征在，所述方法还包括：

如果所述待识别词语中不存在权重等级为1的词语，所述云计算平台服务器重新对所述拼音进行分词处理，以获取至少一个权重等级为1的词语；

则所述云计算平台服务器根据所述待识别词语查找POI数据库，从所述POI数据库中获取与所述待识别词语匹配度最高的目标POI信息为：

所述云计算平台服务器根据从新分词后的待识别词语查找POI数据库，从所述POI数据库中获取与所述待识别词语匹配度最高的目标POI信息。

12、根据权利要求11所述的方法，其特征在于，所述方法还包括：

所述云计算平台服务器将所述至少一个权重等级为1的词语以及该词语对应的拼音串添加到所述词典中。

13、根据权利要求10所述的方法，其特征在于，所述方法还包括：

所述云计算平台服务器根据所述待识别词语查找口语词库，根据查找结果，从所述待识别词语中删除口语词，其中，口语词库用于存储口语词，所述口语词中不包括涉及到所述用户输入的导航位置语音信息中具有实质性含义的文字信息。

14、根据权利要求10所述的方法，其特征在于，所述方法还包括：

如果所述云计算平台服务器查找到两条以上目标POI信息，所述云计算平台服务器向所述终端设备发送所述两条以上目标POI信息；

所述终端设备将所述两条以上目标POI信息显示给所述用户，接收所述用户根据所述两条以上目标POI信息发送的POI信息选取指示；

所述终端设备将所述POI信息选取指示发送给所述云计算平台服务器；

所述云计算平台服务器根据所述POI信息选取指示从所述两条以上目标POI信息中选取优选目标POI信息，并获取该优选目标POI信息对应的导航目的地址。

15、根据权利要求10所述的方法，其特征在于，所述方法还包括：

如果所述云计算平台服务器查找到两条以上目标POI信息，所述云计算平台服务器获取导航数据统计结果；

所述云计算平台服务器根据所述导航数据统计结果从所述两条以上目标POI信息中选取优选目标POI信息。

16、根据权利要求10-15中任意一项所述的方法，其特征在于，所述方法还包括：

所述云计算平台服务器对所述拼音进行模糊音匹配处理，获取模糊匹配后的拼音；

则所述云计算平台服务器采用预先设置的词典对所述拼音进行分词处理，获取分词后的词语拼音串为：

所述云计算平台服务器采用所述预先设置的词典对所述模糊匹配后的拼音进行分词处理，获取分词后的词语拼音串。

17、一种基于自然语音识别的导航方法，其特征在于，包括：

所述云计算平台服务器获取所述待识别词语中的关键词；

所述云计算平台服务器将所述待识别词语按照关键词、后辅助词以及前辅助词的顺序进行排序；其中，后辅助词为所述待识别词语中位于关键词之后的词语，前辅助词为所述待识别词语中位于关键词之前的词语；

所述云计算平台服务器按照所述排序的结果，从所述待识别词语中获取第一个词语，从POI数据库中获取与所述第一个词语匹配的POI信息；

所述云计算平台服务器从所述待识别词语中获取第二个词语，从所述与第一个词语匹配的POI信息组成的POI信息集合中获取与所述第二个词语匹配的POI信息；

以此类推，所述云计算平台服务器从所述待识别词语中获取最后一个词语，从与所述最后一个词语相邻的上一个词语匹配的POI信息组成的POI信息集合中获取与所述最后一个词语匹配的目标POI信息；

18、根据权利要求17所述的方法，其特征在于，如果所述待识别词语中有两个以上关键词，所述后辅助词为所述待识别词语中第一个关键词以后的非关键词。

19、根据权利要求17或18所述的方法，其特征在于，所述方法还包括：