CN104598527B

CN104598527B - 一种语音搜索方法及装置

Info

Publication number: CN104598527B
Application number: CN201410828858.7A
Authority: CN
Inventors: 陈颖棠; 刘昆
Original assignee: Critics Of Science And Technology (guangzhou) Co Ltd
Current assignee: Critics of science and Technology (Guangzhou) Co. Ltd.
Priority date: 2014-12-26
Filing date: 2014-12-26
Publication date: 2018-09-25
Anticipated expiration: 2034-12-26
Also published as: CN104598527A

Abstract

本发明公开了一种语音搜索方法及装置，该方法包括：获取语音信息，并将语音信息转换为文本信息；根据该文本信息，设置首要检索条件与次要检索条件；获取联系人主索引与第二索引，其中首要检索条件与联系人主索引均经过模糊读音处理；根据首要检索条件对第二索引进行检索，获得模糊音检索列表；根据联系人主索引与次要检索条件，对模糊音检索列表进行逐个字母匹配排序，获得语音搜索列表。本发明技术方案使用模糊读音条件搜索联系人，能解决因同音字、连续字或近似读音而造成联系人检索不准确的问题，提高语音搜索联系人的准确性。

Description

一种语音搜索方法及装置

技术领域

本发明涉及语音搜索技术领域，尤其涉及一种语音搜索方法及装置。

背景技术

在移动APP开发中，联系人列表搜索是一个经常实现的功能，为了提高搜索的便利性，语音搜索联系人列表是一种非常便捷的方式。现有的语音搜索具体为：用户终端采集语音并将语音数据上传到云端，对识别完成后的文本进行本地搜索，再根据获取的搜索条件过滤搜索结果，将最终的结构反馈给用户终端。

现有技术在普通长文本检索的时候并不会出现较大的问题，但是在联系人姓名检索方面，由于中文名字通常只有2至4个文字，特征比较短，会有大量同音字和连续字出现，例如连(Lian)和李安(LiAn),刘冰和刘兵,倪明和黎明等常见情况。当语音识别的数据为同音，但非用户所需的数据时，根据这些关键字而获得的搜索结果并不是用户所需求的结果，造成搜索不准确的问题。

发明内容

本发明实施例提出一种语音搜索方法及装置，使用模糊读音条件搜索联系人，能解决因同音字、连续字或近似读音而造成联系人检索不准确的问题，提高语音搜索联系人的准确性。

本发明实施例提供一种语音搜索方法，包括：

获取语音信息，并将所述语音信息转换为文本信息；

根据所述文本信息，设置首要检索条件与次要检索条件；

获取联系人主索引与第二索引，其中所述首要检索条件与所述联系人主索引均经过模糊读音处理；所述模糊读音处理为：将拼音中的Zh转换为Z，Ch转换为C，Sh转换为S，N转换为L；

根据所述首要检索条件对所述第二索引进行检索，获得模糊音检索列表；

根据所述联系人主索引与次要检索条件，对所述模糊音检索列表进行逐个字母匹配排序，获得语音搜索列表。

进一步的，所述根据所述文本信息，设置首要检索条件与次要检索条件，包括：

获取所述文本信息的各文字拼音和关键字单字拼音的首字母；

对所述关键字单字拼音的首字母进行模糊读音处理；

将处理后的所述关键字单字拼音的首字母设置为首要检索条件，并将所述各文字拼音设置为次要检索条件。

进一步的，所述获取联系人主索引与第二索引，包括：

获取云端联系人列表，并将所述云端联系人列表中的联系人名字转换为联系人名字单字拼音；

对所述联系人名字单字拼音进行模糊读音处理；

将处理后的单字拼音设置为联系人主索引，并将所述联系人名字单字拼音的首字母设置为第二索引。

进一步的，所述获取联系人主索引与第二索引，包括：

直接获取预存的联系人主索引与第二索引。

相应地，本发明实施例还提供一种语音搜索装置，包括：

语音获取模块，用于获取语音信息，并将所述语音信息转换为文本信息；

检索条件设置模块，用于根据所述文本信息，设置首要检索条件与次要检索条件；

索引获取模块，用于获取联系人主索引与第二索引，其中所述首要检索条件与所述联系人主索引均经过模糊读音处理；所述模糊读音处理为：将拼音中的Zh转换为Z，Ch转换为C，Sh转换为S，N转换为L；

检索模块，用于根据所述首要检索条件对所述第二索引进行检索，获得模糊音检索列表；

排序模块，用于根据所述联系人主索引与次要检索条件，对所述模糊音检索列表进行逐个字母匹配排序，获得语音搜索列表。

进一步的，所述检索条件设置模块包括：

第一获取单元，用于获取所述文本信息的各文字拼音和关键字单字拼音的首字母；

第一模糊读音处理单元，用于对所述关键字单字拼音的首字母进行模糊读音处理；

检索条件设置单元，用于将处理后的所述关键字单字拼音的首字母设置为首要检索条件，并将所述各文字拼音设置为次要检索条件。

进一步的，所述索引获取模块包括：

第二获取单元，用于获取云端联系人列表，并将所述云端联系人列表中的联系人名字转换为联系人名字单字拼音；

第二模糊读音处理单元，用于对所述联系人名字单字拼音进行模糊读音处理；

索引设置单元，用于将处理后的单字拼音设置为联系人主索引，以及将所述联系人名字单字拼音的首字母设置为第二索引。

进一步的，所述索引获取模块具体用于直接获取预存的联系人主索引与第二索引。

可见，实施本发明实施例，具有如下有益效果：

本发明实施例提供的一种语音搜索方法，将获取的语音信息转换为文本信息，并根据文本信息，设置首要检索条件与次要检索条件，再获取联系人主索引与第二索引。其中，首要检索条件与联系人主索引均经过模糊读音处理。在检索时，根据首要检索条件对第二索引进行检索，获得模糊音检索列表，再根据联系人主索引与次要检索条件，对模糊音检索列表进行逐个字母匹配排序，获得语音搜索列表。相比于现有技术采用的语音识别搜索技术，本发明将精确的语音识别结果转换为模糊语音条件，使用模糊条件搜索联系人，再使用精确读音对搜索结果进行排序，能解决因同音字、连续字或近似读音而造成联系人检索不准确的问题，提高语音搜索联系人的准确性。

进一步的，本发明将语音信息中的关键字单字拼音的首字母进行模糊读音处理，将处理后的首字母设置为首要检索条件。而且将联系人名字单字拼音进行模糊读音处理，将处理后的单字拼音设置为联系人主索引，使得在搜索与排序时能准确的找出用户需要的内容，进一步提高语音搜索联系人的准确性。

另一方面，本发明提供了一种语音搜索装置，语音获取模块将获取的语音信息转换为文本信息，检索条件设置模块根据文本信息，设置首要检索条件与次要检索条件，再由索引获取模块获取联系人主索引与第二索引。其中，首要检索条件与联系人主索引均经过模糊读音处理。在检索时，检索模块根据首要检索条件对第二索引进行检索，获得模糊音检索列表，再由排序模块根据联系人主索引与次要检索条件，对模糊音检索列表进行逐个字母匹配排序，获得语音搜索列表。相比于现有技术采用的语音识别搜索技术，本发明提供的语音检索装置将精确的语音识别结果转换为模糊语音条件，使用模糊条件搜索联系人，再使用精确读音对搜索结果进行排序，能解决因同音字、连续字或近似读音而造成联系人检索不准确的问题，提高语音搜索联系人的准确性。

附图说明

图1是本发明提供的语音搜索方法的一种实施例的流程示意图；

图2是本发明提供了语音搜索装置的一种实施例的结构示意图；

图3是本发明提供的检索条件设置模块的一种实施例的结构示意图；

图4是本发明提供的索引获取模块的一种实施例的结构示意图；

图5是本发明提供的语音搜索装置的另一种实施例的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

参见图1，图1是本发明提供的语音搜索方法的一种实施例的流程示意图，该方法包括以下步骤：

步骤101：获取语音信息，并将语音信息转换为文本信息。

在本实施例中，用户终端采集用户的语音信息，通过设置在用户终端内部或者云端的语音识别引擎，将语音信息转换为文本信息。

步骤102：根据文本信息，设置首要检索条件与次要检索条件。

在本实施例中，用户终端获得文本信息后，获取文本信息的各文字拼音与关键字单字拼音的首字母。其中，各文字拼音的首字母为大写字母。对关键字单字拼音的首字母进行模糊读音处理，将处理后的关键字单字拼音的首字母设置为首要检索条件，并将各文字拼音设置为次要检索条件。

在本实施例中，模糊读音处理为将拼音中的Zh转换为Z，Ch转换为C，Sh转换为S，N转换为L。

步骤103：获取联系人主索引与第二索引，其中首要检索条件与联系人主索引均经过模糊读音处理。

在本实施例中，获取联系人主索引与第二索引包括：获取云端联系人列表，并将云端联系人列表中的联系人名字转换为联系人名字单字拼音。如果联系人的名字为英文，则直接将该英文名字设置为联系人主索引，并标记该英文名字。如果联系人为中英文混合，则忽略英文部分，单独将汉字转换为单字拼音。再对联系人名字单字拼音进行模糊读音处理，将处理后的单字拼音设置为联系人主索引，并将联系人名字单字拼音的首字母设置为第二索引。

在本实施例中，如果联系人存储在本设备中，本设备可以提前进行联系人主索引与第二索引的设置，并将联系人主索引与第二索引存储在本设备中，在获取时，直接获取预先存储的联系人主索引与第二索引。

步骤104：根据首要检索条件对第二索引进行检索，获得模糊音检索列表。

在本实施例中，根据首要检索条件(关键字单字拼音的首字母)对第二索引(联系人名字单字拼音的首字母)进行检索，获得模糊音检索列表，该模糊音检索列表为声母接近的联系人列表。本步骤采用模糊读音作为检索条件进行检索，确保检索到所有的联系人。

在本实施例中，如果检索不到读音接近的联系人，则提示用户未检索到联系人，再次进入语音信息获取步骤。

步骤105：根据联系人主索引与次要检索条件，对模糊音检索列表进行逐个字母匹配排序，获得语音搜索列表。

在本实施例中，在获得模糊音检索列表后，根据联系人主索引(经模糊音处理的联系人名字单字拼音)和次要检索条件(各文字拼音)进行逐个字母匹配排序，获得语音搜索列表，该语音搜索列表为读音接近的联系人列表。

在本实施例中，可以但不限于对次要检索条件与第二索引进行模糊读音处理，进一步提高识别的准确性。

在本实例中，如果检索关键字为英文，则根据英文与联系人列表中的姓名拼音进行逐个字母的匹配排序。

另一方面，参见图2，图2是本发明提供了语音搜索装置的一种实施例的结构示意图。该装置包括：语音获取模块201、检索条件设置模块202、索引获取模块203、检索模块204和排序模块205。

其各部件的工作原理及连接关系如下：

语音获取模块201，用于获取语音信息，并将语音信息转换为文本信息。

检索条件设置模块202，与语音获取模块201电连接，用于根据文本信息，设置首要检索条件与次要检索条件。

索引获取模块203，用于获取联系人主索引与第二索引，其中首要检索条件与所述联系人主索引均经过模糊读音处理；

检索模块204，分别与检索条件设置模块202与索引获取模块203电连接，用于根据首要检索条件对第二索引进行检索，获得模糊音检索列表；

排序模块205，与检索模块204电连接，用于根据联系人主索引与次要检索条件，对模糊音检索列表进行逐个字母匹配排序，获得语音搜索列表。

参见图3，图3是本发明提供的检索条件设置模块的一种实施例的结构示意图。检索条件设置模块202包括：第一获取单元301、第一模糊读音处理单元302和检索条件设置单元303。

其中。第一获取单元301，用于获取文本信息的各文字拼音和关键字单字拼音的首字母。第一模糊读音处理单元302，与第一获取单元301电连接，用于对关键字单字拼音的首字母进行模糊读音处理。第一模糊读音处理单元还可以对各文字拼音进行模糊读音处理。检索条件设置单元303与第一模糊读音处理单元302电连接，用于将处理后的关键字单字拼音的首字母设置为首要检索条件，并将各文字拼音设置为次要检索条件。

参见图4，图4是本发明提供的索引获取模块的一种实施例的结构示意图。索引获取模块203包括：第二获取单元401、第二模糊读音处理单元402和索引设置单元403。

其中，第二获取单元401，用于获取云端联系人列表，并将云端联系人列表中的联系人名字转换为联系人名字单字拼音。第二模糊读音处理单元402，与第二获取单元401电连接，用于对联系人名字单字拼音进行模糊读音处理。第二模糊读音处理单元402还可以用于对联系人名字单字拼音的首字母进行模糊读音处理。索引设置单元403，与第二模糊读音处理单元402电连接，用于将处理后的单字拼音设置为联系人主索引，以及将联系人名字单字拼音的首字母设置为第二索引。

在本实施例中，该装置还包括存储模块，用于存储联系人主索引与第二索引。索引获取模块201还用于获取预存在存储模块中的联系人主索引与第二索引。

参见图5，图5是本发明提供的语音搜索装置的另一种实施例的结构示意图。图5与图2的区别在于，该装置还包括：模糊读音处理模块501，分别与检索条件设置模块202和索引获取模块203电连接，用于模糊读音处理。模糊读音处理为：将拼音中的Zh转换为Z，Ch转换为C，Sh转换为S，N转换为L。

另一方面，本发明提供了一种语音搜索装置，语音获取模块201将获取的语音信息转换为文本信息，检索条件设置模块202根据文本信息，设置首要检索条件与次要检索条件，再由索引获取模块203获取联系人主索引与第二索引。其中，首要检索条件与联系人主索引均经过模糊读音处理。在检索时，检索模块204根据首要检索条件对第二索引进行检索，获得模糊音检索列表，再由排序模块205根据联系人主索引与次要检索条件，对模糊音检索列表进行逐个字母匹配排序，获得语音搜索列表。相比于现有技术采用的语音识别搜索技术，本发明提供的语音检索装置将精确的语音识别结果转换为模糊语音条件，使用模糊条件搜索联系人，再使用精确读音对搜索结果进行排序，能解决因同音字、连续字或近似读音而造成联系人检索不准确的问题，提高语音搜索联系人的准确性。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的程序可存储于一计算机可读取存储介质中，该程序在执行时，可包括如上述各方法的实施例的流程。其中，所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory，ROM)或随机存储记忆体(Random AccessMemory，RAM)等。

以上所述是本发明的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也视为本发明的保护范围。

Claims

1.一种语音搜索方法，其特征在于，包括：

获取语音信息，并将所述语音信息转换为文本信息；

根据所述文本信息，设置首要检索条件与次要检索条件，包括：获取所述文本信息的各文字拼音和关键字单字拼音的首字母；对所述关键字单字拼音的首字母进行模糊读音处理；将处理后的所述关键字单字拼音的首字母设置为首要检索条件，并将所述各文字拼音设置为次要检索条件；

2.根据权利要求1所述的语音搜索方法，其特征在于，所述获取联系人主索引与第二索引，包括：

对所述联系人名字单字拼音进行模糊读音处理；

3.根据权利要求1所述的语音搜索方法，其特征在于，所述获取联系人主索引与第二索引，包括：

直接获取预存的联系人主索引与第二索引。

4.一种语音搜索装置，其特征在于，包括：

索引获取模块，用于获取联系人主索引与第二索引，其中所述首要检索条件与所述联系人主索引均经过模糊读音处理；

排序模块，用于根据所述联系人主索引与次要检索条件，对所述模糊音检索列表进行逐个字母匹配排序，获得语音搜索列表；

其中，所述检索条件设置模块包括：

第一模糊读音处理单元，用于对所述关键字单字拼音的首字母进行模糊读音处理；所述模糊读音处理为：将拼音中的Zh转换为Z，Ch转换为C，Sh转换为S，N转换为L；

5.根据权利要求4所述的语音搜索装置，其特征在于，所述索引获取模块包括：

6.根据权利要求4所述的语音搜索装置，其特征在于，所述索引获取模块具体用于直接获取预存的联系人主索引与第二索引。