CN104469002A

CN104469002A - 确定手机联系人的方法和装置

Info

Publication number: CN104469002A
Application number: CN201410723164.7A
Authority: CN
Inventors: 孙平吉; 刘光宇; 李少红; 葛勇
Original assignee: iFlytek Co Ltd
Current assignee: iFlytek Co Ltd
Priority date: 2014-12-02
Filing date: 2014-12-02
Publication date: 2015-03-25

Abstract

本发明提出一种确定手机联系人的方法和装置，该确定手机联系人的方法包括接收要查找的联系人的语音信息；在预先建立的映射表中包括的联系人词条组中，判断是否存在与所述语音信息一致的联系人词条，所述映射表用于对应保存联系人的原始信息与联系人词条组，所述联系人词条组包括至少一个联系人词条，所述联系人词条是将对应的原始信息进行切词和组合后得到的；如果存在所述联系人词条，根据所述映射表确定与所述联系人词条对应的原始信息，并将所述原始信息确定为所述语音信息的识别结果。该方法能够提高语音识别联系人的成功率。

Description

确定手机联系人的方法和装置

技术领域

本发明涉及语音识别技术领域，尤其涉及一种确定手机联系人的方法和装置。

背景技术

手机联系人是指在手机中保存的进行通信的号码对应的信息，通常包含中文姓名，公司，称谓等信息。语音识别技术应用的范围越来越广泛，对手机联系人也可以采用语音识别。

现有技术中，当接收到语音输入的联系人信息时，将输入的语音信息与手机联系人中原始记录的信息进行比对，从而确定出语音输入的联系人。

但是，由于语言输入时常会以口语等方式进行输入，与原始记录的信息可能会不一致，这样就会降低识别成功率。

发明内容

本发明旨在至少在一定程度上解决相关技术中的技术问题之一。

为此，本发明的一个目的在于提出一种确定手机联系人的方法，该方法可以提高语音输入联系人的识别成功率。

本发明的另一个目的在于提出一种确定手机联系人的装置。

为达到上述目的，本发明第一方面实施例提出的确定手机联系人的方法，包括：接收要查找的联系人的语音信息；在预先建立的映射表中包括的联系人词条组中，判断是否存在与所述语音信息一致的联系人词条，所述映射表用于对应保存联系人的原始信息与联系人词条组，所述联系人词条组包括至少一个联系人词条，所述联系人词条是将对应的原始信息进行切词和组合后得到的；如果存在所述联系人词条，根据所述映射表确定与所述联系人词条对应的原始信息，并将所述原始信息确定为所述语音信息的识别结果。

本发明第一方面实施例提出的确定手机联系人的方法，通过在联系人词条组中查找语音信息，由于联系人词条组是将对应的原始信息进行切词和组合后得到的，可以扩大联系人信息的数量，增大语音信息匹配的概率，从而提高语音识别的成功率。

为达到上述目的，本发明第二方面实施例提出的确定手机联系人的装置，包括：接收模块，用于接收要查找的联系人的语音信息；查找模块，用于在预先建立的映射表中包括的联系人词条组中，判断是否存在与所述语音信息一致的联系人词条，所述映射表用于对应保存联系人的原始信息与联系人词条组，所述联系人词条组包括至少一个联系人词条，所述联系人词条是将对应的原始信息进行切词和组合后得到的；确定模块，用于如果存在所述联系人词条，根据所述映射表确定与所述联系人词条对应的原始信息，并将所述原始信息确定为所述语音信息的识别结果。

本发明第二方面实施例提出的确定手机联系人的装置，通过在联系人词条组中查找语音信息，由于联系人词条组是将对应的原始信息进行切词和组合后得到的，可以扩大联系人信息的数量，增大语音信息匹配的概率，从而提高语音识别的成功率。

本发明附加的方面和优点将在下面的描述中部分给出，部分将从下面的描述中变得明显，或通过本发明的实践了解到。

附图说明

本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解，其中：

图1是本发明一实施例提出的确定手机联系人的方法的流程示意图；

图2是本发明另一实施例提出的确定手机联系人的方法的流程示意图；

图3是本发明实施例中建立映射表的流程示意图；

图4是本发明实施例中更新特征词典的流程示意图；

图5是本发明另一实施例提出的确定手机联系人的装置的结构示意图；

图6是本发明另一实施例提出的确定手机联系人的装置的结构示意图。

具体实施方式

下面详细描述本发明的实施例，所述实施例的示例在附图中示出，其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的，仅用于解释本发明，而不能理解为对本发明的限制。相反，本发明的实施例包括落入所附加权利要求书的精神和内涵范围内的所有变化、修改和等同物。

图1是本发明一实施例提出的确定手机联系人的方法的流程示意图，该方法包括：

S11：接收要查找的联系人的语音信息。

本发明实施例以联系人是手机联系人为例。可以理解的是，本发明实施例的方法也可以应用到其他联系人识别方案中，例如邮件联系人等。

在语音输入时，用户通常会输入口语化的联系人信息，例如，用户在手机联系人中记录的原始信息可以是：“科大讯飞刘光宇”，但是，用户在进行语音输入时可能输入的是“刘光宇科大讯飞”。

S12：在预先建立的映射表中包括的联系人词条组中，判断是否存在与所述语音信息一致的联系人词条。

所述映射表用于对应保存联系人的原始信息与联系人词条组，所述联系人词条组包括至少一个联系人词条，所述联系人词条是将对应的原始信息进行切词和组合后得到的。

其中，如果按照目前直接比对的方式，在上述示例中就会识别失败。为了提高识别成功率，本实施例引入了联系人词条组，联系人词条组中包括至少一个联系人词条，通常，一个联系人词条组包括多个联系人词条。

例如，针对原始信息“科大讯飞刘光宇”，其对应的联系人词条组包括的联系人词条可以分别是：“科大讯飞刘光宇”，“刘光宇科大讯飞”，“科大讯飞的刘光宇”等。

由于联系人词条组可以扩大联系人信息，就可以增大匹配到语音信息的概率，从而可以提高识别成功率。

S13：如果存在所述联系人词条，根据所述映射表确定与所述联系人词条对应的原始信息，并将所述原始信息确定为所述语音信息的识别结果。

例如，联系人词条组中包括“刘光宇科大讯飞”，并根据映射表确定该词条对应的原始信息是“科大讯飞刘光宇”，因此将“科大讯飞刘光宇”确定为语音信息的识别结果。

在确定识别结果后，可以根据相应的命令对该识别结果进行操作，例如，语音操作的指令是“打电话给刘光宇科大讯飞”，之后在确定出原始信息是“科大讯飞刘光宇”后，可以向原始信息“科大讯飞刘光宇”对应的手机号拨打电话。

另一方面，如果不存在则识别失败。

本实施例通过在联系人词条组中查找语音信息，由于联系人词条组是将对应的原始信息进行切词和组合后得到的，可以扩大联系人信息的数量，增大语音信息匹配的概率，从而提高语音识别的成功率。

图2是本发明另一实施例提出的确定手机联系人的方法的流程示意图，该方法包括：

S21：建立映射表。

映射表可以由分词引擎建立，参见图3，分词引擎建立映射表的流程可以包括：

S31：加载特征词典。

特性词典用于保存属于所述特征词典对应的词性的分词。

具体的，可以对当前用户的联系人信息进行统计，根据出现频率按照从高到低的顺序选择预设个数的词性；从预先设置的可供选择的特征词典中，加载所述选择的词性对应的特征词典。

常用的词性类型如表1所示：

表1

编号	类型	编号	类型	编号	类型
						1	姓名	10	关系	19	符号
2	姓	11	职业	20	形容词
						3	公司	12	地点	21	品牌
4	职位	13	业务	22	产品
						5	地名	14	行业	23	英文名
6	部门	15	邮箱	24	字母
						7	昵称	16	号码	25	数字
8	称谓	17	联系终端	26	生活相关
						9	店名	18	运营商	27	其他

例如，可供选择的特征词典对应的词性包括上述27种词性，经过统计，当前用户的联系人信息出现频率较高的词性分别为姓名，公司，昵称，则可以选择对应姓名，公司，昵称的特征词典。以公司为例，对应词性为公司的特征词典包括的分词可以是：科大讯飞，百度，腾讯等。

S32：加载联系人的原始信息。

例如，原始信息是指记录在手机联系人中的信息，例如，联系人的姓名等。

S33：对原始信息进行预处理，得到预处理后的原始信息。

例如，预处理包括：繁体字转换，字母和符号的筛选等。

S34：对预处理后的原始信息进行词性判断及切词，得到原始信息对应的分词。

其中，可以根据特征词典进行词性判断及切词。

例如，对应词性是公司的特征词典中包括科大讯飞，而预处理后的原始信息是“科大讯飞刘光宇”，则可以得到分词“科大讯飞”及对应的词性是公司，类似的，对应姓名的特征词典中包括刘光宇，则还可以得到分词“刘光宇”及对应的词性是姓名。

需要说明的是，对应姓名的特征可以细分为4个词典，分别是：

第一特征词典，用于保存词性是姓的分词；

例如，第一特征词典中包括：李，张，王等。

第二特征词典，用于保存词性是名，且在所述名是单汉字组成的名时包括的分词；

例如，姓名是“张震”时，“张”是姓，可以包括在第一特征词典中，由于“震”是单汉字组成的名，则“震”可以包括在第二特征词典中。

第三特征词典，用于保存词性是名，且在所述名是双汉字组成的名时第一个汉字包括的分词；

第四特征词典，用于保存词性是名，且在所述名是双汉字组成名时第二个汉字包括的分词。

例如，姓名是“张建设”时，“张”是姓，可以包括在第一特征词典中，“建设”是双汉字组成的名，名中第一个汉字“建”可以包括在第三特征词典中，名中的第二个汉字“设”可以包括在第四特征词典中。

第二特征词典以及第三特征词典和第四特征词典可以区分单名和双名的姓名，。另外，通过对应双汉字组成的名建立两个特征词典，相对于将双汉字组成的名写在一个特征词典中的方式可以节省资源。

另一方面，采用的特征词典可以进行更新。

单个用户手机联系人名称中的词性特征分布，受用户知识水平，关系网络环境，国籍，工作类型等影响，会于统计结论有所偏差。为了增强对单个用户的手机联系人名称的分词效果，支持特征词典的动态更新。参见图4，更新流程可以包括：

S41：确定联系人分词。

初始时，可以根据初始配置的特征词典确定。

S42：由词性分析结果生成用户联系人姓名词性分布特征值。

S43：上传给服务端。

S44：服务端收集特征值，并下发特征词典更新内容。

S45：更新特征词典。

S46：重新初始化分词引擎。

S47：分词引擎在重新初始化后，采用更新后的特征词典重新确定联系人分词。

例如，对应一个用户，经过统计其大部分通话是中介的电话，则可以建立中介的特征词典。当然，可以理解的是，这种更新方式只是一种示例，还可以采用其他方式进行更新。

S35：对所述原始信息对应的分词进行拼接，得到所述原始信息对应的联系人词条组。

可以根据预先配置的拼接规则，进行分词拼接。

在进行说法拼接的时候，会根据词条组中包含的词条的词性，进行有针对性的组合。比如针对地名与人名进行“倒装重组”或者“词条+介词+词条”的组合；再比如针对语境特征，将“副主任”处理成“主任”等比较会出现在口语语境中的词条。

例如，拼接规则包括：姓名+公司，公司+姓名，公司+的+姓名，则可以拼接得到：“刘光宇科大讯飞”，“科大讯飞刘光宇”，“科大讯飞的刘光宇”。

拼接规则可以采用如下方式确定：

获取预先统计的组合方式所占的比例；

根据所述比例对所述组合方式进行排序；

在排序后的组合方式中选择预设个数的组合方式，确定为所述拼接规则。

例如，参见表2，排序后的各组合方式所占的比例：

表2

	比例
		姓名	65.26％
姓名+公司	5.95％
		姓名+公司+职位	3.17％
姓名+地名	2.13％
		姓名+地名+公司	2.11％
姓名+地名+公司+职位	1.66％
		姓名+公司+部门	1.44％
公司+姓名	1.41％
		昵称	1.17％
公司	0.77％

在排序后可以选择比例较高的几种组合方式作为拼接规则，例如，预设选择3种，则可以选择姓名+公司，姓名+公司+职位，姓名+地名这三种组合方式作为拼接规则。

在对应每个原始信息得到联系人词条组后，可以建立原始信息与联系人词条组的映射关系，并保存该映射关系得到映射表。

S22：接收要查找的联系人的语音信息。

S23：在预先建立的映射表中包括的联系人词条组中，判断是否存在与所述语音信息一致的联系人词条。

S24：如果存在所述联系人词条，根据所述映射表确定与所述联系人词条对应的原始信息，并将所述原始信息确定为所述语音信息的识别结果。

S22-S24的具体内容可以参见S11-S13，在此不再赘述。

本实施例通过在联系人词条组中查找语音信息，由于联系人词条组是将对应的原始信息进行切词和组合后得到的，可以扩大联系人信息的数量，增大语音信息匹配的概率，从而提高语音识别的成功率；本实施例通过根据不同姓名方式建立不同的特征词典，可以区分不同姓名方式并节省资源；本实施例通过获取各组合方式的统计结果，可以获取更合适的组合方式，为识别成功提供良好基础；本实施例通过特征词典更新，可以适应不同用户需求。

图5是本发明另一实施例提出的确定手机联系人的装置的结构示意图，该装置50包括接收模块51，查找模块52和确定模块53。

接收模块51用于接收要查找的联系人的语音信息；

查找模块52用于在预先建立的映射表中包括的联系人词条组中，判断是否存在与所述语音信息一致的联系人词条，所述映射表用于对应保存联系人的原始信息与联系人词条组，所述联系人词条组包括至少一个联系人词条，所述联系人词条是将对应的原始信息进行切词和组合后得到的；

确定模块53用于如果存在所述联系人词条，根据所述映射表确定与所述联系人词条对应的原始信息，并将所述原始信息确定为所述语音信息的识别结果。

另一方面，如果不存在则识别失败。

参见图6，该装置50还包括用于建立所述映射表的建立模块54，所述建立模块54具体用于：

加载预先设置的特征词典，所述特征词典用于保存属于所述特征词典对应的词性的分词；

加载联系人的原始信息；

对所述原始信息进行预处理，得到预处理后的原始信息；

根据所述特征词典对所述预处理后的原始信息进行词性判断及切词，得到原始信息对应的分词；

根据预先配置的拼接规则，对所述原始信息对应的分词进行拼接，得到所述原始信息对应的联系人词条组；

建立所述原始信息与所述联系人词条组的映射关系。

具体的建立映射表和流程可以参见图3的描述，在此不再赘述。

可选的，所述建立模块具体用于：

对当前用户的联系人信息进行统计，根据出现频率按照从高到低的顺序选择预设个数的词性；

从预先设置的可供选择的特征词典中，加载所述选择的词性对应的特征词典。

例如，可供选择的特征词典对应的词性包括表1所示的27种词性，经过统计，当前用户的联系人信息出现频率较高的词性分别为姓名，公司，昵称，则可以选择对应姓名，公司，昵称的特征词典。以公司为例，对应词性为公司的特征词典包括的分词可以是：科大讯飞，百度，腾讯等。

可选的，当所述选择的词性包括姓名词性时，所述特征词典包括对应姓名的特征词典，所述对应姓名的特征词典包括：

第一特征词典，用于保存词性是姓的分词；

例如，第一特征词典中包括：李，张，王等。

第四特征词典，用于保存词性是名，且在所述名是双汉字组成的名时第二个汉字包括的分词。

第二特征词典以及第三特征词典和第四特征词典可以区分单名和双名的姓名。另外，通过对应双汉字组成的名建立两个特征词典，相对于将双汉字组成的名写在一个特征词典中的方式可以节省资源。

可选的，所述建立模块54具体用于：

加载初始设置的特征词典；或者，

加载对初始设置的特征词典进行更新后得到的特征词典。

单个用户手机联系人名称中的词性特征分布，受用户知识水平，关系网络环境，国籍，工作类型等影响，会于统计结论有所偏差。为了增强对单个用户的手机联系人名称的分词效果，支持特征词典的动态更新。具体更新流程可以参见图4，在此不再赘述。

可选的，参见图6，该装置50还包括：用于获取所述拼接规则的获取模块55，所述获取模块55具体用于：

获取预先统计的组合方式所占的比例；

根据所述比例对所述组合方式进行排序；

可以根据预先配置的拼接规则，进行分词拼接。

例如，排序后的各组合方式所占的比例如表2所示，在排序后可以选择比例较高的几种组合方式作为拼接规则，例如，预设选择3种，则可以选择姓名+公司，姓名+公司+职位，姓名+地名这三种组合方式作为拼接规则。

需要说明的是，在本发明的描述中，术语“第一”、“第二”等仅用于描述目的，而不能理解为指示或暗示相对重要性。此外，在本发明的描述中，除非另有说明，“多个”的含义是两个或两个以上。

流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为，表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分，并且本发明的优选实施方式的范围包括另外的实现，其中可以不按所示出或讨论的顺序，包括根据所涉及的功能按基本同时的方式或按相反的顺序，来执行功能，这应被本发明的实施例所属技术领域的技术人员所理解。

应当理解，本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中，多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如，如果用硬件来实现，和在另一实施方式中一样，可用本领域公知的下列技术中的任一项或他们的组合来实现：具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路，具有合适的组合逻辑门电路的专用集成电路，可编程门阵列(PGA)，现场可编程门阵列(FPGA)等。

本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成，所述的程序可以存储于一种计算机可读存储介质中，该程序在执行时，包括方法实施例的步骤之一或其组合。

此外，在本发明各个实施例中的各功能单元可以集成在一个处理模块中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现，也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时，也可以存储在一个计算机可读取存储介质中。

上述提到的存储介质可以是只读存储器，磁盘或光盘等。

在本说明书的描述中，参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中，对上述术语的示意性表述不一定指的是相同的实施例或示例。而且，描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。

尽管上面已经示出和描述了本发明的实施例，可以理解的是，上述实施例是示例性的，不能理解为对本发明的限制，本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。

Claims

1.一种确定手机联系人的方法，其特征在于，包括：

接收要查找的联系人的语音信息；

在预先建立的映射表中包括的联系人词条组中，判断是否存在与所述语音信息一致的联系人词条，所述映射表用于对应保存联系人的原始信息与联系人词条组，所述联系人词条组包括至少一个联系人词条，所述联系人词条是将对应的原始信息进行切词和组合后得到的；

如果存在所述联系人词条，根据所述映射表确定与所述联系人词条对应的原始信息，并将所述原始信息确定为所述语音信息的识别结果。

2.根据权利要求1所述的方法，其特征在于，还包括：建立所述映射表，所述建立所述映射表包括：

加载联系人的原始信息；

对所述原始信息进行预处理，得到预处理后的原始信息；

建立所述原始信息与所述联系人词条组的映射关系。

3.根据权利要求2所述的方法，其特征在于，所述加载预先设置的特征词典，包括：

4.根据权利要求3所述的方法，其特征在于，当所述选择的词性包括姓名词性时，所述特征词典包括对应姓名的特征词典，所述对应姓名的特征词典包括：

第一特征词典，用于保存词性是姓的分词；

5.根据权利要求2所述的方法，其特征在于，所述加载预先设置的特征词典，包括：

加载初始设置的特征词典；或者，

加载对初始设置的特征词典进行更新后得到的特征词典。

6.根据权利要求2所述的方法，其特征在于，还包括获取所述拼接规则，所述获取所述拼接规则，包括：

获取预先统计的组合方式所占的比例；

根据所述比例对所述组合方式进行排序；

7.一种确定手机联系人的装置，其特征在于，包括：

接收模块，用于接收要查找的联系人的语音信息；

查找模块，用于在预先建立的映射表中包括的联系人词条组中，判断是否存在与所述语音信息一致的联系人词条，所述映射表用于对应保存联系人的原始信息与联系人词条组，所述联系人词条组包括至少一个联系人词条，所述联系人词条是将对应的原始信息进行切词和组合后得到的；

确定模块，用于如果存在所述联系人词条，根据所述映射表确定与所述联系人词条对应的原始信息，并将所述原始信息确定为所述语音信息的识别结果。

8.根据权利要求7所述的装置，其特征在于，还包括用于建立所述映射表的建立模块，所述建立模块具体用于：

加载联系人的原始信息；

对所述原始信息进行预处理，得到预处理后的原始信息；

建立所述原始信息与所述联系人词条组的映射关系。

9.根据权利要求8所述的装置，其特征在于，所述建立模块具体用于：

10.根据权利要求9所述的装置，其特征在于，当所述选择的词性包括姓名词性时，所述特征词典包括对应姓名的特征词典，所述对应姓名的特征词典包括：

第一特征词典，用于保存词性是姓的分词；

第四特征词典，用于保存词性是名，且在所述名是双汉字组成的名时第二个名包括的分词。

11.根据权利要求8所述的装置，其特征在于，所述建立模块具体用于：

加载初始设置的特征词典；或者，

加载对初始设置的特征词典进行更新后得到的特征词典。

12.根据权利要求8所述的装置，其特征在于，还包括：用于获取所述拼接规则的获取模块，所述获取模块具体用于：

获取预先统计的组合方式所占的比例；

根据所述比例对所述组合方式进行排序；