CN105187656B - 通讯录联系人匹配方法和装置 - Google Patents

通讯录联系人匹配方法和装置 Download PDF

Info

Publication number
CN105187656B
CN105187656B CN201510613491.1A CN201510613491A CN105187656B CN 105187656 B CN105187656 B CN 105187656B CN 201510613491 A CN201510613491 A CN 201510613491A CN 105187656 B CN105187656 B CN 105187656B
Authority
CN
China
Prior art keywords
sequence
converted
status switch
phone
similarity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201510613491.1A
Other languages
English (en)
Other versions
CN105187656A (zh
Inventor
穆向禹
彭守业
贾磊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201510613491.1A priority Critical patent/CN105187656B/zh
Publication of CN105187656A publication Critical patent/CN105187656A/zh
Application granted granted Critical
Publication of CN105187656B publication Critical patent/CN105187656B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Telephonic Communication Services (AREA)

Abstract

本发明公开了一种通讯录联系人匹配方法和装置,其中,通讯录联系人匹配方法包括:获取用户发送的语音信息,并将语音信息识别为文本信息;将文本信息转换为第一音子序列,并根据第一音子序列生成第一状态序列;获取通讯录中的多个联系人信息;分别将多个联系人信息转换为对应的第二音子序列,并根据第二音子序列生成第二状态序列;计算第一状态序列与多个第二状态序列的相似度,并根据相似度对多个第二状态序列进行排序,以及将排名前N名的第二状态序列对应的联系人信息反馈给用户。本发明实施例的通讯录联系人匹配方法和装置,提高了用户语音搜索联系人姓名的准确率。

Description

通讯录联系人匹配方法和装置
技术领域
本发明涉及移动终端技术领域,尤其涉及一种通讯录联系人匹配方法和装置。
背景技术
随着科技的不断进步,智能手机已成为人们生活中必不可少的工具,其中,语音识别是智能手机中的一个重要功能。例如:用户说出联系人姓名,即可搜索到通讯录中保存的该联系人对应的联系电话等信息,用户就能够方便快捷地对该联系人进行拨打电话、发短信等操作。
目前,主要通过将用户输入的语音信息转换为拼音字符串,然后与通讯录中保存的联系人姓名对应的字符串进行匹配,选择多个与拼音字符串相似度较高的字符串对应的联系人姓名作为候选,并提供给用户。
但是,上述方法没有考虑到联系人姓名的语言学特征,因此对通讯录中联系人姓名的语音搜索准确率较低。
发明内容
本发明旨在至少在一定程度上解决相关技术中的技术问题之一。为此,本发明的一个目的在于提出一种通讯录联系人匹配方法,该方法能够提高用户语音搜索联系人姓名的准确率。
本发明的第二个目的在于提出一种通讯录联系人匹配装置。
为了实现上述目的,本发明第一方面实施例提出了一种通讯录联系人匹配方法,包括:获取用户发送的语音信息,并将所述语音信息识别为文本信息;将所述文本信息转换为第一音子序列,并根据所述第一音子序列生成第一状态序列;获取通讯录中的多个联系人信息;分别将所述多个联系人信息转换为对应的第二音子序列,并根据所述第二音子序列生成第二状态序列;计算所述第一状态序列与所述多个第二状态序列的相似度,并根据所述相似度对所述多个第二状态序列进行排序,以及将排名前N名的所述第二状态序列对应的联系人信息反馈给所述用户。
本发明实施例的通讯录联系人匹配方法,通过将用户输入的语音信息和通讯录中保存的联系人信息基于声学模型分别转换为第一状态序列和第二状态序列,并计算两者之间的相似度,以及选择与第一状态序列相似度最高的N个第二状态序列,将上述第二状态序列对应的联系人信息反馈给用户,提高了用户语音搜索联系人姓名的准确率。
本发明第二方面实施例提出了一种通讯录联系人匹配装置,包括:第一获取模块,用于获取用户发送的语音信息,并将所述语音信息识别为文本信息;第一生成模块,用于将所述文本信息转换为第一音子序列,并根据所述第一音子序列生成第一状态序列;第二获取模块,用于获取通讯录中的多个联系人信息;第二生成模块,用于分别将所述多个联系人信息转换为对应的多个第二音子序列,并根据所述多个第二音子序列生成对应的多个第二状态序列;反馈模块,用于计算所述第一状态序列与所述多个第二状态序列的相似度,并根据所述相似度对所述多个第二状态序列进行排序,以及将排名前N名的所述第二状态序列对应的联系人信息反馈给所述用户。
本发明实施例的通讯录联系人匹配装置,通过将用户输入的语音信息和通讯录中保存的联系人信息基于声学模型分别转换为第一状态序列和第二状态序列,并计算两者之间的相似度,以及选择与第一状态序列相似度最高的N个第二状态序列,将上述第二状态序列对应的联系人信息反馈给用户,提高了用户语音搜索联系人姓名的准确率。
附图说明
图1是根据本发明一个实施例的通讯录联系人匹配方法的流程图。
图2是根据本发明一个实施例的通讯录联系人匹配装置的结构示意图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本发明,而不能理解为对本发明的限制。
下面参考附图描述本发明实施例的通讯录联系人匹配方法和装置。
图1是根据本发明一个实施例的通讯录联系人匹配方法的流程图。
如图1所示,通讯录联系人匹配方法可包括:
S1、获取用户发送的语音信息,并将语音信息识别为文本信息。
其中,语音信息可以是联系人姓名。例如:可将用户输入的联系人姓名转换为文本信息“张三丰”。
S2、将文本信息转换为第一音子序列,并根据第一音子序列生成第一状态序列。
在将语音信息识别为文本信息之后,可将文本信息转换为第一音子序列,然后将第一音子序列转换为三音子模型,并基于隐马尔可夫模型将三音子模型转换为第一状态序列。其中,第一音子序列为声母、韵母和声调的组合。
例如:可将文本信息“张三丰”转换为第一音子序列“sil zh ang1s an1feng1sil”,其中sil为静音音子。然后转换为6个三音子模型sil-zh+ang1、zh-ang1+s、ang1-s+an1、s-an1+f、an1-f+eng1、f-eng1+sil。再基于隐马尔可夫模型将三音子模型转换为第一状态序列,每个音子均可用对应的状态ID表示,例如:sil-zh+ang1表示为(789,12,34)。则第一状态序列为6*3个状态ID。
S3、获取通讯录中的多个联系人信息。
其中,联系人信息可包括联系人姓名。
S4、分别将多个联系人信息转换为对应的第二音子序列,并根据第二音子序列生成第二状态序列。
其中,每个联系人信息均可转换为一个对应的第二音子序列,而每个第二音子序列也均对应一个第二状态序列。具体方法与生成第一状态序列的方法一致,此处不赘述。
S5、计算第一状态序列与多个第二状态序列的相似度,并根据相似度对多个第二状态序列进行排序,以及将排名前N名的第二状态序列对应的联系人信息反馈给用户。
具体地,可计算第一状态序列与每个第二状态序列之间的编辑距离,并按照编辑距离从小到大的顺序对第二状态序列进行排序,然后获得与第一状态序列编辑距离最近的N个第二状态序列例如5个,并将上述第二状态序列对应的联系人信息作为候选结果反馈给用户。用户看到候选结果后,可选择自己所需的结果进行进一步操作,例如拨打电话、发短信等。其中,编辑距离为两个字串之间由一个转成另一个所需的最少编辑操作次数。编辑次数越少,两者相似度越高。
本发明实施例的通讯录联系人匹配方法,通过将用户输入的语音信息和通讯录中保存的联系人信息基于声学模型分别转换为第一状态序列和第二状态序列,并计算两者之间的相似度,以及选择与第一状态序列相似度最高的N个第二状态序列,将上述第二状态序列对应的联系人信息反馈给用户,提高了用户语音搜索联系人姓名的准确率。
为实现上述目的,本发明还提出一种通讯录联系人匹配装置。
图2是根据本发明一个实施例的通讯录联系人匹配装置的结构示意图。
如图2所示,通讯录联系人匹配装置可包括:第一获取模块110、第一生成模块120、第二获取模块130、第二生成模块140和反馈模块150。
第一获取模块110用于获取用户发送的语音信息,并将语音信息识别为文本信息。其中,语音信息可以是联系人姓名。例如:可将用户输入的联系人姓名转换为文本信息“张三丰”。
第一生成模块120用于将文本信息转换为第一音子序列,并根据第一音子序列生成第一状态序列。
在将语音信息识别为文本信息之后,第一生成模块120可将文本信息转换为第一音子序列,然后将第一音子序列转换为三音子模型,并基于隐马尔可夫模型将三音子模型转换为第一状态序列。其中,第一音子序列为声母、韵母和声调的组合。
例如:可将文本信息“张三丰”转换为第一音子序列“sil zh ang1 s an1 f eng1sil”,其中sil为静音音子。然后转换为6个三音子模型sil-zh+ang1、zh-ang1+s、ang1-s+an1、s-an1+f、an1-f+eng1、f-eng1+sil。再基于隐马尔可夫模型将三音子模型转换为第一状态序列,每个音子均可用对应的状态ID表示,例如:sil-zh+ang1表示为(789,12,34)。则第一状态序列为6*3个状态ID。
第二获取模块130用于获取通讯录中的多个联系人信息。
其中,联系人信息可包括联系人姓名。
第二生成模块140用于分别将多个联系人信息转换为对应的多个第二音子序列,并根据多个第二音子序列生成对应的多个第二状态序列。
其中,每个联系人信息均可转换为一个对应的第二音子序列,而每个第二音子序列也均对应一个第二状态序列。具体方法与生成第一状态序列的方法一致,此处不赘述。
反馈模块150用于计算第一状态序列与多个第二状态序列的相似度,并根据相似度对多个第二状态序列进行排序,以及将排名前N名的第二状态序列对应的联系人信息反馈给用户。
具体地,反馈模块150可计算第一状态序列与每个第二状态序列之间的编辑距离,并按照编辑距离从小到大的顺序对第二状态序列进行排序,然后获得与第一状态序列编辑距离最近的N个第二状态序列例如5个,并将上述第二状态序列对应的联系人信息作为候选结果反馈给用户。用户看到候选结果后,可选择自己所需的结果进行进一步操作,例如拨打电话、发短信等。其中,编辑距离为两个字串之间由一个转成另一个所需的最少编辑操作次数。编辑次数越少,两者相似度越高。
本发明实施例的通讯录联系人匹配装置,通过将用户输入的语音信息和通讯录中保存的联系人信息基于声学模型分别转换为第一状态序列和第二状态序列,并计算两者之间的相似度,以及选择与第一状态序列相似度最高的N个第二状态序列,将上述第二状态序列对应的联系人信息反馈给用户,提高了用户语音搜索联系人姓名的准确率。
在本发明的描述中,需要理解的是,术语“中心”、“纵向”、“横向”、“长度”、“宽度”、“厚度”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”“内”、“外”、“顺时针”、“逆时针”、“轴向”、“径向”、“周向”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本发明的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
在本发明中,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”、“固定”等术语应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或成一体;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通或两个元件的相互作用关系,除非另有明确的限定。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本发明中的具体含义。
在本发明中,除非另有明确的规定和限定,第一特征在第二特征“上”或“下”可以是第一和第二特征直接接触,或第一和第二特征通过中间媒介间接接触。而且,第一特征在第二特征“之上”、“上方”和“上面”可是第一特征在第二特征正上方或斜上方,或仅仅表示第一特征水平高度高于第二特征。第一特征在第二特征“之下”、“下方”和“下面”可以是第一特征在第二特征正下方或斜下方,或仅仅表示第一特征水平高度小于第二特征。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。

Claims (6)

1.一种通讯录联系人匹配方法,其特征在于,包括以下步骤:
获取用户发送的语音信息,并将所述语音信息识别为文本信息;
将所述文本信息转换为第一音子序列,并将所述第一音子序列转换为三音子模型,并基于隐马尔可夫模型将所述三音子模型转换为第一状态序列;
获取通讯录中的多个联系人信息;
分别将所述多个联系人信息转换为对应的多个第二音子序列,并将所述多个第二音子序列转换为对应的多个三音子模型,并基于隐马尔可夫模型将所述多个三音子模型转换为对应的多个第二状态序列;
计算所述第一状态序列与所述多个第二状态序列的相似度,并根据所述相似度对所述多个第二状态序列进行排序,以及将排名前N名的所述第二状态序列对应的联系人信息反馈给所述用户。
2.如权利要求1所述的方法,其特征在于,所述计算所述第一状态序列与所述多个第二状态序列的相似度,包括:
计算所述第一状态序列与每个所述第二状态序列之间的编辑距离。
3.如权利要求2所述的方法,其特征在于,所述根据所述相似度对所述多个第二状态序列进行排序,包括:
根据所述编辑距离从小到大的顺序对所述多个第二状态序列进行排序。
4.一种通讯录联系人匹配装置,其特征在于,包括:
第一获取模块,用于获取用户发送的语音信息,并将所述语音信息识别为文本信息;
第一生成模块,用于将所述文本信息转换为第一音子序列,并将所述第一音子序列转换为三音子模型,并基于隐马尔可夫模型将所述三音子模型转换为第一状态序列;
第二获取模块,用于获取通讯录中的多个联系人信息;
第二生成模块,用于分别将所述多个联系人信息转换为对应的多个第二音子序列,并将所述所个第二音子序列转换为对应的多个三音子模型,并基于隐马尔可夫模型将所述多个三音子模型转换为对应的多个第二状态序列;
反馈模块,用于计算所述第一状态序列与所述多个第二状态序列的相似度,并根据所述相似度对所述多个第二状态序列进行排序,以及将排名前N名的所述第二状态序列对应的联系人信息反馈给所述用户。
5.如权利要求4所述的装置,其特征在于,所述反馈模块中,计算所述第一状态序列与所述多个第二状态序列的相似度,具体用于:
计算所述第一状态序列与每个所述第二状态序列之间的编辑距离。
6.如权利要求5所述的装置,其特征在于,所述反馈模块中,根据所述相似度对所述多个第二状态序列进行排序,具体用于:
根据所述编辑距离从小到大的顺序对所述多个第二状态序列进行排序。
CN201510613491.1A 2015-09-23 2015-09-23 通讯录联系人匹配方法和装置 Active CN105187656B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510613491.1A CN105187656B (zh) 2015-09-23 2015-09-23 通讯录联系人匹配方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510613491.1A CN105187656B (zh) 2015-09-23 2015-09-23 通讯录联系人匹配方法和装置

Publications (2)

Publication Number Publication Date
CN105187656A CN105187656A (zh) 2015-12-23
CN105187656B true CN105187656B (zh) 2018-09-07

Family

ID=54909493

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510613491.1A Active CN105187656B (zh) 2015-09-23 2015-09-23 通讯录联系人匹配方法和装置

Country Status (1)

Country Link
CN (1) CN105187656B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107707745A (zh) * 2017-09-25 2018-02-16 百度在线网络技术(北京)有限公司 用于提取信息的方法和装置
CN109671436A (zh) * 2018-12-07 2019-04-23 陈包容 智能语音识别通讯录联系人人名的方法
CN110390015B (zh) * 2019-07-23 2022-03-22 中国工商银行股份有限公司 一种数据信息处理方法、装置及系统
CN111312226A (zh) * 2020-02-17 2020-06-19 出门问问信息科技有限公司 一种语音识别方法、设备及计算机可读存储介质
CN113470645B (zh) * 2021-06-30 2024-05-28 百度在线网络技术(北京)有限公司 呼叫处理的方法、装置、设备以及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103456297A (zh) * 2012-05-29 2013-12-18 中国移动通信集团公司 一种语音识别匹配的方法和设备
CN104469002A (zh) * 2014-12-02 2015-03-25 科大讯飞股份有限公司 确定手机联系人的方法和装置
CN104598527A (zh) * 2014-12-26 2015-05-06 盈世信息科技(北京)有限公司 一种语音搜索方法及装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9723118B2 (en) * 2012-12-06 2017-08-01 Blackberry Limited Method of identifying contacts for initiating a communication using speech recognition

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103456297A (zh) * 2012-05-29 2013-12-18 中国移动通信集团公司 一种语音识别匹配的方法和设备
CN104469002A (zh) * 2014-12-02 2015-03-25 科大讯飞股份有限公司 确定手机联系人的方法和装置
CN104598527A (zh) * 2014-12-26 2015-05-06 盈世信息科技(北京)有限公司 一种语音搜索方法及装置

Also Published As

Publication number Publication date
CN105187656A (zh) 2015-12-23

Similar Documents

Publication Publication Date Title
CN105187656B (zh) 通讯录联系人匹配方法和装置
US20220230374A1 (en) User interface for generating expressive content
US9640173B2 (en) System and method for intelligent language switching in automated text-to-speech systems
TWI509595B (zh) 用於名稱發音之系統與方法
KR101260087B1 (ko) 키패드를 이용하는 표음식 입력
EP1267326B1 (en) Artificial language generation
KR20090085376A (ko) 문자 메시지의 음성 합성을 이용한 서비스 방법 및 장치
CN102237088A (zh) 语音识别多信息文本获取装置及方法
CN106201424A (zh) 一种信息交互方法、装置及电子设备
WO2008065488A1 (en) Method, apparatus and computer program product for providing a language based interactive multimedia system
KR20050044399A (ko) 사전 데이터 압축 방법
KR20100109034A (ko) 문자 메시지 작성 방법 및 이를 이용한 휴대 단말기
CN107871503A (zh) 语音对话系统以及发声意图理解方法
KR100593757B1 (ko) 외국어 학습효율을 향상시키는 외국어 학습장치 및 이를이용한 온라인 외국어 학습시스템
CN103543929A (zh) 一种语音识别及输入方法和装置
KR101277313B1 (ko) 의사소통 보조 장치 및 방법
GB2376554A (en) Artificial language generation and evaluation
CN104635948B (zh) 一种输入方法与装置
EP2814211A1 (en) Method and device for displaying conversation information
CN109725798B (zh) 智能角色的切换方法及相关装置
JP2019087123A (ja) 複数種の対話を続けて実施可能な対話制御装置、プログラム及び方法
CN110931014A (zh) 基于正则匹配规则的语音识别方法及装置
JP2017010207A (ja) 話題継続願望判定装置、方法、及びプログラム
CN100354805C (zh) 手机智能日文输入法
KR100852946B1 (ko) 휴대단말기 등의 키패드어레이

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant