CN112527819A - 通讯录信息检索方法、装置、电子设备及存储介质 - Google Patents
通讯录信息检索方法、装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN112527819A CN112527819A CN202011423409.6A CN202011423409A CN112527819A CN 112527819 A CN112527819 A CN 112527819A CN 202011423409 A CN202011423409 A CN 202011423409A CN 112527819 A CN112527819 A CN 112527819A
- Authority
- CN
- China
- Prior art keywords
- candidate
- recall
- pinyin
- employee
- target
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 48
- 238000004590 computer program Methods 0.000 claims abstract description 12
- 238000001914 filtration Methods 0.000 claims description 20
- 239000000126 substance Substances 0.000 claims description 2
- 238000012545 processing Methods 0.000 description 23
- 238000004891 communication Methods 0.000 description 8
- 230000006870 function Effects 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 238000012216 screening Methods 0.000 description 4
- 230000004931 aggregating effect Effects 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 239000000243 solution Substances 0.000 description 3
- 239000007983 Tris buffer Substances 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 230000000717 retained effect Effects 0.000 description 2
- 238000003491 array Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000001953 sensory effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/22—Indexing; Data structures therefor; Storage structures
- G06F16/2228—Indexing structures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2457—Query processing with adaptation to user needs
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- Document Processing Apparatus (AREA)
Abstract
本公开提供了一种通讯录信息检索方法、装置、电子设备、存储介质及计算机程序产品,涉及智能检索、智能推荐等领域。具体实现方案为:基于搜索词从通讯录中获取K个候选召回结果;其中,K为大于等于1的整数;基于所述搜索词以及所述K个候选召回结果分别包含的候选员工的姓名的目标拼音组合,从所述K个候选召回结果中确定N个目标召回结果;其中,N为大于等于1且小于等于K的整数;将所述N个目标召回结果分别包含的目标员工的相关信息作为与所述搜索词对应的通讯录信息检索结果。
Description
技术领域
本公开涉及计算机技术领域。本公开尤其涉及智能检索、智能推荐领域。
背景技术
在信息检索技术中,用户经常需要通过姓名或者姓名拼音进行通讯录检索,即存在大量通过姓名或姓名拼音检索到目标结果的需求。现有技术中通讯录进行检索,需要基于用户输入的搜索词召回相关的结果,但是,现有技术的处理中,经常出现召回结果的数量较大以及召回结果的精确率不高的问题。
发明内容
本公开提供了一种通讯录信息检索方法、装置、电子设备、存储介质及计算机程序产品。
根据本公开的一方面,提供了一种通讯录信息检索方法,包括:
基于搜索词从通讯录中获取K个候选召回结果;其中,K为大于等于1的整数;
基于所述搜索词以及所述K个候选召回结果分别包含的候选员工的姓名的目标拼音组合,从所述K个候选召回结果中确定N个目标召回结果;其中,N为大于等于1且小于等于K的整数;
将所述N个目标召回结果分别包含的目标员工的相关信息作为与所述搜索词对应的通讯录信息检索结果。
根据本公开的另一方面,提供了一种通讯录信息检索装置,包括:
召回模块,用于基于搜索词从通讯录中获取K个候选召回结果;其中,K为大于等于1的整数;
过滤模块,用于基于所述搜索词以及所述K个候选召回结果分别包含的候选员工的姓名的目标拼音组合,从所述K个候选召回结果中确定N个目标召回结果;其中,N为大于等于1且小于等于K的整数;
检索结果确定模块,用于将所述N个目标召回结果分别包含的目标员工的相关信息作为与所述搜索词对应的通讯录信息检索结果。
根据本公开的另一方面,提供了一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述方法。
根据本公开的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,该计算机指令用于使计算机执行本公开任一实施例中的方法。
根据本公开的另一方面,提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现本公开任一实施例中的方法。
采用本公开的技术方案,基于搜索词从通讯录中召回K个候选召回结果,再结合所述K个候选召回结果中分别包含的候选员工的姓名的目标拼音组合对所述K个候选召回结果进行过滤,最终得到N个目标召回结果作为搜索词所对应的通讯录信息检索结果。如此,可以结合姓名的目标拼音组合从候选召回结果中进行筛选,以减少最终的召回结果的数量的同时还可以保证召回结果的准确率。
应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
附图用于更好地理解本方案,不构成对本公开的限定。其中:
图1是根据本公开实施例的通讯录信息检索方法流程示意图;
图2是根据本公开实施例的获取相关特征的处理流程示意图;
图3是根据本公开实施例的通讯录信息检索方法的示例性流程图;
图4是根据本公开实施例的通讯录信息检索装置组成结构示意图;
图5是用来实现本公开实施例的电子设备的框图。
具体实施方式
以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
本公开实施例提供了一种通讯录信息检索方法,如图1所示,包括:
S101:基于搜索词,从通讯录中获取K个候选召回结果;其中,K为大于等于1的整数;
S102:基于所述搜索词以及所述K个候选召回结果分别包含的候选员工的姓名的目标拼音组合,从所述K个候选召回结果中确定N个目标召回结果;其中,N为大于等于1且小于等于K的整数;
S103:将所述N个目标召回结果分别包含的目标员工的相关信息作为与所述搜索词对应的通讯录信息检索结果。
本实施例可以应用于电子设备,比如,可以是智能手机、平板电脑、个人电脑等设备。
上述搜索词可以为以下之一:中文搜索词;英文字符搜索词;由中文字符以及英文字符组成的搜索词。分别来说,所述中文搜索词,指的是所述搜索词中仅包含有一个或多个中文字符的搜索词。所述英文字符搜索词,指的是所述搜索词中仅包含一个或多个英文字符的搜索词。所述中文字符子搜索词以及英文字符子搜索词所组成的搜索词,指的是:所述搜索词中可以包括一个或多个中文字符、以及一个或多个英文字符。
上述搜索词可以为用户输入的搜索词。这里,用户输入所述搜索词的一种示例可以为:用户在点击电子设备中的通讯录信息检索功能、或在所述电子设备开启通讯录信息检索页面、或在所述电子设备打开通讯录信息检索软件的情况下,在所述电子设备的显示界面中展示搜索词输入框,用户可以在所述显示界面的所述搜索词输入框中输入所述搜索词。
上述基于所述搜索词从通讯录中获取K个候选召回结果,可以包括:基于所述搜索词以及所述通讯录中包含的M个员工分别对应的中文索引或英文字符索引,从所述M个员工中选取K个员工作为K个候选员工,将该K个候选员工及其对应的相关信息作为所述K个候选召回结果。
上述通讯录中可以包括有当前企业的全部员工的相关信息,本实施例中将通讯录中包含的全部员工的数量表示为M,M可以为大于等于1的整数,比如可以为100、1000等等。其中,所述当前企业可以为使用本实施例提供的方案的任意一个企业或单位。
所述通讯录中包含的所述M个员工中,每一个员工对应的中文索引或英文字符索引可以为:基于所述每一个员工的相关信息,生成所述每一个员工的至少一个中文索引和/或至少一个英文字符索引。
所述每一个员工的相关信息,可以指的是:所述每一个员工的一个或多个相关信息。比如,某一个员工的一个或多个相关信息可以包括有员工的姓名、电话、备注信息、邮箱等等。
需要理解的是,本实施例中示例性的基于上述每一个员工的一个或多个相关信息生成对应的中文索引和/或英文字符索引。但是,实际处理中,所述每一个员工的还可以包括有其他相关信息,比如员工的唯一编码、职位、部门等等;所述员工的唯一编码可以是员工在所述当前企业内的唯一编号、又或者可以是员工的身份证号、护照号等等,这里不做穷举。
其中,所述每一个员工的至少一个中文索引和/或至少一个英文字符索引,可以包括以下至少一种:
所述每一个员工的姓名对应的至少一个中文索引;
所述每一个员工的姓名中的至少一个中文转换得到拼音所对应的至少一个英文字符索引;
所述每一个员工的备注信息所对应的至少一个中文索引;
所述每一个员工的邮箱所对应的至少一个英文字符索引。
需要理解的是,所述每一个员工的相关信息还可以包括有电话等内容,相应的,所述每一个员工还可以对应一个或多个数字索引,只是本实施例中不对每一个员工的全部索引类型进行穷举。
在得到所述K个候选召回结果之后,还可以结合所述K个候选召回结果中每一个候选召回结果中的所述候选员工的姓名的目标拼音组合,对所述K个候选召回结果进行过滤,最终得到所述N个目标召回结果,将所述N个目标召回结果作为与所述搜索词对应的通讯录信息检索结果;再将与所述搜索词对应的通讯录信息检索结果进行展示。相应的,用户可以通过所述电子设备的所述显示界面中查看到所述通讯录信息检索结果。
其中,所述候选员工的姓名的目标拼音组合,可以为所述候选员工的姓名的精准拼音组合。举例来说,所述候选员工的姓名中可能包含有多音字,比如“朝”可以为发音为“zhao”或者“chao”,所述精准拼音组合可以为所述候选员工的姓名中所使用的发音;还有一种情况,可能当前企业内,全部M个员工中,有的员工的姓名为“zhao”的发音,有的员工的姓名为“chao”的发音,则所述精准拼音组合中可以包含上述两种发音。
本实施例提供的方案,可以基于搜索词从通讯录中召回K个候选召回结果,再结合所述K个候选召回结果中分别包含的候选员工的姓名的目标拼音组合对所述K个候选召回结果进行过滤,最终得到N个目标召回结果作为搜索词所对应的通讯录信息检索结果。如此,可以结合姓名的目标拼音组合从候选召回结果中进一步进行筛选,以减少召回结果的数量的同时还可以保证召回结果的准确率。
对当前企业(或某一企业)内部的通讯录进行检索的场景中,用户可能基于某一个员工的相关信息(或相关字段)来进行通讯录信息检索,因此,预先需要明确员工的一个或多个相关信息需要预先构建中文索引和/或英文字符索引,并且明确需要预先构建中文索引和/或英文字符索引的每个相关信息的构建方式,以及哪些相关信息需要支持英文字符搜索词的召回,也就是基于拼音的召回。基于此,本实施例中将每一个员工需要进行中文索引和/或英文字符索引构建的相关信息,设置为以下多种至少之一:员工的姓名、员工的备注信息、员工的邮箱和员工的电话号码。
分别来说,所述员工的姓名需要具备中文索引,以及英文字符索引,其中,所述中文索引的数量可以是一个或多个;所述英文字符索引的数量也可以为一个或多个。这里,所述一个或多个所述英文字符索引可以为基于员工的姓名所对应的拼音组合确定的。
具体的,所述员工的姓名的中文索引为支持Ngram(N元模型)检索的一个或多个中文索引。例如:员工的姓名为“一二三”,相应的中文索引分别为“一”、“二”、“三”、“一二”、“二三”、“一二三”6种。所述员工的姓名的英文字符索引也为支持Ngram检索的一个或多个英文字符索引,比如员工的姓名为“张三”,其完整的拼音组合为“zhangsan”,其可以对应的英文字符索引为“zhangsan”、“zhangs”、“zhang”、“gsan”、“zhan”等等,不对其进行穷举。
需要理解,仅有员工的姓名支持基于拼音生成对应的英文字符索引,并基于拼音生成的所述英文字符索引进行召回的处理。
所述员工的备注信息对应的为支持Ngram检索的一个或多个中文索引。
所述员工的邮箱为支持前缀(Front)Ngram检索,相应的,其对应的可以为英文字符索引;例如:员工B的邮箱为zhangsan@baidu.com,其对应的英文字符索引可以包括为“z”、“zh”、“zha”、“zhan”、“zhang”、“zhangs”、“zhangsa”、“zhangsan”。
所述员工的电话号码字段需要支持FrontNgram检索,相应的,其对应的可以为数字索引,这里不对其进行穷举。
基于以上处理可以预先为所述通讯录包含的M个员工中的每一个员工确定对应的中文索引以及英文字符索引;在此基础上,所述基于搜索词从通讯录中获取K个候选召回结果,包括:在所述搜索词与所述通讯录中包含的M个员工中的第i个员工所对应的中文索引以及英文字符索引中之一匹配的情况下,将所述第i个员工作为第j个候选员工;将所述第j个候选员工的相关信息作为第j个候选召回结果;其中,M为大于等于1的整数,i为大于等于1且小于等于M的整数,j为大于等于1且小于等于K的整数。
上述第i个员工可以为所述通讯录中的任意一个员工,由于在基于搜索词进行候选召回结果的确定的处理中,针对所述通讯录中的M个员工中每一个员工的处理相同,因此不做一一赘述。
所述搜索词与所述通讯录中包含的M个员工中的第i个员工所对应的中文索引以及英文字符索引中之一匹配,为:所述搜索词与所述通讯录中包含的M个员工中的第i个员工所对应的中文索引以及英文字符索引中之一完全相同。
也就是说,在用户输入所述搜索词的情况下,基于所述搜索词与所述M个员工中的每一个员工对应的中文索引和/或英文字符索引进行匹配;当所述M个员工中的任意一个员工的中文索引以及英文字符索引中之一与所述搜索词相同的情况下,将该员工作为候选员工,将该候选员工的相关信息作为一个候选召回结果。
还需要指出的是,上述搜索词可以为以下之一:中文搜索词;英文字符搜索词;中文字符子搜索词以及英文字符子搜索词所组成的搜索词。
分别来说,所述中文搜索词,指的是所述搜索词中仅包含有一个或多个中文字符的搜索词;比如,张三、李四等等。
所述英文字符搜索词,指的是所述搜索词中仅包含一个或多个英文字符的搜索词。比如,所述英文字符搜索词可以是:zhang、wang、zhangsan、zhangs等等。
所述由中文字符以及英文字符组成的搜索词,指的是:所述搜索词中可以包括一个或多个中文字符、以及一个或多个英文字符。比如,zhang三,张x、zhang三s等等。
相应的,在所述搜索词为中文搜索词的情况下,将所述中文搜索词与所述通讯录中包含的M个员工中的第i个员工所对应的中文索引进行比对;在所述中文搜索词与所述第i个员工所对应的中文索引中任意之一匹配的情况下,将所述第i个员工作为第j个候选员工。还需要指出,在所述搜索词为中文搜索词的情况下,还可以将所述中文搜索词转换为拼音组合得到所述中文搜索词所对应的拼音组合搜索词,基于所述拼音组合搜索词与所述通讯录中包含的M个员工中的第i个员工所对应的英文字符索引进行比对;在所述拼音组合搜索词与所述第i个员工所对应的英文字符索引中任意之一匹配的情况下,将所述第i个员工作为第j个候选员工。
在所述搜索词为英文字符搜索词的情况下,将所述英文字符搜索词与所述通讯录中包含的M个员工中的第i个员工所对应的英文字符索引进行比对;在所述英文字符搜索词与所述第i个员工所对应的英文字符索引中任意之一匹配的情况下,将所述第i个员工作为第j个候选员工。
在所述搜索词为由中文字符以及英文字符组成的搜索词的情况下,将所述中文字符以及英文字符所组成的搜索词与所述通讯录中包含的M个员工中的第i个员工所对应的中文索引以及英文字符索引进行比对;在所述中文字符子搜索词以及英文字符子搜索词所组成的搜索词与所述第i个员工所对应的中文索引以及英文字符索引中任意之一匹配的情况下,将所述第i个员工作为第j个候选员工。
需要指出的是,上述搜索词还可以预先进行处理,具体包括:对所述搜索词中的标点、空白符号进行删除。
一种示例中,可以预先在企业级搜索应用服务器(Solr)内对任意一个企业的通讯录中包含的M个员工分别构建中文索引以及英文字符索引;并使用所述Solr支持的检索功能,对所述通讯录中包含的M个员工分别对应的至少一个相关信息所对应的中文索引和/或英文字符索引进行检索。在用户输入搜索词时,对搜索词中包含的全部内容在去除标点和空白符的情况下,与所述通讯录中包含的所述M个员工中的每一个员工的上述任一个中文索引以及英文字符索引进行匹配,最终得到K个候选员工,基于所述K个候选员工分别对应的相关信息确定所述K个候选召回结果。
如此,就可以在基于搜索词以及通讯录中包含的M个员工中的每一个员工所对应的英文字符索引,即拼音生成的英文字符索引,确定K个候选召回结果。这样,可以使得所述通讯录信息检索支持中文字符的召回以及英文字符召回,并且由于英文字符索引中的一部分为基于员工的姓名的拼音生成的,因此可以在不确定员工的姓名的中文的情况下,基于拼音对员工进行召回,提升了通讯录信息检索的场景适应性。
在得到上述K个候选召回结果之后,可以进一步对所述K个候选召回结果进行过滤,下面根据所述搜索词的不同情况,分别进行具体说明:
第一种情况,所述搜索词为中文搜索词;
所述基于所述搜索词以及所述K个候选召回结果分别包含的候选员工的姓名的目标拼音组合,从所述K个候选召回结果中确定N个目标召回结果,包括:
在所述K个候选召回结果中的第q个候选召回结果包含的候选员工的相关信息与所述中文搜索词不匹配的情况下,若所述中文搜索词所对应的拼音组合以及所述第q个候选召回结果包含的候选员工的姓名所对应的目标拼音组合匹配,则将所述第q个候选召回结果作为所述N个目标召回结果中之一;q为大于等于1且小于等于K的整数。
所述中文搜索词中可以包括一个或多个中文字符。
这种情况中,在所述搜索词为中文搜索词的情况下,判断所述K个候选召回结果中的第q个候选召回结果包含的候选员工的相关信息与所述中文搜索词是否匹配;
若匹配,则所述第q个候选召回结果为精准命中的候选召回结果,将该第q个候选召回结果作为所述N个目标召回结果中之一;
若不匹配,则进一步判断所述中文搜索词所对应的拼音组合以及所述第q个候选召回结果包含的候选员工的姓名所对应的目标拼音组合是否匹配;
若所述中文搜索词所对应的拼音组合以及所述第q个候选召回结果包含的候选员工的姓名所对应的目标拼音组合匹配,则将所述第q个候选召回结果作为所述N个目标召回结果中之一;否则,删除所述第q个候选召回结果。
需要指出的是,所述第q个候选召回结果为所述K个候选召回结果中任意之一,也就是说,针对所述K个候选召回结果均采用相同的方式进行判断,只是不做一一赘述。
具体来说,在所述搜索词为中文搜索词的情况下,在所述K个候选召回结果中的每一个候选召回结果中还包括有以第一标示方式标示的一个或多个中文字符。示例性的,所述第一标示方式可以为高亮。也就是说,所述每一个候选召回结果中包含有高亮的一个或多个中文字符。这里,由于候选召回结果中包含候选员工的一个或多个相关信息,因此,所述高亮的一个或多个中文字符,可以是所述候选员工的一个或多个相关信息中的高亮的一个或多个中文字符。
所述判断所述K个候选召回结果中的第q个候选召回结果包含的候选员工的相关信息与所述中文搜索词是否匹配,可以包括:判断所述第q个候选召回结果中以第一标示方式标示的一个或多个中文字符是否包含所述中文搜索词的全部中文字符。也就是,判断所述第q个候选召回结果中高亮的一个或多个中文字符是否包含所述中文搜索词的全部中文字符。
在所述第q个候选召回结果非精准命中的情况下,所述判断所述中文搜索词所对应的拼音组合以及所述第q个候选召回结果包含的候选员工的姓名所对应的目标拼音组合是否匹配包括:
基于所述K个候选召回结果中的所述第q个候选召回结果包含的候选员工的姓名确定目标拼音组合,判断该候选员工的姓名所对应的目标拼音组合与所述中文搜索词所对应的拼音组合是否相同,若相同,则确定所述第q个候选召回结果为模糊命中,将所述第q个候选召回结果作为所述N个目标召回结果中之一;否则,确定所述第q个候选召回结果为错误命中,删除所述第q个候选召回结果。
示例性的,当用户输入中文搜索词时,会基于该中文搜索词召回K个候选召回结果;针对所述K个候选召回结果中的每一个候选召回结果均可以进行以下处理,为了方便说明,将所述K个候选召回结果中的任意一个候选结果称为第q个候选召回结果进行示例性说明:
首先需要判断该第q个候选召回结果包含的候选员工的相关信息的高亮的情况,如果该第q个候选召回结果包含的候选员工的姓名(中文姓名)和/或备注信息的高亮的中文与用户输入的所述中文搜索词不匹配,则排除精准命中;否则为精准命中,该第q个候选召回结果作为目标召回结果。
在此基础上,需要区分该第q个候选召回结果为模糊命中或错误命中的情况。这里,该第q个候选召回结果包含的候选员工的姓名,需要从姓名拼音词典中获取到对应的目标拼音组合(也就是姓名对应的精准拼音)。另外,还需要根据中文常用音词典确定所述中文搜索词对应的拼音组合。这里,根据中文常用音词典确定所述中文搜索词对应的拼音组合的处理,可以是在排除精准命中情况之后执行的。
若所述中文搜索词中的中文为非多音字,且所述中文搜索词对应的拼音组合匹配不到该第q个候选召回结果中候选员工的姓名的目标拼音组合,则该第q个候选召回结果为错误命中需要删除,否则该第q个候选召回结果为模糊命中作为目标召回结果。
若所述中文搜索词中的中文中存在多音字,则在基于所述中文搜索词所对应的多组拼音组合均匹配不到该第q个候选召回结果中的候选员工的姓名的目标拼音组合的情况下,确定该第q个候选召回结果为错误命中,否则为模糊命中作为目标召回结果。
还需要指出的是,所述中文搜索词中的中文中存在多音字的情况下,可以根据中文常用音词典,将所述中文搜索词中的多音字转为多个拼音,进而生成所述中文搜索词所对应的多组拼音组合进行上述处理。
上述示例中,将全部召回的所述K个候选召回结果分为三类,如前述示例,分别为:精准命中、模糊命中和错误命中。其中,所述模糊命中指的是,候选员工的相关信息与搜索词不匹配的情况下,基于拼音或常用多音字召回的候选召回结果;所述错误命中指的是,基于生僻多音字或非姓名的正常读音召回的候选召回结果;其他情况的候选召回结果均为精准命中。
其中,除了精准命中的候选召回结果之外,模糊命中的候选召回结果会根据处理确定保留使用或过滤,而错误命中的候选召回结果均会被直接过滤。
在遍历完全部K个候选召回结果之后,可以得到每一个候选召回结果的命中情况,最终得到过滤后的N个目标召回结果。将所述N个目标召回结果作为本次输入的所述搜索词所对应的通讯录信息检索结果在电子设备的显示界面中展示给用户,以便用户进行后续操作,关于用户的后续操作,可以是从N个目标召回结果中确定本次检索想要找到的目标人物,并进行联系,或者查找目标人物的其他信息等等,不对其进行穷举。
还需要指出,在所述搜索词为中文搜索词的情况下,还可以将所述中文搜索词转换为拼音组合得到所述中文搜索词所对应的拼音组合搜索词;相应的,所述K个候选召回结果中,还可能会存在一部分候选召回结果为基于所述中文搜索词所对应的拼音组合搜索词召回的。这种情况下,所述K个候选召回结果中的第q个候选召回结果,还可以先判断该第q个候选召回结果包含的候选员工的相关信息的高亮的情况,如果该第q个候选召回结果包含的高亮的部分为除了候选员工的姓名(中文姓名)和/或备注信息之外的相关信息,则可以确定所述第q个候选召回结果为精准命中,作为目标召回结果中之一;
如果该第q个候选召回结果包含的高亮的部分为候选员工的姓名(中文姓名)和/或备注信息,则进一步判断该第q个候选召回结果包含的高亮的部分是否为候选员工的姓名(中文姓名)和/或备注信息中的中文字符;
若不是中文字符,则可以认为所述中文搜索词所对应的拼音组合搜索词命中了该第q个候选召回结果包含的高亮的部分为候选员工的姓名(中文姓名)和/或备注信息中的其他字符(比如英文字符等),则可以确定所述第q个候选召回结果为精准命中,作为目标召回结果中之一;
若是中文字符,则可以进一步判断所述第q个候选召回结果中高亮的一个或多个中文字符是否包含所述中文搜索词的全部中文字符,后续的处理与前述实施例相同,不做重复说明。
可见,通过采用上述处理,可以在搜索词为中文搜索词的情况下,基于中文搜索词的拼音组合,以及候选召回结果包含的候选员工的姓名所对应的目标拼音组合也就是精准拼音进行匹配,从而可以过滤掉一部分候选召回结果,保留剩余的候选召回结果作为最终的目标召回结果。如此,可以在减少最终的目标召回结果的数量的基础上,还保证了目标召回结果的准确率。
第二种情况,所述搜索词为英文字符搜索词;
所述基于所述搜索词以及所述K个候选召回结果分别包含的候选员工的姓名的目标拼音组合,从所述K个候选召回结果中确定N个目标召回结果,包括:
在所述K个候选召回结果中的第p个候选召回结果与所述英文字符搜索词不匹配的情况下,若所述英文字符搜索词以及所述第p个候选召回结果包含的候选员工的姓名所对应的目标拼音组合匹配,则将所述第p个候选召回结果作为所述N个目标召回结果中之一;其中p为大于等于1且小于等于K的整数。
所述英文字符搜索词中包括:一个或多个英文字符。
所述方法还包括:在所述K个候选召回结果中的第p个候选召回结果包含的候选员工的除姓名之外的字段与所述英文字符搜索词匹配的情况下,将所述第p个候选召回结果作为所述目标召回结果;其中p为大于等于1且小于等于K的整数。
也就是说,在所述K个候选召回结果中的第p个候选召回结果中,除了所述候选员工的姓名之外的其他相关信息包含以第一标示方式标示的英文字符情况下,则第p个候选召回结果为精准命中;否则,需要进行后续判断。
具体的,在所述K个候选召回结果中的第p个候选召回结果中,除了所述候选员工的姓名之外的其他相关信息中包含的以第一标示方式标示的英文字符包含所述英文字符搜索词中的全部英文字符的情况下,第p个候选召回结果为精准命中。这里,所述第一标示方式可以为高亮,其说明与前述实施例相同,不做赘述。
若所述K个候选召回结果中的第p个候选召回结果是单独通过姓名的拼音所构成的英文字符索引召回的,则需要分析所述英文字符搜索词能否匹配到所述第p个候选召回结果包含的候选员工的姓名的目标拼音组合(也就是精准拼音),包含全命中或部分命中均为匹配,将所述第p个候选召回结果作为N个目标召回结果中之一;若不能匹配,则所述第p个候选召回结果为错误命中,需要把所述第p个候选召回结果过滤删除。
在遍历完全部K个候选召回结果之后,可以得到每一个候选召回结果的命中情况,最终得到过滤后的N个目标召回结果。将所述N个目标召回结果作为本次输入的所述搜索词所对应的通讯录信息检索结果在电子设备的显示界面中展示给用户,以便用户进行后续操作,关于用户的后续操作,可以是从N个目标召回结果中确定本次检索想要找到的目标人物,并进行联系,或者查找目标人物的其他信息等等,不对其进行穷举。
可见,通过采用上述方案,就可以在搜索词为英文字符搜索词的情况下,基于英文字符搜索词,以及候选召回结果包含的候选员工的姓名的目标拼音组合,确定最终的目标召回结果,从而可以过滤掉一部分候选召回结果。如此,可以在减少最终的目标召回结果的数量的基础上,还保证了目标召回结果的准确率。
第三种情况,所述搜索词为由中文字符以及英文字符组成的搜索词。其中,所述中文字符的数量可以是一个或多个,所述英文字符的数量也可以为一个或多个。
所述方法还包括以下之一:
将所述搜索词中的中文字符转换为对应的拼音组合,将所述中文字符所对应的所述拼音组合与所述搜索词中的所述英文字符进行拼接,得到所述搜索词所对应的第一英文搜索词;
将所述搜索词中的中文字符转换为对应的拼音组合,将所述中文字符所对应的所述拼音组合作为所述搜索词所对应的第二英文搜索词。
也就是说,这种情况下,在对K个候选召回结果进行过滤的处理中,需要将搜索词中包含的中文字符进行转换得到对应的拼音组合,在不同的匹配情况下,可以基于中文字符对应的拼音组合直接进行后续筛选过滤,或者采用中文字符所对应的拼音组合以及英文字符连接后得到的英文进行后续筛选过滤。如此,可以适用于不同的候选召回结果进行筛选以及过滤,从而保证了过滤以及筛选的准确性。
所述基于所述搜索词以及所述K个候选召回结果分别包含的候选员工的姓名的目标拼音组合,从所述K个候选召回结果中确定N个目标召回结果,包括:
在所述搜索词中的所述中文字符与所述K个候选召回结果中的第h个候选召回结果包含的候选员工的姓名或备注信息匹配的情况下,若所述第一英文搜索词与所述第h个候选召回结果中的所述候选员工的姓名的所述目标拼音组合匹配,则将所述第h个候选召回结果作为所述N个目标召回结果中之一;其中,h为大于等于1且小于等于K的整数;
在所述搜索词中的所述中文字符与所述K个候选召回结果中的所述第h个候选召回结果包含的候选员工的姓名以及备注信息不匹配的情况下,若所述第二英文搜索词与所述第h个候选召回结果中的所述候选员工的姓名的所述目标拼音组合匹配,则将所述第h个候选召回结果作为所述N个目标召回结果中之一。
具体来说,在所述搜索词为中文字符英文字符混合的情况下,在得到所述K个候选召回结果后,可以进行两个阶段的判断:
首先,判断所述搜索词中的中文字符与所述K个候选召回结果中的第h个候选召回结果的候选员工的姓名、或者与所述候选员工的备注信息是否匹配;这里,所述是否匹配指的是:所述搜索词的所述中文字符是否完全出现在所述第h个候选召回结果包含的候选员工的姓名中和/或完全出现在候选员工的备注信息中。
其中,判断所述搜索词中的中文字符与所述K个候选召回结果中的第h个候选召回结果的候选员工的姓名、或者与所述候选员工的备注信息是否匹配,可以是根据所述第h个候选召回结果包含的候选员工的姓名中和/或候选员工的备注信息中以第一标示方式标示的中文字符中是否完全包含所述搜索词中的中文字符。其中,第一标示方式可以是高亮的方式,与前述实施例相同,不做赘述。
若所述搜索词中的中文字符与所述K个候选召回结果中的第h个候选召回结果的候选员工的姓名、或者与所述候选员工的备注信息匹配,可以确定所述第h个候选召回结果的中文部分精准命中;否则,可以确定所述第h个候选召回结果的中文部分非精准命中。
如果确定所述第h个候选召回结果的中文部分非精准命中,则按照前述实施例中输入的搜索词为中文搜索词的方式进行后续处理,可以包括有:若所述第二英文搜索词与所述第h个候选召回结果中的所述候选员工的姓名的所述目标拼音组合匹配,则将所述第h个候选召回结果作为所述N个目标召回结果中之一。
其中,所述第二英文搜索词即所述搜索词中的中文字符转换得到的拼音组合;相应的,可以采用该第二英文搜索词,判断所述第h个候选召回结果中的姓名所对应的精准拼音(也就是目标拼音组合)与所述第二英文搜索词是否完全匹配,若是,则可以确定所述第h个候选召回结果为模糊命中,将所述第h个候选召回结果作为N个目标召回结果之一;否则,所述第h个候选召回结果为错误命中,删除所述第h个候选召回结果。
在所述搜索词中的所述中文字符与所述K个候选召回结果中的第h个候选召回结果包含的候选员工的姓名或备注信息匹配的情况下,进一步将所述搜索词中的中文字符转换为拼音,将中文字符转换得到的拼音与所述搜索词中的英文字符拼接,得到第一英文搜索词。
进而,采用前述实施例中的英文字符搜索词的处理方式进行后续处理,具体可以包括:
判断所述第一英文搜索词与所述第h个候选召回结果中的所述候选员工的姓名的所述目标拼音组合是否匹配;
若所述第一英文搜索词与所述第h个候选召回结果中的所述候选员工的姓名的所述目标拼音组合匹配,则所述第h个候选召回结果为精准命中,将所述第h个候选召回结果作为所述N个目标召回结果中之一;
若所述第一英文搜索词与所述第h个候选召回结果中的所述候选员工的姓名的所述目标拼音组合不匹配,则第h个候选召回结果为错误命中,删除所述第h个候选召回结果。
需要理解的是,上述仅以一个第h个候选召回结果进行说明,实际处理中,针对召回的所述K个候选召回结果中的每一个候选召回结果的处理与前述处理相同,因此不做一一赘述。
在遍历完全部K个候选召回结果之后,可以得到每一个候选召回结果的命中情况,最终得到过滤后的N个目标召回结果。将所述N个目标召回结果作为本次输入的所述搜索词所对应的通讯录信息检索结果在电子设备的显示界面中展示给用户,以便用户进行后续操作,关于用户的后续操作,可以是从N个目标召回结果中确定本次检查想要找到的目标人物,并进行联系,或者查找目标人物的其他信息等等,不对其进行穷举。
可见,通过采用上述方案,就可以在搜索词为英文字符以及中文字符组成的搜索词的情况下,基于中文字符先对候选召回结果进行中文字符的命中情况的判断,基于中文字符的不同的命中情况,确定将中文字符,或者中文字符以及英文字符转换成不同的英文搜索词,对候选召回结果进行进一步选取,确定最终的目标召回结果,从而可以过滤掉一部分候选召回结果。如此,可以在减少最终的目标召回结果的数量的基础上,还保证了目标召回结果的准确率。
需要指出的是,所述搜索词还可以包含有其他情况,比如输入含有特殊字符、空白符或标点的情况;本实施例提供的方案还可以包括:对所述搜索词中的特殊字符、空白、标点删除之后,得到处理后的搜索词。
相应的,得到处理后的搜索词之后,可以保留下来上述三种搜索词中的任意之一,然后采用以上处理执行后续处理,不做赘述。
另外,在所述搜索词中包含数字、或其他语言的字符的情况下,可以不对数字、或其他语言的字符进行预处理,也就是可以保留所述数字、或其他语言的字符,进而可以基于前述电话号码的一个或多个索引进行匹配得到相应的召回结果,可以将匹配到的召回结果均作为精准命中的召回结果,也就是作为目标召回结果进行展示。
还有一种情况中,所述搜索词中不包含中文字符也不包含英文字符,仅包含数字和/或其他语言的字符,此时,可以将基于这类搜索词召回的所述K个候选召回结果均作为精准命中的目标召回结果,并展示给用户。
根据上述实施例,所述方法还包括:基于姓名拼音词典,确定所述K个候选召回结果分别包含的所述候选员工的姓名的所述目标拼音组合。也就是基于姓名拼音词典,确定任意一个候选召回结果中包含的候选员工的姓名所对应的精准拼音。
所述姓名拼音词典,可以是包含有员工及拼音组合关系列表。所述员工及拼音组合关系列表可以是包含有一个或多个员工,以及所述一个或多个员工中每一个员工所对应的一个或多个拼音组合。其中,所述员工及拼音组合关系列表中包含的员工可以采用员工编号来唯一表示,并且,每一个员工的员工编号可以与该员工的姓名关联。
所述基于姓名拼音词典,确定所述K个候选召回结果分别包含的所述候选员工的姓名的所述目标拼音组合,可以是:基于所述K个候选召回结果中的第g个候选召回结果包含的所述候选员工的姓名确定对应的员工编号;基于所述候选员工的姓名对应的员工编号,从所述姓名拼音词典中获取与所述员工编号对应的一个或多个精准拼音,作为所述候选员工的姓名所对应的目标拼音组合;g为大于等于1且小于等于K的整数。
示例性的,所述员工及拼音组合关系列表可以以key(关键值)-value(值)的方式进行存储的。其中,key(关键值)可以是员工的编号,用于唯一表示一个员工,该员工的编号可以与企业内的员工一一对应,并且该员工的编号可以与员工的姓名关联;value为key所表示的员工的姓名所对应的精准拼音(或前述将其称为目标拼音组合)。这里,员工及拼音组合关系列表中的一个key也就是表示一个员工,该员工所对应的value也就是精准拼音(或目标拼音组合)通常为1个拼音组合,或者根据实际情况基于多音字列表可以配置2个或更多的拼音组合;另外,特殊人员可能可以被特殊的英文所召回,这样的英文也会配置在该员工及拼音组合关系列表中,作为与该员工的key所对应的一个value进行保存。
可见,通过预先构建的包含员工及拼音组合关系列表的姓名拼音词典,可以得到企业内全部员工的目标拼音组合,进而进行候选召回结果的过滤的时候,结合预先构建的姓名拼音词典得到针对某一个候选员工的目标拼音组合,结合搜索词进行筛选以及过滤,可以提升筛选的准确率。
基于此,本实施例提供的方案需要建立姓名拼音词典(或称为人名精准拼音词典),目的是企业中的每个员工(或每个人)都要有尽量精准匹配的目标拼音组合;同样还需要一个中文常用音词典,目的是获取每个汉字的常用拼音。
关于构建姓名拼音词典的方式,参见图2,可以包括:
S201:获取所述通讯录中包含的M个员工的姓名的拼音组合;其中,M为大于等于1的整数;
S202:基于所述M个员工的姓名的拼音组合与所述M个员工分别对应的相关信息,确定所述M个员工的姓名的初始精准拼音;
S203:基于所述M个员工的姓名的所述初始精准拼音,生成员工及拼音组合初始关系列表;
S204:基于所述员工及拼音组合初始关系列表生成多音字列表,基于所述多音字列表以及所述员工及拼音组合初始关系列表生成所述员工及拼音组合关系列表,将所述员工及拼音组合关系列表作为所述姓名拼音词典。
首先通过拼音转化工具,获取所述通讯录中包含的M个员工的姓名中每一个姓名的所有拼音组合;这里,每一个姓名的所有拼音组合中可以包含所有多音字的读音进行排列组合。
所述基于所述M个员工的姓名的拼音组合与所述M个员工分别对应的相关信息,确定所述M个员工的姓名的初始精准拼音,可以指的是:获取员工数据库中M个员工的第i个员工的相关信息(也可以称为所有字段信息),对第i个员工的相关信息去除通用的前缀后缀后进行遍历,逐一与第i个员工的姓名的拼音组合进行比对;如果第i个员工的相关信息与第i个员工的姓名的拼音组合中的至少一种完全匹配,则认为该完全匹配的至少一种拼音组合为用户的初始精准拼音。其中,i为大于等于1且小于等于M的整数。
基于所述M个员工的姓名的所述初始精准拼音,生成员工及拼音组合初始关系列表,可以包括:获取到所有M个员工的姓名的所述初始精准拼音后,遍历所有M个员工的姓名的所述初始精准拼音,并与所述M个员工的每一个员工的姓名进行匹配,构建一个员工及拼音组合初始关系列表。这里,员工及拼音组合初始关系列表可以为key-value初始列表,其中,可以包括有每一个员工的编号及其对应的姓名,以及每一个员工的姓名所对应的初始精准拼音。
基于所述员工及拼音组合初始关系列表生成多音字列表,可以是:所述员工及拼音组合初始关系列表中有一个或多个中文(或汉字)出现过两种或更多拼音(或读音)的,则认为该一个或多个中文为姓名中易出现的多音字,将所述一个或多个中文与网络中常用多音字词典结合,构成多音字列表。
基于所述多音字列表以及所述员工及拼音组合初始关系列表生成所述员工及拼音组合关系列表,将所述员工及拼音组合关系列表作为所述姓名拼音词典,具体可以为:如果所述M个员工中的第j个员工的姓名中存在一个或多个中文出现在所述多音字列表中,则将该第j个员工的姓名中的所述一个或多个中文在所述多音字列表中包含的所有读音进行聚合,更新该第j个员工的姓名所对应的初始精准拼音,得到第j个员工的姓名所对应的一个或多个精准拼音,也就是第j个员工的姓名可以对应一个精准拼音列表。
其中,j为大于等于1且小于等于M的整数。
上述将该第j个员工的姓名中的所述一个或多个中文在所述多音字列表中包含的所有读音进行聚合,可以指的是,基于将该第j个员工的姓名中的所述一个或多个中文在所述多音字列表中包含的所有读音,生成所述第j个员工的姓名的一个或多个精准拼音,将该第j个员工的姓名的一个或多个精准拼音与所述第j个员工的姓名的初始精准拼音进行聚合,以得到该第j个员工的姓名的精准拼音列表。
以此类推,直至遍历完所述员工及拼音组合初始关系列表中的全部M个员工,可以得到所述M个员工所分别对应的精准拼音列表;进而基于所述M个员工所分别对应的精准拼音列表更新所述员工及拼音组合初始关系列表,生成所述员工及拼音组合关系列表。
基于前述实施例,该员工及拼音组合关系列表即作为最终使用的所述姓名拼音词典。
另外,在转换中文搜索词,或搜索词中的中文字符的时候,还需要使用中文常用音词典;所述中文常用音词典需要从网络获取,在相关汉字转拼音的工具包中,会将多音字的每个读音按照常用顺序进行排列,需要取出每个多音字的第一个读音,认为是常用音。同时需要配合上文的多音字列表,如果汉字在上文构建的多音字列表中,则保留所有读音。
如此,在构建姓名拼音词典的时候,综合考虑全部员工的姓名所对应的拼音组合以及相关信息的情况,可以使得最终生成的姓名拼音词典在包含有全部的员工的姓名所对应的全部读音所对应的拼音的情况下,还可以避免全部的多音字均进行保留,这样,在保证占用最小的存储资源的前提下,使用该姓名拼音词典进行通讯录信息检索还可以保证最终检索的准确性。
对上述实施例提供一种示例性的说明,参见图3:
S301:获取搜索词;对搜索词进行处理,删除其中的标点以及空白字符。
S302:判断所述搜索词的类型,若所述搜索词为中文搜索词,执行S3031;若所述搜索词为英文字符搜索词,则执行S3041;若所述搜索词为由中文字符以及英文字符组合的搜索词,则执行S3051。
其中,判断搜索词的类型可以基于搜索词的字符类型来判断,如果其中仅包含中文字符,则为中文搜索词;如果其中仅包含英文字符,则为英文字符搜索词;如果其中包含中文字符以及英文字符,则为中文字符以及英文字符组合的搜索词。
在执行下面步骤之前,基于所述搜索词可以从企业的通讯录中获取到K个候选召回结果。本示例将所述所述K个候选召回结果中的任意一个候选召回结果表示为第k个候选召回结果进行后续步骤的说明,可以理解为针对所述K个候选召回结果均采用相同的方式,因此不做一一赘述。其中,k为大于等于1且小于等于K的整数。
还有一种情况中,所述搜索词中不包含中文字符也不包含英文字符,而且其他情况,比如可以是数字和/或其他语言的字符等等。此时,如图3所示,可以将基于这类搜索词召回的所述K个候选召回结果均作为精准命中的目标召回结果,并展示给用户。
S3031:判断所述中文搜索词与所述候选员工的备注信息和/或姓名的高亮的中文是否匹配,若是,则确定该第k个候选召回结果为精准命中,作为目标召回结果;若不是,则该第k个候选召回结果为非精准命中,执行S3032。
这里,所述判断中文搜索词与所述候选员工的备注信息和/或姓名的高亮的中文是否匹配,指的是,判断所述第k个候选召回结果包含的所述候选员工的备注信息和/或姓名的高亮的中文是否包含中文搜索词中的全部中文字符。
另外,虽然图3中未示出,但是执行S3031之前还可以包括:先判断第k个候选召回结果中的高亮的是否为候选员工的备注信息和/或姓名;
若第k个候选召回结果中的高亮的为候选员工的备注信息和/或姓名,则判断所述第k个候选召回结果中的高亮的是否为候选员工的备注信息和/或姓名中的中文;
若所述第k个候选召回结果中的高亮的为候选员工的备注信息和/或姓名中的中文,则执行前述S3031。
上述判断的处理中,还可以包括:若第k个候选召回结果中的高亮的不为候选员工的备注信息和/或姓名,则确定所述第k个候选召回结果为精准命中。
还可以包括:若所述第k个候选召回结果中的高亮的不为候选员工的备注信息和/或姓名中的中文,则确定所述第k个候选召回结果为精准命中。
S3032:将所述中文搜索词中的中文转换为拼音组合。
S3033:判断所述中文搜索词所对应的拼音组合与所述第k个候选召回结果中包含的候选员工的姓名所对应的目标拼音组合(也就是姓名对应的精准拼音)是否匹配,若是,则确定该第k个候选召回结果为模糊命中,作为目标召回结果;若不是,则执行S306。
S3041:判断第k个候选召回结果中的高亮的是否为候选员工的除了姓名之外的相关信息,若是,则所述第k个候选召回结果为精准命中,作为目标召回结果;若不是,则执行S3042。
S3042:判断所述第k个候选召回结果中的高亮部分是否为中文,若是,则执行S3043;否则,所述第k个候选召回结果为精准命中,作为目标召回结果;
也就是说,如果基于英文字符搜索词召回的第k个候选召回结果中,姓名中存在高亮部分,并且这部分不是中文字符,则可能英文字符搜索词命中了员工的英文姓名,此时,可以将该第k个候选召回结果作为精准命中的结果。
S3043:判断所述英文字符搜索词中的英文字符与所述第k个候选召回结果中包含的候选员工的姓名所对应的目标拼音组合(即精准拼音)是否匹配,若是,则确定该候选召回结果为精准命中,作为目标召回结果;若不是,则执行S306。
S3051:将由中文字符以及英文字符组合的搜索词进行分割,得到中文字符以及英文字符;
S3052:判断所述中文字符与所述第k个候选召回结果是否匹配,若匹配,则确定所述第k个候选召回结果为与所述中文字符精准命中,执行S3053,否则,执行S3055。
其中,判断所述中文字符与所述第k个候选召回结果是否匹配,与前述基于中文搜索词的判断类似,这里不做赘述。
S3053:将所述搜索词中的中文字符转换为拼音,将拼音与所述搜索词中的英文字符组合,得到第一英文搜索词;
S3054:判断所述第k个候选召回结果与所述第一英文搜索词是否匹配,若匹配,则该第k个候选召回结果为精准命中,作为目标召回结果;否则,执行S306。
S3055:将所述搜索词中的中文字符转换为拼音,作为第二英文搜索词;
S3056:判断所述第k个候选召回结果与所述第二英文搜索词是否匹配,若匹配,则该第k个候选召回结果为模糊命中,作为目标召回结果;否则,执行S306。
S306:将所述第k个候选召回结果作为错误命中的召回结果进行删除。
根据本公开的实施例的第二方面,本公开还提供了一种通讯录信息检索装置,如图4所示,包括:
召回模块401,用于基于搜索词从通讯录中获取K个候选召回结果;其中,K为大于等于1的整数;
过滤模块402,用于基于所述搜索词以及所述K个候选召回结果分别包含的候选员工的姓名的目标拼音组合,从所述K个候选召回结果中确定N个目标召回结果;其中,N为大于等于1且小于等于K的整数;
检索结果确定模块403,用于将所述N个目标召回结果分别包含的目标员工的相关信息作为与所述搜索词对应的通讯录信息检索结果。
在一种实施方式中,所述召回模块401,用于在所述搜索词与所述通讯录中包含的M个员工中的第i个员工所对应的中文索引以及英文字符索引中之一匹配的情况下,将所述第i个员工作为第j个候选员工;将所述第j个候选员工的相关信息作为第j个候选召回结果;其中,M为大于等于1的整数,i为大于等于1且小于等于M的整数,j为大于等于1且小于等于K的整数。
在一种实施方式中,所述搜索词为中文搜索词;
所述过滤模块402,用于在所述K个候选召回结果中的第q个候选召回结果包含的候选员工的相关信息与所述中文搜索词不匹配的情况下,若所述中文搜索词所对应的拼音组合以及所述第q个候选召回结果包含的候选员工的姓名所对应的目标拼音组合匹配,则将所述第q个候选召回结果作为所述N个目标召回结果中之一;q为大于等于1且小于等于K的整数。
在一种实施方式中,所述搜索词为英文字符搜索词;
所述过滤模块402,用于在所述K个候选召回结果中的第p个候选召回结果与所述英文字符搜索词不匹配的情况下,若所述英文字符搜索词以及所述第p个候选召回结果包含的候选员工的姓名所对应的目标拼音组合匹配,则将所述第p个候选召回结果作为所述N个目标召回结果中之一;其中p为大于等于1且小于等于K的整数。
在一种实施方式中,所述搜索词为由中文字符以及英文字符组成的搜索词;
所述过滤模块402,用于执行以下之一:
将所述搜索词中的中文字符转换为对应的拼音组合,将所述中文字符所对应的所述拼音组合与所述搜索词中的所述英文字符进行拼接,得到所述搜索词所对应的第一英文搜索词;
将所述搜索词中的中文字符转换为对应的拼音组合,将所述中文字符所对应的所述拼音组合作为所述搜索词所对应的第二英文搜索词。
在一种实施方式中,所述过滤模块402,用于在所述搜索词中的所述中文字符与所述K个候选召回结果中的第h个候选召回结果包含的候选员工的姓名或备注信息匹配的情况下,若所述第一英文搜索词与所述第h个候选召回结果中的所述候选员工的姓名的所述目标拼音组合匹配,则将所述第h个候选召回结果作为所述N个目标召回结果中之一;其中,h为大于等于1且小于等于K的整数;
在所述搜索词中的所述中文字符与所述K个候选召回结果中的所述第h个候选召回结果包含的候选员工的姓名以及备注信息不匹配的情况下,若所述第二英文搜索词与所述第h个候选召回结果中的所述候选员工的姓名的所述目标拼音组合匹配,则将所述第h个候选召回结果作为所述N个目标召回结果中之一。
在一种实施方式中,所述过滤模块402,用于基于姓名拼音词典,确定所述K个候选召回结果分别包含的所述候选员工的姓名的所述目标拼音组合。
在一种实施方式中,所述装置还包括:
词典构建模块404,用于获取所述通讯录中包含的M个员工的姓名的拼音组合;其中,M为大于等于1的整数;基于所述M个员工的姓名的拼音组合与所述M个员工分别对应的相关信息,确定所述M个员工的姓名的初始精准拼音;基于所述M个员工的姓名的所述初始精准拼音,生成员工及拼音组合初始关系列表;基于所述员工及拼音组合初始关系列表生成多音字列表,基于所述多音字列表以及所述员工及拼音组合初始关系列表生成所述员工及拼音组合关系列表,将所述员工及拼音组合关系列表作为所述姓名拼音词典。
根据本公开的实施例,本公开还提供了一种电子设备、一种可读存储介质和一种计算机程序产品。
图5示出了可以用来实施本公开的实施例的示例电子设备800的示意性框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或要求的本公开的实现。
如图5所示,设备500包括计算单元501,其可以根据存储在只读存储器(ROM)502中的计算机程序或者从存储单元508加载到随机访问存储器(RAM)503中的计算机程序来执行各种适当的动作和处理。在RAM 503中,还可存储设备500操作所需的各种程序和数据。计算单元501、ROM 502以及RAM 503通过总线504彼此相连。输入输出(I/O)接口505也连接至总线504。
设备500中的多个部件连接至I/O接口505,包括:输入单元506,例如键盘、鼠标等;输出单元507,例如各种类型的显示器、扬声器等;存储单元508,例如磁盘、光盘等;以及通信单元509,例如网卡、调制解调器、无线通信收发机等。通信单元509允许设备500通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
计算单元501可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元501的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元50执行上文所描述的各个方法和处理,例如通讯录信息检索方法。例如,在一些实施例中,通讯录信息检索方法可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元508。在一些实施例中,计算机程序的部分或者全部可以经由ROM 502和/或通信单元509而被载入和/或安装到设备500上。当计算机程序加载到RAM 503并由计算单元501执行时,可以执行上文描述的通讯录信息检索方法的一个或多个步骤。备选地,在其他实施例中,计算单元501可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行通讯录信息检索方法。
本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、负载可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入、或者触觉输入来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)和互联网。
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本公开公开的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本公开保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等,均应包含在本公开保护范围之内。
Claims (19)
1.一种通讯录信息检索方法,包括:
基于搜索词从通讯录中获取K个候选召回结果;其中,K为大于等于1的整数;
基于所述搜索词以及所述K个候选召回结果分别包含的候选员工的姓名的目标拼音组合,从所述K个候选召回结果中确定N个目标召回结果;其中,N为大于等于1且小于等于K的整数;
将所述N个目标召回结果分别包含的目标员工的相关信息作为与所述搜索词对应的通讯录信息检索结果。
2.根据权利要求1所述的方法,其中,所述基于搜索词从通讯录中获取K个候选召回结果,包括:
在所述搜索词与所述通讯录中包含的M个员工中的第i个员工所对应的中文索引以及英文字符索引中之一匹配的情况下,将所述第i个员工作为第j个候选员工;将所述第j个候选员工的相关信息作为第j个候选召回结果;其中,M为大于等于1的整数,i为大于等于1且小于等于M的整数,j为大于等于1且小于等于K的整数。
3.根据权利要求1所述的方法,其中,所述搜索词为中文搜索词;
所述基于所述搜索词以及所述K个候选召回结果分别包含的候选员工的姓名的目标拼音组合,从所述K个候选召回结果中确定N个目标召回结果,包括:
在所述K个候选召回结果中的第q个候选召回结果包含的候选员工的相关信息与所述中文搜索词不匹配的情况下,若所述中文搜索词所对应的拼音组合以及所述第q个候选召回结果包含的候选员工的姓名所对应的目标拼音组合匹配,则将所述第q个候选召回结果作为所述N个目标召回结果中之一;q为大于等于1且小于等于K的整数。
4.根据权利要求1所述的方法,其中,所述搜索词为英文字符搜索词;
所述基于所述搜索词以及所述K个候选召回结果分别包含的候选员工的姓名的目标拼音组合,从所述K个候选召回结果中确定N个目标召回结果,包括:
在所述K个候选召回结果中的第p个候选召回结果与所述英文字符搜索词不匹配的情况下,若所述英文字符搜索词以及所述第p个候选召回结果包含的候选员工的姓名所对应的目标拼音组合匹配,则将所述第p个候选召回结果作为所述N个目标召回结果中之一;其中p为大于等于1且小于等于K的整数。
5.根据权利要求1所述的方法,其中,所述搜索词为由中文字符以及英文字符组成的搜索词;
所述方法还包括以下之一:
将所述搜索词中的中文字符转换为对应的拼音组合,将所述中文字符所对应的所述拼音组合与所述搜索词中的所述英文字符进行拼接,得到所述搜索词所对应的第一英文搜索词;
将所述搜索词中的中文字符转换为对应的拼音组合,将所述中文字符所对应的所述拼音组合作为所述搜索词所对应的第二英文搜索词。
6.根据权利要求5所述的方法,其中,所述基于所述搜索词以及所述K个候选召回结果分别包含的候选员工的姓名的目标拼音组合,从所述K个候选召回结果中确定N个目标召回结果,包括:
在所述搜索词中的所述中文字符与所述K个候选召回结果中的第h个候选召回结果包含的候选员工的姓名或备注信息匹配的情况下,若所述第一英文搜索词与所述第h个候选召回结果中的所述候选员工的姓名的所述目标拼音组合匹配,则将所述第h个候选召回结果作为所述N个目标召回结果中之一;其中,h为大于等于1且小于等于K的整数;
在所述搜索词中的所述中文字符与所述K个候选召回结果中的所述第h个候选召回结果包含的候选员工的姓名以及备注信息不匹配的情况下,若所述第二英文搜索词与所述第h个候选召回结果中的所述候选员工的姓名的所述目标拼音组合匹配,则将所述第h个候选召回结果作为所述N个目标召回结果中之一。
7.根据权利要求1-6任一项所述的方法,其中,所述方法还包括:
基于姓名拼音词典,确定所述K个候选召回结果分别包含的所述候选员工的姓名的所述目标拼音组合。
8.根据权利要求7所述的方法,其中,所述方法还包括:
获取所述通讯录中包含的M个员工的姓名的拼音组合;其中,M为大于等于1的整数;
基于所述M个员工的姓名的拼音组合与所述M个员工分别对应的相关信息,确定所述M个员工的姓名的初始精准拼音;
基于所述M个员工的姓名的所述初始精准拼音,生成员工及拼音组合初始关系列表;
基于所述员工及拼音组合初始关系列表生成多音字列表,基于所述多音字列表以及所述员工及拼音组合初始关系列表生成所述员工及拼音组合关系列表,将所述员工及拼音组合关系列表作为所述姓名拼音词典。
9.一种通讯录信息检索装置,包括:
召回模块,用于基于搜索词从通讯录中获取K个候选召回结果;其中,K为大于等于1的整数;
过滤模块,用于基于所述搜索词以及所述K个候选召回结果分别包含的候选员工的姓名的目标拼音组合,从所述K个候选召回结果中确定N个目标召回结果;其中,N为大于等于1且小于等于K的整数;
检索结果确定模块,用于将所述N个目标召回结果分别包含的目标员工的相关信息作为与所述搜索词对应的通讯录信息检索结果。
10.根据权利要求9所述的装置,其中,所述召回模块,用于在所述搜索词与所述通讯录中包含的M个员工中的第i个员工所对应的中文索引以及英文字符索引中之一匹配的情况下,将所述第i个员工作为第j个候选员工;将所述第j个候选员工的相关信息作为第j个候选召回结果;其中,M为大于等于1的整数,i为大于等于1且小于等于M的整数,j为大于等于1且小于等于K的整数。
11.根据权利要求9所述的装置,其中,所述搜索词为中文搜索词;
所述过滤模块,用于在所述K个候选召回结果中的第q个候选召回结果包含的候选员工的相关信息与所述中文搜索词不匹配的情况下,若所述中文搜索词所对应的拼音组合以及所述第q个候选召回结果包含的候选员工的姓名所对应的目标拼音组合匹配,则将所述第q个候选召回结果作为所述N个目标召回结果中之一;q为大于等于1且小于等于K的整数。
12.根据权利要求9所述的装置,其中,所述搜索词为英文字符搜索词;
所述过滤模块,用于在所述K个候选召回结果中的第p个候选召回结果与所述英文字符搜索词不匹配的情况下,若所述英文字符搜索词以及所述第p个候选召回结果包含的候选员工的姓名所对应的目标拼音组合匹配,则将所述第p个候选召回结果作为所述N个目标召回结果中之一;其中p为大于等于1且小于等于K的整数。
13.根据权利要求9所述的装置,其中,所述搜索词为由中文字符以及英文字符组成的搜索词;
所述过滤模块,用于执行以下之一:
将所述搜索词中的中文字符转换为对应的拼音组合,将所述中文字符所对应的所述拼音组合与所述搜索词中的所述英文字符进行拼接,得到所述搜索词所对应的第一英文搜索词;
将所述搜索词中的中文字符转换为对应的拼音组合,将所述中文字符所对应的所述拼音组合作为所述搜索词所对应的第二英文搜索词。
14.根据权利要求13所述的装置,其中,所述过滤模块,用于在所述搜索词中的所述中文字符与所述K个候选召回结果中的第h个候选召回结果包含的候选员工的姓名或备注信息匹配的情况下,若所述第一英文搜索词与所述第h个候选召回结果中的所述候选员工的姓名的所述目标拼音组合匹配,则将所述第h个候选召回结果作为所述N个目标召回结果中之一;其中,h为大于等于1且小于等于K的整数;
在所述搜索词中的所述中文字符与所述K个候选召回结果中的所述第h个候选召回结果包含的候选员工的姓名以及备注信息不匹配的情况下,若所述第二英文搜索词与所述第h个候选召回结果中的所述候选员工的姓名的所述目标拼音组合匹配,则将所述第h个候选召回结果作为所述N个目标召回结果中之一。
15.根据权利要求9-14任一项所述的装置,其中,所述过滤模块,用于基于姓名拼音词典,确定所述K个候选召回结果分别包含的所述候选员工的姓名的所述目标拼音组合。
16.根据权利要求15所述的装置,其中,所述装置还包括:
词典构建模块,用于获取所述通讯录中包含的M个员工的姓名的拼音组合;其中,M为大于等于1的整数;基于所述M个员工的姓名的拼音组合与所述M个员工分别对应的相关信息,确定所述M个员工的姓名的初始精准拼音;基于所述M个员工的姓名的所述初始精准拼音,生成员工及拼音组合初始关系列表;基于所述员工及拼音组合初始关系列表生成多音字列表,基于所述多音字列表以及所述员工及拼音组合初始关系列表生成所述员工及拼音组合关系列表,将所述员工及拼音组合关系列表作为所述姓名拼音词典。
17.一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-8中任一项所述的方法。
18.一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行权利要求1-8中任一项所述的方法。
19.一种计算机程序产品,包括计算机程序,该计算机程序在被处理器执行时实现根据权利要求1-8中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011423409.6A CN112527819A (zh) | 2020-12-08 | 2020-12-08 | 通讯录信息检索方法、装置、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011423409.6A CN112527819A (zh) | 2020-12-08 | 2020-12-08 | 通讯录信息检索方法、装置、电子设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112527819A true CN112527819A (zh) | 2021-03-19 |
Family
ID=74996719
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011423409.6A Pending CN112527819A (zh) | 2020-12-08 | 2020-12-08 | 通讯录信息检索方法、装置、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112527819A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113326363A (zh) * | 2021-05-27 | 2021-08-31 | 北京百度网讯科技有限公司 | 搜索方法及装置、预测模型训练方法及装置、电子设备 |
CN113569010A (zh) * | 2021-07-23 | 2021-10-29 | 北京百度网讯科技有限公司 | 过滤检索结果的方法、装置、设备以及存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090077039A1 (en) * | 2007-08-17 | 2009-03-19 | Sony Corporation | Information processing apparatus, and method and program for searching text information candidate |
JP2009289052A (ja) * | 2008-05-29 | 2009-12-10 | Internatl Business Mach Corp <Ibm> | 姓名候補を生成する情報処理装置、情報処理方法、およびプログラム |
CN102542000A (zh) * | 2011-12-07 | 2012-07-04 | 北京风灵创景科技有限公司 | 一种联系人检索的方法及其设备 |
CN103294776A (zh) * | 2013-05-13 | 2013-09-11 | 浙江大学 | 一种智能手机通讯录模糊搜索的方法 |
CN107330120A (zh) * | 2017-07-14 | 2017-11-07 | 三角兽(北京)科技有限公司 | 询问应答方法、询问应答装置及计算机可读存储介质 |
-
2020
- 2020-12-08 CN CN202011423409.6A patent/CN112527819A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090077039A1 (en) * | 2007-08-17 | 2009-03-19 | Sony Corporation | Information processing apparatus, and method and program for searching text information candidate |
JP2009289052A (ja) * | 2008-05-29 | 2009-12-10 | Internatl Business Mach Corp <Ibm> | 姓名候補を生成する情報処理装置、情報処理方法、およびプログラム |
CN102542000A (zh) * | 2011-12-07 | 2012-07-04 | 北京风灵创景科技有限公司 | 一种联系人检索的方法及其设备 |
CN103294776A (zh) * | 2013-05-13 | 2013-09-11 | 浙江大学 | 一种智能手机通讯录模糊搜索的方法 |
CN107330120A (zh) * | 2017-07-14 | 2017-11-07 | 三角兽(北京)科技有限公司 | 询问应答方法、询问应答装置及计算机可读存储介质 |
Non-Patent Citations (1)
Title |
---|
余立毅;: "基于Solr的商品拼音搜索系统设计与实现", 电脑与电信, no. 07 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113326363A (zh) * | 2021-05-27 | 2021-08-31 | 北京百度网讯科技有限公司 | 搜索方法及装置、预测模型训练方法及装置、电子设备 |
CN113326363B (zh) * | 2021-05-27 | 2023-07-25 | 北京百度网讯科技有限公司 | 搜索方法及装置、预测模型训练方法及装置、电子设备 |
CN113569010A (zh) * | 2021-07-23 | 2021-10-29 | 北京百度网讯科技有限公司 | 过滤检索结果的方法、装置、设备以及存储介质 |
CN113569010B (zh) * | 2021-07-23 | 2023-12-12 | 北京百度网讯科技有限公司 | 过滤检索结果的方法、装置、设备以及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111597351A (zh) | 可视化文档图谱构建方法 | |
CN110597994A (zh) | 事件元素识别方法和装置 | |
CN114595686B (zh) | 知识抽取方法、知识抽取模型的训练方法及装置 | |
CN110569370B (zh) | 一种知识图谱的构建方法、装置、电子设备及存储介质 | |
CN112153206B (zh) | 一种联系人匹配方法、装置、电子设备及存储介质 | |
CN112527819A (zh) | 通讯录信息检索方法、装置、电子设备及存储介质 | |
CN113220835A (zh) | 文本信息处理方法、装置、电子设备以及存储介质 | |
CN112507118A (zh) | 信息分类抽取方法、装置和电子设备 | |
US10354013B2 (en) | Dynamic translation of idioms | |
CN111435406A (zh) | 一种纠正数据库语句拼写错误的方法和装置 | |
CN113836316B (zh) | 三元组数据的处理方法、训练方法、装置、设备及介质 | |
CN113326363B (zh) | 搜索方法及装置、预测模型训练方法及装置、电子设备 | |
CN112699237B (zh) | 标签确定方法、设备和存储介质 | |
CN110580337A (zh) | 一种基于实体相似度计算的专业实体消歧实现方法 | |
CN113361240A (zh) | 用于生成目标文章的方法、装置、设备和可读存储介质 | |
CN110674262B (zh) | 词语识别方法、装置、电子设备和介质 | |
CN112560425A (zh) | 模板生成方法、装置、电子设备及存储介质 | |
CN112506864A (zh) | 文件检索的方法、装置、电子设备及可读存储介质 | |
WO2015075920A1 (ja) | 入力支援装置、入力支援方法及び記録媒体 | |
CN115600592A (zh) | 文本内容的关键信息提取方法、装置、设备及介质 | |
CN114417862A (zh) | 文本匹配方法、文本匹配模型的训练方法和装置 | |
CN109727591B (zh) | 一种语音搜索的方法及装置 | |
CN112560459A (zh) | 用于模型训练的样本筛选方法、装置、设备及存储介质 | |
US10055401B2 (en) | Identification and processing of idioms in an electronic environment | |
CN114091483B (zh) | 翻译处理方法、装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |