CN113254766A - 信息的检索方法和装置 - Google Patents
信息的检索方法和装置 Download PDFInfo
- Publication number
- CN113254766A CN113254766A CN202110554353.6A CN202110554353A CN113254766A CN 113254766 A CN113254766 A CN 113254766A CN 202110554353 A CN202110554353 A CN 202110554353A CN 113254766 A CN113254766 A CN 113254766A
- Authority
- CN
- China
- Prior art keywords
- retrieval
- intimacy
- result
- determining
- search results
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 66
- 238000004891 communication Methods 0.000 claims abstract description 57
- 230000004044 response Effects 0.000 claims abstract description 10
- 230000015654 memory Effects 0.000 claims description 19
- 238000011156 evaluation Methods 0.000 claims description 16
- 238000004590 computer program Methods 0.000 claims description 10
- 239000013598 vector Substances 0.000 claims description 6
- 239000000126 substance Substances 0.000 claims 1
- 230000008569 process Effects 0.000 abstract description 11
- 238000013473 artificial intelligence Methods 0.000 abstract description 2
- 238000004904 shortening Methods 0.000 abstract description 2
- 238000010586 diagram Methods 0.000 description 11
- 230000006870 function Effects 0.000 description 8
- 238000012545 processing Methods 0.000 description 8
- 230000006399 behavior Effects 0.000 description 5
- 230000000694 effects Effects 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 239000003795 chemical substances by application Substances 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 238000012417 linear regression Methods 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 101100153581 Bacillus anthracis topX gene Proteins 0.000 description 1
- 101150041570 TOP1 gene Proteins 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000001953 sensory effect Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9538—Presentation of query results
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本公开提供了信息的检索方法和装置,涉及计算机技术领域,具体涉及包括信息检索的人工智能技术领域。具体实施方式包括:响应于接收到检索词,确定在通信应用的登录账号的历史数据的召回集合,其中,召回集合包括历史数据中登录账号的亲密对象;在所述召回集合中,确定检索结果;显示所述检索结果。本公开可以避免在数据量庞大的数据库中进行长时间的检索,而是在数量较小的召回集合中进行检索,可以有效地缩短检索过程,提高检索效率。此外,通过亲密对象,可以确定出通信应用中与用户关系亲密的对象,从而提高了检索结果是用户要点击的检索结果的可能性。
Description
技术领域
本公开涉及计算机技术领域,具体涉及包括信息检索的人工智能技术领域,尤其涉及信息的检索方法和装置。
背景技术
为了更好地推动信息流动、协调人员组织,现代化企业往往会通过使用企业通信工具来满足该类需求。
这些工具中都集成有搜索引擎能力,能够检索联系人、群组、文档、消息记录等,大幅地提高了用户的搜索和办公效率。
发明内容
提供了一种信息的检索方法、装置、电子设备以及存储介质。
根据第一方面,提供了一种信息的检索方法,用于终端的通信应用,包括:响应于接收到检索词,确定在通信应用的登录账号的历史数据的召回集合,其中,召回集合包括历史数据中登录账号的亲密对象;在召回集合中,确定检索结果;显示检索结果。
根据第二方面,提供了一种信息的检索装置,用于终端的通信应用,包括:确定单元,被配置成响应于接收到检索词,确定在通信应用的登录账号的历史数据的召回集合,其中,召回集合包括历史数据中登录账号的亲密对象;生成单元,被配置成在召回集合中,确定检索结果;显示单元,被配置成显示检索结果。
根据第三方面,提供了一种电子设备,包括:至少一个处理器;以及与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行信息的检索方法中任一实施例的方法。
根据第四方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,计算机指令用于使计算机执行根据信息的检索方法中任一实施例的方法。
根据第五方面,提供了一种计算机程序产品,包括计算机程序,计算机程序在被处理器执行时实现根据信息的检索方法中任一实施例的方法。
根据本公开的方案,可以避免在数据量庞大的数据库中进行长时间的检索,而是在数量较小的召回集合中进行检索,可以有效地缩短检索过程,提高检索效率。此外,通过亲密对象,可以确定出通信应用中与用户关系亲密的对象,从而提高了检索结果是用户要点击的检索结果的可能性。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本公开的其它特征、目的和优点将会变得更明显:
图1是本公开一些实施例可以应用于其中的示例性系统架构图;
图2是根据本公开的信息的检索方法的一个实施例的流程图;
图3是根据本公开的信息的检索方法的一个应用场景的示意图;
图4是根据本公开的召回集合生成步骤的一个实施例的流程图;
图5是根据本公开的信息的检索装置的一个实施例的结构示意图;
图6是用来实现本公开实施例的信息的检索方法的电子设备的框图。
具体实施方式
以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
本公开的技术方案中,所涉及的用户个人信息的获取,存储和应用等,均符合相关法律法规的规定,采取了必要保密措施,且不违背公序良俗。
需要说明的是,在不冲突的情况下,本公开中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本公开。
图1示出了可以应用本公开的信息的检索方法或信息的检索装置的实施例的示例性系统架构100。
如图1所示,系统架构100可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。终端设备101、102、103上可以安装有各种通讯客户端应用,例如视频类应用、直播应用、即时通信工具、邮箱客户端、社交平台软件等。
这里的终端设备101、102、103可以是硬件,也可以是软件。当终端设备101、102、103为硬件时,可以是具有显示屏的各种电子设备,包括但不限于智能手机、平板电脑、电子书阅读器、膝上型便携计算机和台式计算机等等。当终端设备101、102、103为软件时,可以安装在上述所列举的电子设备中。其可以实现成多个软件或软件模块(例如用来提供分布式服务的多个软件或软件模块),也可以实现成单个软件或软件模块。在此不做具体限定。
服务器105可以是提供各种服务的服务器,例如对终端设备101、102、103提供支持的后台服务器。后台服务器可以对接收到的检索词等数据进行分析等处理,并将处理结果(例如检索结果)反馈给终端设备。
需要说明的是,本公开实施例所提供的信息的检索方法可以由终端设备101、102、103执行,相应地,信息的检索装置可以设置于终端设备101、102、103中。
应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
继续参考图2,示出了根据本公开的信息的检索方法的一个实施例的流程200。该信息的检索方法,应用于终端的通信应用,比如即时通信(instant message,IM)应用,该方法可以包括以下步骤:
步骤201,响应于接收到检索词,确定在通信应用的登录账号的历史数据的召回集合,其中,召回集合包括历史数据中登录账号的亲密对象。
在本实施例中,信息的检索方法运行于其上的执行主体(例如图1所示的终端设备)可以在接收到检索词(query)的情况下,确定(也即定位)检索所需要的召回集合。具体地,用户可以在上述终端输入检索词,这样,终端可以接收到该检索词,从而实现在终端的检索过程。登录账号的亲密对象,也即当前登录账号的用户的亲密对象。
召回集合包括历史数据中的亲密对象。这里的对象可以是各种各样的与账号相关的信息,也即该账号的用户相关的信息,比如用户、群组、手机号、部门等等。
历史数据指与终端的当前登录用户有关的各种行为信息。这里的行为信息指示的行为可以指联系、检索和/或点击,这里的联系可以指会话沟通、邮件沟通、会邀、汇报等。亲密对象中的亲密,可以指示在通信应用中两个对象之间的亲密度高于阈值。这里的亲密度可以采用各种方式确定,比如利用确定亲密度的对应关系表。该对应关系表用于指示每个行为与亲密度之间的对应关系。可以将各个行为分别对应的亲密度中最大的亲密度作为最终的亲密度。
步骤202,在召回集合中,确定检索结果。
在本实施例中,上述执行主体可以在终端的历史数据的召回集合中,确定检索结果。在实践中,本实施例中在终端的检索过程是在召回集合中进行的。也即,在终端进行的检索所得到的检索结果是在该召回集合中的。
本公开的上述实施例提供的方法可以避免在数据量庞大的数据库中进行长时间的检索,而是在数量较小的召回集合中进行检索,可以有效地缩短检索过程,提高检索效率。此外,通过亲密对象,可以确定出通信应用中与用户关系亲密的对象,从而提高了检索结果是用户要点击的检索结果的可能性。
步骤203,显示检索结果。
在本实施例中,上述执行主体可以实现向用户显示上述检索结果。
继续参见图3,图3是根据本实施例的信息的检索方法的应用场景的一个示意图。在图3的应用场景中,执行主体301响应于接收到检索词302,确定在通信应用的登录账号的历史数据的召回集合303,其中,召回集合包括历史数据中登录账号的亲密对象。执行主体301在召回集合303中,确定检索结果304。显示检索结果304。
在本公开的任一实施例的一些可选的实现方式中,
在显示检索结果之前,方法还可以包括:基于以下的至少一项,对各个检索结果进行排序:检索结果与检索词的相关性、登录账号与检索结果之间对象的亲密度、检索结果中生成时间与当前时间之间的时长不超过预设时长的对象;其中,该亲密度是基于检索结果中的对象与登录账号之间的沟通参数确定的,沟通参数包括以下至少一项:频率、沟通时间与当前时间的临近程度。
在这些可选的实现方式中,上述执行主体可以基于各项参数,对各个检索结果进行排序。具体地,参数可以是至少一项。沟通参数可以包括的沟通时间与当前时间的临近程度,可以采用各种形式来表示,比如,可以是上述沟通时间与当前时间之间的时长的倒数,也可以是将该时长输入指定的临近程度预测模型(比如深度神经网络),得到的、从该模型输出的结果。在排序之后,上述执行主体可以显示排序后的检索结果。
在实践中,排序可以采用线性回归模型确定。比如,上述执行主体可以将上述的至少一项,输入线性回归模型,从而得到排序结果。在排序过程中,排序的得分越高,则排序的位置越在先,也即越靠前。
检索结果与检索词的相关性,可以包括与检索词本身的相关性,也可以包括与检索词的命中域之间的相关性。比如,在域指员工名的情况下,如果检索词是“张”,域是“张三”,那么该域为该检索词命中的域。该相关性越大,则排序得分越高。
登录账号的用户与检索结果中对象之间的亲密度中,亲密度可以通过沟通的频率、沟通时间的新的程度也即临近程度来确定。比如,某执行主体可以将频率和临近程度中的至少一者,输入亲密度模型,并得到从该模型输出的亲密度。具体地,沟通的频率越高、临近程度越大,则亲密度越高。该亲密度越高,则排序得分越高。
对于检索结果中生成时间与当前时间之间的时长不超过预设时长的对象,生成时间可以是作为对象的群组的创建时间(或群成员最后更新时间),也可以是作为对象的用户的注册时间(比如入职时间)。具体地,在排序过程中,上述执行主体可以针对该对象,增加其排序得分,比如增加预设数值的得分。或者,可以是该生成时间与当前时间之间的时长越小,则排序得分越高。
这些可选的实现方式可以通过用户之间的沟通参数,来精确地确定出用户之间的亲密度,进而提高排序结果的准确度。具体地,新生的对象往往历史数据匮乏,为了弥补这个问题,本实施例在排序过程中针对新对象做出了处理,从而可以进一步提高排序的准确度。
在本公开的任一实施例的一些可选的实现方式中,上述方法还可以包括:将检索词上传给服务器,并接收服务器返回的检索结果;以及在显示检索结果之后,方法还包括:将所生成的检索结果排列在最先显示位置,生成包括所生成的检索结果和服务器返回的检索结果中的至少一个检索结果的页面,显示页面。
在这些可选的实现方式中,上述执行主体可以基于本地自身的检索结果和服务器返回的检索结果两者,来进行显示。具体地,上述执行主体可以将检索词上传给服务器,并接收服务器返回的检索结果。上述执行主体可以响应于在本地生成了检索结果,先显示该检索结果。该检索结果的耗时短,可以较快地显示出来。而服务器的检索结果返回的时间,往往在得到本地的检索结果之后。服务器的检索结果一旦返回,上述执行主体可以在本地进而将服务器的检索结果也显示出来。并且显示时,上述执行主体将本地生成的检索结果排列在最先显示位置,比如显示为最靠前的几个词条,并将服务器返回的检索结果排列在本地生成的检索结果之后的位置进行显示。在实践中,上述执行主体可以在显示服务器返回的检索结果之前,先进行去重处理,也即去掉服务器返回的检索结果中,和本地生成的检索结果重复的检索结果。
这些实现方式可以将本地的检索结果和服务器的检索结果进行结合,从而在本地检索可以提高效率和准确度的同时,还可以显示服务器的检索结果,以确保显示内容的全面性。
在本公开的任一实施例的一些可选的实现方式中,所生成的检索结果存在对应的评估步骤,评估步骤包括:确定所生成的检索结果中排列在最先显示位置的检索结果,在历史数据中被点击的检索结果中的占比;确定所生成的检索结果相对于对照检索结果的对比数,其中,对比数包括优数、同效数和劣数;根据占比和对比数,确定评估结果。
在这些可选的实现方式中,上述执行主体或其它电子设备(比如服务器)可以确定历史数据中用户点击的检索结果中,在所生成的检索结果排列在最先的检索结果的占比(也即top1占比)。
对比数即是gsb(good、same、bad)指标,指本公开的策略所生成的检索结果效果,优于、等同于(也即同效于)、劣于对照策略的检索结果效果的数值。比如,优数、同效数和劣数分别为508、47、21。
上述执行主体可以采用各种方式,根据占比和对比数,确定评估结果。比如,上述执行主体可以对占比设定对应的阈值,并对每个对比数分别设定对应的数值范围,在占比超过对应的阈值,且每个对比数均在其对应的数值范围之内,则上述执行主体可以确定评估结果为合格。如果占比未超过对应的阈值,和/或任一对比数未在对应的数值范围之内,则上述执行主体可以确定评估结果为不合格。此外,上述执行主体可以通过预设的模型,确定评估结果。比如,上述执行主体可以将占比和对比数,输入该预设的模型,并得到从该预设的模型输出的评估结果,该评估结果可以是合格,或者不合格。
这些实现方式可以通过上述占比和对比数,准确地对检索结果进行评估。
进一步参考图4,其示出了召回集合的生成步骤的一个实施例的流程400。该流程400,包括以下步骤:
步骤401,在历史数据中,确定以下的至少一项作为召回对象:最新点击对象、最新沟通对象、亲密对象,其中,至少一项中每一项召回对象的数量为至少一个。
在本实施例中,信息的检索方法运行于其上的执行主体(例如图1所示的终端设备)可以在上述历史数据中,确定至少一项,作为召回对象。其中,所确定的召回对象中,任一项的数量为至少一个。
在实践中,最新点击对象、最新沟通对象和亲密对象的数量均可以是至少一个。最新点击对象可以是登录用户在最新的预设历时长内点击的对象。比如在1个月内在检索结果中点击过的对象。最新沟通对象可以是登录用户在最新的指定历史时长内沟通过的对象,且该对象的数量不超过预设对象阈值。比如,在1年内沟通过的对象,且对象的数量不超过300个。在实践中,如果确定的召回对象包括至少两项,可以对各个召回对象进行去重处理,得到去重后的召回对象。
步骤402,将召回对象加入召回集合。
在本实施例中,上述执行主体可以将确定的召回对象加入到召回集合中。
这些可选的实现方式可以将用户检索的可能性较大的对象作为召回对象,从而提高在召回集合中检索到准确结果的概率。
可选地,亲密对象为通过亲密度模型预测得到的;亲密对象的确定步骤包括:对于历史数据中的存在一跳关系的两个对象,通过亲密度模型,确定两个对象指示的向量之间的相似度作为亲密度;若亲密度达到亲密度阈值,确定两个对象为亲密对象。
在这些可选的实现方式中,其它电子设备(比如服务器)或者上述执行主体可以通过亲密度模型对亲密对象进行预测。亲密度模型可以用于预测对象之间的亲密度也即向量的相似度。具体地,以上述其它电子设备为例,该执行主体可以通过亲密度模型,采用用户的沟通数据、邮件数据、会邀数据、汇报关系等信息构建关系图模型,将每个对象映射为一个向量(比如通过Node2Vec技术),并计算该对象与和它有一跳关系的对象之间的相似度。
在本实施例中,对于一个对象来说,与其有一跳关系的对象指与有直接联系的对象。举例来说,如果对象为用户,可以指与用户有过直接的沟通数据、邮件数据、会邀数据、汇报关系等关系。如:A发邮件给B、C,C发了邮件给D,则B、C为A的一跳用户,D为A的二跳用户。此外,也可以是该用户所在的群组。
这些可选的实现方式可以利用亲密度模型,准确地确定出对象之间的相似度,从而提高了确定亲密对象的准确度。
进一步参考图5,作为对上述各图所示方法的实现,本公开提供了一种信息的检索装置的一个实施例,该装置实施例与图2所示的方法实施例相对应,除下面所记载的特征外,该装置实施例还可以包括与图2所示的方法实施例相同或相应的特征或效果。该装置具体可以应用于各种电子设备中。
如图5所示,本实施例的信息的检索装置500,用于终端的通信应用,包括:确定单元501、生成单元502和显示单元503。其中,确定单元501,被配置成响应于接收到检索词,确定在通信应用的登录账号的历史数据的召回集合,其中,召回集合包括历史数据中登录账号的亲密对象;生成单元502,被配置成在召回集合中,确定检索结果;显示单元503,被配置成显示检索结果。
在本实施例中,信息的检索装置500的确定单元501、生成单元502和显示单元503的具体处理及其所带来的技术效果可分别参考图2对应实施例中步骤201、步骤202和步骤203的相关说明,在此不再赘述。
在本实施例的一些可选的实现方式中,召回集合的生成步骤包括:在历史数据中,确定以下的至少一项作为召回对象:最新点击对象、最新沟通对象、亲密对象,其中,至少一项中每一项的数量为至少一个;将召回对象加入召回集合。
在本实施例的一些可选的实现方式中,亲密对象为通过亲密度模型预测得到的;亲密对象的确定步骤包括:对于历史数据中的存在一跳关系的两个对象,通过亲密度模型,确定两个对象指示的向量之间的相似度作为亲密度;若亲密度达到亲密度阈值,则确定两个对象为亲密对象。
在本实施例的一些可选的实现方式中,装置还包括:排序单元,被配置成在显示检索结果之前,基于以下的至少一项,对各个检索结果进行排序:检索结果与检索词的相关性、登录账号与检索结果之间对象的亲密度、检索结果中生成时间与当前时间之间的时长不超过预设时长的对象;其中,该亲密度是基于检索结果中的对象与登录账号之间的沟通参数确定的,沟通参数包括以下至少一项:频率、沟通时间与当前时间的临近程度。
在本实施例的一些可选的实现方式中,装置还包括:通信单元,被配置成将检索词上传给服务器,并接收服务器返回的检索结果;以及装置还包括:显示单元,被配置成在显示检索结果之后,将所生成的检索结果排列在最先显示位置,生成包括所生成的检索结果并包括服务器返回的检索结果中的至少一个检索结果的页面,显示页面。
在本实施例的一些可选的实现方式中,所生成的检索结果存在对应的评估步骤,评估步骤包括:确定所生成的检索结果中排列在最先显示位置的检索结果,在历史数据中被点击的检索结果中的占比;确定所生成的检索结果相对于对照检索结果的对比数,其中,对比数包括优数、同效数和劣数;根据占比和对比数,确定评估结果。
根据本公开的实施例,本公开还提供了一种电子设备、一种可读存储介质和一种计算机程序产品。
如图6所示,是根据本公开实施例的信息的检索方法的电子设备的框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本公开的实现。
如图6所示,该电子设备包括:一个或多个处理器601、存储器602,以及用于连接各部件的接口,包括高速接口和低速接口。各个部件利用不同的总线互相连接,并且可以被安装在公共主板上或者根据需要以其它方式安装。处理器可以对在电子设备内执行的指令进行处理,包括存储在存储器中或者存储器上以在外部输入/输出装置(诸如,耦合至接口的显示设备)上显示GUI的图形信息的指令。在其它实施方式中,若需要,可以将多个处理器和/或多条总线与多个存储器和多个存储器一起使用。同样,可以连接多个电子设备,各个设备提供部分必要的操作(例如,作为服务器阵列、一组刀片式服务器、或者多处理器系统)。图6中以一个处理器601为例。
存储器602即为本公开所提供的非瞬时计算机可读存储介质。其中,存储器存储有可由至少一个处理器执行的指令,以使至少一个处理器执行本公开所提供的信息的检索方法。本公开的非瞬时计算机可读存储介质存储计算机指令,该计算机指令用于使计算机执行本公开所提供的信息的检索方法。
存储器602作为一种非瞬时计算机可读存储介质,可用于存储非瞬时软件程序、非瞬时计算机可执行程序以及模块,如本公开实施例中的信息的检索方法对应的程序指令/模块(例如,附图5所示的确定单元501、生成单元502和显示单元503)。处理器601通过运行存储在存储器602中的非瞬时软件程序、指令以及模块,从而执行服务器的各种功能应用以及数据处理,即实现上述方法实施例中的信息的检索方法。
存储器602可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储根据信息的检索电子设备的使用所创建的数据等。此外,存储器602可以包括高速随机存取存储器,还可以包括非瞬时存储器,例如至少一个磁盘存储器件、闪存器件、或其他非瞬时固态存储器件。在一些实施例中,存储器602可选包括相对于处理器601远程设置的存储器,这些远程存储器可以通过网络连接至信息的检索电子设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
信息的检索方法的电子设备还可以包括:输入装置603和输出装置604。处理器601、存储器602、输入装置603和输出装置604可以通过总线或者其他方式连接,图6中以通过总线连接为例。
输入装置603可接收输入的数字或字符信息,以及产生与信息的检索电子设备的用户设置以及功能控制有关的键信号输入,例如触摸屏、小键盘、鼠标、轨迹板、触摸板、指示杆、一个或者多个鼠标按钮、轨迹球、操纵杆等输入装置。输出装置604可以包括显示设备、辅助照明装置(例如,LED)和触觉反馈装置(例如,振动电机)等。该显示设备可以包括但不限于,液晶显示器(LCD)、发光二极管(LED)显示器和等离子体显示器。在一些实施方式中,显示设备可以是触摸屏。
此处描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、专用ASIC(专用集成电路)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
这些计算程序(也称作程序、软件、软件应用、或者代码)包括可编程处理器的机器指令,并且可以利用高级过程和/或面向对象的编程语言、和/或汇编/机器语言来实施这些计算程序。如本文使用的,术语“机器可读介质”和“计算机可读介质”指的是用于将机器指令和/或数据提供给可编程处理器的任何计算机程序产品、设备、和/或装置(例如,磁盘、光盘、存储器、可编程逻辑装置(PLD)),包括,接收作为机器可读信号的机器指令的机器可读介质。术语“机器可读信号”指的是用于将机器指令和/或数据提供给可编程处理器的任何信号。
为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)和互联网。
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,又称为云计算服务器或云主机,是云计算服务体系中的一项主机产品,以解决了传统物理主机与VPS服务(″Virtual Private Server″,或简称″VPS″)中,存在的管理难度大,业务扩展性弱的缺陷。服务器也可以为分布式系统的服务器,或者是结合了区块链的服务器。
附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本公开实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的单元也可以设置在处理器中,例如,可以描述为:一种处理器包括确定单元、生成单元和显示单元。其中,这些单元的名称在某种情况下并不构成对该单元本身的限定,例如,显示单元还可以被描述为“显示所述检索结果的单元”。
作为另一方面,本公开还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的装置中所包含的;也可以是单独存在,而未装配入该装置中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该装置执行时,使得该装置:响应于接收到检索词,确定在通信应用的登录账号的历史数据的召回集合,其中,召回集合包括历史数据中登录账号的亲密对象;在召回集合中,确定检索结果;显示检索结果。
以上描述仅为本公开的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本公开中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离上述发明构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本公开中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。
Claims (15)
1.一种信息的检索方法,用于终端的通信应用,所述方法包括:
响应于接收到检索词,确定在所述通信应用的登录账号的历史数据的召回集合,其中,所述召回集合包括所述历史数据中所述登录账号的亲密对象;
在所述召回集合中,确定检索结果;
显示所述检索结果。
2.根据权利要求1所述的方法,其中,所述召回集合的生成步骤包括:
在所述历史数据中,确定以下的至少一项作为召回对象:最新点击对象、最新沟通对象、亲密对象,其中,所述至少一项中每一项的数量为至少一个;
将所述召回对象加入所述召回集合。
3.根据权利要求2所述的方法,其中,所述亲密对象为通过亲密度模型预测得到的;
所述亲密对象的确定步骤包括:
对于历史数据中的存在一跳关系的两个对象,通过所述亲密度模型,确定所述两个对象指示的向量之间的相似度作为亲密度;
若所述亲密度达到亲密度阈值,则确定所述两个对象为亲密对象。
4.根据权利要求1-3之一所述的方法,其中,在所述显示所述检索结果之前,所述方法还包括:
基于以下的至少一项,对各个所述检索结果进行排序:
检索结果与检索词的相关性、所述登录账号与检索结果之间对象的亲密度、检索结果中生成时间与当前时间之间的时长不超过预设时长的对象;
其中,该亲密度是基于检索结果中的对象与所述登录账号之间的沟通参数确定的,所述沟通参数包括以下至少一项:频率、沟通时间与当前时间的临近程度。
5.根据权利要求1-3之一所述的方法,其中,所述方法还包括:
将所述检索词上传给服务器,并接收所述服务器返回的检索结果;以及
在所述显示所述检索结果之后,所述方法还包括:
将所生成的检索结果排列在最先显示位置,生成包括所生成的检索结果并包括所述服务器返回的检索结果中的至少一个检索结果的页面,显示所述页面。
6.根据权利要求1-3之一所述的方法,其中,所生成的检索结果存在对应的评估步骤,所述评估步骤包括:
确定所生成的检索结果中排列在最先显示位置的检索结果,在所述历史数据中被点击的检索结果中的占比;
确定所生成的检索结果相对于对照检索结果的对比数,其中,所述对比数包括优数、同效数和劣数;
根据所述占比和所述对比数,确定评估结果。
7.一种信息的检索装置,用于终端的通信应用,所述装置包括:
确定单元,被配置成响应于接收到检索词,确定在所述通信应用的登录账号的历史数据的召回集合,其中,所述召回集合包括所述历史数据中所述登录账号的亲密对象;
生成单元,被配置成在所述召回集合中,确定检索结果;
显示单元,被配置成显示所述检索结果。
8.根据权利要求7所述的装置,其中,所述召回集合的生成步骤包括:
在所述历史数据中,确定以下的至少一项作为召回对象:最新点击对象、最新沟通对象、亲密对象,其中,所述至少一项中每一项的数量为至少一个;
将所述召回对象加入所述召回集合。
9.根据权利要求8所述的装置,其中,所述亲密对象为通过亲密度模型预测得到的;
所述亲密对象的确定步骤包括:
对于历史数据中的存在一跳关系的两个对象,通过所述亲密度模型,确定所述两个对象指示的向量之间的相似度作为亲密度;
若所述亲密度达到亲密度阈值,则确定所述两个对象为亲密对象。
10.根据权利要求7-9之一所述的装置,其中,所述装置还包括:
排序单元,被配置成在所述显示所述检索结果之前,基于以下的至少一项,对各个所述检索结果进行排序:
检索结果与检索词的相关性、所述登录账号与检索结果之间对象的亲密度、检索结果中生成时间与当前时间之间的时长不超过预设时长的对象;
其中,该亲密度是基于检索结果中的对象与所述登录账号之间的沟通参数确定的,所述沟通参数包括以下至少一项:频率、沟通时间与当前时间的临近程度。
11.根据权利要求7-9之一所述的装置,其中,所述装置还包括:
通信单元,被配置成将所述检索词上传给服务器,并接收所述服务器返回的检索结果;以及
所述装置还包括:
显示单元,被配置成在所述显示所述检索结果之后,将所生成的检索结果排列在最先显示位置,生成包括所生成的检索结果并包括所述服务器返回的检索结果中的至少一个检索结果的页面,显示所述页面。
12.根据权利要求7-9之一所述的装置,其中,所生成的检索结果存在对应的评估步骤,所述评估步骤包括:
确定所生成的检索结果中排列在最先显示位置的检索结果,在所述历史数据中被点击的检索结果中的占比;
确定所生成的检索结果相对于对照检索结果的对比数,其中,所述对比数包括优数、同效数和劣数;
根据所述占比和所述对比数,确定评估结果。
13.一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-6中任一项所述的方法。
14.一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行根据权利要求1-6中任一项所述的方法。
15.一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现根据权利要求1-6中任一所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110554353.6A CN113254766A (zh) | 2021-05-20 | 2021-05-20 | 信息的检索方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110554353.6A CN113254766A (zh) | 2021-05-20 | 2021-05-20 | 信息的检索方法和装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113254766A true CN113254766A (zh) | 2021-08-13 |
Family
ID=77183203
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110554353.6A Pending CN113254766A (zh) | 2021-05-20 | 2021-05-20 | 信息的检索方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113254766A (zh) |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1783850A (zh) * | 2004-12-03 | 2006-06-07 | 腾讯科技(深圳)有限公司 | 一种基于即时通讯平台的搜索方法和系统 |
CN102043833A (zh) * | 2010-11-25 | 2011-05-04 | 北京搜狗科技发展有限公司 | 一种基于查询词进行搜索的方法和搜索装置 |
CN102298627A (zh) * | 2011-08-29 | 2011-12-28 | 上海量明科技发展有限公司 | 针对于即时通信工具提供搜索的方法及系统 |
CN103457837A (zh) * | 2013-08-18 | 2013-12-18 | 苏州量跃信息科技有限公司 | 通过搜索引擎进行即时通信搜索的方法及系统 |
CN105279159A (zh) * | 2014-06-05 | 2016-01-27 | 腾讯科技(北京)有限公司 | 联系人的提示方法和装置 |
CN107330019A (zh) * | 2017-06-19 | 2017-11-07 | 北京小米移动软件有限公司 | 搜索方法及装置 |
CN107688595A (zh) * | 2017-05-10 | 2018-02-13 | 平安科技(深圳)有限公司 | 信息检索准确性评估方法、装置及计算机可读存储介质 |
CN109033386A (zh) * | 2018-07-27 | 2018-12-18 | 天津字节跳动科技有限公司 | 搜索排序方法、装置、计算机设备和存储介质 |
CN112087371A (zh) * | 2020-09-10 | 2020-12-15 | 北京百度网讯科技有限公司 | 一种即时通讯群组的搜索方法、装置、设备和存储介质 |
-
2021
- 2021-05-20 CN CN202110554353.6A patent/CN113254766A/zh active Pending
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1783850A (zh) * | 2004-12-03 | 2006-06-07 | 腾讯科技(深圳)有限公司 | 一种基于即时通讯平台的搜索方法和系统 |
CN102043833A (zh) * | 2010-11-25 | 2011-05-04 | 北京搜狗科技发展有限公司 | 一种基于查询词进行搜索的方法和搜索装置 |
CN102298627A (zh) * | 2011-08-29 | 2011-12-28 | 上海量明科技发展有限公司 | 针对于即时通信工具提供搜索的方法及系统 |
CN103457837A (zh) * | 2013-08-18 | 2013-12-18 | 苏州量跃信息科技有限公司 | 通过搜索引擎进行即时通信搜索的方法及系统 |
CN105279159A (zh) * | 2014-06-05 | 2016-01-27 | 腾讯科技(北京)有限公司 | 联系人的提示方法和装置 |
CN107688595A (zh) * | 2017-05-10 | 2018-02-13 | 平安科技(深圳)有限公司 | 信息检索准确性评估方法、装置及计算机可读存储介质 |
CN107330019A (zh) * | 2017-06-19 | 2017-11-07 | 北京小米移动软件有限公司 | 搜索方法及装置 |
CN109033386A (zh) * | 2018-07-27 | 2018-12-18 | 天津字节跳动科技有限公司 | 搜索排序方法、装置、计算机设备和存储介质 |
CN112087371A (zh) * | 2020-09-10 | 2020-12-15 | 北京百度网讯科技有限公司 | 一种即时通讯群组的搜索方法、装置、设备和存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11645321B2 (en) | Calculating relationship strength using an activity-based distributed graph | |
US20230214433A1 (en) | Bulletin Board Data Mapping and Presentation | |
US10255563B2 (en) | Aggregating enterprise graph content around user-generated topics | |
US10146875B2 (en) | Information propagation via weighted semantic and social graphs | |
US20180350009A1 (en) | Using Metadata to Summarize Social Media Content | |
CN112087371B (zh) | 一种即时通讯群组的搜索方法、装置、设备和存储介质 | |
CN112650907B (zh) | 搜索词的推荐方法、目标模型的训练方法、装置及设备 | |
Zhu et al. | Predicting user activity level in social networks | |
US11366818B2 (en) | Context-aware dynamic content assist | |
US20220200937A1 (en) | Content suggestion system for real-time communication environments | |
US10970639B2 (en) | Cognitive robotics analyzer | |
US20190147404A1 (en) | Email streaming records | |
CN112307357A (zh) | 与陌生人的社交方法和装置 | |
US11238122B2 (en) | Managing content sharing in a social network | |
US20210192554A1 (en) | Method, apparatus, device and storage medium for judging permanent area change | |
US20140372168A1 (en) | Systems and methods of initiating contact with a prospect | |
US10324968B2 (en) | Topic generation for a publication | |
CN112084393A (zh) | 用于输出信息的方法、装置、设备以及存储介质 | |
CN113254766A (zh) | 信息的检索方法和装置 | |
CN112269938A (zh) | 信息展示方法、装置、电子设备和存储介质 | |
US20210157867A1 (en) | User-specific summary generation based on communication content analysis | |
CN111695036A (zh) | 内容推荐方法及装置 | |
CN113626462B (zh) | 即时通讯对象的搜索方法、装置、电子设备和存储介质 | |
US20200210499A1 (en) | Automatically linking pages in a website | |
CN111782794A (zh) | 问答响应方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |