CN111582967A - 内容搜索方法、装置、设备及存储介质 - Google Patents
内容搜索方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN111582967A CN111582967A CN201911197737.6A CN201911197737A CN111582967A CN 111582967 A CN111582967 A CN 111582967A CN 201911197737 A CN201911197737 A CN 201911197737A CN 111582967 A CN111582967 A CN 111582967A
- Authority
- CN
- China
- Prior art keywords
- content
- search
- center points
- target
- contents
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0605—Supply or demand aggregation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3322—Query formulation using system suggestions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0623—Item investigation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- General Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- Strategic Management (AREA)
- Marketing (AREA)
- Economics (AREA)
- Development Economics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请公开了一种内容搜索方法、装置、设备及存储介质,属于互联网技术领域。所述方法包括:获取搜索关键词;获取特征向量;根据特征向量,从z个聚类中心点中选择n个目标中心点;从n个目标中心点的聚类集合中,搜索获取与搜索关键词相匹配的r个内容;根据r个内容生成搜索结果。本申请实施例提供的技术方案,扩展了一种搜索查询的方式,并且实现了从内容集合的海量内容中,预先选择一些具有代表性的内容作为聚类中心点,然后在这些聚类中心点及其所在的聚类集合的基础上进行后续的搜索查询过程,提升了系统的处理速度,减少了搜索查询过程的耗时。
Description
技术领域
本申请实施例涉及互联网技术领域,特别涉及一种内容搜索方法、装置、设备及存储介质。
背景技术
目前,越来越多的商户在在线订单类应用程序中注册,在在线订单类应用程序的客户端中登录的用户可以通过输入搜索关键词找到满足需求的商户。
相关技术对于搜索查询满足用户需求的商户部署了两个独立的检索系统,其中一个检索系统根据用户的搜索关键词,从注册在应用程序的商户中检索与搜索关键词相对应的商户作为搜索结果,另外一个检索系统根据用户的特征信息对搜索结果进行过滤筛选,从而得到满足用户偏好的搜索结果。
发明内容
本申请实施例提供了一种内容搜索方法、装置、设备及存储介质。所述技术方案如下:
一方面,本申请实施例提供了一种内容搜索方法,所述方法包括:
获取搜索关键词;
获取特征向量;
根据所述特征向量,从z个聚类中心点中选择n个目标中心点,所述z个聚类中心点是从内容集合中选取的z个内容,所述z为正整数,所述n为小于或等于所述z的正整数;
从所述n个目标中心点的聚类集合中,搜索获取与所述搜索关键词相匹配的r个内容,其中,每个所述目标中心点的聚类集合中包括至少一个内容,所述r为正整数;
根据所述r个内容生成搜索结果。
另一方面,本申请实施例提供了一种内容搜索方法,所述方法包括:
获取目标用户帐号输入的搜索关键词;
获取所述目标用户帐号的用户特征向量;
根据所述用户特征向量,从z个聚类中心点中选择n个目标中心点,所述z个聚类中心点是从内容集合中选取的z个内容,所述z为正整数,所述n为小于或等于所述z的正整数;
从所述n个目标中心点的聚类集合中,搜索获取与所述搜索关键词相匹配的r个内容,其中,每个所述目标中心点的聚类集合中包括至少一个内容,所述r为正整数;
根据所述r个内容生成搜索结果。
再一方面,本申请实施例提供了一种内容搜索装置,所述装置包括:
关键词获取模块,用于获取搜索关键词;
向量获取模块,用于获取特征向量;
中心点选取模块,用于根据所述特征向量,从z个聚类中心点中选择n个目标中心点,所述z个聚类中心点是从内容集合中选取的z个内容,所述z为正整数,所述n为小于或等于所述z的正整数;
内容匹配模块,用于从所述n个目标中心点的聚类集合中,搜索获取与所述搜索关键词相匹配的r个内容,其中,每个所述目标中心点的聚类集合中包括至少一个内容,所述r为正整数;
结果生成模块,用于根据所述r个内容生成搜索结果。
又一方面,本申请实施例提供了一种内容搜索装置,所述装置包括:
关键词获取模块,用于获取目标用户帐号输入的搜索关键词;
向量获取模块,用于获取所述目标用户帐号的用户特征向量;
中心点选取模块,用于根据所述用户特征向量,从z个聚类中心点中选择n个目标中心点,所述z个聚类中心点是从内容集合中选取的z个内容,所述z为正整数,所述n为小于或等于所述z的正整数;
内容匹配模块,用于从所述n个目标中心点的聚类集合中,搜索获取与所述搜索关键词相匹配的r个内容,其中,每个所述目标中心点的聚类集合中包括至少一个内容,所述r为正整数;
结果生成模块,用于根据所述r个内容生成搜索结果。
还一方面,本申请实施例提供了一种计算机设备,所述计算机设备包括处理器和存储器,所述存储器中存储有计算机程序,所述计算机程序由所述处理器加载并执行以实现上述内容搜索方法。
还一方面,本申请实施例提供了一种非临时性计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述内容搜索方法。
还一方面,提供了一种计算机程序产品,当所述计算机程序产品在服务器上运行时,使得服务器执行上述内容搜索方法。
本申请实施例提供的技术方案可以带来如下有益效果:
通过根据特征向量从多个聚类中心点中选择至少一个目标中心点,然后根据搜索关键词从上述目标中心点的聚类集合中选择相匹配的内容,最后根据选择的内容生成搜索结果,扩展了一种搜索查询的方式,并且本申请实施例中多个聚类中心点是从内容集合中选取的多个内容,实现了从内容集合的海量内容中,预先选择一些具有代表性的内容作为聚类中心点,然后在这些聚类中心点及其所在的聚类集合的基础上进行后续的搜索查询过程,提升了系统的处理速度,减少了搜索查询过程的耗时。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请一个实施例提供的实施环境的示意图;
图2是本申请一个实施例提供的内容搜索方法的流程图;
图3是本申请另一个实施例提供的内容搜索方法的流程图;
图4是本申请一个实施例提供的聚类集合生成过程的流程图;
图5是本申请一个实施例提供的聚类集合生成过程的示意图;
图6是本申请又一个实施例提供的内容搜索方法的流程图;
图7是本申请一个实施例提供的内容搜索装置的框图;
图8是本申请另一个实施例提供的内容搜索装置的框图;
图9是本申请又一个实施例提供的内容搜索装置的框图;
图10是本申请一个实施例提供的计算机设备的框图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地详细描述。
请参考图1,其示出了本申请一个实施例提供的实施环境的示意图。该实施环境可以包括:终端10和服务器20。
终端10可以是诸如手机、平板电脑、游戏主机、电子书阅读器、多媒体播放设备、可穿戴设备等电子设备。终端10中可以安装目标应用程序的客户端,该目标应用程序可以是提供内容搜索服务的应用程序,如外卖类应用程序的客户端、购物类应用程序的客户端、视频类应用程序的客户端、资讯类应用程序的客户端等。示例性地,当内容为商户时,目标应用程序可以是外卖类应用程序和购物类应用程序等。
服务器20用于为终端10中的目标应用程序的客户端提供后台服务。例如,服务器20可以是该目标应用程序的后台服务器。服务器20可以是一台服务器,也可以是由多台服务器组成的服务器集群,或者是一个云计算服务中心。
终端10和服务器20之间可通过网络30进行互相通信。该网络30可以是有线网络,也可以是无线网络。
本申请方法实施例中,各步骤的执行主体可以是终端,也可以服务器,为了便于说明,在下述实施例中,仅以各步骤由服务器来执行进行介绍说明,但对此不构成限定。
请参考图2,其示出了本申请一个实施例提供的内容搜索方法的流程图。该方法可以包括如下几个步骤(201~205):
步骤201,获取搜索关键词。
搜索关键词是指从搜索内容中提取的关键词,搜索内容是在应用程序的内容搜索栏中输入的,本申请实施例对搜索关键词的数量不作限定,实际应用中可以综合内容准确性与服务器处理开销这两方面的因素来确定搜索关键词的数量。可选地,为了加快服务器的处理速度,搜索关键词可以与内容搜索栏的输入内容相同。例如,在内容搜索栏中的输入内容为“健康营养粥”时,搜索关键词可以是“健康营养粥”,也可以是“健康”、“营养”和“粥”,还可以是“健康”和“营养粥”。
步骤202,获取特征向量。
特征向量用于指示特征信息,特征信息是指在应用程序的客户端中注册所生成的信息,以及使用应用程序的过程中生成的信息。可选地,特征向量包含一个或多个元素,每个元素对应一个特征信息,即特征信息的数量与特征向量中元素的数量相同。
例如,当特征信息包括年龄、性别、职业、地区、兴趣爱好、历史订单数时,特征向量包含6个元素,且这6个元素分别对应6个特征信息。可选地,为了减轻服务器的处理开销、加快服务器的处理速度,特征向量中的元素采用数值的形式表示。例如,对于特征向量中对应性别这一特征信息的元素,0表示性别为男,1表示性别为女。又例如,对于特征向量中对应地区这一特征信息的元素,0表示北京市,1表示上海市,2表示广东省,3表示江苏省,4表示四川省,中国其它省份和直辖市以此类推;或者,0表示北京市朝阳区,1表示北京市海淀区,2表示北京市大兴区,3表示北京市怀柔区,4表示北京市平谷区,北京市其它辖区以此类推。
步骤203,根据特征向量,从z个聚类中心点中选择n个目标中心点。
本申请实施例中,z个聚类中心点是从内容集合中选取的z个内容,z为正整数,其中,内容集合中包括至少一个内容,本申请实施例中,内容集合中包括x个内容,x为正整数。可选地,为了便于服务器的计算与表示,每个内容对应有一个内容特征向量,该内容特征向量用于指示内容的特征信息。可选地,内容特征向量包含一个或多个元素,每个元素对应一个特征信息,即内容的特征信息的数量与内容特征向量中元素的数量相同。
以外卖类应用程序为例,在该外卖类应用程序上注册的商户提供内容搜索服务,每个商户及其特征信息对应一条内容,多条内容组成了内容集合,其中,商户的特征信息是指商户在该外卖类应用程序中注册及使用所生成的信息,包括商户的名称、地址、类别、菜单、订单量和评价。每个商户对应有一个内容特征向量,该内容特征向量包含6个元素,且这6个元素分别对应商户的6个特征信息。可选地,为了减轻服务器的处理开销、加快服务器的处理速度,内容特征向量中的元素采用数值的形式表示。基于上述步骤202对用户特征向量中元素的表示形式的介绍,得到本步骤203中对内容特征向量中元素的表示形式的介绍,此处不再赘述。
目标中心点是指根据特征向量从z个聚类中心点中选择的n个聚类中心点,n为小于或等于z的正整数。示例性地,本申请实施例使用量化器从z个聚类中心点中选择n个目标中心点,可选地,量化器在从z个聚类中心点中选择n个目标中心点之前,会预先加载z个聚类中心点,并根据该z个聚类中心点构建K-D树(K-Dimensional,K维树),然后根据查询向量从K-D树中选择与查询向量相匹配的n个聚类中心点,其中,查询向量是指特征向量。例如,如图3所示,使用量化器从z个聚类中心点中选择n个目标中心点的查询向量301是特征向量。
在一种可能的实施方式中,上述步骤203包括:分别计算特征向量与每个聚类中心点的内容特征向量之间的相似度;从z个聚类中心点中,选择相似度符合条件的n个聚类中心点作为n个目标中心点;其中,上述条件包括:相似度按照从大到小的顺序排在前n位,或者相似度超过相似度阈值。
相似度用于指示特征向量与聚类中心点的内容特征向量之间的相似程度,可选地,相似度可以使用特征向量与内容特征向量之间的欧式距离计算,也可以使用特征向量与内容特征向量之间的余弦距离计算,本申请实施例对此不作限定。
相似度阈值可以是预先设置的,也可以是根据相似度计算结果设置的,本申请实施例不作限定,实际应用中可以结合结果准确性与对目标中心点数量的需求这两方面的因素来确定相似度阈值的大小。可选地,在上述条件为相似度按照从大到小的顺序排在前n位时,目标中心点的数量n可以根据结果准确性与实际需求来预先确定。
例如,若有6个聚类中心点,且特征向量与这6个聚类中心点的内容特征向量之间的相似度分别为90%、80%、85%、95%、20%和98%,则在条件为相似度按照从大到小的顺序排在前3位时,选择出的目标中心点分别为第六个、第四个和第一个聚类中心点;在条件为相似度超过相似度阈值92%时,选择出的目标中心点分别为第六个和第四个聚类中心点。通过上述对目标中心点的选择方式,可以在便于服务器选择的同时兼顾结果的准确性。
步骤204,从n个目标中心点的聚类集合中,搜索获取与搜索关键词相匹配的r个内容。
每个聚类中心点(目标中心点)均对应有一个聚类集合,该聚类集合中包括至少一个内容,即聚类集合中除了包括聚类中心点(目标中心点)之外,还可以包括其它的内容。服务器选择出n个目标中心点后,即在这n个目标中心点的聚类集合中,搜索与搜索关键词相匹配的r个内容,r为正整数。本申请实施例中,与搜索关键词相匹配,既可以是指某条内容的内容特征向量所表示的含义包括搜索关键词,也可以是指某条内容的内容特征向量所表示的含义与搜索关键词所表达的含义相似。
本申请实施例使用量化器搜索获取与关键词相匹配的r个内容,量化器在搜索获取r个内容之前,预先加载n个目标中心点的聚类集合,然后根据搜索关键词从n个聚类集合中搜索获取与关键词相匹配的r个内容,其中,查询向量是搜索关键词。例如,如图3所示,量化器是使用搜索关键词302从n个目标中心点的聚类集合中搜索获取r个内容的。
在一种可能的实施方式中,为了加快处理速度,上述步骤204包括:分别获取各个目标中心点的倒排链,目标中心点的倒排链中包括以目标中心点为聚类中心的至少一个内容的标识;根据各个目标中心点的倒排链,从以目标中心点为聚类中心的至少一个内容中,搜索获取与搜索关键词相匹配的r个内容。内容的标识可以内容的序号或ID标识等,本申请实施例对此不作限定。
示例性地,上述根据各个目标中心点的倒排链,从以目标中心点为聚类中心的至少一个内容中,搜索获取与搜索关键词相匹配的r个内容,包括:根据搜索关键词,从内容集合中获取与搜索关键词相匹配的多个内容;根据该多个内容,形成搜索关键词倒排链;对搜索关键词倒排链和各个目标中心点的倒排链中的文档进行合并处理,得到r个内容。其中,每个倒排链中包含多个文档,每个文档对应一条内容,且每个文档中包括对应内容的标识。可选地,合并处理可以是取并集处理,也可以是取交集处理,或者是其它处理方式,本申请实施例对合并处理的具体方式不作限定。例如,如图3所示,若有2个目标中心点,记为中心点a和中心点b,每个中心点对应一条倒排链,记为倒排链a和倒排链b,倒排链a中包括文档3、文档6和文档9,倒排链b中包括文档5、文档10和文档12,搜索关键词倒排链中包括文档3、文档7和文档10,则对搜索关键词倒排链和各个目标中心点的倒排链的合并处理303,可以是指将倒排链a和倒排链b中与搜索关键词倒排链中相同的文档对应的内容提取出来作为r个内容,即将文档3和文档10对应的内容提取出来作为r个内容。
步骤205,根据r个内容生成搜索结果。
服务器搜索获取r个内容后,即根据该r个内容生成搜索结果。可选地,搜索结果既可以是r个内容,也可以是从r个内容中选取出的部分内容,本申请实施例对此不作限定。可选地,服务器获取r个内容后,可以对该r个内容进行一定的处理,以生成搜索结果,如进行打分排序处理等。
在一种可能的实施方式中,为了使得搜索结果更加准确,上述步骤205包括:生成r个内容的推荐分值,推荐分值用于指示内容适合推荐的程度;根据r个内容的推荐分值,从r个内容中选择至少一个目标内容作为搜索结果。服务器获取r个内容后,可以根据一定的评分标准生成这r个内容的推荐分值,本申请实施例对评分标准的具体内容不作限定,实际应用中可以结合应用场景的不用具体设置,以应用于外卖类应用程序为例,每条内容对应一个商户,则评分标准可以包括:商户的历史订单数、商户的外卖评价、商户的地理位置,以及商户所售商品的价格等。可选地,为了便于对r个内容的选择,服务器生成这r个内容推荐分值后,可以根据推荐分值从高到低的顺序对这r个内容进行排序,然后服务器可以选择推荐分值排在前t位的内容作为目标内容,t为正整数。可选地,目标内容的数量也可以与r个内容相同,即可以将r个内容全部作为目标内容,此时服务器在生成搜索结果的时候,可以按照r个内容的推荐分值从高到低对r个内容排序,从而可以确保将推荐分值较高的内容最先显示在客户端中。
综上所述,通过根据特征向量从多个聚类中心点中选择至少一个目标中心点,然后根据搜索关键词从上述目标中心点的聚类集合中选择相匹配的内容,最后根据选择的内容生成搜索结果,扩展了一种搜索查询的方式,并且本申请实施例中多个聚类中心点是从内容集合中选取的多个内容,实现了从内容集合的海量内容中,预先选择一些具有代表性的内容作为聚类中心点,然后在这些聚类中心点及其所在的聚类集合的基础上进行后续的搜索查询过程,提升了系统的处理速度,减少了搜索查询过程的耗时。
另外,本申请实施例提供的技术方案,与搜索关键词相匹配的内容是基于倒排链搜索获取的,通过倒排链搜索获取可以加快搜索速度、提升搜索效率。
另外,本申请实施例提供的技术方案中,在根据多个内容生成搜索结果的过程中,会生成这多个内容的推荐分值,然后根据推荐分值从多个内容中选择目标内容作为搜索结果,实现了有效筛选多个内容,将推荐分值较高的内容作为搜索结果,使得搜索结果更加准确。
在一种可能的实施方式中,请参考图4,上述步骤201之前,还包括如下几个步骤:
步骤20A,从内容集合中抽样选取y个内容,内容集合中包括x个内容,x大于y,且x和y均为正整数。
内容集合中包括x个内容,实际应用中,x的取值可能很大,如x的取值为2000万,为了减轻服务器的处理开销,本申请实施例在进行聚类处理之前,首先从内容集合中抽样选取y个内容,但若不考虑服务器的处理开销以及运算速度,可以直接对内容集合中的x个内容进行聚类处理,本申请实施例对此不作限定。
抽样选取出的内容数量y的取值既可以随机任意设置,也可以根据内容集合中的内容的数量和需要得到的聚类中心点的数量进行设置,本申请实施例对此不作限定。示例性地,若需要得到的聚类中心点的数量为z,则y的计算公式如下所示:
y=min(x,z×256)。
服务器从内容集合中抽样选取y个内容,可选地,为了加快抽样速度、进一步减轻服务器处理开销,可以在HDFS(Hadoop Distributed File System,分布式文件系统)上,采取蓄水池抽样算法从内容集合中抽样选取y个内容,且将抽样结果存放在HDFS上。例如,如图5所示,内容集合501中包括多条内容及其对应的内容特征向量,然后在HDFS平台502上对内容集合501进行蓄水池抽样,以选取出y个内容。
步骤20B,对y个内容进行聚类处理,得到z个聚类中心点。
为了将抽样选取出的y个内容进行分类或分组,本申请实施例首先将y个内容进行聚类处理得到z个聚类中心点,然后基于这z个聚类中心点,构建z个聚类集合。可选地,因为每个内容均采用内容特征向量进行表示,因此为了加快聚类速度、进一步减轻服务器的处理开销,可以在GPU(Graphics Processing Unit,图形处理器)上,采取K-Means聚类算法(k-means clustering algorithm,K均值聚类算法)对y个内容进行聚类处理,得到z个聚类中心点。例如,如图5所示,在GPU平台503上对y个内容进行K-Means聚类,得到z个聚类中心点。
聚类中心点的数量z的取值既可以随机任意设置,也可以根据运行速度、处理开销等实际需求进行设置,本申请实施例对此不作限定。示例性地,聚类中心点的数量z的计算公式如下:
步骤20C,对于内容集合中的第i个内容,计算第i个内容的内容特征向量与各个聚类中心点的内容特征向量之间的相似度,i为小于或等于x的正整数。
得到z个聚类中心点后,服务器即对内容集合中除聚类中心点外的每一条内容,计算该内容的内容特征向量分别与z个聚类中心点的内容特征向量之间的相似度,即对于内容特征向量中除聚类中心点外的每一条内容,服务器需要计算z次相似度,服务器总计需要计算次相似度。
步骤20D,选择与第i个内容的内容特征向量之间的相似度最大的聚类中心点,并将第i个内容的标识添加至相似度最大的聚类中心点的聚类集合中。
对于内容特征向量中除聚类中心点外的每一条内容,服务器计算该内容的特征向量分别与z个聚类中心点的内容特征向量之间的相似度之后,根据这z个相似度结果,选择相似度最大的聚类中心点,并将该内容的标识添加至选择出的相似度最大的聚类中心点的聚类集合中,其中,每一条内容的标识可以为该内容的内容特征向量,也可以为该内容的ID标识等,本申请实施例对此不作限定。
可选地,z个聚类中心点对应的聚类集合存储在多个索引分片上,其中,索引分片用于存储聚类集合,索引分片的数量可以根据实际的需求和成本这两方面的因素决定。例如,如图5所示,索引分片504的数量为4个,聚类集合的数量为z个,这z个聚类集合可以通过分布式索引构建服务存储在这4个索引分片504上。本申请实施例中,z个集合既可以在每个索引分片504上进行存储,也可以分别存储在这4个索引分片504上,如每个索引分片504上存储个聚类集合,当z个聚类集合分别存储在4个索引分片504上时,每个索引分片504中存储的聚类集合的数量既可以相同,也可以不相同。通过这种设置,可以在多个索引分片上存储聚类集合,避免因为服务器故障搜索查询服务不能使用的情况,且本申请实施例中聚类集合可以分别存储在索引分片上,可以减轻单个索引分片的存储压力,降低单个索引分片的处理开销。
综上所述,本申请实施例提供的技术方案,通过从内容集合中抽样选取出一定数量的内容,然后对抽样选取出的内容进行聚类处理得到多个聚类中心点,再计算内容集合中的每一条内容与各个聚类中心点之间的相似度,最后根据相似度将每一条内容都添加至对应的聚类集合中,实现了对内容集合中的每一条内容进行分组或分类,得到多个聚类集合。并且,本申请实施例提供的技术方案,在进行聚类处理之前,先从内容集合中抽样选取出一定数量的内容,可以加快聚类处理速度,降低处理开销。另外,本申请实施例的抽样过程是在HDFS平台上采用蓄水池抽样算法进行的,且聚类处理过程是在GPU上采用K-Means聚类算法进行的,可以进一步降低处理开销,提升处理速度。
请参考图6,其示出了本申请一个实施例提供的内容搜索方法的流程图。该方法可以包括如下几个步骤(601~605):
步骤601,获取目标用户帐号输入的搜索关键词。
目标用户帐号是指目标应用程序的客户端中登录的用户帐号。可选地,目标应用程序提供有内容搜索栏,目标用户帐号对应的用户可以在该内容搜索栏中输入需要搜索的内容,搜索关键词是指从内容搜索栏中输入的搜索内容中提取的关键词,本申请实施例对搜索关键词的数量不作限定,实际应用中可以综合内容准确性与服务器处理开销这两方面的因素来确定搜索关键词的数量。可选地,为了加快服务器的处理速度,搜索关键词可以与目标用户帐号的输入内容相同。
步骤602,获取目标用户帐号的用户特征向量。
用户特征向量用于指示用户帐号的特征信息,特征信息是指用户帐号在目标应用程序的客户端中注册所生成的信息,以及使用目标应用程序的过程中生成的信息。可选地,用户特征向量包含一个或多个元素,每个元素对应一个特征信息,即用户帐号的特征信息的数量与用户特征向量中元素的数量相同。
步骤603,根据用户特征向量,从z个聚类中心点中选择n个目标中心点。
本申请实施例中,z个聚类中心点是从内容集合中选取的z个内容,z为正整数,其中,内容集合中包括至少一个内容,本申请实施例中,内容集合中包括x个内容,x为正整数。可选地,为了便于服务器的计算与表示,每个个体对应有一个内容特征向量,该内容特征向量用于指示个体的特征信息。可选地,内容特征向量包含一个或多个元素,每个元素对应一个特征信息,即个体的特征信息的数量与内容特征向量中元素的数量相同。
目标中心点是指根据用户特征向量从z个聚类中心点中选择的n个聚类中心点,n为小于或等于z的正整数。示例性地,本申请实施例使用量化器从z个聚类中心点中选择n个目标中心点,可选地,量化器在从z个聚类中心点中选择n个目标中心点之前,会预先加载z个聚类中心点,并根据该z个聚类中心点构建K-D树(K-Dimensional,K维树),然后根据查询向量从K-D树中选择与查询向量相匹配的n个聚类中心点,其中,查询向量是指用户特征向量。
步骤604,从n个目标中心点的聚类集合中,搜索获取与搜索关键词相匹配的r个内容。
每个聚类中心点(目标中心点)均对应有一个聚类集合,该聚类集合中包括至少一个内容,即聚类集合中除了包括聚类中心点(目标中心点)之外,还可以包括其它的内容。服务器选择出n个目标中心点后,即在这n个目标中心点的聚类集合中,搜索与目标用户帐号输入的搜索关键词相匹配的r个内容,r为正整数。本申请实施例中,与搜索关键词相匹配既可以是指某条内容的内容特征向量所表示的含义包括搜索关键词,也可以是指某条内容的内容特征向量所表示的含义与搜索关键词所表达的含义相似。
本申请实施例使用量化器搜索获取与关键词相匹配的r个内容,量化器在搜索获取r个内容之前,预先加载n个目标中心点的聚类集合,然后根据搜索关键词从n个聚类集合中搜索获取与关键词相匹配的r个内容,其中,查询向量是搜索关键词。
步骤605,根据r个内容生成搜索结果。
服务器搜索获取r个内容后,即根据该r个内容生成搜索结果。可选地,搜索结果既可以是r个内容,也可以是从r个内容中选取出的部分内容,本申请实施例对此不作限定。可选地,服务器获取r个内容后,可以对该r个内容进行一定的处理,以生成搜索结果,如进行打分排序处理等。
需要说明的一点是,基于图2可选实施例的举例说明和扩展实施例,可以得到此处图6可选实施例的举例说明和扩展实施例,详细介绍参见图2可选实施例,此处不再赘述。
综上所述,通过根据目标用户帐号的用户特征向量从多个聚类中心点中选择至少一个目标中心点,然后根据目标用户帐号输入的搜索关键词从上述目标中心点的聚类集合中选择相匹配的内容,最后根据选择的内容生成搜索结果,扩展了一种搜索查询的方式,并且本申请实施例中多个聚类中心点是从内容集合中选取的多个内容,实现了从内容集合的海量内容中,预先选择一些具有代表性的内容作为聚类中心点,然后在这些聚类中心点及其所在的聚类集合的基础上进行后续的搜索查询过程,提升了系统的处理速度,减少了搜索查询过程的耗时。
另外,本申请实施例提供的技术方案,与搜索关键词相匹配的内容是基于倒排链搜索获取的,通过倒排链搜索获取可以加快搜索速度、提升搜索效率。
另外,本申请实施例提供的技术方案中,在根据多个内容生成搜索结果的过程中,会生成这多个内容的推荐分值,然后根据推荐分值从多个内容中选择目标内容作为搜索结果,实现了有效筛选多个内容,将推荐分值较高的内容作为搜索结果,使得搜索结果更加准确。
下述为本申请装置实施例,可以用于执行本申请方法实施例。对于本申请装置实施例中未披露的细节,请参照本申请方法实施例。
请参考图7,其示出了本申请一个实施例提供的内容搜索装置的框图。该装置具有实现上述图2所示方法示例的功能,所述功能可以由硬件实现,也可以由硬件执行相应的软件实现。该装置可以是上文介绍的计算机设备,如终端或服务器。该装置700可以包括:关键词获取模块710、向量获取模块720、中心点选取模块730、内容匹配模块740和结果生成模块750。
关键词获取模块710,用于获取搜索关键词。
向量获取模块720,用于获取特征向量。
中心点选取模块730,用于根据所述特征向量,从z个聚类中心点中选择n个目标中心点,所述z个聚类中心点是从内容集合中选取的z个内容,所述z为正整数,所述n为小于或等于所述z的正整数。
内容匹配模块740,用于从所述n个目标中心点的聚类集合中,搜索获取与所述搜索关键词相匹配的r个内容,其中,每个所述目标中心点的聚类集合中包括至少一个内容,所述r为正整数。
结果生成模块750,用于根据所述r个内容生成搜索结果。
可选地,所述中心点选取模块730,用于:分别计算所述特征向量与每个所述聚类中心点的内容特征向量之间的相似度;从所述z个聚类中心点中,选择所述相似度符合条件的n个聚类中心点作为所述n个目标中心点;其中,所述条件包括:所述相似度按照从大到小的顺序排在前n位,或者所述相似度超过相似度阈值。
可选地,所述内容匹配模块740,用于:分别获取各个所述目标中心点的倒排链,所述目标中心点的倒排链中包括以所述目标中心点为聚类中心的至少一个内容的标识;根据各个所述目标中心点的倒排链,从以所述目标中心点为聚类中心的至少一个内容中,搜索获取与所述搜索关键词相匹配的所述r个内容。
可选地,所述结果生成模块750,用于:生成所述r个内容的推荐分值,所述推荐分值用于指示所述内容适合推荐的程度;根据所述r个内容的推荐分值,从所述r个内容中选择至少一个目标内容作为所述搜索结果。
可选地,如图8所示,所述装置700还包括:内容抽样模块760,用于从所述内容集合中抽样选取y个内容,所述内容集合中包括x个内容,所述x大于所述y,且所述x和所述y均为正整数;内容处理模块770,用于对所述y个内容进行聚类处理,得到所述z个聚类中心点;相似度计算模块780,用于对于所述内容集合中的第i个内容,计算所述第i个内容的内容特征向量与各个所述聚类中心点的内容特征向量之间的相似度,所述i为小于或等于所述x的正整数;内容添加模块790,用于选择与所述第i个内容的内容特征向量之间的相似度最大的聚类中心点,并将所述第i个内容的标识添加至所述相似度最大的聚类中心点的聚类集合中。
综上所述,通过根据特征向量从多个聚类中心点中选择至少一个目标中心点,然后根据搜索关键词从上述目标中心点的聚类集合中选择相匹配的内容,最后根据选择的内容生成搜索结果,扩展了一种搜索查询的方式,并且本申请实施例中多个聚类中心点是从内容集合中选取的多个内容,实现了从内容集合的海量内容中,预先选择一些具有代表性的内容作为聚类中心点,然后在这些聚类中心点及其所在的聚类集合的基础上进行后续的搜索查询过程,提升了系统的处理速度,减少了搜索查询过程的耗时。
另外,本申请实施例提供的技术方案,与搜索关键词相匹配的内容是基于倒排链搜索获取的,通过倒排链搜索获取可以加快搜索速度、提升搜索效率。
另外,本申请实施例提供的技术方案中,在根据多个内容生成搜索结果的过程中,会生成这多个内容的推荐分值,然后根据推荐分值从多个内容中选择目标内容作为搜索结果,实现了有效筛选多个内容,将推荐分值较高的内容作为搜索结果,使得搜索结果更加准确。
请参考图9,其示出了本申请一个实施例提供的内容搜索装置的框图。该装置具有实现上述图6所示方法示例的功能,所述功能可以由硬件实现,也可以由硬件执行相应的软件实现。该装置可以是上文介绍的计算机设备,如终端或服务器。该装置900可以包括:关键词获取模块910、向量获取模块920、中心点选取模块930、内容匹配模块940和结果生成模块950。
关键词获取模块910,用于获取目标用户帐号输入的搜索关键词。
向量获取模块920,用于获取所述目标用户帐号的用户特征向量。
中心点选取模块930,用于根据所述用户特征向量,从z个聚类中心点中选择n个目标中心点,所述z个聚类中心点是从内容集合中选取的z个内容,所述z为正整数,所述n为小于或等于所述z的正整数。
内容匹配模块940,用于从所述n个目标中心点的聚类集合中,搜索获取与所述搜索关键词相匹配的r个内容,其中,每个所述目标中心点的聚类集合中包括至少一个内容,所述r为正整数。
结果生成模块950,用于根据所述r个内容生成搜索结果。
综上所述,通过根据目标用户帐号的用户特征向量从多个聚类中心点中选择至少一个目标中心点,然后根据目标用户帐号输入的搜索关键词从上述目标中心点的聚类集合中选择相匹配的内容,最后根据选择的内容生成搜索结果,扩展了一种搜索查询的方式,并且本申请实施例中多个聚类中心点是从内容集合中选取的多个内容,实现了从内容集合的海量内容中,预先选择一些具有代表性的内容作为聚类中心点,然后在这些聚类中心点及其所在的聚类集合的基础上进行后续的搜索查询过程,提升了系统的处理速度,减少了搜索查询过程的耗时。
另外,本申请实施例提供的技术方案,与搜索关键词相匹配的内容是基于倒排链搜索获取的,通过倒排链搜索获取可以加快搜索速度、提升搜索效率。
另外,本申请实施例提供的技术方案中,在根据多个内容生成搜索结果的过程中,会生成这多个内容的推荐分值,然后根据推荐分值从多个内容中选择目标内容作为搜索结果,实现了有效筛选多个内容,将推荐分值较高的内容作为搜索结果,使得搜索结果更加准确。
需要说明的是,上述实施例提供的装置,在实现其功能时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将设备的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的装置与方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
请参考图10,其示出了本申请实施例提供的计算机设备的结构框图。该计算机设备可以用于实施上述实施例中提供的内容搜索方法。例如,该计算机设备可以上文所述的服务器,也可以是上文所述的终端。具体来讲:
该计算机设备1000包括处理单元(如CPU(Central Processing Unit,中央处理器)、GPU(Graphics Processing Unit,图形处理器)和FPGA(Field Programmable GateArray,现场可编程逻辑门阵列)等)1001、包括RAM(Random-Access Memory,随机存储器)1002和ROM(Read-Only Memory,只读存储器)1003的系统存储器1004,以及连接系统存储器1004和中央处理单元1001的系统总线1005。该计算机设备1000还包括帮助服务器内的各个器件之间传输信息的基本输入/输出系统(Input output system,I/O系统)1006,和用于存储操作系统1013、应用程序1014和其他程序模块1015的大容量存储设备1007。
该基本输入/输出系统1006包括有用于显示信息的显示器1008和用于用户输入信息的诸如鼠标、键盘之类的输入设备1009。其中,该显示器1008和输入设备1009都通过连接到系统总线1005的输入输出控制器1010连接到中央处理单元1001。该基本输入/输出系统1006还可以包括输入输出控制器1010以用于接收和处理来自键盘、鼠标、或电子触控笔等多个其他设备的输入。类似地,输入输出控制器1010还提供输出到显示屏、打印机或其他类型的输出设备。
该大容量存储设备1007通过连接到系统总线1005的大容量存储控制器(未示出)连接到中央处理单元1001。该大容量存储设备1007及其相关联的计算机可读介质为计算机设备1000提供非易失性存储。也就是说,该大容量存储设备1007可以包括诸如硬盘或者CD-ROM(Compact Disc Read-Only Memory,只读光盘)驱动器之类的计算机可读介质(未示出)。
不失一般性,该计算机可读介质可以包括计算机存储介质和通信介质。计算机存储介质包括以用于存储诸如计算机可读指令、数据结构、程序模块或其他数据等信息的任何方法或技术实现的易失性和非易失性、可移动和不可移动介质。计算机存储介质包括RAM、ROM、EPROM(Erasable Programmable Read-Only Memory,可擦写可编程只读存储器)、EEPROM(Electrically Erasable Programmable Read-Only Memory,电可擦写可编程只读存储器)、闪存或其他固态存储其技术,CD-ROM、DVD(Digital Video Disc,高密度数字视频光盘)或其他光学存储、磁带盒、磁带、磁盘存储或其他磁性存储设备。当然,本领域技术人员可知该计算机存储介质不局限于上述几种。上述的系统存储器1004和大容量存储设备1007可以统称为存储器。
根据本申请实施例,该计算机设备1000还可以通过诸如因特网等网络连接到网络上的远程计算机运行。也即计算机设备1000可以通过连接在该系统总线1005上的网络接口单元1011连接到网络1012,或者说,也可以使用网络接口单元1011来连接到其他类型的网络或远程计算机系统(未示出)。
该存储器还包括计算机程序,该计算机程序存储于存储器中,且经配置以由一个或者一个以上处理器执行,以实现上述内容搜索方法。
在示例性实施例中,还提供了一种非临时性计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时以实现上述内容搜索方法。
可选地,该计算机可读存储介质可以包括:ROM(Read-Only Memory,只读存储器)、RAM(Random-Access Memory,随机存储器)、SSD(Solid State Drives,固态硬盘)或光盘等。其中,随机存取记忆体可以包括ReRAM(Resistance Random Access Memory,电阻式随机存取记忆体)和DRAM(Dynamic Random Access Memory,动态随机存取存储器)。
在示例性实施例中,还提供一种计算机程序产品,所述计算机程序产品被处理器执行时,用于实现上述内容搜索方法。
应当理解的是,在本文中提及的“多个”是指两个或两个以上。“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。另外,本文中描述的步骤编号,仅示例性示出了步骤间的一种可能的执行先后顺序,在一些其它实施例中,上述步骤也可以不按照编号顺序来执行,如两个不同编号的步骤同时执行,或者两个不同编号的步骤按照与图示相反的顺序执行,本申请实施例对此不作限定。
以上所述仅为本申请的示例性实施例,并不用以限制本申请,凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。
Claims (10)
1.一种内容搜索方法,其特征在于,所述方法包括:
获取搜索关键词;
获取特征向量;
根据所述特征向量,从z个聚类中心点中选择n个目标中心点,所述z个聚类中心点是从内容集合中选取的z个内容,所述z为正整数,所述n为小于或等于所述z的正整数;
从所述n个目标中心点的聚类集合中,搜索获取与所述搜索关键词相匹配的r个内容,其中,每个所述目标中心点的聚类集合中包括至少一个内容,所述r为正整数;
根据所述r个内容生成搜索结果。
2.根据权利要求1所述的方法,其特征在于,所述根据所述特征向量,从z个聚类中心点中选择n个目标中心点,包括:
分别计算所述特征向量与每个所述聚类中心点的内容特征向量之间的相似度;
从所述z个聚类中心点中,选择所述相似度符合条件的n个聚类中心点作为所述n个目标中心点;
其中,所述条件包括:所述相似度按照从大到小的顺序排在前n位,或者所述相似度超过相似度阈值。
3.根据权利要求1所述的方法,其特征在于,所述从所述n个目标中心点的聚类集合中,搜索获取与所述搜索关键词相匹配的r个内容,包括:
分别获取各个所述目标中心点的倒排链,所述目标中心点的倒排链中包括以所述目标中心点为聚类中心的至少一个内容的标识;
根据各个所述目标中心点的倒排链,从以所述目标中心点为聚类中心的至少一个内容中,搜索获取与所述搜索关键词相匹配的所述r个内容。
4.根据权利要求1所述的方法,其特征在于,所述根据所述r个内容生成搜索结果,包括:
生成所述r个内容的推荐分值,所述推荐分值用于指示所述内容适合推荐的程度;
根据所述r个内容的推荐分值,从所述r个内容中选择至少一个目标内容作为所述搜索结果。
5.根据权利要求1至4任一项所述的方法,其特征在于,所述根据所述特征向量,从z个聚类中心点中选择n个目标中心点之前,还包括:
从所述内容集合中抽样选取y个内容,所述内容集合中包括x个内容,所述x大于所述y,且所述x和所述y均为正整数;
对所述y个内容进行聚类处理,得到所述z个聚类中心点;
对于所述内容集合中的第i个内容,计算所述第i个内容的内容特征向量与各个所述聚类中心点的内容特征向量之间的相似度,所述i为小于或等于所述x的正整数;
选择与所述第i个内容的内容特征向量之间的相似度最大的聚类中心点,并将所述第i个内容的标识添加至所述相似度最大的聚类中心点的聚类集合中。
6.一种内容搜索方法,其特征在于,所述方法包括:
获取目标用户帐号输入的搜索关键词;
获取所述目标用户帐号的用户特征向量;
根据所述用户特征向量,从z个聚类中心点中选择n个目标中心点,所述z个聚类中心点是从内容集合中选取的z个内容,所述z为正整数,所述n为小于或等于所述z的正整数;
从所述n个目标中心点的聚类集合中,搜索获取与所述搜索关键词相匹配的r个内容,其中,每个所述目标中心点的聚类集合中包括至少一个内容,所述r为正整数;
根据所述r个内容生成搜索结果。
7.一种内容搜索装置,其特征在于,所述装置包括:
关键词获取模块,用于获取搜索关键词;
向量获取模块,用于获取特征向量;
中心点选取模块,用于根据所述特征向量,从z个聚类中心点中选择n个目标中心点,所述z个聚类中心点是从内容集合中选取的z个内容,所述z为正整数,所述n为小于或等于所述z的正整数;
内容匹配模块,用于从所述n个目标中心点的聚类集合中,搜索获取与所述搜索关键词相匹配的r个内容,其中,每个所述目标中心点的聚类集合中包括至少一个内容,所述r为正整数;
结果生成模块,用于根据所述r个内容生成搜索结果。
8.一种内容搜索装置,其特征在于,所述装置包括:
关键词获取模块,用于获取目标用户帐号输入的搜索关键词;
向量获取模块,用于获取所述目标用户帐号的用户特征向量;
中心点选取模块,用于根据所述用户特征向量,从z个聚类中心点中选择n个目标中心点,所述z个聚类中心点是从内容集合中选取的z个内容,所述z为正整数,所述n为小于或等于所述z的正整数;
内容匹配模块,用于从所述n个目标中心点的聚类集合中,搜索获取与所述搜索关键词相匹配的r个内容,其中,每个所述目标中心点的聚类集合中包括至少一个内容,所述r为正整数;
结果生成模块,用于根据所述r个内容生成搜索结果。
9.一种计算机设备,其特征在于,所述计算机设备包括处理器和存储器,所述存储器中存储有计算机程序,所述计算机程序由所述处理器加载并执行以实现如权利要求1至5任一项所述的内容搜索方法,或实现如权利要求6所述的内容搜索方法。
10.一种非临时性计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至5任一项所述的内容搜索方法,或实现如权利要求6所述的内容搜索方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911197737.6A CN111582967A (zh) | 2019-11-29 | 2019-11-29 | 内容搜索方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911197737.6A CN111582967A (zh) | 2019-11-29 | 2019-11-29 | 内容搜索方法、装置、设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111582967A true CN111582967A (zh) | 2020-08-25 |
Family
ID=72111374
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911197737.6A Pending CN111582967A (zh) | 2019-11-29 | 2019-11-29 | 内容搜索方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111582967A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112508512A (zh) * | 2020-11-26 | 2021-03-16 | 国网河北省电力有限公司经济技术研究院 | 电网工程造价数据管理方法、装置及终端设备 |
CN117725324A (zh) * | 2024-02-08 | 2024-03-19 | 腾讯科技(深圳)有限公司 | 地图搜索方法及装置、电子设备、存储介质、程序产品 |
-
2019
- 2019-11-29 CN CN201911197737.6A patent/CN111582967A/zh active Pending
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112508512A (zh) * | 2020-11-26 | 2021-03-16 | 国网河北省电力有限公司经济技术研究院 | 电网工程造价数据管理方法、装置及终端设备 |
CN112508512B (zh) * | 2020-11-26 | 2022-09-09 | 国网河北省电力有限公司经济技术研究院 | 电网工程造价数据管理方法、装置及终端设备 |
CN117725324A (zh) * | 2024-02-08 | 2024-03-19 | 腾讯科技(深圳)有限公司 | 地图搜索方法及装置、电子设备、存储介质、程序产品 |
CN117725324B (zh) * | 2024-02-08 | 2024-05-24 | 腾讯科技(深圳)有限公司 | 地图搜索方法及装置、电子设备、存储介质、程序产品 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108304444B (zh) | 信息查询方法及装置 | |
WO2021068610A1 (zh) | 资源推荐的方法、装置、电子设备及存储介质 | |
CN105808685B (zh) | 推广信息的推送方法及装置 | |
WO2018041168A1 (zh) | 信息推送方法、存储介质和服务器 | |
JP5575902B2 (ja) | クエリのセマンティックパターンに基づく情報検索 | |
CN106959965B (zh) | 一种信息处理方法及服务器 | |
US9747305B2 (en) | Image search device, image search method, program, and computer-readable storage medium | |
US20150242497A1 (en) | User interest recommending method and apparatus | |
US20160203191A1 (en) | Recommendation system with metric transformation | |
CN112307366B (zh) | 一种信息展示的方法、装置及计算机存储介质 | |
CN108595688A (zh) | 基于在线学习的潜在语义跨媒体哈希检索方法 | |
CN110909182A (zh) | 多媒体资源搜索方法、装置、计算机设备及存储介质 | |
CN104991959A (zh) | 一种基于内容检索相同或相似图像的方法与系统 | |
KR102654884B1 (ko) | 대화형 정보 제공 서비스 방법 및 이를 위한 장치 | |
CN111325245B (zh) | 重复图像识别方法、装置、电子设备及计算机可读存储介质 | |
CN106407349A (zh) | 一种产品推荐方法及装置 | |
US20150066957A1 (en) | Image search device, image search method, program, and computer-readable storage medium | |
CN107203558B (zh) | 对象推荐方法和装置、推荐信息处理方法和装置 | |
CN102081666B (zh) | 用于分布式图片搜索的索引构建方法和装置 | |
CN111858922A (zh) | 服务方信息查询方法、装置、电子设备以及存储介质 | |
CN111582967A (zh) | 内容搜索方法、装置、设备及存储介质 | |
CN109241360B (zh) | 组合字符串的匹配方法及装置和电子设备 | |
CN111400301B (zh) | 一种数据查询方法、装置及设备 | |
CN114780606A (zh) | 一种大数据挖掘方法及系统 | |
CN113327132A (zh) | 多媒体推荐方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |