CN104951468A - 数据搜索处理方法和系统 - Google Patents

数据搜索处理方法和系统 Download PDF

Info

Publication number
CN104951468A
CN104951468A CN201410123992.7A CN201410123992A CN104951468A CN 104951468 A CN104951468 A CN 104951468A CN 201410123992 A CN201410123992 A CN 201410123992A CN 104951468 A CN104951468 A CN 104951468A
Authority
CN
China
Prior art keywords
sequence
object search
search
interval
sequence point
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201410123992.7A
Other languages
English (en)
Inventor
沈晶晶
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Group Holding Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN201410123992.7A priority Critical patent/CN104951468A/zh
Priority to TW103118582A priority patent/TWI648642B/zh
Priority to JP2016553665A priority patent/JP2017509070A/ja
Priority to PCT/US2015/022048 priority patent/WO2015148393A1/en
Priority to US14/665,997 priority patent/US20150278341A1/en
Publication of CN104951468A publication Critical patent/CN104951468A/zh
Priority to HK15111820.6A priority patent/HK1211104A1/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/285Clustering or classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0277Online advertisement
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs
    • G06F16/24578Query processing with adaptation to user needs using ranking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/907Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/907Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/908Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9538Presentation of query results

Abstract

本申请提供一种数据搜索处理方法和系统。其中,该方法包括:基于第一排序模型获得搜索结果中的各搜索对象的第一排序分,并将第一排序分划分成多个区间;根据该第一排序分将各搜索对象归类到各个区间对应的搜索对象集合中;确定每个区间对应的搜索对象集合中具有预设标记的搜索对象;基于第二排序模型获得所述具有预设标记的搜索对象的第二排序分;利用该第二排序分调整所述具有预设标记的搜索对象在其对应区间的搜索对象集合中的排序。由此,在保证搜索结果相关性的前提下提高了返回搜索结果展示的一致性和连续性效果,为用户提供良好的一致性体验,且简化了算法降低数据处理复杂度、提高效率和系统处理性能。

Description

数据搜索处理方法和系统
技术领域
本申请涉及数据搜索领域,尤其涉及一种数据搜索处理方法和系统。
背景技术
随着互联网技术的发展,越来越多的用户通过网络访问进行数据搜索,并获得反馈的搜索结果。根据搜索请求执行搜索并提供结果的服务器端的数据搜索处理技术对实现用户的搜索目的起着重要作用,比如,如何对搜索结果处理以得到最符合用户需求的结果,如何处理搜索结果以提高服务器的处理性能,优化数据管理效率等。现有的搜索处理技术,根据用户的搜索请求,由搜索引擎、关联引擎分别根据查询词(如:关键词)找到,即搜索引擎找到数据对象、扩展引擎找到基于数据对象的扩展信息,然后,将数据对象和基于数据对象的扩展信息进行处理调整后一并返回输出,如:将找到的基于数据对象的扩展信息嵌入到找到的数据对象结果中,一并展示给输入查询词的用户。
常见的一种应用即为商品搜索引擎中,将收费广告内嵌到搜索结果内,具体地,如图1A所示。(1)用户通过浏览器访问商品搜索网站,输入商品查询词,并按下搜索按钮请求搜索。(2)浏览器访问网站的应用服务器。(3)应用服务器向广告引擎请求针对这次搜索的广告结果(基于商品的广告创意结果),同时还向搜索引擎请求针对这次搜索的商品搜索结果;(i)其中,广告引擎按照一定的逻辑返回广告结果,比如:按照查询词来匹配广告主购买的关键字,得到符合条件的广告商品,然后按照广告预期最大收益(类似考虑广告出价、匹配度、创意质量等)来决定排序,取前m(top m)个广告商品的广告创意作为结果返回;(ii)其中,搜索引擎按照一定的逻辑返回搜索结果,比如:按照查询词来匹配商品的文本描述,得到符合条件的商品,然后按照相关性、商品质量等维度而计算出的商品与发出搜索请求的用户的需求的匹配程度,来决定输出的商品排序,取前n(top n)个商品作为结果返回。(4)应用服务器取得广告结果和搜索的商品结果,进行计算,比如从搜索的商品结果中滤除广告结果中已经存在的对应商品(广告商品);对计算后的结果进行合并,调整排序;对页面进行渲染,返回结果到浏览器以展示给发出搜索请求的用户。
由图1A的过程,搜索结果返回输出,以“商品交易平台搜索”为例子,将收费广告展现在搜索到的商品旁边,如头部、尾部、右边栏等,作为搜索结果的一部分,如图2所示的右边栏。这里,广告部分独立展示,可以由浏览器直接访问来自广告引擎取得的广告结果,直接展现在相应的广告位置,能缩短页面处理时间。另外,还可以由图1B所示的搜索结果返回输出方式,如图3所示“竞价排名”展示,收费广告内嵌到搜索结果中,输出搜索结果到网页时,收费广告还用一方框圈定。这里,广告结果和搜索结果混在一起,将得到的广告结果以及得到的搜索结果做混排后(如利用混合排序服务器),应用服务器再将混排的结果传到浏览器。
两种搜索处理后的展示输出方式,都是在一个页面中展示搜索引擎的结果和广告引擎的结果。但是,两种方式都存在一定缺陷。
其一,由于最终展现的结果为两个引擎的结果合并产生,而两个引擎对应的商品集合不同,排序算法不同,最终返回的结果展示出现不连续、不相关的不良效果,导致用户的体验不一致,尤其在混排广告结果和搜索结果的时候更突出,因此,由于两个引擎采用的排序逻辑不一致,导致最终返回输出的结果效果差、缺乏连续性和相关性,进而导致用户体验不一致的缺陷。
例如:商品总的集合为A、B、C、D、E、F,其中参加广告的商品集合为C、D、E,则搜索引擎的商品集合为商品全集A~F,广告引擎的商品集合为广告商品C~D。用户发起的搜索存在的可能性有:搜索引擎返回结果A、C、F,广告引擎返回结果C、E,混排后展示给用户ACEF。由于ACF按照搜索引擎排序规则展示,E插入其中后会迷惑用户判断。从广告排序角度看即使E的文本描述和用户查询词无密切关联,如果E出价很高仍会返回给用户,此时整体结果给用户的体验是相关性差、不连续、不一致。
其二,现有技术中,应用服务器需要请求两个引擎,两个引擎的目标不一致,各自考虑的排序条件就不一致,返回输出最终结果需要对两个引擎的目标结果进行合并、去重等操作,从而导致同样对象的最终排序不一致,因而,导致增加了混排、去重等繁琐的运算处理,加大计算机系统的复杂度、以及造成计算机系统处理效率低下。
因此,需要对现有技术的上述数据搜索处理的方案进行改进以提高效率、为用户提供一致而良好的用户体验。
发明内容
本申请的主要目的在于提供一种数据搜索处理方法和系统,以解决在保证搜索结果相关性的前提下,提高返回搜索结果展示的一致性和连续性效果等技术问题,以为用户提供良好的一致性体验;进一步,减少了复杂的混排去重等算法以解决降低数据处理复杂度、提高数据处理效率、提升数据搜索处理系统性能等技术问题。其中:
本申请的一方面提供的一种数据搜索处理方法,包括:基于第一排序模型获得搜索结果中的各搜索对象的第一排序分;将该第一排序分划分成多个区间,根据该第一排序分将各搜索对象归类到各个区间对应的搜索对象集合中;确定每一个区间对应的搜索对象集合中具有预设标记的搜索对象;基于第二排序模型获得所述具有预设标记的搜索对象的第二排序分;利用该第二排序分调整所述具有预设标记的搜索对象在其对应区间的搜索对象集合中的排序。
其中,基于第一排序模型获得搜索结果中的各搜索对象的第一排序分,包括:根据用户输入的关键词获得所述搜索结果,基于所述第一排序模型计算搜索结果中每个搜索对象与关键词的相关性,以获取的相关性值作为第一排序分。
其中,将该第一排序分划分成多个区间,根据该第一排序分将各搜索对象归类到各个区间对应的搜索对象集合中,包括:设置一个或多个相关性阈值,将该第一排序分对应所述相关性阈值,划分成多个区间;每个搜索对象依据其第一排序分所属的区间,归类到该所属区间对应的搜索对象集合中。
其中,所述具有预设标记的搜索对象,包括:基于该搜索对象的扩展信息以及与扩展信息相关的记录,所述预设标记用于标识该搜索对象包含所述扩展信息;利用该第二排序分调整所述具有预设标记的搜索对象在其所属的、对应区间的搜索对象集合中的排序,包括:将完成排序调整的搜索结果返回给用户,同时,将所述具有预设标记的搜索对象的扩展信息返回给用户。
其中,基于第二排序模型获得所述具有预设标记的搜索对象的第二排序分,包括:所述第二排序模型利用所述记录,对所述具有预设标记的搜索对象计算第二排序分;利用该第二排序分调整所述具有预设标记的搜索对象在其所属的、对应区间的搜索对象集合中的排序,包括:在每个区间对应的搜索对象集合中,具有预设标记的搜索对象利用其第二排序分,确定其新的排序位置,以调整该搜索对象集合中所有的搜索对象的排序位置。
本申请另一方面提供一种数据搜索处理系统,包括:第一排序分模块,基于第一排序模型获得搜索结果中的各搜索对象的第一排序分;归类模块,将该第一排序分划分成多个区间,根据该第一排序分将各搜索对象归类到各个区间对应的搜索对象集合中;确定模块,确定每一个区间对应的搜索对象集合中具有预设标记的搜索对象;第二排序分模块,基于第二排序模型获得所述具有预设标记的搜索对象的第二排序分;排序调整模块,利用该第二排序分调整所述具有预设标记的搜索对象在其所属的、对应区间的搜索对象集合中的排序。
其中,第一排序分模块,包括:根据用户输入的关键词获得所述搜索结果,基于所述第一排序模型计算搜索结果中每个搜索对象与关键词的相关性,以获取的相关性值作为第一排序分。
其中,归类模块,包括:设置一个或多个相关性阈值,将该第一排序分对应所述相关性阈值,划分成多个区间;每个搜索对象依据其第一排序分所属的区间,归类到该所属区间对应的搜索对象集合中。
其中,所述具有预设标记的搜索对象,包括:基于该搜索对象的扩展信息以及与扩展信息相关的记录,所述预设标记用于标识该搜索对象包含所述扩展信息;排序调整模块,包括:将完成排序调整的搜索结果返回给用户,同时,将所述具有预设标记的搜索对象的扩展信息返回给用户。
其中,第二排序分模块,包括:所述第二排序模型利用所述记录,对所述具有预设标记的搜索对象计算第二排序分;排序调整模块,包括:在每个区间对应的搜索对象集合中,具有预设标记的搜索对象利用其第二排序分,确定其新的排序位置,以调整该搜索对象集合中所有的搜索对象的排序位置。
与现有技术相比,根据本申请的技术方案,通过将基于数据对象的扩展信息直接由统一的搜索引擎执行搜索一并返回,避免了用户体验的不一致,并且,能保证兼顾结果相关性以及具有扩展信息的数据对象的优先展示权。而利用划分区间方式对排序做小范围调整,无需复杂算法,实现简单。进一步说,通过搜索引擎直接搜索得出数据对象结果和基于数据对象的扩展信息,采用一致的排序规则,既达到了数据处理的优化以及相应的数据处理系统的优化,还达到用户体验统一、有效地提升用户体验的目的。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1A~1B是现有的数据搜索处理技术的应用示意图;
图2和图3是现有的数据搜索处理技术返回输出搜索结果的展示效果示意图;
图4是本申请的数据搜索处理方法的一实施例的流程图;
图5是本申请的数据搜索处理方法的应用的一实施例的示意图;
图6是本申请数据搜索处理方法的一实施例中对搜索对象进行排序的一实施例的流程图;
图7是本申请数据搜索处理方法的一实施例的预设标记的一应用示意图
图8是本申请的数据搜索处理系统的一实施例的结构框图。
具体实施方式
本申请的主要思想在于,在搜索过程中匹配数据对象和用户查询词,根据数据对象与用户查询词的相关性获得排序分;设定若干相关性阈值将排序分划分成若干区间,搜索到的数据对象(搜索对象)归入对应的区间的搜索对象集合;然后,引入与基于数据对象的扩展信息相关的各种记录作为影响搜索对象的排序的因素,例如出价因素,利用影响因素,可以在每个搜索对象所属的相关性阈值区间对应的搜索对象集合中,进行排序的调整。由两次排序统一于一次搜索处理过程中,既保证搜索结果相关性,又提高返回搜索结果展示的一致性和连续性效果,并且,减少了复杂的混排去重等算法以解决降低数据处理复杂度、提高数据处理效率、提升数据搜索处理系统性能,简化处理过程能有效提高系统处理效率和运算性能,还为用户提供良好的一致性体验。本申请的应用,比如,商品搜索中,可以将广告主基于商品的广告创意放入商品的搜索引擎,在搜索环境中仅需要使用搜索引擎即可统一返回搜索结果和广告结果,在搜索结果中直接商业化,还能在保证搜索结果相关性的前提下,提升广告商品在搜索结果中的位置,进而有效对搜索引擎商业化。
为使本申请的目的、技术方案和优点更加清楚,下面将结合本申请具体实施例及相应的附图对本申请技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
根据本申请的实施例,提供了一种数据搜索处理方法。
参考图4,图4是本申请的数据搜索处理方法的实施例的流程图400。
在步骤S410处,根据用户输入的关键词获得搜索结果。
如图5所示本申请的数据搜索处理方法的应用的一实施例的示意图。
用户通过浏览器访问搜索平台,如商品搜索平台。用户可以在开启的浏览器上输入查询词并发出搜索请求,如输入商品名称并按下搜索按钮。该浏览器访问该搜索平台的应用服务器,该应用服务器接收到该搜索请求。该应用服务器向搜索引擎请求针对本次搜索请求执行搜索。搜索引擎利用查询词预处理后得到的关键词,执行搜索,以获得搜索结果。
其中,搜索引擎在其全部数据对象的总的集合中,利用关键词对各个数据对象的文本描述做匹配,比如,对关键词与数据对象的文本描述的相似度进行计算等检索模型,找到与该关键词相关程度高(相关性)的文本描述,由此确定对应该文本描述的数据对象是被搜索到的结果。这些被搜索到的数据对象即为匹配关键词的数据对象,作为搜索结果中的各个搜索对象。这里的相关性即搜索相关性或检索相关性。
其中,有的数据对象具有基于该数据对象的扩展信息,对于这类具有扩展信息的搜索对象,可以预设标记进行标识,以便区别于不具有扩展信息的搜索对象。进一步,对应具有扩展信息的数据对象存储该扩展信息。进一步,还可以存有与具有扩展信息的数据对象相关的各种记录。
以商品搜索为例,用户通过浏览器输入关键词如商品名称,并按下搜索按钮,由该浏览器访问到商品搜索平台的应用服务器,该商品名称传递到应用服务器。再由应用服务器向搜索引擎请求执行本次商品搜索,如通过检索模型(基于代数论的IR模型、基于概率统计的IR模型、基于集合论的IR模型、基于统计的机器学习模型等)的相似度计算,查找到所有与本次搜索的关键词即该商品名称相匹配的商品描述,获取对应这些商品描述的商品(数据对象)。其中,有的商品属于广告商品,即该商品还对应有广告创意(基于数据对象的扩展信息)。这类广告商品可以预设标记,与不具有广告创意的商品进行区分。
例如,图7所示本申请数据搜索处理方法的实施例的预设标记的应用示意图。广告主可以通过广告系统来管理其广告商品,广告主针对其要做广告的商品(即广告商品)编辑广告创意,并进行出价。广告商品和相应的出价会实时进入搜索离线处理系统,与原有的离线处理数据进行合并,比如,对搜索商品集合中的当前投放状态正常的广告商品做标记,同时记录下对应的广告创意和出价。搜索离线处理系统合并后的数据对象可以进入搜索引擎的大集合中,提供给搜索引擎进行搜索服务。如果搜索引擎搜索到这些广告商品,这些广告商品都具有预设标记。
在步骤S420处,对获得的搜索结果中的搜索对象进行排序。
具体地,搜索引擎可以首先按照搜索排序逻辑对搜索结果进行排序,然后,根据预先设定的相关性阈值取满足对应该阈值的条件的该搜索结果中的搜索对象,并且,针对搜索结果中的具有预设标记的搜索对象,根据其记录来调整排序次序,将调整后的搜索结果返回(如返回给应用服务器等)。
其中,相关性阈值的选择需要保证不影响搜索相关性。比如,将搜索引擎搜索时的关键词与数据对象的文本描述的相关性和一系列其他因素的线性组合来确定搜索到的数据对象(搜索对象)的排序次序的数值(分值),即排序分(例如1-100分,100分排在第一位),以该线性组合的分值情况来选择相关性阈值。这样,可以把分值在一定阈值内的搜索对象根据诸如带有预设标记的各种情况等重新排序,从而既避免影响到原本的搜索体验、又考虑了预设标记的搜索对象的实际需求。
例如:商品搜索引擎对结果排序,可以将搜索时计算的关键词与文本相关性和一系列商业数值(例:过去30天的销量,退货率等)的线性组合来确定排序次序,则可以由此去选择相关性阈值。
承前述商品搜索例,搜索引擎首先按照例如布尔模型、向量空间模型、概率模型、语言模型或机器学习排序模型等,计算商品的文本描述与用户查询词的相似度,即通过相似度计算确定相关性,假定能匹配得到商品A~I,并对商品A~I排序,得到序列为ABCDEFGHI,而每个商品都有一个排序分。然后预先设定相关性阈值为“20分”,取满足排序分大于等于20分的此条件的前6个商品A~F放在相关性较高的分值区间,即满足相关性阈值的搜索结果为商品ABCDEF,而小于“20分”的商品G、H、I则划入相关性较低的分值区间。进而,在大于等于20分的区间,针对搜索到的商品A~F中具有预设标记的标识当前投放状态正常的广告商品C、E、F,依据其出价记录等,调整C、E、F的排序次序为E、C、F,然后将调整次序后的商品返回按次序输出为EABCDF;同样,在小于20分的区间,针对搜索到的商品G、H、I中具有预设标记的当前投放状态正常的广告商品H、I,依据其出价记录等,调整排序次序为IGH。
在一个实施例中,参考图6所示本申请数据搜索处理方法的一实施例中对搜索对象进行排序的一实施例的流程图(步骤S420),介绍对获得的搜索结果中的搜索对象进行排序以及排序调整的处理方式。
在步骤S610处,基于第一排序模型获得搜索结果中的各搜索对象的第一排序分。
其中,第一排序模型,是根据用户查询词所划分出的关键词,在匹配文档的过程中,经过检索模型的相似度计算找到数据对象(即搜索对象)。该相似度计算,也即找出关键词与数据对象的相关性、相关程度,即对相关性的计算。在一个实施方式中,可以依据相似度计算,来获得每个搜索对象的相关性的数值/分值作为排序分;在另一个实施方式中,可以依据相似度计算而获得的每个搜索对象的相关性和一系列其他因素的线性组合运算,来确定每个搜索对象的排序分。进而,根据排序分确定每个搜索对象排序输出的一种数学模型,或者说,是搜索数据对象以及对搜索结果(搜索到的所有数据对象)进行排序的一种搜索排序逻辑。
其中,通过该第一排序模型的排序运算获得搜索结果中的每个搜索对象的排序分,称为第一排序分。第一排序模型,可以采用语言模型、概率模型、布尔模型、机器训练模型等,计算出每个搜索对象的排序分。
承上述商品搜索例,为简单清楚起见,仅以相似度计算得到相关性的数值/分值来说明。商品搜索引擎会根据用户的查询词(可以划分为几个关键词),利用检索模型进行搜索匹配,如利用布尔模型、向量空间模型等将查询词与每个商品的文本描述做相似度计算得到被搜索到的商品A~I的排序分,即基于第一排序模型获得搜索结果中的各商品的第一排序分。
在步骤S620处,将该第一排序分划分成多个区间,根据该第一排序分将各搜索对象归类到各个区间对应的搜索对象集合中。
将第一排序分划分成多个区间,可以通过预先设置若干相关性阈值如“20分”、“10分”等来进行。例如,将第一排序分划分成:区间一“大于等于20分”,区间二“大于等于10分且小于20分”,区间三“小于10分”三个区间。这样,每个区间都预设有阈值,可以将每个搜索对象的第一排序分与该阈值比较,确定该第一排序分是否落入该区间,一旦落入,则该第一排序分对应的搜索对象,就可以归入该区间对应的搜索对象集合中。
承上述商品搜索例,商品A~I中,假定预设阈值“20分”,将第一排序分划分成两个区间,大于等于20分的第一区间和小于20分的第二区间。商品G、H、I的第一排序分依次为19、18、17,则归入第二区间对应的商品集合II={G,H,I},其中,H、I是当前投放状态正常的广告商品;而商品ABCDEF的第一排序分依次从大到小且均大于20,则归入第一区间对应的商品集合I={A,B,C,D,E,F},其中,C、E、F是当前投放状态正常的广告商品。
在步骤S630处,确定每一个区间对应的搜索对象集合中具有预设标记的搜索对象。
每一个区间对应的搜索对象集合中,都具有一个或多个搜索对象,其中有的搜索对象还具有预设标记,通过预设标记,能标识该搜索对象(即该数据对象)具有基于数据对象的扩展信息,并且这些扩展信息正常无误即为正常状态。
承上述商品搜索例,商品集合I={A,B,C,D,E,F}中,C、E、F是当前投放状态正常的广告商品,商品集合II={G,H,I}中,H、I是当前投放状态正常的广告商品。广告商品所具有的预设标记,标识该商品具有基于商品的广告创意并且投放状态正常。为清晰简要地说明,下面将以商品集合I为例,可以通过预设标记在商品集合I中找出广告商品C、E、F。
在步骤S640处,基于第二排序模型获得所述具有预设标记的搜索对象的第二排序分。
在一个实施例中,对于一个区间中的具有预设标记的搜索对象,基于第二排序模型进行排序分计算。其中,第二排序模型也可以是一种排序逻辑,并且,第二排序模型可以根据实际需要进行调整和设计,此处仅为举例,本申请不应被理解为仅限于此。
比如,每个具有预设标记的搜索对象,其包括扩展信息(基于数据对象的扩展信息)、相应的各种记录等特征信息,可以利用各种记录和扩展信息来设计排序的规则或逻辑即第二排序模型,并按照这样的规则或逻辑得到第二排序分,例如:确定由哪些特征信息的数值、或者哪些特征信息做运算后得到的数值,来表示该搜索对象的排序先后即该数值作为第二排序分,该确定数值或计算数值的方式即第二排序模型。
每个区间,都可以基于第二排序模型获得具有预设标记的搜索对象的第二排序分,该第二排序分即该搜索对象调整后的排序分。
承上述商品搜索例,以第一区间对应的商品集合I中广告商品C、E、F采用按点击付费(CPC)广告模式来投放广告创意并付费为例,来说明第二排序模型的第二排序分获取(包括广告主出价、排序分计算、广告扣费等)。第二区间的商品集合II的调整类似。此处为了能清楚简要地进行说明,仅以商品集合I和调整第一名的排序为例。
广告主,即提供广告商品C、E、F的所有者。广告主出价,即广告主针对广告商品,可以对应在某个查询词/关键词下展现进行出价。该出价被记录,即步骤S410所述的对搜索商品集合中的当前投放状态正常的广告商品做标记,同时记录下对应的广告创意、针对关键词下展示的出价、收集的广告商品的广告质量得分等。如表1示出了广告主对广告商品的出价,表2示出了广告商品的广告质量得分。
表1:
商品 排序调整出价
C 1元
E 1.5元
F 0.8元
表2:
商品 质量得分
C 60
E 50
F 30
其中,设计的排序逻辑即排序公式为:预期收益(第二排序分)=出价*质量得分。另外还可以设计扣费逻辑即扣费公式为:实际扣费=下一名出价*下一名质量得分/质量得分+0.01。则得到广告商品C、E、F的第二排序分/预期收益依次为:1*60=60、1.5*50=75、0.8*30=24,则三者排序依次为2、1、3。广告商品C、E、F实际扣费依次为:24/60+0.01=0.41、60/50+0.01=1.21、0.8(最后一位即按其出价扣费)。第二排序分和实际扣费计算出来如表3所示。
表3:
商品 第二排序分 排序 实际扣费
C 60 2 0.41
E 75 1 1.21
F 24 3 0.8
另外,可以采用其他方式进行广告主出价、第二排序分计算(以便后续搜索引擎排序调整)、广告扣费等,不影响本申请的方案核心。例如:采用按每千人成本(CPM)广告模式来投放广告创意并付费,还可以直接用广告主针对千次展现的竞价进行第二排序分计算,等等。
在步骤S650处,利用该第二排序分调整所述具有预设标记的搜索对象在其所属的、对应区间的搜索对象集合中的排序。
在每个区间对应的搜索对象集合中,都可以根据需要,按照一定的规则,对其中的具有预设标记的搜索对象利用该第二排模型获得的第二排序分,来调整各自区间对应的搜索对象集合中具有预设标记的搜索对象的排序次序。
比如,某搜索对象的第二排序分即为其新的排序分,与其所属的对应区间的搜索对象集合中其他搜索对象的排序分做大小比较,分值最大,以从大到小排列,将其调整到该集合的最前位置(第一位);比如,某搜索对象的第二排序分与其所属的对应区间的搜索对象集合中,其他具有预设标记的搜索对象的第二排序分相比最大,以具有预设标记的搜索对象优先且仅调整第一位的规则,可以将其调整到该集合的最前位置,其他的搜索对象排序分大小从大到小排列;等等。
其中,对于最前位置(第一位)的调整如上述方式外,对于排序第二位、第三位、第四位等的调整,可以根据上述例子的方式类推完成。
承上述商品搜索例,对应第一区间的商品集合I中,商品A~F之前以ABCDEF方式排序,由前述计算的第二排序分可知,广告商品C、E、F中,商品E的第二排序分75最高,商品C为60分,商品F为24分最低。
一种情形,若按照广告商品优先而且仅调整第一位的规则,可以将商品E放在该商品集合I的第一位。则调整后的对应第一区间的商品集合I中各个商品的排序为EABCDF。
另一种情形,如果对广告有点击,希望收取所有广告的费用,可以对于每个区间的商品集合比如第一区间的商品集合I中的所有广告商品C、E、F,根据第二排序分都调整一遍。例1:若广告商品绝对优先,可以按照前述第二排序分调整最后排序为ECFABD。例2:若约定每个广告商品保持原有第一排序分的次序即CEF的次序,那么结合第二排序分调整,例如规定最多向前移动十分之一并取整个位置,广告商品E最多可以往前调7位(75/10并取整)、C最多往前调6位(60/10并取整)、F最多往前调2位(24/10并取整),根据原ABCDEF的排序按照C往前6位、E往前7位、F往前2位,调整为CEABFD。例3:若约定第一排序分和第二排序分叠加来调整最后排序分,假设商品ABCDEF第一排序分依次为:120、100、50、40、30、10,根据第二排序分的调整(相加),则最后排序分依次为:120、100、110、40、105、34,排序调整为:ACEBDF。
在步骤S430处,将完成排序的搜索结果返回给用户。
具体地,应用服务器从搜索引擎取得完成排序的搜索结果即调整完成的排序的搜索结果,对浏览器页面进行渲染,将搜索结果返回给浏览器。在浏览器上将以该排序规定的次序展示搜索结果中的各搜索对象。并且,对于具有预设标记的搜索对象,其还会随搜索对象(数据对象)同时返回基于该数据对象的扩展信息。
承上述商品搜索例,对应第一区间的商品集合I中,应用服务器从商品搜索引擎获得搜索到的完成排序的商品结果,对浏览器页面进行渲染,将商品结果返回给浏览器。在浏览器上对商品A~F,将以EABCDF的排序次序展示给用户。同时,广告商品E、C、F的广告创意也随广告商品E、C、F返回展示给用户。进一步,若用户对商品E的广告创意感兴趣,点击商品E则其广告主按照表3所示扣费1.21元。
图8示意性地示出了根据本申请的数据搜索处理系统的一实施例的结构框图。
根据本申请的一个实施例,该系统800可以包括:搜索模块810,根据用户输入的关键词获得搜索结果,具体实现的功能可以参见步骤S410描述的处理;排序模块820,对获得的搜索结果中的各个搜索对象进行排序,具体实现的功能可以参见步骤S420描述的处理;输出模块830,将完成排序的搜索结果返回给用户,具体实现的功能可以参见步骤S430描述的处理。
其中,排序模块820还包括:第一排序分模块(未示出),基于第一排序模型获得搜索结果中的各搜索对象的第一排序分,具体实现的功能可以参见步骤S610描述的处理;归类模块(未示出),将该第一排序分划分成多个区间,根据该第一排序分将各搜索对象归类到各个区间对应的搜索对象集合中,具体实现的功能可以参见步骤S620描述的处理;确定模块(未示出),确定每一个区间对应的搜索对象集合中具有预设标记的搜索对象,具体实现的功能可以参见步骤S630描述的处理;第二排序分模块(未示出),基于第二排序模型获得所述具有预设标记的搜索对象的第二排序分,具体实现的功能可以参见步骤S640描述的处理;排序调整模块(未示出),利用该第二排序分调整所述具有预设标记的搜索对象在其所属的、对应区间的搜索对象集合中的排序,具体实现的功能可以参见步骤S650描述的处理。
由于本实施例的系统所实现的处理及功能基本相应于前述图1~图7所示的方法实施例,故本实施例的描述中未详尽之处,可以参见前述实施例中的相关说明,在此不做赘述。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flashRAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括非暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
以上所述仅为本申请的实施例而已,并不用于限制本申请,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。

Claims (10)

1.一种数据搜索处理方法,其特征在于,包括:
基于第一排序模型获得搜索结果中的各搜索对象的第一排序分;
将该第一排序分划分成多个区间,根据该第一排序分将各搜索对象归类到各个区间对应的搜索对象集合中;
确定每一个区间对应的搜索对象集合中具有预设标记的搜索对象;
基于第二排序模型获得所述具有预设标记的搜索对象的第二排序分;
利用该第二排序分调整所述具有预设标记的搜索对象在其对应区间的搜索对象集合中的排序。
2.如权利要求1所述的方法,其特征在于,基于第一排序模型获得搜索结果中的各搜索对象的第一排序分,包括:
根据用户输入的关键词获得所述搜索结果,基于所述第一排序模型计算搜索结果中每个搜索对象与关键词的相关性,以获取的相关性值作为第一排序分。
3.如权利要求1或2所述的方法,其特征在于,将该第一排序分划分成多个区间,根据该第一排序分将各搜索对象归类到各个区间对应的搜索对象集合中,包括:
设置一个或多个相关性阈值,将该第一排序分对应所述相关性阈值,划分成多个区间;
每个搜索对象依据其第一排序分所属的区间,归类到该所属区间对应的搜索对象集合中。
4.如权利要求1-3之一所述的方法,其特征在于,
所述具有预设标记的搜索对象,包括:基于该搜索对象的扩展信息以及与扩展信息相关的记录,所述预设标记用于标识该搜索对象包含所述扩展信息;
利用该第二排序分调整所述具有预设标记的搜索对象在其所属的、对应区间的搜索对象集合中的排序,包括:将完成排序调整的搜索结果返回给用户,同时,将所述具有预设标记的搜索对象的扩展信息返回给用户。
5.如权利要求4所述的方法,其特征在于,
基于第二排序模型获得所述具有预设标记的搜索对象的第二排序分,包括:所述第二排序模型利用所述记录,对所述具有预设标记的搜索对象计算第二排序分;
利用该第二排序分调整所述具有预设标记的搜索对象在其所属的、对应区间的搜索对象集合中的排序,包括:
在每个区间对应的搜索对象集合中,具有预设标记的搜索对象利用其第二排序分,确定其新的排序位置,以调整该搜索对象集合中所有的搜索对象的排序位置。
6.一种数据搜索处理系统,其特征在于,包括:
第一排序分模块,基于第一排序模型获得搜索结果中的各搜索对象的第一排序分;
归类模块,将该第一排序分划分成多个区间,根据该第一排序分将各搜索对象归类到各个区间对应的搜索对象集合中;
确定模块,确定每一个区间对应的搜索对象集合中具有预设标记的搜索对象;
第二排序分模块,基于第二排序模型获得所述具有预设标记的搜索对象的第二排序分;
排序调整模块,利用该第二排序分调整所述具有预设标记的搜索对象在其所属的、对应区间的搜索对象集合中的排序。
7.如权利要求6所述的系统,其特征在于,第一排序分模块,包括:
根据用户输入的关键词获得所述搜索结果,基于所述第一排序模型计算搜索结果中每个搜索对象与关键词的相关性,以获取的相关性值作为第一排序分。
8.如权利要求6或7所述的系统,其特征在于,归类模块,包括:
设置一个或多个相关性阈值,将该第一排序分对应所述相关性阈值,划分成多个区间;
每个搜索对象依据其第一排序分所属的区间,归类到该所属区间对应的搜索对象集合中。
9.如权利要求6-8所述的系统,其特征在于,
所述具有预设标记的搜索对象,包括:基于该搜索对象的扩展信息以及与扩展信息相关的记录,所述预设标记用于标识该搜索对象包含所述扩展信息;
排序调整模块,包括:将完成排序调整的搜索结果返回给用户,同时,将所述具有预设标记的搜索对象的扩展信息返回给用户。
10.如权利要求9所述的系统,其特征在于,
第二排序分模块,包括:所述第二排序模型利用所述记录,对所述具有预设标记的搜索对象计算第二排序分;
排序调整模块,包括:在每个区间对应的搜索对象集合中,具有预设标记的搜索对象利用其第二排序分,确定其新的排序位置,以调整该搜索对象集合中所有的搜索对象的排序位置。
CN201410123992.7A 2014-03-28 2014-03-28 数据搜索处理方法和系统 Pending CN104951468A (zh)

Priority Applications (6)

Application Number Priority Date Filing Date Title
CN201410123992.7A CN104951468A (zh) 2014-03-28 2014-03-28 数据搜索处理方法和系统
TW103118582A TWI648642B (zh) 2014-03-28 2014-05-28 Data search processing method and system
JP2016553665A JP2017509070A (ja) 2014-03-28 2015-03-23 データ検索処理
PCT/US2015/022048 WO2015148393A1 (en) 2014-03-28 2015-03-23 Data search processing
US14/665,997 US20150278341A1 (en) 2014-03-28 2015-03-23 Data search processing
HK15111820.6A HK1211104A1 (zh) 2014-03-28 2015-12-02 數據搜索處理方法和系統

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410123992.7A CN104951468A (zh) 2014-03-28 2014-03-28 数据搜索处理方法和系统

Publications (1)

Publication Number Publication Date
CN104951468A true CN104951468A (zh) 2015-09-30

Family

ID=54166131

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410123992.7A Pending CN104951468A (zh) 2014-03-28 2014-03-28 数据搜索处理方法和系统

Country Status (6)

Country Link
US (1) US20150278341A1 (zh)
JP (1) JP2017509070A (zh)
CN (1) CN104951468A (zh)
HK (1) HK1211104A1 (zh)
TW (1) TWI648642B (zh)
WO (1) WO2015148393A1 (zh)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106484766A (zh) * 2016-09-07 2017-03-08 北京百度网讯科技有限公司 基于人工智能的搜索方法和装置
CN108389576A (zh) * 2018-01-10 2018-08-10 苏州思必驰信息科技有限公司 压缩后的语音识别模型的优化方法及系统
CN110069524A (zh) * 2018-07-27 2019-07-30 北京奇虎科技有限公司 数据检索方法及装置
CN110119471A (zh) * 2019-04-03 2019-08-13 北京搜狗科技发展有限公司 一种搜索结果一致性的检查方法及装置
CN110473008A (zh) * 2019-07-31 2019-11-19 腾讯科技(深圳)有限公司 一种数据处理方法、装置、设备及存储介质
CN110647679A (zh) * 2019-09-04 2020-01-03 达疆网络科技(上海)有限公司 一种o2o场景下的搜索结果综合排序方法
CN111626682A (zh) * 2020-08-03 2020-09-04 南昌梦想软件有限公司 一种成本的核算方法、装置、计算机设备和存储介质
CN112364185A (zh) * 2020-11-23 2021-02-12 北京达佳互联信息技术有限公司 多媒体资源的特征确定方法、装置、电子设备和存储介质
CN113254810A (zh) * 2021-06-17 2021-08-13 浙江口碑网络技术有限公司 搜索结果输出方法、装置、计算机设备及可读存储介质
CN113535824A (zh) * 2021-07-27 2021-10-22 杭州海康威视数字技术股份有限公司 数据搜索方法、装置、电子设备及存储介质
CN117235162A (zh) * 2016-06-23 2023-12-15 施耐德电气美国股份有限公司 用于分布式系统的事务性非结构化数据驱动的顺序联合查询方法
CN117435696A (zh) * 2023-12-21 2024-01-23 数据空间研究院 文本数据的检索方法、装置、电子设备及存储介质

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11201963B2 (en) * 2016-07-06 2021-12-14 Ehealth, Inc. Prioritization of electronic communications
JP6913596B2 (ja) * 2017-10-12 2021-08-04 ヤフー株式会社 情報処理装置、情報処理方法及び情報処理プログラム
CN109992764B (zh) * 2017-12-29 2022-12-16 阿里巴巴集团控股有限公司 一种文案生成方法及装置
CN111210290A (zh) * 2018-11-21 2020-05-29 北京京东尚科信息技术有限公司 排序方法、装置和计算机可读存储介质
US20210035180A1 (en) * 2019-07-31 2021-02-04 Ebay Inc. Unified ranking engine for a search system
JP7044821B2 (ja) 2020-03-17 2022-03-30 ヤフー株式会社 情報処理システム、および情報処理方法
JP7309669B2 (ja) * 2020-07-28 2023-07-18 ヤフー株式会社 情報処理装置、情報処理方法、及び情報処理プログラム
CN113343131B (zh) * 2021-06-30 2022-08-26 北京三快在线科技有限公司 一种模型训练的方法、信息展示的方法及装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8090717B1 (en) * 2002-09-20 2012-01-03 Google Inc. Methods and apparatus for ranking documents
US20120030185A1 (en) * 2009-03-24 2012-02-02 Yahoo! Inc. Sponsored search results re-ranking based on linking associations
CN102779136A (zh) * 2011-05-13 2012-11-14 北京搜狗科技发展有限公司 一种信息搜索的方法和装置
US20130179466A1 (en) * 2012-01-05 2013-07-11 Fujitsu Limited Data processing method and distributed processing system
CN103324701A (zh) * 2013-06-13 2013-09-25 深圳中兴网信科技有限公司 数据搜索装置和数据搜索方法

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7062485B1 (en) * 2000-09-01 2006-06-13 Huaichuan Hubert Jin Method and apparatus for score normalization for information retrieval applications
JP2004038370A (ja) * 2002-07-01 2004-02-05 Fan Communications Inc 広告情報検索システム、広告情報検索システム用管理サーバーシステム及び管理サーバーシステム用プログラム
US8620915B1 (en) * 2007-03-13 2013-12-31 Google Inc. Systems and methods for promoting personalized search results based on personal information
US7716198B2 (en) * 2004-12-21 2010-05-11 Microsoft Corporation Ranking search results using feature extraction
US7809731B2 (en) * 2005-07-29 2010-10-05 Yahoo! Inc. System and method for reordering a result set copyright notice
US9177124B2 (en) * 2006-03-01 2015-11-03 Oracle International Corporation Flexible authentication framework
GB2439348A (en) * 2006-06-23 2007-12-27 Mobile Dna Ltd Electronic classified advertising system
US8442972B2 (en) * 2006-10-11 2013-05-14 Collarity, Inc. Negative associations for search results ranking and refinement
JP5084673B2 (ja) * 2008-09-04 2012-11-28 ヤフー株式会社 商品情報検索装置、方法及びシステム
JP5418295B2 (ja) * 2010-02-25 2014-02-19 日本電気株式会社 検索装置
JP5484222B2 (ja) * 2010-06-30 2014-05-07 キヤノン株式会社 画像形成装置
US8706753B2 (en) * 2011-08-25 2014-04-22 Oracle International Corporation Search result ranking with search string certainty weighting
JP5834815B2 (ja) * 2011-11-22 2015-12-24 株式会社リコー 情報処理装置、プログラムおよび文書を検索するための方法
US20130238437A1 (en) * 2012-03-12 2013-09-12 Microsoft Corporation Variable keyword bidding based on search results position

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8090717B1 (en) * 2002-09-20 2012-01-03 Google Inc. Methods and apparatus for ranking documents
US20120030185A1 (en) * 2009-03-24 2012-02-02 Yahoo! Inc. Sponsored search results re-ranking based on linking associations
CN102779136A (zh) * 2011-05-13 2012-11-14 北京搜狗科技发展有限公司 一种信息搜索的方法和装置
US20130179466A1 (en) * 2012-01-05 2013-07-11 Fujitsu Limited Data processing method and distributed processing system
CN103324701A (zh) * 2013-06-13 2013-09-25 深圳中兴网信科技有限公司 数据搜索装置和数据搜索方法

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117235162A (zh) * 2016-06-23 2023-12-15 施耐德电气美国股份有限公司 用于分布式系统的事务性非结构化数据驱动的顺序联合查询方法
CN106484766B (zh) * 2016-09-07 2019-10-22 北京百度网讯科技有限公司 基于人工智能的搜索方法和装置
CN106484766A (zh) * 2016-09-07 2017-03-08 北京百度网讯科技有限公司 基于人工智能的搜索方法和装置
CN108389576A (zh) * 2018-01-10 2018-08-10 苏州思必驰信息科技有限公司 压缩后的语音识别模型的优化方法及系统
CN108389576B (zh) * 2018-01-10 2020-09-01 苏州思必驰信息科技有限公司 压缩后的语音识别模型的优化方法及系统
CN110069524A (zh) * 2018-07-27 2019-07-30 北京奇虎科技有限公司 数据检索方法及装置
CN110119471A (zh) * 2019-04-03 2019-08-13 北京搜狗科技发展有限公司 一种搜索结果一致性的检查方法及装置
CN110119471B (zh) * 2019-04-03 2021-07-27 北京搜狗科技发展有限公司 一种搜索结果一致性的检查方法及装置
CN110473008A (zh) * 2019-07-31 2019-11-19 腾讯科技(深圳)有限公司 一种数据处理方法、装置、设备及存储介质
CN110473008B (zh) * 2019-07-31 2024-02-20 腾讯科技(深圳)有限公司 一种数据处理方法、装置、设备及存储介质
CN110647679A (zh) * 2019-09-04 2020-01-03 达疆网络科技(上海)有限公司 一种o2o场景下的搜索结果综合排序方法
CN111626682A (zh) * 2020-08-03 2020-09-04 南昌梦想软件有限公司 一种成本的核算方法、装置、计算机设备和存储介质
CN112364185B (zh) * 2020-11-23 2024-02-06 北京达佳互联信息技术有限公司 多媒体资源的特征确定方法、装置、电子设备和存储介质
CN112364185A (zh) * 2020-11-23 2021-02-12 北京达佳互联信息技术有限公司 多媒体资源的特征确定方法、装置、电子设备和存储介质
CN113254810A (zh) * 2021-06-17 2021-08-13 浙江口碑网络技术有限公司 搜索结果输出方法、装置、计算机设备及可读存储介质
CN113535824A (zh) * 2021-07-27 2021-10-22 杭州海康威视数字技术股份有限公司 数据搜索方法、装置、电子设备及存储介质
CN117435696A (zh) * 2023-12-21 2024-01-23 数据空间研究院 文本数据的检索方法、装置、电子设备及存储介质

Also Published As

Publication number Publication date
US20150278341A1 (en) 2015-10-01
HK1211104A1 (zh) 2016-05-13
WO2015148393A1 (en) 2015-10-01
TW201537365A (zh) 2015-10-01
JP2017509070A (ja) 2017-03-30
TWI648642B (zh) 2019-01-21

Similar Documents

Publication Publication Date Title
CN104951468A (zh) 数据搜索处理方法和系统
JP5859606B2 (ja) オンライン商取引プラットフォームにおける広告ソースおよびキーワードセットの適合
US8631003B2 (en) Query identification and association
CN104598439B (zh) 信息对象的标题修正方法及装置和推送信息对象的方法
CN102279851B (zh) 一种智能导航方法、装置和系统
CN104679771A (zh) 一种个性化数据搜索方法和装置
US9589277B2 (en) Search service advertisement selection
CN102841904B (zh) 一种搜索方法及设备
CN106557480B (zh) 查询改写的实现方法及装置
CN105447730A (zh) 目标用户定向方法及装置
CN106504011A (zh) 一种业务对象的展示方法和装置
CN104866474A (zh) 个性化数据搜索方法及装置
US20120197732A1 (en) Action-aware intent-based behavior targeting
US11682060B2 (en) Methods and apparatuses for providing search results using embedding-based retrieval
CN103514209A (zh) 基于对象信息库生成待推广对象的推广信息的方法与设备
CN113570413A (zh) 广告关键词的生成方法、装置、存储介质及电子设备
CN105706081A (zh) 结构化信息链接注释
CN111553765A (zh) 一种电商搜索排序方法、装置及计算设备
KR20190081671A (ko) 온라인 쇼핑몰 통합 관리 시스템에서의 유사상품을 검색하는 방법 및 그 서버
CN115775163A (zh) 一种基于大数据的程序化广告投放方法、设备及介质
Joppi et al. POP: mining POtential Performance of new fashion products via webly cross-modal query expansion
CN107203892B (zh) 一种推送增值业务信息的方法、装置及电子设备
CN102982072A (zh) 一种可视化概念检测器及构造语义场的方法
US20090327162A1 (en) Price estimation of overlapping keywords
CN111460300A (zh) 网络内容推送方法、装置及存储介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1211104

Country of ref document: HK

RJ01 Rejection of invention patent application after publication

Application publication date: 20150930

RJ01 Rejection of invention patent application after publication
REG Reference to a national code

Ref country code: HK

Ref legal event code: WD

Ref document number: 1211104

Country of ref document: HK