CN113793193A - 数据搜索准确性验证方法、装置、设备及计算机可读介质 - Google Patents
数据搜索准确性验证方法、装置、设备及计算机可读介质 Download PDFInfo
- Publication number
- CN113793193A CN113793193A CN202110928532.1A CN202110928532A CN113793193A CN 113793193 A CN113793193 A CN 113793193A CN 202110928532 A CN202110928532 A CN 202110928532A CN 113793193 A CN113793193 A CN 113793193A
- Authority
- CN
- China
- Prior art keywords
- search
- dimension
- keyword
- search keyword
- relevant
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000012795 verification Methods 0.000 title claims abstract description 78
- 238000000034 method Methods 0.000 title claims abstract description 46
- 230000011218 segmentation Effects 0.000 claims description 24
- 238000004590 computer program Methods 0.000 claims description 8
- 238000010200 validation analysis Methods 0.000 claims description 5
- 238000012360 testing method Methods 0.000 abstract description 5
- 238000004891 communication Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 238000010998 test method Methods 0.000 description 4
- 238000011156 evaluation Methods 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 230000010365 information processing Effects 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 230000001932 seasonal effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0631—Item recommendations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9532—Query formulation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9537—Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- General Engineering & Computer Science (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Data Mining & Analysis (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Strategic Management (AREA)
- Mathematical Physics (AREA)
- Economics (AREA)
- Development Economics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种数据搜索准确性验证方法、装置、设备及计算机可读介质,属于测试技术领域。所述方法包括:获取搜索关键词;为所述搜索关键词确定至少一个相关维度;根据所述相关维度为所述搜索关键词匹配验证规则;根据所述验证规则验证与所述搜索关键词对应的搜索结果的准确性。本发明通过为搜索关键词匹配相关维度,通过相关维度确定验证规则,可为搜索关键词对应的每个搜索结果从多个相关维度中进行准确性验证,全面地评价搜索结果的准确性,使搜索测试的功能更加灵活可拓展。
Description
技术领域
本发明涉及测试技术领域,特别涉及一种数据搜索准确性验证方法、装置、设备及计算机可读介质。
背景技术
电商运营应用是基于复杂的数据搜索系统建立起来的,用户通过输入的关键词获取反馈的商品信息,从中挑选心仪的商品。由此可见,数据搜索对电商运营起到至关重要的作用,搜索结果的准确性直接影响用户的使用体验和商品销量,因此要对数据搜索进行验证评价。
现有技术中数据搜索的验证常采用A/B测试方法,所谓A/B测试方法采用分离式组间实验,对同一个目标制定两个方案,通过实验结果的比对,对方案进行评价,例如同一类商品营销设置两个页面,让一部分用户使用A页面,一部分用户使用B页面,比较确定哪个页面营销效果更好。因此,A/B测试方法需要真实的流量进行验证评估,由于采用真实的流量,所需的数据量十分巨大,增加了数据搜索验证工作的复杂性。此外,现有的A/B测试方法仅能获取到销量、转化率等数据,这两个方面不能直接反应输入关键词和搜索结果的相关性上,难以对数据搜索进行准确性评价。
发明内容
为了解决现有技术的问题,本发明实施例提供了一种数据搜索准确性验证方法、装置、设备及计算机可读介质。所述技术方案如下:
第一方面,提供了一种数据搜索准确性验证方法,所述方法包括:
获取搜索关键词;
为所述搜索关键词确定至少一个相关维度;
根据所述相关维度为所述搜索关键词匹配验证规则;
根据所述验证规则验证与所述搜索关键词对应的搜索结果的准确性。
进一步地,所述获取搜索关键词,包括:
从缓存词库中获取预先采集到的用户在线输入的查询词,构建所述关键词库;
从所述关键词库中抽取所述搜索关键词。
进一步地,所述为所述搜索关键词确定至少一个相关维度,包括:
将所述搜索关键词与预先构建的维度库匹配,基于维度匹配结果确定所述相关维度。
进一步地,所述将所述搜索关键词与预先构建的维度库匹配,包括:
对所述搜索关键词进行切词,获得至少一个分词;
识别所述分词,根据识别结果确定各所述分词对应的维度库;
遍历所述维度库,将所述分词与所述维度库匹配,获得所述维度匹配结果,其中,所述维度库中包括所述相关维度与所述分词的对应关系。
进一步地,所述为所述搜索关键词确定至少一个相关维度,包括:
获取所述搜索关键词对应的搜索信息;
将所述搜索关键词与所述搜索信息结合,为所述搜索关键词确定至少一个所述相关维度。
进一步地,所述根据所述验证规则验证与所述搜索关键词对应的搜索结果的准确性,包括:
根据所述验证规则计算所述搜索结果在各所述相关维度下的相关度;
按照各所述搜索结果的排序信息对应的排序权重并根据所述搜索结果在各所述相关维度下的相关度计算所述搜索结果关于排序信息的评分;
根据各所述搜索结果关于所述排序信息的评分计算所述搜索关键词的平均分。
进一步地,所述根据所述验证规则验证与所述搜索关键词对应的搜索结果的准确性,包括:
根据所述验证规则计算所述搜索结果在各所述相关维度下各指标的相关度;
根据各所述指标对应的指标权重以及所述搜索结果在各所述相关维度下各指标的相关度计算所述搜索结果关于各所述相关维度的平均分;
根据各所述搜索结果关于各所述相关维度的平均分计算所述搜索关键词关于各所述相关维度的平均分。
第二方面,提供了一种数据搜索准确性验证装置,所述装置包括:
关键词获取模块,用于获取搜索关键词;
维度确定模块,用于为所述搜索关键词确定至少一个相关维度;
规则确定模块,用于根据所述相关维度为所述搜索关键词匹配验证规则;
验证模块,用于根据所述验证规则验证与所述搜索关键词对应的搜索结果的准确性。
进一步地,关键词获取模块,主要通过离线的方式获取关键词,无需依赖真实流量,具体用于:
从缓存词库中获取预先采集到的用户在线输入的查询词,构建关键词库;
从关键词库中抽取搜索关键词。
进一步地,维度确定模块,具体用于:
将搜索关键词与预先构建的维度库匹配,基于维度匹配结果确定相关维度。
进一步地,维度确定模块,还包括:
关键词处理模块,用于对搜索关键词进行切词,获得至少一个分词;
分词识别模块,用于识别分词,根据识别结果确定各分词对应的维度库;
遍历模块,用于遍历维度库,将分词与维度库匹配,基于维度库中的相关维度与分词的对应关系,获得维度匹配结果。
进一步地,维度确定模块,还用于:
获取搜索关键词对应的搜索信息;
将搜索关键词与搜索信息结合,为搜索关键词确定至少一个相关维度。
进一步地,验证模块包括总评分模块,具体用于:
根据验证规则计算搜索结果在各相关维度下的相关度;
按照各搜索结果的排序信息对应的排序权重并根据搜索结果在各相关维度下的相关度计算搜索结果关于排序信息的评分;
根据各搜索结果关于排序信息的评分计算搜索关键词的平均分。
进一步地,验证模块包括维度评分模块,具体用于:
根据验证规则计算搜索结果在各相关维度下各指标的相关度;
根据各指标对应的维度权重以及搜索结果在各所述相关维度下各指标的相关度计算搜索结果关于各相关维度的平均分;
根据各搜索结果关于各相关维度的平均分计算搜索关键词关于各相关维度的平均分。
第三方面,提供了一种电子设备,包括:
一个或多个处理器;以及
与所述一个或多个处理器关联的存储器,所述存储器用于存储程序指令,所述程序指令在被所述一个或多个处理器读取执行时,执行如第一方面任一所述的方法。
第四方面,提供了一种计算机可读介质,其上存储有计算机程序,其中,该程序被处理器执行时实现如第一方面任一所述的方法。
本发明实施例提供的技术方案带来的有益效果是:
1、本发明通过为搜索关键词匹配相关维度,通过相关维度确定验证规则,可为搜索关键词对应的每个搜索结果从多个相关维度中进行准确性验证,全面地评价搜索结果的准确性,使搜索测试的功能更加灵活可拓展;
2、本发明通过离线获取搜索关键词,实现了可离线分析数据搜索的相关性指标,验证搜索结果的准确度;
3、本发明公开了基于搜索结果排序信息评分以及基于相关维度评分的两种验证方法,有利于多角度验证数据搜索的准确性、可靠性。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的数据搜索准确性验证方法流程图;
图2是本发明实施例提供的数据搜索准确性验证装置结构示意图;
图3是本发明实施例提供的在商品搜索场景下搜索准确性验证过程图;
图4是本发明实施例提供的在商品搜索场景下搜索验证页面示意图;
图5是本发明实施例提供的计算机可读介质结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如背景技术所述,现有的数据搜索验证技术需要依赖线上的真实流量,所需数据量十分巨大,且现有的数据搜索验证方法仅能获得简单的指标验证效果,无法进行更多指标的验证。因此,为了解决上述技术问题,本发明公开了一种数据搜索准确性验证方法、装置、设备及计算机可读介质,其中,根据搜索关键词可确定相关维度,一个相关维度对应一种验证规则,因此可以为搜索关键词确定其对应的验证规则,在根据搜索关键词进行搜索后,根据确定的验证规则验证,一方面相较于A/B测试,本发明从搜索关键词的获取到搜索结果的验证均可以离线进行,无需真实的流量,另一方面,本发明提供了相关维度和与相关维度对应的验证规则的技术方案使验证指标可拓展,更加丰富了测试功能。具体技术方案如下所述:
如图1所示,一种数据搜索准确性验证方法,包括:
S1、获取搜索关键词。
上述,搜索关键词可以通过采集用户输入的查询词获得,或者通过词语构建模型等工具自行生成。搜索关键词可以是短句也可以是一个或多个词汇。
作为一种实施例的,步骤S1包括:
从缓存词库中获取预先采集到的用户在线输入的查询词,构建关键词库;
从关键词库中抽取搜索关键词。
上述,由于构建了缓存词库,因此本发明提供的验证方法可以完全离线进行,无需线上采集搜索关键词。缓存词库中的查询词可以通过爬虫软件采集获取,缓存词库可以定时存储有预设时间范围的查询词。关键词库可以存储大量的搜索关键词,构建关键词库具体可以对查询词进行去重筛选,使关键词库中的搜索关键词尽可能体现广大用户的搜索特征。
S2、为搜索关键词确定至少一个相关维度。
上述,相关维度主要与商品的属性信息、销售信息、库存信息等相关,例如:与商品属性信息相关的商品类目、品牌、尺寸、设计特点等,与销售信息相关的商品销量、客户性别、客户年龄等,与库存信息等相关的货源、货仓、库存量等。
作为一种实施例的,步骤S2包括:
将搜索关键词与预先构建的维度库匹配,基于维度匹配结果确定相关维度。
上述,维度库中存储有预先设定的商品各项维度。维度库可以包括多个维度,也可以一个维度库对应一个维度,为了更加快速准确地匹配,优选为一个维度库对应一个维度。
根据由于搜索关键词根据用户输入的查询词获得,因此用户输入的随意性较大,可能会存在短句或者信息缺失的问题,因此本步骤S2还包括:
对搜索关键词进行切词,获得至少一个分词;
识别分词,根据识别结果确定各分词对应的维度库;
遍历维度库,将分词与维度库匹配,获得维度匹配结果,其中,维度库中包括相关维度与分词的对应关系。
上述,切词是指将词序列切分成单独的词,现有技术中包括:基于字符串匹配的分词方法、基于理解的分词方法、基于统计的分词方法等,本发明对具体的切分方法不作限制。切词获得分词后,确定与各分词对应的维度库,从维度库中匹配相关维度。
此外,作为一个实施例的,为了进一步地为搜索关键词匹配到更多的相关维度,补充维度信息,步骤S2还包括:
获取搜索关键词对应的搜索信息;
将搜索关键词与搜索信息结合,为搜索关键词确定至少一个相关维度。
上述,搜索信息可以包括:与搜索关键词对应的搜索时间、用户信息,例如搜索关键词中没有包括和时间有关的分词,而通过搜索信息可以确定到与该搜索关键词对应的搜索时间为6月份,因此可确定商品的季节维度为夏季。
S3、根据相关维度为搜索关键词匹配验证规则。
上述,各相关维度均对应有相应的验证规则,例如颜色维度中对应的验证规则为搜索结果中商品的颜色是否为搜索关键词或者搜索信息中的颜色,季节维度中对应的验证规则为搜索结果中商品适应的季节是否为搜索关键词或者搜索信息中的季节等。
S4、根据验证规则验证与搜索关键词对应的搜索结果的准确性。
上述,搜索结果可以是通过缓存用户输入的查询词返回的搜索结果获取,或者是采用搜索引擎工具根据获取到的搜索关键词进行自动检索获得的搜索结果,两种方式均无需在线获取用户的搜索结果。搜索结果准确性的评判可以通过搜索结果与验证规则的相关度进行评判,或者通过验证规则对搜索结果进行打分,通过评分进行评判。
作为一个实施例的,步骤S4包括:
根据验证规则计算搜索结果在各相关维度下的相关度;
按照各搜索结果的排序信息对应的排序权重并根据搜索结果在各所述相关维度下的相关度计算搜索结果关于排序信息的评分;
根据各搜索结果关于各排序信息的评分计算搜索关键词的平均分。
上述,公开了一种根据搜索结果排序设定的排序权重进行评分的方法,获得的是搜索关键词总的平均分。一个搜索关键词可对应多个搜索结果,每个搜索结果均有对应的排序,搜索结果的排序体现了搜索结果的曝光率,对于商品来说曝光率越高其被购买的可能性越大,因此越靠前的搜索结果在运营网站上的曝光率越高其对应的排序权重值越大。搜索结果在各相关维度下的相关度体现了搜索结果对应各相关维度的准确性,再结合排序权重,可以通过曝光率以及准确性两个方面验证搜索结果。具体地,不同的搜索结果对应不同的排序权重,基于排序权重可为每个搜索结果均计算出评分,搜索结果在各相关维度的相关度主要为与搜索结果中是否包括相关维度下的指标对应的预设值,例如预设搜索结果中包括相关维度下的指标为1,不包括为0,或者搜索结果在各相关维度的相关度为搜索结果中关于相关维度下各指标的相关度平均值或总值。最终获得的评分为搜索关键词对应各搜索结果的总平均分。
作为一个实施例的,步骤S4包括:
根据验证规则计算搜索结果在各相关维度下各指标的相关度;
根据各搜索结果关于各指标对应的指标权重以及相关度计算搜索结果关于各相关维度的平均分;
根据各搜索结果关于各相关维度的平均分计算搜索关键词关于各相关维度的平均分。
上述,公开了一种根据相关维度下各指标对应的指标权重对搜索结果进行评分的方法,获得的是搜索关键词与各相关维度对应的平均分。在一些情况下,搜索关键词可能对应了某个维度下的多个指标,例如在季节的相关维度下可对应春季或秋季两个指标,因此在计算搜索结果在季节这个相关维度下的平均分时可根据春季以及秋季这两个指标的指标权重以及搜索结果对应春季和秋季这两个指标的相关度,计算搜索结果在相关维度为季节下的平均得分,最后根据搜索关键词对应的各搜索结果在不同相关维度下的平均分,计算搜索关键词关于各相关维度下的平均分。指标权重可根据预设的权重调整规则自动调整,例如可为春季指标和秋季指标设定两个指标权重,若搜索信息中搜索时间为春季,则春季指标的指标权重选取大于秋季指标的指标权重。
以上,本发明公开的数据搜索准确性验证方法,可离线分析数据搜索的相关性指标,验证搜索结果的准确度,且通过为搜索关键词匹配相关维度,通过相关维度确定验证规则,可为搜索关键词对应的每个搜索结果从多个相关维度中进行准确性验证,全面地评价搜索结果的准确性,使搜索测试的功能更加灵活可拓展。
如图2所示,基于上述本发明公开的数据搜索准确性验证方法,本发明还公开一种数据搜索准确性验证装置,包括:
关键词获取模块201,用于获取搜索关键词。
维度确定模块202,用于为搜索关键词确定至少一个相关维度。
规则确定模块203,用于根据相关维度为搜索关键词匹配验证规则。
验证模块204,用于根据验证规则验证与搜索关键词对应的搜索结果的准确性。
作为一个实施例的,关键词获取模块201,主要通过离线的方式获取关键词,无需依赖真实流量,具体用于:
从缓存词库中获取预先采集到的用户在线输入的查询词,构建关键词库;
从关键词库中抽取搜索关键词。
作为一个实施例的,维度确定模块202,具体用于:
将搜索关键词与预先构建的维度库匹配,基于维度匹配结果确定相关维度。
基于上述实施例,进一步地,维度确定模块202,还包括:
关键词处理模块,用于对搜索关键词进行切词,获得至少一个分词;
分词识别模块,用于识别分词,根据识别结果确定各分词对应的维度库;
遍历模块,用于遍历维度库,将分词与维度库匹配,基于维度库中的相关维度与分词的对应关系,获得维度匹配结果。
作为一个实施例的,维度确定模块202,还用于:
获取搜索关键词对应的搜索信息;
将搜索关键词与搜索信息结合,为搜索关键词确定至少一个相关维度。
作为一个实施例的,验证模块204包括总评分模块,具体用于:
根据验证规则计算搜索结果在各相关维度下的相关度;
按照各搜索结果的排序信息对应的排序权重并根据搜索结果在各相关维度下的相关度计算搜索结果关于排序信息的评分;
根据各搜索结果关于排序信息的评分计算搜索关键词的平均分。
作为一个实施例的,验证模块204包括维度评分模块,具体用于:
根据验证规则计算搜索结果在各相关维度下各指标的相关度;
根据各指标对应的维度权重以及搜索结果在各所述相关维度下各指标的相关度计算搜索结果关于各相关维度的平均分;
根据各搜索结果关于各相关维度的平均分计算搜索关键词关于各相关维度的平均分。
以上,本发明公开的数据搜索准确性验证装置,通过关键词获取模块、维度确定模块、规则确定模块、验证模块执行了本发明公开的数据搜索准确性验证方法的全部步骤,该装置可单独设置在硬件设备中,或者可嵌套在搜索系统中。
为了进一步体现本发明公开的技术方案,下面结合具体电商领域中商品检索的应用场景对本发明公开的数据搜索准确性验证方法进行详细说明:
如图3所示,数据搜索准确性方法在具体运行时可分为调试任务和普通任务两种,当为调试任务时,搜索关键词从预设的参数中获取,并生成调试任务信息,当为普通任务时,则搜索关键词从关键词库中捞取,并生成普通任务信息,其中关键词库中的查询词从缓存库中获取,
生成调试任务信息或者普通任务信息后,根据搜索关键词进行搜索,获得搜索结果。对搜索关键词进行切词操作获得分词,根据分词在验证规则数据库中获得搜索关键词对应的验证规则。
搜索关键词对应的相关维度,如图3中,为搜索关键词匹配到的相关维度为:类目、品牌、适用性别、颜色、裤长、袖长、适用季节。每个相关维度均对应有验证规则,验证规则存储在规则数据库中,获取到验证规则后,按照验证规则进行准确性验证。具体地,如图4所示,可通过计算获得搜索关键词在各相关维度下的平均分,还可以把无少结果,趋势数据,进行归总统计,以及根据搜索关键词在各相关度下的平均分进行汇总统计获得健康度。
另外本发明实施例还提供了一种电子设备,包括:
一个或多个处理器;以及
与所述一个或多个处理器关联的存储器,所述存储器用于存储程序指令,所述程序指令在被所述一个或多个处理器读取执行时,执行上述实施例公开的数据搜索准确性验证方法。
其中,图5示例性的展示出了计算机系统的架构,具体可以包括处理器510,视频显示适配器511,磁盘驱动器512,输入/输出接口513,网络接口514,以及存储器520。上述处理器510、视频显示适配器511、磁盘驱动器512、输入/输出接口513、网络接口514,与存储器520之间可以通过通信总线530进行通信连接。
其中,处理器510可以采用通用的CPU(Central Processing Unit,中央处理器)、微处理器、应用专用集成电路(Application Specific Integrated Circuit,ASIC)、或者一个或多个集成电路等方式实现,用于执行相关程序,以实现本申请所提供的技术方案。
存储器520可以采用ROM(Read Only Memory,只读存储器)、RAM(Random AccessMemory,随机存取存储器)、静态存储设备,动态存储设备等形式实现。存储器520可以存储用于控制电子设备500运行的操作系统521,用于控制电子设备500的低级别操作的基本输入输出系统(BIOS)。另外,还可以存储网页浏览器523,数据存储管理系统524,以及设备标识信息处理系统525等等。上述设备标识信息处理系统525就可以是本申请实施例中具体实现前述各步骤操作的应用程序。总之,在通过软件或者固件来实现本申请所提供的技术方案时,相关的程序代码保存在存储器520中,并由处理器510来调用执行。
输入/输出接口513用于连接输入/输出模块,以实现信息输入及输出。输入输出/模块可以作为组件配置在设备中(图中未示出),也可以外接于设备以提供相应功能。其中输入设备可以包括键盘、鼠标、触摸屏、麦克风、各类传感器等,输出设备可以包括显示器、扬声器、振动器、指示灯等。
网络接口514用于连接通信模块(图中未示出),以实现本设备与其他设备的通信交互。其中通信模块可以通过有线方式(例如USB、网线等)实现通信,也可以通过无线方式(例如移动网络、WIFI、蓝牙等)实现通信。
总线530包括一通路,在设备的各个组件(例如处理器510、视频显示适配器511、磁盘驱动器512、输入/输出接口513、网络接口514,与存储器520)之间传输信息。
另外,该电子设备500还可以从虚拟资源对象领取条件信息数据库中获得具体领取条件的信息,以用于进行条件判断,等等。
需要说明的是,尽管上述设备仅示出了处理器510、视频显示适配器511、磁盘驱动器512、输入/输出接口513、网络接口514,存储器520,总线530等,但是在具体实施过程中,该设备还可以包括实现正常运行所必需的其他组件。此外,本领域的技术人员可以理解的是,上述设备中也可以仅包含实现本申请方案所必需的组件,而不必包含图中所示的全部组件。
特别地,根据本申请的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本申请的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信装置从网络上被下载和安装,或者从存储器被安装,或者从ROM被安装。在该计算机程序被处理器执行时,执行本申请的实施例的方法中限定的上述功能。
需要说明的是,本申请的实施例的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本申请的实施例中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本申请的实施例中,计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读信号介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:电线、光缆、RF(Radio Frequency,射频)等等,或者上述的任意合适的组合。
上述计算机可读介质可以是上述服务器中所包含的;也可以是单独存在,而未装配入该服务器中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该服务器执行时,使得该服务器:响应于检测到终端的外设模式未激活时,获取终端上应用的帧率;在帧率满足息屏条件时,判断用户是否正在获取终端的屏幕信息;响应于判断结果为用户未获取终端的屏幕信息,控制屏幕进入立即暗淡模式。
可以以一种或多种程序设计语言或其组合来编写用于执行本申请的实施例的操作的计算机程序代码,程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统或系统实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。以上所描述的系统及系统实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
以上对本申请所提供的终端设备标识信息处理方法、装置及电子设备,进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处。综上所述,本说明书内容不应理解为对本申请的限制。
上述所有可选技术方案,可以采用任意结合形成本发明的可选实施例,在此不再一一赘述。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种数据搜索准确性验证方法,其特征在于,包括:
获取搜索关键词;
为所述搜索关键词确定至少一个相关维度;
根据所述相关维度为所述搜索关键词匹配验证规则;
根据所述验证规则验证与所述搜索关键词对应的搜索结果的准确性。
2.如权利要求1所述的方法,其特征在于,所述获取搜索关键词,包括:
从缓存词库中获取预先采集到的用户在线输入的查询词,构建所述关键词库;
从所述关键词库中抽取所述搜索关键词。
3.如权利要求1所述的方法,其特征在于,所述为所述搜索关键词确定至少一个相关维度,包括:
将所述搜索关键词与预先构建的维度库匹配,基于维度匹配结果确定所述相关维度。
4.如权利要求3所述的方法,其特征在于,所述将所述搜索关键词与预先构建的维度库匹配,包括:
对所述搜索关键词进行切词,获得至少一个分词;
识别所述分词,根据识别结果确定各所述分词对应的维度库;
遍历所述维度库,将所述分词与所述维度库匹配,获得所述维度匹配结果,其中,所述维度库中包括所述相关维度与所述分词的对应关系。
5.如权利要求1所述的方法,其特征在于,所述为所述搜索关键词确定至少一个相关维度,包括:
获取所述搜索关键词对应的搜索信息;
将所述搜索关键词与所述搜索信息结合,为所述搜索关键词确定至少一个所述相关维度。
6.如权利要求1~5所述的方法,其特征在于,所述根据所述验证规则验证与所述搜索关键词对应的搜索结果的准确性,包括:
根据所述验证规则计算所述搜索结果在各所述相关维度下的相关度;
按照各所述搜索结果的排序信息对应的排序权重并根据所述搜索结果在各所述相关维度下的相关度计算所述搜索结果关于排序信息的评分;
根据各所述搜索结果关于所述排序信息的评分计算所述搜索关键词的平均分。
7.如权利要求1~5中任一项所述的方法,其特征在于,所述根据所述验证规则验证与所述搜索关键词对应的搜索结果的准确性,包括:
根据所述验证规则计算所述搜索结果在各所述相关维度下各指标的相关度;
根据各所述指标对应的指标权重以及所述搜索结果在各所述相关维度下各指标的相关度计算所述搜索结果关于各所述相关维度的平均分;
根据各所述搜索结果关于各所述相关维度的平均分计算所述搜索关键词关于各所述相关维度的平均分。
8.一种数据搜索准确性验证装置,其特征在于,包括:
关键词获取模块,用于获取搜索关键词;
维度确定模块,用于为所述搜索关键词确定至少一个相关维度;
规则确定模块,用于根据所述相关维度为所述搜索关键词匹配验证规则;
验证模块,用于根据所述验证规则验证与所述搜索关键词对应的搜索结果的准确性。
9.一种电子设备,其特征在于,包括:
一个或多个处理器;以及
与所述一个或多个处理器关联的存储器,所述存储器用于存储程序指令,所述程序指令在被所述一个或多个处理器读取执行时,执行如权利要求1~7中任一所述的方法。
10.一种计算机可读介质,其上存储有计算机程序,其中,该程序被处理器执行时实现如权利要求1~7中任一所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110928532.1A CN113793193B (zh) | 2021-08-13 | 2021-08-13 | 数据搜索准确性验证方法、装置、设备及计算机可读介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110928532.1A CN113793193B (zh) | 2021-08-13 | 2021-08-13 | 数据搜索准确性验证方法、装置、设备及计算机可读介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113793193A true CN113793193A (zh) | 2021-12-14 |
CN113793193B CN113793193B (zh) | 2024-02-02 |
Family
ID=79181623
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110928532.1A Active CN113793193B (zh) | 2021-08-13 | 2021-08-13 | 数据搜索准确性验证方法、装置、设备及计算机可读介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113793193B (zh) |
Citations (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA2164954A1 (en) * | 1993-06-14 | 1995-01-05 | Daniel Egger | Method and apparatus for indexing searching and displaying data |
AU2002333066B2 (en) * | 2001-10-15 | 2006-11-02 | Silverbrook Research Pty Ltd | Digital ink database searching using handwriting feature synthesis |
CN102063469A (zh) * | 2010-12-03 | 2011-05-18 | 百度在线网络技术(北京)有限公司 | 一种用于获取相关关键词信息的方法、装置和计算机设备 |
CN102087669A (zh) * | 2011-03-11 | 2011-06-08 | 北京汇智卓成科技有限公司 | 基于语义关联的智能搜索引擎系统 |
CN103279513A (zh) * | 2013-05-22 | 2013-09-04 | 百度在线网络技术(北京)有限公司 | 产生内容标签的方法、提供多媒体内容信息的方法及装置 |
CN103942347A (zh) * | 2014-05-19 | 2014-07-23 | 焦点科技股份有限公司 | 一种基于多维度综合词库的分词方法 |
WO2017012235A1 (zh) * | 2015-07-23 | 2017-01-26 | 百度在线网络技术(北京)有限公司 | 一种搜索推荐方法、装置、设备及计算机存储介质 |
CN106776741A (zh) * | 2016-11-18 | 2017-05-31 | 北京奇虎科技有限公司 | 一种搜索方法和装置 |
CN107330057A (zh) * | 2017-06-29 | 2017-11-07 | 哈尔滨工程大学科技园发展有限公司 | 一种ElasticSearch搜索相关度算法优化方法及系统 |
CN107729336A (zh) * | 2016-08-11 | 2018-02-23 | 阿里巴巴集团控股有限公司 | 数据处理方法、设备及系统 |
CA3004097A1 (en) * | 2017-05-16 | 2018-11-16 | Hamid Hatami-Hanza | Methods and systems for investigation of compositions of ontological subjects and intelligent systems therefrom |
CN108874773A (zh) * | 2018-05-31 | 2018-11-23 | 平安医疗科技有限公司 | 关键词新增方法、装置、计算机设备和存储介质 |
CN111782770A (zh) * | 2020-07-03 | 2020-10-16 | 国网电子商务有限公司 | 一种基于类目分析召回规则的搜索方法及系统 |
WO2020248379A1 (zh) * | 2019-06-11 | 2020-12-17 | 平安科技(深圳)有限公司 | 一种相似网络页面的搜索方法及设备 |
CN112597396A (zh) * | 2020-12-29 | 2021-04-02 | 深圳Tcl新技术有限公司 | 搜索召回排序方法、系统及计算机可读存储介质 |
-
2021
- 2021-08-13 CN CN202110928532.1A patent/CN113793193B/zh active Active
Patent Citations (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA2164954A1 (en) * | 1993-06-14 | 1995-01-05 | Daniel Egger | Method and apparatus for indexing searching and displaying data |
AU2002333066B2 (en) * | 2001-10-15 | 2006-11-02 | Silverbrook Research Pty Ltd | Digital ink database searching using handwriting feature synthesis |
CN102063469A (zh) * | 2010-12-03 | 2011-05-18 | 百度在线网络技术(北京)有限公司 | 一种用于获取相关关键词信息的方法、装置和计算机设备 |
CN102087669A (zh) * | 2011-03-11 | 2011-06-08 | 北京汇智卓成科技有限公司 | 基于语义关联的智能搜索引擎系统 |
CN103279513A (zh) * | 2013-05-22 | 2013-09-04 | 百度在线网络技术(北京)有限公司 | 产生内容标签的方法、提供多媒体内容信息的方法及装置 |
CN103942347A (zh) * | 2014-05-19 | 2014-07-23 | 焦点科技股份有限公司 | 一种基于多维度综合词库的分词方法 |
WO2017012235A1 (zh) * | 2015-07-23 | 2017-01-26 | 百度在线网络技术(北京)有限公司 | 一种搜索推荐方法、装置、设备及计算机存储介质 |
CN107729336A (zh) * | 2016-08-11 | 2018-02-23 | 阿里巴巴集团控股有限公司 | 数据处理方法、设备及系统 |
CN106776741A (zh) * | 2016-11-18 | 2017-05-31 | 北京奇虎科技有限公司 | 一种搜索方法和装置 |
CA3004097A1 (en) * | 2017-05-16 | 2018-11-16 | Hamid Hatami-Hanza | Methods and systems for investigation of compositions of ontological subjects and intelligent systems therefrom |
CN107330057A (zh) * | 2017-06-29 | 2017-11-07 | 哈尔滨工程大学科技园发展有限公司 | 一种ElasticSearch搜索相关度算法优化方法及系统 |
CN108874773A (zh) * | 2018-05-31 | 2018-11-23 | 平安医疗科技有限公司 | 关键词新增方法、装置、计算机设备和存储介质 |
WO2020248379A1 (zh) * | 2019-06-11 | 2020-12-17 | 平安科技(深圳)有限公司 | 一种相似网络页面的搜索方法及设备 |
CN111782770A (zh) * | 2020-07-03 | 2020-10-16 | 国网电子商务有限公司 | 一种基于类目分析召回规则的搜索方法及系统 |
CN112597396A (zh) * | 2020-12-29 | 2021-04-02 | 深圳Tcl新技术有限公司 | 搜索召回排序方法、系统及计算机可读存储介质 |
Non-Patent Citations (4)
Title |
---|
刘钢;张维石;: "基于决策树的网民评价情感分析", 现代计算机(专业版), no. 32, pages 15 - 19 * |
李军政: ""基于卡方检验和SVM的用户搜索画像技术研究"", 《电子设计工程》, pages 6 - 10 * |
苏亚维;艾中良;: "基于知识画像的文档相似度分析模型", 信息技术, no. 02, pages 116 - 120 * |
鞠亮: ""基于关键词自学习的中文网页分类技术研究与实现"", 《中国优秀硕士学位论文全文数据库》, pages 1 - 74 * |
Also Published As
Publication number | Publication date |
---|---|
CN113793193B (zh) | 2024-02-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10860594B2 (en) | Website scoring system | |
CA2947577C (en) | Method and apparatus for processing service requests | |
US9830633B2 (en) | Deriving dynamic consumer defined product attributes from input queries | |
JP6211605B2 (ja) | クリックスルー率に基づく検索結果の順位付け | |
JP6177871B2 (ja) | 製品情報の公開 | |
KR102324048B1 (ko) | 커뮤니티 질의 응답 데이터의 검증 방법, 장치, 컴퓨터 기기 및 저장 매체 | |
US20170140464A1 (en) | Method and apparatus for evaluating relevance of keyword to asset price | |
JP7023865B2 (ja) | ランディングページ生成の改良 | |
CN110880136A (zh) | 配套产品的推荐方法、系统、设备和存储介质 | |
US10860666B2 (en) | Method and system for providing alternative result for an online search previously with no result | |
US9733906B2 (en) | User interface area coverage | |
JP2015528611A (ja) | 動的データ取得方法およびシステム | |
US11768844B2 (en) | Artificial intelligence and/or machine learning systems and methods for evaluating audiences in an embedding space based on keywords | |
WO2019142345A1 (ja) | セキュリティ情報処理装置、情報処理方法及び記録媒体 | |
JP2012234340A (ja) | 商品キーワード管理システム | |
US20110231415A1 (en) | Web page searching system and method using access time and frequency | |
US20210271637A1 (en) | Creating descriptors for business analytics applications | |
KR102299525B1 (ko) | 제품 평가 마이닝 방법 및 이를 수행하는 장치 | |
EP2778982A1 (en) | Attribute detection | |
CN107908724B (zh) | 一种数据模型匹配方法、装置、设备及存储介质 | |
CN113793193B (zh) | 数据搜索准确性验证方法、装置、设备及计算机可读介质 | |
RU2589856C2 (ru) | Способ обработки целевого сообщения, способ обработки нового целевого сообщения и сервер (варианты) | |
KR20090003853A (ko) | 룰을 이용한 실시간 자동 정보 추출 시스템 및 방법 | |
KR20200129782A (ko) | 크롤링을 이용한 검색 대행 서비스 방법 | |
CN113792087A (zh) | 数据分析方法、装置、电子设备以及计算机可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |