CN104063523A - 一种电子商务搜索评分与排名的方法及系统 - Google Patents

一种电子商务搜索评分与排名的方法及系统 Download PDF

Info

Publication number
CN104063523A
CN104063523A CN201410349094.3A CN201410349094A CN104063523A CN 104063523 A CN104063523 A CN 104063523A CN 201410349094 A CN201410349094 A CN 201410349094A CN 104063523 A CN104063523 A CN 104063523A
Authority
CN
China
Prior art keywords
keyword
commodity
score value
importance
query
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201410349094.3A
Other languages
English (en)
Other versions
CN104063523B (zh
Inventor
李仁勇
殷亚云
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Focus Technology Co Ltd
Original Assignee
Focus Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Focus Technology Co Ltd filed Critical Focus Technology Co Ltd
Priority to CN201410349094.3A priority Critical patent/CN104063523B/zh
Publication of CN104063523A publication Critical patent/CN104063523A/zh
Application granted granted Critical
Publication of CN104063523B publication Critical patent/CN104063523B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明一种电子商务搜索评分与排名方法,包括:步骤一、构建电子商务平台商品的关键词词库;步骤二、计算商品的重要性因子净分值;步骤三、提取商品中的属性信息,存储到索引中;步骤四、按照相关性和重要性构建系列查询块;步骤五、根据分页参数,选择相应的搜索结果,并进行排名。本发明的电子商务搜索评分与排名的方法,它针对电子商务搜索的特点,识别商品的中心关键词,在查询时执行优先匹配;在接受到用户输入的查询搜索关键词后,进行语义分析,考虑到查询域的不同,以及商品浏览量等指标的不同,从而构建不同相关性、重要性的查询语句;当用户搜索商品时,根据查询的相关性、重要性的差别,执行不同的查询,从而快速返回搜索结果。

Description

一种电子商务搜索评分与排名的方法及系统
技术领域
本申请涉及搜索引擎技术领域,特别是对电子商务搜索引擎的排名因素的评估与分值的计算,通过查询分块技术来提升查询效率的方法。
背景技术
随着电子商务的飞速发展,电子商务平台上的商品数量急剧增加,采购商想要从海量的信息中寻找到想要的商品,必须依靠一个精确性高的搜索系统。
通常情况下,电子商务搜索引擎的排名因子较多、查询语句较为复杂,若全局计算在数据量较大的情况下,会导致排名过程非常耗费资源,响应时间较慢。而且,由于排名因子的众多,分值计算标准不统一,这对排名因子进行复杂运算时,带来的一个后果是,对信息质量优秀的商品导向性不足,并且对搜索排名结果的解释性较差。
在搜索引擎中,一般都会采用计算每篇文档的得分,例如Lucene中,对搜索结果进行排序时,需要对搜索结果执行打分处理。其中,Lucene是一个开放源代码的全文检索引擎工具包,即它不是一个完整的全文检索引擎,而是一个全文检索引擎的架构,提供了完整的查询引擎和索引引擎,部分文本分析引擎。
Lucene经典的打分策略打分公式如下所示:
score ( q , d ) = coord ( q , d ) × queryNorm ( q ) × Σ t in q ( tf ( t in d ) × idf ( t ) 2 × t . getBoost ( ) × norm ( t , d ) )
tf(t in d):项频率因子,文档d中出现项t的频率,又称之为文档频率;
idf(t):项在倒排文档中出现的频率,称之为倒文档频率;
getBoost:加权项,可以对文档和域分别进行加权,对于该加权信息,可以由用户自己根据数据的实际情况进行定义;
norm:域的归一化因子,用来表明域中包含的项数量,越短的域在包含相同项数量的同时具有更高的权重;
coord:协调因子,基于文档中包含查询项的个数,对文档中包含更多搜索项的文档进行and加权操作;
queryNorm:每个查询项的归一化值,每个查询项的权重平方和。
对于上述的Lucene的打分公式,其中idf(t)的定义为:
idf ( t ) = 1.0 + log numDocs ( docFreq + 1 )
上述打分方法的含义是:用户输入的搜索关键词,出现在某文档中的频率越高,相关性分值越高;若搜索关键词在其它文档中出现的次数越少,相关性分值越高。
但在电子商务搜索引擎排名中,由于涉及大量的权重较高的因子,其排名不完全取决于商品中包含关键词的多少,还包括商品信息的完善程度,在线时间,商品的点击率和询盘转化率等因素,关键词的TF,IDF分值变成了一个非常次要的参考因素,无法在电子商务搜索起到至关重要的作用。
通常的搜索引擎采用的是包含方式的查询,例如在通用搜索引擎中搜索paper,在搜索结果中出现A4paper和paper machine都是合理的,但是在电子商务搜索引擎中搜索paper,用户希望召回的产品是paper,而不是machine,所以电子商务搜索引擎需要分析提取商品的中心关键词,避免在搜索结果中出现与用户需求相关度不强的商品信息。
搜索引擎的评价指标是准确率和召回率,其中准确率主要体现在能否将相关性强的商品优先展现给用户,召回率可以通过模糊匹配来进行,将相关性弱的商品展现在相关性强的商品的后面。
根据用户的使用习惯,用户都希望搜索时,能快速看到最相关,最重要的搜索结果,因此,如何在尽量短的时间内将用户最希望搜索到的商品返回给用户,如何提升占搜索量较高的前几页搜索结果的查询效率,以及如何平衡各排名因子对最终搜索结果排名的影响,这些在电子商务搜索中,是非常重要的。
发明内容
针对现有技术中存在的不足,本发明提供一种电子商务搜索评分与排名的方法及系统,它针对电子商务搜索的特点,识别商品的中心关键词,在查询时执行优先匹配。在接受到用户输入的查询搜索关键词后,进行语义分析,考虑到查询域的不同,以及商品浏览量等指标的不同,从而构建不同相关性、重要性的查询语句。当用户搜索商品时,根据查询的相关性、重要性的差别,执行不同的查询,从而可以快速返回搜索结果。
技术方案,详细如下:一种电子商务搜索引擎的评分与排名方法,包括:
步骤一、构建电子商务平台商品的关键词词库;
步骤1-1、选择数据源,并进行关键词使用量的统计;
以搜索日志为数据源,选择用户在一段时间内所使用的搜索关键词,对每日每位用户的搜索关键词进行去重,然后统计每个搜索关键词的每日的用户使用量,将一段时间内搜索关键词的每日的用户使用量进行累加,统计出搜索关键词一段时间内的用户使用量;
在电子商务平台中的商品信息中,包含有商品关键词,选择这些商品关键词作为数据源,并对同一个供应商的商品关键词进行去重,然后统计有多少供应商在描述商品的过程中使用了该商品关键词,以及有多少商品使用了该商品关键词;
步骤1-2、根据约束条件选择待选关键词;
经过步骤1-1处理后,将产生大量关键词的候选集合,需要从所述候选关键词数据中,选择符合约束条件的关键词进入词库,约束条件包括:
●当关键词搜索数量,关键词的供应商使用数量,使用关键词的商品数量超过一定阈值时,这些关键词作为待维护的关键词;
●过滤掉一些明显存在错误的原始关键词;
步骤1-3、制定中心关键词识别规则,找出其中中心关键词,并进行标记;
针对电子商务平台上商品的特点,对待选关键词进行处理,识别其中的中心关键词,识别商品中心关键词包含如下规则:
●首先分析各语言的语法结构,分析待选关键词的中心是偏左还是偏右;
●在构建的词库中,判别哪些关键词是表示的是具体的商品,哪些关键词是修饰型关键词;自右向左扫描输入的商品名称,当遇到修饰关键词时,直接跳过,当遇到括号时,认为括号中的信息是对商品本身的补充说明,作为修饰关键词,当识别出一个关键词,该关键词表示的是具体的商品,那么该关键词就是所识别出来的中心关键词;如果存在语义转换词,则直接跳至这些语义转换词的前面继续进行识别,直到找到一个商品中心关键词,或由于商品名称信息表述上的原因而无法找到;
经过上述处理后,标识其中的中心关键词。
步骤二、计算商品的重要性因子净分值;
步骤2-1、选择商品属性作为商品的重要性因子,采用统一的方法来计算每个商品的重要性分值;
所述商品属性,包括商品名称,描述,属性,登录时间,是否存在图片;商品的访问量,点击率,询盘量;
步骤2-2、根据重要性因子的重要性高低配置权重;
由于每个因子的重要程度不同,需要区分这些因子的重要程度,为每一个因子分配不同的权重时,配置的权重越高,意味着该因子越重要;
对每个重要性因子进行评分,计算每个重要性因子的评分值与所有重要性因子的评分值总和的百分比,根据这个百分比的大小作为基准,给每个重要性因子分配合适的权重,这个百分比越大,表示对应的因子重要程度越高,因此分配的权重也应该越高;
步骤2-3、计算商品的净分值;
把商品重要因子影响排名的分值按照一定规则计算出来,称之为商品排名的净分值;
对商品的重要性因子进行综合评分时,不同因子具有不同的数值空间,有些数值是枚举类型,有些数值是连续性数值,对于不同类型的数值采用不同的方式计算其净分值;
对于连续性数值,将数值的最小值对应为0,最大值对应为该因子获得的最高分值,由此构建线性函数的方式,从而对该因子的评分值都能按统一的线性函数计算出对应的净分值;
对于枚举类型,采用类似的构建线性函数的方式,或直接为商品的每个重要性因子的数值,映射对应净分值;
对于非线性类型,通过选择该重要性因子中具有代表性的数值,给这些数值配置不同的净分值,其它范围的净分值通过多项式拟合函数拟合,或采用分段的线性函数进行拟合,使得每个因子的每个评分值都获得较为一致的重要性净分值;
将所述重要性净分值计算出来后,存储在索引中,一旦商品信息发生变化,再重新计算该商品的净分值。
步骤三、提取商品中的属性信息,存储到索引中;
步骤3-1、对商品名称进行分词处理后,与词库比较,获取中心关键词;
对每一个商品名称,依次自右向左扫描,当识别其中含有修饰关键词时,直接跳过,当遇到括号时,认为括号中的信息是对商品本身的补充说明,则作为修饰关键词,当识别出一个关键词,与词库中的关键词进行比对,如果该关键词在词库中,并且其特征为“中心关键词”,则把该关键词作为中心关键词;
对于商品的英文名称,需要进一步处理:该关键词前面没有语义转换词,则该关键词为中心关键词;如果存在语义转换词,则识别商品名称中心关键词的装置,直接跳至这些语义转换词的前面继续进行识别,直到找到一个商品中心关键词,或由于商品名称信息表述上的原因而无法找到;
在每个商品中,对于找到的中心关键词,做好标记;
步骤3-2、计算商品的重要性净分值;
步骤3-3、提取商品中的三个相关属性信息,包括:商品名称、商品关键字、商品的具体描述;
步骤3-4、把该商品的中心关键词、重要性净分值、以及三个相关属性的信息,一起存储到索引中。
步骤四、按照相关性和重要性构建系列查询块;
步骤4-1、选定相关性查询要素,重要性要素;
将用户的搜索行为拆分成一系列的查询,在查询块的设计与排序上,将相关性高、重要性高的查询,配置在编号靠前的查询块中,优先执行,在配置业务时,采用配置面板的形式进行配置;
相关性查询要素表示用户输入的搜索关键词在商品信息中的限定匹配,具体为在商品名称上的匹配、在商品关键词上的匹配、在商品具体描述信息上的匹配;
重要性要素表示对商品重要性影响的因素;
步骤4-2、设置每个查询块的顺序;
相关性查询要素与重要性要素,共同组成一个查询块,用查询块号表示,查询块号越小时,表示该查询块执行的搜索结果相关性越强、重要性越高;
步骤4-3、设置每个查询块召回的查询结果的净分值;
将查询的相关性与重要性以数值的形式表现,给每个查询块召回的结果分配相应净分值,商品排名的净分值=商品重要性的净分值+相关性查询块对应的配置的净分值;最终商品的排名取决于每个商品获得的最终净分值,净分值越高,排名越靠前,当净分值相同时,按照随机方法选择次序展示,或按照商品的更新时间进行排名。
步骤五、根据分页参数,选择相应的搜索结果,并进行排名;
步骤5-1、对输入的搜索关键词进行分词,然后将分词结果与词库中的关键词进行对比,从而识别出用户输入搜索关键词中的修饰词成分与中心关键词成分;
步骤5-2、在缺省显示第一页的搜索结果的情况下,执行相关性最强、重要性最高的第一查询块,得到搜索结果后,计算搜索结果的记录数量,如果数量超过第一页最大能显示的记录数量,则查询工作结束;否则,按照查询块的优先顺序,依次执行第二个查询块,并把第二个查询块的搜索结果与第一查询块的搜索结果进行比较,去除第二个查询块中与第一查询块相同的搜索结果后,计算两次查询结果的记录总数量,以此类推,直到获得多次搜索结果并去除重合部分后,其记录总数量超过第一页最大能显示的记录数量为止;
步骤5-3、当点击搜索结果分页中的某一页时,通过执行相应的查询块,并根据页面展示的数量选择搜索结果并排序,在点击的分页页面上展示相应的查询结果;
步骤5-4、缓存查询结果,执行深度查询。
本发明同时公开了一种电子商务搜索引擎的评分与排名系统,它由搜索关键词输入单元、索引生成模块、搜索处理模块、关键词词库单元、搜索结果显示单元组成,所述搜索关键词输入单元、搜索处理模块与搜索结果显示单元相连,所述索引生成模块与搜索处理模块连接,所述关键词词库单元与索引生成模块、搜索处理模块连接;
所述搜索关键词输入单元用于用户在电子商务平台上根据自己的需要输入搜索关键词;
所述索引生成模块由商品单元、第一分词处理器、重要性因子处理器、索引单元组成,所述商品单元、重要性因子处理器、索引单元顺次连接,所述第一分词处理器与商品单元、索引单元、所述关键词词库单元相连;
所述商品单元用于存储电子商务平台上的商品信息;
所述第一分词处理器用于对所述商品单元中的商品的名称进行分词处理,与所述关键词词库单元中的中心关键词进行匹配,并标识商品名称中的中心关键词;
所述重要性因子处理器用于计算商品单元中每个商品的净分值;
所述索引单元用于保存商品的中心关键词、净分值,以及商品属性信息,包括商品名称、商品关键词、商品的具体描述;
所述搜索处理模块由搜索关键词接收单元、第二分词处理器、查询块处理器、搜索结果排名处理器,所述搜索关键词接收单元、第二分词处理器、查询块处理器、搜索结果排名处理器顺次连接,所述第二分词处理器与所述关键词词库单元连接;
所述搜索关键词接收单元用于接收用户输入的将要搜素的关键词;
所述第二分词处理器用于对接收的搜索关键词进行分词处理,与所述关键词词库单元中的中心关键词进行匹配,并标识搜索关键词中的中心关键词;
所述查询块处理器根据构成的一系列查询块,在索引单元中进行查询,并得出搜索结果;
所述搜索结果排名处理器根据分页情况对搜索结果进行选择,并进行排序;根据召回的搜索结果,计算其总的净分值,根据净分值进行排序,在整体上保证较好的有序性;在相同查询块的内部,由于“相关性查询块对应的查询块配置的净分值”是相同的,在此基础上再根据重要性因子计算出“商品重要性的净分值”,然后进行排名,从而获得理想的排名结果;
所述搜索结果显示单元用于显示经过处理后的搜索结果;
所述关键词词库单元用于对一段时间内所使用的搜索关键词、以及电子商务平台中的商品的关键词进行分词处理,并标识其中的中心关键词和修饰关键词,并对这些关键词进行存储;作为中心关键词的标准,提供给分词处理器使用。
本发明有益效果:
1、构建关键词词库,以其中的中心关键词为标准,对商品名称和搜索关键词进行分析,标识其中的中心关键词,保证搜索结果是客户需要商品。
2、通过查询块体系,优先执行相关性强、重要性高的查询块,再加上重要因子净分值的作用,保证商品信息完整、相关性强、重要性高的搜索结果优先展示给用户。
3、在展示搜索结果时,前面的分页计算量小,越到后面的分页,其搜索结果选择计算量越大,优先保证了前面分页展示的高效率。
4、通过缓存,保存了浏览各个分页搜索结果的数据,保证了以后浏览的高效率。
附图说明
图1为本发明的搜索过程执行流程图。
图2为本发明的相关信息保存到索引流程图。
图3为本发明计算商品的重要性因子净分值流程图。
图4为本发明的索引文件内容构建过程。
图5为本发明的系统结构图。
具体实施方式
以下结合附图和具体实施例对本发明作进一步详细说明。
本实施例公开了一种电子商务搜索引擎的评分与排名方法,包括:
1、构建电子商务平台商品的关键词词库。
(1)选择数据源,并进行关键词使用量的统计;
以搜索日志为数据源,选择用户在一段时间内所使用的搜索关键词,对每日每位用户的搜索关键词进行去重,然后统计每个搜索关键词的每日的用户使用量,将一段时间内搜索关键词的每日的用户使用量进行累加,统计出搜索关键词一段时间内的用户使用量。
在电子商务平台中的商品信息中,包含有商品关键词,选择这些商品关键词作为数据源,并对同一个供应商的商品关键词进行去重,然后统计有多少供应商在描述商品的过程中使用了该商品关键词,以及有多少商品使用了该商品关键词。
(2)根据约束条件选择待选关键词;
经过上述处理后,将产生大量关键词的候选集合,需要从上述候选关键词数据中,选择符合约束条件的关键词进入词库,约束条件包括:
●当关键词搜索数量,关键词的供应商使用数量,使用关键词的商品数量超过一定阈值时,这些关键词的分析和使用价值较大,将它们添加到词库中,作为待维护的关键词;
●过滤掉一些明显存在错误的原始关键词,例如单字、单字母、使用量和搜索量较少的词。
(3)制定中心关键词识别规则,找出其中中心关键词,并进行标记;
针对电子商务平台上商品的特点,对待选关键词进行处理,识别其中的中心关键词,识别商品中心关键词包含如下规则:
●首先需要先分析各语言的语法结构,分析待选关键词的中心是偏左还是偏右,通过分析,中心关键词一般出现在待选关键词的右边。
●在上述构建的词库中,判别哪些关键词是表示的是具体的商品,哪些关键词是修饰型关键词。自右向左扫描输入的商品名称,当遇到修饰关键词时,直接跳过,当遇到括号时,认为括号中的信息是对商品本身的补充说明,应该也作为修饰关键词,当识别出一个关键词,该关键词表示的是具体的商品,以英文为例,如果该关键词并前面没有for,with,without,in,made of等语义转换词,那么该关键词就是所识别出来的中心关键词。如果存在语义转换词,则直接跳至这些语义转换词的前面继续进行识别,直到找到一个商品中心关键词,或由于商品名称信息表述上的原因而无法找到。
经过上述处理后,标识其中的中心关键词。对于中心关键词分词结果不满足实际需要的,需要通过“人工切分”来保存正确的切分结果。
因此,该词库的格式如下表所示。
2、计算商品的重要性因子净分值。
(1)选择商品属性作为商品的重要性因子;
通常情况下商品有非常多的属性,包括商品名称,描述,属性,登录时间,是否存在图片等;另外在电子商务系统中,由于用户访问,商品也因此具有社会属性,例如商品的访问量,点击率,询盘量等。从中选择一些商品属性作为商品的重要性因子,然后采用统一的方法来计算每个商品的重要性分值。
(2)根据重要性因子的重要性高低配置权重;
由于每个因子的重要程度不同,需要区分这些因子的重要程度,通常采用大量人工对其重要性评分,并进行统计,如下所示。
因子F1 因子F2 因子F3 …… 因子Fn
人工1评分 A11 A12 A13 ...... A1n
人工2评分 A21 A22 A23 …… A2n
…….
人工i评分 Ai1 Ai2 Ai3 …… Ain
总和 A11+A21…+Ai1 …… ….. …… A1n+A2n+…+Ain
其中,分值Aij是某人i对因子Fj重要性的评分,可以设置其范围在[0,10],如果分值Aij越大,表示某人i对因子Fj重要性的评分越高。
根据最后一行的总和Tj=A1i+A2i+…+Aii进行排序,从而给出了这些因子的相对重要性的高低,则Tj/(T1+……+Tn)对这些因子的权重具有参考价值。
在为每一个因子分配不同的权重时,配置的权重越高,意味着该因子越重要。
假设总分值为T=T1+……+Tn,存在N个因子
F1,F2,………,Fn
将这N个因子平衡对比,在Ti/(T1+……+Tn)的基础上,给这些因子配置不同的权重,这些权重是:
a1,a2,………,an
这样,因子Fx获得的最高分值为:
Vx=ax/(a1+a2+……+an)*T
(3)计算商品的净分值;
在此,把商品重要因子影响排名的分值按照一定规则计算出来,称之为商品排名的净分值。
对商品的重要性因子进行综合评分时,不同因子具有不同的数值空间,有些数值是枚举类型,有些数值是连续的数值,对于不同类型的数值采用不同的方式计算其净分值。
对于连续性数值,可以将数值的最小值对应为0,最大值对应为该因子可以获得的最高分值,即Vx=ax/(a1+a2+……+an)*T,由此构建线性函数的方式,从而对该因子的人工评分值都能按统一的线性函数计算出对应的净分值。例如,构建的线性函数为:
y=kx+b
其中,x为商品的某一重要性因子的数值,y为净分值。
对于枚举类型,也采用类似的构建线性函数的方式,或直接为商品的每个重要性因子的数值,映射对应净分值。
对于非线性类型,通过选择该重要性因子中一些具有代表性的数值,给这些数值配置不同的净分值,其它范围的净分值可以通过多项式拟合函数拟合,或采用分段的线性函数进行拟合,这样每个因子的每个评分值都获得了较为一致的重要性净分值。
若有几个因素有关联影响,则将它们看成是一个整体,从整体上来先评估其影响,并计算其重要性净分值。
虽然每个重要性因子的度量不一定相同,但是通过上述的规整以后,所有的重要性因子的影响就变得非常的清晰明了。
将该重要性净分值计算出来后,存储在索引中,一旦商品信息发生变化,再重新计算该商品的净分值,这样就避免了在查询期间,计算每个商品的重要性分值而带来的时间消耗。
3、提取商品中的属性信息,存储到索引中。
(1)对商品名称进行分词处理后,与词库比较,获取中心关键词;
对每一个商品名称,依次自右向左扫描,当识别其中含有修饰关键词时,直接跳过,当遇到括号时,认为括号中的信息是对商品本身的补充说明,应该也作为修饰关键词,当识别出一个关键词,与词库中的关键词进行比对,如果该关键词在词库中,并且其特征为“中心关键词”,则把该关键词作为中心关键词。
对于商品的英文名称,需要进一步处理:该关键词前面没有for,with,without,in,made of等语义转换词,则该关键词为中心关键词。如果存在语义转换词,则识别商品名称中心关键词的装置,直接跳至这些语义转换词的前面继续进行识别,直到找到一个商品中心关键词,或由于商品名称信息表述上的原因而无法找到。
在每个商品中,对于找到的中心关键词,做好标记。
(2)计算商品的重要性净分值;
在本实施例中,选择商品的以下属性作为重要因子:
●供应商最后登陆时间
●产品的更新时间
●产品名称不重复单词的个数
●是否存在图片,是否为多图产品
●“海关编码”字段是否填写
●“出口市场”字段是否填写
●“产品型号”字段是否填写
●“产品规格”字段是否填写
●“生产能力”字段是否填写
●“原产地”字段是否填写
●“产品包装”字段是否填写
●“具体描述”字段是否填写
其中,作为连续性数值的因子为:
●供应商最后登陆时间
●产品的更新时间
通过已经构建好的线性函数,来获得商品在这2个因子上的净分值。
作为枚举数值的因子为:
●商品名称不重复单词的个数
●是否存在图片,是否为多图产品
通过每个商品中的相应属性,对应给出其枚举值作为该因子的净分值。
作为只判断是否填写的因子为:
●“海关编码”字段是否填写
●“出口市场”字段是否填写
●“产品型号”字段是否填写
●“产品规格”字段是否填写
●“生产能力”字段是否填写
●“原产地”字段是否填写
●“产品包装”字段是否填写
●“具体描述”字段是否填写
对于没有填写信息的字段,给出该因子的最低分,对于填写信息的字段,给出该因子的最高分。
得出该产品的总的重要性净分值为:以上各个因子的净分值总和。
(3)提取商品中的三个相关属性信息,包括:商品名称、商品关键字、商品的具体描述。
(4)把该商品的中心关键词、重要性净分值、以及三个相关属性的信息,一起存储到索引中。
4、按照相关性和重要性构建系列系列查询块。
对于用户输入的搜索关键词,需要在商品属性信息中进行匹配,有三种匹配方式:
●对商品的名称进行匹配;
●对商品的关键字进相匹配;
●对商品的具体描述进行匹配。
另外,商品其他属性,例如会员级别,商品质量,信任度,询盘数量等信息的不同也决定了排名的不同。
(1)选定相关性查询要素,重要性要素;
用户在电子商务搜索引擎中希望召回的不是全部的搜索结果,而是能够展现在一个Web页面中的搜索结果,通常在20至50条左右。所以将用户的搜索行为拆分成一系列的查询。在查询块的设计与排序上,一般都将相关性高、重要性高的查询,配置在编号靠前的查询块中,优先执行,在配置业务时,采用配置面板的形式进行配置。
配置面板的形式如下表所示,例如相关性分为5个级别,重要性分为3个级别。
重要性1 重要性2 重要性3
相关性查询1 Query1 Query3 Query6
相关性查询2 Query2 Query5 Query9
相关性查询3 Query4 Query8 Query10
相关性查询4 Query7 Query11 Query12
相关性查询5 Query13 Query14 Query15
在上表中,相关性查询i表示用户输入的搜索关键词在商品信息中的限定匹配,具体为在商品名称上的匹配、在商品关键词上的匹配、在商品具体描述信息上的匹配。
重要性j表示对商品重要性影响的因素,例如,是否是主打商品,商品质量、该商品的供应商是否有良好的诚信记录等。
(2)设置每个查询块的顺序;
相关性查询i与重要性j,共同组成一个查询块QueryY,该Y数值表示查询块号,例如,相关性查询2与重要性3的组成查询块Query9。假如相关性为“在商品中心关键词上的匹配”,重要性为“非主打商品”,则其查询块的语句为:
“商品名称:#搜索关键词AND主打:0”。
查询块号越小时,表示该查询块执行的搜索结果相关性越强、重要性越高。所以在上面的例子中,Query1表示执行这个查询块得到的结果相关性最强,重要性最高,Query15表示的查询结果相关性最弱、重要性最低。
每个查询块执行的优先级,综合用户的建议以及运营人员的统计分析排序。
(3)设置每个查询块召回的查询结果的净分值;
为了将查询的相关性与重要性以数值的形式表现,给每个查询块召回的结果分配相应净分值,Query1配置的净分值最高,Query15配置的净分值最低。这样就形成了每件召回的商品的净分值的计算方法。
商品排名的净分值=商品重要性的净分值+相关性查询块对应的QueryY配置的净分值。
最终商品的排名取决于每个商品获得的最终净分值,净分值越高,排名越靠前,当净分值相同时,可以按照随机方法选择次序展示,或按照商品的更新时间进行排名,这样就可以获得确定性的排名结果。
其中,对相关性查询块对应的QueryY配置的净分值赋予的值比较大,例如在本实施例中,每个查询块的净分值跨度在100分,而商品重要性的净分值的范围为:[0,100]。
应用举例:
为了进一步说明不同重要性、相关性的查询块的作用,下面将举例说明输入查询词为“paper”时,为什么将搜索结果“A4paper”的排名排在“paper machine”的前面?
从召回商品上来看,搜索结果“A4paper”和“paper machine”都应该被召回,但是因为“A4paper”的中心词是“paper”,而“paper machine”的中心词是“machine”,而不是“paper”。所以在查询块的设计上,优先查询以“paper”为中心关键词的商品,其次查询商品关键词为“paper的商品,最后查询商品具体描述中包含“paper”的产品。在同一个查询语句中,根据每个商品的净分值进行排名,利用该方法可以确保用户搜索“paper”时,“A4paper”能够获得较高的排名。
在设计相关性查询块时,进行扩展,例如对用户搜索关键词的同义词处理,通过构建查询语句,将相关性查询3看成是用户搜索关键词的同义词,通过该方法,可以根据搜索结果的情况,不断给用户搜索关键词添加同义词,不断完善搜索结果。
5、根据分页参数,选择相应的搜索结果,并进行排名。
当用户进行搜索时,具有一定的范围,包括:搜索关键词,过滤条件,开始位置,结果长度等几项内容。依靠搜索关键词和过滤条件构建不同的查询块,并根据开始位置结果长度等召回相应的搜索结果。
(1)对输入的搜索关键词进行分词,然后将分词结果与词库中的关键词进行对比,从而识别出用户输入搜索关键词中的修饰词成分与中心关键词成分。
(2)在缺省显示第一页的搜索结果的情况下,执行相关性最强、重要性最高的查询块Query1,得到搜索结果后,计算搜索结果的记录数量,如果数量超过第一页最大能显示的记录数量,则查询工作结束。否则,按照查询块的优先顺序,依次执行第二个查询块Query2,并把第二个查询块Query2的搜索结果与Query1的搜索结果进行比较,去除Query2中与Query1相同的搜索结果后,计算两次查询结果的记录总数量,以此类推,直到获得多次搜索结果并去除重合部分后,其记录总数量超过第一页最大能显示的记录数量为止。
然后计算这些查询结果的净分值,按照下述公式计算:
商品排名的净分值=商品重要性的净分值+相关性查询块对应的QueryY配置的净分值。
最后,按照商品排名的净分值的大小顺序,选出第一页最大能显示的记录数量的结果在第一页进行展示。
(3)当点击搜索结果分页中的某一页时,通过执行相应的查询块,并根据页面展示的数量选择搜索结果并排序,在点击的分页页面上展示相应的查询结果。
假设QueryX召回的数据为ResultX,查询块的序列如下所示:
Query1,Query2,………Querym
查询块序列对应的搜索结果序列如下:
Result1,Result2,………Resultm
不同的查询块对应的搜索结果有可能有重合,例如Result2的结果有可能包含Result1的部分结果,所以真正属于第2查询块的查询结果的数据应当为:
Result2-Result1
这样进行下列计算:
Result1,Result2-Result1,Result3-(Result1∪Result2),……,Resultm-(Result1∪Result2……∪Resultm-1)
形成新的搜索结果序列:
NewResult1,NewResult2,NewResult3,………,NewResultm
这些NewResult没有重合的结果,也就是说不存在同样一个搜索结果隶属于2个不同的NewResult。
通过合理配置商品重要性净分值以及相关性查询块配置的净分值,NewResulti的商品的排名将一定排名在NewResult(i+1)中商品的前面。
上述各个搜索结果集合的记录数量序列如下:
A1,A2,A3,………,Am
对于某一分页上要展示的查询结果,其中查询结果的开始位置start必然处于:
A1+…+A(i-1)<start<=A1+…+Ai
对于每个页面要展示的搜索结果数量为size,则
(A1+…+Aj)<=start+size,i<=j
寻找到i和j后,分如下几种情况进行收集查询结果。
如果i=j,说明收集的查询结果存在于同一个数据集合NewResulti中,页面展示的搜索结果数量size保持不变,由于在Ai之前已经有i-1组数据:A1,A2,A3,………,A(i-1),在数据集合NewResulti中,位置从第start-[A1+A2+A3+………+A(i-1)]个搜索结果开始进行计算,向后取size个查询结果记录进行展示。
如果i<j,在这种情况下,收集的查询结果记录来自多个查询块的数据:
●在NewResulti的搜索结果包括从第start-[A1+A2+A3+………+A(i-1)]条记录开始至NewResulti剩下的记录
●NewResult(i+1)至NewResult(j-1)块的所有记录,
●包括NewResultj中的从第0至第start+size-[A1+A2+A3+………+A(j-1)]个记录。
然后计算这些搜索结果的净分值,按照下述公式计算:
商品排名的净分值=商品重要性的净分+相关性查询块对应的QueryY配置的净分值。
最后,按照商品排名的净分值的大小顺序,选出该页最大能显示的记录数量的结果在该页进行展示。
(4)缓存查询块结果,执行深度查询;
通过上述的过程,当用户请求前面几个查询结果页面时,计算过程非常简单,但是当计算深度页面时,由于涉及的查询块较多,并且还需要做去重操作,执行的过程相对来说还是比较复杂的,在这种情况下,去除查询块之间的重合查询结果记录,可以缓存NewResult的大小,这样在查询时,就不需要从前面查询块开始查询,而直接定位到从哪个查询块开始查询,通过缓存结果大小,就可以获得较快的查询速度。
本发明公开了一种电子商务搜索引擎的评分与排名系统,如图5所示,包括:
本系统由搜索关键词输入单元、索引生成模块、搜索处理模块、关键词词库单元、搜索结果显示单元组成。输入单元、搜索处理模块与搜索结果显示单元相连,索引生成模块与搜索处理单元连接,关键词词库单元与索引生成模块、搜索处理模块连接。
搜索关键词输入单元用于用户在电子商务平台上根据自己的需要输入搜索关键词。
索引生成模块由商品单元、分词处理器1、重要性因子处理器、索引单元组成。商品单元、重要性因子处理器、索引单元顺次连接,分词处理器1与商品单元、索引单元、关键词词库单元相连。
商品单元用于存储电子商务平台上的商品信息。
分词处理器1用于对商品单元中的商品的名称进行分词处理,与关键词词库单元中的中心关键词进行匹配,并标识商品名称中的中心关键词。
重要性因子处理器用于计算商品单元中每个商品的净分值。
索引单元用于保存商品的中心关键词、净分值,以及商品属性信息,包括商品名称、商品关键词、商品的具体描述。
搜索处理模块由搜索关键词接收单元、分词处理器2、查询块处理器、搜索结果排名处理器。其中,搜索关键词接收单元、分词处理器2、查询块处理器、搜索结果排名处理器顺次连接,分词处理器与关键词词库单元连接。
搜索关键词接收单元用于接收用户输入的将要搜素的关键词。
分词处理器1用于对接收的搜索关键词进行分词处理,与关键词词库单元中的中心关键词进行匹配,并标识搜索关键词中的中心关键词。
查询块处理器根据构成的一系列查询块,在索引单元中进行查询,并得出搜索结果。
搜索结果排名处理器根据分页情况对搜索结果进行选择,并进行排序。根据召回的搜索结果,计算其总的净分值,根据净分值进行排序,在整体上保证较好的有序性。在相同查询块的内部,由于“相关性查询块对应的QueryY配置的净分值”是相同的,在此基础上再根据重要性因子计算出“商品重要性的净分值”,然后进行排名,从而获得理想的排名结果。
搜索结果显示单元用于显示经过处理后的搜索结果。
关键词词库单元用于对一段时间内所使用的搜索关键词、以及电子商务平台中的商品的关键词进行分词处理,并标识其中的中心关键词和修饰关键词,并对这些关键词进行存储。作为中心关键词的标准,提供给分词处理器使用。
以上实施例只是对于本发明的部分功能进行描述,但实施例和附图并不是用来限定本发明的。在不脱离本发明之精神和范围内,所做的任何等效变化或润饰,同样属于本发明之保护范围。因此本发明的保护范围应当以本申请的权利要求所界定的内容为准。

Claims (9)

1.一种电子商务搜索引擎的评分与排名方法,包括:
步骤一、构建电子商务平台商品的关键词词库;
步骤二、计算商品的重要性因子净分值;
步骤三、提取商品中的属性信息,存储到索引中;
步骤四、按照相关性和重要性构建系列查询块;
步骤五、根据分页参数,选择相应的搜索结果,并进行排名。
2.根据权利要求1所述的方法,其特征在于:步骤一的具体方案为,
步骤1-1、选择数据源,并进行关键词使用量的统计;
以搜索日志为数据源,选择用户在一段时间内所使用的搜索关键词,对每日每位用户的搜索关键词进行去重,然后统计每个搜索关键词的每日的用户使用量,将一段时间内搜索关键词的每日的用户使用量进行累加,统计出搜索关键词一段时间内的用户使用量;
在电子商务平台中的商品信息中,包含有商品关键词,选择这些商品关键词作为数据源,并对同一个供应商的商品关键词进行去重,然后统计有多少供应商在描述商品的过程中使用了该商品关键词,以及有多少商品使用了该商品关键词;
步骤1-2、根据约束条件选择待选关键词;
经过步骤1-1处理后,将产生大量关键词的候选集合,需要从所述候选关键词数据中,选择符合约束条件的关键词进入词库,约束条件包括:
●当关键词搜索数量,关键词的供应商使用数量,使用关键词的商品数量超过一定阈值时,这些关键词作为待维护的关键词;
●过滤掉一些明显存在错误的原始关键词;
步骤1-3、制定中心关键词识别规则,找出其中中心关键词,并进行标记;
针对电子商务平台上商品的特点,对待选关键词进行处理,识别其中的中心关键词,识别商品中心关键词包含如下规则:
●首先分析各语言的语法结构,分析待选关键词的中心是偏左还是偏右;
●在构建的词库中,判别哪些关键词是表示的是具体的商品,哪些关键词是修饰型关键词;自右向左扫描输入的商品名称,当遇到修饰关键词时,直接跳过,当遇到括号时,认为括号中的信息是对商品本身的补充说明,作为修饰关键词,当识别出一个关键词,该关键词表示的是具体的商品, 那么该关键词就是所识别出来的中心关键词;如果存在语义转换词,则直接跳至这些语义转换词的前面继续进行识别,直到找到一个商品中心关键词,或由于商品名称信息表述上的原因而无法找到;
经过上述处理后,标识其中的中心关键词。
3.根据权利要求1所述的方法,其特征在于:步骤二的具体方案为,
步骤2-1、选择商品属性作为商品的重要性因子,采用统一的方法来计算每个商品的重要性分值;
所述商品属性,包括商品名称,描述,属性,登录时间,是否存在图片;商品的访问量,点击率,询盘量;
步骤2-2、根据重要性因子的重要性高低配置权重;
由于每个因子的重要程度不同,需要区分这些因子的重要程度,为每一个因子分配不同的权重时,配置的权重越高,意味着该因子越重要;
对每个重要性因子进行评分,计算每个重要性因子的评分值与所有重要性因子的评分值总和的百分比,根据这个百分比的大小作为基准,给每个重要性因子分配合适的权重,这个百分比越大,表示对应的因子重要程度越高,因此分配的权重也应该越高;
步骤2-3、计算商品的净分值;
把商品重要因子影响排名的分值按照一定规则计算出来,称之为商品排名的净分值;
对商品的重要性因子进行综合评分时,不同因子具有不同的数值空间,有些数值是枚举类型,有些数值是连续性数值,对于不同类型的数值采用不同的方式计算其净分值;
对于连续性数值,将数值的最小值对应为0,最大值对应为该因子获得的最高分值,由此构建线性函数的方式,从而对该因子的评分值都能按统一的线性函数计算出对应的净分值;
对于枚举类型,采用类似的构建线性函数的方式,或直接为商品的每个重要性因子的数值,映射对应净分值;
对于非线性类型,通过选择该重要性因子中具有代表性的数值,给这些数值配置不同的净分值,其它范围的净分值通过多项式拟合函数拟合,或采用分段的 线性函数进行拟合,使得每个因子的每个评分值都获得较为一致的重要性净分值;
将所述重要性净分值计算出来后,存储在索引中,一旦商品信息发生变化,再重新计算该商品的净分值。
4.根据权利要求1所述的方法,其特征在于:步骤三的具体方案为,
步骤3-1、对商品名称进行分词处理后,与词库比较,获取中心关键词;
对每一个商品名称,依次自右向左扫描,当识别其中含有修饰关键词时,直接跳过,当遇到括号时,认为括号中的信息是对商品本身的补充说明,则作为修饰关键词,当识别出一个关键词,与词库中的关键词进行比对,如果该关键词在词库中,并且其特征为“中心关键词”,则把该关键词作为中心关键词;
对于商品的英文名称,需要进一步处理:该关键词前面没有语义转换词,则该关键词为中心关键词;如果存在语义转换词,则识别商品名称中心关键词的装置,直接跳至这些语义转换词的前面继续进行识别,直到找到一个商品中心关键词,或由于商品名称信息表述上的原因而无法找到;
在每个商品中,对于找到的中心关键词,做好标记;
步骤3-2、计算商品的重要性净分值;
步骤3-3、提取商品中的三个相关属性信息,包括:商品名称、商品关键字、商品的具体描述;
步骤3-4、把该商品的中心关键词、重要性净分值、以及三个相关属性的信息,一起存储到索引中。
5.根据权利要求4所述的方法,其特征在于,选择商品的以下属性作为重要因子:
●供应商最后登陆时间;
●产品的更新时间;
●产品名称不重复单词的个数;
●是否存在图片,是否为多图产品;
●“海关编码”字段是否填写;
●“出口市场”字段是否填写;
●“产品型号”字段是否填写;
●“产品规格”字段是否填写;
●“生产能力”字段是否填写;
●“原产地”字段是否填写;
●“产品包装”字段是否填写;
●“具体描述”字段是否填写;
其中,作为连续性数值的因子为:
●供应商最后登陆时间;
●产品的更新时间;
通过已经构建好的线性函数,来获得商品在这两个因子上的净分值;
作为枚举数值的因子为:
●商品名称不重复单词的个数;
●是否存在图片,是否为多图产品;
通过每个商品中的相应属性,对应给出其枚举值作为该因子的净分值;
作为只判断是否填写的因子为:
●“海关编码”字段是否填写;
●“出口市场”字段是否填写;
●“产品型号”字段是否填写;
●“产品规格”字段是否填写;
●“生产能力”字段是否填写;
●“原产地”字段是否填写;
●“产品包装”字段是否填写;
●“具体描述”字段是否填写;
对于没有填写信息的字段,给出该因子的最低分,对于填写信息的字段,给出该因子的最高分;
得出该产品的总的重要性净分值为:以上各个因子的净分值总和。
6.根据权利要求1所述的方法,其特征在于:步骤四的具体方案为,
步骤4-1、选定相关性查询要素,重要性要素;
将用户的搜索行为拆分成一系列的查询,在查询块的设计与排序上,将相关性高、重要性高的查询,配置在编号靠前的查询块中,优先执行;
相关性查询要素表示用户输入的搜索关键词在商品信息中的限定匹配,具体 为在商品名称上的匹配、在商品关键词上的匹配、在商品具体描述信息上的匹配;
重要性要素表示对商品重要性影响的因素;
步骤4-2、设置每个查询块的顺序;
相关性查询要素与重要性要素,共同组成一个查询块,用查询块号表示,查询块号越小时,表示该查询块执行的搜索结果相关性越强、重要性越高;
步骤4-3、设置每个查询块召回的查询结果的净分值;
将查询的相关性与重要性以数值的形式表现,给每个查询块召回的结果分配相应净分值,商品排名的净分值=商品重要性的净分值+相关性查询块对应的配置的净分值;最终商品的排名取决于每个商品获得的最终净分值,净分值越高,排名越靠前,当净分值相同时,按照随机方法选择次序展示,或按照商品的更新时间进行排名。
7.根据权利要求1所述的方法,其特征在于:步骤五的具体方案为,
步骤5-1、对输入的搜索关键词进行分词,然后将分词结果与词库中的关键词进行对比,从而识别出用户输入搜索关键词中的修饰词成分与中心关键词成分;
步骤5-2、在缺省显示第一页的搜索结果的情况下,执行相关性最强、重要性最高的第一查询块,得到搜索结果后,计算搜索结果的记录数量,如果数量超过第一页最大能显示的记录数量,则查询工作结束;否则,按照查询块的优先顺序,依次执行第二个查询块,并把第二个查询块的搜索结果与第一查询块的搜索结果进行比较,去除第二个查询块中与第一查询块相同的搜索结果后,计算两次查询结果的记录总数量,以此类推,直到获得多次搜索结果并去除重合部分后,其记录总数量超过第一页最大能显示的记录数量为止;
步骤5-3、当点击搜索结果分页中的某一页时,通过执行相应的查询块,并根据页面展示的数量选择搜索结果并排序,在点击的分页页面上展示相应的查询结果;
步骤5-4、缓存查询结果,执行深度查询。
8.根据权利要求7所述的方法,其特征在于:步骤5-2中,计算查询结果的净分值公式:商品排名的净分值=商品重要性的净分值+相关性查询块对应的查询块配置的净分值;最后,按照商品排名的净分值的大小顺序,选出第一页最大能显示的记录数量的结果在第一页进行展示;
步骤5-3中,计算搜索结果的净分值公式:商品排名的净分值=商品重要性的净分+相关性查询块对应的查询块配置的净分值;最后,按照商品排名的净分值的大小顺序,选出该页最大能显示的记录数量的结果在该页进行展示
9.一种电子商务搜索引擎的评分与排名系统,其特征在于:由搜索关键词输入单元、索引生成模块、搜索处理模块、关键词词库单元、搜索结果显示单元组成,所述搜索关键词输入单元、搜索处理模块与搜索结果显示单元相连,所述索引生成模块与搜索处理模块连接,所述关键词词库单元与索引生成模块、搜索处理模块连接;
所述搜索关键词输入单元用于用户在电子商务平台上根据自己的需要输入搜索关键词;
所述索引生成模块由商品单元、第一分词处理器、重要性因子处理器、索引单元组成,所述商品单元、重要性因子处理器、索引单元顺次连接,所述第一分词处理器与商品单元、索引单元、所述关键词词库单元相连;
所述商品单元用于存储电子商务平台上的商品信息;
所述第一分词处理器用于对所述商品单元中的商品的名称进行分词处理,与所述关键词词库单元中的中心关键词进行匹配,并标识商品名称中的中心关键词;
所述重要性因子处理器用于计算商品单元中每个商品的净分值;
所述索引单元用于保存商品的中心关键词、净分值,以及商品属性信息,包括商品名称、商品关键词、商品的具体描述;
所述搜索处理模块由搜索关键词接收单元、第二分词处理器、查询块处理器、搜索结果排名处理器,所述搜索关键词接收单元、第二分词处理器、查询块处理器、搜索结果排名处理器顺次连接,所述第二分词处理器与所述关键词词库单元连接;
所述搜索关键词接收单元用于接收用户输入的将要搜素的关键词;
所述第二分词处理器用于对接收的搜索关键词进行分词处理,与所述关键词词库单元中的中心关键词进行匹配,并标识搜索关键词中的中心关键词;
所述查询块处理器根据构成的一系列查询块,在索引单元中进行查询,并得出搜索结果;
所述搜索结果排名处理器根据分页情况对搜索结果进行选择,并进行排序; 根据召回的搜索结果,计算其总的净分值,根据净分值进行排序,在整体上保证较好的有序性;在相同查询块的内部,由于“相关性查询块对应的查询块配置的净分值”是相同的,在此基础上再根据重要性因子计算出“商品重要性的净分值”,然后进行排名,从而获得理想的排名结果;
所述搜索结果显示单元用于显示经过处理后的搜索结果;
所述关键词词库单元用于对一段时间内所使用的搜索关键词、以及电子商务平台中的商品的关键词进行分词处理,并标识其中的中心关键词和修饰关键词,并对这些关键词进行存储;作为中心关键词的标准,提供给分词处理器使用。
CN201410349094.3A 2014-07-21 2014-07-21 一种电子商务搜索评分与排名的方法及系统 Active CN104063523B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410349094.3A CN104063523B (zh) 2014-07-21 2014-07-21 一种电子商务搜索评分与排名的方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410349094.3A CN104063523B (zh) 2014-07-21 2014-07-21 一种电子商务搜索评分与排名的方法及系统

Publications (2)

Publication Number Publication Date
CN104063523A true CN104063523A (zh) 2014-09-24
CN104063523B CN104063523B (zh) 2017-02-22

Family

ID=51551237

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410349094.3A Active CN104063523B (zh) 2014-07-21 2014-07-21 一种电子商务搜索评分与排名的方法及系统

Country Status (1)

Country Link
CN (1) CN104063523B (zh)

Cited By (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104408648A (zh) * 2014-12-09 2015-03-11 北京博雅立方科技有限公司 一种挑选商品的方法及装置
CN105069086A (zh) * 2015-07-31 2015-11-18 焦点科技股份有限公司 一种优化电子商务商品搜索的方法及系统
CN105404627A (zh) * 2014-09-11 2016-03-16 阿里巴巴集团控股有限公司 一种用于确定搜索结果的方法与设备
CN106802906A (zh) * 2015-11-26 2017-06-06 五八同城信息技术有限公司 信息查询方法、装置及服务器设备
CN106874352A (zh) * 2016-12-28 2017-06-20 河北中废通网络技术有限公司 一种搜索因子调整的方法
CN106959947A (zh) * 2016-01-08 2017-07-18 刘挺 一种新型可排序反爬虫多领域垂直搜索网站的设计方法
CN107122467A (zh) * 2017-04-26 2017-09-01 努比亚技术有限公司 一种搜索引擎的检索结果评价方法及装置、计算机可读介质
WO2017162074A1 (zh) * 2016-03-25 2017-09-28 阿里巴巴集团控股有限公司 商品映射方法、装置及设备
WO2017219317A1 (zh) * 2016-06-23 2017-12-28 北京三快在线科技有限公司 一种基于搜索内容的信息推送方法及装置
CN107807990A (zh) * 2017-11-05 2018-03-16 夏策联 一种基于用户偏好的智能搜索方法及系统
CN107886240A (zh) * 2017-11-09 2018-04-06 上海海事大学 一种基于规则的跨境电商商品质量风险识别方法
CN108280124A (zh) * 2017-12-11 2018-07-13 北京三快在线科技有限公司 产品分类方法及装置,排行榜生成方法及装置,电子设备
CN108509426A (zh) * 2018-04-11 2018-09-07 焦点科技股份有限公司 一种深度多维度流量语义分析方法
CN109154942A (zh) * 2016-07-03 2019-01-04 株式会社咕嘟妈咪 信息提供方法、信息提供程序及信息提供装置
WO2019041500A1 (zh) * 2017-08-28 2019-03-07 平安科技(深圳)有限公司 分页的实现方法、装置、计算机设备及存储介质
CN110347910A (zh) * 2019-05-28 2019-10-18 成都美美臣科技有限公司 一个电子商务网站搜索结果过滤规则
CN110362757A (zh) * 2019-05-28 2019-10-22 成都美美臣科技有限公司 一种电子商务网站排序搜索结果的方法
US20200065421A1 (en) * 2018-08-23 2020-02-27 Walmart Apollo, Llc Method and apparatus for ecommerce search ranking
WO2020125015A1 (zh) * 2018-12-17 2020-06-25 北京三快在线科技有限公司 场景化商家召回
CN111651663A (zh) * 2020-04-17 2020-09-11 世纪保众(北京)网络科技有限公司 根据用户搜索内容快速进行关键词完全匹配的检索方法
CN112818247A (zh) * 2021-02-22 2021-05-18 宝宝巴士股份有限公司 一种根据关键词分析产品热度的方法
CN112989190A (zh) * 2021-03-09 2021-06-18 北京百度网讯科技有限公司 一种商品挂载方法、装置、电子设备和存储介质
CN112989164A (zh) * 2021-03-26 2021-06-18 北京金堤征信服务有限公司 搜索结果处理方法、装置及电子设备
CN113343046A (zh) * 2021-05-20 2021-09-03 成都美尔贝科技股份有限公司 一种智能搜索排序系统
US11127064B2 (en) 2018-08-23 2021-09-21 Walmart Apollo, Llc Method and apparatus for ecommerce search ranking
CN113538082A (zh) * 2020-04-21 2021-10-22 江苏工电宝信息科技有限公司 一种产品搜索系统及方法
CN115169337A (zh) * 2022-08-24 2022-10-11 中教畅享(北京)科技有限公司 一种商品标题优化中关键词得分的计算方法
CN115203598A (zh) * 2022-07-20 2022-10-18 贝壳找房(北京)科技有限公司 房产领域的信息排序方法、电子设备及存储介质
CN116821164A (zh) * 2023-08-31 2023-09-29 成都智慧锦城大数据有限公司 一种实现可视化灵活组合动态配置的搜索方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102446180A (zh) * 2010-10-09 2012-05-09 腾讯科技(深圳)有限公司 一种商品搜索方法及其装置
CN103218364A (zh) * 2012-01-19 2013-07-24 阿里巴巴集团控股有限公司 一种搜索方法和系统
CN103577432A (zh) * 2012-07-26 2014-02-12 阿里巴巴集团控股有限公司 一种商品信息搜索方法和系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102446180A (zh) * 2010-10-09 2012-05-09 腾讯科技(深圳)有限公司 一种商品搜索方法及其装置
CN103218364A (zh) * 2012-01-19 2013-07-24 阿里巴巴集团控股有限公司 一种搜索方法和系统
CN103577432A (zh) * 2012-07-26 2014-02-12 阿里巴巴集团控股有限公司 一种商品信息搜索方法和系统

Cited By (40)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105404627A (zh) * 2014-09-11 2016-03-16 阿里巴巴集团控股有限公司 一种用于确定搜索结果的方法与设备
CN105404627B (zh) * 2014-09-11 2019-07-30 阿里巴巴集团控股有限公司 一种用于确定搜索结果的方法与设备
CN104408648A (zh) * 2014-12-09 2015-03-11 北京博雅立方科技有限公司 一种挑选商品的方法及装置
CN105069086A (zh) * 2015-07-31 2015-11-18 焦点科技股份有限公司 一种优化电子商务商品搜索的方法及系统
CN106802906A (zh) * 2015-11-26 2017-06-06 五八同城信息技术有限公司 信息查询方法、装置及服务器设备
CN106959947A (zh) * 2016-01-08 2017-07-18 刘挺 一种新型可排序反爬虫多领域垂直搜索网站的设计方法
WO2017162074A1 (zh) * 2016-03-25 2017-09-28 阿里巴巴集团控股有限公司 商品映射方法、装置及设备
US11397779B2 (en) 2016-06-23 2022-07-26 Beijing Sankuai Online Technology Co., Ltd. Method and device for pushing information based on search content
WO2017219317A1 (zh) * 2016-06-23 2017-12-28 北京三快在线科技有限公司 一种基于搜索内容的信息推送方法及装置
CN109154942B (zh) * 2016-07-03 2022-04-01 株式会社咕嘟妈咪 信息提供方法、信息提供程序及信息提供装置
CN109154942A (zh) * 2016-07-03 2019-01-04 株式会社咕嘟妈咪 信息提供方法、信息提供程序及信息提供装置
CN106874352A (zh) * 2016-12-28 2017-06-20 河北中废通网络技术有限公司 一种搜索因子调整的方法
CN107122467A (zh) * 2017-04-26 2017-09-01 努比亚技术有限公司 一种搜索引擎的检索结果评价方法及装置、计算机可读介质
CN107122467B (zh) * 2017-04-26 2020-12-29 努比亚技术有限公司 一种搜索引擎的检索结果评价方法及装置、计算机可读介质
WO2019041500A1 (zh) * 2017-08-28 2019-03-07 平安科技(深圳)有限公司 分页的实现方法、装置、计算机设备及存储介质
CN107807990A (zh) * 2017-11-05 2018-03-16 夏策联 一种基于用户偏好的智能搜索方法及系统
CN107886240A (zh) * 2017-11-09 2018-04-06 上海海事大学 一种基于规则的跨境电商商品质量风险识别方法
CN108280124A (zh) * 2017-12-11 2018-07-13 北京三快在线科技有限公司 产品分类方法及装置,排行榜生成方法及装置,电子设备
CN108509426A (zh) * 2018-04-11 2018-09-07 焦点科技股份有限公司 一种深度多维度流量语义分析方法
US20200065421A1 (en) * 2018-08-23 2020-02-27 Walmart Apollo, Llc Method and apparatus for ecommerce search ranking
US11232163B2 (en) * 2018-08-23 2022-01-25 Walmart Apollo, Llc Method and apparatus for ecommerce search ranking
US11127064B2 (en) 2018-08-23 2021-09-21 Walmart Apollo, Llc Method and apparatus for ecommerce search ranking
WO2020125015A1 (zh) * 2018-12-17 2020-06-25 北京三快在线科技有限公司 场景化商家召回
CN110347910A (zh) * 2019-05-28 2019-10-18 成都美美臣科技有限公司 一个电子商务网站搜索结果过滤规则
CN110362757A (zh) * 2019-05-28 2019-10-22 成都美美臣科技有限公司 一种电子商务网站排序搜索结果的方法
CN111651663A (zh) * 2020-04-17 2020-09-11 世纪保众(北京)网络科技有限公司 根据用户搜索内容快速进行关键词完全匹配的检索方法
CN113538082A (zh) * 2020-04-21 2021-10-22 江苏工电宝信息科技有限公司 一种产品搜索系统及方法
CN112818247A (zh) * 2021-02-22 2021-05-18 宝宝巴士股份有限公司 一种根据关键词分析产品热度的方法
CN112818247B (zh) * 2021-02-22 2023-11-03 宝宝巴士股份有限公司 一种根据关键词分析产品热度的方法
CN112989190A (zh) * 2021-03-09 2021-06-18 北京百度网讯科技有限公司 一种商品挂载方法、装置、电子设备和存储介质
CN112989190B (zh) * 2021-03-09 2024-03-01 北京百度网讯科技有限公司 一种商品挂载方法、装置、电子设备和存储介质
CN112989164A (zh) * 2021-03-26 2021-06-18 北京金堤征信服务有限公司 搜索结果处理方法、装置及电子设备
CN112989164B (zh) * 2021-03-26 2023-11-03 北京金堤征信服务有限公司 搜索结果处理方法、装置及电子设备
CN113343046A (zh) * 2021-05-20 2021-09-03 成都美尔贝科技股份有限公司 一种智能搜索排序系统
CN113343046B (zh) * 2021-05-20 2023-08-25 成都美尔贝科技股份有限公司 一种智能搜索排序系统
CN115203598A (zh) * 2022-07-20 2022-10-18 贝壳找房(北京)科技有限公司 房产领域的信息排序方法、电子设备及存储介质
CN115203598B (zh) * 2022-07-20 2023-09-19 贝壳找房(北京)科技有限公司 房产领域的信息排序方法、电子设备及存储介质
CN115169337A (zh) * 2022-08-24 2022-10-11 中教畅享(北京)科技有限公司 一种商品标题优化中关键词得分的计算方法
CN116821164A (zh) * 2023-08-31 2023-09-29 成都智慧锦城大数据有限公司 一种实现可视化灵活组合动态配置的搜索方法
CN116821164B (zh) * 2023-08-31 2023-11-21 成都智慧锦城大数据有限公司 一种实现可视化灵活组合动态配置的搜索方法

Also Published As

Publication number Publication date
CN104063523B (zh) 2017-02-22

Similar Documents

Publication Publication Date Title
CN104063523A (zh) 一种电子商务搜索评分与排名的方法及系统
Bar-Ilan Citations to the “Introduction to informetrics” indexed by WOS, Scopus and Google Scholar
CN101408886B (zh) 通过分析文档的段落来选择该文档的标签
CN103020164B (zh) 一种基于多语义分析和个性化排序的语义检索方法
CN103226618B (zh) 基于数据集市挖掘的相关词提取方法及系统
CN102567326B (zh) 一种信息搜索、及信息搜索排序装置和方法
US20060282411A1 (en) System and method for performing a high-level multi-dimensional query on a multi-structural database
CN101216853B (zh) 一种智能Web查询接口系统及其方法
CN101692223A (zh) 响应于用户输入精炼搜索空间
CN101408885A (zh) 利用统计分布对主题进行建模
US20070055691A1 (en) Method and system for managing exemplar terms database for business-oriented metadata content
CN105930469A (zh) 基于Hadoop的个性化旅游推荐系统及方法
US20130218644A1 (en) Determination of expertise authority
CN101206674A (zh) 以商品为媒介的增强型相关搜索系统及其方法
CN104252456A (zh) 一种权重估计方法、装置及系统
CN101408887A (zh) 推荐词条以指定本体空间
CN103186550A (zh) 一种视频的相关视频列表的生成方法及系统
CN102486781A (zh) 一种搜索排序方法和装置
CN101350027A (zh) 内容检索设备和内容检索方法
Kumari et al. Comparative study of page rank and weighted page rank algorithm
Liu et al. Toward multidatabase mining: Identifying relevant databases
CN105468649A (zh) 一种待展示对象匹配的判断方法及其装置
CN101853298B (zh) 一种面向事件的查询扩展方法
CN103455619A (zh) 一种基于Lucene分片结构的打分处理方法及系统
Liu et al. Adaptive relaxation for querying heterogeneous XML data sources

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant