CN105488136B - 选购热点标签的挖掘方法 - Google Patents

选购热点标签的挖掘方法 Download PDF

Info

Publication number
CN105488136B
CN105488136B CN201510831574.8A CN201510831574A CN105488136B CN 105488136 B CN105488136 B CN 105488136B CN 201510831574 A CN201510831574 A CN 201510831574A CN 105488136 B CN105488136 B CN 105488136B
Authority
CN
China
Prior art keywords
label
hot spot
mentioned
word
commodity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201510831574.8A
Other languages
English (en)
Other versions
CN105488136A (zh
Inventor
王颖
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Jingdong Century Trading Co Ltd
Beijing Jingdong Shangke Information Technology Co Ltd
Original Assignee
Beijing Jingdong Century Trading Co Ltd
Beijing Jingdong Shangke Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Jingdong Century Trading Co Ltd, Beijing Jingdong Shangke Information Technology Co Ltd filed Critical Beijing Jingdong Century Trading Co Ltd
Priority to CN201510831574.8A priority Critical patent/CN105488136B/zh
Publication of CN105488136A publication Critical patent/CN105488136A/zh
Application granted granted Critical
Publication of CN105488136B publication Critical patent/CN105488136B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/954Navigation, e.g. using categorised browsing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0641Shopping interfaces
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities

Abstract

本发明公开了一种选购热点标签的挖掘方法,包括以下步骤:搜索步骤,根据用户输入的关键词进行搜索,得到与搜索结果有关的商品标题;分词步骤,使用分词工具对搜索到的商品标题进行分词;组合步骤,使用语言模型N‑Gram对分词结果进行组合,得到候选标签;和交集步骤,将使用最大匹配算法对优质搜索词和用户输入的关键词进行处理而得到的修饰词与在上述候选标签做交集,从而获得选购热点标签,其中,上述优质搜索词是指在有效时间内,点击搜索率高于某阈值的查询式。由此,能将商品的卖点及特色以比较简单的方式展示给用户,同时能减少运营人员的工作量,并完成及时更新,最快地将最近的选购热点标签反映给用户。

Description

选购热点标签的挖掘方法
技术领域
本发明提供一种基于海量商品数据的选购热点标签挖掘方法。
背景技术
随着电子商务迅速的发展,网上购物由于其节省时间和提供丰富的可对比选择商品受到人们的青睐。目前京东(公司名称)商品库中有海量的商品提供给用户选择,随着商品数量的剧增、商品名称书写的不规范等因素的出现,当用户搜索一类产品时,搜索结果页会召回成千上万的商品,用户可能在短时间内无法获取当前比较流行的各个元素的商品。例如,用户搜索连衣裙,召回的商品包含成千上万,可能排名靠前的并不是用户喜欢的类型,用户无法短时间内找到自己心仪的商品,这样可能会造成部分用户流失。有些比较有耐心的用户,会在搜索框中补充信息,如:“修身显瘦连衣裙”、“蕾丝拼接连衣裙”,“小香风连衣裙”等,搜索自己喜欢类型的连衣裙。通过用户增加关键词召回商品增加了用户购物的复杂性。
结合用户喜欢选购当前比较流行元素的商品这一习惯,我们从海量的商品中结合商品类目、该类目下商家最近上架的商品描述的文本信息和用户的搜索习惯,挖掘出各个类别商品的热点选购词。给每一个商品打上标签,这些标签可以反映当前该类商品流行的趋势,选购热点标签将商品的卖点及特色以一种比较简洁的方式展示给用户,可以对用户进行导购,将其从海量的商品选购中解放出来。
热点选购标签与其他导航属性相比,更能吸引用户的眼球,符合大众挑选用户的习惯,节省用户购买商品的成本。
与本发明相关的技术有新词识别,新词识别主要有两类方法:一是基于统计的方法,对待处理的文本统计其重复字符串的频率,然后利用信息熵计算词边界;二是基于监督的方法,首先选取能区分词边界的特征,然后利用大量训练语料训练,利用学习的模型进行分词。
现有技术存在以下缺点。现有技术虽然可以提取到新词,但是选购热点标签又不同于一般的新词,选购热点标签大部分是修饰新词,目前还没有修饰词提取较为成熟的技术。目前电子商务网站中的选购热点标签都是由运营人员编辑设定的,所以存在不能及时发现并更新的问题。而且维护这些标签会浪费大量的人力物力。
发明内容
本发明提供一种基于海量商品数据的选购热点标签挖掘方法,其目的有两个:一是将商品的卖点及特色以一种比较简单的方式展示给用户,可以对用户进行导购,将其从海量的商品选购中解放出来;二是减少运营人员的工作量,并完成及时更新,最快地将最近的选购热点标签反映给用户。
与本发明相关的主要技术有以下三个方面:
·按照商品类目挖掘标签,该技术是新词识别,将描述商品的材质、
类型、风格的词识别出来,这类词主要是修饰词。
·优质搜索词提取,该技术提取用户点击率高于基准值(例如1000次)
的搜索词(即,优质搜索词),过滤掉用户反馈不好以及包含错别字
的搜索词。
·产品词类别判断,该技术是高相关分类,通过用户在一段时间内的
搜索点击行为给搜索词一个最相关的类目信息。
本发明的选购热点标签的挖掘方法包括以下步骤:搜索步骤,根据用户输入的关键词进行搜索,得到与搜索结果有关的商品标题;分词步骤,使用分词工具对搜索到的商品标题进行分词;组合步骤,使用语言模型N-Gram对分词结果进行组合,得到候选标签;和交集步骤,将使用最大匹配算法对优质搜索词和用户输入的关键词进行处理而得到的修饰词与在上述候选标签做交集,从而获得选购热点标签,其中,上述优质搜索词是指在有效时间内,点击搜索率高于某阈值的查询式。
发明效果
根据本发明,能将商品的卖点及特色以一种比较简单的方式展示给用户,可以对用户进行导购,将其从海量的商品选购中解放出来,另外能减少运营人员的工作量,并完成及时更新,最快地将最近的选购热点标签反映给用户。
附图说明
图1是表示本发明的概要的流程图。
图2是利用优质搜索词挖掘选购热点标签的流程图。
图3是利用高相关分类挖掘选购热点标签的流程图。
具体实施方式
下面结合图1对本发明的概要进行说明,图1是表示本发明的概要的流程图。
本发明的一方式的选购热点标签的挖掘方法,包括以下步骤:搜索步骤,根据用户输入的关键词进行搜索,得到与搜索结果有关的商品标题;分词步骤,使用分词工具对搜索到的商品标题进行分词;组合步骤,使用语言模型N-Gram对分词结果进行组合,得到候选标签;和交集步骤,将使用最大匹配算法对优质搜索词和用户输入的关键词进行处理而得到的修饰词与在上述候选标签做交集,从而获得选购热点标签,其中,上述优质搜索词是指在有效时间内,点击搜索率高于某阈值的查询式。
根据上述方式所述的选购热点标签的挖掘方法,其中,在上述组合步骤中,保留组合之后词长大于等于第1词长且小于等于第2词长的标签,并且对只包含字母和汉字的标签进行N-Gram计算,其中,上述第1词长小于上述第2词长。
根据上述方式所述的选购热点标签的挖掘方法,其中,在上述组合步骤中,在采用语言模型N-Gram获取候选标签时删除了商品标题的前部和后部的商品信息。
根据上述方式所述的选购热点标签的挖掘方法,其中,在上述组合步骤中,在采用语言模型N-Gram获取候选标签时删除了商品标题的前部1/5和后部1/5的商品信息。
根据上述方式所述的选购热点标签的挖掘方法,其中,上述优质搜索词满足的条件如下:条件(1),搜索词在最近N天的点击搜索日志中出现,其中N=7;条件(2),累计搜索量大于等于某阈值TIME,其中TIME=100;条件(3),点击搜索率大于等于某阈值P,其中P=15%。
根据上述方式所述的选购热点标签的挖掘方法,其中,挖掘上述优质
搜索词的步骤包括:当D≤7时,一旦满足上述条件(1)、(2)、(3),则输出查询式,作为优质搜索词,当满足上述条件(1)、(2)且不满足条件(3)时,则输出查询式,作为低反馈词,该低反馈词是指点击搜索率低于某阈值的搜索词,当只满足上述条件(1)时,继续计算第D+1天的点击搜索量;当D>7时,将不符合上述条件(1)的查询式输出,其余的处理逻辑与D≤7的情况相同,当D=180时,结束统计,其中,上述D是指统计的日期距当日的天数。
根据上述方式所述的选购热点标签的挖掘方法,其中,在上述交集步骤之后,还包括通过商品标题的关键词匹配来绑定上述选购热点标签的步骤。
下面对具体的实施方式进行说明。
本发明基于京东海量的商品标题并结合用户的搜索习惯自动挖掘出选购热点标签,整个技术方案分为以下三个部分:
一、挖掘17个一级类目下商品的候选热点标签
17个一级类目涉及的三级类目有800多个(此处列举的数字只是京东海量的商品数量的一个例子),统计的数据是最近4个月上架且仍然在柜上的商品,商家为了使自己的商品更容易被用户搜索到,会在商品名称中填写一系列热点选购标签组合。下面是一个商品名称的例子:
花田雅织2015宽松大码九分裤女小脚裤韩国BF风破洞牛仔图片色29。
其中,“宽松大码”、“九分裤”、“小脚裤”、“BF风”、“破洞牛仔”都是描述牛仔裤的标签。因此,本发明通过商品标题提取到大量的候选热点标签。
将提取到的商品名称按照类别分别放在各个文件夹中。京东商品有自己的三级类目体系,将不同类别的商品区分开。选购热点标签与商品类目有密切的关系,每个类别下的标签差别很大,因此需要分别处理。如连衣裙类目下的标签:“波西米亚”、“欧根纱”、“收腰显瘦”等;牛仔裤类目下的标签:“高腰排扣”、“韩版破洞”、“BF风”等。首先,我们使用分词工具对上面的商品标题进行分词,分词后的结果例如如下:
花田/雅/织//2015/宽松/大/码/九分裤//女/小脚裤/韩国/BF/风/破洞/牛仔//图片/色//29。
我们将只包含一个词的选购热点标签称为简单标签,将包含两个或者两个以上词的选购热点标签称为复合标签。只依赖现有的分词系统无法提取到包含新词的热点标签和复合标签,无法更好的描述该商品。为了得到更多的选购热点标签(“热点标签”是指本发明的挖掘目标),本发明使用以下两种方法A和B获取候选标签(“候选标签”只是一个候选集合,里面有很多杂质,热点标签是从这个候选标签中获取的)。
·方法A
使用N-Gram将分词的上下文term(“term”是指“词”)组合起来,保留组合之后词长大于等于3且小于等于5的候选选购热点标签。对只包含字母和汉字的term进行N-Gram计算,当符合以下两个条件时停止计算:(1)词长大于等于5;(2)遇到非字母或者汉字的字。该term计算完毕之后,从下一个term继续计算,直到最后一个term。
这里所说的N-Gram是指:大词汇连续语音识别中常用的一种语言模型,对中文而言,我们称之为“汉语语言模型”,常用的是二元的Bi-Gram和三元的Tri-Gram。本发明中因为限制词长为5,所以最多利用了五元Gram。
另外,为了过滤噪音,我们采用N-Gram获取候选热点标签时删除了商品标题的前部(例如,前1/5)和后部(例如,后1/5)的商品信息。因为商品标题前部的信息多为品牌,后部多为颜色、尺码等。假设,上面标题,过滤掉前面和后面之后的信息为:
2015/宽松/大/码/九分裤//女/小脚裤/韩国/BF/风/破洞/牛仔。
采用N-Gram之后得到的候选标签为:
宽松大;宽松大码;大码九分裤;码九分裤;九分裤;女小脚裤;小脚裤;小脚裤韩国;韩国BF;韩国BF风;BF风;BF风破洞;风破洞;风破洞牛仔;破洞牛仔。
·方法B
基于分词的标注结果,选取修饰词、人名、字母的词。如果词长度大于等于3,则该词直接作为一个标签;如果词长小于等于2,且该词相邻的词也是修饰词、人名、字母,则把该词和相邻词合并作为复合标签。基于该方法得到的热点标签比较有限,但是其正确率比较高,可以直接作为选购热点标签。
二、利用优质搜索词和高相关分类挖掘选购热点标签
下面结合图2对本发明的选购热点标签的流程进行说明。图2是利用优质搜索词挖掘选购热点标签的流程图。
利用N-Gram获取的候选热点标签中除了包含新词之外,还有一些垃圾标签,如:宽松大、码九分裤等。本发明利用该类目下产品词的常用搭配搜索,获取热点标签。例如,用户在搜索牛仔裤时,召回的商品成千上万,用户短时间内无法找到自己喜欢类型的商品,为了更精准的搜索到商品,用户会在搜索框中输入类似“BF风牛仔裤”、“时尚修身牛仔裤”这类的搭配搜索词。我们基于用户这一习惯,从优质搜索词中找到包含该三级类目产品词的固定搭配词。
优质搜索词是指在有效时间内,点击搜索率比较高的query(“query”是指用户查询词/查询式),这类query比较好的表达了用户的搜索意图。优质搜索词是基于点击搜索日志统计query的点击搜索比以及是否被搜索引擎(例如百度百科)纠错获取的。优质搜索词满足的条件如下:
(1)搜索词必须在最近N天的点击搜索日志中出现(N=7)
(2)累计搜索量大于等于某阈值TIME(TIME=100)
(3)点击搜索率大于等于某阈值P(P=15%)。
优质搜索词挖掘的具体实施步骤如下:
a)当D≤7时,一旦满足上面所有条件,则输出query,作为优质搜索词;当满足条件1)、条件2)时且不满足条件3),则输出query,作为低反馈词,即点击搜索比较低的搜索词;当只满足条件1)时,继续计算第D+1天的点击搜索量。
b)当D>7时,将不符合条件1)的query输出;其余的处理逻辑与D≤7的相同。
当D=180时,结束统计。
其中D指统计的日期距当日的天数。
下面结合图3对本发明的选购热点标签的流程进行说明。图3是利用高相关分类挖掘选购热点标签的流程图。
高相关分类是通过统计用户在一段时间内点击商品的类目信息、左侧类目筛选等几十维特征行为训练学习的,指搜索词的高相关三级类目ID。本发明利用京东提供的高相关分类接口获取1.7万个产品词的高相关分类ID。
例如:牛仔裤的高相关类目
其中,cid3代表商品的三级类目ID,name代表该三级类目的名称,weight代表权重。
据统计发现有些热点选购标签中包含产品词,如:荷叶边、娃娃领、泡泡袖、欧根纱,其中荷叶、娃娃、泡泡、纱都是产品词,直接取产品词的搭配关系会过滤掉一些好的热点选购标签。因此,本发明采用最大匹配算法将优质搜索词中该类目下的产品词替换为三级类目ID,这种替换算法可以避免过滤掉其他产品词。
假设在三级类目9735下,替换之前的优质搜索词是“BF风牛仔裤”,我们通过最大匹配算法,用#9735替换优质搜索词中的“牛仔裤”,优质搜索词转化为:BF风#9735
将替换之后,结构为<TAG#cid3>的优质搜索词提取出来,将TAG与上述“一、挖掘17个一级类目下商品的候选热点标签”中通过N-Gram算法获取的候选标签做交集,从而获取该cid3类目下的热点选购标签,标签的权重为在该类目下商品标题中出现的次数。
下面举例进行说明。
BF风牛仔裤
在9735类目下挖掘的候选热点标签有:BF风
而优质搜索词中包含BF风牛仔裤,利用高相关分类,牛仔裤是9735类目下的,
从而就可以判定“BF风”是一个热点选购标签。
做交集的两个词的来源是:
1、优质搜索中符合<TAG#cid3>结构的TAG,如:BF风牛仔裤,处理之后是BF风#9735,其中BF风是从优质搜索词中获取的候选标签;
2、利用N-Gram算法获取的候选标签,如:9735类目下,找到了“BF风”。交集部分就是BF风。
具体实施步骤如图3所示。
根据上述方法,可以获取一定数量的质量较好的选购热点标签,如:明星同款、小香风、气质修身等。
三、选购热点标签归一和商品绑定策略
选购热点标签中包含同义的标签,如:衬衫型、衬衫款;修身版、修身款;目前标签同义词挖掘方法是字数相同且最后一个字是以“型”、“版”、“款”等的原则。将同义词进行传递合并,如果A和B是同义词,B和C是同义词,则A和C也是同义词,并把ABC聚为同一类同义词,我们会选取权重最大的tag作为显示标签。
标签绑定方式有很多种,可以通过商品详细页或者商品标题的关键词匹配绑定标签,本发明的绑定策略基于第二种方法。选购热点标签绑定策略是按照三级类目计算的,对于只有一个词的标签,如:欧洲站、小香风,如果商品标题中包含该标签,则绑定该商品的ID;对于包含两个或者以上词的标签,如果标题中包含所有词,则绑定该商品的ID;同时支持基于模板的绑定策略,模板格式如下:
cid3;A+B+…+Z=TAG[其中A到Z是该类目下挖掘出来的标签,TAG是显示的标签]
对于包含同义词的标签,在绑定的时候直接做了替换,如果A和B是同义词,且A为显示标签,如果商品标题中包含B标签,则将A绑定该商品的ID。
根据本发明,可以获得以下效果。
本发明在商品搜索、推荐领域都有极其广阔的应用前景。
对于搜索而言,有两个应用场景,一方面,当用户在搜索框中输入“连衣裙”时,我们可以利用下拉列表,将该搜索词的高相关类目下的选购热点标签呈现给用户,从而可以更精准的召回用户喜欢类型的商品,提升用户体验。另一方面,当用户搜索“连衣裙”时,召回的商品成千上万,用户无法快速的找到自己喜欢的商品。我们可以将选购热点标签显示在属性区,这些选购热点标签将海量商品的热点元素以一种比较简单的方式呈现给用户,可以对用户进行导购,将用户从海量的商品中解脱出来。
对于推荐而言,可以通过不同的热点选购标签向用户推荐不同类型的产品,或者是针对用户的喜好,向用户推荐该类别其他的商品。
以上所述的具体实施例,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施例而已,并不用于限制本发明(尤其说明书中提到的数字只是用于进行例示,并不应理解为限制本发明),凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (7)

1.一种选购热点标签的挖掘方法,包括以下步骤:
搜索步骤,根据用户输入的关键词进行搜索,得到与搜索结果有关的商品标题;
分词步骤,使用分词工具对搜索到的商品标题进行分词;
组合步骤,使用语言模型N-Gram对分词结果进行组合,得到候选标签;和
交集步骤,将使用最大匹配算法对优质搜索词和用户输入的关键词进行处理而得到的修饰词与在上述候选标签做交集,从而获得选购热点标签,其中,上述优质搜索词是指在有效时间内,点击搜索率高于某阈值的查询式。
2.根据权利要求1所述的选购热点标签的挖掘方法,其特征在于,
在上述组合步骤中,保留组合之后词长大于等于第1词长且小于等于第2词长的标签,并且对只包含字母和汉字的标签进行N-Gram计算,其中,上述第1词长小于上述第2词长。
3.根据权利要求1所述的选购热点标签的挖掘方法,其特征在于,
在上述组合步骤中,在采用语言模型N-Gram获取候选标签时删除了商品标题的前部和后部的商品信息。
4.根据权利要求3所述的选购热点标签的挖掘方法,其特征在于,
在上述组合步骤中,在采用语言模型N-Gram获取候选标签时删除了商品标题的前部1/5和后部1/5的商品信息。
5.根据权利要求1所述的选购热点标签的挖掘方法,其特征在于,
上述优质搜索词满足的条件如下:
条件(1),搜索词在最近N天的点击搜索日志中出现,其中N=7;
条件(2),累计搜索量大于等于某阈值TIME,其中TIME=100;
条件(3),点击搜索率大于等于某阈值P,其中P=15%。
6.根据权利要求5所述的选购热点标签的挖掘方法,其特征在于,
挖掘上述优质搜索词的步骤包括:
当D≤7时,一旦满足上述条件(1)、(2)、(3)的全部,则输出查询式,作为优质搜索词,当满足上述条件(1)、(2)的全部且不满足条件(3)时,则输出查询式,作为低反馈词,该低反馈词是指点击搜索率低于某阈值的搜索词,当只满足上述条件(1)时,继续计算第D+1天的点击搜索量;
当D>7时,将不符合上述条件(1)的查询式输出,其余的处理逻辑与D≤7的情况相同,当D=180时,结束统计,
其中,上述D是指统计的日期距当日的天数。
7.根据权利要求1所述的选购热点标签的挖掘方法,其特征在于,
在上述交集步骤之后,还包括通过商品标题的关键词匹配来绑定上述选购热点标签的步骤。
CN201510831574.8A 2015-11-25 2015-11-25 选购热点标签的挖掘方法 Active CN105488136B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510831574.8A CN105488136B (zh) 2015-11-25 2015-11-25 选购热点标签的挖掘方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510831574.8A CN105488136B (zh) 2015-11-25 2015-11-25 选购热点标签的挖掘方法

Publications (2)

Publication Number Publication Date
CN105488136A CN105488136A (zh) 2016-04-13
CN105488136B true CN105488136B (zh) 2019-03-26

Family

ID=55675111

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510831574.8A Active CN105488136B (zh) 2015-11-25 2015-11-25 选购热点标签的挖掘方法

Country Status (1)

Country Link
CN (1) CN105488136B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106096031B (zh) * 2016-06-27 2020-06-16 武汉斗鱼网络科技有限公司 一种带标签的视频排序方法及装置
CN108182174B (zh) * 2017-12-27 2019-03-26 掌阅科技股份有限公司 新词提取方法、电子设备及计算机存储介质
CN110807083A (zh) * 2018-08-02 2020-02-18 北京京东尚科信息技术有限公司 关键词评估方法和装置
CN109493167B (zh) * 2018-10-23 2020-11-20 广州致轩服饰有限公司 一种基于第三方平台数据的商品反馈方法与装置
CN110619076B (zh) * 2018-12-25 2023-04-07 北京时光荏苒科技有限公司 一种搜索词推荐方法、装置、计算机及存储介质
CN112417872B (zh) * 2020-10-20 2022-08-05 上海大学 一种基于相关系数熵的单示例单标签远程监督实体关系标注方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103218719A (zh) * 2012-01-19 2013-07-24 阿里巴巴集团控股有限公司 一种电子商务网站导航方法及系统
CN103729359A (zh) * 2012-10-12 2014-04-16 阿里巴巴集团控股有限公司 一种推荐搜索词的方法及系统
CN103810198A (zh) * 2012-11-09 2014-05-21 阿里巴巴集团控股有限公司 一种商品信息的搜索方法及装置
CN103902545A (zh) * 2012-12-25 2014-07-02 北京京东尚科信息技术有限公司 一种类目路径识别方法及系统

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100076979A1 (en) * 2008-09-05 2010-03-25 Xuejun Wang Performing search query dimensional analysis on heterogeneous structured data based on relative density

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103218719A (zh) * 2012-01-19 2013-07-24 阿里巴巴集团控股有限公司 一种电子商务网站导航方法及系统
CN103729359A (zh) * 2012-10-12 2014-04-16 阿里巴巴集团控股有限公司 一种推荐搜索词的方法及系统
CN103810198A (zh) * 2012-11-09 2014-05-21 阿里巴巴集团控股有限公司 一种商品信息的搜索方法及装置
CN103902545A (zh) * 2012-12-25 2014-07-02 北京京东尚科信息技术有限公司 一种类目路径识别方法及系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于购物网站用户搜索日志的商品词发现;杨锦锋,等;《计算机应用与软件》;20111130;第28卷(第11期);全文

Also Published As

Publication number Publication date
CN105488136A (zh) 2016-04-13

Similar Documents

Publication Publication Date Title
CN105488136B (zh) 选购热点标签的挖掘方法
US11714839B2 (en) Apparatus and method for automated and assisted patent claim mapping and expense planning
CN103218719B (zh) 一种电子商务网站导航方法及系统
CN102184230B (zh) 一种搜索结果的展示方法及装置
CN103678335B (zh) 商品标识标签的方法、装置及商品导航的方法
CN107688606A (zh) 一种推荐信息的获取方法及装置,电子设备
CN102364498B (zh) 一种基于多标签的图像识别方法
CN108563729B (zh) 一种基于dom树的招标网站中标信息抽取方法
CN105335491B (zh) 基于用户点击行为来向用户推荐图书的方法和系统
CN104035927A (zh) 一种基于用户行为的搜索方法及系统
CN102279851A (zh) 一种智能导航方法、装置和系统
CN104111933A (zh) 获取业务对象标签、建立训练模型的方法及装置
CN104978356B (zh) 一种同义词的识别方法及装置
CN106874411B (zh) 一种表格的搜索方法及搜索平台
CN106326413A (zh) 一种个性化视频推荐系统及方法
CN102495892A (zh) 一种网页信息抽取方法
CN107203507A (zh) 特征词汇提取方法及装置
CN105095625B (zh) 点击率预估模型建立方法、装置及信息提供方法、系统
CN109634594A (zh) 一种考虑代码语句顺序信息的代码片段推荐方法
CN108694647A (zh) 一种商户推荐理由的挖掘方法及装置,电子设备
CN105740415B (zh) 基于标签位置权重与自学习的招投标好友推荐系统
CN105243108A (zh) 基于xbrl的智能报告平台系统
CN110297853A (zh) 频繁集挖掘方法和装置
CN106547864A (zh) 一种基于查询扩展的个性化信息检索方法
CN106484698A (zh) 一种搜索关键词的推送方法和装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant