CN105005917A - 一种通用的关联不同电商网站单品的方法 - Google Patents
一种通用的关联不同电商网站单品的方法 Download PDFInfo
- Publication number
- CN105005917A CN105005917A CN201510393971.1A CN201510393971A CN105005917A CN 105005917 A CN105005917 A CN 105005917A CN 201510393971 A CN201510393971 A CN 201510393971A CN 105005917 A CN105005917 A CN 105005917A
- Authority
- CN
- China
- Prior art keywords
- commodity
- commodity identification
- relevance
- itemid
- different
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 22
- 238000004364 calculation method Methods 0.000 claims description 12
- 238000012216 screening Methods 0.000 claims description 6
- 238000004458 analytical method Methods 0.000 claims description 3
- 238000001914 filtration Methods 0.000 claims description 3
- 238000004806 packaging method and process Methods 0.000 claims description 3
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 claims description 3
- 238000007429 general method Methods 0.000 description 6
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 5
- 239000010931 gold Substances 0.000 description 5
- 229910052737 gold Inorganic materials 0.000 description 5
- 230000011218 segmentation Effects 0.000 description 2
- 239000013598 vector Substances 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000009193 crawling Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 235000013305 food Nutrition 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明属于电子商务技术领域,提供了一种通用的关联不同电商网站单品的方法,包括:步骤一,提取商品标识;步骤二,从不同网站的商品单品页上获取商品标识的键值对数据;步骤三,对步骤一中获得的商品标识进行描述分类;对于从步骤一中获得的每一个itemID,都把它的描述信息分成页面标题和属性列表两个部分;步骤四,将每一个商品标识与其它站点的商品标识进行匹配,筛选出其它站点内与该商品标识相似的itemID。本发明提高了不同站点间商品的匹配度,匹配更加快速,大大提高有购买意图的用户数量,提高商业价值。
Description
技术领域
本发明属于电子商务技术领域,特别涉及网站中一种通用的关联不同电商网站单品的方法。
背景技术
从阿里巴巴成功上市可以看到,电商已经被证明是一个有很高价值的领域。同时,从另一个侧面来看,电商网站访问的流量中还埋藏着巨大的商业价值:一个用户浏览的网页往往代表了用户的购买意图。而现在的再次行销(Remarketing)的商业逻辑只能覆盖那些来过自己网站的用户,无法覆盖其他网站的用户,而自己的网站只是有购买意图的用户的极小的一部分。
因此,电子商务技术领域急需一种能够覆盖不同站点、通用的关联不同电商网站单品的方法,提高了不同站点间商品的匹配度,匹配更加快速,大大提高有购买意图的用户数量,提高商业价值。
发明内容
本发明提供了一种通用的关联不同电商网站单品的方法,对于任意给定的电商网站的单品页,关联到其他网站的相同或者非常相似的单品页。这样,用户在非目标广告主网站访问了一款商品后,就可以推送目标广告网站的同款商品广告,从而实现了再次行销的免代码部署,技术方案如下:
一种通用的关联不同电商网站单品的方法,包括如下步骤:
步骤一,提取商品标识;
步骤二,从不同网站的商品单品页上获取商品标识的键值对数据;
步骤三,对步骤一中获得的商品标识进行描述分类;
对于从步骤一中获得的每一个itemID,都把它的描述信息分成页面标题和属性列表两个部分;
步骤四,将每一个商品标识与其它站点的商品标识进行匹配,筛选出其它站点内与该商品标识相似的itemID;
首先,在步骤三的基础上,为每一个itemID的页面标题和属性列表建立索引;
进一步地,设定一个商品标识与其它站点的商品标识匹配相似度的阈值为P;
进一步地,在索引中搜索,将一个商品标识与其它站点的商品标识进行匹配,得到相似度值,当相似度大于阈值P时,留下此站点的itemID,否则滤除;留下itemID的数量为大于等于0的正整数。
优选的,在上述一种通用的关联不同电商网站单品的方法中,步骤四中采用的索引搜索方式为BM25算法,具体步骤为:
首先,将步骤三中的属性列表的每个属性组装成一个待搜索的Query(查询)项;
进一步地,采用BM25算法计算搜索相关性平分,BM25算法是对Query进行语素解析,生成语素 ;然后,对于每个搜索结果D,计算每个语素与D的相关性得分,最后,将相对于D的相关性得分进行加权求和,从而得到Query与D的相关性平分;
具体公式如下:
;
其中,Score(Q,d)表示Query与D的搜索相关性平分,表示语素与文档d的相关性得分;Q表示Query项,表示Q解析之后的一个语素,表示一个搜索结果文档,W i 表示一个词与一个文档相关性的权重,即语素的权重,采用公式计算:
;
其中,表示索引中的全部文档数,表示包含了的文档数;
根据公式可以看出,对于给定的文档集合,包含了的文档数越多,的权重则越低;也就是说,当很多文档都包含了时,的区分度就不高,因此使用来判断相关性时的重要度就较低;
的计算公式为:
;
其中,K、k 1、k 2、b为调节因子,通常根据经验设置,f i 为在d中的出现频率,qf i 为在Query中的出现频率,dl为文档d的长度,avgdl为所有文档的平均长度,这里k 1,k 2就是我们要调节的属性重要性系数;
从K的定义中可以看出,参数b的作用是调整文档长度对相关性影响的大小;b越大,文档长度对相关性得分的影响越大,反之越小;而文档的相对长度越长,K值将越大,则相关性得分会越小;这可以理解为,当文档较长时,包含的机会越大,因此,同等f i 的情况下,长文档与的相关性应该比短文档与的相关性弱;
将求出的W i 和代入BM25算法公式中,求出搜索相关性平分Score(Q,d);
进一步地,将搜索相关性平分Score(Q,d)与阈值P进行比较,由于有些itemID是无法匹配的,在迭代计算中逐步剔除搜索相关性平分远远小于阈值P的点,最终筛选出其它站点内与该商品标识相似的itemID。
优选的,在上述一种通用的关联不同电商网站单品的方法中,步骤一中提取商品标识的具体步骤为:通过每个站点的统一资源定位符url规则提取该url所对应的商品标识itemID。
优选的,在上述一种通用的关联不同电商网站单品的方法中,步骤二中从不同网站的商品单品页上获取商品标识的键值对数据的具体步骤为:
采用cssselect规则从不同网站上去爬取商品单品页上顾客需要的键值对信息;键值对信息包含商品的url地址、页面标题、产品名称、品牌、型号等,即对于每一个itemID,获取到了描述它的不同维度的信息。
优选的,在上述一种通用的关联不同电商网站单品的方法中,步骤三中,页面标题是商家编辑的对商品的概要描述,而属性列表是这个商品的细节信息描述,包括:商品名称、品牌、型号、包装和重量。
本发明的有益效果:
1、本发明的索引可以动态添加,对于电商网站新增的itemID,只需要添加到之前的索引中即可,动态支持新的itemID匹配。
2、本发明系数权重的搜索过程只需要在初始数据集有一定规模后一次计算即可确定,以后每次新增了itemID后无需重复计算,匹配更加快速。
3、本发明是基于搜索的方式进行商品匹配,简单快速,通时系数权重的自动调节避免了两个商品间相似性的人工设定,因此能够适应不同站点,不同类别的商品间的匹配,克服了现有技术中只能在浏览过的网页内进行匹配的局限性,适用性更强。
附图说明
下面结合附图和具体实施方式来详细说明本发明:
图1为一种通用的关联不同电商网站单品的方法的流程图。
具体实施方式
为了使本发明技术实现的措施、创作特征、达成目的与功效易于明白了解,下面结合具体图示,进一步阐述本发明。
图1为一种通用的关联不同电商网站单品的方法的流程图。
如图1所示,一种通用的关联不同电商网站单品的方法,包括如下步骤:
步骤一,提取商品标识;
通过每个站点的统一资源定位符(url)规则提取该url所对应的商品标识(itemID),例如,对于京东的url: http://item.jd.com/1057746.html,商品id就是1057746;对于天猫的url:http://detail.tmall.com/item.htm?id=40956921400,商品id就是40956921400,这个id即为商品标识,用itemID表示;
步骤二,从不同网站的商品单品页上获取商品标识的键值对数据;
利用cssselect规则从不同网站上去爬取商品单品页上顾客需要的键值对信息;键值对信息包含商品的url地址、页面标题、产品名称、品牌、型号等;即对于每一个itemID,获取到了描述它的不同维度的信息;
步骤三,对步骤一中获得的商品标识进行描述分类;
对于从步骤一中获得的每一个itemID,都把它的描述信息分成页面标题和属性列表两个部分,其中页面标题是商家编辑的对商品的概要描述,而属性列表是这个商品的细节信息描述,包括:商品名称、品牌、型号(3C商品)、包装和重量(食品类商品);
步骤四,计算每一个商品标识与其它站点的商品标识的相似度值,判断两个商品是否匹配,筛选出其它站点内与该商品标识相似的itemID;
首先,在步骤三的基础上,为每一个itemID的页面标题和属性列表建立索引;
进一步地,设定一个商品标识与其它站点的商品标识匹配相似度的阈值为P;
进一步地,在索引中搜索,将一个商品标识与其它站点的商品标识进行匹配,得到相似度值,当相似度大于阈值P时,留下此站点的itemID,否则滤除;留下itemID的数量为大于等于0的正整数。
本实施例中,步骤四中采用的索引搜索方式为BM25算法,具体步骤为:
首先,将步骤三中的属性列表的每个属性组装成一个待搜索的Query(查询)项;
进一步地,采用BM25算法计算搜索相关性平分,BM25算法是对Query进行语素解析,生成语素;然后,对于每个搜索结果D,计算每个语素与D的相关性得分,最后,将相对于D的相关性得分进行加权求和,从而得到Query与D的相关性得分,具体计算公式如下:
其中,Score(Q,d)表示Query与D的搜索相关性平分,表示语素与文档d的相关性得分;Q表示Query项,表示Q解析之后的一个语素,表示一个搜索结果文档,W i 表示一个词与一个文档相关性的权重,即语素的权重,采用公式计算:
;
其中,表示索引中的全部文档数,表示包含了的文档数;
根据公式可以看出,对于给定的文档集合,包含了的文档数越多,的权重则越低;也就是说,当很多文档都包含了时,的区分度就不高,因此使用来判断相关性时的重要度就较低;
的计算公式为:
;
其中,K、k 1 ,k 2 ,b为调节因子,通常根据经验设置,f i 为在d中的出现频率,qf i 为在Query中的出现频率,dl为文档d的长度,avgdl为所有文档的平均长度,这里k 1,k 2就是我们要调节的属性重要性系数;
从K的定义中可以看出,参数b的作用是调整文档长度对相关性影响的大小;b越大,文档长度对相关性得分的影响越大,反之越小;而文档的相对长度越长,K值将越大,则相关性得分会越小;这可以理解为,当文档较长时,包含的机会越大,因此,同等f i 的情况下,长文档与的相关性应该比短文档与的相关性弱;
将求出的W i 和代入BM25算法公式中,求出搜索相关性平分Score(Q,d);
进一步地,将搜索相关性平分Score(Q,d)与阈值P进行比较,由于有些itemID是无法匹配的,在迭代计算中逐步剔除搜索相关性平分远远小于阈值P的点,最终筛选出其它站点内与该商品标识相似的itemID。
下面结合具体实施例对本发明进行具体的阐述,以便于本领域内的技术人员能够理解。
例如我们检索京东和一号店这两个相关站点。目标是挖掘一号店的哪些商品与京东的商品“苹果(Apple)iPhone6 (A1586) 16GB 金色 移动联通电信4G手机”相关联。
第一步,提取京东该商品的itemID;
该商品所在网页地址是http://item.jd.com/1217499.html,根据前面描述的提取规则,我们得到该商品的itemID为jd:1217499;然后我们将该商品的名称,属性,规格等描述拆成如下分词向量:
<苹果,Apple,iphone6,A1586,16GB,金色,移动,联通,电信,4G,手机>
第二步,爬取一号店的商品,获得其对应的itemID和分词向量,例如:
yhd:10629352,<生鲜,甘肃,精选,红富士,苹果>;
yhd:37994174,<Apple,苹果,iPhone6,Plus,A1524,64G,金色,移动,联通,电,4G,手机>;
下面我们将计算Q=<苹果,Apple,iphone6,A1586,16GB,金色,移动,联通,电信,4G,手机>与=<生鲜,甘肃,精选,红富士,苹果>,=< Apple,苹果,iPhone6,Plus,A1524,64G,金色,移动,联通,电,4G,手机>的相似性得分:
;
其中,16GB,金色,移动,=联通,=电信,=4G,手机
5.8
其中,表示一号店所有的商品数,表示一号店含有“苹果”这个词的商品数。
同理,我们可以计算出剩下的权重值,;
其中,表示在中的出现频率,表示在Q中出现的频率;;
所以;同理我们可以得到其余的值;
根据同样的计算过程,我们可以得到
;
我们确定阈值P为25,由于d1的相关性平分小于阈值P,所以一号店商品yhd:10629352不与京东商品jd:1217499关联;由于d2的相关性平分大于阈值P,所以一号店商品yhd:37994174与京东商品jd:1217499关联。
本发明的索引可以动态添加,对于电商网站新增的itemID,只需要添加到之前的索引中即可,动态支持新的itemID匹配。
本发明系数权重的搜索过程只需要在初始数据集有一定规模后一次计算即可确定,以后每次新增了itemID后无需重复计算,匹配更加快速。
本发明是基于搜索的方式进行商品匹配,简单快速,通时系数权重的自动调节避免了两个商品间相似性的人工设定,因此能够适应不同站点,不同类别的商品间的匹配,克服了现有技术中只能在浏览过的网页内进行匹配的局限性,适用性更强。
以上显示和描述了本发明的基本原理、主要特征和本发明的优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是说明本发明的原理,在不脱离本发明精神和范围的前提下本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求书及其等同物界定。
Claims (5)
1.一种通用的关联不同电商网站单品的方法,其特征在于,包括如下步骤:
步骤一,提取商品标识;
步骤二,从不同网站的商品单品页上获取商品标识的键值对数据;
步骤三,对所述步骤一中获得的商品标识进行描述分类;
对于从所述步骤一中获得的每一个itemID,都把它的描述信息分成页面标题和属性列表两个部分;
步骤四,将每一个商品标识与其它站点的商品标识进行匹配,筛选出其它站点内与该商品标识相似的itemID;
首先,在所述步骤三的基础上,为每一个itemID的页面标题和属性列表建立索引;
进一步地,设定一个商品标识与其它站点的商品标识匹配相似度的阈值为P;
进一步地,在索引中搜索,将一个商品标识与其它站点的商品标识进行匹配,得到相似度值,当相似度大于阈值P时,留下此站点的itemID,否则滤除;留下itemID的数量为大于等于0的正整数。
2.根据权利要求1所述的一种通用的关联不同电商网站单品的方法,其特征在于,所述步骤四中采用的索引搜索方式为BM25算法,具体步骤为:
首先,将所述步骤三中的属性列表的每个属性组装成一个待搜索的Query查询项;
进一步地,采用BM25算法计算搜索相关性平分,BM25算法是对Query进行语素解析,生成语素 ;然后,对于每个搜索结果D,计算每个语素与D的相关性得分,最后,将相对于D的相关性得分进行加权求和,从而得到Query与D的相关性得分;具体公式如下:
;
其中,Score(Q,d)表示Query与D的搜索相关性平分,表示语素与文档d的相关性得分;Q表示Query项,表示Q解析之后的一个语素,表示一个搜索结果文档,W i 表示一个词与一个文档相关性的权重,即语素的权重,采用公式计算:
;
其中,表示索引中的全部文档数,表示包含了的文档数;
根据公式可以看出,对于给定的文档集合,包含了的文档数越多,的权重则越低;也就是说,当很多文档都包含了时,的区分度就不高,因此使用来判断相关性时的重要度就较低;
的计算公式为:
;
其中,K、k 1、k 2、b为调节因子,通常根据经验设置,f i 为在d中的出现频率,qf i 为在Query中的出现频率,dl为文档d的长度,avgdl为所有文档的平均长度,这里k 1,k 2就是我们要调节的属性重要性系数;
从K的定义中可以看出,参数b的作用是调整文档长度对相关性影响的大小;b越大,文档长度对相关性得分的影响越大,反之越小;而文档的相对长度越长,K值将越大,则相关性得分会越小;这可以理解为,当文档较长时,包含的机会越大,因此,同等f i 的情况下,长文档与的相关性应该比短文档与的相关性弱;
将求出的W i 和代入BM25算法公式中,求出搜索相关性平分Score(Q,d);
进一步地,将搜索相关性平分Score(Q,d)与阈值P进行比较,由于有些itemID是无法匹配的,在迭代计算中逐步剔除搜索相关性平分远远小于阈值P的点,最终筛选出其它站点内与该商品标识相似的itemID。
3.根据权利要求1所述的一种通用的关联不同电商网站单品的方法,其特征在于,所述步骤一中提取商品标识的具体步骤为:通过每个站点的统一资源定位符url规则提取所述url所对应的商品标识itemID。
4.根据权利要求1所述的一种通用的关联不同电商网站单品的方法,其特征在于,所述步骤二中从不同网站的商品单品页上获取商品标识的键值对数据的具体步骤为:
采用cssselect规则从不同网站上去爬取商品单品页上顾客需要的键值对信息;键值对信息包含商品的url地址、页面标题、产品名称、品牌、型号,即对于每一个itemID,获取到了描述它的不同维度的信息。
5.根据权利要求1所述的一种通用的关联不同电商网站单品的方法,其特征在于,所述步骤三中,页面标题是商家编辑的对商品的概要描述,而属性列表是这个商品的细节信息描述,包括:商品名称、品牌、型号、包装和重量。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510393971.1A CN105005917A (zh) | 2015-07-07 | 2015-07-07 | 一种通用的关联不同电商网站单品的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510393971.1A CN105005917A (zh) | 2015-07-07 | 2015-07-07 | 一种通用的关联不同电商网站单品的方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN105005917A true CN105005917A (zh) | 2015-10-28 |
Family
ID=54378578
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510393971.1A Pending CN105005917A (zh) | 2015-07-07 | 2015-07-07 | 一种通用的关联不同电商网站单品的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105005917A (zh) |
Cited By (25)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106600356A (zh) * | 2016-10-27 | 2017-04-26 | 杭州王道科技有限公司 | 多平台电子商务信息聚合方法及系统 |
CN106779963A (zh) * | 2016-12-29 | 2017-05-31 | 江西博瑞彤芸科技有限公司 | 关联商品的商品信息设置方法 |
CN106920147A (zh) * | 2017-02-28 | 2017-07-04 | 华中科技大学 | 一种基于词向量数据驱动的商品智能推荐方法 |
CN107203548A (zh) * | 2016-03-17 | 2017-09-26 | 阿里巴巴集团控股有限公司 | 属性获取方法和装置 |
CN107464162A (zh) * | 2017-07-28 | 2017-12-12 | 腾讯科技(深圳)有限公司 | 商品关联方法、装置及计算机可读存储介质 |
CN107545453A (zh) * | 2016-06-28 | 2018-01-05 | 阿里巴巴集团控股有限公司 | 一种信息投放方法及装置 |
CN108932248A (zh) * | 2017-05-24 | 2018-12-04 | 苏宁云商集团股份有限公司 | 一种搜索实现方法及系统 |
CN109584006A (zh) * | 2018-11-27 | 2019-04-05 | 中国人民大学 | 一种基于深度匹配模型的跨平台商品匹配方法 |
CN110309144A (zh) * | 2018-03-22 | 2019-10-08 | 北京新媒传信科技有限公司 | 一种运用redis构建树形数据结构的方法及装置 |
CN110347930A (zh) * | 2019-07-18 | 2019-10-18 | 杭州连银科技有限公司 | 一种基于统计分析方法的高维数据自动加工及处理方法 |
CN110392118A (zh) * | 2019-08-07 | 2019-10-29 | 北京艾摩瑞策科技有限公司 | 区块链上的自媒体数据处理方法及其装置 |
CN110414945A (zh) * | 2019-08-07 | 2019-11-05 | 北京艾摩瑞策科技有限公司 | 区块链上的招聘关联数据处理方法及其装置 |
CN110413698A (zh) * | 2019-08-07 | 2019-11-05 | 北京艾摩瑞策科技有限公司 | 互联网广告关联数据的上链方法及其装置 |
CN110413663A (zh) * | 2019-08-07 | 2019-11-05 | 北京艾摩瑞策科技有限公司 | 关于区块链上的社区关联数据处理方法及其装置 |
CN110427776A (zh) * | 2019-08-07 | 2019-11-08 | 北京艾摩瑞策科技有限公司 | 区块链上的电商关联数据处理方法及其装置 |
CN110427439A (zh) * | 2019-08-07 | 2019-11-08 | 北京艾摩瑞策科技有限公司 | 涉及区块链的共享经济关联数据处理方法及其装置 |
CN110427380A (zh) * | 2019-08-07 | 2019-11-08 | 北京艾摩瑞策科技有限公司 | 涉及区块链的租房关联数据处理方法及其装置 |
CN110430267A (zh) * | 2019-08-07 | 2019-11-08 | 北京艾摩瑞策科技有限公司 | 区块链上的投票关联数据处理方法及其装置 |
CN110427431A (zh) * | 2019-08-07 | 2019-11-08 | 北京艾摩瑞策科技有限公司 | 区块链上的生活服务关联数据处理方法及其装置 |
CN110443652A (zh) * | 2019-08-07 | 2019-11-12 | 北京艾摩瑞策科技有限公司 | 在区块链上的广告数据处理方法及其装置 |
CN110442622A (zh) * | 2019-08-07 | 2019-11-12 | 北京艾摩瑞策科技有限公司 | 涉及区块链的搜索数据处理方法及其装置 |
CN110543479A (zh) * | 2019-08-07 | 2019-12-06 | 北京艾摩瑞策科技有限公司 | 涉及区块链的调研数据处理方法及其装置 |
CN112199451A (zh) * | 2020-09-30 | 2021-01-08 | 京东数字科技控股股份有限公司 | 商品识别方法、装置、计算机设备及存储介质 |
CN112464365A (zh) * | 2020-11-19 | 2021-03-09 | 北京航空航天大学 | 飞行器的参数设计方法及装置 |
CN113298609A (zh) * | 2021-01-27 | 2021-08-24 | 阿里巴巴集团控股有限公司 | 对象识别码处理方法、对象发布方法、装置、设备及介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101968788A (zh) * | 2009-07-27 | 2011-02-09 | 富士通株式会社 | 提取商品属性信息的方法和设备 |
CN102332137A (zh) * | 2011-09-23 | 2012-01-25 | 纽海信息技术(上海)有限公司 | 商品匹配方法及系统 |
WO2012061076A1 (en) * | 2010-11-01 | 2012-05-10 | Alibaba Group Holding Limited | Search method, apparatus and server for online trading platform |
-
2015
- 2015-07-07 CN CN201510393971.1A patent/CN105005917A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101968788A (zh) * | 2009-07-27 | 2011-02-09 | 富士通株式会社 | 提取商品属性信息的方法和设备 |
WO2012061076A1 (en) * | 2010-11-01 | 2012-05-10 | Alibaba Group Holding Limited | Search method, apparatus and server for online trading platform |
CN102332137A (zh) * | 2011-09-23 | 2012-01-25 | 纽海信息技术(上海)有限公司 | 商品匹配方法及系统 |
Non-Patent Citations (1)
Title |
---|
匿名: "BM25算法浅析", 《百度学术:HTTPS://WENKU.BAIDU.COM/VIEW/9107BD78A26925C52CC5BFBB.HTML?FROM=SEARCH&ISBTN=1》 * |
Cited By (29)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107203548A (zh) * | 2016-03-17 | 2017-09-26 | 阿里巴巴集团控股有限公司 | 属性获取方法和装置 |
CN107545453A (zh) * | 2016-06-28 | 2018-01-05 | 阿里巴巴集团控股有限公司 | 一种信息投放方法及装置 |
CN106600356B (zh) * | 2016-10-27 | 2019-12-24 | 杭州王道科技有限公司 | 多平台电子商务信息聚合方法及系统 |
CN106600356A (zh) * | 2016-10-27 | 2017-04-26 | 杭州王道科技有限公司 | 多平台电子商务信息聚合方法及系统 |
CN106779963A (zh) * | 2016-12-29 | 2017-05-31 | 江西博瑞彤芸科技有限公司 | 关联商品的商品信息设置方法 |
CN106920147B (zh) * | 2017-02-28 | 2020-12-29 | 华中科技大学 | 一种基于词向量数据驱动的商品智能推荐方法 |
CN106920147A (zh) * | 2017-02-28 | 2017-07-04 | 华中科技大学 | 一种基于词向量数据驱动的商品智能推荐方法 |
CN108932248A (zh) * | 2017-05-24 | 2018-12-04 | 苏宁云商集团股份有限公司 | 一种搜索实现方法及系统 |
CN107464162B (zh) * | 2017-07-28 | 2022-12-30 | 腾讯科技(深圳)有限公司 | 商品关联方法、装置及计算机可读存储介质 |
CN107464162A (zh) * | 2017-07-28 | 2017-12-12 | 腾讯科技(深圳)有限公司 | 商品关联方法、装置及计算机可读存储介质 |
CN110309144A (zh) * | 2018-03-22 | 2019-10-08 | 北京新媒传信科技有限公司 | 一种运用redis构建树形数据结构的方法及装置 |
CN109584006A (zh) * | 2018-11-27 | 2019-04-05 | 中国人民大学 | 一种基于深度匹配模型的跨平台商品匹配方法 |
CN109584006B (zh) * | 2018-11-27 | 2020-12-01 | 中国人民大学 | 一种基于深度匹配模型的跨平台商品匹配方法 |
CN110347930A (zh) * | 2019-07-18 | 2019-10-18 | 杭州连银科技有限公司 | 一种基于统计分析方法的高维数据自动加工及处理方法 |
CN110427776A (zh) * | 2019-08-07 | 2019-11-08 | 北京艾摩瑞策科技有限公司 | 区块链上的电商关联数据处理方法及其装置 |
CN110543479A (zh) * | 2019-08-07 | 2019-12-06 | 北京艾摩瑞策科技有限公司 | 涉及区块链的调研数据处理方法及其装置 |
CN110427380A (zh) * | 2019-08-07 | 2019-11-08 | 北京艾摩瑞策科技有限公司 | 涉及区块链的租房关联数据处理方法及其装置 |
CN110430267A (zh) * | 2019-08-07 | 2019-11-08 | 北京艾摩瑞策科技有限公司 | 区块链上的投票关联数据处理方法及其装置 |
CN110427431A (zh) * | 2019-08-07 | 2019-11-08 | 北京艾摩瑞策科技有限公司 | 区块链上的生活服务关联数据处理方法及其装置 |
CN110443652A (zh) * | 2019-08-07 | 2019-11-12 | 北京艾摩瑞策科技有限公司 | 在区块链上的广告数据处理方法及其装置 |
CN110442622A (zh) * | 2019-08-07 | 2019-11-12 | 北京艾摩瑞策科技有限公司 | 涉及区块链的搜索数据处理方法及其装置 |
CN110427439A (zh) * | 2019-08-07 | 2019-11-08 | 北京艾摩瑞策科技有限公司 | 涉及区块链的共享经济关联数据处理方法及其装置 |
CN110413663A (zh) * | 2019-08-07 | 2019-11-05 | 北京艾摩瑞策科技有限公司 | 关于区块链上的社区关联数据处理方法及其装置 |
CN110413698A (zh) * | 2019-08-07 | 2019-11-05 | 北京艾摩瑞策科技有限公司 | 互联网广告关联数据的上链方法及其装置 |
CN110414945A (zh) * | 2019-08-07 | 2019-11-05 | 北京艾摩瑞策科技有限公司 | 区块链上的招聘关联数据处理方法及其装置 |
CN110392118A (zh) * | 2019-08-07 | 2019-10-29 | 北京艾摩瑞策科技有限公司 | 区块链上的自媒体数据处理方法及其装置 |
CN112199451A (zh) * | 2020-09-30 | 2021-01-08 | 京东数字科技控股股份有限公司 | 商品识别方法、装置、计算机设备及存储介质 |
CN112464365A (zh) * | 2020-11-19 | 2021-03-09 | 北京航空航天大学 | 飞行器的参数设计方法及装置 |
CN113298609A (zh) * | 2021-01-27 | 2021-08-24 | 阿里巴巴集团控股有限公司 | 对象识别码处理方法、对象发布方法、装置、设备及介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105005917A (zh) | 一种通用的关联不同电商网站单品的方法 | |
CN108121737B (zh) | 一种业务对象属性标识的生成方法、装置和系统 | |
US9514202B2 (en) | Information processing apparatus, information processing method, program for information processing apparatus and recording medium | |
CN102799591B (zh) | 一种提供推荐词的方法及装置 | |
CN103246980B (zh) | 信息输出方法及服务器 | |
CN105488233A (zh) | 阅读信息推荐方法和系统 | |
WO2019076191A1 (zh) | 关键词提取方法和装置、存储介质及电子装置 | |
EP3107006A1 (en) | Search engine and method for implementing the same | |
WO2016000555A1 (zh) | 基于社交网络的内容、新闻推荐方法和系统 | |
US11127063B2 (en) | Product and content association | |
CN105426528A (zh) | 一种商品数据的检索排序方法及系统 | |
CN111125495A (zh) | 一种信息推荐方法、设备及存储介质 | |
US20150193821A1 (en) | Information processing apparatus, information processing method, and information processing program | |
US20130275269A1 (en) | Searching supplier information based on transaction platform | |
US20150254714A1 (en) | Systems and methods for keyword suggestion | |
CN106445963B (zh) | App平台的广告索引关键词自动生成方法和装置 | |
CN108763321A (zh) | 一种基于大规模相关实体网络的相关实体推荐方法 | |
CN105468649B (zh) | 一种待展示对象匹配的判断方法及其装置 | |
CN105023178B (zh) | 一种基于本体的电子商务推荐方法 | |
CN102542046A (zh) | 一种基于图书内容的图书推荐方法 | |
CN104915399A (zh) | 基于新闻标题的推荐数据处理方法及系统 | |
WO2014029318A1 (en) | Method and apparatus for identifying webpage type | |
CN107194769A (zh) | 一种基于用户搜索内容的商品推荐方法 | |
WO2016101812A1 (zh) | 用于对搜索数据进行处理的方法及设备 | |
US9600560B2 (en) | Search keyword and category association apparatus, search keyword and category association method, search keyword and category association program and recording medium |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20151028 |
|
RJ01 | Rejection of invention patent application after publication |