CN109426974A - 竞品分析方法和装置 - Google Patents
竞品分析方法和装置 Download PDFInfo
- Publication number
- CN109426974A CN109426974A CN201710744910.4A CN201710744910A CN109426974A CN 109426974 A CN109426974 A CN 109426974A CN 201710744910 A CN201710744910 A CN 201710744910A CN 109426974 A CN109426974 A CN 109426974A
- Authority
- CN
- China
- Prior art keywords
- product
- information
- behavioural information
- behavioural
- mix
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000004458 analytical method Methods 0.000 title claims abstract description 21
- 230000003542 behavioural effect Effects 0.000 claims abstract description 318
- 238000000034 method Methods 0.000 claims abstract description 52
- 241001269238 Data Species 0.000 claims abstract description 28
- 239000000203 mixture Substances 0.000 claims description 243
- 239000000284 extract Substances 0.000 claims description 18
- 238000009412 basement excavation Methods 0.000 abstract description 6
- 239000000047 product Substances 0.000 description 756
- 230000006399 behavior Effects 0.000 description 215
- 238000004519 manufacturing process Methods 0.000 description 15
- 238000010586 diagram Methods 0.000 description 8
- 238000010276 construction Methods 0.000 description 6
- 230000001419 dependent effect Effects 0.000 description 6
- 230000008901 benefit Effects 0.000 description 4
- 238000000605 extraction Methods 0.000 description 4
- 238000004590 computer program Methods 0.000 description 2
- 239000006227 byproduct Substances 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 230000002860 competitive effect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
- G06Q30/0202—Market predictions or forecasting for commercial activities
Landscapes
- Business, Economics & Management (AREA)
- Strategic Management (AREA)
- Engineering & Computer Science (AREA)
- Accounting & Taxation (AREA)
- Development Economics (AREA)
- Finance (AREA)
- Entrepreneurship & Innovation (AREA)
- Game Theory and Decision Science (AREA)
- Data Mining & Analysis (AREA)
- Economics (AREA)
- Marketing (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种竞品分析方法和装置,其中方法包括:根据多个关联的用户行为数据对应的行为信息,构建多个行为信息组合,分别获取与所述各个行为信息组合匹配的至少两个产品,对应组成多个产品组合,汇总多个产品组合,确定各个产品组合中各个产品之间的相关数据,根据各个产品组合对应的相关数据,确定产品组合中各产品互为竞品,基于用户行为之间的意图联系,发现可能互为竞品的产品,再通过统计汇总确定品牌或产品之间互为竞品,实现了产品或品牌间竞品关系的挖掘。
Description
技术领域
本发明涉及数据处理技术领域,具体涉及竞品分析方法,以及竞品分析装置。
背景技术
品牌或者产品之间的竞争关系是复杂多样的,在分析品牌或产品的竞品时,通常需要依靠主观判断、调查问卷、甚至还需要得到行业内竞争对手的销售数据。人工方式进行的情报搜集、经验判断等,虽然也能得到品牌或产品的竞品关系,但互联网上信息量急剧膨胀、内容变化越来越快,有限的人力根本无法及时地获取全面的与品牌或产品相关的信息,也无法根据全面的信息对品牌或产品的竞品关系进行分析。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的竞品分析方法,以及竞品分析装置。
依据本发明的一个方面,提供了一种竞品分析方法,所述方法包括:
根据多个关联的用户行为数据对应的行为信息,构建多个行为信息组合;
分别获取与所述各个行为信息组合匹配的至少两个产品,对应组成多个产品组合;
汇总所述多个产品组合,确定各个产品组合中各个产品之间的相关数据;
根据所述各个产品组合对应的相关数据,确定产品组合中各产品互为竞品。
可选地,所述用户行为数据包括行为时间,所述根据多个关联的用户行为数据对应的行为信息,构建多个行为信息组合包括:
从多个关联的用户行为数据抽取对应的行为信息;
将所述行为信息按照对应的行为时间构建多个行为信息组合。
可选地,所述将所述行为信息按照对应的行为时间构建多个行为信息组合包括:
将多个关联的行为信息按照对应的行为时间划分为多个行为信息集合;
按照各个行为信息集合中行为时间的顺序,提取临近的多个行为信息构建多个行为信息组合。
可选地,所述用户行为数据包括用户搜索行为数据和用户浏览行为数据,所述行为信息包括搜索行为信息和浏览行为信息,所述按照各个行为信息集合中行为时间的顺序,提取临近的多个行为信息构建多个行为信息组合包括:
按照各个行为信息集合中行为时间的顺序,确定临近的搜索行为信息和浏览行为信息的对应关系;
根据所述搜索行为信息和浏览行为信息的对应关系,提取相同浏览行为信息对应的多个搜索行为信息、或者相同搜索行为信息对应的多个浏览行为信息,构建多个行为信息组合。
可选地,在所述分别获取与所述各个行为信息组合匹配的至少两个产品,对应组成多个产品组合之前,所述方法还包括:
从数据系统中采集多个所述产品及其属性信息;
所述分别获取与所述各个行为信息组合匹配的至少两个产品,对应组成多个产品组合包括:
分别对所述各个行为信息组合中各行为信息和属性信息进行匹配;
获取匹配的属性信息对应的至少两个产品,对应组成多个产品组合。
可选地,在所述分别获取与所述各个行为信息组合匹配的至少两个产品,对应组成多个产品组合之前,所述方法还包括:
建立所述多个产品和对应的展示页面的网址之间的展示对应关系;
所述分别获取与所述各个行为信息组合匹配的至少两个产品,对应组成多个产品组合包括:
分别对所述行为信息组合中各行为信息和展示页面的网址进行匹配;
获取至少两个匹配的展示页面的网址对应的产品,对应组成多个产品组合。
可选地,在所述建立所述多个产品和对应的展示页面的网址之间的展示对应关系之前,所述方法还包括:
根据采集的页面内容,识别产品对应的展示页面,所述页面内容包括页面标题和页面中预设区域的内容中至少一种。
可选地,在所述建立所述多个产品和对应的展示页面的网址之间的展示对应关系之前,所述方法还包括:
由所述产品在各个站点的预设标识和站点预设网址,组成各个产品对应的展示页面的网址。
可选地,所述汇总多个产品组合,确定所述产品组合中各个产品之间的相关数据包括:
针对所述产品组合对应的各个行为信息类别,分别合并相同的多个产品组合,并记录合并前各个产品组合的出现次数;
根据所述各个产品组合的出现次数及其对应的行为信息类别的预设类别权重,分别计算各个产品组合中多个产品之间的相关性分数。
可选地,在所述根据所述各个产品组合的出现次数及其对应的行为信息类别的预设类别权重,分别计算各个产品组合中多个产品之间的相关性分数之前,所述方法还包括:
根据多个产品组合样本中多个产品之间的预设相关性分数,以及各个产品组合样本对应各个行为信息类别的出现次数,确定各个行为信息类别对应的预设类别权重;其中,所述产品组合样本包括各个行为信息类别对应的产品组合。
可选地,所述根据所述各个产品组合对应的相关数据,确定产品组合中各产品互为竞品包括:
选取相关性分数超过预设相关阈值的产品组合,确定选取的产品组合中各产品互为竞品。
可选地,在所述汇总多个产品组合,确定各个产品组合中各个产品之间的相关数据之后,所述方法还包括:
比较所述产品和多个目标产品之间的相关数据,确定与所述产品相关的多个目标产品的排序。
可选地,所述产品组合包括各产品确定互为竞品的目标产品组合,在所述根据所述各个产品组合对应的相关数据,确定产品组合中各产品互为竞品之后,所述方法还包括:
识别具有相同产品的多个目标产品组合;
将所述多个目标产品组合之间不相同的多个产品确定为互为竞品。
根据本发明的另一方面,提供了……。
一种竞品分析装置,所述装置包括:
信息组合构建模块,用于根据多个关联的用户行为数据对应的行为信息,构建多个行为信息组合;
产品组合组成模块,用于分别获取与所述各个行为信息组合匹配的至少两个产品,对应组成多个产品组合;
相关数据确定模块,用于汇总所述多个产品组合,确定各个产品组合中各个产品之间的相关数据;
竞品确定模块,用于根据所述各个产品组合对应的相关数据,确定产品组合中各产品互为竞品。
可选地,所述用户行为数据包括行为时间,所述信息组合构建模块包括:
信息抽取子模块,用于从多个关联的用户行为数据抽取对应的行为信息;
组合构建子模块,用于将所述行为信息按照对应的行为时间构建多个行为信息组合。
可选地,所述组合构建子模块包括:
集合划分单元,用于将多个关联的行为信息按照对应的行为时间划分为多个行为信息集合;
组合构建单元,用于按照各个行为信息集合中行为时间的顺序,提取临近的多个行为信息构建多个行为信息组合。
可选地,所述用户行为数据包括用户搜索行为数据和用户浏览行为数据,所述行为信息包括搜索行为信息和浏览行为信息,所述组合构建单元包括:
对应关系确定子单元,用于按照各个行为信息集合中行为时间的顺序,确定临近的搜索行为信息和浏览行为信息的对应关系;
组合构建子单元,用于根据所述搜索行为信息和浏览行为信息的对应关系,提取相同浏览行为信息对应的多个搜索行为信息、或者相同搜索行为信息对应的多个浏览行为信息,构建多个行为信息组合。
可选地,所述装置还包括:
信息采集模块,用于在所述分别获取与所述各个行为信息组合匹配的至少两个产品,对应组成多个产品组合之前,从数据系统中采集多个所述产品及其属性信息;
所述产品组合组成模块包括:
信息匹配子模块,用于分别对所述各个行为信息组合中各行为信息和属性信息进行匹配;
第一组合组成子模块,用于获取匹配的属性信息对应的至少两个产品,对应组成多个产品组合。
可选地,所述装置还包括:
关系建立模块,用于在所述分别获取与所述各个行为信息组合匹配的至少两个产品,对应组成多个产品组合之前,建立所述多个产品和对应的展示页面的网址之间的展示对应关系;
所述产品组合组成模块包括:
地址匹配子模块,用于分别对所述行为信息组合中各行为信息和展示页面的网址进行匹配;
第二组合组成子模块,用于获取至少两个匹配的展示页面的网址对应的产品,对应组成多个产品组合。
可选地,所述装置还包括:
页面识别模块,用于在所述建立所述多个产品和对应的展示页面的网址之间的展示对应关系之前,根据采集的页面内容,识别产品对应的展示页面,所述页面内容包括页面标题和页面中预设区域的内容中至少一种。
可选地,所述装置还包括:
网址组成模块,用于在所述建立所述多个产品和对应的展示页面的网址之间的展示对应关系之前,由所述产品在各个站点的预设标识和站点预设网址,组成各个产品对应的展示页面的网址。
可选地,所述相关数据确定模块包括:
组合合并子模块,用于针对所述产品组合对应的各个行为信息类别,分别合并相同的多个产品组合,并记录合并前各个产品组合的出现次数;
分数计算子模块,用于根据所述各个产品组合的出现次数及其对应的行为信息类别的预设类别权重,分别计算各个产品组合中多个产品之间的相关性分数。
可选地,所述装置还包括:
权重确定模块,用于在所述根据所述各个产品组合的出现次数及其对应的行为信息类别的预设类别权重,分别计算各个产品组合中多个产品之间的相关性分数之前,根据多个产品组合样本中多个产品之间的预设相关性分数,以及各个产品组合样本对应各个行为信息类别的出现次数,确定各个行为信息类别对应的预设类别权重;其中,所述产品组合样本包括各个行为信息类别对应的产品组合。
可选地,所述竞品确定模块包括:
竞品确定子模块,用于选取相关性分数超过预设相关阈值的产品组合,确定选取的产品组合中各个产品互为竞品。
可选地,所述装置还包括:
排序确定模块,用于在所述汇总多个产品组合,确定各个产品组合中各个产品之间的相关数据之后,比较所述产品和多个目标产品之间的相关数据,确定与所述产品相关的多个目标产品的排序。
可选地,所述产品组合包括各产品确定互为竞品的目标产品组合,所述装置还包括:
组合识别模块,用于在所述根据所述各个产品组合对应的相关数据,确定产品组合中各产品互为竞品之后,识别具有相同产品的多个目标产品组合;
相关产品确定模块,用于将所述多个目标产品组合之间不相同的多个产品确定为互为竞品。
根据本发明的一种竞品分析方法和相应的装置,通过根据多个关联的用户行为数据对应的行为信息,构建多个行为信息组合,分别获取与各个行为信息组合匹配的至少两个产品,对应组成多个产品组合,由于有关联的用户行为可能具有相同或相关的行为意图,也就是说各个行为信息组合中的行为信息之间就可能反映出相同或相关的行为意图。再根据行为信息组合对应匹配产品组合,由此产品组合中的多个产品就可能是相关的,得到可能互为竞品的产品组成的组合,然后汇总多个产品组合,确定各个产品组合中各个产品之间的相关数据,根据各个产品组合对应的相关数据,确定产品组合中各产品互为竞品。以此方式,基于用户行为之间的意图联系,发现可能互为竞品的产品,再通过统计汇总确定品牌或产品之间互为竞品,实现了产品或品牌间竞品关系的挖掘。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1示出了根据本发明实施例一的一种产品分析方法的步骤流程示意图;
图2示出了根据本发明实施例二的一种产品分析方法的步骤流程示意图;
图3示出了根据本发明实施例三的一种产品分析方法的步骤流程示意图;
图4示出了根据本发明实施例四的一种产品分析装置的结构框图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
参照图1,示出了根据本发明实施例一的一种产品分析方法的步骤流程示意图,具体可以包括如下步骤:
步骤101,根据多个关联的用户行为数据对应的行为信息,构建多个行为信息组合。
用户行为数据包括用户行为产生的多种相关数据,例如,搜索引擎中,用户在搜索框中输入的搜索词、搜索行为的发生时间等数据,或者,网络安全服务中,记录的用户浏览过的网址、浏览行为的发生时间等,具体可以包括任意适用的数据,本发明实施例对此不做限制。
其中,行为信息是用户行为数据的一种,具体包括与用户行为的意图相关的信息,例如,搜索行为中,可以反映用户搜索的意图的搜索词、或者,浏览行为中,可以反映用户浏览的意图的浏览网址等,具体可以包括任意适用的信息,本发明实施例对此不做限制。
在本发明实施例中,多个关联的用户行为数据包括来自于同一个用户的多个用户行为数据,来自于同一个地区的多个用户行为数据,或者具有其他任意适用的关联关系的用户行为数据,本发明实施例对此不做限制。
在本发明实施例中,行为信息组合包括多个行为信息,具体可以将具有一定关联的多个行为信息构建成一个行为信息组合,例如,提取行为发生时间在一定时间范围内一个用户的多个行为信息,构建成一个行为信息组合。具体可以包括任意适用的组合方式,本发明实施例对此不做限制。具体实现时,针对一段时间内各个用户的行为信息,分别构建多个行为信息组合。
实际应用中,在分析品牌或产品的竞品时,获取一段时间内搜索行为的用户行为数据,然后针对各个用户将搜索引擎记录的搜索词和搜索时间提取出来,并且按照搜索时间排序,形成一个搜索行为链,再以相同时间间隔将搜索行为链切分为多个搜索行为子链,由于搜索时间临近,对应的搜索词可能都是在搜索意图上相关的,再在每个搜索行为子链中,按顺序两两提取得到搜索词对作为行为信息组合,由此得到的行为信息组合中各个行为信息就可能在用户的行为意图上具有一定的联系,可以作为分析品牌或产品的竞品的依据。
步骤102,分别获取与所述各个行为信息组合匹配的至少两个产品,对应组成多个产品组合。
产品包括产品的品牌、产品的名称等,例如,汽车信息网站中可以采集到各种汽车品牌、产品等,具体可以包括任意适用的事物,本发明实施例对此不做限制。
在本发明实施例中,行为信息可以和产品相匹配,例如,匹配和搜索词最相似的品牌的名称,得到搜索词匹配的品牌,或者,匹配和浏览网址相同的产品的展示页面的名称,得到浏览网址匹配的产品。
在本发明实施例中,行为信息组合包括多个行为信息,针对每个行为信息去和产品进行匹配,其中全部或部分行为信息可以匹配到产品,如果一个行为信息组合可以匹配的至少两个产品,那么由匹配得到的产品,组成行为信息组合对应的产品组合。产品组合包括至少两个产品。
实际应用中,针对按顺序两两提取得到搜索词对作为行为信息组合,与预先获取的品牌或产品的各种属性数据进行匹配,如果一个行为信息组合中两个搜索词都可以匹配到对应的品牌或产品,就将两个品牌或产品保存下来,组成产品组合。
步骤103,汇总所述多个产品组合,确定各个产品组合中各个产品之间的相关数据。
在本发明实施例中,相关数据表征产品之间的相关程度,具体可以包括数值、字符标记等各种形式,本发明实施例对此不做限制,例如,相关性分值。产品组合包括多个,汇总多个产品组合,如果多个产品组合中包含相同的多个产品,那么产品组合是相同的,根据汇总后的产品组合,确定产品组合中各个产品之间的相关数据。例如,汇总相同的产品组合时,出现次数多的产品组合中各个产品之间的相关程度就高,反之则相关程度就低,可以用出现次数作为产品组合中各个产品之间的相关数据。
步骤104,根据所述各个产品组合对应的相关数据,确定产品组合中各产品互为竞品。
在本发明实施例中,由于行为信息组合中各个行为信息就可能在用户的行为意图上具有一定的联系,行为信息组合对应匹配得到的产品组合,那么产品组合中各个产品也可能反映出用户的行为意图上具有一定的联系,所以可以各个各个产品组合对应的相关数据,确定产品组合中各个产品互为竞品。
在本发明实施例中,行为信息组合可以包括多个,相应的产品组合也可以包括多个,并且产品组合可能会有相同的,确定相关产品的一种实现方式为汇总多个产品组合,统计各个产品组合的出现次数,产品组合的出现次数越多,产品组合中各个产品之间的相关程度就越高,根据出现次数确定产品组合对应的相关数据后,所以可以根据相关数据,将相关数据高于设定阈值的产品组合中的各个产品确定为互为竞品,具体可以根据实际需要设置任意适用的设定阈值,本发明实施例对此不做限制。
在本发明实施例中,产品组合还可以根据对应的行为信息的多种类别分别统计出现次数,例如,按照搜索行为、浏览行为、搜索行为和浏览行为的三种行为信息的类别。确定相关产品的另一种实现方式为分别汇总各个类别的产品组合,根据各个产品组合对应各个行为信息的类别的出现次数,乘以各个类别的预设权重后进行加和,得到各个产品组合的相关性分数,再将相关性分数超过设定阈值的产品组合中各个产品确定互为竞品,具体可以设置任意适用的预设权重,本发明实施例对此不做限制。
综上所述,依据本发明实施例,通过根据多个关联的用户行为数据对应的行为信息,构建多个行为信息组合,分别获取与各个行为信息组合匹配的至少两个产品,对应组成多个产品组合,由于有关联的用户行为可能具有相同或相关的行为意图,也就是说各个行为信息组合中的行为信息之间就可能反映出相同或相关的行为意图。再根据行为信息组合对应匹配产品组合,由此产品组合中的多个产品就可能是相关的,得到可能互为竞品的产品组成的组合,然后汇总多个产品组合,确定各个产品组合中各个产品之间的相关数据,根据各个产品组合对应的相关数据,确定产品组合中各产品互为竞品。以此方式,基于用户行为之间的意图联系,发现可能互为竞品的产品,再通过统计汇总确定品牌或产品之间互为竞品,实现了产品或品牌间竞品关系的挖掘。
参照图2,示出了根据本发明实施例二的一种产品分析方法的步骤流程示意图,具体可以包括如下步骤:
步骤201,从多个关联的用户行为数据抽取对应的行为信息。
在本发明实施例中,用户行为数据包括行为信息和行为时间,行为时间是指行为的发生时间,行为时间和行为信息是对应记录的。从用户行为数据中抽取出行为信息,例如,针对一段时间内的搜索行为的用户行为数据,按用户将搜索词抽取出来,并按照搜索时间排序,形成一个搜索行为的行为信息的列表。或者针对一段时间内的浏览行为的用户行为数据,按用户将浏览网址抽取出来,并按照浏览时间排序,形成一个浏览行为的信息信息的列表。或者,针对一段时间内的搜索行为和浏览行为的用户行为数据,按用户将搜索词和浏览网址抽取出来,并按照搜索时间和浏览时间排序,形成一个混合行为的行为信息的列表。
步骤202,将所述行为信息按照对应的行为时间构建多个行为信息组合。
在本发明实施例集中,行为时间接近的用户行为可能具有相同或相关的行为意图,按照行为时间可以确定关联的用户行为数据,具体可以分时间段以对应的多个行为信息分别构建多个行为信息组合。每个行为信息组合中的行为信息由于时间接近,所以行为信息可能反映相同或相关的行为意图。
例如,按照时间顺序,每两个行为信息就构建为一个行为信息组合,或者,每10分钟的行为信息作为一个行为信息的集合,再从每个集合中两两提取行为信息构建为一个行为信息组合,或者其他任意适用的方式取行为信息构建行为信息组合,本发明实施例对此不做限制。
步骤203,分别获取与所述各个行为信息组合匹配的至少两个产品,对应组成多个产品组合。
在本发明实施例中,此步骤具体实现可以参见前述实施例中的描述,此处不另赘述。
在本发明的一种优选实施例中,数据系统包括由一系列页面组成的网站、由相互联系的数据组成的数据库等任意适用的系统。属性信息包括标识、价格、产地、详情介绍、规格参数等任意适用的信息。在分别获取与所述行为信息组合匹配的至少两个产品,对应组成多个产品组合之前,还可以包括:从数据系统中采集多个所述产品及其属性信息,例如,从行业垂直网站采集对应品牌或产品,以及品牌或产品的属性,比如ID(Identifier、标识)、价格、产品等。那么获取与所述行为信息组合匹配的至少两个产品,组成产品组合的一种实现方式包括:分别对所述各个行为信息组合中各行为信息和属性信息进行匹配,获取匹配的属性信息对应的至少两个产品,对应组成多个产品组合。
分别针对各个行为信息组合中各行为信息,匹配对应的属性信息,全部或者部分行为信息可以匹配到属性信息,如果行为信息可以匹配到属性信息,且对应至少两个产品,那么获取至少两个属性信息对应的产品,组成产品组合。例如,搜索词和属性信息进行匹配,获取其中可以匹配到的属性信息对应的品牌或产品,组成品牌组合或者产品组合。
在本发明的一种优选实施例中,在分别获取与所述各个行为信息组合匹配的至少两个产品,对应组成多个产品组合之前,还可以包括:建立所述多个产品和对应的展示页面的网址之间的展示对应关系,展示页面包括专用于展示产品的网站中的页面、针对产品的展示页面等,例如,品牌的官方网站或者电商交易平台中某个产品的展示页面等。在识别到页面为产品的展示页面时,建立产品与对应的展示页面的网址之间的展示对应关系。那么所述获取与所述行为信息组合匹配的至少两个产品,对应组成多个产品组合的另一种实现方式包括:对所述行为信息组合中各行为信息和展示页面的网址进行匹配,获取至少两个匹配的展示页面的网址对应的产品,对应组成多个产品组合。
针对行为信息组合中各行为信息,匹配对应的展示页面的网址,全部或者部分行为信息可以匹配到展示页面的网址,如果行为信息可以匹配到展示页面的网址,且对应至少两个产品,那么获取至少两个展示页面的网址对应的产品,组成产品组合。例如,浏览网址和展示页面的网址进行匹配,获取其中可以匹配到的展示页面的网址对应的品牌或产品,组成品牌组合或者产品组合。
在本发明的一种优选实施例中,页面内容包括页面标题和页面中预设区域的内容中至少一种。在建立所述多个产品和对应的展示页面的网址之间的展示对应关系之前,还可以包括:根据采集的页面内容,识别产品对应的展示页面。例如,识别到页面标题中包含产品的名称,则该页面为产品对应的展示页面,或者页面中预设区域的内容中包含产品的名称或者标识图片等,则该页面为产品对应的展示页面,具体可以包括任意适用的方式识别展示页面,本发明实施例对此不做限制。
在本发明的一种优选实施例中,产品在不同的站点会有不同的预设标识,这与站点自身设置有关,本发明实施例对此不做限制。各种站点中给产品的展示页面分配的网址通常都是由站点预设网址和预设标识组合而成,站点预设网址也与站点自身设置有关,本发明实施例对此不做限制。在所述建立所述多个产品和对应的展示页面的网址之间的展示对应关系之前,还可以包括:由所述产品在各个站点的预设标识和站点预设网址,组成各个产品对应的展示页面的网址。针对不同的站点可以通过分析网址,得到站点预设网址,然后由产品在各个站点的预设标识和站点预设网址组合,得到各个产品对应的展示页面的网址。
步骤204,针对所述产品组合对应的各个行为信息类别,分别合并相同的多个产品组合,并记录合并前各个产品组合的出现次数。
在本发明实施例中,行为信息类别可以包括多种,例如,搜索行为对应的搜索词、浏览行为对应的浏览网址、搜索行为和浏览行为对应的搜索词和浏览网址。分类别对产品组合进行合并,合并相同行为信息类别且相同的多个产品组合,并分类别记录合并前各个产品组合的出现次数。
步骤205,根据所述各个产品组合的出现次数及其对应的行为信息类别的预设类别权重,分别计算各个产品组合中多个产品之间的相关性分数。
在本发明实施例中,预设类别权重可以预先设置,具体可以设置任意适用的预设类别权重,本发明实施例对此不做限制。具体可以各个产品组合在各个类别中的出现次数,乘以该类别的预设类别权重,再将各个类别得到的乘积相加,得到多个产品之间的相关性分数。
在本发明的一种优选实施例中,产品组合样本是指作为计算预设类别权重的样本的产品组合,包括各个行为信息类别对应的产品组合。在所述根据所述各个产品组合的出现次数及其对应的行为信息类别的预设类别权重,分别计算各个产品组合中多个产品之间的相关性分数之前,还可以包括:根据多个产品组合样本中多个产品之间的预设相关性分数,以及各个产品组合样本对应各个行为信息类别的出现次数,确定各个行为信息类别对应的预设类别权重。其中,根据多个产品样本中各个产品,通过比较不同的产品组合中各个产品,为多个产品之间设置预设相关性分数,具体可以根据实际情况设置任意适用的预设相关性分数,本发明实施例对此不做限制。分行为信息类别统计各个产品组合样本的出现次数,由于已知各个产品组合样本对应各个行为信息类别的出现次数,以及多个产品组合样本中多个产品之间的预设相关性分数,通过数学计算拟合出预设相关性分数和对应各个行为信息类别的出现次数之间的函数关系,也即是得到各个行为信息类别对应的预设类别权重。
步骤206,根据所述各个产品组合对应的相关数据,确定产品组合中各产品互为竞品。
在本发明实施例中,各个产品之间的相关性分数反映产品之间的相关程度,根据各个产品之间的相关性分值,可以将相关程度高的各产品确定为相关产品。
在本发明的一种优选实施例中,根据所述各个产品之间的相关数据,将各产品确定为相关产品的一种实现方式包括:选取相关性分数超过预设相关阈值的产品组合,确定选取的产品组合中各产品互为竞品。具体可以根据实际需要设置任意适用的预设相关阈值,本发明实施例对此不做限制。
步骤207,比较所述产品和多个目标产品之间的相关数据,确定与所述产品相关的多个目标产品的排序。
在本发明实施例中,目标产品为产品的相关的竞品产品,一个产品可能有多个目标产品。比较产品和各个目标产品之间的相关数据,由于相关数据反映相关程度,所以可以确定与产品相关的多个目标产品的排序,例如,按照相关数据的从高到低排序,得到与一个品牌的各个竞品品牌的排序。
综上所述,依据本发明实施例,通过从多个关联的用户行为数据抽取对应的行为信息,将所述行为信息按照对应的行为时间构建多个行为信息组合,由于时间相近或者时间上有关联的用户行为可能具有相同或相关的行为意图,按照时间构建的行为信息组合中的行为信息之间就可能反映出相同或相关的行为意图。
进一步,通过分别获取与所述各个行为信息组合匹配的至少两个产品,对应组成多个产品组合,针对所述产品组合对应的各个行为信息类别,分别合并相同的多个产品组合,并记录合并前各个产品组合的出现次数,根据所述各个产品组合的出现次数及其对应的行为信息类别的预设类别权重,分别计算各个产品组合中多个产品之间的相关性分数,根据所述各个产品组合对应的相关数据,确定产品组合中各产品互为竞品,以此方式,基于用户行为之间的意图联系,发现可能互为竞品的产品,再通过统计汇总确定品牌或产品之间互为竞品,实现了产品或品牌间竞品关系的挖掘。
进一步,通过比较所述产品和多个目标产品之间的相关数据,确定与所述产品相关的多个目标产品的排序,得到与产品相关的多个产品按照相关程度的排序。以此方式,对品牌或者产品的竞品进行排序。
参照图3,示出了根据本发明实施例三的一种产品分析方法的步骤流程示意图,具体可以包括如下步骤:
步骤301,从多个关联的用户行为数据抽取对应的行为信息。
在本发明实施例中,此步骤具体实现可以参见前述实施例中的描述,此处不另赘述。
步骤302,将多个关联的行为信息按照对应的行为时间划分为多个行为信息集合。
在本发明实施例中,行为信息集合包括多个行为信息,具体可以包括一定时间段内对应的行为信息,将多个关联的行为信息,按照行为时间划分为多个行为信息集合,例如,每10分钟对应的行为信息组合一个行为信息集合,具体可以任意适用的方式划分集合,本发明实施例对此不做限制。
步骤303,按照各个行为信息集合中行为时间的顺序,提取临近的多个行为信息构建多个行为信息组合。
在本发明实施例中,时间上临近的用户行为可能具有相同或相关的行为意图,因此按照各个行为信息集合中行为时间的顺序,提取临近的多个行为信息,分别构建行为信息组合,得到多个行为信息组合。例如,按照搜索时间,提取时间上临近的每两个搜索词构建搜索词组合。
在发明的一种优选实施例中,用户搜索行为数据是指用户搜索行为的用户行为数据,用户浏览行为数据是指用户浏览行为的用户行为数据,当用户行为数据包括用户搜索行为数据和用户浏览行为数据时,行为信息包括搜索行为信息和浏览行为信息,所述按照各个行为信息集合中行为时间的顺序,提取临近的多个行为信息构建多个行为信息组合的一种实现方式包括:按照各个行为信息集合中行为时间的顺序,确定临近的搜索行为信息和浏览行为信息的对应关系,根据所述搜索行为信息和浏览行为信息的对应关系,提取相同浏览行为信息对应的多个搜索行为信息、或者相同搜索行为信息对应的多个浏览行为信息,构建多个行为信息组合。
具体实现时,用户搜索行为数据中的行为信息和用户浏览行为数据中的行为信息放在一起,按照行为时间的顺序,确定时间临近的搜索行为信息和浏览行为信息的对应关系,一个搜索行为信息可能可以对应多个浏览行为信息,一个浏览行为信息也可能对应多个搜索行为信息,可以提取相同浏览行为信息对应的多个搜索行为信息构建组合,得到多个行为信息组合,或者,可以提取相同搜索行为信息对应的多个浏览行为信息构建组合,得到多个行为信息组合。
步骤304,分别获取与所述各个行为信息组合匹配的至少两个产品,对应组成多个产品组合。
在本发明实施例中,此步骤具体实现可以参见前述实施例中的描述,此处不另赘述。
步骤305,汇总所述多个产品组合,确定各个产品组合中各个产品之间的相关数据。
在本发明实施例中,此步骤具体实现可以参见前述实施例中的描述,此处不另赘述。
步骤306,根据所述各个产品组合对应的相关数据,确定产品组合中各产品互为竞品。
在本发明实施例中,此步骤具体实现可以参见前述实施例中的描述,此处不另赘述。
步骤307,识别具有相同产品的多个目标产品组合。
在本发明实施例中,多个目标产品组合中各个产品已经被确定为相关产品,通过比较各个产品组合中的产品,识别到具有相同产品的多个目标产品组合。
步骤308,将所述多个目标产品组合之间不相同的多个产品确定为互为竞品。
在本发明实施例中,由于多个目标产品组合具有相同过的产品,一个目标产品组合中,与其他目标产品不相同的多个产品和相同的产品是相关的,另一个目标产品组合中,与其他目标产品相同的产品和不相同的多个产品是相关的,那么两个目标产品组合中的不相同的多个产品也是相关的,可以确定为互为竞品。
例如,竞品库中已有第一品牌组合中品牌A和品牌B互为竞品,第二品牌组合中品牌B和品牌C互为竞品,则推断品牌A和品牌C也为竞品关系。这种传递关系可以延伸下去,但为了避免后续结果的不准确和环路的产生,只考虑利用一次传递关系,推断互为竞品。
综上所述,依据本发明实施例,通过从多个关联的用户行为数据抽取对应的行为信息,将多个关联的行为信息按照对应的行为时间划分为多个行为信息集合,按照各个行为信息集合中行为时间的顺序,提取临近的多个行为信息构建多个行为信息组合,由于时间相近或者时间上有关联的用户行为可能具有相同或相关的行为意图,按照时间构建的行为信息组合中的行为信息之间就可能反映出相同或相关的行为意图。
进一步,通过分别获取与所述行为信息组合匹配的至少两个产品,组成多个产品组合,汇总所述多个产品组合,确定各个产品组合中各个产品之间的相关数据,根据所述各个产品组合对应的相关数据,确定产品组合中各产品互为竞品。,根据行为信息组合对应匹配诸如品牌或产品等产品的产品组合,由此产品组合中的多个产品就可能是相关的。以此方式,基于用户行为之间的意图联系,发现可能互为竞品的产品,再通过统计汇总确定品牌或产品之间互为竞品,实现了产品或品牌间竞品关系的挖掘。
进一步,通过识别具有相同产品的多个目标产品组合,将所述多个目标产品组合之间不相同的多个产品确定为互为竞品,基于已经确定的相关产品,推断出更多的产品互为竞品。
为使本领域技术人员更好地理解本申请,以下通过具体的示例对本申请的一种产品分析方法进行说明。
在本发明实施例的一个示例中产品的分析过程中,基于用户行为数据的长时间积累,以及统计规律,可以通过用户行为产生的数据找到对应的品牌或产品的相关信息,间接分析出用户行为所反映出的品牌或产品的竞品,具体可以包括如下步骤:
步骤1、建立产品的数据库
产品包括品牌或产品,具体可以采集下面两方面数据:
1、从行业垂直网站采集对应产品,以及产品的属性,例如,ID、价格、产地等,或者通过其他任意适用的方式获取这类数据;
2、建立产品和展示页面的网址之间的对应关系,例如,根据产品在各个站点的ID,由该ID和站点此类网址中部分预设的字符串组成完整的网址,并建立产品和网址的对应关系。或者,通过分析页面上标题以及预设区域关键词,识别出网页为产品的展示页面,建立产品和网页的网址之间的对应关系;
步骤2、获取用户搜索行为数据,并根据搜索行为之间的关系获取品牌和品牌之间的关系
具体可以包括如下子步骤:
1、针对一定时期内的搜索行为数据,按用户将搜索词和搜索时间提取出来,并按照搜索时间的顺序,形成一个搜索行为数据的有序集合;
2、按照时间规则将搜索行为数据的有序集合切分为多个有序子集合,确保每个子集合中的搜索词都有一定的联系,例如,时间间隔在设定阈值范围内的两次搜索行为可能具有相同或相关的行为意图;
3、在每个搜索行为数据的子集合中,按顺序两两提取搜索词,然后根据步骤1得到的产品的数据库,凡是两个搜索词都可以匹配到产品,就保存该产品对;
4、统计所有人所有行为数据集合得到的产品对,得到产品对和出现次数;
步骤3、获取用户浏览行为数据,并根据浏览行为之间的关系获取品牌和品牌之间的关系
具体可以包括如下子步骤:
1、针对一定时期内的浏览行为数据,按用户将浏览网址和浏览时间提取出来,并按照浏览时间的顺序,形成一个浏览行为数据的有序集合;
2、按照时间规则将浏览行为数据的有序集合切分为多个有序子集合,确保每个子集合中的浏览网址都有一定的联系,例如,时间间隔在设定阈值范围内的两次浏览行为可能具有相同或相关的行为意图;
3、在每个浏览行为数据的子集合中,按顺序两两提取浏览网址,然后根据步骤1得到的产品的数据库,凡是两个浏览网址都可以匹配到产品,就保存该产品对;
4、统计所有人所有行为数据集合得到的产品对,得到产品对和出现次数;
步骤4、获取用户搜索行为数据和浏览行为数据,并根据搜索行为和浏览行为之间的关系获取品牌和品牌之间的关系
具体可以包括如下子步骤:
1、将步骤2和步骤3提取的搜索词和搜索时间,以及浏览网址和浏览时间,按照搜索时间和浏览时间的顺序,形成一个两种用户行为数据的有序集合;
2、按照时间规则将两种用户行为数据的有序集合切分为多个有序子集合,确保每个子集合中的搜索词和浏览网址都有一定的联系,例如,时间间隔在设定阈值范围内的搜索词和浏览行为可能具有相同或相关的行为意图;
3、在每个两种用户行为数据的子集合中,按顺序提取搜索词和浏览网址,得到多对搜索词和浏览网址;
4、按照相同浏览网址进行分组,每个浏览网址对应的多个搜索词作为搜索词组合,或者按照相同搜索词进行分组,每个搜索词对应的多个浏览网址作为浏览网址组合,然后根据步骤1得到的产品的数据库,凡是组合中多个搜索词或者多个浏览网址都可以匹配到产品,就保存该产品对;
5、统计所有人所有行为数据集合得到的产品对,得到产品对和出现次数。
步骤5、拓展产品之间的关系
根据步骤3、或步骤4、或步骤5得到的产品对,查找到具有相同产品的产品对,将查找到的多个产品对中其他不相同的产品确定为产品对,而且这种传递关系可以延伸下去,但为了结果的准确性和避免传递环路产生,只考虑一次传递关系。
步骤6、根据各个产品的出现次数对及其对应的来源的权重,得到产品之间的相关性分数,并且按照分数大小得到各个产品的竞品的排列顺序。
参照图4,示出了根据本发明实施例四的一种产品分析装置的结构框图,具体可以包括如下模块:
信息组合构建模块401,用于根据多个关联的用户行为数据对应的行为信息,构建多个行为信息组合;
产品组合组成模块402,用于分别获取与所述各个行为信息组合匹配的至少两个产品,对应组成多个产品组合;
相关数据确定模块403,用于汇总所述多个产品组合,确定各个产品组合中各个产品之间的相关数据;
竞品确定模块404,用于根据所述各个产品组合对应的相关数据,确定产品组合中各产品互为竞品。
在本发明实施例中,优选地,所述用户行为数据包括行为时间,所述信息组合构建模块包括:
信息抽取子模块,用于从多个关联的用户行为数据抽取对应的行为信息;
组合构建子模块,用于将所述行为信息按照对应的行为时间构建多个行为信息组合。
在本发明实施例中,优选地,所述组合构建子模块包括:
集合划分单元,用于将多个关联的行为信息按照对应的行为时间划分为多个行为信息集合;
组合构建单元,用于按照各个行为信息集合中行为时间的顺序,提取临近的多个行为信息构建多个行为信息组合。
在本发明实施例中,优选地,所述用户行为数据包括用户搜索行为数据和用户浏览行为数据,所述行为信息包括搜索行为信息和浏览行为信息,所述组合构建单元包括:
对应关系确定子单元,用于按照各个行为信息集合中行为时间的顺序,确定临近的搜索行为信息和浏览行为信息的对应关系;
组合构建子单元,用于根据所述搜索行为信息和浏览行为信息的对应关系,提取相同浏览行为信息对应的多个搜索行为信息、或者相同搜索行为信息对应的多个浏览行为信息,构建多个行为信息组合。
在本发明实施例中,优选地,所述装置还包括:
信息采集模块,用于在所述分别获取与所述各个行为信息组合匹配的至少两个产品,对应组成多个产品组合之前,从数据系统中采集多个所述产品及其属性信息;
所述产品组合组成模块包括:
信息匹配子模块,用于分别对所述各个行为信息组合中各行为信息和属性信息进行匹配;
第一组合组成子模块,用于获取匹配的属性信息对应的至少两个产品,对应组成多个产品组合。
在本发明实施例中,优选地,所述装置还包括:
关系建立模块,用于在所述分别获取与所述各个行为信息组合匹配的至少两个产品,对应组成多个产品组合之前,建立所述多个产品和对应的展示页面的网址之间的展示对应关系;
所述产品组合组成模块包括:
地址匹配子模块,用于分别对所述行为信息组合中各行为信息和展示页面的网址进行匹配;
第二组合组成子模块,用于获取至少两个匹配的展示页面的网址对应的产品,对应组成多个产品组合。
在本发明实施例中,优选地,所述装置还包括:
页面识别模块,用于在所述建立所述多个产品和对应的展示页面的网址之间的展示对应关系之前,根据采集的页面内容,识别产品对应的展示页面,所述页面内容包括页面标题和页面中预设区域的内容中至少一种。
在本发明实施例中,优选地,所述装置还包括:
网址组成模块,用于在所述建立所述多个产品和对应的展示页面的网址之间的展示对应关系之前,由所述产品在各个站点的预设标识和站点预设网址,组成各个产品对应的展示页面的网址。
在本发明实施例中,优选地,所述相关数据确定模块包括:
组合合并子模块,用于针对所述产品组合对应的各个行为信息类别,分别合并相同的多个产品组合,并记录合并前各个产品组合的出现次数;
分数计算子模块,用于根据所述各个产品组合的出现次数及其对应的行为信息类别的预设类别权重,分别计算各个产品组合中多个产品之间的相关性分数。
在本发明实施例中,优选地,所述装置还包括:
权重确定模块,用于在所述根据所述各个产品组合的出现次数及其对应的行为信息类别的预设类别权重,分别计算各个产品组合中多个产品之间的相关性分数之前,根据多个产品组合样本中多个产品之间的预设相关性分数,以及各个产品组合样本对应各个行为信息类别的出现次数,确定各个行为信息类别对应的预设类别权重;其中,所述产品组合样本包括各个行为信息类别对应的产品组合。
在本发明实施例中,优选地,所述竞品确定模块包括:
竞品确定子模块,用于选取相关性分数超过预设相关阈值的产品组合,确定选取的产品组合中各个产品互为竞品。
在本发明实施例中,优选地,所述装置还包括:
排序确定模块,用于在所述汇总多个产品组合,确定各个产品组合中各个产品之间的相关数据之后,比较所述产品和多个目标产品之间的相关数据,确定与所述产品相关的多个目标产品的排序。
在本发明实施例中,优选地,所述产品组合包括各产品确定互为竞品的目标产品组合,所述装置还包括:
组合识别模块,用于在所述根据所述各个产品组合对应的相关数据,确定产品组合中各产品互为竞品之后,识别具有相同产品的多个目标产品组合;
相关产品确定模块,用于将所述多个目标产品组合之间不相同的多个产品确定为互为竞品。
综上所述,依据本发明实施例,通过根据多个关联的用户行为数据对应的行为信息,构建多个行为信息组合,分别获取与各个行为信息组合匹配的至少两个产品,对应组成多个产品组合,由于有关联的用户行为可能具有相同或相关的行为意图,也就是说各个行为信息组合中的行为信息之间就可能反映出相同或相关的行为意图。再根据行为信息组合对应匹配产品组合,由此产品组合中的多个产品就可能是相关的,得到可能互为竞品的产品组成的组合,然后汇总多个产品组合,确定各个产品组合中各个产品之间的相关数据,根据各个产品组合对应的相关数据,确定产品组合中各产品互为竞品。以此方式,基于用户行为之间的意图联系,发现可能互为竞品的产品,再通过统计汇总确定品牌或产品之间互为竞品,实现了产品或品牌间竞品关系的挖掘。
在此提供的算法和显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述,构造这类系统所要求的结构是显而易见的。此外,本发明也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例的产品分析方法和装置的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。
本发明还公开了A1、一种竞品分析方法,包括:
根据多个关联的用户行为数据对应的行为信息,构建多个行为信息组合;
分别获取与所述各个行为信息组合匹配的至少两个产品,对应组成多个产品组合;
汇总所述多个产品组合,确定各个产品组合中各个产品之间的相关数据;
根据所述各个产品组合对应的相关数据,确定产品组合中各产品互为竞品。
A2、根据A1所述的方法,其中,所述用户行为数据包括行为时间,所述根据多个关联的用户行为数据对应的行为信息,构建多个行为信息组合包括:
从多个关联的用户行为数据抽取对应的行为信息;
将所述行为信息按照对应的行为时间构建多个行为信息组合。
A 3、根据A 2所述的方法,其中,所述将所述行为信息按照对应的行为时间构建多个行为信息组合包括:
将多个关联的行为信息按照对应的行为时间划分为多个行为信息集合;
按照各个行为信息集合中行为时间的顺序,提取临近的多个行为信息构建多个行为信息组合。
A 4、根据A 3所述的方法,其中,所述用户行为数据包括用户搜索行为数据和用户浏览行为数据,所述行为信息包括搜索行为信息和浏览行为信息,所述按照各个行为信息集合中行为时间的顺序,提取临近的多个行为信息构建多个行为信息组合包括:
按照各个行为信息集合中行为时间的顺序,确定临近的搜索行为信息和浏览行为信息的对应关系;
根据所述搜索行为信息和浏览行为信息的对应关系,提取相同浏览行为信息对应的多个搜索行为信息、或者相同搜索行为信息对应的多个浏览行为信息,构建多个行为信息组合。
A 5、根据A 1所述的方法,其中,在所述分别获取与所述各个行为信息组合匹配的至少两个产品,对应组成多个产品组合之前,所述方法还包括:
从数据系统中采集多个所述产品及其属性信息;
所述分别获取与所述各个行为信息组合匹配的至少两个产品,对应组成多个产品组合包括:
分别对所述各个行为信息组合中各行为信息和属性信息进行匹配;
获取匹配的属性信息对应的至少两个产品,对应组成多个产品组合。
A 6、根据A 1所述的方法,其中,在所述分别获取与所述各个行为信息组合匹配的至少两个产品,对应组成多个产品组合之前,所述方法还包括:
建立所述多个产品和对应的展示页面的网址之间的展示对应关系;
所述分别获取与所述各个行为信息组合匹配的至少两个产品,对应组成多个产品组合包括:
分别对所述行为信息组合中各行为信息和展示页面的网址进行匹配;
获取至少两个匹配的展示页面的网址对应的产品,对应组成多个产品组合。
A 7、根据A 6所述的方法,其中,在所述建立所述多个产品和对应的展示页面的网址之间的展示对应关系之前,所述方法还包括:
根据采集的页面内容,识别产品对应的展示页面,所述页面内容包括页面标题和页面中预设区域的内容中至少一种。
A 8、根据A 6所述的方法,其中,在所述建立所述多个产品和对应的展示页面的网址之间的展示对应关系之前,所述方法还包括:
由所述产品在各个站点的预设标识和站点预设网址,组成各个产品对应的展示页面的网址。
A 9、根据A 1所述的方法,其中,所述汇总多个产品组合,确定所述产品组合中各个产品之间的相关数据包括:
针对所述产品组合对应的各个行为信息类别,分别合并相同的多个产品组合,并记录合并前各个产品组合的出现次数;
根据所述各个产品组合的出现次数及其对应的行为信息类别的预设类别权重,分别计算各个产品组合中多个产品之间的相关性分数。
A 10、根据A 9所述的方法,其中,在所述根据所述各个产品组合的出现次数及其对应的行为信息类别的预设类别权重,分别计算各个产品组合中多个产品之间的相关性分数之前,所述方法还包括:
根据多个产品组合样本中多个产品之间的预设相关性分数,以及各个产品组合样本对应各个行为信息类别的出现次数,确定各个行为信息类别对应的预设类别权重;其中,所述产品组合样本包括各个行为信息类别对应的产品组合。
A 11、根据A 9所述方法,其中,所述根据所述各个产品组合对应的相关数据,确定产品组合中各产品互为竞品包括:
选取相关性分数超过预设相关阈值的产品组合,确定选取的产品组合中各产品互为竞品。
A 12、根据A 1所述的方法,其中,在所述汇总多个产品组合,确定各个产品组合中各个产品之间的相关数据之后,所述方法还包括:
比较所述产品和多个目标产品之间的相关数据,确定与所述产品相关的多个目标产品的排序。
A 13、根据A 1所述方法,其中,所述产品组合包括各产品确定互为竞品的目标产品组合,在所述根据所述各个产品组合对应的相关数据,确定产品组合中各产品互为竞品之后,所述方法还包括:
识别具有相同产品的多个目标产品组合;
将所述多个目标产品组合之间不相同的多个产品确定为互为竞品。
本发明还公开了B14、一种竞品分析装置,所述装置包括:
信息组合构建模块,用于根据多个关联的用户行为数据对应的行为信息,构建多个行为信息组合;
产品组合组成模块,用于分别获取与所述各个行为信息组合匹配的至少两个产品,对应组成多个产品组合;
相关数据确定模块,用于汇总所述多个产品组合,确定各个产品组合中各个产品之间的相关数据;
竞品确定模块,用于根据所述各个产品组合对应的相关数据,确定产品组合中各产品互为竞品。
B15、根据B14所述的装置,其中,所述用户行为数据包括行为时间,所述信息组合构建模块包括:
信息抽取子模块,用于从多个关联的用户行为数据抽取对应的行为信息;
组合构建子模块,用于将所述行为信息按照对应的行为时间构建多个行为信息组合。
B16、根据B15所述的装置,其中,所述组合构建子模块包括:
集合划分单元,用于将多个关联的行为信息按照对应的行为时间划分为多个行为信息集合;
组合构建单元,用于按照各个行为信息集合中行为时间的顺序,提取临近的多个行为信息构建多个行为信息组合。
B17、根据B16所述的装置,其中,所述用户行为数据包括用户搜索行为数据和用户浏览行为数据,所述行为信息包括搜索行为信息和浏览行为信息,所述组合构建单元包括:
对应关系确定子单元,用于按照各个行为信息集合中行为时间的顺序,确定临近的搜索行为信息和浏览行为信息的对应关系;
组合构建子单元,用于根据所述搜索行为信息和浏览行为信息的对应关系,提取相同浏览行为信息对应的多个搜索行为信息、或者相同搜索行为信息对应的多个浏览行为信息,构建多个行为信息组合。
B18、根据B14所述的装置,其中,所述装置还包括:
信息采集模块,用于在所述分别获取与所述各个行为信息组合匹配的至少两个产品,对应组成多个产品组合之前,从数据系统中采集多个所述产品及其属性信息;
所述产品组合组成模块包括:
信息匹配子模块,用于分别对所述各个行为信息组合中各行为信息和属性信息进行匹配;
第一组合组成子模块,用于获取匹配的属性信息对应的至少两个产品,对应组成多个产品组合。
B18、根据B14所述的装置,其中,所述装置还包括:
关系建立模块,用于在所述分别获取与所述各个行为信息组合匹配的至少两个产品,对应组成多个产品组合之前,建立所述多个产品和对应的展示页面的网址之间的展示对应关系;
所述产品组合组成模块包括:
地址匹配子模块,用于分别对所述行为信息组合中各行为信息和展示页面的网址进行匹配;
第二组合组成子模块,用于获取至少两个匹配的展示页面的网址对应的产品,对应组成多个产品组合。
B20、根据B19所述的装置,其中,所述装置还包括:
页面识别模块,用于在所述建立所述多个产品和对应的展示页面的网址之间的展示对应关系之前,根据采集的页面内容,识别产品对应的展示页面,所述页面内容包括页面标题和页面中预设区域的内容中至少一种。
B21、根据B19所述的装置,其中,所述装置还包括:
网址组成模块,用于在所述建立所述多个产品和对应的展示页面的网址之间的展示对应关系之前,由所述产品在各个站点的预设标识和站点预设网址,组成各个产品对应的展示页面的网址。
B22、根据B14所述的装置,其中,所述相关数据确定模块包括:
组合合并子模块,用于针对所述产品组合对应的各个行为信息类别,分别合并相同的多个产品组合,并记录合并前各个产品组合的出现次数;
分数计算子模块,用于根据所述各个产品组合的出现次数及其对应的行为信息类别的预设类别权重,分别计算各个产品组合中多个产品之间的相关性分数。
B23、根据B22所述的装置,其中,所述装置还包括:
权重确定模块,用于在所述根据所述各个产品组合的出现次数及其对应的行为信息类别的预设类别权重,分别计算各个产品组合中多个产品之间的相关性分数之前,根据多个产品组合样本中多个产品之间的预设相关性分数,以及各个产品组合样本对应各个行为信息类别的出现次数,确定各个行为信息类别对应的预设类别权重;其中,所述产品组合样本包括各个行为信息类别对应的产品组合。
B24、根据B22所述装置,其中,所述竞品确定模块包括:
竞品确定子模块,用于选取相关性分数超过预设相关阈值的产品组合,确定选取的产品组合中各个产品互为竞品。
B25、根据B14所述的装置,其中,所述装置还包括:
排序确定模块,用于在所述汇总多个产品组合,确定各个产品组合中各个产品之间的相关数据之后,比较所述产品和多个目标产品之间的相关数据,确定与所述产品相关的多个目标产品的排序。
B26、根据B14所述装置,其中,所述产品组合包括各产品确定互为竞品的目标产品组合,所述装置还包括:
组合识别模块,用于在所述根据所述各个产品组合对应的相关数据,确定产品组合中各产品互为竞品之后,识别具有相同产品的多个目标产品组合;
相关产品确定模块,用于将所述多个目标产品组合之间不相同的多个产品确定为互为竞品。
Claims (10)
1.一种竞品分析方法,所述方法包括:
根据多个关联的用户行为数据对应的行为信息,构建多个行为信息组合;
分别获取与所述各个行为信息组合匹配的至少两个产品,对应组成多个产品组合;
汇总所述多个产品组合,确定各个产品组合中各个产品之间的相关数据;
根据所述各个产品组合对应的相关数据,确定产品组合中各产品互为竞品。
2.根据权利要求1所述的方法,其中,所述用户行为数据包括行为时间,所述根据多个关联的用户行为数据对应的行为信息,构建多个行为信息组合包括:
从多个关联的用户行为数据抽取对应的行为信息;
将所述行为信息按照对应的行为时间构建多个行为信息组合。
3.根据权利要求2所述的方法,其中,所述将所述行为信息按照对应的行为时间构建多个行为信息组合包括:
将多个关联的行为信息按照对应的行为时间划分为多个行为信息集合;
按照各个行为信息集合中行为时间的顺序,提取临近的多个行为信息构建多个行为信息组合。
4.根据权利要求3所述的方法,其中,所述用户行为数据包括用户搜索行为数据和用户浏览行为数据,所述行为信息包括搜索行为信息和浏览行为信息,所述按照各个行为信息集合中行为时间的顺序,提取临近的多个行为信息构建多个行为信息组合包括:
按照各个行为信息集合中行为时间的顺序,确定临近的搜索行为信息和浏览行为信息的对应关系;
根据所述搜索行为信息和浏览行为信息的对应关系,提取相同浏览行为信息对应的多个搜索行为信息、或者相同搜索行为信息对应的多个浏览行为信息,构建多个行为信息组合。
5.根据权利要求1所述的方法,其中,在所述分别获取与所述各个行为信息组合匹配的至少两个产品,对应组成多个产品组合之前,所述方法还包括:
从数据系统中采集多个所述产品及其属性信息;
所述分别获取与所述各个行为信息组合匹配的至少两个产品,对应组成多个产品组合包括:
分别对所述各个行为信息组合中各行为信息和属性信息进行匹配;
获取匹配的属性信息对应的至少两个产品,对应组成多个产品组合。
6.根据权利要求1所述的方法,其中,在所述分别获取与所述各个行为信息组合匹配的至少两个产品,对应组成多个产品组合之前,所述方法还包括:
建立所述多个产品和对应的展示页面的网址之间的展示对应关系;
所述分别获取与所述各个行为信息组合匹配的至少两个产品,对应组成多个产品组合包括:
分别对所述行为信息组合中各行为信息和展示页面的网址进行匹配;
获取至少两个匹配的展示页面的网址对应的产品,对应组成多个产品组合。
7.根据权利要求6所述的方法,其中,在所述建立所述多个产品和对应的展示页面的网址之间的展示对应关系之前,所述方法还包括:
根据采集的页面内容,识别产品对应的展示页面,所述页面内容包括页面标题和页面中预设区域的内容中至少一种。
8.根据权利要求6所述的方法,其中,在所述建立所述多个产品和对应的展示页面的网址之间的展示对应关系之前,所述方法还包括:
由所述产品在各个站点的预设标识和站点预设网址,组成各个产品对应的展示页面的网址。
9.根据权利要求1所述的方法,其中,所述汇总多个产品组合,确定所述产品组合中各个产品之间的相关数据包括:
针对所述产品组合对应的各个行为信息类别,分别合并相同的多个产品组合,并记录合并前各个产品组合的出现次数;
根据所述各个产品组合的出现次数及其对应的行为信息类别的预设类别权重,分别计算各个产品组合中多个产品之间的相关性分数。
10.一种竞品分析装置,所述装置包括:
信息组合构建模块,用于根据多个关联的用户行为数据对应的行为信息,构建多个行为信息组合;
产品组合组成模块,用于分别获取与所述各个行为信息组合匹配的至少两个产品,对应组成多个产品组合;
相关数据确定模块,用于汇总所述多个产品组合,确定各个产品组合中各个产品之间的相关数据;
竞品确定模块,用于根据所述各个产品组合对应的相关数据,确定产品组合中各产品互为竞品。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710744910.4A CN109426974A (zh) | 2017-08-25 | 2017-08-25 | 竞品分析方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710744910.4A CN109426974A (zh) | 2017-08-25 | 2017-08-25 | 竞品分析方法和装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109426974A true CN109426974A (zh) | 2019-03-05 |
Family
ID=65499534
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710744910.4A Pending CN109426974A (zh) | 2017-08-25 | 2017-08-25 | 竞品分析方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109426974A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110060088A (zh) * | 2019-03-07 | 2019-07-26 | 平安国际智慧城市科技股份有限公司 | 竞品监控方法、装置及存储介质、计算机设备 |
CN110443290A (zh) * | 2019-07-23 | 2019-11-12 | 广东数鼎科技有限公司 | 一种基于大数据的产品竞争关系量化生成方法及装置 |
CN113220983A (zh) * | 2020-02-06 | 2021-08-06 | 北京沃东天骏信息技术有限公司 | 基于深度学习的选品方法和装置 |
WO2022081267A1 (en) * | 2020-10-15 | 2022-04-21 | Pattern Inc. | Product evaluation system and method of use |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080215349A1 (en) * | 2003-05-07 | 2008-09-04 | Cnet Networks | System and method for generating an alternative product recommendation |
CN102866992A (zh) * | 2011-07-04 | 2013-01-09 | 阿里巴巴集团控股有限公司 | 一种在网页中显示产品信息的方法及装置 |
CN104615721A (zh) * | 2015-02-06 | 2015-05-13 | 北京京东尚科信息技术有限公司 | 用于基于退货关联信息推荐商品的方法和系统 |
US20170083954A1 (en) * | 2015-08-10 | 2017-03-23 | Reviews From Friends, Inc. | Obtaining Referral Using Customer Database |
CN106844402A (zh) * | 2015-12-04 | 2017-06-13 | 阿里巴巴集团控股有限公司 | 数据处理方法及装置 |
-
2017
- 2017-08-25 CN CN201710744910.4A patent/CN109426974A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080215349A1 (en) * | 2003-05-07 | 2008-09-04 | Cnet Networks | System and method for generating an alternative product recommendation |
CN102866992A (zh) * | 2011-07-04 | 2013-01-09 | 阿里巴巴集团控股有限公司 | 一种在网页中显示产品信息的方法及装置 |
CN104615721A (zh) * | 2015-02-06 | 2015-05-13 | 北京京东尚科信息技术有限公司 | 用于基于退货关联信息推荐商品的方法和系统 |
US20170083954A1 (en) * | 2015-08-10 | 2017-03-23 | Reviews From Friends, Inc. | Obtaining Referral Using Customer Database |
CN106844402A (zh) * | 2015-12-04 | 2017-06-13 | 阿里巴巴集团控股有限公司 | 数据处理方法及装置 |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110060088A (zh) * | 2019-03-07 | 2019-07-26 | 平安国际智慧城市科技股份有限公司 | 竞品监控方法、装置及存储介质、计算机设备 |
CN110443290A (zh) * | 2019-07-23 | 2019-11-12 | 广东数鼎科技有限公司 | 一种基于大数据的产品竞争关系量化生成方法及装置 |
CN110443290B (zh) * | 2019-07-23 | 2022-02-18 | 广东数鼎科技有限公司 | 一种基于大数据的产品竞争关系量化生成方法及装置 |
CN113220983A (zh) * | 2020-02-06 | 2021-08-06 | 北京沃东天骏信息技术有限公司 | 基于深度学习的选品方法和装置 |
WO2022081267A1 (en) * | 2020-10-15 | 2022-04-21 | Pattern Inc. | Product evaluation system and method of use |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109426974A (zh) | 竞品分析方法和装置 | |
CN103488781B (zh) | 提供信息搜索的方法、搜索引擎服务器 | |
US9348934B2 (en) | Systems and methods for facilitating open source intelligence gathering | |
CN103365839B (zh) | 一种搜索引擎的推荐搜索方法和装置 | |
CN103984776B (zh) | 一种识别重复图片的方法、图片搜索去重方法及其装置 | |
EP2560111A2 (en) | Systems and methods for facilitating the gathering of open source intelligence | |
CN103412881B (zh) | 提供搜索结果的方法及系统 | |
CA3153598A1 (en) | Method of and device for predicting video playback integrity | |
CN104050286B (zh) | 一种提供搜索结果整合的方法和装置 | |
EP2732416A2 (en) | System and method for advertisement placement | |
CN106445963A (zh) | App平台的广告索引关键词自动生成方法和装置 | |
CN103488787B (zh) | 一种基于视频搜索的在线播放入口对象的推送方法和装置 | |
CN112966014B (zh) | 查找目标对象的方法和装置 | |
CN106033445A (zh) | 获取文章关联度数据的方法和装置 | |
CN103559313B (zh) | 搜索方法及装置 | |
CN109447749A (zh) | 商品信息录入方法及装置 | |
CN107368526A (zh) | 一种数据处理方法及装置 | |
CN109241455A (zh) | 一种推荐对象的展示方法及装置 | |
CN104199987B (zh) | 根据用户自定义排序显示搜索结果页的方法及搜索服务器 | |
CN115098777A (zh) | 一种基于数据分析的用户个性化推荐方法和系统 | |
CN106934679A (zh) | 信息匹配方法及装置 | |
KR20190055963A (ko) | 키워드검색 분석을 통한 온라인 쇼핑몰의 상품 노출 시스템 및 그 운영방법 | |
CN106168962B (zh) | 基于自然搜索结果提供精确观点的搜索方法及装置 | |
CN105608195B (zh) | 一种给搜索结果中的官网添加网站图标的方法和系统 | |
CN110032731A (zh) | 企业经营范围判断方法、装置及计算机可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20190305 |
|
RJ01 | Rejection of invention patent application after publication |