CN110544140A - 一种处理浏览数据的方法和装置 - Google Patents
一种处理浏览数据的方法和装置 Download PDFInfo
- Publication number
- CN110544140A CN110544140A CN201810531956.2A CN201810531956A CN110544140A CN 110544140 A CN110544140 A CN 110544140A CN 201810531956 A CN201810531956 A CN 201810531956A CN 110544140 A CN110544140 A CN 110544140A
- Authority
- CN
- China
- Prior art keywords
- article
- item
- conversation
- same
- target
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 45
- 238000012545 processing Methods 0.000 title claims abstract description 32
- 230000002860 competitive effect Effects 0.000 claims abstract description 66
- 238000012216 screening Methods 0.000 claims abstract description 22
- 239000011159 matrix material Substances 0.000 claims description 13
- 238000004590 computer program Methods 0.000 claims description 9
- 238000012163 sequencing technique Methods 0.000 claims description 5
- 238000010586 diagram Methods 0.000 description 13
- 230000006870 function Effects 0.000 description 13
- 238000004891 communication Methods 0.000 description 7
- 230000003287 optical effect Effects 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 230000002159 abnormal effect Effects 0.000 description 3
- 230000006399 behavior Effects 0.000 description 3
- 230000008901 benefit Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 238000004140 cleaning Methods 0.000 description 2
- 235000014510 cooky Nutrition 0.000 description 2
- 239000000835 fiber Substances 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 240000006108 Allium ampeloprasum Species 0.000 description 1
- 235000005254 Allium ampeloprasum Nutrition 0.000 description 1
- 241000282569 Pongo Species 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000019771 cognition Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000013479 data entry Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000003340 mental effect Effects 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0631—Item recommendations
Landscapes
- Business, Economics & Management (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Information Transfer Between Computers (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种处理浏览数据的方法和装置,涉及计算机技术领域。该方法的一具体实施方式包括:根据用户浏览数据,确定第一物品和各个第二物品出现在同一次会话中的会话次数,以及每个第二物品和各个第三物品出现在同一次会话中的会话次数;其中,所述第三物品包括第一物品和除该第二物品外的其余的第二物品;根据所述会话次数,从第二物品中筛选出与第一物品互为竞品关系的目标物品;分别计算第一物品与每个目标物品的竞争值,从而确定所述第一物品的竞品。该实施方式能够解决无法准确查找竞品的技术问题。
Description
技术领域
本发明涉及计算机技术领域,尤其涉及一种处理浏览数据的方法和装置。
背景技术
虽然线上消费具有很多优点,但是导购人员的缺失,仍然是目前线上消费的一个弱点。一个经验丰富的导购人员可以根据用户的现场反应,来确定用户的心里价位,对产品功能的需求,进而为消费者推荐其感兴趣的产品。价格区间接近,功能相识,品牌热度趋同的产品一般为物品竞品关系。目前针对竞品,除了业务人员的人工筛选与商家自定之外,并没有基于计算机的自动化实现方法。
在实现本发明过程中,发明人发现现有技术中至少存在如下问题:
1、目前物品竞品关系,都是根据业务人员的经验确定:但是需要业务人员至少具有两年以上的工作经验,才能基于经验确定物品间的竞争关系,这期间不仅要投入人力与物力,而且由于不同业务人员的认知不同,往往会给出不同的结果。
2、商家市场定位的局限性:商家在推出一款产品时,一般会进行充分的市场调研,了解同类产品有哪些,与那些产品之间是竞品关系,但是最终到了消费者层面,结果往往事与愿违,商家认为的竞品在消费眼中不一定是竞品关系。
发明内容
有鉴于此,本发明实施例提供一种处理浏览数据的方法和装置,以解决无法准确查找竞品的技术问题。
为实现上述目的,根据本发明实施例的一个方面,提供了一种处理浏览数据的方法,包括:
根据用户浏览数据,确定第一物品和各个第二物品出现在同一次会话中的会话次数,以及每个第二物品和各个第三物品出现在同一次会话中的会话次数;其中,所述第三物品包括第一物品和除该第二物品外的其余的第二物品;
根据所述会话次数,从第二物品中筛选出与第一物品互为竞品关系的目标物品;
分别计算第一物品与每个目标物品的竞争值,从而确定所述第一物品的竞品。
可选地,根据所述会话次数,从第二物品中筛选出与第一物品互为竞品关系的目标物品,包括:
根据所述第一物品和各个第二物品出现在同一次会话中的会话次数由大至小,分别确定与第一物品出现在同一次会话中的各个第二物品的正向排序;
根据所述每个第二物品和各个第三物品出现在同一次会话中的会话次数由大至小,分别确定与每个第二物品出现在同一次会话中的各个第三物品的反向排序;
如果第一物品和第二物品出现在彼此的正向排序和反向排序的前N个,则将该第二物品作为与第一物品互为竞品关系的目标物品,其中N为大于零的正整数。
可选地,根据用户浏览数据,确定第一物品和各个第二物品出现在同一次会话中的会话次数,以及每个第二物品和各个第三物品出现在同一次会话中的会话次数,包括:
根据每个用户的历史浏览数据,构造浏览数据矩阵,用户标识相同、且会话标识相同的浏览数据记为一行;
根据所述浏览数据矩阵确定第一物品和各个第二物品出现在同一次会话中的会话次数,以及每个第二物品和各个第三物品出现在同一次会话中的会话次数。
可选地,计算第一物品与每个目标物品的竞争值,包括:
将第一物品和目标物品出现在同一次会话中的次数除以第一物品和各个第二物品出现在同一次会话中的会话次数之和,得到第一会话比值;
将所述目标物品和第一物品出现在同一次会话中的次数除以所述目标物品和各个第三物品出现在同一次会话中的会话次数之和,得到第二会话比值;
将所述第一会话比值与第二会话比值的乘积作为第一物品与所述目标物品的竞争值。
可选地,所述方法还包括:
基于第一物品与各个目标物品的竞争值由大至小,确定竞争值排序;
判断所述竞争值排序中相邻竞争值的差值是否均小于阈值,若是,则缩小N的取值,和/或,扩大用户浏览数据对应的时间周期。
另外,根据本发明实施例的另一个方面,提供了一种处理浏览数据的装置,包括:
确定模块,用于根据用户浏览数据,确定第一物品和各个第二物品出现在同一次会话中的会话次数,以及每个第二物品和各个第三物品出现在同一次会话中的会话次数;其中,所述第三物品包括第一物品和除该第二物品外的其余的第二物品;
筛选模块,用于根据所述会话次数,从第二物品中筛选出与第一物品互为竞品关系的目标物品;
计算模块,用于分别计算第一物品与每个目标物品的竞争值,从而确定所述第一物品的竞品。
可选地,所述筛选模块用于:
根据所述第一物品和各个第二物品出现在同一次会话中的会话次数由大至小,分别确定与第一物品出现在同一次会话中的各个第二物品的正向排序;
根据所述每个第二物品和各个第三物品出现在同一次会话中的会话次数由大至小,分别确定与每个第二物品出现在同一次会话中的各个第三物品的反向排序;
如果第一物品和第二物品出现在彼此的正向排序和反向排序的前N个,则将该第二物品作为与第一物品互为竞品关系的目标物品,其中N为大于零的正整数。
可选地,所述确定模块用于:
根据每个用户的历史浏览数据,构造浏览数据矩阵,用户标识相同、且会话标识相同的浏览数据记为一行;
根据所述浏览数据矩阵确定第一物品和各个第二物品出现在同一次会话中的会话次数,以及每个第二物品和各个第三物品出现在同一次会话中的会话次数。
可选地,所述计算模块用于:
将第一物品和目标物品出现在同一次会话中的次数除以第一物品和各个第二物品出现在同一次会话中的会话次数之和,得到第一会话比值;
将所述目标物品和第一物品出现在同一次会话中的次数除以所述目标物品和各个第三物品出现在同一次会话中的会话次数之和,得到第二会话比值;
将所述第一会话比值与第二会话比值的乘积作为第一物品与所述目标物品的竞争值。
可选地,所述计算模块还用于:
基于第一物品与各个目标物品的竞争值由大至小,确定竞争值排序;
判断所述竞争值排序中相邻竞争值的差值是否均小于阈值,若是,则缩小N的取值,和/或,扩大用户浏览数据对应的时间周期。
根据本发明实施例的另一个方面,还提供了一种电子设备,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现上述任一实施例所述的方法。
根据本发明实施例的另一个方面,还提供了一种计算机可读介质,其上存储有计算机程序,所述程序被处理器执行时实现上述任一实施例所述的方法。
上述发明中的一个实施例具有如下优点或有益效果:因为采用根据第一物品和各个第二物品出现在同一次会话中的会话次数,筛选出与第一物品互为竞品关系的目标物品,从而计算第一物品与每个目标物品的竞争值的技术手段,所以克服了无法准确查找竞品的技术问题;根据第一物品和各个第二物品出现在同一次会话中的会话次数,筛选出与第一物品互为竞品关系的目标物品,从而计算第一物品与每个目标物品的竞争值,避免现有技术方案中无法准确查找竞品的问题。因此,本发明实施例能够基于用户浏览数据准确地挖掘不同物品间的竞品关系,将具有相同功能,价格区间和热度接近的产品推荐给用户,缩短用户寻找产品的时间和购买周期,帮助提升用户体验。
上述的非惯用的可选方式所具有的进一步效果将在下文中结合具体实施方式加以说明。
附图说明
附图用于更好地理解本发明,不构成对本发明的不当限定。其中:
图1是根据本发明实施例的处理浏览数据的方法的主要流程的示意图;
图2是根据本发明一个可参考实施例的处理浏览数据的方法的主要流程的示意图;
图3是根据本发明实施例的处理浏览数据的装置的主要模块的示意图;
图4是本发明实施例可以应用于其中的示例性系统架构图;
图5是适于用来实现本发明实施例的终端设备或服务器的计算机系统的结构示意图。
具体实施方式
以下结合附图对本发明的示范性实施例做出说明,其中包括本发明实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本发明的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
图1是根据本发明实施例的处理浏览数据的方法的主要流程的示意图。作为本发明的一个实施例,如图1所示,所述处理浏览数据的方法可以包括:
步骤101,根据用户浏览数据,确定第一物品和各个第二物品出现在同一次会话中的会话次数,以及每个第二物品和各个第三物品出现在同一次会话中的会话次数。
在该步骤中,基于用户的历史浏览数据,确定相同品类内(例如二级品类、三级品类、四级品类等),第一物品和各个第二物品出现在同一次会话中的会话次数,以及每个第二物品和各个第三物品出现在同一次会话中的会话次数。其中,所述第三物品包括第一物品和除该第二物品外的其余的第二物品。本发明实施例基于用户的浏览数据,挖掘相同品类内,不同物品之间的竞品关系,引入session_id(用户发起一次浏览的会话标识),限定物品竞品间的数据边界,即是用户一次会话中同时被访问到的物品间才更具有竞品关系,如果两个物品是出现在该用户不同的会话中,则不能认为这两个品类具有竞争关系。而且,通过session_id的限定,可以过滤掉平台热搜品。
本发明实施例通过限定session_id挖掘用户的浏览行为,Session用来追踪每个用户的会话,使用服务器生成的session_id进行标识,用以区分用户。Session存放在服务器的内存中,session_id存放在服务器内存和客户机的Cookie里面。这样,当用户发出请求时,服务器将用户Cookie里面记录的session_id和服务器内存中的session_id进行比对,从而找到这个用户对应的Session进行操作。
在步骤101之前,所述方法还包括:获取历史时间周期内的用户浏览数据,并对所述用户浏览数据进行数据清洗。其中,时间周期可以是7的倍数,例如7天、14天、21天等。例如数据缺失值填补与噪声过滤等。例如依据抽取的相关数据,对数据进行异常值处理,针对不同的异常值特点采取不同的处理策略。例如针对可以修补的异常值,采用临近平均值、拉格朗日插值法等方法。
具体地,现以35天的用户浏览数据,从用户浏览数据中抽取用户35天的浏览数据,数据格式包括:用户名、session_id、用户浏览的一级品类ID、二级品类ID、三级品类ID、品类、物品品牌、物品ID。如下所示:
表1用户浏览数据表
然后基于清洗后的用户浏览数据,构造浏览数据矩阵,用户标识相同、且会话标识相同的浏览数据记为一行。具体地,基于上面的用户浏览数据表,以用户名和会话标识作为数据拼接的比对标准,即将用户浏览数据表中user_log_acct与session_id一致的数据条目连接到一起。这样可以保证所有被关联到一起的skuA与skuB是同时出现在一次用户浏览行为中,只有这样才能保证挖掘出来的物品为具有竞争可能性。
举例来说,将上面的用户浏览数据表,按照user_log_acct与session_id相同,三级品类相同,sku_id不同的条件拼接,以构造浏览数据矩阵,并将主商品放在左侧,与主商品相关的商品放在右侧。例如左侧为物品A,右侧为物品B、C、D,其含义为用户在一次会话中,同时浏览物品A的同时还浏览了物品B、C、D。数据拼接后样例如下:
表2拼接后数据表
用户名 | Mian3 | Brand | Sku_id | Rel3 | Rel_brand | Rel_Sku_id |
小红 | 1300 | 方太 | A | 1300 | 老板 | B |
小红 | 1300 | 方太 | A | 1300 | 方太 | C |
小红 | 1300 | 方太 | A | 1300 | 海尔 | D |
… | … | … | … | … | … | … |
小红 | 1300 | 方太 | A | 1300 | 西门子 | E |
小李 | 1300 | 方太 | A | 1300 | 老板 | B |
小李 | 1300 | 方太 | A | 1300 | 华帝 | F |
小李 | 1300 | 方太 | A | 1300 | 华帝 | Q |
小李 | 1300 | 方太 | A | 1300 | 华帝 | T |
其中,Mian3表示主品(即第一物品)的三级品类的编号,Brand表示主品(即第一物品)的品牌,Rel3表示反转物品(即第二物品)的三级品类的编号,Rel_brand表示反转物品(即第二物品)的品牌,Rel_Sku_id表示反转物品(即第二物品)的物品ID。
以上数据显示,小红在浏览方太品牌下,sku_id=A(即主品)的同时,还浏览了Rel_sku_id=B/C/D/E(即反转物品)。用户小李下浏览了方太品牌下,sku_id=A(即主品)的同时还浏览了Rel_sku_id=B/F/Q/T(即反转物品)。
根据上述矩阵可以得到以物品A作为主品(即第一物品)时,物品A和各个反转物品(即第二物品)出现在同一次会话中的会话次数。
同样地,以物品B作为主品(即第一物品)时,物品B和各个反转物品(即第三物品)出现在同一次会话中的会话次数。以物品C作为主品(即第一物品)时,物品C和各个反转物品(即第三物品)出现在同一次会话中的会话次数。依次类推,从而得到每个第二物品和各个第三物品出现在同一次会话中的会话次数,如下表所示:
表3会话次数统计表
主品 | 反转物品 | 会话次数 | 主品会话总次数 | 反转会话计数 | 反转会话总次数 |
A | B | m<sub>1</sub> | Main_sum_A | n<sub>1</sub> | Main_sum_B |
A | C | m<sub>2</sub> | Main_sum_A | n<sub>2</sub> | Main_sum_C |
A | D | m<sub>3</sub> | Main_sum_A | n<sub>3</sub> | Main_sum_D |
A | E | m<sub>4</sub> | Main_sum_A | n<sub>4</sub> | Main_sum_E |
… | … | … | … | … | … |
A | Z | m<sub>n</sub> | Main_sum_A | n<sub>n</sub> | Main_sum_Z |
B | A | n<sub>1</sub> | Main_sum_B | m<sub>1</sub> | Main_sum_A |
… | … | … | … | … | … |
C | A | n<sub>2</sub> | Main_sum_C | m<sub>2</sub> | Main_sum_A |
… | … | … | … | … | … |
Z | A | n<sub>n</sub> | Main_sum_Z | m<sub>n</sub> | Main_sum_A |
其中,m1表示以物品A作为主品(即第一物品)时,物品A和反转物品B(即第二物品)出现在同一次会话中的会话次数,m2表示以物品A作为主品(即第一物品)时,物品A和反转物品C(即第二物品)出现在同一次会话中的会话次数,以此类推,mn表示以物品A作为主品(即第一物品)时,物品A和反转物品Z(即第二物品)出现在同一次会话中的会话次数。因此,Main_sum_A=m1+m2+···+mn。
同样地,n1表示以物品B作为主品(即第二物品)时,反转物品B和物品A现在同一次会话中的会话次数,n2表示以物品C作为主品(即第二物品)时,反转物品C和物品A现在同一次会话中的会话次数,以此类推。
步骤102,根据所述会话次数,从第二物品中筛选出与第一物品互为竞品关系的目标物品。
在该步骤中,通过步骤101得到的会话次数,进行排序,从而筛选出与第一物品互为竞品关系的目标物品。可选地,根据所述第一物品和各个第二物品出现在同一次会话中的会话次数由大至小,分别确定与第一物品出现在同一次会话中的各个第二物品的正向排序;根据所述每个第二物品和各个第三物品出现在同一次会话中的会话次数由大至小,分别确定与每个第二物品出现在同一次会话中的各个第三物品的反向排序;如果第一物品和第二物品出现在彼此的正向排序和反向排序的前N个,则将该第二物品作为与第一物品互为竞品关系的目标物品,其中N为大于零的正整数。
举例来说,根据表3确定物品A与物品B、C、D等出现在同一次会话中的会话次数,并按照由大至小进行排序,从而确定与物品A出现在同一次会话中的各个第二物品(物品B、C、D等)的正向排序。同样地,根据表3确定物品B与物品A、C、D等出现在同一次会话中的会话次数,并按照由大至小进行排序,从而确定与物品B出现在同一次会话中的各个第三物品(物品A、C、D等)的反向排序。如果第物品A和物品B出现在彼此的正向排序和反向排序的前N个,则将物品B作为与物品A互为竞品关系的目标物品,其中N为大于零的正整数。可选地,N可以是50、80、100等。
该步骤的目的是统计物品A与B在所有用户浏览行为中同时出现的次数,这样做可以将用户的浏览行为聚焦到一次会话中,只有用户在一次会话中同时被访问到的物品,才能说明这些品类间存在某种竞争性。在该步骤中,通过分析用户每一次浏览会话中,一起被浏览过的物品,进而挖掘出在用户的心里,哪些物品具有竞品关系。然后对商品间的竞争性进行排名,取正反向排名都在前N的物品。如果两个物品中有一个没有出现在另一个竞品关系的前N,就删除该条记录。
步骤103,分别计算第一物品与每个目标物品的竞争值,从而确定所述第一物品的竞品v。
在步骤102的基础上,分别计算第一物品与每个目标物品的竞争值,具体地,将第一物品和目标物品出现在同一次会话中的次数除以第一物品和各个第二物品出现在同一次会话中的会话次数之和,得到第一会话比值;将所述目标物品和第一物品出现在同一次会话中的次数除以所述目标物品和各个第三物品出现在同一次会话中的会话次数之和,得到第二会话比值;将所述第一会话比值与第二会话比值的乘积作为第一物品与所述目标物品的竞争值。
以步骤102中的表3为例,竞争值的计算公式如下:
竞争值表示两个物品A与B之间的竞争性大小。该值得取值范围在0-1之间。数值越接近于1,表示两个物品间的竞争性性越强。
表4竞争值统计表
本发明从用户角度更精确地了解哪些物品间具有竞争性,可以根据用户当前的浏览状态,将与用户正在浏览的物品(例如物品A)具有强竞争关系的物品推送给用户,增强竞争品的曝光力度,将用户可能感兴趣的物品放在最佳的货位上,帮助用户找到感兴趣的物品,缩短用户的购买周期,优化用户体验。
作为本发明的又一个实施例,所述方法还包括:基于第一物品与各个目标物品的竞争值由大至小,确定竞争值排序;判断所述竞争值排序中相邻竞争值的差值是否均小于阈值,若是,则缩小N的取值,和/或,扩大用户浏览数据对应的时间周期。
例如,可以将N的取值由100缩小为80或者50,也可以将时间周期从35天扩大为49天或者70天。然后重复步骤101-103,直至竞争值排序中相邻竞争值的差值至少有一个大于等于阈值。还可以继续循环迭代,调整N的取值和/或时间周期,以使输出结果达到最优。
根据上面所述的各种实施例,可以看出本发明通过采用根据第一物品和各个第二物品出现在同一次会话中的会话次数,筛选出与第一物品互为竞品关系的目标物品,从而计算第一物品与每个目标物品的竞争值的技术手段,从而解决了无法准确查找竞品的问题。也就是说,现有技术除了业务人员的人工筛选与商家自定之外,并没有基于计算机的自动化实现方法。而本发明是根据第一物品和各个第二物品出现在同一次会话中的会话次数,筛选出与第一物品互为竞品关系的目标物品;从而计算第一物品与每个目标物品的竞争值,避免现有技术方案中无法准确查找竞品的问题。因此,本发明实施例提供的方法能够基于用户浏览数据准确地挖掘不同物品间的竞品关系,将具有相同功能,价格区间和热度接近的产品推荐给用户,缩短用户寻找产品的时间和购买周期,帮助提升用户体验。
图2是根据本发明另一个可参考实施例的处理浏览数据的方法的主要流程的示意图,所述处理浏览数据的方法可以包括:
步骤201,获取历史时间周期内的用户浏览数据,并对所述用户浏览数据进行数据清洗;
步骤202,根据用户浏览数据,分别确定第一物品和各个第二物品出现在同一次会话中的会话次数,以及每个第二物品和各个第三物品出现在同一次会话中的会话次数;
步骤203,根据所述第一物品和各个第二物品出现在同一次会话中的会话次数由大至小,确定与第一物品出现在同一次会话中的各个第二物品的正向排序;
步骤204,根据所述每个第二物品和各个第三物品出现在同一次会话中的会话次数由大至小,确定与每个第二物品出现在同一次会话中的各个第三物品的反向排序;
步骤205,如果第一物品和第二物品出现在彼此的正向排序和反向排序的前N个,则将该第二物品作为与第一物品互为竞品关系的多个目标物品;
步骤206,将第一物品和目标物品出现在同一次会话中的次数除以第一物品和各个第二物品出现在同一次会话中的会话次数之和,得到第一会话比值;
步骤207,将所述目标物品和第一物品出现在同一次会话中的次数除以所述目标物品和各个第三物品出现在同一次会话中的会话次数之和,得到第二会话比值;
步骤208,将所述第一会话比值与第二会话比值的乘积作为第一物品与所述目标物品的竞争值,从而确定所述第一物品的竞品。数值越接近于1,表示两个物品间的竞争性性越强。
其中,步骤203与步骤204的顺序可以互换,步骤206与步骤207的顺序也可以互换,本发明实施例对此不作限制。
根据上面所述的各种实施例,可以看出本发明通过采用根据第一物品和各个第二物品出现在同一次会话中的会话次数,筛选出与第一物品互为竞品关系的目标物品,从而计算第一物品与每个目标物品的竞争值的技术手段,从而解决了无法准确查找竞品的问题。也就是说,现有技术除了业务人员的人工筛选与商家自定之外,并没有基于计算机的自动化实现方法。而本发明是根据第一物品和各个第二物品出现在同一次会话中的会话次数,筛选出与第一物品互为竞品关系的目标物品;从而计算第一物品与每个目标物品的竞争值,避免现有技术方案中无法准确查找竞品的问题。因此,本发明实施例提供的方法能够基于用户浏览数据准确地挖掘不同物品间的竞品关系,将具有相同功能,价格区间和热度接近的产品推荐给用户,缩短用户寻找产品的时间和购买周期,帮助提升用户体验。
另外,在本发明一个可参考实施例中处理浏览数据的方法的具体实施内容,在上面所述处理浏览数据的方法中已经详细说明了,故在此重复内容不再说明。
图3是根据本发明实施例的处理浏览数据的装置的主要模块的示意图,如图3所示,所述处理浏览数据的装置300包括确定模块301、筛选模块302和计算模块303。其中,所述确定模块301根据用户浏览数据,确定第一物品和各个第二物品出现在同一次会话中的会话次数,以及每个第二物品和各个第三物品出现在同一次会话中的会话次数;其中,所述第三物品包括第一物品和除该第二物品外的其余的第二物品;所述筛选模块302根据所述会话次数,从第二物品中筛选出与第一物品互为竞品关系的目标物品;所述计算模块303分别计算第一物品与每个目标物品的竞争值,从而确定所述第一物品的竞品。
可选地,所述筛选模块302根据所述第一物品和各个第二物品出现在同一次会话中的会话次数由大至小,分别确定与第一物品出现在同一次会话中的各个第二物品的正向排序;根据所述每个第二物品和各个第三物品出现在同一次会话中的会话次数由大至小,分别确定与每个第二物品出现在同一次会话中的各个第三物品的反向排序;如果第一物品和第二物品出现在彼此的正向排序和反向排序的前N个,则将该第二物品作为与第一物品互为竞品关系的目标物品,其中N为大于零的正整数。
可选地,所述确定模块301根据每个用户的历史浏览数据,构造浏览数据矩阵,用户标识相同、且会话标识相同的浏览数据记为一行;根据所述浏览数据矩阵确定第一物品和各个第二物品出现在同一次会话中的会话次数,以及每个第二物品和各个第三物品出现在同一次会话中的会话次数。
可选地,所述计算模块303将第一物品和目标物品出现在同一次会话中的次数除以第一物品和各个第二物品出现在同一次会话中的会话次数之和,得到第一会话比值;将所述目标物品和第一物品出现在同一次会话中的次数除以所述目标物品和各个第三物品出现在同一次会话中的会话次数之和,得到第二会话比值;将所述第一会话比值与第二会话比值的乘积作为第一物品与所述目标物品的竞争值。
可选地,所述计算模块303还基于第一物品与各个目标物品的竞争值由大至小,确定竞争值排序;判断所述竞争值排序中相邻竞争值的差值是否均小于阈值,若是,则缩小N的取值,和/或,扩大用户浏览数据对应的时间周期。
根据上面所述的各种实施例,可以看出本发明通过采用根据第一物品和各个第二物品出现在同一次会话中的会话次数,筛选出与第一物品互为竞品关系的目标物品,从而计算第一物品与每个目标物品的竞争值的技术手段,从而解决了无法准确查找竞品的问题。也就是说,现有技术除了业务人员的人工筛选与商家自定之外,并没有基于计算机的自动化实现方法。而本发明是根据第一物品和各个第二物品出现在同一次会话中的会话次数,筛选出与第一物品互为竞品关系的目标物品;从而计算第一物品与每个目标物品的竞争值,避免现有技术方案中无法准确查找竞品的问题。因此,本发明实施例提供的装置能够基于用户浏览数据准确地挖掘不同物品间的竞品关系,将具有相同功能,价格区间和热度接近的产品推荐给用户,缩短用户寻找产品的时间和购买周期,帮助提升用户体验。
需要说明的是,在本发明所述处理浏览数据的装置的具体实施内容,在上面所述处理浏览数据的方法中已经详细说明了,故在此重复内容不再说明。
图4示出了可以应用本发明实施例的处理浏览数据的方法或处理浏览数据的装置的示例性系统架构400。
如图4所示,系统架构400可以包括终端设备401、402、403,网络404和服务器405。网络404用以在终端设备401、402、403和服务器405之间提供通信链路的介质。网络404可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户可以使用终端设备401、402、403通过网络404与服务器405交互,以接收或发送消息等。终端设备401、402、403上可以安装有各种通讯客户端应用,例如购物类应用、网页浏览器应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等(仅为示例)。
终端设备401、402、403可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。
服务器405可以是提供各种服务的服务器,例如对用户利用终端设备401、402、403所浏览的购物类网站提供支持的后台管理服务器(仅为示例)。后台管理服务器可以对接收到的产品信息查询请求等数据进行分析等处理,并将处理结果(例如目标推送信息、产品信息——仅为示例)反馈给终端设备。
需要说明的是,本发明实施例所提供的处理浏览数据的方法一般在公共场所的终端设备401、402、403上执行,也可以由服务器405执行,相应地,所述处理浏览数据的装置一般设置在公共场所的终端设备401、402、403上,也可以设置在服务器405中。
应该理解,图4中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
下面参考图5,其示出了适于用来实现本发明实施例的终端设备的计算机系统500的结构示意图。图5示出的终端设备仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图5所示,计算机系统500包括中央处理单元(CPU)501,其可以根据存储在只读存储器(ROM)502中的程序或者从存储部分508加载到随机访问存储器(RAM)503中的程序而执行各种适当的动作和处理。在RAM 503中,还存储有系统500操作所需的各种程序和数据。CPU 501、ROM 502以及RAM503通过总线504彼此相连。输入/输出(I/O)接口505也连接至总线504。
以下部件连接至I/O接口505:包括键盘、鼠标等的输入部分506;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分507;包括硬盘等的存储部分508;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分509。通信部分509经由诸如因特网的网络执行通信处理。驱动器510也根据需要连接至I/O接口505。可拆卸介质511,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器510上,以便于从其上读出的计算机程序根据需要被安装入存储部分508。
特别地,根据本发明公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本发明公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分509从网络上被下载和安装,和/或从可拆卸介质511被安装。在该计算机程序被中央处理单元(CPU)501执行时,执行本发明的系统中限定的上述功能。
需要说明的是,本发明所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本发明中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本发明中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。
附图中的流程图和框图,图示了按照本发明各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本发明实施例中所涉及到的模块可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的模块也可以设置在处理器中,例如,可以描述为:一种处理器包括确定模块、筛选模块和计算模块,其中,这些模块的名称在某种情况下并不构成对该模块本身的限定。
作为另一方面,本发明还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的设备中所包含的;也可以是单独存在,而未装配入该设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被一个该设备执行时,使得该设备包括:根据用户浏览数据,确定第一物品和各个第二物品出现在同一次会话中的会话次数,以及每个第二物品和各个第三物品出现在同一次会话中的会话次数;根据所述会话次数,从第二物品中筛选出与第一物品互为竞品关系的目标物品;分别计算第一物品与每个目标物品的竞争值,从而确定所述第一物品的竞品。
根据本发明实施例的技术方案,因为采用根据第一物品和各个第二物品出现在同一次会话中的会话次数,筛选出与第一物品互为竞品关系的目标物品,从而计算第一物品与每个目标物品的竞争值的技术手段,所以克服了无法准确查找竞品的技术问题,根据第一物品和各个第二物品出现在同一次会话中的会话次数,筛选出与第一物品互为竞品关系的目标物品;从而计算第一物品与每个目标物品的竞争值,避免现有技术方案中无法准确查找竞品的问题。因此,本发明实施例能够基于用户浏览数据准确地挖掘不同物品间的竞品关系,将具有相同功能,价格区间和热度接近的产品推荐给用户,缩短用户寻找产品的时间和购买周期,帮助提升用户体验。
上述具体实施方式,并不构成对本发明保护范围的限制。本领域技术人员应该明白的是,取决于设计要求和其他因素,可以发生各种各样的修改、组合、子组合和替代。任何在本发明的精神和原则之内所作的修改、等同替换和改进等,均应包含在本发明保护范围之内。
Claims (12)
1.一种处理浏览数据的方法,其特征在于,包括:
根据用户浏览数据,确定第一物品和各个第二物品出现在同一次会话中的会话次数,以及每个第二物品和各个第三物品出现在同一次会话中的会话次数;其中,所述第三物品包括第一物品和除该第二物品外的其余的第二物品;
根据所述会话次数,从第二物品中筛选出与第一物品互为竞品关系的目标物品;
分别计算第一物品与每个目标物品的竞争值,从而确定第一物品的竞品。
2.根据权利要求1所述的方法,其特征在于,根据所述会话次数,从第二物品中筛选出与第一物品互为竞品关系的目标物品,包括:
根据所述第一物品和各个第二物品出现在同一次会话中的会话次数由大至小,分别确定与第一物品出现在同一次会话中的各个第二物品的正向排序;
根据所述每个第二物品和各个第三物品出现在同一次会话中的会话次数由大至小,分别确定与每个第二物品出现在同一次会话中的各个第三物品的反向排序;
如果第一物品和第二物品出现在彼此的正向排序和反向排序的前N个,则将该第二物品作为与第一物品互为竞品关系的目标物品,其中N为大于零的正整数。
3.根据权利要求1所述的方法,其特征在于,根据用户浏览数据,确定第一物品和各个第二物品出现在同一次会话中的会话次数,以及每个第二物品和各个第三物品出现在同一次会话中的会话次数,包括:
根据每个用户的历史浏览数据,构造浏览数据矩阵,用户标识相同、且会话标识相同的浏览数据记为一行;
根据所述浏览数据矩阵确定第一物品和各个第二物品出现在同一次会话中的会话次数,以及每个第二物品和各个第三物品出现在同一次会话中的会话次数。
4.根据权利要求1所述的方法,其特征在于,计算第一物品与每个目标物品的竞争值,包括:
将第一物品和目标物品出现在同一次会话中的次数除以第一物品和各个第二物品出现在同一次会话中的会话次数之和,得到第一会话比值;
将所述目标物品和第一物品出现在同一次会话中的次数除以所述目标物品和各个第三物品出现在同一次会话中的会话次数之和,得到第二会话比值;
将所述第一会话比值与第二会话比值的乘积作为第一物品与所述目标物品的竞争值。
5.根据权利要求1所述的方法,其特征在于,还包括:
基于第一物品与各个目标物品的竞争值由大至小,确定竞争值排序;
判断所述竞争值排序中相邻竞争值的差值是否均小于阈值,若是,则缩小N的取值,和/或,扩大用户浏览数据对应的时间周期。
6.一种处理浏览数据的装置,其特征在于,包括:
确定模块,用于根据用户浏览数据,确定第一物品和各个第二物品出现在同一次会话中的会话次数,以及每个第二物品和各个第三物品出现在同一次会话中的会话次数;其中,所述第三物品包括第一物品和除该第二物品外的其余的第二物品;
筛选模块,用于根据所述会话次数,从第二物品中筛选出与第一物品互为竞品关系的目标物品;
计算模块,用于分别计算第一物品与每个目标物品的竞争值,从而确定所述第一物品的竞品。
7.根据权利要求6所述的装置,其特征在于,所述筛选模块用于:
根据所述第一物品和各个第二物品出现在同一次会话中的会话次数由大至小,分别确定与第一物品出现在同一次会话中的各个第二物品的正向排序;
根据所述每个第二物品和各个第三物品出现在同一次会话中的会话次数由大至小,分别确定与每个第二物品出现在同一次会话中的各个第三物品的反向排序;
如果第一物品和第二物品出现在彼此的正向排序和反向排序的前N个,则将该第二物品作为与第一物品互为竞品关系的目标物品,其中N为大于零的正整数。
8.根据权利要求6所述的装置,其特征在于,所述确定模块用于:
根据每个用户的历史浏览数据,构造浏览数据矩阵,用户标识相同、且会话标识相同的浏览数据记为一行;
根据所述浏览数据矩阵确定第一物品和各个第二物品出现在同一次会话中的会话次数,以及每个第二物品和各个第三物品出现在同一次会话中的会话次数。
9.根据权利要求6所述的装置,其特征在于,所述计算模块用于:
将第一物品和目标物品出现在同一次会话中的次数除以第一物品和各个第二物品出现在同一次会话中的会话次数之和,得到第一会话比值;
将所述目标物品和第一物品出现在同一次会话中的次数除以所述目标物品和各个第三物品出现在同一次会话中的会话次数之和,得到第二会话比值;
将所述第一会话比值与第二会话比值的乘积作为第一物品与所述目标物品的竞争值。
10.根据权利要求6所述的装置,其特征在于,所述计算模块还用于:
基于第一物品与各个目标物品的竞争值由大至小,确定竞争值排序;
判断所述竞争值排序中相邻竞争值的差值是否均小于阈值,若是,则缩小N的取值,和/或,扩大用户浏览数据对应的时间周期。
11.一种电子设备,其特征在于,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-5中任一所述的方法。
12.一种计算机可读介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现如权利要求1-5中任一所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810531956.2A CN110544140B (zh) | 2018-05-29 | 2018-05-29 | 一种处理浏览数据的方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810531956.2A CN110544140B (zh) | 2018-05-29 | 2018-05-29 | 一种处理浏览数据的方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110544140A true CN110544140A (zh) | 2019-12-06 |
CN110544140B CN110544140B (zh) | 2024-08-20 |
Family
ID=68701550
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810531956.2A Active CN110544140B (zh) | 2018-05-29 | 2018-05-29 | 一种处理浏览数据的方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110544140B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111080411A (zh) * | 2019-12-17 | 2020-04-28 | 深圳市梦网百科信息技术有限公司 | 一种基于网络中心度的商品推送方法、系统及终端设备 |
CN113065882A (zh) * | 2020-01-02 | 2021-07-02 | 阿里巴巴集团控股有限公司 | 一种商品处理方法、装置及电子设备 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009205517A (ja) * | 2008-02-28 | 2009-09-10 | Toshiba Corp | 情報処理装置及び情報処理方法 |
CN105589905A (zh) * | 2014-12-26 | 2016-05-18 | 中国银联股份有限公司 | 用户兴趣数据分析和收集系统及其方法 |
CN106294338A (zh) * | 2015-05-12 | 2017-01-04 | 株式会社理光 | 信息处理方法和信息处理装置 |
CN107481066A (zh) * | 2017-08-29 | 2017-12-15 | 艾普英捷(北京)智能科技股份有限公司 | 一种基于大数据的竞品分析方法及系统 |
-
2018
- 2018-05-29 CN CN201810531956.2A patent/CN110544140B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009205517A (ja) * | 2008-02-28 | 2009-09-10 | Toshiba Corp | 情報処理装置及び情報処理方法 |
CN105589905A (zh) * | 2014-12-26 | 2016-05-18 | 中国银联股份有限公司 | 用户兴趣数据分析和收集系统及其方法 |
CN106294338A (zh) * | 2015-05-12 | 2017-01-04 | 株式会社理光 | 信息处理方法和信息处理装置 |
CN107481066A (zh) * | 2017-08-29 | 2017-12-15 | 艾普英捷(北京)智能科技股份有限公司 | 一种基于大数据的竞品分析方法及系统 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111080411A (zh) * | 2019-12-17 | 2020-04-28 | 深圳市梦网百科信息技术有限公司 | 一种基于网络中心度的商品推送方法、系统及终端设备 |
CN111080411B (zh) * | 2019-12-17 | 2023-09-15 | 深圳市梦网视讯有限公司 | 一种基于网络中心度的商品推送方法、系统及终端设备 |
CN113065882A (zh) * | 2020-01-02 | 2021-07-02 | 阿里巴巴集团控股有限公司 | 一种商品处理方法、装置及电子设备 |
Also Published As
Publication number | Publication date |
---|---|
CN110544140B (zh) | 2024-08-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20120109946A1 (en) | Determination of category information using multiple | |
CN110363604B (zh) | 页面生成方法和装置 | |
CN110020162B (zh) | 用户识别方法和装置 | |
CN107463675B (zh) | 数据处理方法及其系统 | |
CN110473043B (zh) | 一种基于用户行为的物品推荐方法和装置 | |
CN107423356A (zh) | 评价信息的处理方法及装置、计算机可读介质、电子设备 | |
CN109146533B (zh) | 信息推送方法和装置 | |
CN110298716A (zh) | 信息推送方法和装置 | |
CN110827101B (zh) | 一种店铺推荐的方法和装置 | |
CN109727047A (zh) | 一种确定数据关联度的方法和装置、数据推荐方法和装置 | |
CN112749323A (zh) | 一种构建用户画像的方法和装置 | |
CN110544140A (zh) | 一种处理浏览数据的方法和装置 | |
CN110232581B (zh) | 一种为用户提供优惠券的方法和装置 | |
CN110599281A (zh) | 一种确定目标店铺的方法和装置 | |
CN110490682B (zh) | 分析商品属性的方法和装置 | |
CN112784861A (zh) | 相似度的确定方法、装置、电子设备和存储介质 | |
CN107357847B (zh) | 数据处理方法及其装置 | |
CN111833085A (zh) | 一种计算物品价格的方法和装置 | |
CN110956514A (zh) | 一种生成订单信息的方法和装置 | |
CN110838019A (zh) | 确定试用品发放人群的方法和装置 | |
CN113313542B (zh) | 一种推送频道页面的方法和装置 | |
CN114677174A (zh) | 一种计算未上架物品销量的方法和装置 | |
CN110378714B (zh) | 一种处理访问数据的方法和装置 | |
CN113763080A (zh) | 推荐物品的确定方法、装置、电子设备和存储介质 | |
CN113762535A (zh) | 一种物品召回方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |