CN115131070B - 一种在线商品预定量虚标的识别及处理方法及装置 - Google Patents

一种在线商品预定量虚标的识别及处理方法及装置 Download PDF

Info

Publication number
CN115131070B
CN115131070B CN202210812954.7A CN202210812954A CN115131070B CN 115131070 B CN115131070 B CN 115131070B CN 202210812954 A CN202210812954 A CN 202210812954A CN 115131070 B CN115131070 B CN 115131070B
Authority
CN
China
Prior art keywords
commodity
preset quantity
list
preset
item
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210812954.7A
Other languages
English (en)
Other versions
CN115131070A (zh
Inventor
吕巧燕
单震
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chaozhou Zhuoshu Big Data Industry Development Co Ltd
Original Assignee
Chaozhou Zhuoshu Big Data Industry Development Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chaozhou Zhuoshu Big Data Industry Development Co Ltd filed Critical Chaozhou Zhuoshu Big Data Industry Development Co Ltd
Priority to CN202210812954.7A priority Critical patent/CN115131070B/zh
Publication of CN115131070A publication Critical patent/CN115131070A/zh
Application granted granted Critical
Publication of CN115131070B publication Critical patent/CN115131070B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0207Discounts or incentives, e.g. coupons or rebates
    • G06Q30/0225Avoiding frauds
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Finance (AREA)
  • Databases & Information Systems (AREA)
  • Strategic Management (AREA)
  • General Physics & Mathematics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • Game Theory and Decision Science (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及大数据分析处理领域,具体提供了一种在线商品预定量虚标的识别及处理方法,具有如下步骤:S1、电商大促期间预定量相关数据分析采集;S2、判断电商平台是否虚标预定量;S3、估算真实预定量。与现有技术相比,本发明根据电商大促活动期间,在网络零售平台采集的商品预定量相关信息,判断预定量是否真实,并预估真实的预定量水平,为消费者网上购物、商家备货营销、市场监管部门合规监管、相关部门宏观决策以及其他销售分析提供数据支撑。

Description

一种在线商品预定量虚标的识别及处理方法及装置
技术领域
本发明涉及大数据分析处理领域,具体提供一种在线商品预定量虚标的识别及处理方法及装置。
背景技术
近年来,我国电子商务迅速发展,电商预售越来越普遍。早期,预售主要是面向商品定制生产,预付金有合同金性质,用以约束消费者,防止违约;随后,“双11”、“618”等电商大促活动当天流量迸发导致服务器宕机,预售成为电商平台缓解服务器压力的有效方式,同时也使得商家提前获取市场需求,有更长的时间针对性地备货;使得物流效率大幅提升,改善了用户体验。但随着预售的普及,问题也逐步显现,部分电商平台以及商家为了让活动看起来更加火爆、商品看起来更加抢手,虚标抬高预定量,对消费者购买决策造成诱导,对合规经营的商家、政府部门了解真实市场需求造成扰动。
对于虚假销售行为,目前已有一定的研究成果,但研究主要针对的是日常经营中商家层面的“刷单”。预定量虚标与“刷单”不同,一般发生在电商大促活动中,是电商平台层面的虚标行为,且无模拟交易过程,影响范围、数据特征与“刷单”不同,无法套用“刷单”的处理方法。随着电商促销活动越来越频繁,预售活动越来越普遍,建立在线商品预定量虚标的识别及处理系统是进行网络零售监测、统计、分析必须解决且亟待解决的问题。
发明内容
本发明是针对上述现有技术的不足,提供一种实用性强的在线商品预定量虚标的识别及处理方法。
本发明进一步的技术任务是提供一种设计合理,安全适用的在线商品预定量虚标的识别及处理装置。
本发明解决其技术问题所采用的技术方案是:
一种在线商品预定量虚标的识别及处理方法,具有如下步骤:
S1、电商大促期间预定量相关数据分析采集;
S2、判断电商平台是否虚标预定量;
S3、估算真实预定量。
进一步的,在步骤S1中,分析电商大促活动期间购物网站后台数据,识别商品预售信息,利用爬虫技术,获取商品详情页面商品预售信息,获取电商平台预售榜单数据,将所述商品预售信息和预售榜单数据存储在数据库中。
进一步的,在步骤S2中,首先,网站后台数据中有展示预定量、真实预定量2种不同的预定量字段,则商品预定量认定虚标;
其次,用电商平台的商品详情页预定量与榜单数据对比验证。
进一步的,用电商平台的商品详情页预定量与榜单数据对比验证时,若存在下列情形之一,则电商平台商品预定量认定虚标:
①记同一商品详情页、榜单预定量分别为VC、VB,VC>2*VB;
②商品详情页预定量排名与榜单预定量排名不一致,记商品M在详情页、榜单预定量排名分别为OMC、OMB,商品N在详情页、榜单预定量排名分别为ONC、ONB,OMC>ONC且OMB<ONB
进一步的,在步骤S2中,对标竞品电商平台预定量数据,若存在下列情形之一,则电商平台预定量也认定为虚标:
①绘制预定量直方图,对比预定量过万的商品分布,组距相同的情况下电商平台随着预定量的提高,频数有增长趋势,而竞品平台为逐步降低;
②筛选全网预定量同比增速高于200%的品牌,多个品牌在电商平台的预定量与在竞品电商平台存在量级差距;记品牌P在电商平台A和竞品平台B的预定量分别为VPA、VPB,预定量同比增速分别为GPA、GPB,VPA≥10*VPB且GPA≥10*GPB
进一步的,用商品预定量环比验证,若百个以上预定量过万件的商品出现多次环比下降或一次性环比下降幅度较大的情况,则电商平台预定量认定虚标。
进一步的,在步骤S3中,确定电商平台存在预定量虚标的情况后,针对网站后台是否有真实预定量采取不同的处理方法,若网站后台有真实预定量,则用采集到的真实预定量替代;
若无真实预定量,则视具体情况采用比例法、去重法处理。
进一步的,所述比例法为若预售榜单公布了各品类预定量且能通过爬虫技术获取,则用比例法处理;
具体方法为:第一步,计算各品类的调整系数,记品类i商品j的榜单预定量为Vij,展示预定量为Wij,则品类i的调整系数为Ri=∑Vij/∑Wij
第二步,计算单个商品的预估预定量。记品类i榜单上预定量最低的商品预定量为Li,品类i商品j的预估预定量为TVij,则①品类i商品j为榜单商品,TVij=Vij;②品类i商品j不是榜单商品且Wij≥100,TVij=min(Li,round(Wij*Ri,0));③品类i商品j不是榜单商品且Wij≤100,TVij=min(Li,Wij)。
进一步的,所述去重法为若预售榜单未公布预定量或预售榜单预定量无法获取,则用去重法处理,仅处理预定量超过百件的商品;
记店铺i商品j预定量为Vij,Vij的位数为x,记round(Vij/10x-2,0)为NVij,同一店铺下,按NVij去重,即处理结果中店铺i中所有商品的NVij均不同。
一种在线商品预定量虚标的识别及处理装置,包括:至少一个存储器和至少一个处理器;
所述至少一个存储器,用于存储机器可读程序;
所述至少一个处理器,用于调用所述机器可读程序,执行一种在线商品预定量虚标的识别及处理方法。
本发明的一种在线商品预定量虚标的识别及处理方法及装置和现有技术相比,具有以下突出的有益效果:
本发明根据电商大促活动期间,在网络零售平台采集的商品预定量相关信息,判断预定量是否真实,并预估真实的预定量水平,为消费者网上购物、商家备货营销、市场监管部门合规监管、相关部门宏观决策以及其他销售分析提供数据支撑。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
附图1是一种在线商品预定量虚标的识别及处理方法的流程示意图。
具体实施方式
为了使本技术领域的人员更好的理解本发明的方案,下面结合具体的实施方式对本发明作进一步的详细说明。显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例都属于本发明保护的范围。
下面给出一个最佳实施例:
如图1所示,本实施例中的一种在线商品预定量虚标的识别及处理方法,具有如下步骤:
S1、电商大促期间预定量相关数据分析采集;
分析电商大促活动期间购物网站后台数据,识别商品预售信息。利用爬虫技术,获取商品详情页面商品预售信息,包含商品id、店铺id、商品名称、商品原价、标示价格、页面预定量、真实预定量(若有)、类目信息等;
另外,获取电商平台预售榜单数据,包含榜单类目、商品id、商品名称、预定量(若有)、排名等,将采集数据储存到数据库中。
S2、判断电商平台是否虚标预定量;
首先,网站后台数据中有展示预定量、真实预定量2种不同的预定量字段,则商品预定量认定虚标。
其次,用电商平台的商品详情页预定量与榜单数据对比验证,若存在下列情形之一,则电商平台商品预定量认定虚标:
②记同一商品详情页、榜单预定量分别为VC、VB,VC>2*VB;
②商品详情页预定量排名与榜单预定量排名不一致,记商品M在详情页、榜单预定量排名分别为OMC、OMB,商品N在详情页、榜单预定量排名分别为ONC、ONB,OMC>ONC且OMB<ONB
对标竞品电商平台预定量数据,若存在下列情形之一,则电商平台预定量也认定为虚标:
①绘制预定量直方图,对比预定量过万的商品分布,组距相同的情况下电商平台随着预定量的提高,频数有增长趋势,而竞品平台为逐步降低;
②筛选全网预定量同比增速高于200%的品牌,多个品牌在电商平台的预定量与在竞品电商平台存在量级差距;记品牌P在电商平台A和竞品平台B的预定量分别为VPA、VPB,预定量同比增速分别为GPA、GPB,VPA≥10*VPB且GPA≥10*GPB
最后,用商品预定量环比验证,若百个以上预定量过万件的商品出现多次环比下降或一次性环比下降幅度较大的情况,则电商平台预定量认定虚标。
S3、估算真实是预定量:
确定电商平台存在预定量虚标的情况后,针对网站后台是否有真实预定量采取不同的处理方法,若网站后台有真实预定量,则用采集到的真实预定量替代;若无真实预定量,则视具体情况采用比例法、去重法处理。
所述比例法为若预售榜单公布了各品类预定量且能通过爬虫技术获取,则用比例法处理;
具体方法为:第一步,计算各品类的调整系数,记品类i商品j的榜单预定量为Vij,展示预定量为Wij,则品类i的调整系数为Ri=∑Vij/∑Wij
第二步,计算单个商品的预估预定量。记品类i榜单上预定量最低的商品预定量为Li,品类i商品j的预估预定量为TVij,则①品类i商品j为榜单商品,TVij=Vij;②品类i商品j不是榜单商品且Wij≥100,TVij=min(Li,round(Wij*Ri,0));③品类i商品j不是榜单商品且Wij≤100,TVij=min(Li,Wij)。
所述去重法为若预售榜单未公布预定量或预售榜单预定量无法获取,则用去重法处理,仅处理预定量超过百件的商品;
记店铺i商品j预定量为Vij,Vij的位数为x,记round(Vij/10x-2,0)为NVij,同一店铺下,按NVij去重,即处理结果中店铺i中所有商品的NVij均不同。
基于上述方法,本实施例中的一种在线商品预定量虚标的识别及处理装置,包括:至少一个存储器和至少一个处理器;
所述至少一个存储器,用于存储机器可读程序;
所述至少一个处理器,用于调用所述机器可读程序,执行一种在线商品预定量虚标的识别及处理方法。
上述具体的实施方式仅是本发明具体的个案,本发明的专利保护范围包括但不限于上述具体的实施方式,任何符合本发明的一种在线商品预定量虚标的识别及处理方法及装置权利要求书的且任何所述技术领域普通技术人员对其做出的适当变化或者替换,皆应落入本发明的专利保护范围。
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。

Claims (5)

1.一种在线商品预定量虚标的识别及处理方法,其特征在于,具有如下步骤:
S1、电商大促期间预定量相关数据分析采集;
分析电商大促活动期间购物网站后台数据,识别商品预售信息,利用爬虫技术,获取商品详情页面商品预售信息,获取电商平台预售榜单数据,将所述商品预售信息和预售榜单数据存储在数据库中;
S2、判断电商平台是否虚标预定量;
对标竞品电商平台预定量数据,若存在下列情形之一,则电商平台预定量认定为虚标:
①绘制预定量直方图,对比预定量过万的商品分布,组距相同的情况下电商平台随着预定量的提高,频数有增长趋势,而竞品电商平台为逐步降低;
②筛选全网预定量同比增速高于200%的品牌,多个品牌在电商平台的预定量与在竞品电商平台存在量级差距;记品牌P在电商平台A和竞品平台B的预定量分别为VPA、VPB,预定量同比增速分别为GPA、GPB,VPA≥10*VPB且GPA≥10*GPB
S3、估算真实预定量;
确定电商平台存在预定量虚标的情况后,针对网站后台是否有真实预定量采取不同的处理方法,若网站后台有真实预定量,则用采集到的真实预定量替代;
若无真实预定量,则视具体情况采用比例法、去重法处理;
所述比例法为若预售榜单公布了各品类预定量且能通过爬虫技术获取,则用比例法处理;
具体方法为:第一步,计算各品类的调整系数,记品类i商品j的榜单预定量为Vij,展示预定量为Wij,则品类i的调整系数为Ri=∑Vij/∑Wij
第二步,计算单个商品的预估预定量,记品类i榜单上预定量最低的商品预定量为Li,品类i商品j的预估预定量为TVij,则①品类i商品j为榜单商品,TVij=Vij;②品类i商品j不是榜单商品且Wij≥100,TVij=min(Li,round(Wij*Ri,0));③品类i商品j不是榜单商品且Wij≤100,TVij=min(Li,Wij);
所述去重法为若预售榜单未公布预定量或预售榜单预定量无法获取,则用去重法处理,仅处理预定量超过百件的商品;
记店铺Z商品j预定量为VZj,VZj的位数为x,记round(VZj/10x-2,0)为NVZj,同一店铺下,按NVZj去重,即处理结果中店铺Z中所有商品的NVZj均不同。
2.根据权利要求1所述的一种在线商品预定量虚标的识别及处理方法,其特征在于,在步骤S2中,首先,网站后台数据中有展示预定量、真实预定量2种不同的预定量字段,则商品预定量认定虚标;
其次,用电商平台的商品详情页预定量与榜单数据对比验证。
3.根据权利要求1所述的一种在线商品预定量虚标的识别及处理方法,其特征在于,用电商平台的商品详情页预定量与榜单数据对比验证时,若存在下列情形之一,则电商平台商品预定量认定虚标:
①记同一商品详情页、榜单预定量分别为VC、VB,VC>2*VB;
②商品详情页预定量排名与榜单预定量排名不一致,记商品M在详情页、榜单预定量排名分别为OMC、OMB,商品N在详情页、榜单预定量排名分别为ONC、ONB,OMC>ONC且OMB<ONB
4.根据权利要求3所述的一种在线商品预定量虚标的识别及处理方法,其特征在于,用商品预定量环比验证,若百个以上预定量过万件的商品出现多次环比下降或一次性环比下降幅度较大的情况,则电商平台预定量认定虚标。
5.一种在线商品预定量虚标的识别及处理装置,其特征在于,包括:至少一个存储器和至少一个处理器;
所述至少一个存储器,用于存储机器可读程序;
所述至少一个处理器,用于调用所述机器可读程序,执行权利要求1至4中任一所述的方法。
CN202210812954.7A 2022-07-12 2022-07-12 一种在线商品预定量虚标的识别及处理方法及装置 Active CN115131070B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210812954.7A CN115131070B (zh) 2022-07-12 2022-07-12 一种在线商品预定量虚标的识别及处理方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210812954.7A CN115131070B (zh) 2022-07-12 2022-07-12 一种在线商品预定量虚标的识别及处理方法及装置

Publications (2)

Publication Number Publication Date
CN115131070A CN115131070A (zh) 2022-09-30
CN115131070B true CN115131070B (zh) 2023-07-18

Family

ID=83384176

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210812954.7A Active CN115131070B (zh) 2022-07-12 2022-07-12 一种在线商品预定量虚标的识别及处理方法及装置

Country Status (1)

Country Link
CN (1) CN115131070B (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105912642A (zh) * 2016-04-08 2016-08-31 世纪禾光科技发展(北京)有限公司 产品价格数据采集方法及系统
WO2017128359A1 (zh) * 2016-01-30 2017-08-03 深圳市博信诺达经贸咨询有限公司 基于大数据的电商平台分析方法及系统
CN108428153A (zh) * 2018-03-12 2018-08-21 上海哔哩哔哩科技有限公司 预售商品的策略调整方法、服务器及策略调整系统
CN111275528A (zh) * 2020-01-20 2020-06-12 可可奇货(深圳)科技有限公司 一种基于大众参与的商品信息产生和管理平台
CN113393245A (zh) * 2021-06-21 2021-09-14 浪潮卓数大数据产业发展有限公司 基于电商运营数据识别刷单店铺的预警方法及系统
CN113763077A (zh) * 2020-07-24 2021-12-07 北京沃东天骏信息技术有限公司 用于检测虚假交易订单的方法和装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017128359A1 (zh) * 2016-01-30 2017-08-03 深圳市博信诺达经贸咨询有限公司 基于大数据的电商平台分析方法及系统
CN105912642A (zh) * 2016-04-08 2016-08-31 世纪禾光科技发展(北京)有限公司 产品价格数据采集方法及系统
CN108428153A (zh) * 2018-03-12 2018-08-21 上海哔哩哔哩科技有限公司 预售商品的策略调整方法、服务器及策略调整系统
CN111275528A (zh) * 2020-01-20 2020-06-12 可可奇货(深圳)科技有限公司 一种基于大众参与的商品信息产生和管理平台
CN113763077A (zh) * 2020-07-24 2021-12-07 北京沃东天骏信息技术有限公司 用于检测虚假交易订单的方法和装置
CN113393245A (zh) * 2021-06-21 2021-09-14 浪潮卓数大数据产业发展有限公司 基于电商运营数据识别刷单店铺的预警方法及系统

Also Published As

Publication number Publication date
CN115131070A (zh) 2022-09-30

Similar Documents

Publication Publication Date Title
CN107578281B (zh) 电子商务环境下用户优惠券行为预测方法及模型构建方法
CN110009372B (zh) 一种用户风险识别方法和装置
US20150332414A1 (en) System and method for predicting items purchased based on transaction data
US8170998B2 (en) Methods, systems, and computer program products for estimating accuracy of linking of customer relationships
JP5337174B2 (ja) 需要予測装置、及びそのプログラム
KR101794221B1 (ko) 온라인 판매자의 정산 서비스를 위한 시스템 및 방법
EP2074564A2 (en) Diamond valuation method, apparatus and computer readable medium product
CN113393245A (zh) 基于电商运营数据识别刷单店铺的预警方法及系统
CN117010953A (zh) 一种商城积分兑换系统
CN112396433A (zh) 基于留评人行为识别虚假商品评论的方法及系统
CN116739652A (zh) 一种服装电商销量预测建模方法
CN117236996B (zh) 一种基于大数据分析的用户行为预测方法和系统
CN115994767A (zh) 基于电子商务的产品供应链管理系统
CN116611796B (zh) 一种店铺交易数据的异常检测方法及装置
KR101729714B1 (ko) 기술 가치 평가 장치, 방법 및 이를 위한 프로그램이 기록된 컴퓨터로 읽을 수 있는 기록매체
TWI747290B (zh) 客戶分群服務客製化行銷方法及系統
CN116934418B (zh) 一种异常订单的检测预警方法、系统、设备及存储介质
CN115131070B (zh) 一种在线商品预定量虚标的识别及处理方法及装置
TWM587310U (zh) 金融商品之潛在購買客群篩選系統
CN116503130A (zh) 基于电子商务的账户风险评估系统
CN116402525A (zh) 一种仓储货物自动化估值方法、装置、设备及存储介质
CN115456679A (zh) 一种网络零售店铺指标体系的分析方法、装置及介质
CN114626888A (zh) 网络购物平台的恶意刷单行为预测方法
KR100738899B1 (ko) 신용카드 결제 시스템을 이용한 창업 및 경영 지원 서비스제공 시스템
CN113780799A (zh) 一种商品经销商服务弱项的识别评估方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant