CN115131070B - 一种在线商品预定量虚标的识别及处理方法及装置 - Google Patents
一种在线商品预定量虚标的识别及处理方法及装置 Download PDFInfo
- Publication number
- CN115131070B CN115131070B CN202210812954.7A CN202210812954A CN115131070B CN 115131070 B CN115131070 B CN 115131070B CN 202210812954 A CN202210812954 A CN 202210812954A CN 115131070 B CN115131070 B CN 115131070B
- Authority
- CN
- China
- Prior art keywords
- commodity
- preset quantity
- list
- preset
- item
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0207—Discounts or incentives, e.g. coupons or rebates
- G06Q30/0225—Avoiding frauds
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Accounting & Taxation (AREA)
- Development Economics (AREA)
- Finance (AREA)
- Databases & Information Systems (AREA)
- Strategic Management (AREA)
- General Physics & Mathematics (AREA)
- Entrepreneurship & Innovation (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Economics (AREA)
- Game Theory and Decision Science (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及大数据分析处理领域,具体提供了一种在线商品预定量虚标的识别及处理方法,具有如下步骤:S1、电商大促期间预定量相关数据分析采集;S2、判断电商平台是否虚标预定量;S3、估算真实预定量。与现有技术相比,本发明根据电商大促活动期间,在网络零售平台采集的商品预定量相关信息,判断预定量是否真实,并预估真实的预定量水平,为消费者网上购物、商家备货营销、市场监管部门合规监管、相关部门宏观决策以及其他销售分析提供数据支撑。
Description
技术领域
本发明涉及大数据分析处理领域,具体提供一种在线商品预定量虚标的识别及处理方法及装置。
背景技术
近年来,我国电子商务迅速发展,电商预售越来越普遍。早期,预售主要是面向商品定制生产,预付金有合同金性质,用以约束消费者,防止违约;随后,“双11”、“618”等电商大促活动当天流量迸发导致服务器宕机,预售成为电商平台缓解服务器压力的有效方式,同时也使得商家提前获取市场需求,有更长的时间针对性地备货;使得物流效率大幅提升,改善了用户体验。但随着预售的普及,问题也逐步显现,部分电商平台以及商家为了让活动看起来更加火爆、商品看起来更加抢手,虚标抬高预定量,对消费者购买决策造成诱导,对合规经营的商家、政府部门了解真实市场需求造成扰动。
对于虚假销售行为,目前已有一定的研究成果,但研究主要针对的是日常经营中商家层面的“刷单”。预定量虚标与“刷单”不同,一般发生在电商大促活动中,是电商平台层面的虚标行为,且无模拟交易过程,影响范围、数据特征与“刷单”不同,无法套用“刷单”的处理方法。随着电商促销活动越来越频繁,预售活动越来越普遍,建立在线商品预定量虚标的识别及处理系统是进行网络零售监测、统计、分析必须解决且亟待解决的问题。
发明内容
本发明是针对上述现有技术的不足,提供一种实用性强的在线商品预定量虚标的识别及处理方法。
本发明进一步的技术任务是提供一种设计合理,安全适用的在线商品预定量虚标的识别及处理装置。
本发明解决其技术问题所采用的技术方案是:
一种在线商品预定量虚标的识别及处理方法,具有如下步骤:
S1、电商大促期间预定量相关数据分析采集;
S2、判断电商平台是否虚标预定量;
S3、估算真实预定量。
进一步的,在步骤S1中,分析电商大促活动期间购物网站后台数据,识别商品预售信息,利用爬虫技术,获取商品详情页面商品预售信息,获取电商平台预售榜单数据,将所述商品预售信息和预售榜单数据存储在数据库中。
进一步的,在步骤S2中,首先,网站后台数据中有展示预定量、真实预定量2种不同的预定量字段,则商品预定量认定虚标;
其次,用电商平台的商品详情页预定量与榜单数据对比验证。
进一步的,用电商平台的商品详情页预定量与榜单数据对比验证时,若存在下列情形之一,则电商平台商品预定量认定虚标:
①记同一商品详情页、榜单预定量分别为VC、VB,VC>2*VB;
②商品详情页预定量排名与榜单预定量排名不一致,记商品M在详情页、榜单预定量排名分别为OMC、OMB,商品N在详情页、榜单预定量排名分别为ONC、ONB,OMC>ONC且OMB<ONB。
进一步的,在步骤S2中,对标竞品电商平台预定量数据,若存在下列情形之一,则电商平台预定量也认定为虚标:
①绘制预定量直方图,对比预定量过万的商品分布,组距相同的情况下电商平台随着预定量的提高,频数有增长趋势,而竞品平台为逐步降低;
②筛选全网预定量同比增速高于200%的品牌,多个品牌在电商平台的预定量与在竞品电商平台存在量级差距;记品牌P在电商平台A和竞品平台B的预定量分别为VPA、VPB,预定量同比增速分别为GPA、GPB,VPA≥10*VPB且GPA≥10*GPB。
进一步的,用商品预定量环比验证,若百个以上预定量过万件的商品出现多次环比下降或一次性环比下降幅度较大的情况,则电商平台预定量认定虚标。
进一步的,在步骤S3中,确定电商平台存在预定量虚标的情况后,针对网站后台是否有真实预定量采取不同的处理方法,若网站后台有真实预定量,则用采集到的真实预定量替代;
若无真实预定量,则视具体情况采用比例法、去重法处理。
进一步的,所述比例法为若预售榜单公布了各品类预定量且能通过爬虫技术获取,则用比例法处理;
具体方法为:第一步,计算各品类的调整系数,记品类i商品j的榜单预定量为Vij,展示预定量为Wij,则品类i的调整系数为Ri=∑Vij/∑Wij;
第二步,计算单个商品的预估预定量。记品类i榜单上预定量最低的商品预定量为Li,品类i商品j的预估预定量为TVij,则①品类i商品j为榜单商品,TVij=Vij;②品类i商品j不是榜单商品且Wij≥100,TVij=min(Li,round(Wij*Ri,0));③品类i商品j不是榜单商品且Wij≤100,TVij=min(Li,Wij)。
进一步的,所述去重法为若预售榜单未公布预定量或预售榜单预定量无法获取,则用去重法处理,仅处理预定量超过百件的商品;
记店铺i商品j预定量为Vij,Vij的位数为x,记round(Vij/10x-2,0)为NVij,同一店铺下,按NVij去重,即处理结果中店铺i中所有商品的NVij均不同。
一种在线商品预定量虚标的识别及处理装置,包括:至少一个存储器和至少一个处理器;
所述至少一个存储器,用于存储机器可读程序;
所述至少一个处理器,用于调用所述机器可读程序,执行一种在线商品预定量虚标的识别及处理方法。
本发明的一种在线商品预定量虚标的识别及处理方法及装置和现有技术相比,具有以下突出的有益效果:
本发明根据电商大促活动期间,在网络零售平台采集的商品预定量相关信息,判断预定量是否真实,并预估真实的预定量水平,为消费者网上购物、商家备货营销、市场监管部门合规监管、相关部门宏观决策以及其他销售分析提供数据支撑。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
附图1是一种在线商品预定量虚标的识别及处理方法的流程示意图。
具体实施方式
为了使本技术领域的人员更好的理解本发明的方案,下面结合具体的实施方式对本发明作进一步的详细说明。显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例都属于本发明保护的范围。
下面给出一个最佳实施例:
如图1所示,本实施例中的一种在线商品预定量虚标的识别及处理方法,具有如下步骤:
S1、电商大促期间预定量相关数据分析采集;
分析电商大促活动期间购物网站后台数据,识别商品预售信息。利用爬虫技术,获取商品详情页面商品预售信息,包含商品id、店铺id、商品名称、商品原价、标示价格、页面预定量、真实预定量(若有)、类目信息等;
另外,获取电商平台预售榜单数据,包含榜单类目、商品id、商品名称、预定量(若有)、排名等,将采集数据储存到数据库中。
S2、判断电商平台是否虚标预定量;
首先,网站后台数据中有展示预定量、真实预定量2种不同的预定量字段,则商品预定量认定虚标。
其次,用电商平台的商品详情页预定量与榜单数据对比验证,若存在下列情形之一,则电商平台商品预定量认定虚标:
②记同一商品详情页、榜单预定量分别为VC、VB,VC>2*VB;
②商品详情页预定量排名与榜单预定量排名不一致,记商品M在详情页、榜单预定量排名分别为OMC、OMB,商品N在详情页、榜单预定量排名分别为ONC、ONB,OMC>ONC且OMB<ONB。
对标竞品电商平台预定量数据,若存在下列情形之一,则电商平台预定量也认定为虚标:
①绘制预定量直方图,对比预定量过万的商品分布,组距相同的情况下电商平台随着预定量的提高,频数有增长趋势,而竞品平台为逐步降低;
②筛选全网预定量同比增速高于200%的品牌,多个品牌在电商平台的预定量与在竞品电商平台存在量级差距;记品牌P在电商平台A和竞品平台B的预定量分别为VPA、VPB,预定量同比增速分别为GPA、GPB,VPA≥10*VPB且GPA≥10*GPB。
最后,用商品预定量环比验证,若百个以上预定量过万件的商品出现多次环比下降或一次性环比下降幅度较大的情况,则电商平台预定量认定虚标。
S3、估算真实是预定量:
确定电商平台存在预定量虚标的情况后,针对网站后台是否有真实预定量采取不同的处理方法,若网站后台有真实预定量,则用采集到的真实预定量替代;若无真实预定量,则视具体情况采用比例法、去重法处理。
所述比例法为若预售榜单公布了各品类预定量且能通过爬虫技术获取,则用比例法处理;
具体方法为:第一步,计算各品类的调整系数,记品类i商品j的榜单预定量为Vij,展示预定量为Wij,则品类i的调整系数为Ri=∑Vij/∑Wij;
第二步,计算单个商品的预估预定量。记品类i榜单上预定量最低的商品预定量为Li,品类i商品j的预估预定量为TVij,则①品类i商品j为榜单商品,TVij=Vij;②品类i商品j不是榜单商品且Wij≥100,TVij=min(Li,round(Wij*Ri,0));③品类i商品j不是榜单商品且Wij≤100,TVij=min(Li,Wij)。
所述去重法为若预售榜单未公布预定量或预售榜单预定量无法获取,则用去重法处理,仅处理预定量超过百件的商品;
记店铺i商品j预定量为Vij,Vij的位数为x,记round(Vij/10x-2,0)为NVij,同一店铺下,按NVij去重,即处理结果中店铺i中所有商品的NVij均不同。
基于上述方法,本实施例中的一种在线商品预定量虚标的识别及处理装置,包括:至少一个存储器和至少一个处理器;
所述至少一个存储器,用于存储机器可读程序;
所述至少一个处理器,用于调用所述机器可读程序,执行一种在线商品预定量虚标的识别及处理方法。
上述具体的实施方式仅是本发明具体的个案,本发明的专利保护范围包括但不限于上述具体的实施方式,任何符合本发明的一种在线商品预定量虚标的识别及处理方法及装置权利要求书的且任何所述技术领域普通技术人员对其做出的适当变化或者替换,皆应落入本发明的专利保护范围。
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。
Claims (5)
1.一种在线商品预定量虚标的识别及处理方法,其特征在于,具有如下步骤:
S1、电商大促期间预定量相关数据分析采集;
分析电商大促活动期间购物网站后台数据,识别商品预售信息,利用爬虫技术,获取商品详情页面商品预售信息,获取电商平台预售榜单数据,将所述商品预售信息和预售榜单数据存储在数据库中;
S2、判断电商平台是否虚标预定量;
对标竞品电商平台预定量数据,若存在下列情形之一,则电商平台预定量认定为虚标:
①绘制预定量直方图,对比预定量过万的商品分布,组距相同的情况下电商平台随着预定量的提高,频数有增长趋势,而竞品电商平台为逐步降低;
②筛选全网预定量同比增速高于200%的品牌,多个品牌在电商平台的预定量与在竞品电商平台存在量级差距;记品牌P在电商平台A和竞品平台B的预定量分别为VPA、VPB,预定量同比增速分别为GPA、GPB,VPA≥10*VPB且GPA≥10*GPB;
S3、估算真实预定量;
确定电商平台存在预定量虚标的情况后,针对网站后台是否有真实预定量采取不同的处理方法,若网站后台有真实预定量,则用采集到的真实预定量替代;
若无真实预定量,则视具体情况采用比例法、去重法处理;
所述比例法为若预售榜单公布了各品类预定量且能通过爬虫技术获取,则用比例法处理;
具体方法为:第一步,计算各品类的调整系数,记品类i商品j的榜单预定量为Vij,展示预定量为Wij,则品类i的调整系数为Ri=∑Vij/∑Wij;
第二步,计算单个商品的预估预定量,记品类i榜单上预定量最低的商品预定量为Li,品类i商品j的预估预定量为TVij,则①品类i商品j为榜单商品,TVij=Vij;②品类i商品j不是榜单商品且Wij≥100,TVij=min(Li,round(Wij*Ri,0));③品类i商品j不是榜单商品且Wij≤100,TVij=min(Li,Wij);
所述去重法为若预售榜单未公布预定量或预售榜单预定量无法获取,则用去重法处理,仅处理预定量超过百件的商品;
记店铺Z商品j预定量为VZj,VZj的位数为x,记round(VZj/10x-2,0)为NVZj,同一店铺下,按NVZj去重,即处理结果中店铺Z中所有商品的NVZj均不同。
2.根据权利要求1所述的一种在线商品预定量虚标的识别及处理方法,其特征在于,在步骤S2中,首先,网站后台数据中有展示预定量、真实预定量2种不同的预定量字段,则商品预定量认定虚标;
其次,用电商平台的商品详情页预定量与榜单数据对比验证。
3.根据权利要求1所述的一种在线商品预定量虚标的识别及处理方法,其特征在于,用电商平台的商品详情页预定量与榜单数据对比验证时,若存在下列情形之一,则电商平台商品预定量认定虚标:
①记同一商品详情页、榜单预定量分别为VC、VB,VC>2*VB;
②商品详情页预定量排名与榜单预定量排名不一致,记商品M在详情页、榜单预定量排名分别为OMC、OMB,商品N在详情页、榜单预定量排名分别为ONC、ONB,OMC>ONC且OMB<ONB。
4.根据权利要求3所述的一种在线商品预定量虚标的识别及处理方法,其特征在于,用商品预定量环比验证,若百个以上预定量过万件的商品出现多次环比下降或一次性环比下降幅度较大的情况,则电商平台预定量认定虚标。
5.一种在线商品预定量虚标的识别及处理装置,其特征在于,包括:至少一个存储器和至少一个处理器;
所述至少一个存储器,用于存储机器可读程序;
所述至少一个处理器,用于调用所述机器可读程序,执行权利要求1至4中任一所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210812954.7A CN115131070B (zh) | 2022-07-12 | 2022-07-12 | 一种在线商品预定量虚标的识别及处理方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210812954.7A CN115131070B (zh) | 2022-07-12 | 2022-07-12 | 一种在线商品预定量虚标的识别及处理方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115131070A CN115131070A (zh) | 2022-09-30 |
CN115131070B true CN115131070B (zh) | 2023-07-18 |
Family
ID=83384176
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210812954.7A Active CN115131070B (zh) | 2022-07-12 | 2022-07-12 | 一种在线商品预定量虚标的识别及处理方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115131070B (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105912642A (zh) * | 2016-04-08 | 2016-08-31 | 世纪禾光科技发展(北京)有限公司 | 产品价格数据采集方法及系统 |
WO2017128359A1 (zh) * | 2016-01-30 | 2017-08-03 | 深圳市博信诺达经贸咨询有限公司 | 基于大数据的电商平台分析方法及系统 |
CN108428153A (zh) * | 2018-03-12 | 2018-08-21 | 上海哔哩哔哩科技有限公司 | 预售商品的策略调整方法、服务器及策略调整系统 |
CN111275528A (zh) * | 2020-01-20 | 2020-06-12 | 可可奇货(深圳)科技有限公司 | 一种基于大众参与的商品信息产生和管理平台 |
CN113393245A (zh) * | 2021-06-21 | 2021-09-14 | 浪潮卓数大数据产业发展有限公司 | 基于电商运营数据识别刷单店铺的预警方法及系统 |
CN113763077A (zh) * | 2020-07-24 | 2021-12-07 | 北京沃东天骏信息技术有限公司 | 用于检测虚假交易订单的方法和装置 |
-
2022
- 2022-07-12 CN CN202210812954.7A patent/CN115131070B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017128359A1 (zh) * | 2016-01-30 | 2017-08-03 | 深圳市博信诺达经贸咨询有限公司 | 基于大数据的电商平台分析方法及系统 |
CN105912642A (zh) * | 2016-04-08 | 2016-08-31 | 世纪禾光科技发展(北京)有限公司 | 产品价格数据采集方法及系统 |
CN108428153A (zh) * | 2018-03-12 | 2018-08-21 | 上海哔哩哔哩科技有限公司 | 预售商品的策略调整方法、服务器及策略调整系统 |
CN111275528A (zh) * | 2020-01-20 | 2020-06-12 | 可可奇货(深圳)科技有限公司 | 一种基于大众参与的商品信息产生和管理平台 |
CN113763077A (zh) * | 2020-07-24 | 2021-12-07 | 北京沃东天骏信息技术有限公司 | 用于检测虚假交易订单的方法和装置 |
CN113393245A (zh) * | 2021-06-21 | 2021-09-14 | 浪潮卓数大数据产业发展有限公司 | 基于电商运营数据识别刷单店铺的预警方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN115131070A (zh) | 2022-09-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107578281B (zh) | 电子商务环境下用户优惠券行为预测方法及模型构建方法 | |
CN110009372B (zh) | 一种用户风险识别方法和装置 | |
US20150332414A1 (en) | System and method for predicting items purchased based on transaction data | |
US8170998B2 (en) | Methods, systems, and computer program products for estimating accuracy of linking of customer relationships | |
JP5337174B2 (ja) | 需要予測装置、及びそのプログラム | |
KR101794221B1 (ko) | 온라인 판매자의 정산 서비스를 위한 시스템 및 방법 | |
EP2074564A2 (en) | Diamond valuation method, apparatus and computer readable medium product | |
CN113393245A (zh) | 基于电商运营数据识别刷单店铺的预警方法及系统 | |
CN117010953A (zh) | 一种商城积分兑换系统 | |
CN112396433A (zh) | 基于留评人行为识别虚假商品评论的方法及系统 | |
CN116739652A (zh) | 一种服装电商销量预测建模方法 | |
CN117236996B (zh) | 一种基于大数据分析的用户行为预测方法和系统 | |
CN115994767A (zh) | 基于电子商务的产品供应链管理系统 | |
CN116611796B (zh) | 一种店铺交易数据的异常检测方法及装置 | |
KR101729714B1 (ko) | 기술 가치 평가 장치, 방법 및 이를 위한 프로그램이 기록된 컴퓨터로 읽을 수 있는 기록매체 | |
TWI747290B (zh) | 客戶分群服務客製化行銷方法及系統 | |
CN116934418B (zh) | 一种异常订单的检测预警方法、系统、设备及存储介质 | |
CN115131070B (zh) | 一种在线商品预定量虚标的识别及处理方法及装置 | |
TWM587310U (zh) | 金融商品之潛在購買客群篩選系統 | |
CN116503130A (zh) | 基于电子商务的账户风险评估系统 | |
CN116402525A (zh) | 一种仓储货物自动化估值方法、装置、设备及存储介质 | |
CN115456679A (zh) | 一种网络零售店铺指标体系的分析方法、装置及介质 | |
CN114626888A (zh) | 网络购物平台的恶意刷单行为预测方法 | |
KR100738899B1 (ko) | 신용카드 결제 시스템을 이용한 창업 및 경영 지원 서비스제공 시스템 | |
CN113780799A (zh) | 一种商品经销商服务弱项的识别评估方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |