CN117035822A - 基于大数据的电子商务产业带统计方法及系统 - Google Patents
基于大数据的电子商务产业带统计方法及系统 Download PDFInfo
- Publication number
- CN117035822A CN117035822A CN202310974854.9A CN202310974854A CN117035822A CN 117035822 A CN117035822 A CN 117035822A CN 202310974854 A CN202310974854 A CN 202310974854A CN 117035822 A CN117035822 A CN 117035822A
- Authority
- CN
- China
- Prior art keywords
- commerce
- industry
- commerce industry
- data
- band
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000007619 statistical method Methods 0.000 title claims abstract description 10
- 238000012216 screening Methods 0.000 claims abstract description 62
- 238000000034 method Methods 0.000 claims abstract description 13
- 238000007781 pre-processing Methods 0.000 claims abstract description 13
- 238000012545 processing Methods 0.000 claims abstract description 9
- 238000011161 development Methods 0.000 claims description 23
- 230000008901 benefit Effects 0.000 claims description 18
- 230000002159 abnormal effect Effects 0.000 claims description 13
- 238000004220 aggregation Methods 0.000 claims description 12
- 230000002776 aggregation Effects 0.000 claims description 12
- 238000012795 verification Methods 0.000 claims description 8
- 238000007726 management method Methods 0.000 claims description 6
- 230000001737 promoting effect Effects 0.000 claims description 6
- 238000011156 evaluation Methods 0.000 claims description 5
- 238000002360 preparation method Methods 0.000 claims description 2
- 238000013480 data collection Methods 0.000 claims 1
- 238000012544 monitoring process Methods 0.000 abstract description 4
- 238000009472 formulation Methods 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 230000003014 reinforcing effect Effects 0.000 description 2
- 230000006399 behavior Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2455—Query execution
- G06F16/24564—Applying rules; Deductive queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06393—Score-carding, benchmarking or key performance indicator [KPI] analysis
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Human Resources & Organizations (AREA)
- Development Economics (AREA)
- Strategic Management (AREA)
- Entrepreneurship & Innovation (AREA)
- Theoretical Computer Science (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Economics (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Game Theory and Decision Science (AREA)
- Data Mining & Analysis (AREA)
- Educational Administration (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- Computational Linguistics (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了基于大数据的电子商务产业带统计方法及系统,属于大数据处理技术领域,要解决的技术问题为如何通过对网络零售数据的监测统计、找出电子商务产业带。包括如下步骤:确定电商产业带定义相关的多个维度的指标;基于配置的指标,采集相关数据,相关包括网络零售数据,并对采集的相关数据进行数据预处理,并将预处理后相关数据存储至数据库中;基于采集的相关数据制定电商产业带的筛选规则,每个维度的指标对应有相关的筛选规则;基于筛选规则进行电商产业带筛选,并对筛选出的电商产业带进行打分和验证。
Description
技术领域
本发明涉及大数据处理技术领域,具体地说是基于大数据的电子商务产业带统计方法及系统。
背景技术
近年来,随着电子商务的迅猛发展,网络购物成为新的消费形态,也逐渐成长为经济增长的新力量。电商产业带是一条带状的链条产业集中区域,是相关或相同的电商产业的基地,在此区域内可以形成电商产业集聚效应,更好的壮大产业。在这产业带里资源会更有效地利用和配置,产业带的形成是区域经济发展的一个显著特征。在产业带形成初期,企业区位行为受环境条件的影响,而表现为向某一优势区位集中,进而发展成若干城市工业集中区,企业在运营过程中又由中心向外沿轴线扩散,这两种空间过程既相互推动又相互制约,便形成了产业带。电商产业带涵盖了电子商务企业、物流配送企业、金融支付企业、信息技术服务企业等相关产业的集聚区域。这些企业之间相互依存、相互促进,形成了一条完整的产业链,从而形成了一个具有竞争力和优势的电商生态系统。
如何通过对网络零售数据的监测统计、找出电子商务产业带,是需要解决的技术问题。
发明内容
本发明的技术任务是针对以上不足,提供基于大数据的电子商务产业带统计方法及系统,来解决如何通过对网络零售数据的监测统计、找出电子商务产业带的技术问题。
第一方面,本发明一种基于大数据的电子商务产业带统计方法,包括如下步骤:
确定电商产业带定义相关的多个维度的指标;
基于配置的指标,采集相关数据,相关包括网络零售数据,并对采集的相关数据进行数据预处理,并将预处理后相关数据存储至数据库中;
基于采集的相关数据制定电商产业带的筛选规则,每个维度的指标对应有相关的筛选规则;
基于筛选规则进行电商产业带筛选,并对筛选出的电商产业带进行打分和验证。
作为优选,确定电商产业带定义的相关指标包括:
地理位置,电商产业带集中在某个地理区域,地理区域具有符合预设条件的基础设施、交通网络、物流和供应链体系;
企业数量,电商产业带内具有预定数量的电商企业,包括电商平台、电商服务提供商以及物流公司;
人才聚集,电商产业带具有多种人员,包括技术开发人员、市场营销人员和物流管理人员;
政策支持,电商产业带内政府提供支持,包括税收优惠和知识产权保护;
经济效益,电商产业带能够为当前地理位置的经济提供贡献,包括创造就业机会以及促进消费增长。
作为优选,基于电子商务平台,通过互联网爬虫技术采集网络零售数据,所述网络零售数据包括店铺id、店铺名称、店铺所在地、商品发货地、评分、商品名称、价格、评价以及销量;
对采集的相关进行数据预处理,包括如下步骤:
按照规划的统一标准,对各电商平台采集的网络零售数据进行标准化,并进行各个指标的计算;
对于异常的数据,进行异常值的筛选和处理,形成每个电商平台的商品明细表和店铺明细表;
根据采集到的电商企业工商注册信息,得到企业的地理位置分布情况和城市的电商企业数量;
根据采集到的电商企业的参保人数获得企业员工数量;
对于政策支持对应的数据,采集政策类网站的信息,识别出各城市与电商相关的政策数量和政策等级;
根据采集店铺的销售额,统计城市中电商产业带来销售额数据,根据店铺的网络零售规模,推算店铺电子商务方面店铺经营以及物流的从业人数,得到带动就业的数量。
作为优选,制定电商产业带的筛选规则时,执行如下操作:
对于地理位置,优先考虑电商产业同属于一个城市情况;
对于企业数量,设定城市电商企业数量大于5000家;
对于人才聚集,设定城市电商企业人员数量大于2万人,或一级大类的企业人员数量大于4000人,其中,一级大类包括日用品、服装和家电;
对于政策支持,设定最近3年政府发布的电商方面政策数量大于20;
对于经济效益,设定电商产业年网络零售额大于1亿元,电商从业人数大于2万人,对于某一行业的产业带,筛选规则在整个电商产业带的基础上进行预定数量的下降。
作为优选,对于筛选出的符合筛选规则的城市电商产业带,每一个维度的指标设置权重和评分标准,计算电商产业带的总体分值,总体分值高于阈值的电商产业带发展较好,总体分值低于阈值的电商产业带发展不好或者还未达到电商产业带,从行业角度来看,虽然某些城市整体电商产业发展还不足、但在某个特定行业的发展较好;
对筛选出的电商产业带进行人工验证,识别出最终的电商产业带。
第二方面,本发明一种基于大数据的电子商务产业带统计系统,用于通过如第一方面任一项所述的基于大数据的电子商务产业带统计方法统计电子商务产业带,所述系统包括:
指标制定模块,所述指标制定模块用于确定电商产业带定义相关的多个维度的指标;
数据采集模块,所述数据采集模块用于基于配置的指标,采集相关数据,相关包括网络零售数据,并对采集的相关数据进行数据预处理,并将预处理后相关数据存储至数据库中;
筛选规则配置模块,所述筛选规则配置模块用于基于采集的相关数据制定电商产业带的筛选规则,每个维度的指标对应有相关的筛选规则;
打分验证模块,所述打分验证模块用于基于筛选规则进行电商产业带筛选,并对筛选出的电商产业带进行打分和验证。
作为优选,确定电商产业带定义的相关指标包括:
地理位置,电商产业带集中在某个地理区域,地理区域具有符合预设条件的基础设施、交通网络、物流和供应链体系;
企业数量,电商产业带内具有预定数量的电商企业,包括电商平台、电商服务提供商以及物流公司;
人才聚集,电商产业带具有多种人员,包括技术开发人员、市场营销人员和物流管理人员;
政策支持,电商产业带内政府提供支持,包括税收优惠和知识产权保护;
经济效益,电商产业带能够为当前地理位置的经济提供贡献,包括创造就业机会以及促进消费增长。
作为优选,所述数据采集模块用于基于电子商务平台、通过互联网爬虫技术采集网络零售数据,所述网络零售数据包括店铺id、店铺名称、店铺所在地、商品发货地、评分、商品名称、价格、评价以及销量;
所述数据采集模块用于执行如下对采集的相关进行数据预处理:
按照规划的统一标准,对各电商平台采集的网络零售数据进行标准化,并进行各个指标的计算;
对于异常的数据,进行异常值的筛选和处理,形成每个电商平台的商品明细表和店铺明细表;
根据采集到的电商企业工商注册信息,得到企业的地理位置分布情况和城市的电商企业数量;
根据采集到的电商企业的参保人数获得企业员工数量;
对于政策支持对应的数据,采集政策类网站的信息,识别出各城市与电商相关的政策数量和政策等级;
根据采集店铺的销售额,统计城市中电商产业带来销售额数据,根据店铺的网络零售规模,推算店铺电子商务方面店铺经营以及物流的从业人数,得到带动就业的数量。
作为优选,制定电商产业带的筛选规则时,所述筛选规则配置模块用于执行如下操作:
对于地理位置,优先考虑电商产业同属于一个城市情况;
对于企业数量,设定城市电商企业数量大于5000家;
对于人才聚集,设定城市电商企业人员数量大于2万人,或一级大类的企业人员数量大于4000人,其中,一级大类包括日用品、服装和家电;
对于政策支持,设定最近3年政府发布的电商方面政策数量大于20;
对于经济效益,设定电商产业年网络零售额大于1亿元,电商从业人数大于2万人,对于某一行业的产业带,筛选规则在整个电商产业带的基础上进行预定数量的下降。
作为优选,对于筛选出的符合筛选规则的城市电商产业带,所述打分验证模块用于执行如下:
为每一个维度的指标设置权重和评分标准,计算电商产业带的总体分值,总体分值高于阈值的电商产业带发展较好,总体分值低于阈值的电商产业带发展不好或者还未达到电商产业带,从行业角度来看,虽然某些城市整体电商产业发展还不足、但在某个特定行业的发展较好;
对筛选出的电商产业带进行人工验证,识别出最终的电商产业带。
本发明的基于大数据的电子商务产业带统计方法及系统具有以下优点:
1、基于制定的维度,采集网络零售数据,对于每个维度,基于设定的筛选规则进行筛选、打分和验证,得到电商产业带,提高了筛选的速度和准确性,得到的电商产业带,能给当地政府提供建议,因地制宜推出适合的扶持和推动发展的政策,更好的发展当地的电商产业,在电商产业带中,各类企业可以通过资源共享、技术创新、市场开拓等方式实现协同发展,提高整体竞争力和影响力;
2、对于采集的数据进行预处理,去除异常值并进行标准化,提高了后续数据处理的速度。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
下面结合附图对本发明进一步说明。
图1为实施例1一种基于大数据的电子商务产业带统计方法的流程框图。
具体实施方式
下面结合附图和具体实施例对本发明作进一步说明,以使本领域的技术人员可以更好地理解本发明并能予以实施,但所举实施例不作为对本发明的限定,在不冲突的情况下,本发明实施例以及实施例中的技术特征可以相互结合。
本发明实施例提供基于大数据的电子商务产业带统计方法及系统,用于解决如何通过对网络零售数据的监测统计、找出电子商务产业带的技术问题。
实施例1:
本发明一种基于大数据的电子商务产业带统计方法,包括如下步骤:
S100、确定电商产业带定义相关的多个维度的指标;
S200、基于配置的指标,采集相关数据,相关包括网络零售数据,并对采集的相关数据进行数据预处理,并将预处理后相关数据存储至数据库中;
S300、基于采集的相关数据制定电商产业带的筛选规则,每个维度的指标对应有相关的筛选规则;
S400、基于筛选规则进行电商产业带筛选,并对筛选出的电商产业带进行打分和验证。
本实施例步骤S100确定电商产业带定义的相关指标。要识别一个电商产业带,可以从地理位置、企业数量、人才聚集、政策支持和经济效益几个方面考虑。
地理位置:电商产业带通常会集中在某个地理区域内,例如中国的杭州、深圳等地就是电商产业带的代表。这些地区通常具有良好的基础设施和交通网络,以及便捷的物流和供应链体系。
企业数量:电商产业带内通常有大量的电商企业,包括电商平台、电商服务提供商、物流公司等。这些企业之间通常存在着紧密的合作关系,形成了完整的产业链。
人才聚集:电商产业需要各种各样的人才,包括技术开发人员、市场营销人员、物流管理人员等。因此,电商产业带通常会吸引大量的人才聚集在该地区。
政策支持:政府通常会对电商产业进行支持和鼓励,例如提供税收优惠、加强知识产权保护等。因此,电商产业带通常也会受到政府的重视和支持。
经济效益:电商产业带通常会为当地经济带来显著的贡献,包括创造就业机会、促进消费增长等。因此,电商产业带通常也是当地经济发展的重要引擎之一。
本实施例步骤S200获取相关数据和数据整理。通过互联网爬虫技术采集数据,可以采集全国主要的电子商务平台,获取这些平台上网络经营店铺的数据和店铺经营商品数据,包含店铺id、店铺名称、店铺所在地、商品发货地、评分、商品名称、价格、评价、销量等,并存储到数据库中。对采集的相关进行数据预处理,包括如下:
(1)按照规划的统一标准,对各电商平台采集的网络零售数据进行标准化,并进行各个指标的计算;
(2)对于异常的数据,进行异常值的筛选和处理,形成每个电商平台的商品明细表和店铺明细表;
(3)根据采集到的电商企业工商注册信息,得到企业的地理位置分布情况和城市的电商企业数量;
(4)根据采集到的电商企业的参保人数获得企业员工数量;
(5)对于政策支持对应的数据,采集政策类网站的信息,识别出各城市与电商相关的政策数量和政策等级;
(6)根据采集店铺的销售额,统计城市中电商产业带来销售额数据,根据店铺的网络零售规模,推算店铺电子商务方面店铺经营以及物流的从业人数,得到带动就业的数量。
上述预处理后的相关数据存储至数据库中。
步骤S300结合采集的相关数据制定电商产业带的筛选规则。通过以上整理的各维度数据,综合所有城市的具体情况,制定每个维度筛选规则,举例说明,地理位置方面优先考虑电商产业同属于一个城市情况,方便数据的比较。企业数量方面,城市电商企业数量大于5000家。人才聚集情况,城市电商企业人员数量大于2万人,或某个一级大类(日用品、服装、家电等)的企业人员数量大于4000人。政策支持方面,最近3年政府发布的电商方面政策数量大于20。经济效益方面电商产业年网络零售额大于1亿元,电商从业人数大于2万人。对于某一行业的产业带,筛选规则在整个电商产业带的基础上下降一些。
步骤S400对筛选出的电商产业带进行打分和验证。对筛选出的符合基本规则的城市电商产业带,每一个维度设置权重和评分标准,计算电商产业带总体分值,总体分值较高的电商产业带发展较好,总体分值较低的产业发展还不好,或者还未达到电商产业带。也可以从行业角度来看,虽然某些城市整体电商产业发展还不足,但在某个特定行业的发展较好。最后对筛选出的产业带进行人工验证,识别出确实符合的产业带。
实施例2:
本发明一种基于大数据的电子商务产业带统计系统,包括指标制定模块、数据采集模块、筛选规则配置模块以及打分验证模块,该系统可执行实施例1公开的方法来统计电子商务产业带。
指标制定模块用于确定电商产业带定义相关的多个维度的指标。
本实施例中,指标制定模块确定电商产业带定义的相关指标。要识别一个电商产业带,可以从地理位置、企业数量、人才聚集、政策支持和经济效益几个方面考虑。
地理位置:电商产业带通常会集中在某个地理区域内,例如中国的杭州、深圳等地就是电商产业带的代表。这些地区通常具有良好的基础设施和交通网络,以及便捷的物流和供应链体系。
企业数量:电商产业带内通常有大量的电商企业,包括电商平台、电商服务提供商、物流公司等。这些企业之间通常存在着紧密的合作关系,形成了完整的产业链。
人才聚集:电商产业需要各种各样的人才,包括技术开发人员、市场营销人员、物流管理人员等。因此,电商产业带通常会吸引大量的人才聚集在该地区。
政策支持:政府通常会对电商产业进行支持和鼓励,例如提供税收优惠、加强知识产权保护等。因此,电商产业带通常也会受到政府的重视和支持。
经济效益:电商产业带通常会为当地经济带来显著的贡献,包括创造就业机会、促进消费增长等。因此,电商产业带通常也是当地经济发展的重要引擎之一。
数据采集模块用于基于配置的指标,采集相关数据,相关包括网络零售数据,并对采集的相关数据进行数据预处理,并将预处理后相关数据存储至数据库中。
本实施例中,数据采集模块用于获取相关数据和数据整理。具体执行如下进行数据采集:通过互联网爬虫技术采集数据,可以采集全国主要的电子商务平台,获取这些平台上网络经营店铺的数据和店铺经营商品数据,包含店铺id、店铺名称、店铺所在地、商品发货地、评分、商品名称、价格、评价、销量等,并存储到数据库中。
该数据采集模块还用于执行如下对采集的相关进行数据预处理:
(1)按照规划的统一标准,对各电商平台采集的网络零售数据进行标准化,并进行各个指标的计算;
(2)对于异常的数据,进行异常值的筛选和处理,形成每个电商平台的商品明细表和店铺明细表;
(3)根据采集到的电商企业工商注册信息,得到企业的地理位置分布情况和城市的电商企业数量;
(4)根据采集到的电商企业的参保人数获得企业员工数量;
(5)对于政策支持对应的数据,采集政策类网站的信息,识别出各城市与电商相关的政策数量和政策等级;
(6)根据采集店铺的销售额,统计城市中电商产业带来销售额数据,根据店铺的网络零售规模,推算店铺电子商务方面店铺经营以及物流的从业人数,得到带动就业的数量。
上述预处理后的相关数据存储至数据库中。
筛选规则配置模块用于基于采集的相关数据制定电商产业带的筛选规则,每个维度的指标对应有相关的筛选规则。
本实施例中筛选规则配置模块用于结合采集的相关数据制定电商产业带的筛选规则。通过以上整理的各维度数据,综合所有城市的具体情况,制定每个维度筛选规则,举例说明,地理位置方面优先考虑电商产业同属于一个城市情况,方便数据的比较。企业数量方面,城市电商企业数量大于5000家。人才聚集情况,城市电商企业人员数量大于2万人,或某个一级大类(日用品、服装、家电等)的企业人员数量大于4000人。政策支持方面,最近3年政府发布的电商方面政策数量大于20。经济效益方面电商产业年网络零售额大于1亿元,电商从业人数大于2万人。对于某一行业的产业带,筛选规则在整个电商产业带的基础上下降一些。
打分验证模块用于基于筛选规则进行电商产业带筛选,并对筛选出的电商产业带进行打分和验证。
本实施例中打分验证模块用于对筛选出的电商产业带进行打分和验证。对筛选出的符合基本规则的城市电商产业带,每一个维度设置权重和评分标准,计算电商产业带总体分值,总体分值较高的电商产业带发展较好,总体分值较低的产业发展还不好,或者还未达到电商产业带。也可以从行业角度来看,虽然某些城市整体电商产业发展还不足,但在某个特定行业的发展较好。最后对筛选出的产业带进行人工验证,识别出确实符合的产业带。
上文通过附图和优选实施例对本发明进行了详细展示和说明,然而本发明不限于这些已揭示的实施例,基与上述多个实施例本领域技术人员可以知晓,可以组合上述不同实施例中的手段得到本发明更多的实施例,这些实施例也在本发明的保护范围之内。
Claims (10)
1.一种基于大数据的电子商务产业带统计方法,其特征在于,包括如下步骤:
确定电商产业带定义相关的多个维度的指标;
基于配置的指标,采集相关数据,相关包括网络零售数据,并对采集的相关数据进行数据预处理,并将预处理后相关数据存储至数据库中;
基于采集的相关数据制定电商产业带的筛选规则,每个维度的指标对应有相关的筛选规则;
基于筛选规则进行电商产业带筛选,并对筛选出的电商产业带进行打分和验证。
2.根据权利要求1所述的基于大数据的电子商务产业带统计方法,其特征在于,确定电商产业带定义的相关指标包括:
地理位置,电商产业带集中在某个地理区域,地理区域具有符合预设条件的基础设施、交通网络、物流和供应链体系;
企业数量,电商产业带内具有预定数量的电商企业,包括电商平台、电商服务提供商以及物流公司;
人才聚集,电商产业带具有多种人员,包括技术开发人员、市场营销人员和物流管理人员;
政策支持,电商产业带内政府提供支持,包括税收优惠和知识产权保护;
经济效益,电商产业带能够为当前地理位置的经济提供贡献,包括创造就业机会以及促进消费增长。
3.根据权利要求2所述的基于大数据的电子商务产业带统计方法,其特征在于,基于电子商务平台,通过互联网爬虫技术采集网络零售数据,所述网络零售数据包括店铺id、店铺名称、店铺所在地、商品发货地、评分、商品名称、价格、评价以及销量;
对采集的相关进行数据预处理,包括如下步骤:
按照规划的统一标准,对各电商平台采集的网络零售数据进行标准化,并进行各个指标的计算;
对于异常的数据,进行异常值的筛选和处理,形成每个电商平台的商品明细表和店铺明细表;
根据采集到的电商企业工商注册信息,得到企业的地理位置分布情况和城市的电商企业数量;
根据采集到的电商企业的参保人数获得企业员工数量;
对于政策支持对应的数据,采集政策类网站的信息,识别出各城市与电商相关的政策数量和政策等级;
根据采集店铺的销售额,统计城市中电商产业带来销售额数据,根据店铺的网络零售规模,推算店铺电子商务方面店铺经营以及物流的从业人数,得到带动就业的数量。
4.根据权利要求2所述的基于大数据的电子商务产业带统计方法,其特征在于,制定电商产业带的筛选规则时,执行如下操作:
对于地理位置,优先考虑电商产业同属于一个城市情况;
对于企业数量,设定城市电商企业数量大于5000家;
对于人才聚集,设定城市电商企业人员数量大于2万人,或一级大类的企业人员数量大于4000人,其中,一级大类包括日用品、服装和家电;
对于政策支持,设定最近3年政府发布的电商方面政策数量大于20;
对于经济效益,设定电商产业年网络零售额大于1亿元,电商从业人数大于2万人,对于某一行业的产业带,筛选规则在整个电商产业带的基础上进行预定数量的下降。
5.根据权利要求1-4任一项所述的基于大数据的电子商务产业带统计方法,其特征在于,对于筛选出的符合筛选规则的城市电商产业带,每一个维度的指标设置权重和评分标准,计算电商产业带的总体分值,总体分值高于阈值的电商产业带发展较好,总体分值低于阈值的电商产业带发展不好或者还未达到电商产业带,从行业角度来看,虽然某些城市整体电商产业发展还不足、但在某个特定行业的发展较好;
对筛选出的电商产业带进行人工验证,识别出最终的电商产业带。
6.一种基于大数据的电子商务产业带统计系统,其特征在于,用于通过如权利要求1-5任一项所述的基于大数据的电子商务产业带统计方法统计电子商务产业带,所述系统包括:
指标制定模块,所述指标制定模块用于确定电商产业带定义相关的多个维度的指标;
数据采集模块,所述数据采集模块用于基于配置的指标,采集相关数据,相关包括网络零售数据,并对采集的相关数据进行数据预处理,并将预处理后相关数据存储至数据库中;
筛选规则配置模块,所述筛选规则配置模块用于基于采集的相关数据制定电商产业带的筛选规则,每个维度的指标对应有相关的筛选规则;
打分验证模块,所述打分验证模块用于基于筛选规则进行电商产业带筛选,并对筛选出的电商产业带进行打分和验证。
7.根据权利要求6所述的基于大数据的电子商务产业带统计系统,其特征在于,确定电商产业带定义的相关指标包括:
地理位置,电商产业带集中在某个地理区域,地理区域具有符合预设条件的基础设施、交通网络、物流和供应链体系;
企业数量,电商产业带内具有预定数量的电商企业,包括电商平台、电商服务提供商以及物流公司;
人才聚集,电商产业带具有多种人员,包括技术开发人员、市场营销人员和物流管理人员;
政策支持,电商产业带内政府提供支持,包括税收优惠和知识产权保护;
经济效益,电商产业带能够为当前地理位置的经济提供贡献,包括创造就业机会以及促进消费增长。
8.根据权利要求7所述的基于大数据的电子商务产业带统计系统,其特征在于,所述数据采集模块用于基于电子商务平台、通过互联网爬虫技术采集网络零售数据,所述网络零售数据包括店铺id、店铺名称、店铺所在地、商品发货地、评分、商品名称、价格、评价以及销量;
所述数据采集模块用于执行如下对采集的相关进行数据预处理:
按照规划的统一标准,对各电商平台采集的网络零售数据进行标准化,并进行各个指标的计算;
对于异常的数据,进行异常值的筛选和处理,形成每个电商平台的商品明细表和店铺明细表;
根据采集到的电商企业工商注册信息,得到企业的地理位置分布情况和城市的电商企业数量;
根据采集到的电商企业的参保人数获得企业员工数量;
对于政策支持对应的数据,采集政策类网站的信息,识别出各城市与电商相关的政策数量和政策等级;
根据采集店铺的销售额,统计城市中电商产业带来销售额数据,根据店铺的网络零售规模,推算店铺电子商务方面店铺经营以及物流的从业人数,得到带动就业的数量。
9.根据权利要求7所述的基于大数据的电子商务产业带统计系统,其特征在于,制定电商产业带的筛选规则时,所述筛选规则配置模块用于执行如下操作:
对于地理位置,优先考虑电商产业同属于一个城市情况;
对于企业数量,设定城市电商企业数量大于5000家;
对于人才聚集,设定城市电商企业人员数量大于2万人,或一级大类的企业人员数量大于4000人,其中,一级大类包括日用品、服装和家电;
对于政策支持,设定最近3年政府发布的电商方面政策数量大于20;
对于经济效益,设定电商产业年网络零售额大于1亿元,电商从业人数大于2万人,对于某一行业的产业带,筛选规则在整个电商产业带的基础上进行预定数量的下降。
10.根据权利要求6-9任一项所述的基于大数据的电子商务产业带统计系统,其特征在于,对于筛选出的符合筛选规则的城市电商产业带,所述打分验证模块用于执行如下:
为每一个维度的指标设置权重和评分标准,计算电商产业带的总体分值,总体分值高于阈值的电商产业带发展较好,总体分值低于阈值的电商产业带发展不好或者还未达到电商产业带,从行业角度来看,虽然某些城市整体电商产业发展还不足、但在某个特定行业的发展较好;
对筛选出的电商产业带进行人工验证,识别出最终的电商产业带。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310974854.9A CN117035822A (zh) | 2023-08-04 | 2023-08-04 | 基于大数据的电子商务产业带统计方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310974854.9A CN117035822A (zh) | 2023-08-04 | 2023-08-04 | 基于大数据的电子商务产业带统计方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117035822A true CN117035822A (zh) | 2023-11-10 |
Family
ID=88623801
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310974854.9A Pending CN117035822A (zh) | 2023-08-04 | 2023-08-04 | 基于大数据的电子商务产业带统计方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117035822A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117763422A (zh) * | 2023-12-25 | 2024-03-26 | 北京燃数科技有限公司 | 一种涉及解决投资策略的SaaS投研系统 |
-
2023
- 2023-08-04 CN CN202310974854.9A patent/CN117035822A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117763422A (zh) * | 2023-12-25 | 2024-03-26 | 北京燃数科技有限公司 | 一种涉及解决投资策略的SaaS投研系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9978021B2 (en) | Database management and presentation processing of a graphical user interface | |
US7921118B2 (en) | Methods and systems for developing market intelligence | |
Karam et al. | Analysis of the barriers to implementing horizontal collaborative transport using a hybrid fuzzy Delphi-AHP approach | |
US20120203708A1 (en) | Using non-public shipper records to facilitate rating an entity based on public records of supply transactions | |
CN102906686A (zh) | 针对金融投资决策而评估供应交易的公共记录 | |
Charoenwong et al. | Trade and foreign economic policy uncertainty in supply chain networks: Who comes home? | |
CN111861595A (zh) | 一种基于知识图谱的循环开票风险识别方法 | |
AU2004214245B2 (en) | Cascaded planning of an enterprise planning model | |
CN107609771A (zh) | 一种供应商价值评价方法 | |
CN117035822A (zh) | 基于大数据的电子商务产业带统计方法及系统 | |
CN112116256A (zh) | 一种数据资产管理方法 | |
KR100469495B1 (ko) | 지리정보를 이용한 마케팅 지원 서비스방법 | |
Wiedenmann et al. | Supply risk identification in manufacturing supply networks | |
CN116542631A (zh) | 一种分布式架构企业信息管理系统 | |
CN115456745A (zh) | 小微企业画像构建方法及装置 | |
Ahmad et al. | Value stream mapping with lean thinking model for effective non-value added identification, evaluation and solution processes | |
Diana et al. | Performance indicators for urban public transport systems with a focus on transport policy effectiveness issues | |
WO2019112064A1 (ja) | 商標価値算出装置 | |
CN115481938A (zh) | 地区电商发展水平的评价方法及系统 | |
Martins | Redesign of a sustainable food bank supply chain | |
KR102432126B1 (ko) | 데이터 이활용에 관한 데이터 준비 방법 및 데이터 이활용 시스템 | |
CN113641725A (zh) | 信息展示方法、装置、设备及存储介质 | |
CN113191857A (zh) | 一种基于大数据的云平台电子商务数据处理方法及系统 | |
CN111932131A (zh) | 业务数据处理方法及装置 | |
CN109359185A (zh) | 一种兼职智能搜索排序方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |