CN114611959A - 一种基于o2o大数据技术的选品策略系统 - Google Patents
一种基于o2o大数据技术的选品策略系统 Download PDFInfo
- Publication number
- CN114611959A CN114611959A CN202210266101.8A CN202210266101A CN114611959A CN 114611959 A CN114611959 A CN 114611959A CN 202210266101 A CN202210266101 A CN 202210266101A CN 114611959 A CN114611959 A CN 114611959A
- Authority
- CN
- China
- Prior art keywords
- commodity
- store
- data
- information
- grid
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/067—Enterprise or organisation modelling
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/18—File system types
- G06F16/182—Distributed file systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0623—Item investigation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0639—Item locations
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- Finance (AREA)
- Accounting & Taxation (AREA)
- General Engineering & Computer Science (AREA)
- General Business, Economics & Management (AREA)
- Development Economics (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Entrepreneurship & Innovation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Educational Administration (AREA)
- Evolutionary Biology (AREA)
- Game Theory and Decision Science (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及大数据分析技术领域,公开了一种基于大数据技术的O2O平台选品分析方法,包括以下具体步骤:S1.根据待分析商品品类的所在行业,选择对应的O2O平台和对应的O2O平台模块,从对应的O2O平台模块的大数据中,获取待分析商品品类的相关门店及商品信息;S2.存储获取的待分析商品品类的相关门店及商品信息到大数据数据库中;S3.通过自动化算法对获取的相关门店及商品信息进行清洗,并获取清洗后的相关门店及商品信息;S4.将清洗后的相关门店及商品信息输入大数据数据库,整合大数据数据库中的现有数据,构建门店选品模型,并根据门店选品模型优化待分析商品品类的选品策略。本发明解决了现有技术不适用于O2O模式的品牌商连锁门店的精细化经营的问题。
Description
技术领域
本发明涉及大数据分析技术领域,更具体的,涉及一种基于大数据分析技术的O2O选品方法。
背景技术
对于线下渠道生意占比高的品牌商来说,建立可视化的“人、货、场”数据平台,运用数据对商业模式和技术进行革新等,才能更有效地适应新零售时代的零售运营。“新零售”是利用互联网和大数据,将“人、货、场”等传统商业要素进行重构的过程,包括重构生产流程、重构商家与消费者的关系、重构消费体验等。
传统零售中货品的选品全凭“经验”,选品确定后,在货品既定的前提下,通过有效组织、分类分层的陈列、导购或促销的方式卖更多的货,讲的是“怎么卖”的问题。新零售时代直接就是选什么样的货才能更好地销售,讲的是“卖什么”的问题。
因此,品牌商需要了解本品自身及竞品的市场规模,寻找潜力空白机会点,但缺少对应的工具,而且面对庞大的O2O(Online to Offline,或者Offline to Online,线上线下)融合市场,散落的数据和仅仅依靠门店人员的经验,没办法支撑精准制定的O2O铺货策略,以及结合线上线下门店进行精细化经营。
现有技术中公开了一种基于空间自回归模型的零售店铺画像构建方法及系统,所述方法包括以下步骤:包括:获取数据、数据预处理、确定基础类标签和分析类标签、构建店铺画像、店铺画像的可视化。然而现有技术仅仅是公开了针对画像闭环营销数据进行了分析,不适用于O2O模式的品牌商连锁门店的精细化经营;因此,如何发明一种应用广泛,适用与O2O模式的品牌商连锁门店的精细化经营的基于大数据分析技术的O2O选品方法,是本技术领域急需解决的问题。
发明内容
本发明为了解决现有技术不适用于O2O模式的品牌商连锁门店的精细化经营的问题,提供了一种基于大数据分析技术的O2O选品方法,其具有泛用性强,精确易用的特点。
为实现上述本发明目的,采用的技术方案如下:
一种基于大数据技术的O2O平台选品分析方法,包括以下具体步骤:
S1.根据待分析商品品类的所在行业,选择对应的O2O平台和对应的 O2O平台模块,从对应的O2O平台模块的大数据中,获取待分析商品品类的相关门店及商品信息;
S2.存储获取的待分析商品品类的相关门店及商品信息到大数据数据库中;
S3.通过自动化算法对获取的相关门店及商品信息进行清洗,并获取清洗后的相关门店及商品信息;
S4.将清洗后的相关门店及商品信息输入大数据数据库,整合大数据数据库中的现有数据,构建门店选品模型,并根据门店选品模型优化待分析商品品类的选品策略。
优选的,步骤S1,具体步骤为:
S101.根据待分析商品品类,选择其最优的O2O平台和其中最优的O2O 平台模块;
S102.选定待分析商品品类的市场区域,将选定的市场区域栅格化,提取每个栅格的中心经纬度,进入最优的O2O平台模块,输入虚拟定位的各个栅格的中心经纬度,并通过爬虫技术构建栅格的中心经纬度附近的推荐门店列表;
S103.进入对应的O2O平台模块的门店详情页面,并通过爬虫技术获取门店的详情数据;
S103.进入对应的O2O平台模块的商品详情页面,通过爬虫技术获取商品的详情数据。
进一步的,步骤S2,储存获取的待分析商品品类的所有相关门店及商品信息,具体步骤为:
S201.将收集到的所有相关门店及商品信息以csv数据上传HDFS;
S202.将HDFS数据以textfile格式load进临时表;
S203.复制所述的临时表中的数据,并以ORC格式写入正式表中;
S204.使用Sqoop或dataX工具将正式表中的数据同步到Hive工具中,完成大数据存储。
更进一步的,步骤S3,通过自动化算法对获取的相关门店及商品信息进行清洗,具体步骤为:
S301.对收集到的所有相关门店及商品信息进行自动去重,得到去重后的相关门店及商品信息;
S302.将去重后的相关门店及商品信息通过实体识别算法中进行切词,提取出商品的品类品牌信息;
S303.通过得到的品类品牌信息制作商品的品牌品类码表,并通过该码表对收集到的所有相关门店及商品信息进行分类;
S304.通过所述的品牌品类码表对数据库中的品类数据和品牌数据进行打码,并通过反复量化验证打码准确性,优化品牌品类码表;
S305.进一步筛选出核心品牌品类信息,通过优化的品牌品类码表,对码表中数据进行不同维度的反复标记,直到达到SKU级别的数据清洗结果。
更进一步的,步骤S301,具体步骤为:
T101.基于Hive,使用row_number开窗函数,按item_name,price, month_sale_count,store_id去重,得到去重后的相关门店及商品信息;
T102.通过待分析商品品类的关联业务的维表,规范化收集到的所有相关门店及商品信息中的字段;
T103.通过Json提取相关门店及商品信息中的重要字段;
T104.根据提取的重要字段,为去重后的相关门店及商品信息打上门店类型标签和商品类型标签;
T105.按照门店信息中的门店名称,构建门店对应的商品维表;
T106.基于所述的商品维表为商品信息打上商品品牌,品类标签;
T107.基于门店信息为门店信息打上门店品牌,品类标签;
T108.将商品信息关联门店信息,形成融合宽表;
T109.将门店融合数据另存为历史快照表。
更进一步的,步骤S4中所述大数据数据库中的现有数据还包括全国若干个城市的经济数据、地图栅格数据、各个栅格的人口指标数据以及对应的人群画像数据、全国POI数据。
更进一步的,步骤S4,结合大数据数据库中的现有数据构建门店选品模型,具体步骤为:
S401.根据清洗后的相关门店及商品信息、全国栅格信息、全国POI信息,筛选出没有O2O覆盖的栅格和已有O2O覆盖的栅格,并对栅格内的门店商品销售进行统计,获取已有O2O门店的栅格O2O潜力排行榜;
S402.分店铺类型统计已有O2O覆盖的栅格内的O2O商品销量和销售额统计,归一化所述的商品销量和销售额并加权平均其结果,筛选各店类型的高商品销售额的商品,并计算栅格-商品的评分矩阵;
S403.将没有O2O覆盖的栅格对应的多维经济数据、栅格POI数据、栅格的人口指标数、栅格对应的人群画像数据分别输入到机器学习模型中,并筛选出没有O2O覆盖的栅格中O2O潜力高的栅格;
S404.基于所述的栅格-商品评分矩阵和栅格中O2O潜力高的栅格,计算栅格余弦相似度矩阵之间的余弦相似度,得到相似栅格;
S405.通过栅格的协同过滤算法,得到已铺货O2O的黄金栅格,黄金栅格销量在前n的商品和与其相似的已有O2O覆盖的栅格卖得好但本栅格没卖的商品,并对O2O潜力高的没有O2O覆盖的栅格推荐其相似栅格销量在前n的商品;
S406.根据栅格-商品的评分矩阵,各个栅格中的商品评分与其若干个相似栅格的商品评分加权平均,得到每个栅格的商品推荐指数,并分店铺类型分栅格输出商品推荐列表。
更进一步的,步骤S403,具体步骤为:
V201.输入栅格POI数据和栅格人群画像数据到LGB模型和Xgboost模型中进行训练,并分别输出O2O销售潜力值;
V202.对比两个模型的准确率,选取准确率更高的模型作为O2O销售潜力的预测模型;
V203.将没有O2O覆盖的栅格对应的多维经济数据、栅格POI数据、栅格的人口指标数、栅格对应的人群画像数据分别输入到O2O销售潜力的预测模型,并输出O2O销售潜力排行榜。
更进一步的,步骤S4中门店选品模型可进行迭代优化,优化步骤为:
S301.收集投放后实际门店反馈的业务数据和效果数据,进行模型训练,建立自动调参模型,优化门店选品模型,得到优化后的门店选品模型,并进行性能和兼容性测试;
S302.对于优化后的门店选品模型,使用小规模流量的A/B测试,并持续评价模型效果;
S303.扩大测试的验证范围,进行全量测试,并评价优化后的门店选品模型效果,判断是否进行整体模型切换。
更进一步的,步骤S301中,优化门店选品模型,具体步骤为:
X101.对门店选品模型进行超参数优化,根据数据更新频率设置模型重新训练的定时器,使用GridSearchCV在模型训练中自动寻找最优超参数组合;
X102.对门店选品模型进行优化经验参数,根据反馈的业务数据和效果数据,调整商品推荐参数。
本发明的有益效果如下:
本发明根据待分析商品品类的所在行业,选择对应的O2O平台和对应的O2O 平台模块,并收录全国O2O平台相关数据,得到分析企业推荐的相关门店及商品信息;通过智能算法将推荐的相关门店及商品信息进行清洗,并结合大数据数据库构建门店选品模型,优化待分析商品品类的选品策略;由此,本发明解决了现有技术不适用于O2O模式的品牌商连锁门店的精细化经营的问题,且具有具有泛用性强,精确易用的特点。
附图说明
图1是本基于大数据技术的O2O平台选品分析方法的流程图。
图2是实施例2中本基于大数据技术的O2O平台选品分析方法的门店选品模型的具体流程图。
具体实施方式
下面结合附图和具体实施方式对本发明做详细描述。
实施例1
如图1所示,一种基于大数据技术的O2O平台选品分析方法,包括以下具体步骤:
S1.根据待分析商品品类的所在行业,选择对应的O2O平台和对应的O2O平台模块,从对应的O2O平台模块的大数据中,获取待分析商品品类的相关门店及商品信息;
S2.存储获取的待分析商品品类的相关门店及商品信息到大数据数据库中;
S3.通过自动化算法对获取的相关门店及商品信息进行清洗,并获取清洗后的相关门店及商品信息;
S4.将清洗后的相关门店及商品信息输入大数据数据库,整合大数据数据库中的现有数据,构建门店选品模型,并根据门店选品模型优化待分析商品品类的选品策略。
实施例2
如图1所示,一种基于大数据技术的O2O平台选品分析方法,包括以下具体步骤:
S1.根据待分析商品品类的所在行业,选择对应的O2O平台和对应的 O2O平台模块,从对应的O2O平台模块的大数据中,获取待分析商品品类的相关门店及商品信息;本实施例中,选择的O2O平台为美团外卖平台,所述的O2O平台模块为超市/便利店模块。
S2.存储获取的待分析商品品类的相关门店及商品信息到大数据数据库中;
S3.通过自动化算法对获取的相关门店及商品信息进行清洗,并获取清洗后的相关门店及商品信息;
S4.将清洗后的相关门店及商品信息输入大数据数据库,整合大数据数据库中的现有数据,构建门店选品模型,并根据门店选品模型优化待分析商品品类的选品策略。
在一个具体实施例中,步骤S1,具体步骤为:
S101.根据待分析商品品类,选择其最优的O2O平台和其中最优的O2O 平台模块;
S102.选定待分析商品品类的市场区域,将选定的市场区域栅格化,提取每个栅格的中心经纬度,进入最优的O2O平台模块,输入虚拟定位的各个栅格的中心经纬度,并通过爬虫技术构建栅格的中心经纬度附近的推荐门店列表;
本实施例中,待分析商品品类的市场区域为全中国区域。
本实施例中,通过爬虫技术获取的“为你推荐”的门店列表示例如下:
S103.进入对应的O2O平台模块的门店详情页面,并通过爬虫技术获取门店的详情数据;本实施例中,门店的详情数据示例如下表:
S103.进入对应的O2O平台模块的商品详情页面,通过爬虫技术获取商品的详情数据。本实施例中,商品的详情数据示例如下表:
在一个具体实施例中,步骤S2,储存获取的待分析商品品类的所有相关门店及商品信息,具体步骤为:
S201.将收集到的所有相关门店及商品信息以csv数据上传Hadoop分布式文件系统,即HDFS,中;
S202.将HDFS数据以textfile格式load进临时表;
S203.复制所述的临时表中的数据,并以ORC格式写入正式表中;
S204.使用Sqoop或dataX工具将正式表中的数据同步到Hive工具中,
完成大数据存储。
在一个具体实施例中,步骤S3,通过自动化算法对获取的相关门店及商品信息进行清洗,具体步骤为:
S301.对收集到的所有相关门店及商品信息进行自动去重,得到去重后的相关门店及商品信息;
S302.将去重后的相关门店及商品信息通过实体识别算法中进行切词,提取出商品的品类品牌信息;
S303.通过得到的品类品牌信息制作商品的品牌品类码表,并通过该码表对收集到的所有相关门店及商品信息进行分类;
S304.通过所述的品牌品类码表对数据库中的品类数据和品牌数据进行打码,并通过反复量化验证打码准确性,优化品牌品类码表;
S305.进一步筛选出核心品牌品类信息,通过优化的品牌品类码表,对码表中数据进行不同维度的反复标记,直到达到SKU级别的数据清洗结果。
在一个具体实施例中,步骤S301,具体步骤为:
T101.基于Hive,使用row_number开窗函数,按item_name,price, month_sale_count,store_id去重,得到去重后的相关门店及商品信息;
T102.通过待分析商品品类的关联业务的维表,规范化收集到的所有相关门店及商品信息中的字段;
T103.通过Json提取相关门店及商品信息中的重要字段;
T104.根据提取的重要字段,为去重后的相关门店及商品信息打上门店类型标签和商品类型标签;
T105.按照门店信息中的门店名称,构建门店对应的商品维表;
T106.基于所述的商品维表为商品信息打上商品品牌,品类标签;
T107.基于门店信息为门店信息打上门店品牌,品类标签;
T108.将商品信息关联门店信息,形成融合宽表;
T109.将门店融合数据另存为历史快照表。
本实施例中,提取的重要字段如下表所示:
实施例3
如图1所示,一种基于大数据技术的O2O平台选品分析方法,包括以下具体步骤:
S1.根据待分析商品品类的所在行业,选择对应的O2O平台和对应的 O2O平台模块,从对应的O2O平台模块的大数据中,获取待分析商品品类的相关门店及商品信息;
S2.存储获取的待分析商品品类的相关门店及商品信息到大数据数据库中;
S3.通过自动化算法对获取的相关门店及商品信息进行清洗,并获取清洗后的相关门店及商品信息;
S4.将清洗后的相关门店及商品信息输入大数据数据库,整合大数据数据库中的现有数据,构建门店选品模型,并根据门店选品模型优化待分析商品品类的选品策略。
在一个具体实施例中,步骤S1,具体步骤为:
S101.根据待分析商品品类,选择其最优的O2O平台和其中最优的O2O 平台模块;
S102.选定待分析商品品类的市场区域,将选定的市场区域栅格化,提取每个栅格的中心经纬度,进入最优的O2O平台模块,输入虚拟定位的各个栅格的中心经纬度,并通过爬虫技术构建栅格的中心经纬度附近的推荐门店列表;
本实施例中,待分析商品品类的市场区域为全中国区域。
S103.进入对应的O2O平台模块的门店详情页面,并通过爬虫技术获取门店的详情数据;
S103.进入对应的O2O平台模块的商品详情页面,通过爬虫技术获取商品的详情数据。
在一个具体实施例中,步骤S2,储存获取的待分析商品品类的所有相关门店及商品信息,具体步骤为:
S201.将收集到的所有相关门店及商品信息以csv数据上传HDFS;
S202.将HDFS数据以textfile格式load进临时表;
S203.复制所述的临时表中的数据,并以ORC格式写入正式表中;
S204.使用Sqoop或dataX工具将正式表中的数据同步到Hive工具中,
完成大数据存储。
在一个具体实施例中,步骤S3,通过自动化算法对获取的相关门店及商品信息进行清洗,具体步骤为:
S301.对收集到的所有相关门店及商品信息进行自动去重,得到去重后的相关门店及商品信息;
S302.将去重后的相关门店及商品信息通过实体识别算法中进行切词,提取出商品的品类品牌信息;
S303.通过得到的品类品牌信息制作商品的品牌品类码表,并通过该码表对收集到的所有相关门店及商品信息进行分类;
S304.通过所述的品牌品类码表对数据库中的品类数据和品牌数据进行打码,并通过反复量化验证打码准确性,优化品牌品类码表;
S305.进一步筛选出核心品牌品类信息,通过优化的品牌品类码表,对码表中数据进行不同维度的反复标记,直到达到SKU级别的数据清洗结果。
在一个具体实施例中,步骤S301,具体步骤为:
T101.基于Hive,使用row_number开窗函数,按item_name,price, month_sale_count,store_id去重,得到去重后的相关门店及商品信息;
T102.通过待分析商品品类的关联业务的维表,规范化收集到的所有相关门店及商品信息中的字段;
T103.通过Json提取相关门店及商品信息中的重要字段;本实施例中,商品的重点字段如下:
T104.根据提取的重要字段,为去重后的相关门店及商品信息打上门店类型标签和商品类型标签;
T105.按照门店信息中的门店名称,构建门店对应的商品维表;
T106.基于所述的商品维表为商品信息打上商品品牌,品类标签;
T107.基于门店信息为门店信息打上门店品牌,品类标签;
T108.将商品信息关联门店信息,形成融合宽表;
T109.将门店融合数据另存为历史快照表。
本实施例中,门店信息包括线上门店维表和线下门店维表;线上门店维表和线下门店维表包括有门店固有信息;其中门店固有信息包括:门店ID、门店名称、区域、品牌、地址、经纬度以及竞对关系表。
本实施例中,本发明根据最新的O2O市场信息持续更新线上门店维表和线下门店维表。
本实施例中,对商品的品类采用智能标签模型,自动生成场景化的客户标签,例如:查找、标注男女性专用商品
男性专用商品:查找商品库中二级品类、三级品类、四级品类、商品名称中含有“男”、“Men”、“boy”、“gentle”、“male”的全部商品,把找出来的全部商品剔除男女性通用的、儿童的商品后,把该商品列表标记为“男性专用商品”
女性专用商品:查找商品库中二级品类,三级品类,四级品类,商品名称中含有“女”、“women”、“lady”、“girl”,“female”的全部商品,把相关找出来的商品剔除男女性通用的,儿童的商品后,把该商品列表标注为“女性专用商品”。
在一个具体实施例中,步骤S4中所述大数据数据库中的现有数据还包括全国若干个城市的经济数据、地图栅格数据、各个栅格的人口指标数据以及对应的人群画像数据、全国POI数据。本实施例中,还整合了待分析商品品类内部的订单数据和营销活动数据,包括:区域客群画像/消费力数据、会员用户信息、 O2O&B2C商品数据、门店商品库数据、门店热销商品信息、门店地理位置信息数据+地理栅格化数据。
如图2所示,在一个具体实施例中,步骤S4,结合大数据数据库中的现有数据构建门店选品模型,具体步骤为:
S401.根据清洗后的相关门店及商品信息、全国栅格信息、全国POI信息,筛选出没有O2O覆盖的栅格和已有O2O覆盖的栅格,并对栅格内的门店商品销售进行统计,获取已有O2O门店的栅格O2O潜力排行榜;本实施例通过匹配相关门店及商品信息和全国栅格信息的经纬度筛选出没有O2O覆盖的栅格和已有O2O覆盖的栅格。
S402.分店铺类型统计已有O2O覆盖的栅格内的O2O商品销量和销售额统计,归一化所述的商品销量和销售额并加权平均其结果,筛选各店类型的高商品销售额的商品,并计算栅格-商品的评分矩阵;本实施例中,筛选各店类型的商品销售额前200名的商品。
S403.将没有O2O覆盖的栅格对应的多维经济数据、栅格POI数据、栅格的人口指标数、栅格对应的人群画像数据分别输入到机器学习模型中,并筛选出没有O2O覆盖的栅格中O2O潜力高的栅格;
S404.基于所述的栅格-商品评分矩阵和栅格中O2O潜力高的栅格,计算栅格余弦相似度矩阵之间的余弦相似度,得到相似栅格;
S405.通过栅格的协同过滤算法,得到已铺货O2O的黄金栅格,黄金栅格销量在前n的商品和与其相似的已有O2O覆盖的栅格卖得好但本栅格没卖的商品,并对O2O潜力高的没有O2O覆盖的栅格推荐其相似栅格销量在前n的商品;
S406.根据栅格-商品的评分矩阵,各个栅格中的商品评分与其若干个相似栅格的商品评分加权平均,得到每个栅格的商品推荐指数,并分店铺类型分栅格输出商品推荐列表。本实施例中,各个栅格中的商品评分与其相似5个栅格的商品评分加权平均。
本实施例中,商品推荐的列表示例如下:
本实施例中,根据业务应用场景的特性和用户特性,使用了协同过滤算法,对商品推荐列表进行优化:
1.过滤门店库存小于3的商品;
2.过滤与该用户性别完全负相关的商品;
3.过滤性别冲突的商品;
4.过滤低单价商品;
5.过滤相同SPU的商品。
在一个具体实施例中,步骤S403,具体步骤为:
V201.输入栅格POI数据和栅格人群画像数据到LGB模型和Xgboost模型中进行训练,并分别输出O2O销售潜力值;
V202.对比两个模型的准确率,选取准确率更高的模型作为O2O销售潜力的预测模型;
V203.将没有O2O覆盖的栅格对应的多维经济数据、栅格POI数据、栅格的人口指标数、栅格对应的人群画像数据分别输入到O2O销售潜力的预测模型,并输出O2O销售潜力排行榜。
在一个具体实施例中,步骤S4中门店选品模型可进行迭代优化,优化步骤为:
S301.收集投放后实际门店反馈的业务数据和效果数据,进行模型训练,建立自动调参模型,优化门店选品模型,得到优化后的门店选品模型,并进行性能和兼容性测试;
S302.对于优化后的门店选品模型,使用小规模流量的A/B测试,并持续评价模型效果;
S303.扩大测试的验证范围,进行全量测试,并评价优化后的门店选品模型效果,判断是否进行整体模型切换。
在一个具体实施例中,步骤S301中,优化门店选品模型,具体步骤为:
X101.对门店选品模型进行超参数优化,根据数据更新频率设置模型重新训练的定时器,使用GridSearchCV在模型训练中自动寻找最优超参数组合;
X102.对门店选品模型进行优化经验参数,根据反馈的业务数据和效果数据,调整商品推荐参数。
在一个具体实施例中,本发明根据待分析商品品类的所在行业,选择对应的 O2O平台和对应的O2O平台模块,并收录全国O2O平台相关数据,得到分析企业推荐的相关门店及商品信息;通过智能算法将推荐的相关门店及商品信息进行清洗,并结合大数据数据库构建门店选品模型,优化待分析商品品类的选品策略,最终实现了营销转化率提升;由此,本发明解决了现有技术不适用于O2O模式的品牌商连锁门店的精细化经营的问题,且具有具有泛用性强,精确易用的特点。
显然,本发明的上述实施例仅仅是为清楚地说明本发明所作的举例,而并非是对本发明的实施方式的限定。凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明权利要求的保护范围之内。
Claims (10)
1.一种基于大数据技术的O2O平台选品分析方法,其特征在于:包括以下具体步骤:
S1.根据待分析商品品类的所在行业,选择对应的O2O平台和对应的O2O平台模块,从对应的O2O平台模块的大数据中,获取待分析商品品类的相关门店及商品信息;
S2.存储获取的待分析商品品类的相关门店及商品信息到大数据数据库中;
S3.通过自动化算法对获取的相关门店及商品信息进行清洗,并获取清洗后的相关门店及商品信息;
S4.将清洗后的相关门店及商品信息输入大数据数据库,整合大数据数据库中的现有数据,构建门店选品模型,并根据门店选品模型优化待分析商品品类的选品策略。
2.根据权利要求1所述的基于大数据技术的O2O平台选品分析方法,其特征在于:步骤S1,具体步骤为:
S101.根据待分析商品品类,选择其最优的O2O平台和其中最优的O2O平台模块;
S102.选定待分析商品品类的市场区域,将选定的市场区域栅格化,提取每个栅格的中心经纬度,进入最优的O2O平台模块,输入虚拟定位的各个栅格的中心经纬度,并通过爬虫技术构建栅格的中心经纬度附近的推荐门店列表;
S103.进入对应的O2O平台模块的门店详情页面,并通过爬虫技术获取门店的详情数据;
S103.进入对应的O2O平台模块的商品详情页面,通过爬虫技术获取商品的详情数据。
3.根据权利要求2所述的基于大数据技术的O2O平台选品分析方法,其特征在于:步骤S2,储存获取的待分析商品品类的所有相关门店及商品信息,具体步骤为:
S201.将收集到的所有相关门店及商品信息以csv数据上传HDFS;
S202.将HDFS数据以textfile格式load进临时表;
S203.复制所述的临时表中的数据,并以ORC格式写入正式表中;
S204.使用Sqoop或dataX工具将正式表中的数据同步到Hive工具中,完成大数据存储。
4.根据权利要求2所述的基于大数据技术的O2O平台选品分析方法,其特征在于:步骤S3,通过自动化算法对获取的相关门店及商品信息进行清洗,具体步骤为:
S301.对收集到的所有相关门店及商品信息进行自动去重,得到去重后的相关门店及商品信息;
S302.将去重后的相关门店及商品信息通过实体识别算法中进行切词,提取出商品的品类品牌信息;
S303.通过得到的品类品牌信息制作商品的品牌品类码表,并通过该码表对收集到的所有相关门店及商品信息进行分类;
S304.通过所述的品牌品类码表对数据库中的品类数据和品牌数据进行打码,并通过反复量化验证打码准确性,优化品牌品类码表;
S305.进一步筛选出核心品牌品类信息,通过优化的品牌品类码表,对码表中数据进行不同维度的反复标记,直到达到SKU级别的数据清洗结果。
5.根据权利要求4所述的基于大数据技术的O2O平台选品分析方法,其特征在于:步骤S301,具体步骤为:
T101.基于Hive,使用row_number开窗函数,按item_name,price,month_sale_count,store_id去重,得到去重后的相关门店及商品信息;
T102.通过待分析商品品类的关联业务的维表,规范化收集到的所有相关门店及商品信息中的字段;
T103.通过Json提取相关门店及商品信息中的重要字段;
T104.根据提取的重要字段,为去重后的相关门店及商品信息打上门店类型标签和商品类型标签;
T105.按照门店信息中的门店名称,构建门店对应的商品维表;
T106.基于所述的商品维表为商品信息打上商品品牌,品类标签;
T107.基于门店信息为门店信息打上门店品牌,品类标签;
T108.将商品信息关联门店信息,形成融合宽表;
T109.将门店融合数据另存为历史快照表。
6.根据权利要求4所述的基于大数据技术的O2O平台选品分析方法,其特征在于:步骤S4中所述大数据数据库中的现有数据还包括全国若干个城市的多维度经济数据、全国栅格POI数据、各个栅格的人口指标数据、各个栅格的人群画像数据、全国POI数据。
7.根据权利要求6所述的基于大数据技术的O2O平台选品分析方法,其特征在于:步骤S4中,构建门店选品模型,具体为:
S401.根据清洗后的相关门店及商品信息、全国栅格信息、全国POI信息,筛选出没有O2O覆盖的栅格和已有O2O覆盖的栅格,并对栅格内的门店商品销售进行统计,获取已有O2O门店的栅格O2O潜力排行榜;
S402.分店铺类型统计已有O2O覆盖的栅格内的O2O商品销量和销售额统计,归一化所述的商品销量和销售额并加权平均其结果,筛选各店类型的高商品销售额的商品,并计算栅格-商品的评分矩阵;
S403.将没有O2O覆盖的栅格对应的多维经济数据、栅格POI数据、栅格的人口指标数、栅格对应的人群画像数据分别输入到机器学习模型中,并筛选出没有O2O覆盖的栅格中O2O潜力高的栅格;
S404.基于所述的栅格-商品评分矩阵和栅格中O2O潜力高的栅格,计算栅格余弦相似度矩阵之间的余弦相似度,得到相似栅格;
S405.通过栅格的协同过滤算法,得到已铺货O2O的黄金栅格,黄金栅格销量在前n的商品和与其相似的已有O2O覆盖的栅格卖得好但本栅格没卖的商品,并对O2O潜力高的没有O2O覆盖的栅格推荐其相似栅格销量在前n的商品;
S406.根据栅格-商品的评分矩阵,各个栅格中的商品评分与其若干个相似栅格的商品评分加权平均,得到每个栅格的商品推荐指数,并分店铺类型分栅格输出商品推荐列表。
8.根据权利要求7所述的基于大数据技术的O2O平台选品分析方法,其特征在于:步骤S403,具体步骤为:
V201.输入栅格POI数据和栅格人群画像数据到LGB模型和Xgboost模型中进行训练,并分别输出O2O销售潜力值;
V202.对比两个模型的准确率,选取准确率更高的模型作为O2O销售潜力的预测模型;
V203.将没有O2O覆盖的栅格对应的多维经济数据、栅格POI数据、栅格的人口指标数、栅格对应的人群画像数据分别输入到O2O销售潜力的预测模型,并输出O2O销售潜力排行榜。
9.根据权利要求7所述的基于大数据技术的O2O平台选品分析方法,其特征在于:步骤S4中门店选品模型可进行迭代优化,优化步骤为:
S301.收集投放后实际门店反馈的业务数据和效果数据,进行模型训练,建立自动调参模型,优化门店选品模型,得到优化后的门店选品模型,并进行性能和兼容性测试;
S302.对于优化后的门店选品模型,使用小规模流量的A/B测试,并持续评价模型效果;
S303.扩大测试的验证范围,进行全量测试,并评价优化后的门店选品模型效果,判断是否进行整体模型切换。
10.根据权利要求9所述的基于大数据技术的O2O平台选品分析方法,其特征在于:步骤S301中,优化门店选品模型,具体步骤为:
X101.对门店选品模型进行超参数优化,根据数据更新频率设置模型重新训练的定时器,使用GridSearchCV在模型训练中自动寻找最优超参数组合;
X102.对门店选品模型进行优化经验参数,根据反馈的业务数据和效果数据,调整商品推荐参数。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210266101.8A CN114611959A (zh) | 2022-03-17 | 2022-03-17 | 一种基于o2o大数据技术的选品策略系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210266101.8A CN114611959A (zh) | 2022-03-17 | 2022-03-17 | 一种基于o2o大数据技术的选品策略系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114611959A true CN114611959A (zh) | 2022-06-10 |
Family
ID=81864328
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210266101.8A Pending CN114611959A (zh) | 2022-03-17 | 2022-03-17 | 一种基于o2o大数据技术的选品策略系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114611959A (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115796943A (zh) * | 2023-01-31 | 2023-03-14 | 广州数说故事信息科技有限公司 | 一种行业开店空间规划方法及系统 |
CN116302536A (zh) * | 2023-03-17 | 2023-06-23 | 广东朝恒科技有限公司 | 一种数据采集的内存优化方法以及装置 |
CN116308465A (zh) * | 2023-05-15 | 2023-06-23 | 深圳易派支付科技有限公司 | 一种基于移动支付的大数据分析系统 |
CN116720022A (zh) * | 2023-08-07 | 2023-09-08 | 广州趣米网络科技有限公司 | 一种基于SaaS系统的前端页面内容展示方法及系统 |
CN117370448A (zh) * | 2023-12-05 | 2024-01-09 | 耐特康赛网络技术(北京)有限公司 | 品牌数字资产洞察分析方法 |
-
2022
- 2022-03-17 CN CN202210266101.8A patent/CN114611959A/zh active Pending
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115796943A (zh) * | 2023-01-31 | 2023-03-14 | 广州数说故事信息科技有限公司 | 一种行业开店空间规划方法及系统 |
CN115796943B (zh) * | 2023-01-31 | 2023-05-26 | 广州数说故事信息科技有限公司 | 一种行业开店空间规划方法及系统 |
CN116302536A (zh) * | 2023-03-17 | 2023-06-23 | 广东朝恒科技有限公司 | 一种数据采集的内存优化方法以及装置 |
CN116308465A (zh) * | 2023-05-15 | 2023-06-23 | 深圳易派支付科技有限公司 | 一种基于移动支付的大数据分析系统 |
CN116308465B (zh) * | 2023-05-15 | 2023-09-01 | 深圳易派支付科技有限公司 | 一种基于移动支付的大数据分析系统 |
CN116720022A (zh) * | 2023-08-07 | 2023-09-08 | 广州趣米网络科技有限公司 | 一种基于SaaS系统的前端页面内容展示方法及系统 |
CN117370448A (zh) * | 2023-12-05 | 2024-01-09 | 耐特康赛网络技术(北京)有限公司 | 品牌数字资产洞察分析方法 |
CN117370448B (zh) * | 2023-12-05 | 2024-03-08 | 耐特康赛网络技术(北京)有限公司 | 品牌数字资产洞察分析方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN114611959A (zh) | 一种基于o2o大数据技术的选品策略系统 | |
KR100712711B1 (ko) | 3지표축에 의해 표현된 고객가치를 기준으로 한 매상 예측 | |
Cheng et al. | Customer lifetime value prediction by a Markov chain based data mining model: Application to an auto repair and maintenance company in Taiwan | |
CN106327227A (zh) | 一种信息推荐系统及信息推荐方法 | |
CN113553540A (zh) | 一种商品销量的预测方法 | |
CN108388955A (zh) | 基于随机森林和逻辑回归的客户服务策略制定方法、装置 | |
CN115409577A (zh) | 基于用户行为及环境信息的智能货柜复购预测方法及系统 | |
CN115456745A (zh) | 小微企业画像构建方法及装置 | |
CN114372848A (zh) | 一种基于机器学习的烟草行业智能营销系统 | |
CN106980639A (zh) | 短文本数据聚合系统及方法 | |
CN116681461A (zh) | 一种基于线下药品零售市场分层分级放大方法 | |
JP2017146632A (ja) | 買い替え時期判断方法、買い替え時期判断システム、及びプログラム | |
CN109508340A (zh) | 精准营销的方法 | |
CN114266594A (zh) | 一种基于东南亚跨境电商平台的大数据分析方法 | |
CN111311331A (zh) | 一种rfm分析方法 | |
Butler et al. | Customer behaviour classification using simulated transactional data | |
JP7228208B2 (ja) | 潜在顧客発掘支援システム | |
Asha et al. | Machine Learning based prototype for Customer Segmentation using RFM | |
OgrajenSek | Use of customer data analysis in continuous quality improvement of service processes | |
Malik et al. | Applying data mining for clustering shoppers based on store loyalty | |
Zais | The pricing of information: a model for selective dissemination of information services | |
Yue et al. | Analysis on the effect of data-mining to supermarket | |
Babeanu et al. | The Impact Of Artificial Intelligence Usage In Business | |
Karaağaç | Churn analysis and churn prediction in a private bank | |
Pekkola et al. | DESIGNING CUSTOMER SEGMENTATION MODEL FOR ANALYSING CONSUMER DATA |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |