CN110689257B - 基于运营商大数据的快消品行业督查方法以及装置 - Google Patents
基于运营商大数据的快消品行业督查方法以及装置 Download PDFInfo
- Publication number
- CN110689257B CN110689257B CN201910904050.5A CN201910904050A CN110689257B CN 110689257 B CN110689257 B CN 110689257B CN 201910904050 A CN201910904050 A CN 201910904050A CN 110689257 B CN110689257 B CN 110689257B
- Authority
- CN
- China
- Prior art keywords
- index
- user
- evaluation
- indexes
- check
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 68
- 238000011156 evaluation Methods 0.000 claims abstract description 101
- 238000012545 processing Methods 0.000 claims abstract description 45
- 238000012549 training Methods 0.000 claims abstract description 41
- 238000004458 analytical method Methods 0.000 claims abstract description 31
- 238000012795 verification Methods 0.000 claims abstract description 20
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 18
- 238000013075 data extraction Methods 0.000 claims abstract description 15
- 238000012423 maintenance Methods 0.000 claims description 22
- 238000012502 risk assessment Methods 0.000 claims description 19
- 230000011218 segmentation Effects 0.000 claims description 15
- 235000021167 banquet Nutrition 0.000 claims description 10
- 238000012216 screening Methods 0.000 claims description 10
- 238000004891 communication Methods 0.000 claims description 9
- 238000013210 evaluation model Methods 0.000 claims description 8
- 238000007621 cluster analysis Methods 0.000 claims description 6
- 238000007477 logistic regression Methods 0.000 claims description 5
- 238000010801 machine learning Methods 0.000 claims description 5
- 238000007637 random forest analysis Methods 0.000 claims description 5
- 238000004590 computer program Methods 0.000 claims description 3
- 230000009467 reduction Effects 0.000 abstract description 3
- 238000010586 diagram Methods 0.000 description 6
- 230000008569 process Effects 0.000 description 4
- 230000006870 function Effects 0.000 description 3
- 238000007689 inspection Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 235000013305 food Nutrition 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 239000013307 optical fiber Substances 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0635—Risk analysis of enterprise or organisation activities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06393—Score-carding, benchmarking or key performance indicator [KPI] analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
Landscapes
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Engineering & Computer Science (AREA)
- Economics (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- Development Economics (AREA)
- Educational Administration (AREA)
- Entrepreneurship & Innovation (AREA)
- General Physics & Mathematics (AREA)
- Marketing (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Game Theory and Decision Science (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本公开是关于一种基于运营商大数据的快消品行业督查方法、装置、电子设备以及存储介质。其中,该方法包括:通过分析快消品行业重点市场费用场景的造假手段,基于运营商大数据,采集所述重点市场费用场景的特征指标;将所述特征指标进行样本数据抽取、指标特征处理、模型训练后,计算风险得分得到高风险用户;采用聚类分析方法对所述高风险用户进行不同场景的评估维度分析,输出不同场景评估维度侧重点,引领督查导向,完成快消品行业的督查。本公开以消费者四类推广场景为着手点,以运营商数据为基础,以大数据算法为手段,实现核查验证,进一步提高督察效率,达到降本增益的目的。
Description
技术领域
本公开涉及大数据领域,具体而言,涉及一种基于运营商大数据的快消品行业督查方法、装置、电子设备以及计算机可读存储介质。
背景技术
快消行业是指消费频率高、使用时限短、拥有广泛的消费群体、对于消费的便利性要求很高的商品销售行业。快消行业的销售渠道种类多而复杂,传统业态和新兴业态等多种渠道并存。快消行业集中度逐步上升,竞争度加大。为了应对市场需要,快消品行业(以酒业为例)市场推广方式多样,推广费用逐年上涨,目前主要核查手段是通过现场照片、协议、发票收据等,核查方式存在漏洞,且督察工作量极大,亟需利用大数据、人工智能技术提升核查手段,提高核查效率。
因此,需要一种或多种方法解决上述问题。
需要说明的是,在上述背景技术部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
发明内容
本公开的目的在于提供一种基于运营商大数据的快消品行业督查方法、装置、电子设备以及计算机可读存储介质,进而至少在一定程度上克服由于相关技术的限制和缺陷而导致的一个或者多个问题。
根据本公开的一个方面,提供一种基于运营商大数据的快消品行业督查方法,包括:
特征指标采集步骤,通过分析快消品行业重点市场费用场景的造假手段,基于运营商大数据,采集所述重点市场费用场景的特征指标;
风险评估模型训练步骤,将所述特征指标进行样本数据抽取、指标特征处理、模型训练后,计算风险得分得到高风险用户;
督查导向确立步骤,采用聚类分析方法对所述高风险用户进行不同场景的评估维度分析,输出不同场景评估维度侧重点,引领督查导向,完成快消品行业的督查。
在本公开的一种示例性实施例中,所述特征指标设计步骤的重点市场费用场景的特征指标包括:
消费者宴席场景,采集基础评估指标检查用户的基础信息是否正确以及卡属性,采集养卡评估指标检查提供的回访电话是否为虚假电话,采集位置评估指标检查用户近期位置是否在酒店位置出现以及出现时长,采集交往圈验真指标判定交往圈规模以及稳定性,采集消费评估指标检查用户近期的消费情况以判断用户是否符合推广人特征;
渠道宣传场景,采集基础评估指标检查用户的基础信息是否正确以及卡属性,采集养卡评估指标检查提供的回访电话是否为虚假电话,采集位置评估指标检查用户工作常驻位置是否在商超位置附近,采集交往圈验真指标检查用户的交往圈稳定度,采集消费评估指标检查商超联系人的消费特征;
客情旅游场景,采集基础评估指标检查用户的基础信息是否正确以及卡属性,采集养卡评估指标检查提供的回访电话是否为虚假电话,采集位置评估指标检查用户近期常驻位置是否在旅游目的地位置附近以及在目的地的驻留情况,采集交通评估指标判定用户是否在旅游目的地存在飞机、火车、高速交通方式,采集消费评估指标检查用户近期的消费情况以判断用户是否存在旅游消费;
客情维护场景,采集基础评估指标检查用户的基础信息是否正确以及卡属性,采集养卡评估指标检查提供的回访电话是否为虚假电话,采集位置评估指标检查用户是否经常出现在已知的客户位置附近,采集交往圈验真指标检查用户的交往圈稳定度,采集消费评估指标检查目标客户的消费特征。
在本公开的一种示例性实施例中,所述风险评估模型训练步骤包括:
样本数据抽取,基于督查合作伙伴提供的经销商及其客户数据、运营商数据,按照1:1比例抽取欺诈客户与非欺诈客户特征指标数据,组成建模样本;
指标特征处理,通过量纲处理、指标筛选、指标分段步骤对所述样本进行特征处理;
模型训练,根据样本数据结合特征处理结果,利用逻辑回归算法进行风险评估模型训练得到各个指标的权重大小。
风险得分计算,利用模型训练结果,将用户指标值与指标分段结果进行比对,获取指标对应分数,结合权重大小得到指标最终得分,所有指标得分和就是风险得分。
在本公开的一种示例性实施例中,所述风险评估模型训练步骤的指标特征处理还包括:
量纲处理,将所有指标都转换处理为数值型,便于机器学习算法进行分析;
指标筛选,利用随机森林算法,运用条件熵的理论,综合得出每一个指标与风险等级之间的关联程度,去除关联程度最弱的指标,保留有价值的特征指标,实现特征选择;
指标分段,利用聚类和信息熵方法将每个指标分组处理。
在本公开的一种示例性实施例中,所述督查导向确立步骤包括:
针对验真高风险用户,采用聚类分析方法进行不同场景的评估维度分析,输出不同场景评估维度侧重点,采用人工方式调整指标权重,优化评估模型。
在本公开的一种示例性实施例中,所述的验真高风险用户为针对模型评估风险用户,经由督查合作伙伴验证后确为欺诈用户的,采用数据回流方式支撑聚类分析。
在本公开的一种示例性实施例中,所述方法还包括:
采用聚类分析方法进行渠道宣传陈列费、客情旅游、消费者宴席推广及客情维护四个场景的评估维度分析,所述四个场景分别对位置评估指标、交往圈信息指标、消费特征指标进行偏重评估。
在本公开的一个方面,提供一种基于运营商大数据的快消品行业督查装置,包括:
特征指标采集模块,用于通过分析快消品行业重点市场费用场景的造假手段,基于运营商大数据,采集所述重点市场费用场景的特征指标;
风险评估模型训练模块,用于将所述特征指标进行样本数据抽取、指标特征处理、模型训练后,计算风险得分得到高风险用户;
督查导向确立模块,用于采用聚类分析方法对所述高风险用户进行不同场景的评估维度分析,输出不同场景评估维度侧重点,引领督查导向,完成快消品行业的督查。
在本公开的一个方面,提供一种电子设备,包括:
处理器;以及
存储器,所述存储器上存储有计算机可读指令,所述计算机可读指令被所述处理器执行时实现根据上述任意一项所述的方法。
在本公开的一个方面,提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现根据上述任意一项所述的方法。
本公开的示例性实施例中的基于运营商大数据的快消品行业督查方法,特征指标采集步骤,通过分析快消品行业重点市场费用场景的造假手段,基于运营商大数据,采集所述重点市场费用场景的特征指标;将所述特征指标进行样本数据抽取、指标特征处理、模型训练后,计算风险得分得到高风险用户;采用聚类分析方法对所述高风险用户进行不同场景的评估维度分析,输出不同场景评估维度侧重点,引领督查导向,完成快消品行业的督查。本公开以消费者四类推广场景为着手点,以运营商数据为基础,以大数据算法为手段,实现核查验证,进一步提高督察效率,达到降本增益的目的。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
通过参照附图来详细描述其示例实施例,本公开的上述和其它特征及优点将变得更加明显。
图1示出了根据本公开一示例性实施例的基于运营商大数据的快消品行业督查方法的流程图;
图2A-2D示出了根据本公开一示例性实施例的基于运营商大数据的快消品行业督查方法的应用场景示意图;
图3示出了根据本公开一示例性实施例的基于运营商大数据的快消品行业督查装置的示意框图;
图4示意性示出了根据本公开一示例性实施例的电子设备的框图;以及
图5示意性示出了根据本公开一示例性实施例的计算机可读存储介质的示意图。
具体实施方式
现在将参考附图更全面地描述示例实施例。然而,示例实施例能够以多种形式实施,且不应被理解为限于在此阐述的实施例;相反,提供这些实施例使得本公开将全面和完整,并将示例实施例的构思全面地传达给本领域的技术人员。在图中相同的附图标记表示相同或类似的部分,因而将省略对它们的重复描述。
此外,所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施例中。在下面的描述中,提供许多具体细节从而给出对本公开的实施例的充分理解。然而,本领域技术人员将意识到,可以实践本公开的技术方案而没有所述特定细节中的一个或更多,或者可以采用其它的方法、组元、材料、装置、步骤等。在其它情况下,不详细示出或描述公知结构、方法、装置、实现、材料或者操作以避免模糊本公开的各方面。
附图中所示的方框图仅仅是功能实体,不一定必须与物理上独立的实体相对应。即,可以采用软件形式来实现这些功能实体,或在一个或多个软件硬化的模块中实现这些功能实体或功能实体的一部分,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
在本示例实施例中,首先提供了一种基于运营商大数据的快消品行业督查方法;参考图1中所示,该基于运营商大数据的快消品行业督查方法可以包括以下步骤:
特征指标采集步骤S110,通过分析快消品行业重点市场费用场景的造假手段,基于运营商大数据,采集所述重点市场费用场景的特征指标;
风险评估模型训练步骤S120,将所述特征指标进行样本数据抽取、指标特征处理、模型训练后,计算风险得分得到高风险用户;
督查导向确立步骤S130,采用聚类分析方法对所述高风险用户进行不同场景的评估维度分析,输出不同场景评估维度侧重点,引领督查导向,完成快消品行业的督查。
本公开的示例性实施例中的基于运营商大数据的快消品行业督查方法,特征指标采集步骤,通过分析快消品行业重点市场费用场景的造假手段,基于运营商大数据,采集所述重点市场费用场景的特征指标;将所述特征指标进行样本数据抽取、指标特征处理、模型训练后,计算风险得分得到高风险用户;采用聚类分析方法对所述高风险用户进行不同场景的评估维度分析,输出不同场景评估维度侧重点,引领督查导向,完成快消品行业的督查。本公开以消费者四类推广场景为着手点,以运营商数据为基础,以大数据算法为手段,实现核查验证,进一步提高督察效率,达到降本增益的目的。
下面,将对本示例实施例中的基于运营商大数据的快消品行业督查方法进行进一步的说明。
在特征指标采集步骤S110中,可以通过分析快消品行业重点市场费用场景的造假手段,基于运营商大数据,采集所述重点市场费用场景的特征指标。
在本示例的实施例中,所述特征指标设计步骤的重点市场费用场景的特征指标包括:
消费者宴席场景,采集基础评估指标检查用户的基础信息是否正确以及卡属性,采集养卡评估指标检查提供的回访电话是否为虚假电话,采集位置评估指标检查用户近期位置是否在酒店位置出现以及出现时长,采集交往圈验真指标判定交往圈规模以及稳定性,采集消费评估指标检查用户近期的消费情况以判断用户是否符合推广人特征;
渠道宣传场景,采集基础评估指标检查用户的基础信息是否正确以及卡属性,采集养卡评估指标检查提供的回访电话是否为虚假电话,采集位置评估指标检查用户工作常驻位置是否在商超位置附近,采集交往圈验真指标检查用户的交往圈稳定度,采集消费评估指标检查商超联系人的消费特征;
客情旅游场景,采集基础评估指标检查用户的基础信息是否正确以及卡属性,采集养卡评估指标检查提供的回访电话是否为虚假电话,采集位置评估指标检查用户近期常驻位置是否在旅游目的地位置附近以及在目的地的驻留情况,采集交通评估指标判定用户是否在旅游目的地存在飞机、火车、高速交通方式,采集消费评估指标检查用户近期的消费情况以判断用户是否存在旅游消费;
客情维护场景,采集基础评估指标检查用户的基础信息是否正确以及卡属性,采集养卡评估指标检查提供的回访电话是否为虚假电话,采集位置评估指标检查用户是否经常出现在已知的客户位置附近,采集交往圈验真指标检查用户的交往圈稳定度,采集消费评估指标检查目标客户的消费特征。
在本示例的实施例中,深度分析快消品行业四大重点市场费用场景的造假手段,结合运营商大数据,进行模型所需特征指标集设计。
其中:
1)消费者宴席场景
2)渠道宣传场景
3)客情旅游场景
4)客情维护场景
在风险评估模型训练步骤S120中,可以将所述特征指标进行样本数据抽取、指标特征处理、模型训练后,计算风险得分得到高风险用户。
在本示例的实施例中,所述风险评估模型训练步骤包括:
样本数据抽取,基于督查合作伙伴提供的经销商及其客户数据、运营商数据,按照1:1比例抽取欺诈客户与非欺诈客户特征指标数据,组成建模样本;
指标特征处理,通过量纲处理、指标筛选、指标分段步骤对所述样本进行特征处理;
模型训练,根据样本数据结合特征处理结果,利用逻辑回归算法进行风险评估模型训练得到各个指标的权重大小。;
风险得分计算,利用模型训练结果,将用户指标值与指标分段结果进行比对,获取指标对应分数,结合权重大小得到指标最终得分,所有指标得分和就是风险得分。
在本示例的实施例中,所述风险评估模型训练步骤的指标特征处理还包括:
量纲处理,将所有指标都转换处理为数值型,便于机器学习算法进行分析;
指标筛选,利用随机森林算法,运用条件熵的理论,综合得出每一个指标与风险等级之间的关联程度,去除关联程度最弱的指标,保留有价值的特征指标,实现特征选择;
指标分段,利用聚类和信息熵方法将每个指标分组处理。
在本示例的实施例中,评估模型训练主要通过以下步骤解决风险评估模型有哪些指标构成,以及各个指标的权重占比。
(1)样本数据抽取
基于督查合作伙伴提供的经销商及其客户数据、运营商数据,按照1:1比例抽取欺诈客户与非欺诈客户特征指标数据,组成建模样本。抽取过程利用随机抽样函数实现,保证样本数据的分布与整体分布的一致性。
(2)指标特征处理
针对四类场景的每个模型,需要对所有指标进行特征处理,包括量纲处理、指标筛选、指标分段。
量纲处理:将所有指标都转换处理为数值型,便于机器学习算法进行分析。
指标筛选:主要实现特征选择,利用随机森林算法,运用条件熵的理论,综合得出每一个指标与风险等级之间的关联程度,去除关联程度最弱的指标,保留有价值的特征指标。
指标分段:利用聚类和信息熵方法将每个指标分组处理。输入样本号码的欺诈等级和某个指标值,输出欺诈等级与指标区间的对应关系。如月均ARPU值被划分为5个区间,<29,29~75,75~110,110~158,158~319,>319。
(3)模型训练
根据样本数据结合特征处理结果,利用逻辑回归算法进行风险评估模型训练得到各个指标的权重大小。权重通过比例转换为分数得到风险评估模型下各个指标的构成及得分。
(4)风险得分计算
利用模型训练结果,将用户指标值与指标分段结果进行比对,获取指标对应分数,结合权重大小得到指标最终得分,所有指标得分和就是风险得分。
在督查导向确立步骤S130中,可以采用聚类分析方法对所述高风险用户进行不同场景的评估维度分析,输出不同场景评估维度侧重点,引领督查导向,完成快消品行业的督查。
在本示例的实施例中,所述督查导向确立步骤包括:
针对验真高风险用户,采用聚类分析方法进行不同场景的评估维度分析,输出不同场景评估维度侧重点,采用人工方式调整指标权重,优化评估模型。
在本示例的实施例中,所述的验真高风险用户为针对模型评估风险用户,经由督查合作伙伴验证后确为欺诈用户的,采用数据回流方式支撑聚类分析。
在本示例的实施例中,所述方法还包括:
采用聚类分析方法进行渠道宣传陈列费、客情旅游、消费者宴席推广及客情维护四个场景的评估维度分析,所述四个场景分别对位置评估指标、交往圈信息指标、消费特征指标进行偏重评估。
在本示例的实施例中,针对验真高风险用户,采用聚类分析方法进行不同场景的评估维度分析,输出不同场景评估维度侧重点,采用人工方式调整指标权重,优化评估模型。
如图2所示分别为根据渠道宣传陈列费、客情旅游、消费者宴席推广、客情维护等4类场景不同维度的影响力,对于渠道宣传陈列费,更加偏重于用户的常驻位置特征是否在商超附近以及用户的消费特征;而对于客情旅游,更加注重用户常驻位置是否在旅游目的地附近以及是否具有交通方式特征;对于消费者宴席推广主要偏重于交往圈信息,以及位置信息,主要原因在于推广人通常具有较广的交往圈,而对于客情维护,更加注重消费信息以及位置信息。
需要说明的是,尽管在附图中以特定顺序描述了本公开中方法的各个步骤,但是,这并非要求或者暗示必须按照该特定顺序来执行这些步骤,或是必须执行全部所示的步骤才能实现期望的结果。附加的或备选的,可以省略某些步骤,将多个步骤合并为一个步骤执行,以及/或者将一个步骤分解为多个步骤执行等。
此外,在本示例实施例中,还提供了一种基于运营商大数据的快消品行业督查装置。参照图3所示,该基于运营商大数据的快消品行业督查装置200可以包括:特征指标采集模块210、风险评估模型训练模块220以及督查导向确立模块230。其中:
特征指标采集模块210,用于通过分析快消品行业重点市场费用场景的造假手段,基于运营商大数据,采集所述重点市场费用场景的特征指标;
风险评估模型训练模块220,用于将所述特征指标进行样本数据抽取、指标特征处理、模型训练后,计算风险得分得到高风险用户;
督查导向确立模块230,用于采用聚类分析方法对所述高风险用户进行不同场景的评估维度分析,输出不同场景评估维度侧重点,引领督查导向,完成快消品行业的督查。
上述中各基于运营商大数据的快消品行业督查装置模块的具体细节已经在对应的基于运营商大数据的快消品行业督查方法中进行了详细的描述,因此此处不再赘述。
应当注意,尽管在上文详细描述中提及了基于运营商大数据的快消品行业督查装置200的若干模块或者单元,但是这种划分并非强制性的。实际上,根据本公开的实施方式,上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之,上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。
此外,在本公开的示例性实施例中,还提供了一种能够实现上述方法的电子设备。
所属技术领域的技术人员能够理解,本发明的各个方面可以实现为系统、方法或程序产品。因此,本发明的各个方面可以具体实现为以下形式,即:完全的硬件实施例、完全的软件实施例(包括固件、微代码等),或硬件和软件方面结合的实施例,这里可以统称为“电路”、“模块”或“系统”。
下面参照图4来描述根据本发明的这种实施例的电子设备300。图4显示的电子设备300仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图4所示,电子设备300以通用计算设备的形式表现。电子设备300的组件可以包括但不限于:上述至少一个处理单元310、上述至少一个存储单元320、连接不同系统组件(包括存储单元320和处理单元310)的总线330、显示单元340。
其中,所述存储单元存储有程序代码,所述程序代码可以被所述处理单元310执行,使得所述处理单元310执行本说明书上述“示例性方法”部分中描述的根据本发明各种示例性实施例的步骤。例如,所述处理单元310可以执行如图1中所示的步骤S110至步骤S130。
存储单元320可以包括易失性存储单元形式的可读介质,例如随机存取存储单元(RAM)3201和/或高速缓存存储单元3202,还可以进一步包括只读存储单元(ROM)3203。
存储单元320还可以包括具有一组(至少一个)程序模块3205的程序/实用工具3204,这样的程序模块3205包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
总线330可以为表示几类总线结构中的一种或多种,包括存储单元总线或者存储单元控制器、外围总线、图形加速端口、处理单元或者使用多种总线结构中的任意总线结构的局域总线。
电子设备300也可以与一个或多个外部设备370(例如键盘、指向设备、蓝牙设备等)通信,还可与一个或者多个使得用户能与该电子设备300交互的设备通信,和/或与使得该电子设备300能与一个或多个其它计算设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口350进行。并且,电子设备300还可以通过网络适配器360与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器360通过总线330与电子设备300的其它模块通信。应当明白,尽管图中未示出,可以结合电子设备300使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
通过以上的实施例的描述,本领域的技术人员易于理解,这里描述的示例实施例可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本公开实施例的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、终端装置、或者网络设备等)执行根据本公开实施例的方法。
在本公开的示例性实施例中,还提供了一种计算机可读存储介质,其上存储有能够实现本说明书上述方法的程序产品。在一些可能的实施例中,本发明的各个方面还可以实现为一种程序产品的形式,其包括程序代码,当所述程序产品在终端设备上运行时,所述程序代码用于使所述终端设备执行本说明书上述“示例性方法”部分中描述的根据本发明各种示例性实施例的步骤。
参考图5所示,描述了根据本发明的实施例的用于实现上述方法的程序产品400,其可以采用便携式紧凑盘只读存储器(CD-ROM)并包括程序代码,并可以在终端设备,例如个人电脑上运行。然而,本发明的程序产品不限于此,在本文件中,可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
所述程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。可读信号介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、有线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言的任意组合来编写用于执行本发明操作的程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、C++等,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(LAN)或广域网(WAN),连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
此外,上述附图仅是根据本发明示例性实施例的方法所包括的处理的示意性说明,而不是限制目的。易于理解,上述附图所示的处理并不表明或限制这些处理的时间顺序。另外,也易于理解,这些处理可以是例如在多个模块中同步或异步执行的。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其他实施例。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由权利要求指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限。
Claims (7)
1.一种基于运营商大数据的快消品行业督查方法,其特征在于,所述方法包括:
特征指标采集步骤,通过分析快消品行业重点市场费用场景的造假手段,基于运营商大数据,采集所述重点市场费用场景的特征指标;
风险评估模型训练步骤,将所述特征指标进行样本数据抽取、指标特征处理、模型训练后,计算风险得分得到高风险用户;
督查导向确立步骤,采用聚类分析方法对所述高风险用户进行不同场景的评估维度分析,输出不同场景评估维度侧重点,引领督查导向,完成快消品行业的督查;
所述风险评估模型训练步骤包括:
样本数据抽取,基于督查合作伙伴提供的经销商及其客户数据、运营商数据,按照1:1比例抽取欺诈客户与非欺诈客户特征指标数据,组成建模样本;
指标特征处理,通过量纲处理、指标筛选、指标分段步骤对所述样本进行特征处理;
模型训练,根据样本数据结合特征处理结果,利用逻辑回归算法进行风险评估模型训练得到各个指标的权重大小;
风险得分计算,利用模型训练结果,将用户指标值与指标分段结果进行比对,获取指标对应分数,结合权重大小得到指标最终得分,所有指标得分和就是风险得分;
所述风险评估模型训练步骤的指标特征处理还包括:
量纲处理,将所有指标都转换处理为数值型,便于机器学习算法进行分析;
指标筛选,利用随机森林算法,运用条件熵的理论,综合得出每一个指标与风险等级之间的关联程度,去除关联程度最弱的指标,保留有价值的特征指标,实现特征选择;
指标分段,利用聚类和信息熵方法将每个指标分组处理;
所述特征指标采集步骤的重点市场费用场景的特征指标包括:
消费者宴席场景,采集基础评估指标检查用户的基础信息是否正确以及卡属性,采集养卡评估指标检查提供的回访电话是否为虚假电话,采集位置评估指标检查用户近期位置是否在酒店位置出现以及出现时长,采集交往圈验真指标判定交往圈规模以及稳定性,采集消费评估指标检查用户近期的消费情况以判断用户是否符合推广人特征;
渠道宣传场景,采集基础评估指标检查用户的基础信息是否正确以及卡属性,采集养卡评估指标检查提供的回访电话是否为虚假电话,采集位置评估指标检查用户工作常驻位置是否在商超位置附近,采集交往圈验真指标检查用户的交往圈稳定度,采集消费评估指标检查商超联系人的消费特征;
客情旅游场景,采集基础评估指标检查用户的基础信息是否正确以及卡属性,采集养卡评估指标检查提供的回访电话是否为虚假电话,采集位置评估指标检查用户近期常驻位置是否在旅游目的地位置附近以及在目的地的驻留情况,采集交通评估指标判定用户是否在旅游目的地存在飞机、火车、高速交通方式,采集消费评估指标检查用户近期的消费情况以判断用户是否存在旅游消费;
客情维护场景,采集基础评估指标检查用户的基础信息是否正确以及卡属性,采集养卡评估指标检查提供的回访电话是否为虚假电话,采集位置评估指标检查用户是否经常出现在已知的客户位置附近,采集交往圈验真指标检查用户的交往圈稳定度,采集消费评估指标检查目标客户的消费特征。
2.如权利要求1所述的方法,其特征在于,所述督查导向确立步骤包括:
针对验真高风险用户,采用聚类分析方法进行不同场景的评估维度分析,输出不同场景评估维度侧重点,采用人工方式调整指标权重,优化评估模型。
3.如权利要求2所述的方法,其特征在于,所述的验真高风险用户为针对模型评估风险用户,经由督查合作伙伴验证后确为欺诈用户的,采用数据回流方式支撑聚类分析。
4.如权利要求2所述的方法,其特征在于,所述方法还包括:
采用聚类分析方法进行渠道宣传陈列费、客情旅游、消费者宴席推广及客情维护四个场景的评估维度分析,所述四个场景分别对位置评估指标、交往圈信息指标、消费特征指标进行偏重评估。
5.一种基于运营商大数据的快消品行业督查装置,其特征在于,所述装置包括:
特征指标采集模块,用于通过分析快消品行业重点市场费用场景的造假手段,基于运营商大数据,采集所述重点市场费用场景的特征指标;
风险评估模型训练模块,用于将所述特征指标进行样本数据抽取、指标特征处理、模型训练后,计算风险得分得到高风险用户;样本数据抽取,基于督查合作伙伴提供的经销商及其客户数据、运营商数据,按照1:1比例抽取欺诈客户与非欺诈客户特征指标数据,组成建模样本;指标特征处理,通过量纲处理、指标筛选、指标分段步骤对所述样本进行特征处理;模型训练,根据样本数据结合特征处理结果,利用逻辑回归算法进行风险评估模型训练得到各个指标的权重大小;风险得分计算,利用模型训练结果,将用户指标值与指标分段结果进行比对,获取指标对应分数,结合权重大小得到指标最终得分,所有指标得分和就是风险得分;所述风险评估模型训练步骤的指标特征处理还包括:量纲处理,将所有指标都转换处理为数值型,便于机器学习算法进行分析;指标筛选,利用随机森林算法,运用条件熵的理论,综合得出每一个指标与风险等级之间的关联程度,去除关联程度最弱的指标,保留有价值的特征指标,实现特征选择;指标分段,利用聚类和信息熵方法将每个指标分组处理;
督查导向确立模块,用于采用聚类分析方法对所述高风险用户进行不同场景的评估维度分析,输出不同场景评估维度侧重点,引领督查导向,完成快消品行业的督查;
所述特征指标采集模块的重点市场费用场景的特征指标包括:
消费者宴席场景,采集基础评估指标检查用户的基础信息是否正确以及卡属性,采集养卡评估指标检查提供的回访电话是否为虚假电话,采集位置评估指标检查用户近期位置是否在酒店位置出现以及出现时长,采集交往圈验真指标判定交往圈规模以及稳定性,采集消费评估指标检查用户近期的消费情况以判断用户是否符合推广人特征;
渠道宣传场景,采集基础评估指标检查用户的基础信息是否正确以及卡属性,采集养卡评估指标检查提供的回访电话是否为虚假电话,采集位置评估指标检查用户工作常驻位置是否在商超位置附近,采集交往圈验真指标检查用户的交往圈稳定度,采集消费评估指标检查商超联系人的消费特征;
客情旅游场景,采集基础评估指标检查用户的基础信息是否正确以及卡属性,采集养卡评估指标检查提供的回访电话是否为虚假电话,采集位置评估指标检查用户近期常驻位置是否在旅游目的地位置附近以及在目的地的驻留情况,采集交通评估指标判定用户是否在旅游目的地存在飞机、火车、高速交通方式,采集消费评估指标检查用户近期的消费情况以判断用户是否存在旅游消费;
客情维护场景,采集基础评估指标检查用户的基础信息是否正确以及卡属性,采集养卡评估指标检查提供的回访电话是否为虚假电话,采集位置评估指标检查用户是否经常出现在已知的客户位置附近,采集交往圈验真指标检查用户的交往圈稳定度,采集消费评估指标检查目标客户的消费特征。
6.一种电子设备,其特征在于,包括
处理器;以及
存储器,所述存储器上存储有计算机可读指令,所述计算机可读指令被所述处理器执行时实现根据权利要求1至4中任一项所述的方法。
7.一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现根据权利要求1至4中任一项所述方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910904050.5A CN110689257B (zh) | 2019-09-24 | 2019-09-24 | 基于运营商大数据的快消品行业督查方法以及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910904050.5A CN110689257B (zh) | 2019-09-24 | 2019-09-24 | 基于运营商大数据的快消品行业督查方法以及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110689257A CN110689257A (zh) | 2020-01-14 |
CN110689257B true CN110689257B (zh) | 2022-09-09 |
Family
ID=69110014
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910904050.5A Active CN110689257B (zh) | 2019-09-24 | 2019-09-24 | 基于运营商大数据的快消品行业督查方法以及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110689257B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112100165B (zh) * | 2020-09-14 | 2024-02-02 | 郄中洋 | 基于质量评估的交通数据处理方法、系统、设备和介质 |
CN112446425A (zh) * | 2020-11-20 | 2021-03-05 | 北京思特奇信息技术股份有限公司 | 一种用于自动获取疑似养卡渠道的方法和装置 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018105995A2 (ko) * | 2016-12-06 | 2018-06-14 | 주식회사 원소프트다임 | 빅데이터를 활용한 건강정보 예측 장치 및 방법 |
CN109614526A (zh) * | 2018-11-09 | 2019-04-12 | 环境保护部环境工程评估中心 | 基于高维异常检测模型的环境监测数据造假手段识别方法 |
CN109801082A (zh) * | 2018-12-29 | 2019-05-24 | 广州王老吉大健康产业有限公司 | 一种快消品防伪防窜货方法、系统、服务器及存储介质 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106157132A (zh) * | 2016-06-20 | 2016-11-23 | 中国工商银行股份有限公司 | 信用风险监控系统及方法 |
-
2019
- 2019-09-24 CN CN201910904050.5A patent/CN110689257B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018105995A2 (ko) * | 2016-12-06 | 2018-06-14 | 주식회사 원소프트다임 | 빅데이터를 활용한 건강정보 예측 장치 및 방법 |
CN109614526A (zh) * | 2018-11-09 | 2019-04-12 | 环境保护部环境工程评估中心 | 基于高维异常检测模型的环境监测数据造假手段识别方法 |
CN109801082A (zh) * | 2018-12-29 | 2019-05-24 | 广州王老吉大健康产业有限公司 | 一种快消品防伪防窜货方法、系统、服务器及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN110689257A (zh) | 2020-01-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110910257A (zh) | 信息预测方法、装置、电子设备和计算机可读介质 | |
CN111666304B (zh) | 数据处理装置、数据处理方法、存储介质与电子设备 | |
CN111260102A (zh) | 一种用户满意度预测方法、装置、电子设备及存储介质 | |
CN108550054B (zh) | 一种内容质量评估方法、装置、设备和介质 | |
CN110689257B (zh) | 基于运营商大数据的快消品行业督查方法以及装置 | |
CN112016855B (zh) | 基于关系网匹配的用户行业识别方法、装置和电子设备 | |
CN112037038A (zh) | 银行信贷风险预测方法及装置 | |
CN111582645B (zh) | 基于因子分解机的app风险评估方法、装置和电子设备 | |
CN111598122B (zh) | 数据校验方法、装置、电子设备和存储介质 | |
CN111967543A (zh) | 用户资源配额确定方法、装置及电子设备 | |
CN110647523B (zh) | 数据质量的分析方法及装置、存储介质、电子设备 | |
CN111861521A (zh) | 数据处理方法、装置、计算机可读介质及电子设备 | |
CN110826619A (zh) | 电子卷宗的文件分类方法、装置及电子设备 | |
CN110704614B (zh) | 对应用中的用户群类型进行预测的信息处理方法及装置 | |
CN110782128B (zh) | 一种用户职业标签生成方法、装置和电子设备 | |
CN113569929B (zh) | 基于小样本扩展的互联网服务提供方法、装置及电子设备 | |
CN111383766A (zh) | 计算机数据处理方法、装置、介质及电子设备 | |
CN111582649B (zh) | 基于用户app独热编码的风险评估方法、装置和电子设备 | |
CN113516398A (zh) | 基于分层抽样的风险设备识别方法、装置及电子设备 | |
CN112465149A (zh) | 同城件识别方法、装置、电子设备以及存储介质 | |
CN113221990A (zh) | 信息录入方法、装置及相关设备 | |
CN114204989B (zh) | 分光器数据的评估方法及装置、存储介质、电子设备 | |
CN116629639B (zh) | 评估信息确定方法、装置、介质与电子设备 | |
CN114492409B (zh) | 文件内容的评价方法、装置、电子设备及程序产品 | |
CN116167497A (zh) | 一种人口流动趋势预判的方法、装置、介质及设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |