CN114169933A - 基于多维数据的门店智能选址推荐方法及系统 - Google Patents

基于多维数据的门店智能选址推荐方法及系统 Download PDF

Info

Publication number
CN114169933A
CN114169933A CN202111501258.6A CN202111501258A CN114169933A CN 114169933 A CN114169933 A CN 114169933A CN 202111501258 A CN202111501258 A CN 202111501258A CN 114169933 A CN114169933 A CN 114169933A
Authority
CN
China
Prior art keywords
data
site selection
gis
gis geographic
index
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111501258.6A
Other languages
English (en)
Inventor
沈秋英
曹骏
张文韬
朱静怡
庄文兵
刘柳
张恒超
王之阳
王波
曲照言
王聪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou Power Supply Co of State Grid Jiangsu Electric Power Co Ltd
Original Assignee
Suzhou Power Supply Co of State Grid Jiangsu Electric Power Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou Power Supply Co of State Grid Jiangsu Electric Power Co Ltd filed Critical Suzhou Power Supply Co of State Grid Jiangsu Electric Power Co Ltd
Priority to CN202111501258.6A priority Critical patent/CN114169933A/zh
Publication of CN114169933A publication Critical patent/CN114169933A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0204Market segmentation
    • G06Q30/0205Location or geographical consideration
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/215Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/29Geographical information databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/24323Tree-organised classifiers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • G06F18/251Fusion techniques of input or preprocessed data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06393Score-carding, benchmarking or key performance indicator [KPI] analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/06Electricity, gas or water supply

Abstract

基于多维数据的门店智能选址推荐方法及系统,通过采集构建指标所需要的数据并对数据进行清洗融合,构建企业选址指标并根据所采集数据为每个指标赋值,构建机器学习模型以及在训练机器学习模型后,输入需要被判定的用电场所GIS地理数据以及其对应的指标数据,反复进行迭代直到前后两次输出的概率值相差在所设定阈值以内得到最终选址结果。本方法使用了区域内完整的电力大数据,以及市场公开全量的第三方数据作为融合,可以对相同客群的品牌门店进行跨地域,多点的横向比较,解决机器学习中样本不足问题,量化选址策略,大大提升选址效率,节约企业选址成本与人工成本。

Description

基于多维数据的门店智能选址推荐方法及系统
技术领域
本发明属于电力大数据处理技术领域,具体涉及基于多维数据的门店智能选址推荐方法及系统。
背景技术
一个好的选址,是线下门店运营成功的第一步。目前企业普遍通过选址经理线下走访考察,人为收集信息。这种方式效率低,精准度不高,而且收集成本高昂。最后收集的信息经过专家打分评估,决策团队只能靠主观意义判断,试错成本高。针对选址场景重点关注的人流量、消费能力、同业竞品分析、租金成本、行业生态和区位交通等指标,行业缺少有效,权威的数据做支撑。而电力数据具有可信度高、时效性强、连续性好、覆盖面广等特点,通过与工商、GIS区位交通和配套等数据进行深度融合,在企业经营选址决策方面有巨大的潜力。
企业前期的选址更多的是一种试错和积累的过程,需要定期复盘,推演哪家门店位置选得好,好在哪里,哪家门店位置选的不好,哪里不好。通过不断的复盘,内化企业选址能力,逐渐找到企业最适合的选址逻辑。理论上,有相同客群的品牌门店在位置上也会趋同,就像麦当劳的周边大概率会有肯德基一样。
发明内容
为解决现有技术中存在的不足,本发明的目的在于,提供基于多维数据的门店智能选址推荐方法及系统。
本发明采用如下的技术方案:
基于多维数据的门店智能选址推荐方法,包括以下步骤:
步骤1,采集门店选址指标所需要的数据并对数据进行清洗融合;
步骤2,根据步骤2采集的数据构建企业选址指标并根据所采集数据为每个指标赋值;
步骤3,构建机器学习模型;
步骤4,对步骤3构建的机器学习模型进行训练后,输入需要被判定的用电场所GIS地理数据以及其对应的指标数据,反复进行迭代直到前后两次输出的概率值相差在所设定阈值以内得到最终选址结果。
在步骤1中,构建指标所需要的数据包括电力数据、工商数据、用电场所GIS地理数据和其他数据;电力数据包括企业账户数量、居民账户数量、月度用电量、正常用电入住标识;
工商数据包括企业名称、成立时间、企业经营状态、所属行业,所属产业;企业经营状态包括存续、在业、吊销、注销、迁入、迁出、停业、清算;
所选取的企业均为营业时间超过2年的企业;
用电场所GIS地理数据包括用电企业GIS地理数据、用电办公地GIS地理数据、用电居住地GIS地理数据、所选区域内小区数量、交通,医院配套数量;
其他数据包括用电场所楼价数据、用电场所租金信息。
在步骤2中,所构建的指标包括“人流量”、“消费能力”、“用工成本”、“租金成本”、“同业店面数量”、“写字楼数量”、“小区数量”、“交通”、“基础设施”、“环保要求”以及“选址效果”;
“人流量”:指在所选择用电场所GIS地理数据范围内1天内每平方米的人口密度平均值;当人流量大于10为高;5-9为中;小于5为低;
“消费能力”:指在所选择用电场所GIS地理数据范围内24小时内用电地区每个用户花费的电费;大于50元为高,25-49元为中,小于25元为低;
“用工成本”:指在所选择用电场所GIS地理数据范围内每平方米内的人均时薪,大于100元为高,50-99元为中,小于55元为低;
“租金成本”:指在所选择用电场所GIS地理数据范围内每个商业住房或居民住房的月租金,大于4000元为高,2000-3999元为中,小于2000元为低;
“同业店面数量”:指在所选择用电场所GIS地理数据范围内每平方米内属于同一行业的店面最大数量;
“写字楼数量”:指在所选择用电场所GIS地理数据范围内每平方米内所存在写字楼总数量;
“小区数量”:指在所选择用电场所GIS地理数据范围内每平方米内存在的小区总数量;
“交通”:指在所选择用电场所GIS地理数据范围内中是否存在公交车站与地铁站,是否有对主要道路进行划分;如果上述三项都存在,则为“好”;存在任意两项为“中”;存在任意一项为“差”;
“基础设施”:指在所选择用电场所GIS地理数据范围内中是否存在学校、医院、文体活动中心、邮电中心、办公楼、住宅区、商业服务中心;如果存在任意5项以上,则为“好”;存在任意3-4项,则为“中”;小于3项则为“差”;
“环保要求”:指政府部门是否对所选择用电场所GIS地理数据范围内指定了环保方面的要求,包括垃圾分类、因环保问题不合格而限制企业发展;
“选址效果”:指在所选择用电场所GIS地理数据范围内的企业选择该地址的成功率;如果企业每平方米的年利润达到20万以上则为成功,否则为失败。
人口密度平均值通过对电力数据进行智能计算获得,可选取的智能计算方法包括神经网络、K-Means、DBSCAN以及概率模型。
所选择用电场所GIS地理数据至少涵盖五平方米的范围。
在输入至机器学习模型时,将指标中的“高”转化为数字“3”,“中”转化为数字“2”,“低”转化为数字“1”;
“成功”转化为数字“1”,“失败”转化为数字“0”;
“好”转化为数字3,“中”转化为数字2,“差”转化为数字1。
在步骤3中,机器学习模型为由m棵回归树构成的回归树群。
机器学习模型具体构建方法如下:
步骤3.1,构建拥有m棵回归树的回归树群;
步骤3.2,构建回归树群的目标函数;
该目标函数满足以下关系式:
Figure BDA0003401722140000031
其中,m为所有回归树的个数,Tj表示第j棵回归树的节点总数,n表示指标数据总数,
Figure BDA0003401722140000041
表示第j-1棵回归树判定结果
Figure BDA0003401722140000042
与第j棵回归树判定结果yj的损失值;当j=1时,
Figure BDA0003401722140000043
表示实际数据与当前回归树判定结果的损失值;l表示损失函数,可选用对数损失函数,平方损失函数或指数损失函数,每棵回归树可选用不同的损失函数;gj和hj分别为第j棵回归树损失函数的第一阶导数与第二阶导数;γ为超因子数,Tj表示第j棵回归树的节点总数;xi表示第i条原始数据;ft表示第j棵回归树第t个节点的交叉熵函数;
步骤3.3,将采集到的数据输入至构建好的回归树群中进行训练。
交叉熵函数满足以下关系式:
ft(xi)=-xilog(xi)-(1-xi)log(1-xi)
展示层提供用户交互,用户浏览GIS地理信息,选择感兴趣的用电区域,并将所对应的GIS数据上传至应用层。而应用层模块接收到这些信息,经过计算,将是否成功开店的概率显示的界面上;同时展示层还显示竞品店面等选址信息供用户做横向比较;
应用层模块接收展示层用户传来的GIS数据,通过提取相关指标数据、构建指标、赋值指标、训练机器学习模型计算每个指标的概率,计算所选GIS对应地区的选址成功开率。
应用层还包括数据采集与清洗模块、指标构建模块、机器学习模型构建模块;
数据采集与清洗模块采集电力数据、工商数据、用电场所GIS地理数据和其他数据,并对这些数据进行清洗融合;
指标构建模块根据数据采集与清洗模块得到的数据构建企业选址指标并根据所采集数据为每个指标赋值;
机器学习模型构建模块构建本发明所要使用的机器学习模型并对该模型进行训练;
应用层模块接收展示层用户传来的GIS选择数据,数据采集模块将对应的相关指标数据提取出来。
回归树群的目标函数为:
Figure BDA0003401722140000051
其中,m为所有回归树的个数,Tj表示第j棵回归树的节点总数,n表示指标数据总数,
Figure BDA0003401722140000052
表示上一棵回归树判定结果与第j棵回归树判定结果的损失值;当j=1时,
Figure BDA0003401722140000053
表示实际数据与当前回归树判定结果的损失值;l表示损失函数,可选用对数损失函数,平方损失函数或指数损失函数,每棵回归树可选用不同的损失函数;gj和hj分别为第j棵回归树损失函数的第一阶导数与第二阶导数;f(xi)表示;γ为超因子数,根据实际情况进行设置用于控制本函数的复杂程度,Tj表示第j棵回归树的节点总数;xi表示第i条指标数据;ft表示第j棵回归树第t个节点的交叉熵函数。
本发明的有益效果在于,与现有技术相比,本发明:
1、根据企业选址场景所关注的重要特征指标和成熟的样本案例,对提取的指标经过科学分析加工后,通过机器学习的方法,为企业选址提供决策依据;本发明所提出的机器学习方法可以仅使用少量数据进行训练便可准确判定出选址结果;
2、本方法使用了区域内完整的电力大数据,以及市场公开全量的第三方数据做为融合,可以对相同客群的品牌门店进行跨地域,多点的横向比较,解决机器学习中样本不足问题,量化选址策略,大大提升选址效率,节约企业选址成本与人工成本;
3、本方法充分利用电力数据具有可信度高、时效性强、连续性好、覆盖面广等特点,通过与市场公开的其它数据源深度融合,能充分提取构建企业选址最核心的特征指标。
附图说明
图1为本发明基于多维数据的门店智能选址推荐方法的具体流程图。
具体实施方式
下面结合附图对本申请作进一步描述。以下实施例仅用于更加清楚地说明本发明的技术方案,而不能以此来限制本申请的保护范围。
基于多维数据的门店智能选址推荐方法,其流程图如图1所示,包括以下步骤:
步骤1,采集门店选址指标所需要的数据并对数据进行清洗融合;
本领域的技术人员可根据实际情况进行数据的采集与清洗和融合,本发明在此处给出的仅为一优选实施例;
构建门店选址指标所需要的数据包括电力数据、工商数据、用电场所GIS地理数据和其他数据;电力数据包括企业账户数量、居民账户数量、月度用电量、正常用电入住标识;
工商数据包括企业名称、成立时间、企业经营状态、所属行业,所属产业;企业经营状态包括存续、在业、吊销、注销、迁入、迁出、停业、清算;
本发明中的企业为零售、餐饮业企业,所选取的企业均为营业时间超过2年的企业;
用电场所GIS地理数据包括用电企业GIS地理数据、用电办公地GIS地理数据、用电居住地GIS地理数据、所选区域内小区数量、交通,医院配套数量;
其他数据包括用电场所楼价数据、用电场所租金信息;
在本实施例中,使用NLP技术中的实体提取和关键词提取方法对政策中提到的地域、企业名称等进行提取与匹配。同时利用NLP的分词等技术,将企业注册地址或电力数据中的装机用能地址提到楼层、门牌号等信息。
步骤2,根据步骤2采集的数据构建企业选址指标并根据所采集数据为每个指标赋值;
本领域的技术人员可根据实际情况构建企业选址指标并对指标进行赋值,本发明在此处给出的仅为一优选实施例;
在本实施例中,所构建的指标如下:
“人流量”:指在所选择用电场所GIS地理数据范围内1天内每平方米的人口密度平均值,该人口密度通过对电力数据进行智能计算获得;本领域的技术人员可选取的智能计算方法包括神经网络、K-Means、DBSCAN以及概率模型;当人流量大于10为高;5-9为中;小于5为低;
“消费能力”:指在所选择用电场所GIS地理数据范围内24小时内用电地区每个用户花费的电费;大于50元为高,25-49元为中,小于25元为低;
“用工成本”:指在所选择用电场所GIS地理数据范围内每平方米内的人均时薪,大于100元为高,50-99元为中,小于55元为低;
“租金成本”:指在所选择用电场所GIS地理数据范围内每个商业住房或居民住房的月租金,大于4000元为高,2000-3999元为中,小于2000元为低;
“同业店面数量”:指在所选择用电场所GIS地理数据范围内每平方米内属于同一行业的店面最大数量;
“写字楼数量”:指在所选择用电场所GIS地理数据范围内每平方米内所存在写字楼总数量;
“小区数量”:指在所选择用电场所GIS地理数据范围内每平方米内存在的小区总数量;
“交通”:指在所选择用电场所GIS地理数据范围内中是否存在公交车站与地铁站,是否有对主要道路进行划分;如果上述三项都存在,则为“好”;存在任意两项为“中”;存在任意一项为“差”;
“基础设施”:指在所选择用电场所GIS地理数据范围内中是否存在学校、医院、文体活动中心、邮电中心、办公楼、住宅区、商业服务中心;如果存在任意5项以上,则为“好”;存在任意3-4项,则为“中”;小于3项则为“差”;
“环保要求”:指政府部门是否对所选择用电场所GIS地理数据范围内指定了环保方面的要求,如垃圾分类、因环保问题不合格而限制企业发展;
“选址效果”:指在所选择用电场所GIS地理数据范围内的企业选择该地址的成功率;如果企业每平方米的年利润达到20万以上则为成功,否则为失败;
本实施例中,所选择用电场所GIS地理数据至少涵盖五平方米的范围;
本实施例所使用数据中的任意3个企业指标对应的指标数据如表1所示:
表1:随机选择的3个企业的选址效果以及其所在用电地区的指标数据
Figure BDA0003401722140000071
Figure BDA0003401722140000081
在输入至机器学习模型时,将语义评估信息“高”转化为数字“3”,“中”转化为数字“2”,“低”转化为数字“1”;
“成功”转化为数字“1”,“失败”转化为数字“0”;
“好”转化为数字3,“中”转化为数字2,“差”转化为数字1;
步骤3,构建机器学习模型;
本领域的技术人员可以根据实际情况选择机器学习模型,如分类树、卷积神经网络,本发明所提供的机器学习模型仅为一优选实施例,其优势是可以在训练数据稀少的情况下进行训练并能够准确地输出判定概率;机器学习模型为由m棵回归树构成的改进回归树群。
具体构建方法如下:
步骤3.1,构建拥有m棵回归树的回归树群,本领域的技术人员可以根据实际情况选择回归树的个数;
步骤3.2,构建回归树群的目标函数;
本领域的技术人员可以根据实际情况选择回归树的目标函数,本实施例提供的仅为一种最佳选择,该目标函数满足以下关系式:
Figure BDA0003401722140000082
其中,m为所有回归树的个数,Tj表示第j棵回归树的节点总数,n表示指标数据总数,
Figure BDA0003401722140000083
表示上一棵回归树判定结果与第j棵回归树判定结果的损失值;当j=1时,
Figure BDA0003401722140000084
表示实际数据与当前回归树判定结果的损失值;l表示损失函数,可选用对数损失函数,平方损失函数或指数损失函数,每棵回归树可选用不同的损失函数;gj和hj分别为第j棵回归树损失函数的第一阶导数与第二阶导数;f(xi)表示;γ为超因子数,根据实际情况进行设置用于控制本函数的复杂程度;xi表示第i条指标数据;ft表示第j棵回归树第t个节点的交叉熵函数,本领域的技术人员可以根据实际情况进行选择,在本发明中,交叉函数满足以下关系式:
ft(xi)=-xilog(xi)-(1-xi)log(1-xi)
步骤3.3,将采集到的数据输入至构建好的回归树群中进行训练;
步骤4,对步骤3构建的机器学习模型进行训练后,输入需要被判定的用电场所GIS地理数据以及其对应的指标数据,反复进行迭代直到前后两次输出的概率值相差在所设定阈值以内,即得到选址结果;
在本实施例中,所设定的阈值为0.05。
步骤5,将输出结果进行展示,供用户决策参考;
本发明还公开了所对应的基于多维数据的门店智能选址推荐系统,包括展示层与应用层;
展示层提供用户交互,用户浏览GIS地理信息,选择感兴趣的用电区域,并将所对应的GIS数据上传至应用层。而应用层模块接收到这些信息,经过计算,将是否成功开店的概率显示的界面上。同时展示层还显示竞品店面等选址信息供用户做横向比较;
应用层模块接收展示层用户传来的GIS数据,通过提取相关指标数据、构建指标、赋值指标、训练机器学习模型计算每个指标的概率,计算所选GIS对应地区的选址成功开率;
具体地,应用层还包括数据采集与清洗模块、指标构建模块、机器学习模型构建模块;
数据采集与清洗模块采集电力数据、工商数据、用电场所GIS地理数据和其他数据,并对这些数据进行清洗融合;
指标构建模块根据数据采集与清洗模块得到的数据构建企业选址指标并根据所采集数据为每个指标赋值;
机器学习模型构建模块构建本发明所要使用的机器学习模型并对该模型进行训练,具体地,本发明中的机器学习模型构建模块通过构建回归树群用于训练,回归树群的目标函数为:
Figure BDA0003401722140000091
其中,
Figure BDA0003401722140000092
表示上一棵回归树判定结果与第j棵回归树判定结果的损失值;当j=1时,
Figure BDA0003401722140000093
表示实际数据与当前回归树判定结果的损失值;l表示损失函数,可选用对数损失函数,平方损失函数或指数损失函数,每棵回归树可选用不同的损失函数;gj和hj分别为第j棵回归树损失函数的第一阶导数与第二阶导数;f(xi)表示;γ为超因子数,根据实际情况进行设置用于控制本函数的复杂程度,Tj表示第j棵回归树的节点总数;xi表示第i条原始数据;ft表示第j棵回归树第t个节点的交叉熵函数,本领域的技术人员可以根据实际情况进行选择,在本发明中,交叉函数满足以下关系式:
ft(xi)=-xilog(xi)-(1-xi)log(1-xi)
应用层模块接收展示层用户传来的GIS选择数据,数据采集模块将对应的相关指标数据提取出来。
本发明申请人结合说明书附图对本发明的实施示例做了详细的说明与描述,但是本领域技术人员应该理解,以上实施示例仅为本发明的优选实施方案,详尽的说明只是为了帮助读者更好地理解本发明精神,而并非对本发明保护范围的限制,相反,任何基于本发明的发明精神所作的任何改进或修饰都应当落在本发明的保护范围之内。

Claims (11)

1.基于多维数据的门店智能选址推荐方法,其特征在于,所述基于多维数据的门店智能选址推荐方法包括以下步骤:
步骤1,采集门店选址指标所需要的数据并对数据进行清洗融合;
步骤2,根据步骤2采集的数据构建企业选址指标并根据所采集数据为每个指标赋值;
步骤3,构建机器学习模型;
步骤4,对步骤3构建的机器学习模型进行训练后,输入需要被判定的用电场所GIS地理数据以及其对应的指标数据,反复进行迭代直到前后两次输出的概率值相差在所设定阈值以内得到最终选址结果。
2.根据权利要求1所述的基于多维数据的门店智能选址推荐方法,其特征在于,
在所述步骤1中,门店选址指标所需要的数据包括电力数据、工商数据、用电场所GIS地理数据和其他数据;电力数据包括企业账户数量、居民账户数量、月度用电量、正常用电入住标识;
工商数据包括企业名称、成立时间、企业经营状态、所属行业,所属产业;企业经营状态包括存续、在业、吊销、注销、迁入、迁出、停业、清算;
所选取的企业均为营业时间超过2年的企业;
用电场所GIS地理数据包括用电企业GIS地理数据、用电办公地GIS地理数据、用电居住地GIS地理数据、所选区域内小区数量、交通,医院配套数量;
其他数据包括用电场所楼价数据、用电场所租金信息。
3.根据权利要求1或2所述的基于多维数据的门店智能选址推荐方法,其特征在于,
在所述步骤2中,所构建的指标包括“人流量”、“消费能力”、“用工成本”、“租金成本”、“同业店面数量”、“写字楼数量”、“小区数量”、“交通”、“基础设施”、“环保要求”以及“选址效果”;
“人流量”:指在所选择用电场所GIS地理数据范围内1天内每平方米的人口密度平均值;当人流量大于10为高;5-9为中;小于5为低;
“消费能力”:指在所选择用电场所GIS地理数据范围内24小时内用电地区每个用户花费的电费;大于50元为高,25-49元为中,小于25元为低;
“用工成本”:指在所选择用电场所GIS地理数据范围内每平方米内的人均时薪,大于100元为高,50-99元为中,小于55元为低;
“租金成本”:指在所选择用电场所GIS地理数据范围内每个商业住房或居民住房的月租金,大于4000元为高,2000-3999元为中,小于2000元为低;
“同业店面数量”:指在所选择用电场所GIS地理数据范围内每平方米内属于同一行业的店面最大数量;
“写字楼数量”:指在所选择用电场所GIS地理数据范围内每平方米内所存在写字楼总数量;
“小区数量”:指在所选择用电场所GIS地理数据范围内每平方米内存在的小区总数量;
“交通”:指在所选择用电场所GIS地理数据范围内中是否存在公交车站与地铁站,是否有对主要道路进行划分;如果上述三项都存在,则为“好”;存在任意两项为“中”;存在任意一项为“差”;
“基础设施”:指在所选择用电场所GIS地理数据范围内中是否存在学校、医院、文体活动中心、邮电中心、办公楼、住宅区、商业服务中心;如果存在任意5项以上,则为“好”;存在任意3-4项,则为“中”;小于3项则为“差”;
“环保要求”:指政府部门是否对所选择用电场所GIS地理数据范围内指定了环保方面的要求,包括垃圾分类、因环保问题不合格而限制企业发展;
“选址效果”:指在所选择用电场所GIS地理数据范围内的企业选择该地址的成功率;如果企业每平方米的年利润达到20万以上则为成功,否则为失败。
4.根据权利要求3所述的基于多维数据的门店智能选址推荐方法,其特征在于,
所述人口密度平均值通过对电力数据进行智能计算获得,可选取的智能计算方法包括神经网络、K-Means、DBSCAN以及概率模型。
5.根据权利要求3所述的基于多维数据的门店智能选址推荐方法,其特征在于,
所选择用电场所GIS地理数据至少涵盖五平方米的范围。
6.根据权利要求3所述的基于多维数据的门店智能选址推荐方法,其特征在于,
在输入至机器学习模型时,将指标中的“高”转化为数字“3”,“中”转化为数字“2”,“低”转化为数字“1”;
“成功”转化为数字“1”,“失败”转化为数字“0”;
“好”转化为数字3,“中”转化为数字2,“差”转化为数字1。
7.根据权利要求1所述的基于多维数据的门店智能选址推荐方法,其特征在于,
在所述步骤3中,机器学习模型为由m棵回归树构成的回归树群。
8.根据权利要求1或7所述的基于多维数据的门店智能选址推荐方法,其特征在于,
所述机器学习模型具体构建方法如下:
步骤3.1,构建拥有m棵回归树的回归树群;
步骤3.2,构建回归树群的目标函数;
该目标函数满足以下关系式:
Figure FDA0003401722130000031
其中,m为所有回归树的个数,Tj表示第j棵回归树的节点总数,n表示指标数据总数,
Figure FDA0003401722130000032
表示第j-1棵回归树判定结果
Figure FDA0003401722130000033
与第j棵回归树判定结果yj的损失值;当j=1时,
Figure FDA0003401722130000034
表示实际数据与当前回归树判定结果的损失值;l表示损失函数,可选用对数损失函数,平方损失函数或指数损失函数,每棵回归树可选用不同的损失函数;gj和hj分别为第j棵回归树损失函数的第一阶导数与第二阶导数;γ为超因子数,Tj表示第j棵回归树的节点总数;xi表示第i条原始数据;ft表示第j棵回归树第t个节点的交叉熵函数;
步骤3.3,将采集到的数据输入至构建好的回归树群中进行训练。
9.根据权利要求8所述的基于多维数据的门店智能选址推荐方法,其特征在于,
所述交叉熵函数满足以下关系式:
ft(xi)=-xilog(xi)-(1-xi)log(1-xi)。
10.基于权利要求1-9任意一项所述的基于多维数据的门店智能选址推荐方法的门店智能选址推荐系统,包括展示层与应用层,其特征在于,
展示层提供用户交互,用户浏览GIS地理信息,选择感兴趣的用电区域,并将所对应的GIS数据上传至应用层;而应用层模块接收到这些信息,经过计算,将是否成功开店的概率显示在界面上;同时展示层还显示竞品店面选址信息供用户做横向比较;
应用层接收展示层用户传来的GIS数据,通过提取相关指标数据、构建指标、赋值指标、训练机器学习模型计算每个指标的概率,计算所选GIS对应地区的选址成功开率。
11.根据权利要求10所述的一种基于电力数据的企业选址评估方法的企业选址评估系统,其特征在于,
所述应用层还包括数据采集与清洗模块、指标构建模块、机器学习模型构建模块;
所述数据采集与清洗模块采集电力数据、工商数据、用电场所GIS地理数据和其他数据,并对这些数据进行清洗融合;
所述指标构建模块根据数据采集与清洗模块得到的数据构建企业选址指标并根据所采集数据为每个指标赋值;
所述机器学习模型构建模块构建本发明所要使用的机器学习模型并对该模型进行训练;
所述应用层接收展示层用户传来的GIS选择数据,数据采集模块将对应的相关指标数据提取出来。
CN202111501258.6A 2021-12-09 2021-12-09 基于多维数据的门店智能选址推荐方法及系统 Pending CN114169933A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111501258.6A CN114169933A (zh) 2021-12-09 2021-12-09 基于多维数据的门店智能选址推荐方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111501258.6A CN114169933A (zh) 2021-12-09 2021-12-09 基于多维数据的门店智能选址推荐方法及系统

Publications (1)

Publication Number Publication Date
CN114169933A true CN114169933A (zh) 2022-03-11

Family

ID=80485052

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111501258.6A Pending CN114169933A (zh) 2021-12-09 2021-12-09 基于多维数据的门店智能选址推荐方法及系统

Country Status (1)

Country Link
CN (1) CN114169933A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114611624A (zh) * 2022-03-22 2022-06-10 广东贤能数字科技有限公司 基于人工智能的商铺或营业厅业务活跃度评价系统及方法
CN115860810A (zh) * 2023-02-07 2023-03-28 广州数说故事信息科技有限公司 一种行业品牌城市开店策略动态监测方法及系统
CN116151839A (zh) * 2023-04-18 2023-05-23 中汽传媒(天津)有限公司 一种汽车售后点动态规划方法及系统

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114611624A (zh) * 2022-03-22 2022-06-10 广东贤能数字科技有限公司 基于人工智能的商铺或营业厅业务活跃度评价系统及方法
CN114611624B (zh) * 2022-03-22 2023-04-07 广东贤能数字科技有限公司 基于人工智能的商铺或营业厅业务活跃度评价系统及方法
CN115860810A (zh) * 2023-02-07 2023-03-28 广州数说故事信息科技有限公司 一种行业品牌城市开店策略动态监测方法及系统
CN116151839A (zh) * 2023-04-18 2023-05-23 中汽传媒(天津)有限公司 一种汽车售后点动态规划方法及系统
CN116151839B (zh) * 2023-04-18 2023-06-27 中汽传媒(天津)有限公司 一种汽车售后点动态规划方法及系统

Similar Documents

Publication Publication Date Title
Ali et al. A data-driven approach for multi-scale GIS-based building energy modeling for analysis, planning and support decision making
CN114169933A (zh) 基于多维数据的门店智能选址推荐方法及系统
CN110705873B (zh) 一种配电网运行状态画像分析方法
CN106022592B (zh) 一种用电行为异常检测与治安风险预警方法及装置
CN106507315A (zh) 一种基于网络社交媒体数据的城市交通事故预测方法和系统
CN106447534A (zh) 一种基于灰色关联度分析的用电模式稳定性判别方法
CN111724039B (zh) 一种向电力用户推荐客服人员的推荐方法
CN108549907A (zh) 一种基于多源迁移学习的数据校验方法
CN112288172A (zh) 台区线损率的预测方法、装置
CN106651093A (zh) 一种用于低压集抄系统的智能复核管控方法
CN116662860A (zh) 一种基于能源大数据的用户画像与分类方法
Xiang et al. Abnormal behaviour analysis algorithm for electricity consumption based on density clustering
CN111612054A (zh) 一种基于非负矩阵分解和密度聚类的用户窃电行为识别方法
CN111797145A (zh) 一种电力客户容忍度评价分类方法
CN104123466A (zh) 一种基于常态模式的大数据态势分析预警方法及系统
Chung et al. Information extraction methodology by web scraping for smart cities
Domínguez et al. Analysis of electric power consumption using Self-Organizing Maps.
CN115049180A (zh) 一种基于标准地址上实有人口、房屋以及单位数据分析的风险预估方法
CN113971213A (zh) 智慧城市管理公共信息共享系统
CN106503880A (zh) 一种低压集抄系统零电量用户的智能辨识方法
Dehler-Holland et al. The legitimacy of wind power in Germany
Yan et al. Cross-domain feature extraction-based household characteristics identification approach using smart meter data
CN113837486B (zh) 一种基于rnn-rbm的配网馈线长期负荷预测方法
Fang et al. Self-training convolutional autoencoder for consumer characteristics identification with imbalance datasets
JP4780670B2 (ja) トラヒック分析モデルの構築方法、装置および構築プログラムならびにその記憶媒体

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination