CN112308603A - 基于相似性扩展的快速门店选址方法及装置、存储介质 - Google Patents

基于相似性扩展的快速门店选址方法及装置、存储介质 Download PDF

Info

Publication number
CN112308603A
CN112308603A CN202011093625.9A CN202011093625A CN112308603A CN 112308603 A CN112308603 A CN 112308603A CN 202011093625 A CN202011093625 A CN 202011093625A CN 112308603 A CN112308603 A CN 112308603A
Authority
CN
China
Prior art keywords
store
seed
site selection
stores
samples
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011093625.9A
Other languages
English (en)
Inventor
王彪
王金明
虞振昕
缪伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Kunzhan Technology Co ltd
Original Assignee
Shenzhen Kunzhan Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Kunzhan Technology Co ltd filed Critical Shenzhen Kunzhan Technology Co ltd
Priority to CN202011093625.9A priority Critical patent/CN112308603A/zh
Publication of CN112308603A publication Critical patent/CN112308603A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0204Market segmentation
    • G06Q30/0205Location or geographical consideration

Landscapes

  • Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Engineering & Computer Science (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Finance (AREA)
  • Game Theory and Decision Science (AREA)
  • Data Mining & Analysis (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于相似性扩展的快速门店选址方法及装置、计算机可读存储介质,该方法包括以下步骤:将经营效果满足预设条件的已有门店作为种子门店,并获取种子门店的经营相关特征;采用特征筛选方法对种子门店的经营相关特征进行特征选取,得到种子门店的主要特征;使用种子门店在门店数据库中进行特征匹配得到正样本,并在门店数据库中根据正样本选取负样本;使用主要特征对正样本和负样本进行表示,并利用正样本和负样本对分类模型进行训练;利用已训练的分类模型对门店数据库中的候选门店进行分类,并返回预设数量的已分类候选门店。本发明实现了对门店选址效果的提升,降低了选址成本,提高了选址效率,达到了快速进行门店选址的效果。

Description

基于相似性扩展的快速门店选址方法及装置、存储介质
技术领域
本申请涉及数据处理技术领域,尤其涉及一种基于相似性扩展的快速门店选址方法及装置、计算机可读存储介质。
背景技术
中国零售行业总体规模巨大,行业集中低,同业竞争激烈,正走在品牌化和连锁化发展的轨道上。大批单枪匹马的小店将被淘汰,少量优质企业将借助品牌和规模优势不断扩大。而对于需要大规模扩张的企业而言,门店的快速选址尤为重要,门店选址的好坏将会极大地影响门店经营效果的好坏。
对于门店选址,目前常用的方法是获取已有门店的特征,根据已有门店的特征对已有门店进行聚类,并根据聚类结果分析确定影响门店经营效果的主要因素,然后基于这些主要因素通过人工寻找合适的门店位置。但是,通过人工基于主要因素进行门店选址的方法,成本高,效率低,且容易受到主观因素影响,难以找到最佳的门店位置。
发明内容
本申请实施例通过提供一种基于相似性扩展的快速门店选址方法及装置、计算机可读存储介质,解决了传统技术中门店选址效果较差的问题,实现了对门店选址效果的提升,并降低了选址成本,提高了选址效率,达到了快速进行门店选址的效果。
本申请实施例提供了一种基于相似性扩展的快速门店选址方法,所述方法包括:
将经营效果满足预设条件的已有门店作为种子门店,并获取所述种子门店的经营相关特征;
采用特征筛选方法对所述种子门店的经营相关特征进行特征选取,得到所述种子门店的主要特征;
使用所述种子门店在门店数据库中进行特征匹配得到正样本,并在所述门店数据库中根据所述正样本选取负样本;
使用所述主要特征对所述正样本和负样本进行表示,并利用所述正样本和负样本对分类模型进行训练;其中,所述分类模型用于对所述正样本和负样本进行区分;
利用已训练的分类模型对所述门店数据库中的候选门店进行分类,并返回预设数量的已分类候选门店。
在一实施例中,所述预设条件为销售量和/或经营利润达到预设值。
在一实施例中,所述采用特征筛选方法对所述种子门店的经营相关特征进行特征选取,得到所述种子门店的主要特征的步骤包括:
使用单因素特征选择方法对所述种子门店的经营相关特征进行特征选取,得到初步筛选后的特征;
使用后向逐步选择方法对所述初步筛选后的特征进行特征选取,得到所述种子门店的主要特征。
在一实施例中,所述主要特征的数量小于或等于预设值。
在一实施例中,所述使用所述种子门店在门店数据库中进行特征匹配得到正样本的步骤包括:
使用所述种子门店在门店数据库中进行特征匹配,并判断特征匹配的结果是否大于或等于预设阈值;
若所述特征匹配的结果大于或等于预设阈值,则将匹配成功的种子门店作为正样本。
在一实施例中,所述使用所述种子门店在门店数据库中进行特征匹配得到正样本的步骤还包括:
若所述特征匹配的结果小于预设阈值,则对匹配失败的种子门店进行数据采集,并将数据采集后的种子门店以及匹配成功的种子门店作为正样本。
在一实施例中,在所述对匹配失败的种子门店进行数据采集的步骤之后,还包括:
将数据采集后的种子门店添加到所述门店数据库中。
在一实施例中,所述正样本与负样本的数量差距小于预设值。
本申请实施例还提供了一种装置,所述装置包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的快速门店选址程序,所述快速门店选址程序被所述处理器执行时实现如上述的基于相似性扩展的快速门店选址方法的步骤。
本申请实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有快速门店选址程序,所述快速门店选址程序被处理器执行时实现如上述的基于相似性扩展的快速门店选址方法的步骤。
本申请实施例中提供的一种基于相似性扩展的快速门店选址方法及装置、计算机可读存储介质的技术方案,至少具有如下技术效果:
由于采用了将经营效果满足预设条件的已有门店作为种子门店,并获取所述种子门店的经营相关特征;采用特征筛选方法对所述种子门店的经营相关特征进行特征选取,得到所述种子门店的主要特征;使用所述种子门店在门店数据库中进行特征匹配得到正样本,并在所述门店数据库中根据所述正样本选取负样本;使用所述主要特征对所述正样本和负样本进行表示,并利用所述正样本和负样本对分类模型进行训练;其中,所述分类模型用于对所述正样本和负样本进行区分;利用已训练的分类模型对所述门店数据库中的候选门店进行分类,并返回预设数量的已分类候选门店的技术手段。所以,有效解决了传统技术中门店选址效果较差的问题,实现了对门店选址效果的提升,并降低了选址成本,提高了选址效率,达到了快速进行门店选址的效果。
附图说明
图1为本申请实施例涉及的装置的结构示意图;
图2为本申请基于相似性扩展的快速门店选址方法的第一实施例的流程示意图;
图3为本申请基于相似性扩展的快速门店选址方法的第二实施例的流程示意图;
图4为本申请基于相似性扩展的快速门店选址方法的第三实施例的流程示意图。
具体实施方式
本申请为了解决传统技术中门店选址效果较差的问题,采用了将经营效果满足预设条件的已有门店作为种子门店,并获取所述种子门店的经营相关特征;采用特征筛选方法对所述种子门店的经营相关特征进行特征选取,得到所述种子门店的主要特征;使用所述种子门店在门店数据库中进行特征匹配得到正样本,并在所述门店数据库中根据所述正样本选取负样本;使用所述主要特征对所述正样本和负样本进行表示,并利用所述正样本和负样本对分类模型进行训练;其中,所述分类模型用于对所述正样本和负样本进行区分;利用已训练的分类模型对所述门店数据库中的候选门店进行分类,并返回预设数量的已分类候选门店的技术方案。实现了对门店选址效果的提升,并降低了选址成本,提高了选址效率,达到了快速进行门店选址的效果。
为了更好地理解上述技术方案,下面将参照附图更详细地描述本申请的示例性实施例。虽然附图中显示了本申请的示例性实施例,然而应当理解,可以以各种形式实现本申请而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本申请,并且能够将本申请的范围完整的传达给本领域的技术人员。
结合图1所示,其为本申请各个实施例中涉及的装置的一种硬件结构示意图,所述装置可以包括:处理器101、存储器102、输入单元103、显示单元104等部件。本领域技术人员可以理解,图1所示的装置的硬件结构并不构成对所述装置的限定,所述装置可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
下面结合图1对所述装置的各个部件进行具体的介绍:
处理器101是装置的控制中心,连接整个装置的各个部分,通过运行或执行存储在存储器102内的程序,以及调用存储在存储器102内的数据,执行装置的各种功能或对数据进行处理,从而对装置进行整体监控。
存储器102可用于存储装置的各种程序以及各种数据。存储器102主要包括存储程序区和存储数据区,其中,存储程序区至少存储了进行快速门店选址所需的程序;存储数据区可以存储装置的各种数据。此外,存储器102可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件或其他易失性固态存储器件。
输入单元103可用于输入进行快速门店选址所需的各种数据。
显示单元104可用于显示门店选址结果。
在本申请实施例中,处理器101可以用于调用存储在存储器102中的快速门店选址程序,并执行以下操作:
将经营效果满足预设条件的已有门店作为种子门店,并获取所述种子门店的经营相关特征;
采用特征筛选方法对所述种子门店的经营相关特征进行特征选取,得到所述种子门店的主要特征;
使用所述种子门店在门店数据库中进行特征匹配得到正样本,并在所述门店数据库中根据所述正样本选取负样本;
使用所述主要特征对所述正样本和负样本进行表示,并利用所述正样本和负样本对分类模型进行训练;其中,所述分类模型用于对所述正样本和负样本进行区分;
利用已训练的分类模型对所述门店数据库中的候选门店进行分类,并返回预设数量的已分类候选门店。
在一实施例中,所述预设条件为销售量和/或经营利润达到预设值。
在一实施例中,处理器101可以用于调用存储在存储器102中的快速门店选址程序,并执行以下操作:
使用单因素特征选择方法对所述种子门店的经营相关特征进行特征选取,得到初步筛选后的特征;
使用后向逐步选择方法对所述初步筛选后的特征进行特征选取,得到所述种子门店的主要特征。
在一实施例中,所述主要特征的数量小于或等于预设值。
在一实施例中,处理器101可以用于调用存储在存储器102中的快速门店选址程序,并执行以下操作:
使用所述种子门店在门店数据库中进行特征匹配,并判断特征匹配的结果是否大于或等于预设阈值;
若所述特征匹配的结果大于或等于预设阈值,则将匹配成功的种子门店作为正样本。
在一实施例中,处理器101可以用于调用存储在存储器102中的快速门店选址程序,并执行以下操作:
若所述特征匹配的结果小于预设阈值,则对匹配失败的种子门店进行数据采集,并将数据采集后的种子门店以及匹配成功的种子门店作为正样本。
在一实施例中,处理器101可以用于调用存储在存储器102中的快速门店选址程序,并执行以下操作:
将数据采集后的种子门店添加到所述门店数据库中。
在一实施例中,所述正样本与负样本的数量差距小于预设值。
本实施例根据上述技术方案,采用了将经营效果满足预设条件的已有门店作为种子门店,并获取所述种子门店的经营相关特征;采用特征筛选方法对所述种子门店的经营相关特征进行特征选取,得到所述种子门店的主要特征;使用所述种子门店在门店数据库中进行特征匹配得到正样本,并在所述门店数据库中根据所述正样本选取负样本;使用所述主要特征对所述正样本和负样本进行表示,并利用所述正样本和负样本对分类模型进行训练;其中,所述分类模型用于对所述正样本和负样本进行区分;利用已训练的分类模型对所述门店数据库中的候选门店进行分类,并返回预设数量的已分类候选门店的技术手段。所以,有效解决了传统技术中门店选址效果较差的问题,实现了对门店选址效果的提升,并降低了选址成本,提高了选址效率,达到了快速进行门店选址的效果。
为了更好地理解上述技术方案,下面将结合说明书附图以及具体的实施方式对上述技术方案进行详细的说明。
结合图2所示,在本申请的第一实施例中,本申请的基于相似性扩展的快速门店选址方法具体包括以下步骤:
步骤S110,将经营效果满足预设条件的已有门店作为种子门店,并获取所述种子门店的经营相关特征。
在本实施例中,所述经营效果为由与各种经营指标相应的经营数据构成的反应门店经营情况的数据。其中,所述经营指标可以是销售量、经营利润等指标。在相似性扩展算法中,通过一定的算法评估模型,可以基于种子数据进行扩展得到更多与种子数据存在潜在关联性的数据。而种子门店即为本申请的基于相似性扩展的快速门店选址方法中用于进行相似性扩展得到其他可能达到与所述种子门店拥有相同经营效果的门店的种子数据。
由于种子门店的经营效果在一定程度上会决定扩展得到的门店能够达到的经营效果,因此在选取种子门店时需要根据对扩展得到的门店的经营效果的期望来设置预设条件。例如,若希望扩展得到的门店的销售量达到某一预设值,则可以将所述预设条件设置为销售量达到该预设值;若希望扩展得到的门店的经营利润达到某一预设值,则可以将所述预设条件设置为经营利润达到该预设值。在一实施例中,所述预设条件为销售量和/或经营利润达到预设值。此时,通过将经营效果满足预设条件的已有门店作为种子门店,即可得到进行相似性扩展所需的种子门店。
而在得到了种子门店之后,还需要获取所述种子门店的经营相关特征,以便后续分析得出影响所述种子门店经营效果的主要特征。其中,所述经营相关特征为与门店经营相关的各种特征,例如,门店位置、门店周边交通情况、门店所处商圈人流量。并且在获取所述种子门店的经营相关特征时应该尽可能多地获取,以避免遗漏与种子门店经营效果高度相关的重要特征。
步骤S120,采用特征筛选方法对所述种子门店的经营相关特征进行特征选取,得到所述种子门店的主要特征。
在本实施例中,为了避免遗漏与种子门店经营效果高度相关的重要特征,我们获取了大量的经营相关特征。但是在使用所述种子门店的特征来训练分类模型时并不能将全部的经营相关特征都作为分类模型的训练数据,一方面是因为将大量的经营相关特征作为分类模型的训练数据会严重影响分类模型的训练速度,另一方面是因为所述大量的经营相关特征中还包含了许多与种子门店经营效果相关度较低的特征,将其与主要特征一起输入分类模型会严重影响分类模型的分类性能。因此在使用经营相关特征来表示种子门店之前,需要采用一定特征筛选方法对所述种子门店的经营相关特征进行特征选取,从而得到所述种子门店的主要特征。其中,为了控制特征维度,提高分类模型训练效率,最终得到的主要特征的数量应小于或等于某一预设值。例如,所述预设值可以是10。
步骤S130,使用所述种子门店在门店数据库中进行特征匹配得到正样本,并在所述门店数据库中根据所述正样本选取负样本。
在本实施例中,所述门店数据库为包含大量门店及其经营相关特征的数据库。其中,所述大量门店中至少包括已有门店和可用于进行门店选址的候选门店。所述特征匹配为利用所述种子门店的主要特征与所述门店数据库中的门店的相应特征进行匹配。若匹配成功,则意味着所述种子门店为所述门店数据库中的门店,可以作为正样本与从所述门店数据库中选出的负样本一起用于对分类模型进行训练;若匹配失败,则意味着所述种子门店不是所述门店数据库中的门店,不能直接作为正样本与从所述门店数据库中选出的负样本一起用于对分类模型进行训练。在一实施例中,在对所述匹配失败的种子门店进行处理后,可以将其作为用于分类模型训练的正样本。
根据所述已经确定的正样本,可以从所述门店数据库中选取用于分类模型训练的负样本。其中,对负样本进行选取的方法可以是在所述门店数据库中对不属于种子门店的门店进行随机选取,也可以是根据所述种子门店的主要特征通过设计更精密的分成抽样进行选取。此外,为了后续更好地对分类模型进行训练,选取得到的负样本的数量应该与所述正样本的数量大致相同。因此,可以将所述正样本和负样本的数量差距限定为小于预设值。其中,所述预设值可以根据实际需要进行设定。
步骤S140,使用所述主要特征对所述正样本和负样本进行表示,并利用所述正样本和负样本对分类模型进行训练。
在本实施例中,所述分类模型用于对所述正样本和负样本进行区分,可以是决策树、Logistic Regression(逻辑回归)、SVM(Support Vector Machine,支持向量机)等典型的分类模型,也可以是其它用于分类的模型。而在利用所述正样本和负样本对分类模型进行训练之前,需要使用之前筛选得到的主要特征对所述正样本和负样本进行表示,从而能够将所述正样本和负样本作为所述分类模型的输入进行所述分类模型的训练,并得到已训练的分类模型。
步骤S150,利用已训练的分类模型对所述门店数据库中的候选门店进行分类,并返回预设数量的已分类候选门店。
在本实施例中,所述候选门店为门店数据库中可用于进行门店选址的门店。而所述预设数量为希望从门店数据库中通过相似性扩展得到的门店的数量。在通过利用正样本和负样本对分类模型进行训练得到已训练的分类模型之后,即可利用所述已训练的分类模型对所述门店数据库中的候选门店进行分类。而在对所述候选门店进行分类后可以得到对应于正样本的候选门店和对应于负样本的候选门店,再从所述对应于正样本的候选门店中选择预设数量的候选门店,即可得到所需的门店选址结果。
上述方法的有益效果为采用了将经营效果满足预设条件的已有门店作为种子门店,并获取所述种子门店的经营相关特征;采用特征筛选方法对所述种子门店的经营相关特征进行特征选取,得到所述种子门店的主要特征;使用所述种子门店在门店数据库中进行特征匹配得到正样本,并在所述门店数据库中根据所述正样本选取负样本;使用所述主要特征对所述正样本和负样本进行表示,并利用所述正样本和负样本对分类模型进行训练;其中,所述分类模型用于对所述正样本和负样本进行区分;利用已训练的分类模型对所述门店数据库中的候选门店进行分类,并返回预设数量的已分类候选门店的技术方案。所以,有效解决了传统技术中门店选址效果较差的问题,实现了对门店选址效果的提升,并降低了选址成本,提高了选址效率,达到了快速进行门店选址的效果。
结合图3所示,在本申请的第二实施例中,本申请的基于相似性扩展的快速门店选址方法具体包括以下步骤:
步骤S210,将经营效果满足预设条件的已有门店作为种子门店,并获取所述种子门店的经营相关特征。
步骤S221,使用单因素特征选择方法对所述种子门店的经营相关特征进行特征选取,得到初步筛选后的特征。
在本实施例中,采用了回归分析的方法对所述种子门店的经营相关特征进行特征选取,来得到所述种子门店的主要特征。首先,使用单因素特征选择方法(UnivariateFeature Selection)对所述种子门店的经营相关特征进行特征选取,得到初步筛选后的特征。其步骤具体包括:假设所述种子门店的经营相关特征为{x1,x2,...xm},门店经营利润为y,则先使用所述经营相关特征分别与经营利润建立单变量回归模型如下所示。
model-1:y=α11*x1
model-2:y=α22*x2
model-m:y=αmm*xm
再从model-1,model-2,…,model-m中选取统计重要性指标p-value小于预设阈值(例如0.1)的模型model-t1,model-t2,…,model-tk,并选取相应的经营相关特征{xt1,xt2,...xtk},即得到了初步筛选后的特征。
步骤S222,使用后向逐步选择方法对所述初步筛选后的特征进行特征选取,得到所述种子门店的主要特征。
在本实施例中,在得到了初步筛选后的特征之后,继续使用后向逐步选择方法对所述初步筛选后的特征进行特征选取,得到所述种子门店的主要特征。其步骤具体包括:先使用初步筛选后得到的经营相关特征{xt1,xt2,...xtk}与门店经营利润y建立多变量回归模型(full-model)如下所示。
y=α01*xt12*xt2+...+ωk*xtk
再逐步依次从所述模型中去除非重要变量,即选取使得模型R2下降值最小的变量逐次移除,直到模型中所有变量的p-value值小于预设阈值(例如0.05)。最后得到留在最终模型中的变量,即为所述种子门店的主要特征。
步骤S230,使用所述种子门店在门店数据库中进行特征匹配得到正样本,并在所述门店数据库中根据所述正样本选取负样本。
步骤S240,使用所述主要特征对所述正样本和负样本进行表示,并利用所述正样本和负样本对分类模型进行训练。
步骤S250,利用已训练的分类模型对所述门店数据库中的候选门店进行分类,并返回预设数量的已分类候选门店。
上述方法的有益效果为在第一实施例的基础上对获得种子门店的主要特征的步骤进行了细化。所以,进一步有效解决了传统技术中门店选址效果较差的问题,实现了对门店选址效果的提升,并降低了选址成本,提高了选址效率,达到了快速进行门店选址的效果。
结合图4所示,在本申请的第三实施例中,本申请的基于相似性扩展的快速门店选址方法具体包括以下步骤:
步骤S310,将经营效果满足预设条件的已有门店作为种子门店,并获取所述种子门店的经营相关特征。
步骤S320,采用特征筛选方法对所述种子门店的经营相关特征进行特征选取,得到所述种子门店的主要特征。
步骤S331,使用所述种子门店在门店数据库中进行特征匹配,并判断特征匹配的结果是否大于或等于预设阈值。
在本实施例中,所述特征匹配结果可以是使用种子门店在门店数据库中进行特征匹配后得到的种子门店的匹配成功率,即匹配成功的种子门店数量与全部种子门店数量之间的比例。所述预设阈值可以根据实际情况进行预先设定。在一实施例中,所述预设阈值可以根据进行特征匹配的种子门店的数量进行设定。例如,在种子门店的数量较大时,可以将预设阈值设置为较低的值;在种子门店的数量较小时,可以将预设阈值设置为较高的值。其目的在于在使所述种子门店在门店数据库中进行特征匹配的过程中得到足够数量的匹配成功的种子门店,从而得到足够数量的正样本。
步骤S332,若所述特征匹配的结果大于或等于预设阈值,则将匹配成功的种子门店作为正样本。
在本实施例中,若所述种子门店的特征匹配结果大于或等于预设阈值,则意味着通过使用所述种子门店在门店数据库中进行特征匹配已经得到了足够数量的匹配成功的种子门店。此时,可以直接将所述匹配成功的种子门店作为用于分类模型训练的正样本。
步骤S333,若所述特征匹配的结果小于预设阈值,则对匹配失败的种子门店进行数据采集,并将数据采集后的种子门店以及匹配成功的种子门店作为正样本。
在本实施例中,若所述种子门店的特征匹配结果小于预设阈值,则意味着通过使用所述种子门店在门店数据库中进行特征匹配没有得到足够数量的匹配成功的种子门店。此时,仍然可以将所述匹配成功的种子门店作为用于分类模型训练的正样本,但是这样无法得到足够数量的正样本。因此,需要对匹配失败的种子门店进行补充数据采集,以使得采集后的种子门店同样可以作为用于分类模型训练的正样本。其中,可以对所有匹配失败的种子门店进行数据采集,也可以只对部分匹配失败的种子门店进行数据采集,只需要使得采集后的种子门店的数量加上匹配成功的种子门店的数量与所有种子门店的数量之间的比例达到预设阈值即可。此外,对于数据采集,既可以通过人工的方式进行,也可以通过装置自动进行,还可以通过两者相结合的方式进行。
步骤S334,将数据采集后的种子门店添加到所述门店数据库中。
在本实施例中,在对匹配失败的种子门店进行数据采集之后,还可以将数据采集后的种子门店添加到所述门店数据库中。
步骤S335,在所述门店数据库中根据所述正样本选取负样本。
步骤S340,使用所述主要特征对所述正样本和负样本进行表示,并利用所述正样本和负样本对分类模型进行训练。
步骤S350,利用已训练的分类模型对所述门店数据库中的候选门店进行分类,并返回预设数量的已分类候选门店。
上述方法的有益效果为在第一实施例的基础上对获取正样本的步骤进行了细化,并通过细化的步骤保证了用于分类模型训练的正样本数量的充足。所以,有效解决了传统技术中门店选址效果较差的问题,进一步实现了对门店选址效果的提升,并降低了选址成本,提高了选址效率,达到了快速进行门店选址的效果。
基于同一发明构思,本申请实施例还提供了一种装置,所述装置包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的快速门店选址程序,所述快速门店选址程序被所述处理器执行时实现如上述的基于相似性扩展的快速门店选址方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
由于本申请实施例提供的装置,为实施本申请实施例的方法所采用的装置,故而基于本申请实施例所介绍的方法,本领域所属人员能够了解该装置的具体结构及变形,故而在此不再赘述。凡是本申请实施例的方法所采用的装置都属于本申请所欲保护的范围。
基于同一发明构思,本申请实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有快速门店选址程序,所述快速门店选址程序被处理器执行时实现如上述的基于相似性扩展的快速门店选址方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
由于本申请实施例提供的计算机可读存储介质,为实施本申请实施例的方法所采用的计算机可读存储介质,故而基于本申请实施例所介绍的方法,本领域所属人员能够了解该计算机可读存储介质的具体结构及变形,故而在此不再赘述。凡是本申请实施例的方法所采用的计算机可读存储介质都属于本申请所欲保护的范围。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
应当注意的是,在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的部件或步骤。位于部件之前的单词“一”或“一个”不排除存在多个这样的部件。本发明可以借助于包括有若干不同部件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (10)

1.一种基于相似性扩展的快速门店选址方法,其特征在于,所述方法包括:
将经营效果满足预设条件的已有门店作为种子门店,并获取所述种子门店的经营相关特征;
采用特征筛选方法对所述种子门店的经营相关特征进行特征选取,得到所述种子门店的主要特征;
使用所述种子门店在门店数据库中进行特征匹配得到正样本,并在所述门店数据库中根据所述正样本选取负样本;
使用所述主要特征对所述正样本和负样本进行表示,并利用所述正样本和负样本对分类模型进行训练;其中,所述分类模型用于对所述正样本和负样本进行区分;
利用已训练的分类模型对所述门店数据库中的候选门店进行分类,并返回预设数量的已分类候选门店。
2.如权利要求1所述的基于相似性扩展的快速门店选址方法,其特征在于,所述预设条件为销售量和/或经营利润达到预设值。
3.如权利要求1所述的基于相似性扩展的快速门店选址方法,其特征在于,所述采用特征筛选方法对所述种子门店的经营相关特征进行特征选取,得到所述种子门店的主要特征的步骤包括:
使用单因素特征选择方法对所述种子门店的经营相关特征进行特征选取,得到初步筛选后的特征;
使用后向逐步选择方法对所述初步筛选后的特征进行特征选取,得到所述种子门店的主要特征。
4.如权利要求1或3所述的基于相似性扩展的快速门店选址方法,其特征在于,所述主要特征的数量小于或等于预设值。
5.如权利要求1所述的基于相似性扩展的快速门店选址方法,其特征在于,所述使用所述种子门店在门店数据库中进行特征匹配得到正样本的步骤包括:
使用所述种子门店在门店数据库中进行特征匹配,并判断特征匹配的结果是否大于或等于预设阈值;
若所述特征匹配的结果大于或等于预设阈值,则将匹配成功的种子门店作为正样本。
6.如权利要求5所述的基于相似性扩展的快速门店选址方法,其特征在于,所述使用所述种子门店在门店数据库中进行特征匹配得到正样本的步骤还包括:
若所述特征匹配的结果小于预设阈值,则对匹配失败的种子门店进行数据采集,并将数据采集后的种子门店以及匹配成功的种子门店作为正样本。
7.如权利要求6所述的基于相似性扩展的快速门店选址方法,其特征在于,在所述对匹配失败的种子门店进行数据采集的步骤之后,还包括:
将数据采集后的种子门店添加到所述门店数据库中。
8.如权利要求1所述的基于相似性扩展的快速门店选址方法,其特征在于,所述正样本与负样本的数量差距小于预设值。
9.一种装置,其特征在于,所述装置包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的快速门店选址程序,所述快速门店选址程序被所述处理器执行时实现如权利要求1至8任一项所述的基于相似性扩展的快速门店选址方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有快速门店选址程序,所述快速门店选址程序被处理器执行时实现如权利要求1至8任一项所述的基于相似性扩展的快速门店选址方法的步骤。
CN202011093625.9A 2020-10-13 2020-10-13 基于相似性扩展的快速门店选址方法及装置、存储介质 Pending CN112308603A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011093625.9A CN112308603A (zh) 2020-10-13 2020-10-13 基于相似性扩展的快速门店选址方法及装置、存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011093625.9A CN112308603A (zh) 2020-10-13 2020-10-13 基于相似性扩展的快速门店选址方法及装置、存储介质

Publications (1)

Publication Number Publication Date
CN112308603A true CN112308603A (zh) 2021-02-02

Family

ID=74488956

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011093625.9A Pending CN112308603A (zh) 2020-10-13 2020-10-13 基于相似性扩展的快速门店选址方法及装置、存储介质

Country Status (1)

Country Link
CN (1) CN112308603A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113301138A (zh) * 2021-05-20 2021-08-24 苏州达家迎信息技术有限公司 目标服务节点的位置确定方法、装置及电子设备

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009145472A1 (ko) * 2008-04-05 2009-12-03 주식회사 타스테크 소상공인의 영업점 입지적합도 및 매출등급 계산 시스템 및 방법
CN108876032A (zh) * 2018-06-12 2018-11-23 阿里巴巴集团控股有限公司 一种对象选址的数据处理方法、装置、设备及系统
CN109377328A (zh) * 2018-12-19 2019-02-22 口口相传(北京)网络技术有限公司 商家门店地理位置的推荐方法及装置
CN110675177A (zh) * 2018-07-03 2020-01-10 百度在线网络技术(北京)有限公司 门店选址方法和装置
CN111666292A (zh) * 2020-04-24 2020-09-15 百度在线网络技术(北京)有限公司 用于检索地理位置的相似度模型建立方法和装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009145472A1 (ko) * 2008-04-05 2009-12-03 주식회사 타스테크 소상공인의 영업점 입지적합도 및 매출등급 계산 시스템 및 방법
CN108876032A (zh) * 2018-06-12 2018-11-23 阿里巴巴集团控股有限公司 一种对象选址的数据处理方法、装置、设备及系统
CN110675177A (zh) * 2018-07-03 2020-01-10 百度在线网络技术(北京)有限公司 门店选址方法和装置
CN109377328A (zh) * 2018-12-19 2019-02-22 口口相传(北京)网络技术有限公司 商家门店地理位置的推荐方法及装置
CN111666292A (zh) * 2020-04-24 2020-09-15 百度在线网络技术(北京)有限公司 用于检索地理位置的相似度模型建立方法和装置

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
刘雄杰: "连锁门店的竞争选址与设计问题研究", 《中国优秀硕士学位论文全文数据库 (经济与管理科学辑)》 *
肖正中;嵩涛;蒋伟;: "基于最优尺度回归的黔彩新零售连锁便利店区位选择研究", 时代经贸, no. 22, pages 60 - 61 *
臧恒佳;王萌;: "多元线性回归和判别分析在连锁店选址中的应用", 统计与咨询, no. 01, pages 62 - 63 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113301138A (zh) * 2021-05-20 2021-08-24 苏州达家迎信息技术有限公司 目标服务节点的位置确定方法、装置及电子设备
CN113301138B (zh) * 2021-05-20 2024-05-07 苏州达家迎信息技术有限公司 目标服务节点的位置确定方法、装置及电子设备

Similar Documents

Publication Publication Date Title
CN111078994B (zh) 基于画像的医学科普文章推荐方法及系统
CN109271374B (zh) 一种基于机器学习的数据库健康度打分方法和打分系统
CN111311401A (zh) 一种基于LightGBM的金融违约概率预测模型
CN110610193A (zh) 标注数据的处理方法及装置
CN108563555B (zh) 基于四目标优化的故障更改代码预测方法
CN110069690B (zh) 一种主题网络爬虫方法、装置及介质
CN112765230B (zh) 基于互联网金融的支付大数据分析方法及大数据分析系统
CN108509727B (zh) 数据建模中的模型选择处理方法及装置
CN115796312A (zh) 一种多变量时间序列预测方法及系统
CN110737805A (zh) 图模型数据的处理方法、装置和终端设备
CN111680085A (zh) 数据处理任务分析方法、装置、电子设备和可读存储介质
CN115576834A (zh) 支撑故障还原的软件测试复用方法、系统、终端及介质
CN112308603A (zh) 基于相似性扩展的快速门店选址方法及装置、存储介质
US20190370600A1 (en) Accessible machine learning
CN116501979A (zh) 信息推荐方法、装置、计算机设备及计算机可读存储介质
CN113628077B (zh) 生成不重复考题的方法、终端及可读存储介质
CN107957944B (zh) 面向用户数据覆盖率的测试用例自动生成方法
CN114637917A (zh) 基于人工智能的资讯头条推荐方法及装置
CN115167965A (zh) 交易进度条的处理方法及装置
CN114595262A (zh) 一种市政道路epc项目招标清单的快速生成方法及系统
CN113095589A (zh) 一种人口属性确定方法、装置、设备及存储介质
CN113065067A (zh) 一种物品推荐方法、装置、计算机设备及存储介质
US11989517B2 (en) Conversational automated machine learning
CN112684909B (zh) 输入法联想效果评测方法、装置、电子设备及存储介质
CN113886579B (zh) 行业资讯正负面模型构建方法和系统、识别方法和系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination