CN109409923A - 销售区域的分配方法、计算机可读存储介质及终端设备 - Google Patents
销售区域的分配方法、计算机可读存储介质及终端设备 Download PDFInfo
- Publication number
- CN109409923A CN109409923A CN201811017012.XA CN201811017012A CN109409923A CN 109409923 A CN109409923 A CN 109409923A CN 201811017012 A CN201811017012 A CN 201811017012A CN 109409923 A CN109409923 A CN 109409923A
- Authority
- CN
- China
- Prior art keywords
- region
- training
- sales region
- random forest
- sample
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
- G06Q30/0204—Market segmentation
- G06Q30/0205—Location or geographical consideration
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Entrepreneurship & Innovation (AREA)
- Accounting & Taxation (AREA)
- Development Economics (AREA)
- Finance (AREA)
- Strategic Management (AREA)
- General Physics & Mathematics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Economics (AREA)
- Game Theory and Decision Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明适用于大数据技术领域,提供了一种销售区域的分配方法、计算机可读存储介质及终端设备,包括:将预设区域按照预设规则划分为N个销售区域,并获取每个销售区域的区域信息;从所述N个销售区域中选取M个区域作为样本区域,分别将每个样本区域的区域信息作为一个训练样本,并将M个训练样本组成训练样本集;建立随机森林模型,并根据所述训练样本集对所述随机森林模型进行训练;根据所述训练后的随机森林模型分别预测每个销售区域的潜在客户数量,并根据预测出的各销售区域的潜在客户数量,对各销售人员的销售区域进行分配。通过上述方法,能够既高效又合理地对各销售区域进行分配。
Description
技术领域
本发明涉及大数据技术领域,尤其涉及一种销售区域的分配方法、计算机可读存储介质及终端设备。
背景技术
在很多行业中,销售区域一般是由人工进行分配的,销售人员按照分配好的销售区域进行业务拓展;或者是不限定销售区域,直接由销售人员自行进行业务拓展。
如果是由人工分配销售区域,需要人工收集大量的客户信息,并对客户信息进行分析,之后制定较合理的销售区域分配方案。这样的方法会消耗大量的人力资源、效率较低。
如果不限定销售区域,那么当某一区域的潜在客户比较集中时,可能会有多个销售人员先后或同时对该区域进行业务扩展。这样会导致销售工作的重复、业务拓展效率较低。
因此,如何既高效又合理地分配销售区域对于销售行业来说,是一个亟需解决的问题。
发明内容
有鉴于此,本发明实施例提供了一种销售区域的分配方法、计算机可读存储介质及终端设备,以解决如何既高效又合理地分配销售区域的问题。
本发明实施例的第一方面,提供了销售区域的分配方法,可以包括:
将预设区域按照预设规则划分为N个销售区域,并获取每个销售区域的区域信息,所述N为大于1的自然数;
从所述N个销售区域中选取M个区域作为样本区域,分别将每个样本区域的区域信息作为一个训练样本,并将M个训练样本组成训练样本集,所述M为小于N的自然数;
建立随机森林模型,并根据所述训练样本集对所述随机森林模型进行训练;
对训练后的随机森林模型进行测试得到测试结果,并判断所述测试结果是否符合预期结果;
若所述测试结果不符合预期结果,则重新训练所述随机森林模型;
若所述测试结果符合预期结果,则根据所述训练后的随机森林模型分别预测每个销售区域的潜在客户数量,并根据预测出的各销售区域的潜在客户数量,对各销售人员的销售区域进行分配。
本发明实施例的第二方面,提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如下步骤:
将预设区域按照预设规则划分为N个销售区域,并获取每个销售区域的区域信息,所述N为大于1的自然数;
从所述N个销售区域中选取M个区域作为样本区域,分别将每个样本区域的区域信息作为一个训练样本,并将M个训练样本组成训练样本集,所述M为小于N的自然数;
建立随机森林模型,并根据所述训练样本集对所述随机森林模型进行训练;
对训练后的随机森林模型进行测试得到测试结果,并判断所述测试结果是否符合预期结果;
若所述测试结果不符合预期结果,则重新训练所述随机森林模型;
若所述测试结果符合预期结果,则根据所述训练后的随机森林模型分别预测每个销售区域的潜在客户数量,并根据预测出的各销售区域的潜在客户数量,对各销售人员的销售区域进行分配。
本发明实施例的第三方面,提供了一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如下步骤:
将预设区域按照预设规则划分为N个销售区域,并获取每个销售区域的区域信息,所述N为大于1的自然数;
从所述N个销售区域中选取M个区域作为样本区域,分别将每个样本区域的区域信息作为一个训练样本,并将M个训练样本组成训练样本集,所述M为小于N的自然数;
建立随机森林模型,并根据所述训练样本集对所述随机森林模型进行训练;
对训练后的随机森林模型进行测试得到测试结果,并判断所述测试结果是否符合预期结果;
若所述测试结果不符合预期结果,则重新训练所述随机森林模型;
若所述测试结果符合预期结果,则根据所述训练后的随机森林模型分别预测每个销售区域的潜在客户数量,并根据预测出的各销售区域的潜在客户数量,对各销售人员的销售区域进行分配。
本发明实施例与现有技术相比存在的有益效果是:
本发明实施例通过建立训练样本集,并利用训练样本集训练随机森林模型,能够有效统计各销售区域的区域信息;利用训练好的随机森林模型预测每个销售区域的潜在客户数量,能够较准确地预测出各销售区域的潜在客户数量;根据预测的每个销售区域的潜在客户数量对销售区域进行分配,有效保证了对各销售区域分配的合理性。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的销售区域的分配方法的实现流程示意图;
图2是本发明实施例提供的销售区域的分配装置的示意图;
图3是本发明实施例提供的终端设备的示意图。
具体实施方式
以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本发明实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本发明。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本发明的描述。
应当理解,当在本说明书和所附权利要求书中使用时,术语“包括”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
还应当理解,在此本发明说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本发明。如在本发明说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。
还应当进一步理解,在本发明说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
如在本说明书和所附权利要求书中所使用的那样,术语“如果”可以依据上下文被解释为“当...时”或“一旦”或“响应于确定”或“响应于检测到”。类似地,短语“如果确定”或“如果检测到[所描述条件或事件]”可以依据上下文被解释为意指“一旦确定”或“响应于确定”或“一旦检测到[所描述条件或事件]”或“响应于检测到[所描述条件或事件]”。
为了说明本发明所述的技术方案,下面通过具体实施例来进行说明。
图1是本发明实施例提供的销售区域的分配方法的实现流程示意图,如图所示,所述方法可以包括以下步骤:
步骤S101,将预设区域按照预设规则划分为N个销售区域,并获取每个销售区域的区域信息,所述N为大于1的自然数。
在实际应用中,预设区域可以是一个国家、一个城市或一个行政区,根据实际需要设定预设区域,在此不做具体限定。预设规则可以是根据预设区域的大小预先设定的。示例性的,如果预设区域是一个国家,预设规则可以是按照省份划分,也可以是按照城市划分;如果预设区域是一个城市,预设规则可以是按照行政区划分;如果预设区域是一个行政区,预设规则可以是按照区域大小(如1公里范围)进行划分。上述只是划分销售区域的示例,并不对如何预设规则做具体限定。
其中,所述区域信息中包括X个特征信息,所述X为大于1的自然数。
可选的,所述区域信息包括:
地理特征信息、客户量特征信息和申请量特征信息。
所述地理特征信息包括:日化餐饮类商户的数量、日化餐饮类商户的比重、五金建材类商户的数量、五金建材类商户的比重、批发类商户的数量以及批发类商户的比重。
所述客户量特征信息包括:当前预设时间段的客户数量、历史客户数量和数量变化量。
所述申请量特征信息包括:当前预设时间段的申请量和历史申请量。
其中,预设时间段可以是一个月、一个季度或一年等。历史客户数量与预设时间段的客户数量相对应。例如,如果预设时间段为一个月,假设当前月为11月,那么历史客户数量对应的就是11月以前每个月的客户数量。需要说明的是,上述只是区域信息的示例,在实际应用中,还可以包括其他区域信息,只要是可以反应某个区域的销售特征的信息均可以作为区域信息,在此不做具体限定。
步骤S102,从所述N个销售区域中选取M个区域作为样本区域,分别将每个样本区域的区域信息作为一个训练样本,并将M个训练样本组成训练样本集,所述M为小于N的自然数。
在实际应用中,可以从N个销售区域中随机选取M个区域作为样本区域,那么对应的就有M个训练样本。随机选取的好处是,排除样本的特殊性,使得样本更具普遍性。
步骤S103,建立随机森林模型,并根据所述训练样本集对所述随机森林模型进行训练。
其中,所述建立随机森林模型包括K个决策树,所述K为大于1的自然数。
随机森林模型是一个包含多个决策树的分类器,它能够对样本进行训练并预测。随机森林模型能够快速地对大数据进行处理,并且能够产生高准确度的分类结果。在对随机森林模型进行训练的过程中,假设该随机森林模型中有n棵决策树,则至少需要n个具有一定样本数量的样本集来分别训练每一棵树。
可选的,所述根据所述训练样本集对所述随机森林模型进行训练,包括:
从所述训练样本集中有放回的抽取H个训练样本,并分别从每个训练样本中抽取Y个特征信息,所述H为小于或等于M的自然数,所述Y为小于或等于X的自然数。
利用所述H个训练样本以及每个训练样本中的Y个特征信息,对第k个决策树进行训练,所述k为小于或等于K的自然数。
判断所述K个决策树中是否存在未训练的决策树。
若所述K个决策树中不存在未训练的决策树,则根据训练后的K个决策树得到训练后的随机森林模型。
若所述K个决策树中存在未训练的决策树,则继续对未训练的决策树进行训练。
在实际应用中,在对第k个决策树进行训练时,需要先构建一个样本子集,该样本子集中包括从训练样本集中有放回地抽取的H个训练样本,以及从每个训练样本中抽取的Y个特征信息。示例性的,假设训练样本集中共有100个样本,每个样本有5个特征信息。从训练样本集中有放回地抽取20个样本作为样本子集,从这个样本子集中的每个样本中抽取3个特征信息,那么共有3×20个特征信息。利用这20个样本和3×20个特征信息对第k个决策树进行训练。有放回地抽取可以增加样本选择的随机性。
在第k个决策树训练完成后,判断所有的K个决策树是否都已训练完成,如果存在未训练的决策树,则继续对未训练的决策树进行训练,直到所有的K个决策树均被训练。在对下一个决策树进行训练时,需要按照上述方法,重新选取样本子集以及样本子集中的样本的特征信息。换句话说,训练每颗决策树时所用的样本均不相同。这样可以使更多的样本发挥作用,保证了训练后的随机森林模型更准确。
另外,在对随机森林模型中的各决策树进行训练时,可以按照一定的顺序依次进行训练,也可以随机选取未训练的决策树进行训练。每个决策树进行一次训练即可。
步骤S104,对训练后的随机森林模型进行测试得到测试结果,并判断所述测试结果是否符合预期结果。
其中,预期结果可以是预设阈值。例如,测试结果大于预设阈值,则说明测试结果符合预期结果,否则,则说明测试结果不符合预期结果。
可选的,所述对训练后的随机森林模型进行测试得到测试结果,包括:
从剩余销售区域中选取L个区域作为测试区域,所述剩余销售区域为所述N个销售区域中不属于所述样本区域的区域,所述L≦N-M。
分别将每个测试区域的区域信息作为一个测试样本,并将所有的测试样本组成测试样本集。
将所述测试样本集输入所述训练后的随机森林模型中,得到输出结果。
根据所述输出结果和所述测试样本集建立混淆矩阵,并根据所述混淆矩阵计算出测试结果。
在实际应用中,作为样本区域的销售区域不再作为测试区域。例如,共划分为10个销售区域,其中选取6个作为样本区域,则从剩余的4个销售区域中选取2个作为测试区域。
其中,混淆矩阵也称误差矩阵,是表示精度评价的一种标准格式。示例性的,混淆矩阵的每一列可以代表预测类别,每一行可以代表数据的真实归属类别,每一列中的数值可以表示真实数据被预测为该类的数目,每一行的数据总数可以表示该类别的数据实例的数据,每一列的总数可以表示预测为该类别的数据的数目。
可选的,所述根据所述混淆矩阵计算出测试结果,包括:
从所述混淆矩阵中获得指标数据,所述指标数据包括正例样本数量、负例样本数量、正确预测的正例数量、负例预测为正例的数量以及正例预测为负例的数量。
根据所述指标数据分别计算分类准确度、召回率、虚警率以及精确度,并将计算出的准确度、召回率、虚警率以及精确度作为测试结果。
示例性的,假设属于I类的样本为正例样本,不属于I类的样本为负例样本,样本A属于I类,样本B不属于I类。如果样本A输入随机森林模型后的输出结果为A属于I类,则该结果为正确预测的正例;如果样本A输入随机森林模型后的输出结果为A不属于I类,则该结果为正例预测为负例;如果样本B输入随机森林模型后的输出结果为B属于I类,则该结果为负例预测为正例。
从混淆矩阵中即可分别统计出正例样本数量、负例样本数量、正确预测的正例样本数量、负例预测为正例的数量以及正例预测为负例的数量,将上述数据作为指标数据,根据指标数据计算分类准确度、召回率、虚警率和精确度等。
可选的,所述根据所述指标数据分别计算分类准确度、召回率、虚警率以及精确度,包括:
根据计算分类准确度。
根据计算召回率。
根据计算虚警率。
根据计算精确度。
其中,Accuracy为所述分类准确度,Recall为所述召回率,FPrate为所述虚警率,Precision为所述精确度,P为所述正例样本数量,N为所述负例样本数量,TP为所述正确预测的正例数量,FP为所述负例预测为正例的数量,TN为所述正例预测为负例的数量。
步骤S105,若所述测试结果不符合预期结果,则重新训练所述随机森林模型。
在实际应用中,预期结果可以是一个综合指标,例如,预期结果可以为分类准确度达到A值、召回率小于B值、虚警率小于C值且精确度达到D值。对应的,当分类准确度达到A值、召回率小于B值、虚警率小于C值且精确度达到D值时,即为满足预期结果。
步骤S106,若所述测试结果符合预期结果,则根据所述训练后的随机森林模型分别预测每个销售区域的潜在客户数量,并根据预测出的各销售区域的潜在客户数量,对各销售人员的销售区域进行分配。
在实际应用中,可以统计各销售人员的业务能力,根据预测出的各销售区的潜在客户数量以及各销售人员的业务能力分配销售区域。例如,销售员A月拜访客户量为20,销售员B月拜访客户量为30,假设预测出的I销售区域的潜在客户数量为15,II销售区域的潜在客户数量为25,则可以将I销售区域分配给销售员A,将II销售区域分配给销售员B。再假设预测出的III销售区域的潜在客户数量为50,则可以将III销售区域同时分配给销售员A和B。当然,还可以将III销售区域作为本方法中的预设区域,对其进一步划分,以增加销售区域的划分精度。
本发明实施例通过建立训练样本集,并利用训练样本集训练随机森林模型,能够有效统计各销售区域的区域信息;利用训练好的随机森林模型预测每个销售区域的潜在客户数量,能够较准确地预测出各销售区域的潜在客户数量;根据预测的每个销售区域的潜在客户数量对销售区域进行分配,有效保证了对各销售区域分配的合理性。
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
图2是本发明实施例提供的销售区域的分配装置的示意图,为了便于说明,仅示出与本发明实施例相关的部分。
图2所示的销售区域的分配装置可以是内置于现有的终端设备内的软件单元、硬件单元、或软硬结合的单元,也可以作为独立的挂件集成到所述终端设备中,还可以作为独立的终端设备存在。
所述销售区域的分配装置2包括:
划分单元21,用于将预设区域按照预设规则划分为N个销售区域,并获取每个销售区域的区域信息,所述N为大于1的自然数。
选取单元22,用于从所述N个销售区域中选取M个区域作为样本区域,分别将每个样本区域的区域信息作为一个训练样本,并将M个训练样本组成训练样本集,所述M为小于N的自然数。
建立单元23,用于建立随机森林模型,并根据所述训练样本集对所述随机森林模型进行训练。
测试单元24,用于对训练后的随机森林模型进行测试得到测试结果,并判断所述测试结果是否符合预期结果。
训练单元25,用于若所述测试结果不符合预期结果,则重新训练所述随机森林模型。
预测单元26,用于若所述测试结果符合预期结果,则根据所述训练后的随机森林模型分别预测每个销售区域的潜在客户数量,并根据预测出的各销售区域的潜在客户数量,对各销售人员的销售区域进行分配。
可选的,所述区域信息中包括X个特征信息,所述X为大于1的自然数。
所述建立随机森林模型包括K个决策树,所述K为大于1的自然数。
可选的,所述建立单元23包括:
抽取子单元,用于从所述训练样本集中有放回的抽取H个训练样本,并分别从每个训练样本中抽取Y个特征信息,所述H为小于或等于M的自然数,所述Y为小于或等于X的自然数。
第一训练子单元,用于利用所述H个训练样本以及每个训练样本中的Y个特征信息,对第k个决策树进行训练,所述k为小于或等于K的自然数。
判断子单元,用于判断所述K个决策树中是否存在未训练的决策树。
建立子单元,用于若所述K个决策树中不存在未训练的决策树,则根据训练后的K个决策树得到训练后的随机森林模型。
第二训练子单元,用于若所述K个决策树中存在未训练的决策树,则继续对未训练的决策树进行训练。
可选的,所述测试单元24包括:
选取子单元,用于从剩余销售区域中选取L个区域作为测试区域,所述剩余销售区域为所述N个销售区域中不属于所述样本区域的区域,所述L≦N-M。
组成子单元,用于分别将每个测试区域的区域信息作为一个测试样本,并将所有的测试样本组成测试样本集。
输入子单元,用于将所述测试样本集输入所述训练后的随机森林模型中,得到输出结果。
计算子单元,用于根据所述输出结果和所述测试样本集建立混淆矩阵,并根据所述混淆矩阵计算出测试结果。
可选的,所述计算子单元包括:
获取模块,用于从所述混淆矩阵中获得指标数据,所述指标数据包括正例样本数量、负例样本数量、正确预测的正例数量、负例预测为正例的数量以及正例预测为负例的数量。
计算模块,用于根据所述指标数据分别计算分类准确度、召回率、虚警率以及精确度,并将计算出的准确度、召回率、虚警率以及精确度作为测试结果。
可选的,所述计算模块包括:
第一计算子模块,用于根据计算分类准确度。
第二计算子模块,用于根据计算召回率。
第三计算子模块,用于根据计算虚警率。
第四计算子模块,用于根据计算精确度。
其中,Accuracy为所述分类准确度,Recall为所述召回率,FPrate为所述虚警率,Precision为所述精确度,P为所述正例样本数量,N为所述负例样本数量,TP为所述正确预测的正例数量,FP为所述负例预测为正例的数量,TN为所述正例预测为负例的数量。
可选的,所述区域信息包括:
地理特征信息、客户量特征信息和申请量特征信息。
所述地理特征信息包括:日化餐饮类商户的数量、日化餐饮类商户的比重、五金建材类商户的数量、五金建材类商户的比重、批发类商户的数量以及批发类商户的比重。
所述客户量特征信息包括:当前预设时间段的客户数量、历史客户数量和数量变化量。
所述申请量特征信息包括:当前预设时间段的申请量和历史申请量。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本发明的保护范围。上述系统中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
图3是本发明实施例提供的终端设备的示意图。如图3所示,该实施例的终端设备3包括:处理器30、存储器31以及存储在所述存储器31中并可在所述处理器30上运行的计算机程序32。所述处理器30执行所述计算机程序32时实现上述各个销售区域的分配方法实施例中的步骤,例如图1所示的步骤S101至S106。或者,所述处理器30执行所述计算机程序32时实现上述各装置实施例中各模块/单元的功能,例如图2所示模块21至26的功能。
示例性的,所述计算机程序32可以被分割成一个或多个模块/单元,所述一个或者多个模块/单元被存储在所述存储器31中,并由所述处理器30执行,以完成本发明。所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述所述计算机程序32在所述终端设备3中的执行过程。例如,所述计算机程序32可以被分割成划分单元、选取单元、建立单元、测试单元、训练单元、预测单元,各单元具体功能如下:
划分单元,用于将预设区域按照预设规则划分为N个销售区域,并获取每个销售区域的区域信息,所述N为大于1的自然数。
选取单元,用于从所述N个销售区域中选取M个区域作为样本区域,分别将每个样本区域的区域信息作为一个训练样本,并将M个训练样本组成训练样本集,所述M为小于N的自然数。
建立单元,用于建立随机森林模型,并根据所述训练样本集对所述随机森林模型进行训练。
测试单元,用于对训练后的随机森林模型进行测试得到测试结果,并判断所述测试结果是否符合预期结果。
训练单元,用于若所述测试结果不符合预期结果,则重新训练所述随机森林模型。
预测单元,用于若所述测试结果符合预期结果,则根据所述训练后的随机森林模型分别预测每个销售区域的潜在客户数量,并根据预测出的各销售区域的潜在客户数量,对各销售人员的销售区域进行分配。
可选的,所述区域信息中包括X个特征信息,所述X为大于1的自然数。
所述建立随机森林模型包括K个决策树,所述K为大于1的自然数。
可选的,所述建立单元包括:
抽取子单元,用于从所述训练样本集中有放回的抽取H个训练样本,并分别从每个训练样本中抽取Y个特征信息,所述H为小于或等于M的自然数,所述Y为小于或等于X的自然数。
第一训练子单元,用于利用所述H个训练样本以及每个训练样本中的Y个特征信息,对第k个决策树进行训练,所述k为小于或等于K的自然数。
判断子单元,用于判断所述K个决策树中是否存在未训练的决策树。
建立子单元,用于若所述K个决策树中不存在未训练的决策树,则根据训练后的K个决策树得到训练后的随机森林模型。
第二训练子单元,用于若所述K个决策树中存在未训练的决策树,则继续对未训练的决策树进行训练。
可选的,所述测试单元包括:
选取子单元,用于从剩余销售区域中选取L个区域作为测试区域,所述剩余销售区域为所述N个销售区域中不属于所述样本区域的区域,所述L≦N-M。
组成子单元,用于分别将每个测试区域的区域信息作为一个测试样本,并将所有的测试样本组成测试样本集。
输入子单元,用于将所述测试样本集输入所述训练后的随机森林模型中,得到输出结果。
计算子单元,用于根据所述输出结果和所述测试样本集建立混淆矩阵,并根据所述混淆矩阵计算出测试结果。
可选的,所述计算子单元包括:
获取模块,用于从所述混淆矩阵中获得指标数据,所述指标数据包括正例样本数量、负例样本数量、正确预测的正例数量、负例预测为正例的数量以及正例预测为负例的数量。
计算模块,用于根据所述指标数据分别计算分类准确度、召回率、虚警率以及精确度,并将计算出的准确度、召回率、虚警率以及精确度作为测试结果。
可选的,所述计算模块包括:
第一计算子模块,用于根据计算分类准确度。
第二计算子模块,用于根据计算召回率。
第三计算子模块,用于根据计算虚警率。
第四计算子模块,用于根据计算精确度。
其中,Accuracy为所述分类准确度,Recall为所述召回率,FPrate为所述虚警率,Precision为所述精确度,P为所述正例样本数量,N为所述负例样本数量,TP为所述正确预测的正例数量,FP为所述负例预测为正例的数量,TN为所述正例预测为负例的数量。
可选的,所述区域信息包括:
地理特征信息、客户量特征信息和申请量特征信息。
所述地理特征信息包括:日化餐饮类商户的数量、日化餐饮类商户的比重、五金建材类商户的数量、五金建材类商户的比重、批发类商户的数量以及批发类商户的比重。
所述客户量特征信息包括:当前预设时间段的客户数量、历史客户数量和数量变化量。
所述申请量特征信息包括:当前预设时间段的申请量和历史申请量。
所述终端设备3可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。所述终端设备可包括,但不仅限于,处理器30、存储器31。本领域技术人员可以理解,图3仅仅是终端设备3的示例,并不构成对终端设备3的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述终端设备还可以包括输入输出设备、网络接入设备、总线等。
所称处理器30可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
所述存储器31可以是所述终端设备3的内部存储单元,例如终端设备3的硬盘或内存。所述存储器31也可以是所述终端设备3的外部存储设备,例如所述终端设备3上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。进一步地,所述存储器31还可以既包括所述终端设备3的内部存储单元也包括外部存储设备。所述存储器31用于存储所述计算机程序以及所述终端设备所需的其他程序和数据。所述存储器31还可以用于暂时地存储已经输出或者将要输出的数据。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
在本发明所提供的实施例中,应该理解到,所揭露的装置/终端设备和方法,可以通过其它的方式实现。例如,以上所描述的装置/终端设备实施例仅仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括是电载波信号和电信信号。
以上所述实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围,均应包含在本发明的保护范围之内。
Claims (10)
1.一种销售区域的分配方法,其特征在于,包括:
将预设区域按照预设规则划分为N个销售区域,并获取每个销售区域的区域信息,所述N为大于1的自然数;
从所述N个销售区域中选取M个区域作为样本区域,分别将每个样本区域的区域信息作为一个训练样本,并将M个训练样本组成训练样本集,所述M为小于N的自然数;
建立随机森林模型,并根据所述训练样本集对所述随机森林模型进行训练;
对训练后的随机森林模型进行测试得到测试结果,并判断所述测试结果是否符合预期结果;
若所述测试结果不符合预期结果,则重新训练所述随机森林模型;
若所述测试结果符合预期结果,则根据所述训练后的随机森林模型分别预测每个销售区域的潜在客户数量,并根据预测出的各销售区域的潜在客户数量,对各销售人员的销售区域进行分配。
2.如权利要求1所述的销售区域的分配方法,其特征在于,所述区域信息中包括X个特征信息,所述X为大于1的自然数;
所述建立随机森林模型包括K个决策树,所述K为大于1的自然数。
3.如权利要求2所述的销售区域的分配方法,其特征在于,所述根据所述训练样本集对所述随机森林模型进行训练,包括:
从所述训练样本集中有放回的抽取H个训练样本,并分别从每个训练样本中抽取Y个特征信息,所述H为小于或等于M的自然数,所述Y为小于或等于X的自然数;
利用所述H个训练样本以及每个训练样本中的Y个特征信息,对第k个决策树进行训练,所述k为小于或等于K的自然数;
判断所述K个决策树中是否存在未训练的决策树;
若所述K个决策树中不存在未训练的决策树,则根据训练后的K个决策树得到训练后的随机森林模型;
若所述K个决策树中存在未训练的决策树,则继续对未训练的决策树进行训练。
4.如权利要求3所述的销售区域的分配方法,其特征在于,所述对训练后的随机森林模型进行测试得到测试结果,包括:
从剩余销售区域中选取L个区域作为测试区域,所述剩余销售区域为所述N个销售区域中不属于所述样本区域的区域,所述L≦N-M;
分别将每个测试区域的区域信息作为一个测试样本,并将所有的测试样本组成测试样本集;
将所述测试样本集输入所述训练后的随机森林模型中,得到输出结果;
根据所述输出结果和所述测试样本集建立混淆矩阵,并根据所述混淆矩阵计算出测试结果。
5.如权利要求4所述的销售区域的分配方法,其特征在于,所述根据所述混淆矩阵计算出测试结果,包括:
从所述混淆矩阵中获得指标数据,所述指标数据包括正例样本数量、负例样本数量、正确预测的正例数量、负例预测为正例的数量以及正例预测为负例的数量;
根据所述指标数据分别计算分类准确度、召回率、虚警率以及精确度,并将计算出的准确度、召回率、虚警率以及精确度作为测试结果。
6.如权利要求5所述的销售区域的分配方法,其特征在于,所述根据所述指标数据分别计算分类准确度、召回率、虚警率以及精确度,包括:
根据计算分类准确度;
根据计算召回率;
根据计算虚警率;
根据计算精确度;
其中,Accuracy为所述分类准确度,Recall为所述召回率,FPrate为所述虚警率,Precision为所述精确度,P为所述正例样本数量,N为所述负例样本数量,TP为所述正确预测的正例数量,FP为所述负例预测为正例的数量,TN为所述正例预测为负例的数量。
7.如权利要求6所述的销售区域的分配方法,其特征在于,所述区域信息包括:
地理特征信息、客户量特征信息和申请量特征信息;
所述地理特征信息包括:日化餐饮类商户的数量、日化餐饮类商户的比重、五金建材类商户的数量、五金建材类商户的比重、批发类商户的数量以及批发类商户的比重;
所述客户量特征信息包括:当前预设时间段的客户数量、历史客户数量和数量变化量;
所述申请量特征信息包括:当前预设时间段的申请量和历史申请量。
8.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7中任一项所述销售区域的分配方法的步骤。
9.一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如下步骤:
将预设区域按照预设规则划分为N个销售区域,并获取每个销售区域的区域信息,所述N为大于1的自然数;
从所述N个销售区域中选取M个区域作为样本区域,分别将每个样本区域的区域信息作为一个训练样本,并将M个训练样本组成训练样本集,所述M为小于N的自然数;
建立随机森林模型,并根据所述训练样本集对所述随机森林模型进行训练;
对训练后的随机森林模型进行测试得到测试结果,并判断所述测试结果是否符合预期结果;
若所述测试结果不符合预期结果,则重新训练所述随机森林模型;
若所述测试结果符合预期结果,则根据所述训练后的随机森林模型分别预测每个销售区域的潜在客户数量,并根据预测出的各销售区域的潜在客户数量,对各销售人员的销售区域进行分配。
10.如权利要求9所述的终端设备,其特征在于,所述区域信息中包括X个特征信息,所述X为大于1的自然数;
所述建立随机森林模型包括K个决策树,所述K为大于1的自然数。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811017012.XA CN109409923A (zh) | 2018-09-03 | 2018-09-03 | 销售区域的分配方法、计算机可读存储介质及终端设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811017012.XA CN109409923A (zh) | 2018-09-03 | 2018-09-03 | 销售区域的分配方法、计算机可读存储介质及终端设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109409923A true CN109409923A (zh) | 2019-03-01 |
Family
ID=65463697
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811017012.XA Pending CN109409923A (zh) | 2018-09-03 | 2018-09-03 | 销售区域的分配方法、计算机可读存储介质及终端设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109409923A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110717806A (zh) * | 2019-09-06 | 2020-01-21 | 中国平安财产保险股份有限公司 | 产品信息推送方法、装置、设备及存储介质 |
CN111210302A (zh) * | 2019-12-29 | 2020-05-29 | 方正株式(武汉)科技开发有限公司 | 报纸分片推销方法及系统、服务器及介质 |
CN111967798A (zh) * | 2020-09-07 | 2020-11-20 | 上海优扬新媒信息技术有限公司 | 实验样本分配的方法及装置、设备及计算机可读存储介质 |
CN113793171A (zh) * | 2021-08-27 | 2021-12-14 | 浙江新再灵科技股份有限公司 | 基于多维数据的区域划分方法、装置、存储介质及设备 |
-
2018
- 2018-09-03 CN CN201811017012.XA patent/CN109409923A/zh active Pending
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110717806A (zh) * | 2019-09-06 | 2020-01-21 | 中国平安财产保险股份有限公司 | 产品信息推送方法、装置、设备及存储介质 |
CN110717806B (zh) * | 2019-09-06 | 2024-04-02 | 中国平安财产保险股份有限公司 | 产品信息推送方法、装置、设备及存储介质 |
CN111210302A (zh) * | 2019-12-29 | 2020-05-29 | 方正株式(武汉)科技开发有限公司 | 报纸分片推销方法及系统、服务器及介质 |
CN111967798A (zh) * | 2020-09-07 | 2020-11-20 | 上海优扬新媒信息技术有限公司 | 实验样本分配的方法及装置、设备及计算机可读存储介质 |
CN111967798B (zh) * | 2020-09-07 | 2023-10-03 | 度小满科技(北京)有限公司 | 实验样本分配的方法及装置、设备及计算机可读存储介质 |
CN113793171A (zh) * | 2021-08-27 | 2021-12-14 | 浙江新再灵科技股份有限公司 | 基于多维数据的区域划分方法、装置、存储介质及设备 |
CN113793171B (zh) * | 2021-08-27 | 2023-11-07 | 浙江新再灵科技股份有限公司 | 基于多维数据的区域划分方法、装置、存储介质及设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109409923A (zh) | 销售区域的分配方法、计算机可读存储介质及终端设备 | |
WO2017157203A1 (zh) | 一种分布式环境下监督学习算法的基准测试方法和装置 | |
CN108352035A (zh) | 用于高效索赔处理的动态拓扑系统和方法 | |
CN113592019B (zh) | 基于多模型融合的故障检测方法、装置、设备及介质 | |
CN111242793B (zh) | 医保数据异常的检测方法和装置 | |
CN107679734A (zh) | 一种用于无标签数据分类预测的方法和系统 | |
CN108573358A (zh) | 一种逾期预测模型生成方法及终端设备 | |
Blecic et al. | How much past to see the future: a computational study in calibrating urban cellular automata | |
CN110135684A (zh) | 一种能力测评方法、能力测评装置及终端设备 | |
CN110390433A (zh) | 一种订单预测方法、订单预测装置及终端设备 | |
CN107545038A (zh) | 一种文本分类方法与设备 | |
CN107944761A (zh) | 基于人工智能消费维权指数企业投诉预警监测分析方法 | |
CN108830830A (zh) | 一种脑萎缩程度的定量检测方法、检测装置及终端设备 | |
CN113516417A (zh) | 基于智能建模的业务评估方法、装置、电子设备及介质 | |
CN114612194A (zh) | 产品推荐方法、装置、电子设备及存储介质 | |
CN113342939B (zh) | 数据质量监控方法、装置及相关设备 | |
US20230386665A1 (en) | Method and device for constructing autism spectrum disorder (asd) risk prediction model | |
CN110796381A (zh) | 建模数据评价指标的处理方法、装置、终端设备及介质 | |
CN103365900A (zh) | 线上素材投放方法及装置 | |
CN110096708A (zh) | 一种定标集确定方法及装置 | |
CN109326324A (zh) | 一种抗原表位的检测方法、系统及终端设备 | |
CN114186785A (zh) | 构建房屋资源禀赋图谱的方法和提供房屋资源信息的方法 | |
CN107291722B (zh) | 一种描述词的分类方法及设备 | |
CN114972273A (zh) | 流水化产品数据集增强方法、系统、设备及存储介质 | |
González et al. | Typologies of Colombian off-grid localities using pca and clustering analysis for a better understanding of their situation to meet sdg-7 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |