CN111798274B - 零售户识别方法、终端及可读存储介质 - Google Patents

零售户识别方法、终端及可读存储介质 Download PDF

Info

Publication number
CN111798274B
CN111798274B CN202010631230.3A CN202010631230A CN111798274B CN 111798274 B CN111798274 B CN 111798274B CN 202010631230 A CN202010631230 A CN 202010631230A CN 111798274 B CN111798274 B CN 111798274B
Authority
CN
China
Prior art keywords
retail
abnormal
households
preset
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010631230.3A
Other languages
English (en)
Other versions
CN111798274A (zh
Inventor
侯杰华
邹暾
李益文
钟湘琼
刘煜
向皓明
洪伟
伊丹
刘英平
罗先学
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hunan Co Of China National Tobacco Corp
Original Assignee
Hunan Co Of China National Tobacco Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hunan Co Of China National Tobacco Corp filed Critical Hunan Co Of China National Tobacco Corp
Priority to CN202010631230.3A priority Critical patent/CN111798274B/zh
Publication of CN111798274A publication Critical patent/CN111798274A/zh
Application granted granted Critical
Publication of CN111798274B publication Critical patent/CN111798274B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0203Market surveys; Market polls

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Strategic Management (AREA)
  • Finance (AREA)
  • Physics & Mathematics (AREA)
  • Development Economics (AREA)
  • Accounting & Taxation (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Game Theory and Decision Science (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开一种零售户识别方法、终端及可读存储介质,该零售户识别方法包括:获取多个零售户的经营特征数据信息、进货数据信息和进货进货时间信息,根据预设规则和进货时间信息将各零售户的进货数据信息分成第一历史数据和第二历史数据;根据预设指标预测模型、经营特征数据信息和第一历史数据计算得到各零售户的预设指标的预测值;根据预测值和第二历史数据计算得到各零售户的偏离值并确定与预设阈值的大小关系;根据大小关系确定各零售户中的异常零售户;并根据各零售户之间的距离信息、各零售户中的异常零售户以及预设算法确定各所述零售户中的异常零售大户。本发明能够识别异常零售户并进一步识别异常零售大户,节省人力,提高识别准确性。

Description

零售户识别方法、终端及可读存储介质
技术领域
本发明涉及数据处理技术领域,具体涉及一种零售户识别方法、终端及可读存储介质。
背景技术
目前,烟草局在对烟草零售户的监管过程中,主要是通过人工排查的方式来判断烟草零售户是否存在违规行为,该方式不仅耗费大量人力成本,而且由于人口流动等原因,可能导致零售户的购烟数据会不稳定,识别所述异常零售户时判断不准确。
因此,有必要提供一种零售户识别方法,以解决上述技术问题。
上述内容仅用于辅助理解本发明的技术方案,并不代表承认上述内容是现有技术。
发明内容
本发明的主要目的是提供一种零售户识别方法、终端及可读存储介质,旨在解决人工排查的方式来判断烟草零售户是否存在违规行为不仅耗费大量人力成本,而且判断不准确的问题。
为实现上述目的,本发明提出的零售户识别方法,包括以下步骤:
获取多个零售户的经营特征数据信息、进货数据信息和进货进货时间信息,根据预设规则和所述进货时间信息将各所述零售户的进货数据信息分成第一历史数据和第二历史数据;
根据预设指标预测模型、所述经营特征数据信息和所述第一历史数据计算得到各零售户的预设指标的预测值;
根据所述预测值和所述第二历史数据计算得到各零售户的偏离值,确定所述偏离值与预设阈值的大小关系;
根据所述大小关系确定各所述零售户中的异常零售户;
获取各所述零售户之间的距离信息,并根据各所述零售户之间的距离信息、各所述零售户中的异常零售户以及预设算法确定各所述零售户中的异常零售大户。
优选地,所述获取各所述零售户之间的距离信息,并根据各所述零售户之间的距离信息、各所述零售户中的异常零售户以及预设算法确定各所述零售户中的异常零售大户的步骤包括:
获取各所述零售户之间的距离信息,遍历各所述零售户,对第i个零售户,根据各所述零售户之间的距离信息确定与第i个零售户的距离小于预设距离的零售户{Xj,Xk,Xn,...};
确定各所述零售户{Xj,Xk,Xn,...}中异常零售户的数量Si;
将与各所述零售户{Xj,Xk,Xn,...}对应的各异常特征值{Tj,Tk,Tn,...}分别与Si相加,其中,各所述异常特征值的初始值为零;
根据各所述异常特征值确定各所述零售户中的异常零售大户。
优选地,所述根据各所述异常特征值确定各所述零售户中的异常零售大户的步骤包括:
获取各所述异常特征值中的最大值;
确定所述最大值对应的零售户为异常零售大户。
优选地,所述获取多个零售户的经营特征数据信息、进货数据信息和与所述进货数据信息对应的进货时间信息,根据预设规则和所述进货时间信息将各所述零售户的进货数据信息分成第一历史数据和第二历史数据的步骤包括:
获取多个零售户的经营特征数据信息、进货数据信息和与所述进货数据信息对应的进货时间信息;
判断所述进货数据信息对应的进货时间信息是否在预设时间段内;
若所述进货数据信息对应的进货时间信息在所述预设时间段内,则将所述进货数据信息划分为第一历史数据;
若所述进货数据信息对应的进货时间信息不在所述预设时间段内,则将所述进货数据信息划分为第二历史数据。
优选地,所述根据预设指标预测模型、所述经营特征数据信息和所述第一历史数据计算得到各零售户的预设指标的预测值的步骤包括:
根据所述经营特征数据信息和所述第一历史数据获取与所述预设指标相关的特征值,并生成特征向量;
根据所述特征向量、所述预设指标预测模型计算得到各零售户的预设指标的预测值。
优选地,所述根据所述预测值和所述第二历史数据计算得到各零售户的偏离值,确定所述偏离值与预设阈值的大小关系的步骤,包括:
根据所述第二历史数据获取与所述预设指标相关的实际值;
根据所述实际值和所述预测值计算得到各所述零售户的偏离值;
确定所述偏离值与预设阈值的大小关系。
优选地,所述根据所述大小关系确定各所述零售户中的异常零售户的步骤包括:
若所述偏离值大于预设阈值,则将与所述偏离值对应的零售户标记为异常零售户,并生成异常零售户标记信息;
建立所述零售户与所述异常零售户标记信息的映射关系并存储。
优选地,所述获取多个零售户的经营特征数据信息、进货数据信息和与所述进货数据信息对应的进货时间信息,根据预设规则和所述进货时间信息将各所述零售户的进货数据信息分成第一历史数据和第二历史数据的步骤之前,包括:
获取多个零售户的样本数据信息;
构建基于循环神经网络的指标预测模型;
通过所述样本数据信息对所述指标预测模型进行训练,确定指标预测模型中的参数值;
将确定参数值的所述指标预测模型作为所述预设指标预测模型并存储。
本发明还提出一种终端,包括存储器、处理器和存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述的零售户识别方法的步骤。
本发明还提出一种可读存储介质,所述可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上述的零售户识别方法的步骤
本发明技术方案中,通过获取多个零售户的经营特征数据信息、进货数据信息和进货进货时间信息,根据预设规则和所述进货时间信息将各所述零售户的进货数据信息分成第一历史数据和第二历史数据;根据预设指标预测模型、所述经营特征数据信息和所述第一历史数据计算得到各零售户的预设指标的预测值;根据所述预测值和所述第二历史数据计算得到各零售户的偏离值,确定所述偏离值与预设阈值的大小关系;根据所述大小关系确定各所述零售户中的异常零售户;获取各所述零售户之间的距离信息,并根据各所述零售户之间的距离信息、各所述零售户中的异常零售户以及预设算法确定各所述零售户中的异常零售大户,可以识别出多个零售户中的异常零售户,并进一步识别出异常零售大户,无需人工实地排查,节省了人力成本,提高识别效率并提高了识别准确性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图示出的结构获得其他的附图。
图1是本发明实施例方案涉及的硬件运行环境的终端结构示意图;
图2为本发明零售户识别方法第一实施例的流程示意图;
图3为本发明零售户识别方法第二实施例中步骤S140的细化流程示意图;
图4为本发明零售户识别方法第四实施例中步骤S100的细化流程示意图;
图5为本发明零售户识别方法第六实施例中步骤S120的细化流程示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明,本发明实施例中所有方向性指示(诸如上、下、左、右、前、后……)仅用于解释在某一特定姿态(如附图所示)下各部件之间的相对位置关系、运动情况等,如果该特定姿态发生改变时,则该方向性指示也相应地随之改变。
另外,在本发明中如涉及“第一”、“第二”等的描述仅用于描述目的,而不能理解为指示或暗示其相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本发明的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
在本发明中,除非另有明确的规定和限定,术语“连接”、“固定”等应做广义理解,例如,“固定”可以是固定连接,也可以是可拆卸连接,或成一体;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通或两个元件的相互作用关系,除非另有明确的限定。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本发明中的具体含义。
另外,本发明各个实施例之间的技术方案可以相互结合,但是必须是以本领域普通技术人员能够实现为基础,当技术方案的结合出现相互矛盾或无法实现时应当认为这种技术方案的结合不存在,也不在本发明要求的保护范围之内。需要说明的是,下述实施例中所提及的强电卡钩与弱电卡钩不是对卡钩所能安装的导线类型的设置,只是便于说明。
本发明实施例提供了一种零售户识别方法、终端及可读存储介质。
如图1所示,本发明方法适用于终端,该终端可以包括:处理器1001,例如CPU,通信总线1002,用户接口1003,网络接口1004,存储器1005。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括触感板、触摸屏、键盘,可选的用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器1005可以是告诉RAM存储器,也可以是稳定的存储器(non-volatitle memory),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。
本领域技术人员可以理解,图1中示出的终端结构并不构成对终端的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
如图1所示,作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及零售户识别程序。
处理器1001可以用于调用存储器1005中存储的零售户识别程序,并执行以下操作:
获取多个零售户的经营特征数据信息、进货数据信息和进货进货时间信息,根据预设规则和所述进货时间信息将各所述零售户的进货数据信息分成第一历史数据和第二历史数据;
根据预设指标预测模型、所述经营特征数据信息和所述第一历史数据计算得到各零售户的预设指标的预测值;
根据所述预测值和所述第二历史数据计算得到各零售户的偏离值,确定所述偏离值与预设阈值的大小关系;
根据所述大小关系确定各所述零售户中的异常零售户;
获取各所述零售户之间的距离信息,并根据各所述零售户之间的距离信息、各所述零售户中的异常零售户以及预设算法确定各所述零售户中的异常零售大户。
进一步地,处理器1001可以用于调用存储器1005中存储的零售户识别程序,还执行以下操作:
获取各所述零售户之间的距离信息,遍历各所述零售户,对第i个零售户,根据各所述零售户之间的距离信息确定与第i个零售户的距离小于预设距离的零售户{Xj,Xk,Xn,...};
确定各所述零售户{Xj,Xk,Xn,...}中异常零售户的数量Si;
将与各所述零售户{Xj,Xk,Xn,...}对应的各异常特征值{Tj,Tk,Tn,...}分别与Si相加,其中,各所述异常特征值的初始值为零;
根据各所述异常特征值确定各所述零售户中的异常零售大户。
进一步地,处理器1001可以用于调用存储器1005中存储的零售户识别程序,还执行以下操作:
获取各所述异常特征值中的最大值;
确定所述最大值对应的零售户为异常零售大户。
进一步地,处理器1001可以用于调用存储器1005中存储的零售户识别程序,还执行以下操作:
获取多个零售户的经营特征数据信息、进货数据信息和与所述进货数据信息对应的进货时间信息;
判断所述进货数据信息对应的进货时间信息是否在预设时间段内;
若所述进货数据信息对应的进货时间信息在所述预设时间段内,则将所述进货数据信息划分为第一历史数据;
若所述进货数据信息对应的进货时间信息不在所述预设时间段内,则将所述进货数据信息划分为第二历史数据。
进一步地,处理器1001可以用于调用存储器1005中存储的零售户识别程序,还执行以下操作:
根据所述经营特征数据信息和所述第一历史数据获取与所述预设指标相关的特征值,并生成特征向量;
根据所述特征向量、所述预设指标预测模型计算得到各零售户的预设指标的预测值。
进一步地,处理器1001可以用于调用存储器1005中存储的零售户识别程序,还执行以下操作:
根据所述第二历史数据获取与所述预设指标相关的实际值;
根据所述实际值和所述预测值计算得到各所述零售户的偏离值;
确定所述偏离值与预设阈值的大小关系。
进一步地,处理器1001可以用于调用存储器1005中存储的零售户识别程序,还执行以下操作:
若所述偏离值大于预设阈值,则将与所述偏离值对应的零售户标记为异常零售户,并生成异常零售户标记信息;
建立所述零售户与所述异常零售户标记信息的映射关系并存储。
进一步地,处理器1001可以用于调用存储器1005中存储的零售户识别程序,还执行以下操作:
获取多个零售户的样本数据信息;
构建基于循环神经网络的指标预测模型;
通过所述样本数据信息对所述指标预测模型进行训练,确定指标预测模型中的参数值;
将确定参数值的所述指标预测模型作为所述预设指标预测模型并存储。
基于上述硬件结构,提出本发明的零售户识别方法和冰箱控制方法的各个实施例。
请参照图2,为本发明中的零售户识别方法的第一实施例的流程示意图。所述零售户识别方法包括以下步骤:
步骤S100,获取多个零售户的经营特征数据信息、进货数据信息和与所述进货数据信息对应的进货时间信息,根据预设规则和所述进货时间信息将各所述零售户的进货数据信息分成第一历史数据和第二历史数据;
具体地,用户可以通过所述终端输入所述经营特征数据信息和所述进货数据信息,所述终端还可以从文件(例如:EXCEL文件)中导入所述经营特征数据信息和所述进货数据信息。为实现识别有套购卷烟行为的烟草零售大户,所述经营特征数据信息和所述进货数据信息可以是与烟草零售户有关的数据,所述经营特征数据信息可以是零售户的基本信息,例如:零售户的经营资金、零售户的经营面积等;所述进货数据信息可以是与购买卷烟行为有关的数据信息,例如:零售户的每个月的购烟数量、购烟金额等;所述与进货数据信息对应的进货时间信息可以是所述零售户每个月的购烟数量、购烟金额等对应的月份,例如:第一购烟数量对应的进货时间信息为一月份,第二购烟数量对应的进货时间信息为二月份等。同时考虑到零售户的销售行为可能存在周期性规律,根据预设规则和所述进货时间信息将各所述零售户的进货数据信息分成第一历史数据和第二历史数据,例如:所述第一历史数据为:一月份的购烟数量、二月份的购烟数量、三月份的购烟数量,或者一月份的购烟金额、二月份的购烟金额、三月份的购烟金额;所述第二历史数据为:四月份的购烟数量,或者四月份的购烟金额。
步骤S110,根据预设指标预测模型、所述经营特征数据信息和所述第一历史数据计算得到各零售户的预设指标的预测值;
具体地,所述预设指标预测模型可以预先存储在所述终端中,所述预设指标预测模型可以是已经训练好的循环神经网络模型,通过所述循环神经网络模型、所述经营特征数据信息和所述第一历史数据对各零售户的预设指标进行预测,得到预设指标的预测值。所述预设指标可以由用户设定,例如:设置零售户的预设指标为:零售户的购烟数量。当预设指标为零售户的购烟数量时,此时根据第一历史数据中的一月份的购烟数量、二月份的购烟数量、三月份的购烟数量和经营特征数据信息对零售户的购烟数量进行预测,所述预测值可以是四月份的购烟数量预测值。
步骤S120,根据所述预测值和所述第二历史数据计算得到各零售户的偏离值,确定所述偏离值与预设阈值的大小关系;
步骤S130,根据所述大小关系确定各所述零售户中的异常零售户;
具体地,为实现步骤S120,可以计算所述预测值和所述第二历史数据中对应的实际值差值,即为各零售户的偏离值。例如:计算四月份的购烟数量预测值和实际获取到的四月份的购烟数量之间的差值。为实现所述步骤S130,用户可以根据实际需要设定所述预设阈值,当所述偏离值大于所述预设阈值时,说明该零售户的购烟数据异常,所述零售户可能存在异常的购烟行为,该零售户为异常零售户,此时对该异常零售户进行标记,并生成异常零售户标记信息并存储,在存储所述异常零售户标记信息时需要建立所述异常零售户标记信息与零售户之间的对应关系。通过上述步骤可以识别出所有零售户中的异常零售户。
步骤S140,获取各所述零售户之间的距离信息,并根据各所述零售户之间的距离信息、各所述零售户中的异常零售户以及预设算法确定各所述零售户中的异常零售大户。
具体地,各所述零售户之间的距离信息可以是各所述零售户地理位置之间的距离,所述终端可以从地图软件中获取所述距离信息,根据各所述零售户之间的距离信息可以确定某一零售户预设范围内的零售户,例如:确定第i个零售户半径r范围内的零售户,通过所述异常零售户标记信息可以确定第i个零售户半径r范围内的异常零售户,并统计所述异常零售户的数量,通过统计每个零售户半径内的异常零售户的数量,再根据预设算法可以确定所有零售户中的异常零售大户,所述异常零售大户即有套购零售户卷烟行为的零售大户,通过对所述异常零售大户进行标记,生成异常零售大户标记信息并显示,用户可以直观地查看所有零售户中具有套购零售户卷烟行为的异常零售大户。
本实施例中,在对烟草零售户的监管过程中,无需通过人工排查来判断烟草零售户是否存在套购卷烟的行为,用户只需通过终端输入数据即可直观地查看所有零售户中具有套购零售户卷烟行为的异常零售大户,节省了人力,提高了监管效率,并且由于人口流动等原因,可能导致零售户的购烟数据会不稳定,因此本申请通过在异常零售户中选择异常零售大户,提高了识别准确性。
进一步地,基于第一实施例提出第二实施例,参照图3,在本实施例中,所述步骤S140步骤包括:
步骤S200,获取各所述零售户之间的距离信息,遍历各所述零售户,对第i个零售户,根据各所述零售户之间的距离信息确定与第i个零售户的距离小于预设距离的零售户{Xj,Xk,Xn,...};
具体地,根据各所述零售户之间的距离信息确定与第i个零售户的距离小于预设距离的零售户{Xj,Xk,Xn,...},即确定第i个零售户半径为预设距离范围内的零售户{Xj,Xk,Xn,...},其中,所述第i个零售户为Xi。
步骤S210,确定各所述零售户{Xj,Xk,Xn,...}中异常零售户的数量Si;
具体地,根据存储的所述零售户标记信息可以确定各所述零售户{Xj,Xk,Xn,...}中的异常零售户,并统计得到异常零售户的数量Si。
步骤S220,将与各所述零售户{Xj,Xk,Xn,...}对应的各异常特征值{Tj,Tk,Tn,...}分别与Si相加,其中,各所述异常特征值的初始值为零;
具体地,将与各所述零售户{Xj,Xk,Xn,...}对应的各异常特征值{Tj,Tk,Tn,...}加上Si,例如:Tj=0+Si,Tk=0+Si,Tn=0+Si;当第i个零售户计算完毕,计算第j个零售户时,将与各所述零售户{Xi,Xk,Xn,...}对应的各异常特征值{Ti,Tk,Tn,...}加上Sj,得到:Ti=0+Sj,Tk=Si+Sj,Tn=Si+Sj。
步骤S230,根据各所述异常特征值确定各所述零售户中的异常零售大户。
具体地,当通过上述算法遍历各所述零售户后,通过最后得到的各零售户对应的异常特征值,通过比较所述零售户对应的异常特征值,可以确定各所述零售户中的异常零售大户并进行标记,所述异常零售大户可以是与各异常特征值中最大值对应的零售户,也可以是各异常特征值中大于预设值的对应的零售户。
本实施例中,通过预设算法计算各所述零售户对应的异常特征值,根据异常特征值确定各所述零售户中的异常零售大户,异常特征值反映了一个零售户对其附近零售户的影响程度,其值越大代表其作为异常零售大户的可能性越大,能够简单快速地确定出所述异常零售大户。
进一步地,基于第二实施例提出第三实施例,在本实施例中,所述步骤S230包括:
获取各所述异常特征值中的最大值;
确定所述最大值对应的零售户为异常零售大户。
具体地,通过将最后得到的各零售户对应的异常特征值两两进行比较,可以确定各所述异常特征值中的最大值,因为异常特征值反映了一个零售户对其附近零售户的影响程度,其值越大代表其作为异常零售大户的可能性越大,所以确定所述最大值对应的零售户为异常零售大户并进行标记,生成异常零售大户标记信息并显示。
优选地,也可以获取各所述异常特征值中大小排在前几位的几个异常特征值,确定这几个异常特征值对应的零售户为异常零售大户并进行标记;也可以是获取各所述异常特征值中大于预设值的异常特征值,确定大于预设值的异常特征值对应的零售户为异常零售大户并进行标记。
进一步地,基于第一实施例提出第四实施例,参照图4,在本实施例中,所述步骤S100包括:
步骤S300,获取多个零售户的经营特征数据信息、进货数据信息和与所述进货数据信息对应的进货时间信息;
具体地,所述经营特征数据信息和所述进货数据信息可以是与烟草零售户有关的数据,所述经营特征数据信息可以是零售户的基本信息,例如:零售户的经营资金、零售户的经营面积等;所述进货数据信息可以是与购买卷烟行为有关的数据信息,例如:零售户的每个月的购烟数量、购烟金额等;所述与进货数据信息对应的进货时间信息可以是所述零售户每个月的购烟数量、购烟金额等对应的月份,例如:第一购烟数量对应的进货时间信息为一月份,第二购烟数量对应的进货时间信息为二月份等。
步骤S310,判断所述进货数据信息对应的进货时间信息是否在预设时间段内;
步骤S320,若所述进货数据信息对应的进货时间信息在所述预设时间段内,则将所述进货数据信息划分为第一历史数据;
步骤S330,若所述进货数据信息对应的进货时间信息不在所述预设时间段内,则将所述进货数据信息划分为第二历史数据。
具体地,考虑到零售户的销售行为可能存在周期性规律,用户可以设定所述预设时间段,例如:设定所述预设时间段为1~3月份,通过判断所述进货数据信息对应的进货时间信息是否在预设时间段内,可以将各所述零售户的进货数据信息分成第一历史数据和第二历史数据,例如:所述第一历史数据为:一月份的购烟数量、二月份的购烟数量、三月份的购烟数量,或者一月份的购烟金额、二月份的购烟金额、三月份的购烟金额;所述第二历史数据为:四月份的购烟数量,或者四月份的购烟金额。
在本实施例中,根据所述进货数据信息对应的进货时间信息将所述进货数据信息分成第一历史数据和第二历史数据,便于通过预设指标预测模型对数据进行计算。
进一步地,基于第一实施例提出第五实施例,在本实施例中,所述步骤S110包括:
根据所述经营特征数据信息和所述第一历史数据获取与所述预设指标相关的特征值,并生成特征向量;
具体地,所述预设指标可以由用户设定,例如:设置零售户的预设指标为:零售户的购烟数量。当预设指标为零售户的购烟数量时,此时根据第一历史数据中的一月份的购烟数量、二月份的购烟数量、三月份的购烟数量和经营特征数据信息得到特征值,并生成特征向量,所述特征向量为:(零售户经营资金,零售户经营面积,一月份的购烟数量,二月份的购烟数量,三月份的购烟数量)。
根据所述特征向量、所述预设指标预测模型计算得到各零售户的预设指标的预测值。
具体地,所述预设指标预测模型可以预先存储在所述终端中,所述预设指标预测模型可以是已经训练好的循环神经网络模型,根据所述特征向量、所述预设指标预测模型计算得到各零售户的预设指标的预测值。
在本实施例中,用户通过设置预设指标,根据循环神经网络模型可以实现对各零售户的预设指标的精准预测。
进一步地,基于第一实施例提出第六实施例,参照图5,在本实施例中,所述步骤S120包括:
步骤S400,根据所述第二历史数据获取与所述预设指标相关的实际值;
步骤S410,根据所述实际值和所述预测值计算得到各所述零售户的偏离值;
步骤S420,确定所述偏离值与预设阈值的大小关系。
具体地,所述预设指标可以由用户设定,例如:设置零售户的预设指标为:零售户的购烟数量。当预设指标为零售户的购烟数量时,根据所述第二历史数据获取与零售户的购烟数量相关的实际值,所述实际值与所述预测值对应,例如:所述预测值是四月份的购烟数量预测值,则所述实际值为获取到的四月份的购烟数量。可以计算所述预测值和实际值的差值,即为各零售户的偏离值。通过确定所述偏离值与预设阈值的大小关系,可以确定所述零售户是否存在异常行为,例如:偏离值大于预设阈值,说明零售户四月份的购烟数量的实际值远远大于四月份购烟数量预测值,表示该零售户在四月份存在异常的购烟行为。
进一步地,基于第一实施例提出第七实施例,在本实施例中,所述步骤S130包括:
若所述偏离值大于预设阈值,则将与所述偏离值对应的零售户标记为异常零售户,并生成异常零售户标记信息;
建立所述零售户与所述异常零售户标记信息的映射关系并存储。
具体地,终端将偏离值大于预设阈值的对应零售户标记位异常零售户,可以是获取各零售户的门店名称,然后再将偏离值大于预设阈值的对应零售户的门店名称标红,所述异常零售户标记信息即为门店名称标红信息,建立所述零售户与所述异常零售户标记信息的映射关系并存储。
本实施例中,通过对所述异常零售户进行标记,并建立所述零售户与所述异常零售户标记信息的映射关系并存储,一方面,用户可以通过所述终端查看各零售户中的异常零售户;另一方面,建立所述零售户与所述异常零售户标记信息的映射关系,能够方便对所述异常零售户标记信息进行调用。
进一步地,基于第一实施例提出第八实施例,在本实施例中,所述步骤S100之前,包括:
获取多个零售户的样本数据信息;
构建基于循环神经网络的指标预测模型;
通过所述样本数据信息对所述指标预测模型进行训练,确定指标预测模型中的参数值;
将确定参数值的所述指标预测模型作为所述预设指标预测模型并存储。
在本实施例中,所述样本数据信息可以是零售户的经营资金、零售户的经营面积、近几年每个月的购烟数据等,构建基于循环神经网络的指标预测模型后,终端通过所述样本数据信息对所述指标预测模型进行训练,确定指标预测模型中的参数值后,即表示训练完成,将确定了参数值的所述指标预测模型作为所述预设指标预测模型并存储。
本发明还提供了一种可读存储介质,所述可读存储介质上存储有计算机程序,所述计算机程序被处理单元执行时实现如前述的零售户识别方法的步骤。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
应当注意的是,在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的部件或步骤。位于部件之前的单词“一”或“一个”不排除存在多个这样的部件。本发明可以借助于包括有若干不同部件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
以上所述仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是在本发明的发明构思下,利用本发明说明书及附图内容所作的等效结构变换,或直接/间接运用在其他相关的技术领域均包括在本发明的专利保护范围内。

Claims (9)

1.一种零售户识别方法,其特征在于,所述零售户识别方法包括以下步骤:
获取多个零售户的经营特征数据信息、进货数据信息和进货时间信息,根据预设规则和所述进货时间信息将各所述零售户的进货数据信息分成第一历史数据和第二历史数据;
根据预设指标预测模型、所述经营特征数据信息和所述第一历史数据计算得到各零售户的预设指标的预测值;
根据所述预测值和所述第二历史数据计算得到各零售户的偏离值,确定所述偏离值与预设阈值的大小关系;
根据所述大小关系确定各所述零售户中的异常零售户;
获取各所述零售户之间的距离信息,并根据各所述零售户之间的距离信息、各所述零售户中的异常零售户以及预设算法确定各所述零售户中的异常零售大户;
所述获取各所述零售户之间的距离信息,并根据各所述零售户之间的距离信息、各所述零售户中的异常零售户以及预设算法确定各所述零售户中的异常零售大户的步骤包括:
获取各所述零售户之间的距离信息,遍历各所述零售户,对第i个零售户,根据各所述零售户之间的距离信息确定与第i个零售户的距离小于预设距离的零售户{Xj,Xk,Xn,...};
确定各所述零售户{Xj,Xk,Xn,...}中异常零售户的数量Si;
将与各所述零售户{Xj,Xk,Xn,...}对应的各异常特征值{Tj,Tk,Tn,...}分别与Si相加,其中,各所述异常特征值的初始值为零;
根据各所述异常特征值确定各所述零售户中的异常零售大户。
2.如权利要求1所述的零售户识别方法,其特征在于,所述根据各所述异常特征值确定各所述零售户中的异常零售大户的步骤包括:
获取各所述异常特征值中的最大值;
确定所述最大值对应的零售户为异常零售大户。
3.如权利要求1所述的零售户识别方法,其特征在于,所述获取多个零售户的经营特征数据信息、进货数据信息和与所述进货数据信息对应的进货时间信息,根据预设规则和所述进货时间信息将各所述零售户的进货数据信息分成第一历史数据和第二历史数据的步骤包括:
获取多个零售户的经营特征数据信息、进货数据信息和与所述进货数据信息对应的进货时间信息;
判断所述进货数据信息对应的进货时间信息是否在预设时间段内;
若所述进货数据信息对应的进货时间信息在所述预设时间段内,则将所述进货数据信息划分为第一历史数据;
若所述进货数据信息对应的进货时间信息不在所述预设时间段内,则将所述进货数据信息划分为第二历史数据。
4.如权利要求1所述的零售户识别方法,其特征在于,所述根据预设指标预测模型、所述经营特征数据信息和所述第一历史数据计算得到各零售户的预设指标的预测值的步骤包括:
根据所述经营特征数据信息和所述第一历史数据获取与所述预设指标相关的特征值,并生成特征向量;
根据所述特征向量、所述预设指标预测模型计算得到各零售户的预设指标的预测值。
5.如权利要求1所述的零售户识别方法,其特征在于,所述根据所述预测值和所述第二历史数据计算得到各零售户的偏离值,确定所述偏离值与预设阈值的大小关系的步骤,包括:
根据所述第二历史数据获取与所述预设指标相关的实际值;
根据所述实际值和所述预测值计算得到各所述零售户的偏离值;
确定所述偏离值与预设阈值的大小关系。
6.如权利要求1所述的零售户识别方法,其特征在于,所述根据所述大小关系确定各所述零售户中的异常零售户的步骤包括:
若所述偏离值大于预设阈值,则将与所述偏离值对应的零售户标记为异常零售户,并生成异常零售户标记信息;
建立所述零售户与所述异常零售户标记信息的映射关系并存储。
7.如权利要求1所述的零售户识别方法,其特征在于,所述获取多个零售户的经营特征数据信息、进货数据信息和与所述进货数据信息对应的进货时间信息,根据预设规则和所述进货时间信息将各所述零售户的进货数据信息分成第一历史数据和第二历史数据的步骤之前,包括:
获取多个零售户的样本数据信息;
构建基于循环神经网络的指标预测模型;
通过所述样本数据信息对所述指标预测模型进行训练,确定指标预测模型中的参数值;
将确定参数值的所述指标预测模型作为所述预设指标预测模型并存储。
8.一种终端,其特征在于,包括存储器、处理器和存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如权利要求1至7中任一项所述的零售户识别方法的步骤。
9.一种可读存储介质,其特征在于,所述可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至7中任一项所述的零售户识别方法的步骤。
CN202010631230.3A 2020-07-03 2020-07-03 零售户识别方法、终端及可读存储介质 Active CN111798274B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010631230.3A CN111798274B (zh) 2020-07-03 2020-07-03 零售户识别方法、终端及可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010631230.3A CN111798274B (zh) 2020-07-03 2020-07-03 零售户识别方法、终端及可读存储介质

Publications (2)

Publication Number Publication Date
CN111798274A CN111798274A (zh) 2020-10-20
CN111798274B true CN111798274B (zh) 2022-01-11

Family

ID=72809944

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010631230.3A Active CN111798274B (zh) 2020-07-03 2020-07-03 零售户识别方法、终端及可读存储介质

Country Status (1)

Country Link
CN (1) CN111798274B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11455639B2 (en) * 2020-05-29 2022-09-27 Sap Se Unsupervised universal anomaly detection for situation handling
CN113779568A (zh) * 2021-09-18 2021-12-10 中国平安人寿保险股份有限公司 异常行为用户识别方法、装置、设备及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150073889A1 (en) * 2013-09-10 2015-03-12 Barclays Plc Dynamic Retailer Rewards Based on Attributes of Historical Transactions and Calculated Values
CN109299954A (zh) * 2018-08-22 2019-02-01 中国银联股份有限公司 一种违规商户识别方法和装置
CN110046781A (zh) * 2018-12-04 2019-07-23 阿里巴巴集团控股有限公司 商户风险防控方法及装置
CN110415119A (zh) * 2019-07-30 2019-11-05 中国工商银行股份有限公司 模型训练、票据交易预测方法、装置、存储介质及设备

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150073889A1 (en) * 2013-09-10 2015-03-12 Barclays Plc Dynamic Retailer Rewards Based on Attributes of Historical Transactions and Calculated Values
CN109299954A (zh) * 2018-08-22 2019-02-01 中国银联股份有限公司 一种违规商户识别方法和装置
CN110046781A (zh) * 2018-12-04 2019-07-23 阿里巴巴集团控股有限公司 商户风险防控方法及装置
CN110415119A (zh) * 2019-07-30 2019-11-05 中国工商银行股份有限公司 模型训练、票据交易预测方法、装置、存储介质及设备

Also Published As

Publication number Publication date
CN111798274A (zh) 2020-10-20

Similar Documents

Publication Publication Date Title
CN111798274B (zh) 零售户识别方法、终端及可读存储介质
US8738421B1 (en) Driver moderator method for retail sales prediction
JP6352798B2 (ja) マーケティング施策最適化装置、方法、及びプログラム
JP6275923B2 (ja) 施策評価システムおよび施策評価方法
CN109255710B (zh) 一种行情交易软件上标记挂单的方法、装置及系统
US20160232559A1 (en) Coupon information management device, coupon information management method, and program
JP2018139036A (ja) 分析装置
US20090112665A1 (en) Execution decision support program and device of regulation measures
EP3671610A1 (en) Determination of similarity between user and merchant
CN111768243A (zh) 销量预测方法、预测模型构建方法、装置、设备及介质
JPH06119309A (ja) 購入見込み度合予測方法及び顧客管理システム
CN111445133A (zh) 一种材料管理方法、装置、计算机设备和存储介质
US11625733B2 (en) Evaluating coincident interaction indicators
JP2019149098A (ja) 広告管理装置、広告提供システム、広告管理方法、及びプログラム
JP2021135873A (ja) 最適決済手段情報提供システム及びその方法
US20090319330A1 (en) Techniques for evaluating recommendation systems
CN111932338A (zh) 一种商品推荐方法、装置、设备及存储介质
US20220222689A1 (en) Methods and apparatus for surge-adjusted forecasting
JP2019067154A (ja) 提案装置、提案方法及び提案プログラム
JP2007026335A (ja) 評価指標見通し可視化方法
JP6151435B2 (ja) 倉庫収益シミュレーション装置
WO2016018711A1 (en) Systems and methods for price position sensitivity analysis
CN112950298A (zh) 一种恶意订单识别方法、装置及存储介质
US10733653B2 (en) System and method for alternative product selection and profitability indication
JP6094021B1 (ja) 顧客分析サーバ、顧客分析方法、および顧客分析プログラム

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant