CN115564423A - 基于大数据的留学缴费的分析处理方法 - Google Patents

基于大数据的留学缴费的分析处理方法 Download PDF

Info

Publication number
CN115564423A
CN115564423A CN202211401801.XA CN202211401801A CN115564423A CN 115564423 A CN115564423 A CN 115564423A CN 202211401801 A CN202211401801 A CN 202211401801A CN 115564423 A CN115564423 A CN 115564423A
Authority
CN
China
Prior art keywords
data
payment
subdata
analysis processing
dimension
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202211401801.XA
Other languages
English (en)
Other versions
CN115564423B (zh
Inventor
盛峥山
黄浩浩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Yisihui Business Service Co ltd
Original Assignee
Beijing Yisihui Business Service Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Yisihui Business Service Co ltd filed Critical Beijing Yisihui Business Service Co ltd
Priority to CN202211401801.XA priority Critical patent/CN115564423B/zh
Publication of CN115564423A publication Critical patent/CN115564423A/zh
Application granted granted Critical
Publication of CN115564423B publication Critical patent/CN115564423B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q20/00Payment architectures, schemes or protocols
    • G06Q20/08Payment architectures
    • G06Q20/10Payment architectures specially adapted for electronic funds transfer [EFT] systems; specially adapted for home banking systems
    • G06Q20/102Bill distribution or payments
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06393Score-carding, benchmarking or key performance indicator [KPI] analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/20Education
    • G06Q50/205Education administration or guidance

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Strategic Management (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Finance (AREA)
  • Theoretical Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • Economics (AREA)
  • General Business, Economics & Management (AREA)
  • Educational Administration (AREA)
  • Data Mining & Analysis (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Marketing (AREA)
  • Tourism & Hospitality (AREA)
  • Computational Mathematics (AREA)
  • Educational Technology (AREA)
  • Mathematical Physics (AREA)
  • Game Theory and Decision Science (AREA)
  • Operations Research (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Analysis (AREA)
  • Evolutionary Biology (AREA)
  • Quality & Reliability (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Primary Health Care (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Probability & Statistics with Applications (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Algebra (AREA)
  • General Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供一种基于大数据的留学缴费的分析处理方法,包括:根据第一留学缴费数据、第二留学缴费数据进行差分计算,得到相对应的第一差分数据;若判断第一差分数据不满足预设数据条件,则根据第二留学缴费数据对第一留学缴费数据进行噪音添加,得到添加噪音后的第一留学缴费数据;第三方平台接收并统计所有具有第一标签的第一留学缴费数据,得到与预设分类维度表对应的第一维度统计表,第一维度统计表包括多个指标信息;接收用户的分析处理请求,根据分析处理请求确定相应的分析处理维度,统计与分析处理指标信息相关联的第一指标信息,统计与第一指标分析结果对应的所有历史指标分析结果,得到最终展示分析结果。

Description

基于大数据的留学缴费的分析处理方法
技术领域
本发明涉及数据处理技术领域,尤其涉及一种基于大数据的留学缴费的分析处理方法。
背景技术
随着时代的发展,留学产业发展越来越完善,在留学的环节中,留学缴费是必不可少的一个步骤。留学缴费一般至少会对应相应的性别信息、年龄信息、学校信息、费用信息,在大量的留学缴费数据中,可以针对留学信息进行分析,提供针对性的服务。
但是在现有技术中,并无法对留学缴费信息进行有效的处理后进行分析,导致可能会出现数据泄露、无法进行有效分析的情况。
发明内容
本发明实施例提供一种基于大数据的留学缴费的分析处理方法,可以对留学缴费信息进行差分化处理,并根据工作人员的需求,针对差分化处理后的留学缴费信息进行分析,得到工作人员所需要的有用信息。
本发明实施例的第一方面,提供一种基于大数据的留学缴费的分析处理方法,包括:
留学缴费平台获取在第一时间段内的至少一个第一留学缴费数据,调取与所述第一留学缴费数据所对应的上一个时间段内的第二留学缴费数据,所述第一留学缴费数据包括所述第二留学缴费数据;
根据所述第一留学缴费数据、第二留学缴费数据进行差分计算,得到相对应的第一差分数据,若判断所述第一差分数据满足预设数据条件,则对所述第二留学缴费数据添加第一标签;
若判断所述第一差分数据不满足预设数据条件,则根据所述第二留学缴费数据对所述第一留学缴费数据进行噪音添加,得到添加噪音后的第一留学缴费数据,对添加噪音后的第一留学缴费数据添加第一标签;
第三方平台接收并统计所有具有第一标签的第一留学缴费数据,根据预设分类维度表依次统计每一个第一留学缴费数据中所包括的留学缴费子数据,提取每一个留学缴费子数据中相应维度类别的维度信息并进行计数,得到与预设分类维度表对应的第一维度统计表,所述第一维度统计表包括多个指标信息;
接收用户的分析处理请求,根据所述分析处理请求确定相应的分析处理维度,调取第一维度统计表中与所述分析处理请求对应的分析处理指标信息,统计与所述分析处理指标信息相关联的第一指标信息;
根据所述分析处理指标信息的量值、第一指标信息的量值进行融合计算,得到相对应的第一指标分析结果,统计与所述第一指标分析结果对应的所有历史指标分析结果,得到最终展示分析结果。
可选地,在第一方面的一种可能实现方式中,所述留学缴费平台获取在第一时间段内的至少一个第一留学缴费数据,调取与所述第一留学缴费数据所对应的上一个时间段内的第二留学缴费数据,包括:
留学缴费平台获取在第一时间段内的第一留学缴费数据,获取所述第一留学缴费数据中数据条目的数量得到第一留学条目数量;
调取与相应留学缴费平台在上一个时间段所传输的第二留学缴费数据,获取所述第二留学缴费数据中数据条目的数量得到第二留学条目数量。
可选地,在第一方面的一种可能实现方式中,所述根据所述第一留学缴费数据、第二留学缴费数据进行差分计算,得到相对应的第一差分数据,若判断所述第一差分数据满足预设数据条件,则对所述第二留学缴费数据添加第一标签,包括:
计算所述第一留学条目数量和第二留学条目数量的差值得到第一条目差数量,若所述第一条目差数量大于等于预设条目数量值,则判断所述第一差分数据满足数量条件;
确定第二留学缴费数据相较于第一留学缴费数据在第一时间段内,新增的留学缴费子数据,确定新增的留学缴费子数据在每个维度类别的指标;
将所有留学缴费子数据中相同维度类别的指标的数量进行统计得到第一指标数量,若所述第一指标数量小于所述第一条目差数量,则判断所述第一指标数量满足指标类别条件;
对满足数量条件、指标类别条件的第二留学缴费数据添加第一标签。
可选地,在第一方面的一种可能实现方式中,所述若判断所述第一差分数据不满足预设数据条件,则根据所述第二留学缴费数据对所述第一留学缴费数据进行噪音添加,得到添加噪音后的第一留学缴费数据,对添加噪音后的第一留学缴费数据添加第一标签,包括:
若所述第一条目差数量小于预设条目数量值,则判断所述第一差分数据不满足预设数据条件,确定新增的留学缴费子数据;
根据所述第一条目差数量、预设条目数量值之间的差值得到对留学缴费子数据的复制次数,根据所述复制次数对留学缴费子数据进行复制处理,得到多个复制的缴费子数据;
根据复制的缴费子数据的数量、预设条目数量值之间的差值进行计算,得到随机抽取数量,根据所述随机抽取数量在第二留学缴费数据内随机抽取相应随机抽取数量的留学缴费子数据,得到随机抽取的留学缴费子数据;
根据复制的缴费子数据、随机抽取的留学缴费子数据形成添加噪音的噪音总数据,根据所述噪音总数据对第一留学缴费数据进行噪音添加,得到添加噪音后的第一留学缴费数据。
可选地,在第一方面的一种可能实现方式中,所述根据所述第一条目差数量、预设条目数量值之间的差值得到对留学缴费子数据的复制次数,根据所述复制次数对留学缴费子数据进行复制处理,得到多个复制的缴费子数据,包括:
计算所述第一条目差数量、预设条目数量值之间的差值得到条目数量差值,根据所述条目数量差值、预设数量权重值进行计算,得到相对应的复制次数,通过以下公式计算复制次数,
Figure 7106DEST_PATH_IMAGE001
其中,
Figure 122829DEST_PATH_IMAGE002
为复制次数,
Figure 24926DEST_PATH_IMAGE003
为预设条目数量值,
Figure 567903DEST_PATH_IMAGE004
为第二留学条目数量,
Figure 424126DEST_PATH_IMAGE005
为第一留学条目数量,
Figure 343540DEST_PATH_IMAGE006
为数量归一化值,
Figure 100144DEST_PATH_IMAGE007
为预设数量权重值,
Figure 814022DEST_PATH_IMAGE008
为第一预设常数值;
若所述复制次数为非整数,则对每个留学缴费子数据进行差异化复制计算,得到每个留学缴费子数据对应的复制次数,根据所述复制次数对留学缴费子数据进行复制处理,得到多个复制的缴费子数据。
可选地,在第一方面的一种可能实现方式中,所述若所述复制次数为非整数,则对每个留学缴费子数据进行差异化复制计算,得到每个留学缴费子数据对应的复制次数,根据所述复制次数对留学缴费子数据进行复制处理,得到多个复制的缴费子数据,包括:
在复制次数为非整数时,根据复制次数中的整数对所有留学缴费子数据进行统一的一次复制处理,得到一次复制处理后的留学缴费子数据;
根据复制次数中的非整数对所有留学缴费子数据按照非整数的比例进行随机选择复制,得到二次复制处理后的留学缴费子数据。
可选地,在第一方面的一种可能实现方式中,所述根据复制的缴费子数据的数量、预设条目数量值之间的差值进行计算,得到随机抽取数量,根据所述随机抽取数量在第二留学缴费数据内随机抽取相应随机抽取数量的留学缴费子数据,得到随机抽取的留学缴费子数据包括:
将复制的缴费子数据的数量与已存在的缴费子数据的数量相加得到第一总数量,若所述第一总数量大于等于预设条目数量值,则选择预设定值作为随机抽取数量;
若所述第一总数量小于预设条目数量值,则通过以下公式计算随机抽取数量,
Figure 420190DEST_PATH_IMAGE009
其中,
Figure 815399DEST_PATH_IMAGE010
为随机抽取数量,
Figure 426509DEST_PATH_IMAGE011
为第
Figure 576868DEST_PATH_IMAGE012
个留学缴费子数据的复制次数,
Figure 906218DEST_PATH_IMAGE013
为新增的留学缴费子数据的数量,
Figure 668900DEST_PATH_IMAGE015
为第二常数值,
Figure 134516DEST_PATH_IMAGE016
为随机抽取权重;
若所述随机抽取数量为非整数,则对所述随机抽取数量进行正向取整处理。
可选地,在第一方面的一种可能实现方式中,所述第三方平台接收并统计所有具有第一标签的第一留学缴费数据,根据预设分类维度表依次统计每一个第一留学缴费数据中所包括的留学缴费子数据,提取每一个留学缴费子数据中相应维度类别的维度信息并进行计数,得到与预设分类维度表对应的第一维度统计表,所述第一维度统计表包括多个指标信息,包括:
对留学缴费子数据进行文本识别,得到每个留学缴费子数据在不同维度类别的维度信息,所述维度信息包括性别信息、年龄信息、学校信息、费用信息中的至少一种;
提取每一个留学缴费子数据中相应维度类别的维度信息并进行计数,确定每个留学缴费子数据所对应维度信息中的指标信息,将相应的指标信息填充至相对应的预设分类维度表的单元格内,生成第一维度统计表。
可选地,在第一方面的一种可能实现方式中,所述接收用户的分析处理请求,根据所述分析处理请求确定相应的分析处理维度,调取第一维度统计表中与所述分析处理请求对应的分析处理指标信息,统计与所述分析处理指标信息相关联的第一指标信息,包括:
在判断用户输入分析处理请求后,则根据分析处理请求确定相应的分析处理维度,提取所述分析处理请求中的分析处理指标信息;
根据所述分析处理维度确定分析处理指标信息之外、其余相关联的第一指标信息。
可选地,在第一方面的一种可能实现方式中,所述根据所述分析处理指标信息的量值、第一指标信息的量值进行融合计算,得到相对应的第一指标分析结果,统计与所述第一指标分析结果对应的所有历史指标分析结果,得到最终展示分析结果,包括:
通过以下公式对分析处理指标信息的量值、第一指标信息的量值进行融合计算,
Figure 393459DEST_PATH_IMAGE017
其中,
Figure 210106DEST_PATH_IMAGE018
为第
Figure 9434DEST_PATH_IMAGE020
个分析处理请求所对应的第一指标分析结果,
Figure 93672DEST_PATH_IMAGE021
为第
Figure 585833DEST_PATH_IMAGE022
个分析处理指标信息的量值,
Figure 624196DEST_PATH_IMAGE023
为第
Figure 164899DEST_PATH_IMAGE024
个第一指标信息的量值;
调取与第一指标分析结果所对应的所有历史指标分析结果,根据所述历史指标分析结果得到平均指标分析结果;
若所述第一指标分析结果大于等于平均指标分析结果,则输出第一预设颜色的最终展示分析结果;
若所述第一指标分析结果小于平均指标分析结果,则输出第二预设颜色的最终展示分析结果;
根据所述最终展示分析结果生成对营销端的营销策略。
有益效果:
1、本方案会对相近时间段内的留学缴费数据进行差异化判断,并在差异化较小时,及时的按照相关策略为相应的留学缴费数据添加噪音数据。其中,本方案会采用多维度对差异化程度进行判断,并结合复制次数、随机抽取数量的计算,来随机生成合理数量的噪音数据,对留学缴费数据进行噪音添加,提高两个留学缴费数据之间的差异度。本方案通过上述方式可以使得用户可以在对留学缴费信息进行有效的处理后进行分析,减少数据泄露、无法有效分析的情况出现。
2、本方案在判断留学缴费数据之间的差异程度时,会结合两个留学缴费数据之间的条目数量,以及新增的留学缴费子数据的指标类别相应的指标数量进行综合判断,通过上述方式,本方案可以从多维度准确、全面的对差分数据进行判断,从而多角度的对留学缴费数据进行保护和处理。在添加噪音数据的过程中,会依据第一条目差数量计算数据的复制次数对数据进行相应次数的复制得到复制的缴费子数据,此外,本方案还会在复制次数为非整数的情况下,对每个留学缴费子数据进行差异化复制计算;同时本方案会计算随机抽取数量,对相应的数据进行随机抽取,得到随机抽取的留学缴费子数据,通过上述方式可以随机生成合理数量的噪音数据。
3、本方案在对留学缴费信息进行分析时,可以根据工作人员的需求,针对差分化处理后的留学缴费信息进行分析,得到工作人员所需要的有用信息。其中,本方案会得到每个留学缴费子数据在不同维度类别的维度信息,生成第一维度统计表对数据进行整合和梳理,后续用户可以依据第一维度统计表来对快速的对数据进行有效分析。同时,在分析过程中,会对工作人员的需求的其他相关数据进行综合分析,得到第一指标分析结果,并依据平均指标分析结果对第一指标分析结果进行判断、展示,为营销端制定营销策略提供清晰的数据支撑。
附图说明
图1是本发明实施例提供的一种基于大数据的留学缴费的分析处理方法的流程示意图。
图2是本发明实施例提供的一种基于大数据的留学缴费的分析处理系统的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。
应当理解,在本发明的各种实施例中,各过程的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
应当理解,在本发明中,“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
应当理解,在本发明中,“多个”是指两个或两个以上。“和/或”仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。“包含A、B和C”、“包含A、B、C”是指A、B、C三者都包含,“包含A、B或C”是指包含A、B、C三者之一,“包含A、B和/或C”是指包含A、B、C三者中任1个或任2个或3个。
应当理解,在本发明中,“与A对应的B”、“与A相对应的B”、“A与B相对应”或者“B与A相对应”,表示B与A相关联,根据A可以确定B。根据A确定B并不意味着仅仅根据A确定B,还可以根据A和/或其他信息确定B。A与B的匹配,是A与B的相似度大于或等于预设的阈值。
取决于语境,如在此所使用的“若”可以被解释成为“在……时”或“当……时”或“响应于确定”或“响应于检测”。
下面以具体地实施例对本发明的技术方案进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例不再赘述。
参见图1,是本发明实施例提供的一种基于大数据的留学缴费的分析处理方法的流程示意图,图1所示方法的执行主体可以是软件和/或硬件装置。本申请的执行主体可以包括但不限于以下中的至少一个:用户设备、网络设备等。其中,用户设备可以包括但不限于计算机、智能手机、个人数字助理(Personal Digital Assistant,简称:PDA)及上述提及的电子设备等。网络设备可以包括但不限于单个网络服务器、多个网络服务器组成的服务器组或基于云计算的由大量计算机或网络服务器构成的云,其中,云计算是分布式计算的一种,由一群松散耦合的计算机组成的一个超级虚拟计算机。本实施例对此不做限制。该基于大数据的留学缴费的分析处理方法包括S1-S6:
S1,留学缴费平台获取在第一时间段内的至少一个第一留学缴费数据,调取与所述第一留学缴费数据所对应的上一个时间段内的第二留学缴费数据,所述第一留学缴费数据包括所述第二留学缴费数据。
其中,第一时间段可以是一个月,本方案的留学缴费平台会获取在第一时间段内的至少一个第一留学缴费数据,也就是说,第一留学缴费数据为当前时间段内的当前数据。
本方案还会调取与第一留学缴费数据所对应的上一个时间段内的第二留学缴费数据,也就是说,第二留学缴费数据为前一历史时间段内的历史数据。因此,第一留学缴费数据包括所述第二留学缴费数据。
可以理解的是,如果第一留学缴费数据和第二留学缴费数据之间的差异化较小,其他用户可以通过对差异化较小的数据分析得到差异数据,从而使得相应的数据泄漏,导致数据安全的问题出现。本方案会对差异化较小的数据进行处理,提高差异程度,从而减少数据泄漏的风险。
在一些实施例中,S1(所述留学缴费平台获取在第一时间段内的至少一个第一留学缴费数据,调取与所述第一留学缴费数据所对应的上一个时间段内的第二留学缴费数据)包括S11- S12:
S11,留学缴费平台获取在第一时间段内的第一留学缴费数据,获取所述第一留学缴费数据中数据条目的数量得到第一留学条目数量。
本方案的留学缴费平台可以获取第一时间段内的第一留学缴费数据,然后对第一留学缴费数据中数据条目的数量进行分析,得到第一留学条目数量。例如,第一留学缴费数据中有102个学生,那么第一留学条目数量可以是102。
S12,调取与相应留学缴费平台在上一个时间段所传输的第二留学缴费数据,获取所述第二留学缴费数据中数据条目的数量得到第二留学条目数量。
同理,本方案也会对第二留学缴费数据中的数据条目的数量进行分析,得到第二留学条目数量。例如,第二留学缴费数据中有100个学生,那么第二留学条目数量可以是100。
S2,根据所述第一留学缴费数据、第二留学缴费数据进行差分计算,得到相对应的第一差分数据,若判断所述第一差分数据满足预设数据条件,则对所述第二留学缴费数据添加第一标签。
在得到第一留学缴费数据和第二留学缴费数据之后,本方案会对第一留学缴费数据、第二留学缴费数据进行差分计算,得到相对应的第一差分数据,如果判断第一差分数据满足预设数据条件,则本方案会对第二留学缴费数据添加第一标签。
其中,预设数据条件包括数量条件和指标类别条件,具体见下文阐述。
在一些实施例中,S2(所述根据所述第一留学缴费数据、第二留学缴费数据进行差分计算,得到相对应的第一差分数据,若判断所述第一差分数据满足预设数据条件,则对所述第二留学缴费数据添加第一标签)包括S21- S24:
S21,计算所述第一留学条目数量和第二留学条目数量的差值得到第一条目差数量,若所述第一条目差数量大于等于预设条目数量值,则判断所述第一差分数据满足数量条件。
本方案中的预设数据条件包括数量条件,为了判断数量条件是否满足要求,首先,本方案会计算述第一留学条目数量和第二留学条目数量的差值得到第一条目差数量,然后将第一条目差数量与预设条目数量值进行比对,如果第一条目差数量大于等于预设条目数量值,则本方案会判断第一差分数据满足数量条件。
例如,第一留学条目数量是120,第二留学条目数量是100,那么第一条目差数量为20,如果预设条目数量值为10,那么第一条目差数量大于等于预设条目数量值,则本方案会判断第一差分数据满足数量条件。
S22,确定第二留学缴费数据相较于第一留学缴费数据在第一时间段内,新增的留学缴费子数据,确定新增的留学缴费子数据在每个维度类别的指标。
本方案中的预设数据条件还包括指标类别条件,为了判断指标类别条件是否满足要求,首先,本方案会确定第二留学缴费数据相较于第一留学缴费数据在第一时间段内,新增的留学缴费子数据,然后对新增的留学缴费子数据进行解析,得到新增的留学缴费子数据在每个维度类别的指标。
S23,将所有留学缴费子数据中相同维度类别的指标的数量进行统计得到第一指标数量,若所述第一指标数量小于所述第一条目差数量,则判断所述第一指标数量满足指标类别条件。
示例性的,第一条目差数量为20 ,以留学国家维度为例,本方案统计到美国留学的第一指标数量为10,此时,第一指标数量小于第一条目差数量,说明在留学国家维度,至少有2个以上的国家存在,例如包括美国、韩国等,在上述情况下,本方案会判断第一指标数量满足指标类别条件。
S24,对满足数量条件、指标类别条件的第二留学缴费数据添加第一标签。
可以理解的是,如果数量条件和指标类别条件都满足要求,则本方案会对满足数量条件、指标类别条件的第二留学缴费数据添加第一标签。
S3,若判断所述第一差分数据不满足预设数据条件,则根据所述第二留学缴费数据对所述第一留学缴费数据进行噪音添加,得到添加噪音后的第一留学缴费数据,对添加噪音后的第一留学缴费数据添加第一标签。
可以理解的是,如果判断第一差分数据不满足预设数据条件,则需要对数据进行处理。处理时,本方案会根据第二留学缴费数据对第一留学缴费数据进行噪音添加,得到添加噪音后的第一留学缴费数据,对添加噪音后的第一留学缴费数据添加第一标签。即本方案会通过噪音添加的方式来对数据进行混淆,提高两个数据之间的差异度,从而提高数据安全。
在一些实施例中,S3(所述若判断所述第一差分数据不满足预设数据条件,则根据所述第二留学缴费数据对所述第一留学缴费数据进行噪音添加,得到添加噪音后的第一留学缴费数据,对添加噪音后的第一留学缴费数据添加第一标签),包括S31- S34:
S31,若所述第一条目差数量小于预设条目数量值,则判断所述第一差分数据不满足预设数据条件,确定新增的留学缴费子数据。
可以理解的是,如果第一条目差数量小于预设条目数量值,则说明第一差分数据不满足预设数据条件,此时,本方案会确定新增的留学缴费子数据。
例如,第一留学缴费数据中有102个学生,第二留学缴费数据中有100个学生,那么新增数据为2个学生的新增数据。
S32,根据所述第一条目差数量、预设条目数量值之间的差值得到对留学缴费子数据的复制次数,根据所述复制次数对留学缴费子数据进行复制处理,得到多个复制的缴费子数据。
本方案为了对噪音数据进行添加,会对相关数据进行复制,首先,本方案会利用第一条目差数量、预设条目数量值之间的差值得到对留学缴费子数据的复制次数,然后利用复制次数对留学缴费子数据进行复制处理,得到多个复制的缴费子数据。需要说明的是,在对留学缴费子数据进行复制处理之后,需要对学生的姓名进行调整,例如复制的学生的姓名为“张三”,可以在复制之后,将学生的姓名调整为“张四”,且在实际应用中,“张四”不与其余学生的姓名重复,另外,在后续的随机挑选方案中也是如此,以提高噪音数据的混淆程度。
在一些实施例中,S32(所述根据所述第一条目差数量、预设条目数量值之间的差值得到对留学缴费子数据的复制次数,根据所述复制次数对留学缴费子数据进行复制处理,得到多个复制的缴费子数据)包括S321- S322:
S321,计算所述第一条目差数量、预设条目数量值之间的差值得到条目数量差值,根据所述条目数量差值、预设数量权重值进行计算,得到相对应的复制次数,通过以下公式计算复制次数,
Figure 870687DEST_PATH_IMAGE025
其中,
Figure 769635DEST_PATH_IMAGE002
为复制次数,
Figure 560873DEST_PATH_IMAGE026
为预设条目数量值,
Figure 702005DEST_PATH_IMAGE004
为第二留学条目数量,
Figure 262299DEST_PATH_IMAGE005
为第一留学条目数量,
Figure 768367DEST_PATH_IMAGE006
为数量归一化值,
Figure 568874DEST_PATH_IMAGE007
为预设数量权重值,
Figure 513696DEST_PATH_IMAGE008
为第一预设常数值。
本方案在计算复制次数时,会利用第一条目差数量、预设条目数量值之间的差值得到条目数量差值,可以理解的是,条目数量差值越大,说明差异化越大,则需要复制次数就会越少。上述公式中,
Figure 928497DEST_PATH_IMAGE027
代表第一条目差数量,其值越大,预设条目数量值
Figure 933362DEST_PATH_IMAGE028
也就越小,其中,数量归一化值
Figure 371297DEST_PATH_IMAGE006
和预设数量权重值
Figure 355695DEST_PATH_IMAGE029
可以是工作人员预先设置的,本方案通过上述方式可以计算出较为合适的复制次数,来对数据进行处理。
S322,若所述复制次数为非整数,则对每个留学缴费子数据进行差异化复制计算,得到每个留学缴费子数据对应的复制次数,根据所述复制次数对留学缴费子数据进行复制处理,得到多个复制的缴费子数据。
可以理解的是,如果所计算出来的复制次数为非整数,则本方案会对每个留学缴费子数据进行差异化复制计算,从而得到每个留学缴费子数据对应的复制次数,根据复制次数对留学缴费子数据进行复制处理,得到多个复制的缴费子数据。
在一些实施例中,S322(所述若所述复制次数为非整数,则对每个留学缴费子数据进行差异化复制计算,得到每个留学缴费子数据对应的复制次数,根据所述复制次数对留学缴费子数据进行复制处理,得到多个复制的缴费子数据),包括S3221- S3222:
S3221,在复制次数为非整数时,根据复制次数中的整数对所有留学缴费子数据进行统一的一次复制处理,得到一次复制处理后的留学缴费子数据。
示例性的,复制次数为2.5,本方案会根据2.5中的2对所有留学缴费子数据进行统一的一次复制处理,即将所有的留学缴费子数据进行2遍复制处理,得到一次复制处理后的留学缴费子数据。
S3222,根据复制次数中的非整数对所有留学缴费子数据按照非整数的比例进行随机选择复制,得到二次复制处理后的留学缴费子数据。
示例性的,复制次数为2.5,本方案会根据2.5中的0.5对所有留学缴费子数据按照非整数的比例进行随机选择复制,得到二次复制处理后的留学缴费子数据。例如,留学缴费子数据有2个,那么得到的非整数的比例为2乘以0.5为1,则本方案会按照1从留学缴费子数据中随机选择1个进行选择复制,得到二次复制处理后的留学缴费子数据。
需要说明的是,复制次数的非整数不是0.5时,本方案还可以进一步处理,以使得所计算出来的非整数的比例为整数。例如,复制次数为2.1、2.2、2.8、2.9时,本方案可以将复制次数统一处理为2.5。
S33,根据复制的缴费子数据的数量、预设条目数量值之间的差值进行计算,得到随机抽取数量,根据所述随机抽取数量在第二留学缴费数据内随机抽取相应随机抽取数量的留学缴费子数据,得到随机抽取的留学缴费子数据;
本方案在计算得到复制的缴费子数据的数量之后,会对复制的缴费子数据的数量、预设条目数量值之间的差值进行计算,得到随机抽取数量,然后再利用随机抽取数量在第二留学缴费数据内随机抽取相应随机抽取数量的留学缴费子数据,得到随机抽取的留学缴费子数据。
可以理解的是,本方案通过上述方式,可以使得到的留学缴费子数据随机性较高,从而提高加噪过程中的随机性,使得加噪后的数据安全性较高。
在一些实施例中,S33(所述根据复制的缴费子数据的数量、预设条目数量值之间的差值进行计算,得到随机抽取数量,根据所述随机抽取数量在第二留学缴费数据内随机抽取相应随机抽取数量的留学缴费子数据,得到随机抽取的留学缴费子数据)包括S331-S333:
S331,将复制的缴费子数据的数量与已存在的缴费子数据的数量相加得到第一总数量,若所述第一总数量大于等于预设条目数量值,则选择预设定值作为随机抽取数量。
本方案会将复制的缴费子数据的数量与已存在的缴费子数据的数量相加得到第一总数量,例如,复制的缴费子数据的数量为7,已存在的缴费子数据的数量为2,则第一总数量为9,如果预设条目数量值为5,那么此时第一总数量大于预设条目数量值,说明目前的样本数量足够多,则本方案会选择预设定值作为随机抽取数量。其中,预设定值例如可以是5个。
S332,若所述第一总数量小于预设条目数量值,则通过以下公式计算随机抽取数量,
Figure 890582DEST_PATH_IMAGE009
其中,
Figure 800769DEST_PATH_IMAGE010
为随机抽取数量,
Figure 788317DEST_PATH_IMAGE011
为第
Figure 573477DEST_PATH_IMAGE012
个留学缴费子数据的复制次数,
Figure 900553DEST_PATH_IMAGE013
为新增的留学缴费子数据的数量,
Figure 247221DEST_PATH_IMAGE015
为第二常数值,
Figure 722064DEST_PATH_IMAGE016
为随机抽取权重。
可以理解的是,如果第一总数量小于预设条目数量值,说明当前的样本数量较少,无法满足预设定值的挑选,此时,本方案会通过上述公式计算出随机抽取数量。
上述公式中,
Figure 546801DEST_PATH_IMAGE030
代表第一总数量,第一总数量越多,得到的
Figure 292165DEST_PATH_IMAGE031
也就越大,则随机抽取数量会越少,使得最后得到的综合条目数量接近于预设条目数量值,其中,随机抽取权重
Figure 544155DEST_PATH_IMAGE032
可以是工作人员预先设置的。
S333,若所述随机抽取数量为非整数,则对所述随机抽取数量进行正向取整处理。
可以理解的是,当所计算出来的随机抽取数量为非整数时,本方案会对随机抽取数量进行正向取整处理。
S34,根据复制的缴费子数据、随机抽取的留学缴费子数据形成添加噪音的噪音总数据,根据所述噪音总数据对第一留学缴费数据进行噪音添加,得到添加噪音后的第一留学缴费数据。
本方案会利用复制的缴费子数据、随机抽取的留学缴费子数据形成添加噪音的噪音总数据,然后利用噪音总数据对第一留学缴费数据进行噪音添加,得到添加噪音后的第一留学缴费数据,实现对数据的加噪,提高数据之间的差异度。
S4,第三方平台接收并统计所有具有第一标签的第一留学缴费数据,根据预设分类维度表依次统计每一个第一留学缴费数据中所包括的留学缴费子数据,提取每一个留学缴费子数据中相应维度类别的维度信息并进行计数,得到与预设分类维度表对应的第一维度统计表,所述第一维度统计表包括多个指标信息。
本方案的第三方平台会接收并统计所有具有第一标签的第一留学缴费数据,然后利用预设分类维度表依次统计每一个第一留学缴费数据中所包括的留学缴费子数据,之后提取每一个留学缴费子数据中相应维度类别的维度信息并进行计数,得到与预设分类维度表对应的第一维度统计表,其中,第一维度统计表包括多个指标信息。
在一些实施例中,S4(所述第三方平台接收并统计所有具有第一标签的第一留学缴费数据,根据预设分类维度表依次统计每一个第一留学缴费数据中所包括的留学缴费子数据,提取每一个留学缴费子数据中相应维度类别的维度信息并进行计数,得到与预设分类维度表对应的第一维度统计表,所述第一维度统计表包括多个指标信息)包括S41- S42:
S41,对留学缴费子数据进行文本识别,得到每个留学缴费子数据在不同维度类别的维度信息,所述维度信息包括性别信息、年龄信息、学校信息、费用信息中的至少一种。
首先,本方案会对留学缴费子数据进行文本识别,得到每个留学缴费子数据在不同维度类别的维度信息,其中,维度信息包括性别信息、年龄信息、学校信息、费用信息中的至少一种。需要说明的是,本方案对维度信息不做限定,例如还可以包括留学国家等维度的信息。
S42,提取每一个留学缴费子数据中相应维度类别的维度信息并进行计数,确定每个留学缴费子数据所对应维度信息中的指标信息,将相应的指标信息填充至相对应的预设分类维度表的单元格内,生成第一维度统计表。
在得到每个留学缴费子数据在不同维度类别的维度信息之后,本方案会提取每一个留学缴费子数据中相应维度类别的维度信息并进行计数,然后确定每个留学缴费子数据所对应维度信息中的指标信息,将相应的指标信息填充至相对应的预设分类维度表的单元格内,形成本方案的第一维度统计表。
S5,接收用户的分析处理请求,根据所述分析处理请求确定相应的分析处理维度,调取第一维度统计表中与所述分析处理请求对应的分析处理指标信息,统计与所述分析处理指标信息相关联的第一指标信息。
在得到第一维度统计表之后,用户可以对第一维度统计表进行分析。如果接收用户的分析处理请求后,本方案会先对分析处理请求进行解析,得到分析处理请求相应的分析处理维度,然后调取第一维度统计表中与分析处理请求对应的分析处理指标信息,统计与分析处理指标信息相关联的第一指标信息。
在一些实施例中,S5(所述接收用户的分析处理请求,根据所述分析处理请求确定相应的分析处理维度,调取第一维度统计表中与所述分析处理请求对应的分析处理指标信息,统计与所述分析处理指标信息相关联的第一指标信息)包括S51- S52:
S51,在判断用户输入分析处理请求后,则根据分析处理请求确定相应的分析处理维度,提取所述分析处理请求中的分析处理指标信息。
示例性的,如果分析处理维度为留学国家维度,且是去中国留学的留学国家维度,那么本方案会调取第一维度统计表中与去中国留学维度对应的分析处理指标信息,分析处理指标信息例如是40个。
S52,根据所述分析处理维度确定分析处理指标信息之外、其余相关联的第一指标信息。
可以理解的是,本方案还会统计与分析处理指标信息相关联的第一指标信息,例如是与留学国家相关的第一指标信息。第一指标信息例如是去韩国、美国留学的第一指标信息,例如为60个。
S6,根据所述分析处理指标信息的量值、第一指标信息的量值进行融合计算,得到相对应的第一指标分析结果,统计与所述第一指标分析结果对应的所有历史指标分析结果,得到最终展示分析结果。
本方案会利用分析处理指标信息的量值、第一指标信息的量值进行融合计算,得到相对应的第一指标分析结果。同时,本方案会在得到相对应的第一指标分析结果之后,统计与第一指标分析结果对应的所有历史指标分析结果,得到最终展示分析结果。
其中,最终展示分析结果例如是采用折线图的形式对历史数据和当前数据进行展示,可以使得用户清晰的了解到相关维度的变化趋势。
在一些实施例中,S6(所述根据所述分析处理指标信息的量值、第一指标信息的量值进行融合计算,得到相对应的第一指标分析结果,统计与所述第一指标分析结果对应的所有历史指标分析结果,得到最终展示分析结果)包括S61- S65:
S61,通过以下公式对分析处理指标信息的量值、第一指标信息的量值进行融合计算,
Figure 771874DEST_PATH_IMAGE017
其中,
Figure 337985DEST_PATH_IMAGE018
为第
Figure 436391DEST_PATH_IMAGE020
个分析处理请求所对应的第一指标分析结果,
Figure 623396DEST_PATH_IMAGE021
为第
Figure 72832DEST_PATH_IMAGE022
个分析处理指标信息的量值,
Figure 973792DEST_PATH_IMAGE023
为第
Figure 457863DEST_PATH_IMAGE033
个第一指标信息的量值。
上述公式中,
Figure 818699DEST_PATH_IMAGE034
代表第一指标信息的量值之后与第
Figure 427535DEST_PATH_IMAGE020
个分析处理指标信息的量值的综合值,然后通过上述公式可以计算出相关占比,从而得到分析处理请求所对应的第一指标分析结果。
S62,调取与第一指标分析结果所对应的所有历史指标分析结果,根据所述历史指标分析结果得到平均指标分析结果。
在得到第一指标分析结果之后,本方案会调取与第一指标分析结果所对应的所有历史指标分析结果,然后根据历史指标分析结果得到平均指标分析结果。
S63,若所述第一指标分析结果大于等于平均指标分析结果,则输出第一预设颜色的最终展示分析结果。
本方案在计算得到平均指标分析结果之后,会将第一指标分析结果与平均指标分析结果进行比对,如果第一指标分析结果大于等于平均指标分析结果,则本方案会输出第一预设颜色的最终展示分析结果。其中,第一预设颜色可以是红色。
S64,若所述第一指标分析结果小于平均指标分析结果,则输出第二预设颜色的最终展示分析结果。
如果第一指标分析结果小于平均指标分析结果,则本方案会输出第二预设颜色的最终展示分析结果。其中,第二预设颜色可以是绿色。
S65,根据所述最终展示分析结果生成对营销端的营销策略。
本方案在依据平均指标分析结果对第一指标分析结果进行判断之后,可以对最终展示分析结果展示,为营销端制定营销策略提供清晰的数据支撑。例如,当去中国留学的学生逐渐增多时,可以制定去中国留学的相关营销策略。
参见图2,是本方案实施例提供的一种基于大数据的留学缴费的分析处理系统的结构示意图,该基于大数据的留学缴费的分析处理系统包括:
采集模块,用于留学缴费平台获取在第一时间段内的至少一个第一留学缴费数据,调取与所述第一留学缴费数据所对应的上一个时间段内的第二留学缴费数据,所述第一留学缴费数据包括所述第二留学缴费数据;
计算模块,用于根据所述第一留学缴费数据、第二留学缴费数据进行差分计算,得到相对应的第一差分数据,若判断所述第一差分数据满足预设数据条件,则对所述第二留学缴费数据添加第一标签;
噪音模块,用于若判断所述第一差分数据不满足预设数据条件,则根据所述第二留学缴费数据对所述第一留学缴费数据进行噪音添加,得到添加噪音后的第一留学缴费数据,对添加噪音后的第一留学缴费数据添加第一标签;
统计模块,用于第三方平台接收并统计所有具有第一标签的第一留学缴费数据,根据预设分类维度表依次统计每一个第一留学缴费数据中所包括的留学缴费子数据,提取每一个留学缴费子数据中相应维度类别的维度信息并进行计数,得到与预设分类维度表对应的第一维度统计表,所述第一维度统计表包括多个指标信息;
分析模块,用于接收用户的分析处理请求,根据所述分析处理请求确定相应的分析处理维度,调取第一维度统计表中与所述分析处理请求对应的分析处理指标信息,统计与所述分析处理指标信息相关联的第一指标信息;
结果模块,用于根据所述分析处理指标信息的量值、第一指标信息的量值进行融合计算,得到相对应的第一指标分析结果,统计与所述第一指标分析结果对应的所有历史指标分析结果,得到最终展示分析结果。
本发明还提供一种存储介质,所述存储介质中存储有计算机程序,所述计算机程序被处理器执行时用于实现上述的各种实施方式提供的方法。
其中,存储介质可以是计算机存储介质,也可以是通信介质。通信介质包括便于从一个地方向另一个地方传送计算机程序的任何介质。计算机存储介质可以是通用或专用计算机能够存取的任何可用介质。例如,存储介质耦合至处理器,从而使处理器能够从该存储介质读取信息,且可向该存储介质写入信息。当然,存储介质也可以是处理器的组成部分。处理器和存储介质可以位于专用集成电路(Application Specific IntegratedCircuits,简称:ASIC)中。另外,该ASIC可以位于用户设备中。当然,处理器和存储介质也可以作为分立组件存在于通信设备中。存储介质可以是只读存储器(ROM)、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
本发明还提供一种程序产品,该程序产品包括执行指令,该执行指令存储在存储介质中。设备的至少一个处理器可以从存储介质读取该执行指令,至少一个处理器执行该执行指令使得设备实施上述的各种实施方式提供的方法。
在上述终端或者服务器的实施例中,应理解,处理器可以是中央处理单元(英文:Central Processing Unit,简称:CPU),还可以是其他通用处理器、数字信号处理器(英文:Digital Signal Processor,简称:DSP)、专用集成电路(英文:Application SpecificIntegrated Circuit,简称:ASIC)等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本发明所公开的方法的步骤可以直接体现为硬件处理器执行完成,或者用处理器中的硬件及软件模块组合执行完成。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

Claims (10)

1.基于大数据的留学缴费的分析处理方法,其特征在于,包括:
留学缴费平台获取在第一时间段内的至少一个第一留学缴费数据,调取与所述第一留学缴费数据所对应的上一个时间段内的第二留学缴费数据,所述第一留学缴费数据包括所述第二留学缴费数据;
根据所述第一留学缴费数据、第二留学缴费数据进行差分计算,得到相对应的第一差分数据,若判断所述第一差分数据满足预设数据条件,则对所述第二留学缴费数据添加第一标签;
若判断所述第一差分数据不满足预设数据条件,则根据所述第二留学缴费数据对所述第一留学缴费数据进行噪音添加,得到添加噪音后的第一留学缴费数据,对添加噪音后的第一留学缴费数据添加第一标签;
第三方平台接收并统计所有具有第一标签的第一留学缴费数据,根据预设分类维度表依次统计每一个第一留学缴费数据中所包括的留学缴费子数据,提取每一个留学缴费子数据中相应维度类别的维度信息并进行计数,得到与预设分类维度表对应的第一维度统计表,所述第一维度统计表包括多个指标信息;
接收用户的分析处理请求,根据所述分析处理请求确定相应的分析处理维度,调取第一维度统计表中与所述分析处理请求对应的分析处理指标信息,统计与所述分析处理指标信息相关联的第一指标信息;
根据所述分析处理指标信息的量值、第一指标信息的量值进行融合计算,得到相对应的第一指标分析结果,统计与所述第一指标分析结果对应的所有历史指标分析结果,得到最终展示分析结果。
2.根据权利要求1所述的基于大数据的留学缴费的分析处理方法,其特征在于,
所述留学缴费平台获取在第一时间段内的至少一个第一留学缴费数据,调取与所述第一留学缴费数据所对应的上一个时间段内的第二留学缴费数据,包括:
留学缴费平台获取在第一时间段内的第一留学缴费数据,获取所述第一留学缴费数据中数据条目的数量得到第一留学条目数量;
调取与相应留学缴费平台在上一个时间段所传输的第二留学缴费数据,获取所述第二留学缴费数据中数据条目的数量得到第二留学条目数量。
3.根据权利要求2所述的基于大数据的留学缴费的分析处理方法,其特征在于,
所述根据所述第一留学缴费数据、第二留学缴费数据进行差分计算,得到相对应的第一差分数据,若判断所述第一差分数据满足预设数据条件,则对所述第二留学缴费数据添加第一标签,包括:
计算所述第一留学条目数量和第二留学条目数量的差值得到第一条目差数量,若所述第一条目差数量大于等于预设条目数量值,则判断所述第一差分数据满足数量条件;
确定第二留学缴费数据相较于第一留学缴费数据在第一时间段内,新增的留学缴费子数据,确定新增的留学缴费子数据在每个维度类别的指标;
将所有留学缴费子数据中相同维度类别的指标的数量进行统计得到第一指标数量,若所述第一指标数量小于所述第一条目差数量,则判断所述第一指标数量满足指标类别条件;
对满足数量条件、指标类别条件的第二留学缴费数据添加第一标签。
4.根据权利要求3所述的基于大数据的留学缴费的分析处理方法,其特征在于,
所述若判断所述第一差分数据不满足预设数据条件,则根据所述第二留学缴费数据对所述第一留学缴费数据进行噪音添加,得到添加噪音后的第一留学缴费数据,对添加噪音后的第一留学缴费数据添加第一标签,包括:
若所述第一条目差数量小于预设条目数量值,则判断所述第一差分数据不满足预设数据条件,确定新增的留学缴费子数据;
根据所述第一条目差数量、预设条目数量值之间的差值得到对留学缴费子数据的复制次数,根据所述复制次数对留学缴费子数据进行复制处理,得到多个复制的缴费子数据;
根据复制的缴费子数据的数量、预设条目数量值之间的差值进行计算,得到随机抽取数量,根据所述随机抽取数量在第二留学缴费数据内随机抽取相应随机抽取数量的留学缴费子数据,得到随机抽取的留学缴费子数据;
根据复制的缴费子数据、随机抽取的留学缴费子数据形成添加噪音的噪音总数据,根据所述噪音总数据对第一留学缴费数据进行噪音添加,得到添加噪音后的第一留学缴费数据。
5.根据权利要求4所述的基于大数据的留学缴费的分析处理方法,其特征在于,
所述根据所述第一条目差数量、预设条目数量值之间的差值得到对留学缴费子数据的复制次数,根据所述复制次数对留学缴费子数据进行复制处理,得到多个复制的缴费子数据,包括:
计算所述第一条目差数量、预设条目数量值之间的差值得到条目数量差值,根据所述条目数量差值、预设数量权重值进行计算,得到相对应的复制次数,通过以下公式计算复制次数,
Figure 512267DEST_PATH_IMAGE001
其中,
Figure 585265DEST_PATH_IMAGE002
为复制次数,
Figure 553221DEST_PATH_IMAGE003
为预设条目数量值,
Figure 711670DEST_PATH_IMAGE004
为第二留学条目数量,
Figure 721477DEST_PATH_IMAGE005
为第一留学条目数量,
Figure 914561DEST_PATH_IMAGE006
为数量归一化值,
Figure 115735DEST_PATH_IMAGE007
为预设数量权重值,
Figure 761480DEST_PATH_IMAGE008
为第一预设常数值;
若所述复制次数为非整数,则对每个留学缴费子数据进行差异化复制计算,得到每个留学缴费子数据对应的复制次数,根据所述复制次数对留学缴费子数据进行复制处理,得到多个复制的缴费子数据。
6.根据权利要求5所述的基于大数据的留学缴费的分析处理方法,其特征在于,
所述若所述复制次数为非整数,则对每个留学缴费子数据进行差异化复制计算,得到每个留学缴费子数据对应的复制次数,根据所述复制次数对留学缴费子数据进行复制处理,得到多个复制的缴费子数据,包括:
在复制次数为非整数时,根据复制次数中的整数对所有留学缴费子数据进行统一的一次复制处理,得到一次复制处理后的留学缴费子数据;
根据复制次数中的非整数对所有留学缴费子数据按照非整数的比例进行随机选择复制,得到二次复制处理后的留学缴费子数据。
7.根据权利要求6所述的基于大数据的留学缴费的分析处理方法,其特征在于,
所述根据复制的缴费子数据的数量、预设条目数量值之间的差值进行计算,得到随机抽取数量,根据所述随机抽取数量在第二留学缴费数据内随机抽取相应随机抽取数量的留学缴费子数据,得到随机抽取的留学缴费子数据包括:
将复制的缴费子数据的数量与已存在的缴费子数据的数量相加得到第一总数量,若所述第一总数量大于等于预设条目数量值,则选择预设定值作为随机抽取数量;
若所述第一总数量小于预设条目数量值,则通过以下公式计算随机抽取数量,
Figure 572048DEST_PATH_IMAGE009
其中,
Figure 557321DEST_PATH_IMAGE010
为随机抽取数量,
Figure 929397DEST_PATH_IMAGE011
为第
Figure 62438DEST_PATH_IMAGE012
个留学缴费子数据的复制次数,
Figure 178161DEST_PATH_IMAGE013
为新增的留学缴费子数据的数量,
Figure 581723DEST_PATH_IMAGE015
为第二常数值,
Figure 124700DEST_PATH_IMAGE016
为随机抽取权重;
若所述随机抽取数量为非整数,则对所述随机抽取数量进行正向取整处理。
8.根据权利要求7所述的基于大数据的留学缴费的分析处理方法,其特征在于,
所述第三方平台接收并统计所有具有第一标签的第一留学缴费数据,根据预设分类维度表依次统计每一个第一留学缴费数据中所包括的留学缴费子数据,提取每一个留学缴费子数据中相应维度类别的维度信息并进行计数,得到与预设分类维度表对应的第一维度统计表,所述第一维度统计表包括多个指标信息,包括:
对留学缴费子数据进行文本识别,得到每个留学缴费子数据在不同维度类别的维度信息,所述维度信息包括性别信息、年龄信息、学校信息、费用信息中的至少一种;
提取每一个留学缴费子数据中相应维度类别的维度信息并进行计数,确定每个留学缴费子数据所对应维度信息中的指标信息,将相应的指标信息填充至相对应的预设分类维度表的单元格内,生成第一维度统计表。
9.根据权利要求8所述的基于大数据的留学缴费的分析处理方法,其特征在于,
所述接收用户的分析处理请求,根据所述分析处理请求确定相应的分析处理维度,调取第一维度统计表中与所述分析处理请求对应的分析处理指标信息,统计与所述分析处理指标信息相关联的第一指标信息,包括:
在判断用户输入分析处理请求后,则根据分析处理请求确定相应的分析处理维度,提取所述分析处理请求中的分析处理指标信息;
根据所述分析处理维度确定分析处理指标信息之外、其余相关联的第一指标信息。
10.根据权利要求9所述的基于大数据的留学缴费的分析处理方法,其特征在于,
所述根据所述分析处理指标信息的量值、第一指标信息的量值进行融合计算,得到相对应的第一指标分析结果,统计与所述第一指标分析结果对应的所有历史指标分析结果,得到最终展示分析结果,包括:
通过以下公式对分析处理指标信息的量值、第一指标信息的量值进行融合计算,
Figure 479458DEST_PATH_IMAGE017
其中,
Figure 336555DEST_PATH_IMAGE018
为第
Figure 93159DEST_PATH_IMAGE020
个分析处理请求所对应的第一指标分析结果,
Figure 329010DEST_PATH_IMAGE021
为第
Figure 436643DEST_PATH_IMAGE022
个分析处理指标信息的量值,
Figure DEST_PATH_IMAGE023
为第
Figure 956486DEST_PATH_IMAGE024
个第一指标信息的量值;
调取与第一指标分析结果所对应的所有历史指标分析结果,根据所述历史指标分析结果得到平均指标分析结果;
若所述第一指标分析结果大于等于平均指标分析结果,则输出第一预设颜色的最终展示分析结果;
若所述第一指标分析结果小于平均指标分析结果,则输出第二预设颜色的最终展示分析结果;
根据所述最终展示分析结果生成对营销端的营销策略。
CN202211401801.XA 2022-11-10 2022-11-10 基于大数据的留学缴费的分析处理方法 Active CN115564423B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211401801.XA CN115564423B (zh) 2022-11-10 2022-11-10 基于大数据的留学缴费的分析处理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211401801.XA CN115564423B (zh) 2022-11-10 2022-11-10 基于大数据的留学缴费的分析处理方法

Publications (2)

Publication Number Publication Date
CN115564423A true CN115564423A (zh) 2023-01-03
CN115564423B CN115564423B (zh) 2023-03-24

Family

ID=84768746

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211401801.XA Active CN115564423B (zh) 2022-11-10 2022-11-10 基于大数据的留学缴费的分析处理方法

Country Status (1)

Country Link
CN (1) CN115564423B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115879952A (zh) * 2023-01-29 2023-03-31 北京易思汇商务服务有限公司 基于留学生的跨境安全缴费方法、装置、设备及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160019534A1 (en) * 2014-07-16 2016-01-21 Mastercard International Incorporated Systems and Methods for Monitoring Performance of Payment Networks Through Distributed Computing
CN111738724A (zh) * 2020-07-31 2020-10-02 支付宝(杭州)信息技术有限公司 跨境资源转移真实性审核方法及装置、电子设备
CN112053124A (zh) * 2020-08-06 2020-12-08 中信银行股份有限公司 线上留学缴费方法、装置、电子设备及介质
CN112561524A (zh) * 2020-12-10 2021-03-26 中信银行股份有限公司 缴费方法及装置、存储介质、电子装置
CN114819941A (zh) * 2022-05-06 2022-07-29 北京易思汇商务服务有限公司 留学用户缴费生命周期模型生成方法及装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160019534A1 (en) * 2014-07-16 2016-01-21 Mastercard International Incorporated Systems and Methods for Monitoring Performance of Payment Networks Through Distributed Computing
CN111738724A (zh) * 2020-07-31 2020-10-02 支付宝(杭州)信息技术有限公司 跨境资源转移真实性审核方法及装置、电子设备
CN112053124A (zh) * 2020-08-06 2020-12-08 中信银行股份有限公司 线上留学缴费方法、装置、电子设备及介质
CN112561524A (zh) * 2020-12-10 2021-03-26 中信银行股份有限公司 缴费方法及装置、存储介质、电子装置
CN114819941A (zh) * 2022-05-06 2022-07-29 北京易思汇商务服务有限公司 留学用户缴费生命周期模型生成方法及装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115879952A (zh) * 2023-01-29 2023-03-31 北京易思汇商务服务有限公司 基于留学生的跨境安全缴费方法、装置、设备及存储介质

Also Published As

Publication number Publication date
CN115564423B (zh) 2023-03-24

Similar Documents

Publication Publication Date Title
CN104702492B (zh) 垃圾消息模型训练方法、垃圾消息识别方法及其装置
CN109872162B (zh) 一种处理用户投诉信息的风控分类识别方法及系统
CN109345417B (zh) 基于身份认证的业务人员的在线考核方法及终端设备
CN106296195A (zh) 一种风险识别方法及装置
CN111078880B (zh) 子应用的风险识别方法以及装置
CN104778186B (zh) 将商品对象挂载到标准产品单元的方法及系统
CN106384273A (zh) 恶意刷单检测系统及方法
CN106708940A (zh) 用于处理图片的方法和装置
CN111275491A (zh) 一种数据处理方法及装置
CN111371767A (zh) 恶意账号识别方法、恶意账号识别装置、介质及电子设备
CN111435357B (zh) 加油站客户流失预测方法、装置、电子设备及存储介质
CN115564423B (zh) 基于大数据的留学缴费的分析处理方法
CN110135684A (zh) 一种能力测评方法、能力测评装置及终端设备
CN113762973A (zh) 数据处理方法、装置、计算机可读介质及电子设备
CN111538909A (zh) 一种信息推荐方法及装置
CN114298845A (zh) 一种理赔票据处理方法和装置
CN112950359A (zh) 一种用户识别方法和装置
CN110210868B (zh) 数值转移数据的处理方法及电子设备
CN112561636A (zh) 一种推荐方法、装置、终端设备及介质
CN109636627B (zh) 基于区块链的保险产品管理方法、装置、介质及电子设备
CN115982653A (zh) 异常账号识别方法、装置、电子设备及可读存储介质
CN109885504B (zh) 推荐系统的测试方法、装置、介质及电子设备
CN113378037A (zh) 资费配置的获取方法及装置
CN114782668A (zh) 模型聚合方法、装置、系统及电子设备
CN113516398A (zh) 基于分层抽样的风险设备识别方法、装置及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant