CN110688371B - 数据调整方法、装置、电子设备及存储介质 - Google Patents

数据调整方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN110688371B
CN110688371B CN201910731273.6A CN201910731273A CN110688371B CN 110688371 B CN110688371 B CN 110688371B CN 201910731273 A CN201910731273 A CN 201910731273A CN 110688371 B CN110688371 B CN 110688371B
Authority
CN
China
Prior art keywords
data
adjustment
target
target data
module
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910731273.6A
Other languages
English (en)
Other versions
CN110688371A (zh
Inventor
孙汀娟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Technology Shenzhen Co Ltd
Original Assignee
Ping An Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Technology Shenzhen Co Ltd filed Critical Ping An Technology Shenzhen Co Ltd
Priority to CN201910731273.6A priority Critical patent/CN110688371B/zh
Publication of CN110688371A publication Critical patent/CN110688371A/zh
Application granted granted Critical
Publication of CN110688371B publication Critical patent/CN110688371B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/215Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2462Approximate or statistical queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/26Visual data mining; Browsing structured data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Software Systems (AREA)
  • Computational Mathematics (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Analysis (AREA)
  • Computational Linguistics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Quality & Reliability (AREA)
  • Operations Research (AREA)
  • Fuzzy Systems (AREA)
  • Algebra (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

一种数据调整方法,所述方法包括:通过获取模块获取多个目标数据以及每个所述目标数据包括的底层数据的数量;通过判断模块判断所述多个目标数据中是否存在底层数据的数量小于预设阈值的目标数据;若所述多个目标数据中存在底层数据的数量小于预设阈值的目标数据,通过输入模块将所述多个目标数据输入预先学习好的数据调整模型中;通过调整模块使用所述数据调整模型对所述多个目标数据进行调整,获得调整数据;通过生成模块根据所述调整数据,生成可视化数据图,其中,所述可视化数据图用于反映所述多个目标数据所代表的业务的真实情况。本发明还提供一种数据调整装置、电子设备及存储介质。本发明能提高数据分析结果的准确性。

Description

数据调整方法、装置、电子设备及存储介质
技术领域
本发明涉及数据处理技术领域,尤其涉及一种数据调整方法、装置、电子设备及存储介质。
背景技术
随着数据获取、管理、存储技术地蓬勃发展,数据逐渐呈现了海量的数据规模、快速的数据流转、多样的数据类型和价值密度低等新型特征,数据也渗透到了各行各业,对数据的分析处理就显得尤其重要。
然而,实践中发现,在数据分析处理中,有一些数据通常是由很多个底层数据经过计算得来的,但通常数据中的极值(比如最大值或最小值)会对数据分析结果造成较大的影响,特别是底层数据的数量较少时,极值对数据分析结果的影响将非常大。
通常,这些数量不足的底层数据或者极值数据在数据分析处理中会被剔除,然而,在底层数据比较少的情况下,任何一个数据都是来之不易的,如果剔除数量不足的底层数据或者极值数据,将会对数据分析产生影响,使得数据分析结果的准确性较低。
因此,如何提高数据分析结果的准确性是一个亟待解决的技术问题。
发明内容
鉴于以上内容,有必要提供一种数据调整方法、装置、电子设备及存储介质,能够提高数据分析结果的准确性。
本发明的第一方面提供一种数据调整方法,所述方法包括:
通过获取模块获取多个目标数据以及每个所述目标数据包括的底层数据的数量;
通过判断模块判断所述多个目标数据中是否存在底层数据的数量小于预设阈值的目标数据;
若所述多个目标数据中存在底层数据的数量小于预设阈值的目标数据,通过输入模块将所述多个目标数据输入预先学习好的数据调整模型中;
通过调整模块使用所述数据调整模型对所述多个目标数据进行调整,获得调整数据;
通过生成模块根据所述调整数据,生成可视化数据图,其中,所述可视化数据图用于反映所述多个目标数据所代表的业务的真实情况。
在一种可能的实现方式中,所述通过调整模块使用所述数据调整模型对所述多个目标数据进行调整,获得调整数据包括:
确定组成所述多个目标数据的底层数据的最大数量;
根据所述最大数量以及每个所述目标数据包括的底层数据的数量,计算每个所述目标数据需要的调整幅度;
针对每个所述目标数据,根据所述数据调整模型以及所述目标数据需要的调整幅度,对所述目标数据进行调整,获得所述目标数据对应的调整数据。
在一种可能的实现方式中,所述通过获取模块获取多个目标数据以及每个所述目标数据包括的底层数据的数量之前,所述方法还包括:
收集训练数据,所述训练数据包括基础样本数据和与所述基础样本数据对应的调整样本数据,所述调整样本数据为预先通过多次试验获得的数据;
利用机器学习算法学习所述基础样本数据与所述调整样本数据之间的关系;
根据所述基础样本数据与所述调整样本数据之间的关系,建立所述数据调整模型。
在一种可能的实现方式中,所述机器学习算法与所述数据调整模型的类型对应,所述数据调整模型的类型包括:多元回归模型、逻辑回归模型以及神经网络模型。
在一种可能的实现方式中,所述方法还包括:
针对每个所述目标数据,从所述目标数据包括的底层数据中,确定极值数据;
获取所述极值数据对应的目标用户;
对所述极值数据进行分析,以确定所述目标用户在所述极值数据所代表的业务上的能力值;
根据所述能力值,对所述目标用户进行业务指导。
在一种可能的实现方式中,所述对所述极值数据进行分析,以确定所述目标用户在所述极值数据所代表的业务上的能力值包括:
从所述目标数据包括的底层数据中,确定中位数;
将所述极值数据与所述中位数进行比较,获得所述极值数据与所述中位数之间的差值;
将所述极值数据以及所述差值输入能力值计算模型中,获得所述目标用户在所述极值数据所代表的业务上的能力值。
在一种可能的实现方式中,所述根据所述能力值,对所述目标用户进行业务指导包括:
若所述能力值代表所述目标用户的能力处于下等水平,确定所述目标用户在所述业务上的技能缺陷;
确定能够弥补所述技能缺陷且能力处于上等水平的资深用户;
获取所述业务在所述技能缺陷上所需的基本技能知识;
向所述目标用户推荐所述基本技能知识以及所述资深用户。
本发明的第二方面提供一种数据调整装置,所述装置包括:
获取模块,用于获取多个目标数据以及每个所述目标数据包括的底层数据的数量;
判断模块,用于判断所述多个目标数据中是否存在底层数据的数量小于预设阈值的目标数据;
输入模块,用于若所述多个目标数据中存在底层数据的数量小于预设阈值的目标数据,将所述多个目标数据输入预先学习好的数据调整模型中;
调整模块,用于使用所述数据调整模型对所述多个目标数据进行调整,获得调整数据;
生成模块,用于根据所述调整数据,生成可视化数据图,其中,所述可视化数据图用于反映所述多个目标数据所代表的业务的真实情况。
本发明的第三方面提供一种电子设备,所述电子设备包括处理器和存储器,所述处理器用于执行所述存储器中存储的计算机程序时实现所述的数据调整方法。
本发明的第四方面提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现所述的数据调整方法。
由以上技术方案,本发明中,可以先通过获取模块获取多个目标数据以及每个所述目标数据包括的底层数据的数量,并通过判断模块判断所述多个目标数据中是否存在底层数据的数量小于预设阈值的目标数据,如果所述多个目标数据中存在底层数据的数量小于预设阈值的目标数据,表明所述目标数据中存在底层数据的数量不足的目标数据,而底层数据的数量不足的目标数据会受到极值的影响,为了避免这种影响,可以通过输入模块将所述多个目标数据输入预先学习好的数据调整模型中,通过调整模块使用所述数据调整模型对所述多个目标数据进行调整,获得调整数据,最后,再通过生成模块根据所述调整数据,生成可视化数据图,由于所述数据调整模型能够将底层数据的数量不足的极值向中位数附近进行调整,而中位数不会受到极值的影响,根据调整后的调整数据,进行数据分析处理,获得的可视化数据图的真实性较高,从而能够提高数据分析结果的准确性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1是本发明公开的一种数据调整方法的较佳实施例的流程图。
图2是本发明公开的一种团队人数排名(倒序)与调整幅度的关系图。
图3是本发明公开的一种调整前后的对比图。
图4是本发明公开的一种数据调整装置的较佳实施例的功能模块图。
图5是本发明实现数据调整方法的较佳实施例的电子设备的结构示意图。
具体实施方式
为了能够更清楚地理解本发明的上述目的、特征和优点,下面结合附图和具体实施例对本发明进行详细描述。需要说明的是,在不冲突的情况下,本发明的实施例及实施例中的特征可以相互组合。
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。本文中在本发明的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本发明。
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
本发明实施例的数据调整方法应用在电子设备中,也可以应用在电子设备和通过网络与所述电子设备进行连接的服务器所构成的硬件环境中,由服务器和电子设备共同执行。网络包括但不限于:广域网、城域网或局域网。
其中,服务器可以是指能对网络中其它设备(如电子设备)提供服务的计算机系统。如果一个个人电脑能够对外提供文件传输协议(File Transfer Protocol,简称FTP)服务,也可以叫服务器。从狭义范围上讲,服务器专指某些高性能计算机,能通过网络,对外提供服务,其相对于普通的个人电脑来说,稳定性、安全性、性能等方面都要求更高,因此在CPU、芯片组、内存、磁盘系统、网络等硬件和普通的个人电脑有所不同。
所述电子设备包括一种能够按照事先设定或存储的指令,自动进行数值计算和/或信息处理的电子设备,其硬件包括但不限于微处理器、专用集成电路(ASIC)、可编程门阵列(FPGA)、数字处理器(DSP)、嵌入式设备等。所述电子设备还可包括网络设备和/或用户设备。其中,所述网络设备包括但不限于单个网络服务器、多个网络服务器组成的服务器组或基于云计算(Cloud Computing)的由大量主机或网络服务器构成的云,其中,云计算是分布式计算的一种,由一群松散耦合的计算机集组成的一个超级虚拟计算机。所述用户设备包括但不限于任何一种可与用户通过键盘、鼠标、遥控器、触摸板或声控设备等方式进行人机交互的电子产品,例如,个人计算机、平板电脑、智能手机、个人数字助理PDA、游戏机、交互式网络电视IPTV、智能式穿戴式设备等。其中,所述用户设备及网络设备所处的网络包括但不限于互联网、广域网、城域网、局域网、虚拟专用网络VPN等。
请参见图1,图1是本发明公开的一种数据调整方法的较佳实施例的流程图。其中,根据不同的需求,该流程图中步骤的顺序可以改变,某些步骤可以省略。
S11、电子设备通过获取模块获取多个目标数据以及每个所述目标数据包括的底层数据的数量。
本发明实施例中,所述目标数据为需要进行整体分析的业务数据,比如多个团队的得分数据,每个所述目标数据包括至少一个底层数据,所述目标数据由所述至少一个底层数据经计算得到,比如:数据X1由其他数据
Figure BDA0002160650770000071
经计算得到,
Figure BDA0002160650770000072
为X1的底层数据,X1为目标数据,类似的,目标数据X2由底层数据
Figure BDA0002160650770000073
经计算得到,依次类推,共有n个数据需由底层数据经计算得到,也即Xn
Figure BDA0002160650770000074
经计算得到,假设X1,X2…Xn的分布服从正态分布或趋近正态分布。
在目标数据X1,X2…Xn中,底层数据的数量较大的目标数据能较好的代表业务在整体上的真实情况,而底层数据的数量较小的目标数据,则会受到底层数据中极值(即极大值或极小值)的影响。
S12、电子设备通过判断模块判断所述多个目标数据中是否存在底层数据的数量小于预设阈值的目标数据,若是,执行步骤S13,若否,结束本流程。
其中,可以预先设置一个预设阈值,所述预设阈值为能够反映业务在整体上的真实情况所需数据的数量的临界值,比如最小值。
本发明实施例中,针对每个所述目标数据,可以依次判断所述目标数据包括的底层数据的数量是否小于预设阈值,如果所述目标数据包括的底层数据的数量小于预设阈值,表明所述目标数据包括的底层数据的数量不够,底层数据中的极大值或极小值将会影响最终计算得到的目标数据,从而导致所述目标数据与真实情况相差较大。
如果所述多个目标数据中存在底层数据的数量小于预设阈值的目标数据,为了能够准确地反映业务在整体上的真实情况,需要对所述多个目标数据进行调整。
S13、电子设备通过输入模块将所述多个目标数据输入预先学习好的数据调整模型中。
本发明实施例中,所述数据调整模型为预先学习好的模型,所述数据调整模型能够对所述多个目标数据进行调整,使得调整后获得的调整数据能够准确地反映业务在整体上的真实情况。
作为一种可选的实施方式,步骤S11之前,所述方法还包括:
收集训练数据,所述训练数据包括基础样本数据和与所述基础样本数据对应的调整样本数据,所述调整样本数据为预先通过多次试验获得的数据;
利用机器学习算法学习所述基础样本数据与所述调整样本数据之间的关系;
根据所述基础样本数据与所述调整样本数据之间的关系,建立所述数据调整模型。
在该可选的实施方式中,所述基础样本数据包括多个,该多个基础样本数据中存在底层数据的数量小于预设阈值的样本数据,可以预先经过多次试验,对多个基础样本数据向中位数附近进行调整,获得测试数据,并从所述测试数据中将能够反映业务在整体上的真实情况的测试数据确定为调整样本数据,并建立所述基础样本数据与所述调整样本数据之间的对应关系。
进一步地,可以利用机器学习算法学习所述基础样本数据与所述调整样本数据之间的关系,其中,所述机器学习算法与所述数据调整模型的类型对应,所述数据调整模型的类型包括:多元回归模型、逻辑回归模型以及神经网络模型。
举例来说,假设多个团队的得分为X1,X2…Xn(即基础样本数据),X1包括的底层数据为
Figure BDA0002160650770000081
X2包括的底层数据为/>
Figure BDA0002160650770000082
依次类推,Xn包括的底层数据为/>
Figure BDA0002160650770000083
X1,X2…Xn的分布服从正态分布或趋近正态分布,调整后的团队得分为y1,y2…yn(即调整样本数据)。
则利用机器学习算法学习所述基础样本数据与所述调整样本数据之间的关系可以为:
Figure BDA0002160650770000084
其中,a为调整系数,取值范围为(0,1],通常a可以在(1/8,1/4)中取值,a的大小通常会影响最后生成的可视化数据图中线条的弯曲程度,可以通过实验进行调整,使得a的取值更好的贴合实际,rankXi为X1,X2…Xn的排名结果,倒序排名,也即Xi越小,rankXi越小,取值范围为1,2,…n。可选的,所述机器学习算法与所述数据调整模型的类型对应,所述数据调整模型的类型包括:多元回归模型、逻辑回归模型以及神经网络模型。
S14、电子设备通过调整模块使用所述数据调整模型对所述多个目标数据进行调整,获得调整数据。
其中,所述数据调整模型对每个所述目标数据调整的幅度是不同的,这取决于所述目标数据所在的位置,由于所述多个目标数据X1,X2…Xn的分布服从正态分布或趋近正态分布,则底层数据的数量较小的目标数据有极大的概率落在所述多个目标数据X1,X2…Xn的中位数附近。
作为一种可选的实施方式,所述通过调整模块使用所述数据调整模型对所述多个目标数据进行调整,获得调整数据包括:
确定组成所述多个目标数据的底层数据的最大数量;
根据所述最大数量以及每个所述目标数据包括的底层数据的数量,计算每个所述目标数据需要的调整幅度;
针对每个所述目标数据,根据所述数据调整模型以及所述目标数据需要的调整幅度,对所述目标数据进行调整,获得所述目标数据对应的调整数据。
在该可选的实施方式中,每个所述目标数据包括的底层数据的数量可能不同,可以从每个所述目标数据包括的底层数据的数量中确定最大数量,并根据所述最大数量以及每个所述目标数据包括的底层数据的数量,计算每个所述目标数据需要的调整幅度,比如上述公式中的
Figure BDA0002160650770000091
即为调整幅度,所述调整幅度的取值范围为(0,1),假如计算的调整幅度为0.3,则表示调整幅度为30%,也即30%选取调整后的调整数据,70%选取调整前的目标数据。
请一并参见图2,图2为团队人数排名(倒序)与调整幅度的关系图,如图2所示,底层数据的数量越少,对应的目标数据的调整幅度越大。
在确定调整幅度后,即可使用所述数据调整模型以及所述目标数据需要的调整幅度,对所述目标数据进行调整,获得所述目标数据对应的调整数据。
S15、电子设备通过生成模块根据所述调整数据,生成可视化数据图,其中,所述可视化数据图用于反映所述多个目标数据所代表的业务的真实情况。
本发明实施例中,经所述数据调整模型调整后的所述调整数据,虽然所述调整数据包括的底层数据的数量不变,但是,所述调整数据不会被所述底层数据中的极值所影响,根据所述调整数据,生成的可视化数据图,能够很好的反映所述多个目标数据所代表的业务的真实情况。
请一并参见图3,图3为调整前后的对比图。如图3所示,在调整前,根据所述多个目标数据生成的可视化数据图为一条直线,而在调整后,根据所述多个调整数据生成的可视化数据图为一条类似正弦的曲线,很明显,直线背离了团队排名得分的真实情况,而曲线能够很好地反映团队排名得分的真实情况。
作为一种可选的实施方式,所述方法还包括:
针对每个所述目标数据,从所述目标数据包括的底层数据中,确定极值数据;
获取所述极值数据对应的目标用户;
对所述极值数据进行分析,以确定所述目标用户在所述极值数据所代表的业务上的能力值;
根据所述能力值,对所述目标用户进行业务指导。
在该可选的实施方式中,每个所述目标数据包括多个底层数据,这些底层数据中可能会存在极值,比如极大值或极小值,如果这些底层数据代表的是用户在业务上的数据,比如一个团队中的团员在某个项目上的得分,则这些底层数据从某种程度上就代表了用户自身在该业务上的能力水平,极值数据对应的目标用户也就代表了所述目标用户在底层数据对应的所有用户中的能力的最低水平和最高水平,也即所述目标用户比较有代表性。
在确定所述目标用户后,可以对所述极值数据进行分析,进而确定所述目标用户在所述极值数据所代表的业务上的能力值,进一步地,还可以根据所述能力值,对所述目标用户进行业务指导,此处进行业务指导主要针对的是能力值较低的目标用户。
作为一种可选的实施方式,所述对所述极值数据进行分析,以确定所述目标用户在所述极值数据所代表的业务上的能力值包括:
从所述目标数据包括的底层数据中,确定中位数;
将所述极值数据与所述中位数进行比较,获得所述极值数据与所述中位数之间的差值;
将所述极值数据以及所述差值输入能力值计算模型中,获得所述目标用户在所述极值数据所代表的业务上的能力值。
其中,可以预先训练能力值计算模型,具体训练方法如下:1、获取大量的极值数据以及差值,其中,每个极值数据与所述差值对应,2、预设每个极值数据、差值所对应的能力值。3、利用机器学习算法学习所述极值数据、差值与所述能力值之间的关系。4、根据所述极值数据、差值与所述能力值之间的关系,建立所述能力值计算模型。
在该可选的实施方式中,通常,中位数能够从一定程度上反映整体的平均水平,而不会受到极值或者底层数据的数量不足的影响。通过极值数据、中位数训练获得的能力值计算模型,能够很好的反映用户的能力水平。通常,能力值越大,代表用户的能力水平越高,反之,能力值越小,代表用户的能力水平越低。
作为一种可选的实施方式,所述根据所述能力值,对所述目标用户进行业务指导包括:
若所述能力值代表所述目标用户的能力处于下等水平,确定所述目标用户在所述业务上的技能缺陷;
确定能够弥补所述技能缺陷且能力处于上等水平的资深用户;
获取所述业务在所述技能缺陷上所需的基本技能知识;
向所述目标用户推荐所述基本技能知识以及所述资深用户。
在该可选的实施方式中,可以根据能力值将用户的能力划分为三个等级,比如上等水平、中等水平以及下等水平。比如,可以设置上等水平的能力值范围为(A,B),中等水平的能力值范围为(C,B),以及下等水平的能力值范围为(D,C)。
其中,能力值与用户的技能息息相关,不同的能力值能够反映用户在哪些方面的技能较强,在哪些方面的技能存在缺陷。
如果所述目标用户在所述极值数据所代表的业务上的能力值代表所述目标用户的能力处于下等水平,表明所述目标用户所对应的极值数据为极小值,也表明所述目标用户在整个团队中处于一个极差的水平。其中,可以预先存储所有用户的能力值与用户技能信息的对应关系,当确定所述目标用户的能力值之后,可以从能力值与用户技能信息的对应关系中,查询所述目标用户的能力值所对应的技能缺陷,进一步地,在确定能够弥补所述技能缺陷且能力处于上等水平的资深用户,也即该资深用户在所述技能缺陷上的能力值处于上等水平,能够对所述目标用户进行技能指导。此外,还可以获取所述业务在所述技能缺陷上所需的基本技能知识,并向所述目标用户推荐所述基本技能知识以及所述资深用户,以便所述目标用户可以通过所述基本技术知识自学,或者向所述资深用户来请教,多方面来提升自己的技能水平,从而有助于提高整个团队的技能水平。
在图1所描述的方法流程中,可以先通过获取模块获取多个目标数据以及每个所述目标数据包括的底层数据的数量,并通过判断模块判断所述多个目标数据中是否存在底层数据的数量小于预设阈值的目标数据,如果所述多个目标数据中存在底层数据的数量小于预设阈值的目标数据,表明所述目标数据中存在底层数据的数量不足的目标数据,而底层数据的数量不足的目标数据会受到极值的影响,为了避免这种影响,可以通过输入模块将所述多个目标数据输入预先学习好的数据调整模型中,通过调整模块使用所述数据调整模型对所述多个目标数据进行调整,获得调整数据,最后,再通过生成模块根据所述调整数据,生成可视化数据图,由于所述数据调整模型能够将底层数据的数量不足的极值向中位数附近进行调整,而中位数不会受到极值的影响,根据调整后的调整数据,进行数据分析处理,获得的可视化数据图的真实性较高,从而能够提高数据分析结果的准确性。
以上所述,仅是本发明的具体实施方式,但本发明的保护范围并不局限于此,对于本领域的普通技术人员来说,在不脱离本发明创造构思的前提下,还可以做出改进,但这些均属于本发明的保护范围。
请参见图4,图4是本发明公开的一种数据调整装置的较佳实施例的功能模块图。
在一些实施例中,所述数据调整装置运行于电子设备中。所述数据调整装置可以包括多个由程序代码段所组成的功能模块。所述数据调整装置中的各个程序段的程序代码可以存储于存储器中,并由至少一个处理器所执行,以执行图1所描述的数据调整方法中的部分或全部步骤。
本实施例中,所述数据调整装置根据其所执行的功能,可以被划分为多个功能模块。所述功能模块可以包括:获取模块201、判断模块202、输入模块203、调整模块204及生成模块205。本发明所称的模块是指一种能够被至少一个处理器所执行并且能够完成固定功能的一系列计算机程序段,其存储在存储器中。在一些实施例中,关于各模块的功能将在后续的实施例中详述。
获取模块201,用于获取多个目标数据以及每个所述目标数据包括的底层数据的数量;
本发明实施例中,所述目标数据为需要进行整体分析的业务数据,比如多个团队的得分数据,每个所述目标数据包括至少一个底层数据,所述目标数据由所述至少一个底层数据经计算得到,比如:数据X1由其他数据
Figure BDA0002160650770000141
经计算得到,
Figure BDA0002160650770000142
为X1的底层数据,X1为目标数据,类似的,目标数据X2由底层数据
Figure BDA0002160650770000143
经计算得到,依次类推,共有n个数据需由底层数据经计算得到,也即Xn
Figure BDA0002160650770000144
经计算得到,假设X1,X2…Xn的分布服从正态分布或趋近正态分布。
在目标数据X1,X2…Xn中,底层数据的数量较大的目标数据能较好的代表业务在整体上的真实情况,而底层数据的数量较小的目标数据,则会受到底层数据中极值(即极大值或极小值)的影响。
判断模块202,用于判断所述多个目标数据中是否存在底层数据的数量小于预设阈值的目标数据;
其中,可以预先设置一个预设阈值,所述预设阈值为能够反映业务在整体上的真实情况所需数据的数量的临界值,比如最小值。
本发明实施例中,针对每个所述目标数据,可以依次判断所述目标数据包括的底层数据的数量是否小于预设阈值,如果所述目标数据包括的底层数据的数量小于预设阈值,表明所述目标数据包括的底层数据的数量不够,底层数据中的极大值或极小值将会影响最终计算得到的目标数据,从而导致所述目标数据与真实情况相差较大。
如果所述多个目标数据中存在底层数据的数量小于预设阈值的目标数据,为了能够准确地反映业务在整体上的真实情况,需要对所述多个目标数据进行调整。
输入模块203,用于若所述多个目标数据中存在底层数据的数量小于预设阈值的目标数据,将所述多个目标数据输入预先学习好的数据调整模型中;
本发明实施例中,所述数据调整模型为预先学习好的模型,所述数据调整模型能够对所述多个目标数据进行调整,使得调整后获得的调整数据能够准确地反映业务在整体上的真实情况。
调整模块204,用于使用所述数据调整模型对所述多个目标数据进行调整,获得调整数据;
其中,所述数据调整模型对每个所述目标数据调整的幅度是不同的,这取决于所述目标数据所在的位置,由于所述多个目标数据X1,X2…Xn的分布服从正态分布或趋近正态分布,则底层数据的数量较小的目标数据有极大的概率落在所述多个目标数据X1,X2…Xn的中位数附近。
生成模块205,用于根据所述调整数据,生成可视化数据图,其中,所述可视化数据图用于反映所述多个目标数据所代表的业务的真实情况。
本发明实施例中,经所述数据调整模型调整后的所述调整数据,虽然所述调整数据包括的底层数据的数量不变,但是,所述调整数据不会被所述底层数据中的极值所影响,根据所述调整数据,生成的可视化数据图,能够很好的反映所述多个目标数据所代表的业务的真实情况。
请一并参见图3,图3为调整前后的对比图。如3所示,在调整前,根据所述多个目标数据生成的可视化数据图为一条直线,而在调整后,根据所述多个调整数据生成的可视化数据图为一条类似正弦的曲线,很明显,直线背离了团队排名得分的真实情况,而曲线能够很好地反映团队排名得分的真实情况。
作为一种可选的实施方式,所述调整模块204使用所述数据调整模型对所述多个目标数据进行调整,获得调整数据的方式具体为:
确定组成所述多个目标数据的底层数据的最大数量;
根据所述最大数量以及每个所述目标数据包括的底层数据的数量,计算每个所述目标数据需要的调整幅度;
针对每个所述目标数据,根据所述数据调整模型以及所述目标数据需要的调整幅度,对所述目标数据进行调整,获得所述目标数据对应的调整数据。
在该可选的实施方式中,每个所述目标数据包括的底层数据的数量可能不同,可以从每个所述目标数据包括的底层数据的数量中确定最大数量,并根据所述最大数量以及每个所述目标数据包括的底层数据的数量,计算每个所述目标数据需要的调整幅度,比如上述公式中的
Figure BDA0002160650770000161
即为调整幅度,所述调整幅度的取值范围为(0,1),假如计算的调整幅度为0.3,则表示调整幅度为30%,也即30%选取调整后的调整数据,70%选取调整前的目标数据。
请一并参见图2,图2为团队人数排名(倒序)与调整幅度的关系图,如图2所示,底层数据的数量越少,对应的目标数据的调整幅度越大。
在确定调整幅度后,即可使用所述数据调整模型以及所述目标数据需要的调整幅度,对所述目标数据进行调整,获得所述目标数据对应的调整数据。
作为一种可选的实施方式,所述数据调整装置还可以包括:
收集模块,用于所述获取模块201获取多个目标数据以及每个所述目标数据包括的底层数据的数量之前,收集训练数据,所述训练数据包括基础样本数据和与所述基础样本数据对应的调整样本数据,所述调整样本数据为预先通过多次试验获得的数据;
学习模块,用于利用机器学习算法学习所述基础样本数据与所述调整样本数据之间的关系;
建立模块,用于根据所述基础样本数据与所述调整样本数据之间的关系,建立所述数据调整模型。
在该可选的实施方式中,所述基础样本数据包括多个,该多个基础样本数据中存在底层数据的数量小于预设阈值的样本数据,可以预先经过多次试验,对多个基础样本数据向中位数附近进行调整,获得测试数据,并从所述测试数据中将能够反映业务在整体上的真实情况的测试数据确定为调整样本数据,并建立所述基础样本数据与所述调整样本数据之间的对应关系。
进一步地,可以利用机器学习算法学习所述基础样本数据与所述调整样本数据之间的关系,其中,所述机器学习算法与所述数据调整模型的类型对应,所述数据调整模型的类型包括:多元回归模型、逻辑回归模型以及神经网络模型。
举例来说,假设多个团队的得分为X1,X2…Xn(即基础样本数据),X1包括的底层数据为
Figure BDA0002160650770000171
X2包括的底层数据为/>
Figure BDA0002160650770000172
依次类推,Xn包括的底层数据为/>
Figure BDA0002160650770000173
X1,X2…Xn的分布服从正态分布或趋近正态分布,调整后的团队得分为y1,y2…yn(即调整样本数据)。
则利用机器学习算法学习所述基础样本数据与所述调整样本数据之间的关系可以为:
Figure BDA0002160650770000174
其中,a为调整系数,取值范围为(0,1],通常a可以在(1/8,1/4)中取值,a的大小通常会影响最后生成的可视化数据图中线条的弯曲程度,可以通过实验进行调整,使得a的取值更好的贴合实际,rankXi为X1,X2…Xn的排名结果,倒序排名,也即Xi越小,rankXi越小,取值范围为1,2,…n。
作为一种可选的实施方式,所述机器学习算法与所述数据调整模型的类型对应,所述数据调整模型的类型包括:多元回归模型、逻辑回归模型以及神经网络模型。
作为一种可选的实施方式,所述数据调整装置还可以包括:
确定模块,用于针对每个所述目标数据,从所述目标数据包括的底层数据中,确定极值数据;
所述获取模块201,还用于获取所述极值数据对应的目标用户;
分析模块,用于对所述极值数据进行分析,以确定所述目标用户在所述极值数据所代表的业务上的能力值;
指导模块,用于根据所述能力值,对所述目标用户进行业务指导。
在该可选的实施方式中,每个所述目标数据包括多个底层数据,这些底层数据中可能会存在极值,比如极大值或极小值,如果这些底层数据代表的是用户在业务上的数据,比如一个团队中的团员在某个项目上的得分,则这些底层数据从某种程度上就代表了用户自身在该业务上的能力水平,极值数据对应的目标用户也就代表了所述目标用户在底层数据对应的所有用户中的能力的最低水平和最高水平,也即所述目标用户比较有代表性。
在确定所述目标用户后,可以对所述极值数据进行分析,进而确定所述目标用户在所述极值数据所代表的业务上的能力值,进一步地,还可以根据所述能力值,对所述目标用户进行业务指导,此处进行业务指导主要针对的是能力值较低的目标用户。
作为一种可选的实施方式,所述分析模块对所述极值数据进行分析,以确定所述目标用户在所述极值数据所代表的业务上的能力值的方式具体为:
从所述目标数据包括的底层数据中,确定中位数;
将所述极值数据与所述中位数进行比较,获得所述极值数据与所述中位数之间的差值;
将所述极值数据以及所述差值输入能力值计算模型中,获得所述目标用户在所述极值数据所代表的业务上的能力值。
其中,可以预先训练能力值计算模型,具体训练方法如下:1、获取大量的极值数据以及差值,其中,每个极值数据与所述差值对应,2、预设每个极值数据、差值所对应的能力值。3、利用机器学习算法学习所述极值数据、差值与所述能力值之间的关系。4、根据所述极值数据、差值与所述能力值之间的关系,建立所述能力值计算模型。
在该可选的实施方式中,通常,中位数能够从一定程度上反映整体的平均水平,而不会受到极值或者底层数据的数量不足的影响。通过极值数据、中位数训练获得的能力值计算模型,能够很好的反映用户的能力水平。通常,能力值越大,代表用户的能力水平越高,反之,能力值越小,代表用户的能力水平越低。
作为一种可选的实施方式,所述指导模块根据所述能力值,对所述目标用户进行业务指导的方式具体为:
若所述能力值代表所述目标用户的能力处于下等水平,确定所述目标用户在所述业务上的技能缺陷;
确定能够弥补所述技能缺陷且能力处于上等水平的资深用户;
获取所述业务在所述技能缺陷上所需的基本技能知识;
向所述目标用户推荐所述基本技能知识以及所述资深用户。
在该可选的实施方式中,可以根据能力值将用户的能力划分为三个等级,比如上等水平、中等水平以及下等水平。比如,可以设置上等水平的能力值范围为(A,B),中等水平的能力值范围为(C,B),以及下等水平的能力值范围为(D,C)。
其中,能力值与用户的技能息息相关,不同的能力值能够反映用户在哪些方面的技能较强,在哪些方面的技能存在缺陷。
如果所述目标用户在所述极值数据所代表的业务上的能力值代表所述目标用户的能力处于下等水平,表明所述目标用户所对应的极值数据为极小值,也表明所述目标用户在整个团队中处于一个极差的水平。其中,可以预先存储所有用户的能力值与用户技能信息的对应关系,当确定所述目标用户的能力值之后,可以从能力值与用户技能信息的对应关系中,查询所述目标用户的能力值所对应的技能缺陷,进一步地,在确定能够弥补所述技能缺陷且能力处于上等水平的资深用户,也即该资深用户在所述技能缺陷上的能力值处于上等水平,能够对所述目标用户进行技能指导。此外,还可以获取所述业务在所述技能缺陷上所需的基本技能知识,并向所述目标用户推荐所述基本技能知识以及所述资深用户,以便所述目标用户可以通过所述基本技术知识自学,或者向所述资深用户来请教,多方面来提升自己的技能水平,从而有助于提高整个团队的技能水平。
在图4所描述的数据调整装置中,可以先通过获取模块获取多个目标数据以及每个所述目标数据包括的底层数据的数量,并通过判断模块判断所述多个目标数据中是否存在底层数据的数量小于预设阈值的目标数据,如果所述多个目标数据中存在底层数据的数量小于预设阈值的目标数据,表明所述目标数据中存在底层数据的数量不足的目标数据,而底层数据的数量不足的目标数据会受到极值的影响,为了避免这种影响,可以通过输入模块将所述多个目标数据输入预先学习好的数据调整模型中,通过调整模块使用所述数据调整模型对所述多个目标数据进行调整,获得调整数据,最后,再通过生成模块根据所述调整数据,生成可视化数据图,由于所述数据调整模型能够将底层数据的数量不足的极值向中位数附近进行调整,而中位数不会受到极值的影响,根据调整后的调整数据,进行数据分析处理,获得的可视化数据图的真实性较高,从而能够提高数据分析结果的准确性。
如图5所示,图5是本发明实现数据调整方法的较佳实施例的电子设备的结构示意图。所述电子设备3包括存储器31、至少一个处理器32、存储在所述存储器31中并可在所述至少一个处理器32上运行的计算机程序33及至少一条通讯总线34。
本领域技术人员可以理解,图5所示的示意图仅仅是所述电子设备3的示例,并不构成对所述电子设备3的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述电子设备3还可以包括输入输出设备、网络接入设备等。
所述电子设备3还包括但不限于任何一种可与用户通过键盘、鼠标、遥控器、触摸板或声控设备等方式进行人机交互的电子产品,例如,个人计算机、平板电脑、智能手机、个人数字助理(Personal Digital Assistant,PDA)、游戏机、交互式网络电视(InternetProtocol Television,IPTV)、智能式穿戴式设备等。所述电子设备3所处的网络包括但不限于互联网、广域网、城域网、局域网、虚拟专用网络(Virtual Private Network,VPN)等。
所述至少一个处理器32可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。该处理器32可以是微处理器或者该处理器32也可以是任何常规的处理器等,所述处理器32是所述电子设备3的控制中心,利用各种接口和线路连接整个电子设备3的各个部分。
所述存储器31可用于存储所述计算机程序33和/或模块/单元,所述处理器32通过运行或执行存储在所述存储器31内的计算机程序和/或模块/单元,以及调用存储在存储器31内的数据,实现所述电子设备3的各种功能。所述存储器31可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据电子设备3的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器31可以包括高速随机存取存储器,还可以包括非易失性存储器,例如硬盘、内存、插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
结合图3,所述电子设备3中的所述存储器31存储多个指令以实现一种数据调整方法,所述处理器32可执行所述多个指令从而实现:
通过获取模块获取多个目标数据以及每个所述目标数据包括的底层数据的数量;
通过判断模块判断所述多个目标数据中是否存在底层数据的数量小于预设阈值的目标数据;
若所述多个目标数据中存在底层数据的数量小于预设阈值的目标数据,通过输入模块将所述多个目标数据输入预先学习好的数据调整模型中;
通过调整模块使用所述数据调整模型对所述多个目标数据进行调整,获得调整数据;
通过生成模块根据所述调整数据,生成可视化数据图,其中,所述可视化数据图用于反映所述多个目标数据所代表的业务的真实情况。
在一种可选的实施方式中,所述通过调整模块使用所述数据调整模型对所述多个目标数据进行调整,获得调整数据包括:
确定组成所述多个目标数据的底层数据的最大数量;
根据所述最大数量以及每个所述目标数据包括的底层数据的数量,计算每个所述目标数据需要的调整幅度;
针对每个所述目标数据,根据所述数据调整模型以及所述目标数据需要的调整幅度,对所述目标数据进行调整,获得所述目标数据对应的调整数据。
在一种可选的实施方式中,所述通过获取模块获取多个目标数据以及每个所述目标数据包括的底层数据的数量之前,所述处理器32可执行所述多个指令从而实现:
收集训练数据,所述训练数据包括基础样本数据和与所述基础样本数据对应的调整样本数据,所述调整样本数据为预先通过多次试验获得的数据;
利用机器学习算法学习所述基础样本数据与所述调整样本数据之间的关系;
根据所述基础样本数据与所述调整样本数据之间的关系,建立所述数据调整模型。
在一种可选的实施方式中,所述机器学习算法与所述数据调整模型的类型对应,所述数据调整模型的类型包括:多元回归模型、逻辑回归模型以及神经网络模型。
在一种可选的实施方式中,所述处理器32可执行所述多个指令从而实现:
针对每个所述目标数据,从所述目标数据包括的底层数据中,确定极值数据;
获取所述极值数据对应的目标用户;
对所述极值数据进行分析,以确定所述目标用户在所述极值数据所代表的业务上的能力值;
根据所述能力值,对所述目标用户进行业务指导。
在一种可选的实施方式中,所述对所述极值数据进行分析,以确定所述目标用户在所述极值数据所代表的业务上的能力值包括:
从所述目标数据包括的底层数据中,确定中位数;
将所述极值数据与所述中位数进行比较,获得所述极值数据与所述中位数之间的差值;
将所述极值数据以及所述差值输入能力值计算模型中,获得所述目标用户在所述极值数据所代表的业务上的能力值。
在一种可选的实施方式中,所述根据所述能力值,对所述目标用户进行业务指导包括:
若所述能力值代表所述目标用户的能力处于下等水平,确定所述目标用户在所述业务上的技能缺陷;
确定能够弥补所述技能缺陷且能力处于上等水平的资深用户;
获取所述业务在所述技能缺陷上所需的基本技能知识;
向所述目标用户推荐所述基本技能知识以及所述资深用户。
具体地,所述处理器32对上述指令的具体实现方法可参考图3对应实施例中相关步骤的描述,在此不赘述。
在图5所描述的电子设备3中,可以先通过获取模块获取多个目标数据以及每个所述目标数据包括的底层数据的数量,并通过判断模块判断所述多个目标数据中是否存在底层数据的数量小于预设阈值的目标数据,如果所述多个目标数据中存在底层数据的数量小于预设阈值的目标数据,表明所述目标数据中存在底层数据的数量不足的目标数据,而底层数据的数量不足的目标数据会受到极值的影响,为了避免这种影响,可以通过输入模块将所述多个目标数据输入预先学习好的数据调整模型中,通过调整模块使用所述数据调整模型对所述多个目标数据进行调整,获得调整数据,最后,再通过生成模块根据所述调整数据,生成可视化数据图,由于所述数据调整模型能够将底层数据的数量不足的极值向中位数附近进行调整,而中位数不会受到极值的影响,根据调整后的调整数据,进行数据分析处理,获得的可视化数据图的真实性较高,从而能够提高数据分析结果的准确性。
所述电子设备3集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。
在本发明所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能模块的形式实现。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附关联图标记视为限制所涉及的权利要求。此外,显然“包括”一词不排除其他单元或步骤,单数不排除复数。系统权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第二等词语用来表示名称,而并不表示任何特定的顺序。
最后应说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或等同替换,而不脱离本发明技术方案的精神和范围。

Claims (8)

1.一种数据调整方法,其特征在于,所述方法包括:
收集训练数据,所述训练数据包括基础样本数据和与所述基础样本数据对应的调整样本数据,所述调整样本数据为预先通过多次试验获得的数据,利用机器学习算法学习所述基础样本数据与所述调整样本数据之间的关系,根据所述基础样本数据与所述调整样本数据之间的关系,建立数据调整模型;
通过获取模块获取多个目标数据以及每个所述目标数据包括的底层数据的数量;
通过判断模块判断所述多个目标数据中是否存在底层数据的数量小于预设阈值的目标数据;
若所述多个目标数据中存在底层数据的数量小于预设阈值的目标数据,通过输入模块将所述多个目标数据输入所述数据调整模型中;
通过调整模块使用所述数据调整模型对所述多个目标数据进行调整,获得调整数据,包括:确定组成所述多个目标数据的底层数据的最大数量,根据所述最大数量以及每个所述目标数据包括的底层数据的数量,计算每个所述目标数据需要的调整幅度,针对每个所述目标数据,根据所述数据调整模型以及所述目标数据需要的调整幅度,对所述目标数据进行调整,获得所述目标数据对应的调整数据;
通过生成模块根据所述调整数据,生成可视化数据图,其中,所述可视化数据图用于反映所述多个目标数据所代表的业务的真实情况。
2.根据权利要求1所述的方法,其特征在于,所述机器学习算法与所述数据调整模型的类型对应,所述数据调整模型的类型包括:多元回归模型、逻辑回归模型以及神经网络模型。
3.根据权利要求1至2任一项所述的方法,其特征在于,所述方法还包括:
针对每个所述目标数据,从所述目标数据包括的底层数据中,确定极值数据;
获取所述极值数据对应的目标用户;
对所述极值数据进行分析,以确定所述目标用户在所述极值数据所代表的业务上的能力值;
根据所述能力值,对所述目标用户进行业务指导。
4.根据权利要求3所述的方法,其特征在于,所述对所述极值数据进行分析,以确定所述目标用户在所述极值数据所代表的业务上的能力值包括:
从所述目标数据包括的底层数据中,确定中位数;
将所述极值数据与所述中位数进行比较,获得所述极值数据与所述中位数之间的差值;
将所述极值数据以及所述差值输入能力值计算模型中,获得所述目标用户在所述极值数据所代表的业务上的能力值。
5.根据权利要求3所述的方法,其特征在于,所述根据所述能力值,对所述目标用户进行业务指导包括:
若所述能力值代表所述目标用户的能力处于下等水平,确定所述目标用户在所述业务上的技能缺陷;
确定能够弥补所述技能缺陷且能力处于上等水平的资深用户;
获取所述业务在所述技能缺陷上所需的基本技能知识;
向所述目标用户推荐所述基本技能知识以及所述资深用户。
6.一种数据调整装置,其特征在于,所述数据调整装置包括:
收集模块,用于收集训练数据,所述训练数据包括基础样本数据和与所述基础样本数据对应的调整样本数据,所述调整样本数据为预先通过多次试验获得的数据;
学习模块,用于利用机器学习算法学习所述基础样本数据与所述调整样本数据之间的关系;
建立模块,用于根据所述基础样本数据与所述调整样本数据之间的关系,建立数据调整模型;
获取模块,用于获取多个目标数据以及每个所述目标数据包括的底层数据的数量;
判断模块,用于判断所述多个目标数据中是否存在底层数据的数量小于预设阈值的目标数据;
输入模块,用于若所述多个目标数据中存在底层数据的数量小于预设阈值的目标数据,将所述多个目标数据输入所述数据调整模型中;
调整模块,用于使用所述数据调整模型对所述多个目标数据进行调整,获得调整数据,包括:确定组成所述多个目标数据的底层数据的最大数量,根据所述最大数量以及每个所述目标数据包括的底层数据的数量,计算每个所述目标数据需要的调整幅度,针对每个所述目标数据,根据所述数据调整模型以及所述目标数据需要的调整幅度,对所述目标数据进行调整,获得所述目标数据对应的调整数据;
生成模块,用于根据所述调整数据,生成可视化数据图,其中,所述可视化数据图用于反映所述多个目标数据所代表的业务的真实情况。
7.一种电子设备,其特征在于,所述电子设备包括处理器和存储器,所述处理器用于执行存储器中存储的计算机程序以实现如权利要求1至5中任意一项所述的数据调整方法。
8.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有至少一个指令,所述至少一个指令被处理器执行时实现如权利要求1至5中任意一项所述的数据调整方法。
CN201910731273.6A 2019-08-08 2019-08-08 数据调整方法、装置、电子设备及存储介质 Active CN110688371B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910731273.6A CN110688371B (zh) 2019-08-08 2019-08-08 数据调整方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910731273.6A CN110688371B (zh) 2019-08-08 2019-08-08 数据调整方法、装置、电子设备及存储介质

Publications (2)

Publication Number Publication Date
CN110688371A CN110688371A (zh) 2020-01-14
CN110688371B true CN110688371B (zh) 2023-06-06

Family

ID=69108254

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910731273.6A Active CN110688371B (zh) 2019-08-08 2019-08-08 数据调整方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN110688371B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103377087A (zh) * 2012-04-27 2013-10-30 北大方正集团有限公司 一种数据任务处理方法、装置及系统
CN103514259A (zh) * 2013-08-13 2014-01-15 江苏华大天益电力科技有限公司 一种基于数值关联性模型的异常数据探测及修正方法
CN104317910A (zh) * 2014-10-27 2015-01-28 国家电网公司 一种数据处理方法及装置
EP3208728A1 (en) * 2016-02-18 2017-08-23 Ge Aviation Systems Llc, Inc. Systems and methods for flexible access of internal data of an avionics system
CN107291749A (zh) * 2016-03-31 2017-10-24 阿里巴巴集团控股有限公司 一种数据指标关联关系的确定方法及装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10838922B2 (en) * 2017-03-31 2020-11-17 International Business Machines Corporation Data compression by using cognitive created dictionaries

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103377087A (zh) * 2012-04-27 2013-10-30 北大方正集团有限公司 一种数据任务处理方法、装置及系统
CN103514259A (zh) * 2013-08-13 2014-01-15 江苏华大天益电力科技有限公司 一种基于数值关联性模型的异常数据探测及修正方法
CN104317910A (zh) * 2014-10-27 2015-01-28 国家电网公司 一种数据处理方法及装置
EP3208728A1 (en) * 2016-02-18 2017-08-23 Ge Aviation Systems Llc, Inc. Systems and methods for flexible access of internal data of an avionics system
CN107291749A (zh) * 2016-03-31 2017-10-24 阿里巴巴集团控股有限公司 一种数据指标关联关系的确定方法及装置

Also Published As

Publication number Publication date
CN110688371A (zh) 2020-01-14

Similar Documents

Publication Publication Date Title
JP6749468B2 (ja) 評価モデルのためのモデリング方法及び装置
WO2019205325A1 (zh) 确定用户风险等级的方法、终端设备及计算机可读存储介质
CN108197652B (zh) 用于生成信息的方法和装置
CN108833458B (zh) 一种应用推荐方法、装置、介质及设备
CN109345553B (zh) 一种手掌及其关键点检测方法、装置和终端设备
US20130246290A1 (en) Machine-Assisted Legal Assessments
US20200090269A1 (en) Data collection method and apparatus for risk evaluation, and electronic device
US11068285B2 (en) Machine-learning models applied to interaction data for determining interaction goals and facilitating experience-based modifications to interface elements in online environments
WO2017159403A1 (ja) 予測システム、方法およびプログラム
CN111681091A (zh) 基于时间域信息的金融风险预测方法、装置及存储介质
JP2020126587A (ja) コミュニティ質問応答データの検証方法、装置、コンピュータ機器、及び記憶媒体
CN113014566B (zh) 恶意注册的检测方法、装置、计算机可读介质及电子设备
CN113689436B (zh) 图像语义分割方法、装置、设备及存储介质
US20180005248A1 (en) Product, operating system and topic based
CN112131322A (zh) 时间序列分类方法及装置
CN113407854A (zh) 一种应用推荐方法、装置、设备及计算机可读存储介质
CN111798047A (zh) 风控预测方法、装置、电子设备及存储介质
CN107633257B (zh) 数据质量评估方法及装置、计算机可读存储介质、终端
CN112184059A (zh) 评分分析方法、装置、电子设备及存储介质
CN114723652A (zh) 细胞密度确定方法、装置、电子设备及存储介质
CN110688371B (zh) 数据调整方法、装置、电子设备及存储介质
CN109034085B (zh) 用于生成信息的方法和装置
CN116629423A (zh) 用户行为预测方法、装置、设备及存储介质
CN110866437A (zh) 颜值判定模型优化方法、装置、电子设备及存储介质
CN110717817A (zh) 贷前审核方法及装置、电子设备和计算机可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant