CN111274452A - 一种数据分析建模方法、平台、服务器及可读存储介质 - Google Patents

一种数据分析建模方法、平台、服务器及可读存储介质 Download PDF

Info

Publication number
CN111274452A
CN111274452A CN202010044483.0A CN202010044483A CN111274452A CN 111274452 A CN111274452 A CN 111274452A CN 202010044483 A CN202010044483 A CN 202010044483A CN 111274452 A CN111274452 A CN 111274452A
Authority
CN
China
Prior art keywords
modeling
data
area
authority
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010044483.0A
Other languages
English (en)
Inventor
江春梅
苏煜鋆
刘念慈
李世武
姜波
游少华
曾鹏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Technology Shenzhen Co Ltd
Original Assignee
Ping An Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Technology Shenzhen Co Ltd filed Critical Ping An Technology Shenzhen Co Ltd
Priority to CN202010044483.0A priority Critical patent/CN111274452A/zh
Publication of CN111274452A publication Critical patent/CN111274452A/zh
Priority to PCT/CN2020/111661 priority patent/WO2021143145A1/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/904Browsing; Visualisation therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

本发明实施例公开了一种数据分析建模方法、平台、服务器及可读存储介质,其中,该方法包括:监听用户对数据分析建模平台上图标区域中的一个或多个功能图标的选取操作;当监听到选取操作将一个或多个功能图标拖拽至建模聚合分析区域中时,对每个功能图标进行连接得到建模流程图;根据用户在算法选取区域中选取的与每个功能图标对应的多个不同的算法,分别执行建模流程图对应的算法流程,每个功能图标包括多个不同的算法,多个不同的算法任意组合;根据不同的算法结果数据进行对比得到的对比结果确定出最优算法模型;将最优算法模型进行发布。通过这种实施方式,实现了数据可视化分析建模,以及对模型的统一管理,提高了建模的效率和有效性。

Description

一种数据分析建模方法、平台、服务器及可读存储介质
技术领域
本发明涉及数据分析建模领域,尤其涉及一种数据分析建模方法、平台、服务器及可读存储介质。
背景技术
数据分析建模是数据挖掘应用的基础,目前数据分析建模需要调研人员或者业务人员调研客户痛点,产品人员设计解决方案,建模人员使用各自熟悉的建模工具进行数据预处理、特征工程、建模调参、模型选择及验证等步骤后,最终生成模型以供用户使用。
然而,这种方式会因为调研人员、业务人员、产品人员、建模人员和模型使用者的背景知识与业务技能差别较大,导致技术割裂严重,建模工作量大,效率低等问题。因此,如何更高效地进行数据分析建模成为亟待解决的问题。
发明内容
本发明实施例提供了一种数据分析建模方法、平台、服务器及可读存储介质,可实现对数据可视化分析建模,以及对建模产生的模型进行统一管理,减少了建模工作量,提高了建模的效率和有效性。
第一方面,本发明实施例提供了一种数据分析建模方法,应用于数据分析建模平台,所述方法包括:
监听用户对所述数据分析建模平台上图标区域中的一个或多个功能图标的选取操作;
当监听到所述选取操作为将所述一个或多个功能图标拖拽至所述数据分析建模平台上的建模聚合分析区域中时,对所述建模聚合分析区域中的每个功能图标进行连接,得到建模流程图;
获取用户在所述数据分析建模平台中的算法选取区域中选取的与所述建模聚合分析区域中的每个功能图标对应的多个不同的算法,并根据所述不同的算法分别执行所述建模流程图对应的算法流程,得到不同的算法结果数据;
将所述不同的算法结果数据进行对比,并根据对比结果确定出由目标算法执行所述建模流程图得到的最优算法模型;
对所述最优算法模型的数据进行处理,并将处理后的所述最优算法模型进行发布。
进一步地,所述对所述建模聚合分析区域中的每个功能图标进行连接,包括:
获取用户对所述建模聚合分析区域中的每个功能图标的选取操作的顺序;
根据所述选取操作的顺序,确定所述建模聚合分析区域中的每个功能图标的连接顺序;
按照所述每个功能图标的连接顺序,以有向连接的方式对所述建模聚合分析区域中的每个功能图标进行连接。
进一步地,所述对所述最优算法模型的数据进行处理,包括:
在所述数据分析建模平台输出模型设置界面;
根据用户在所述模型设置界面输入的数据,生成所述最优算法模型中参与计算的参数数据,所述在所述模型设置界面输入的数据包括模型名称、数据文件、计算方式、分割符中的任意一种或多种;
根据所述参数数据对所述最优算法模型的数据进行处理。
进一步地,所述对所述最优算法模型的数据进行处理,包括:
在所述数据分析建模平台输出权限管理界面,所述权限管理界面包括权限操作区域和权限查看区域;
根据用户在所述权限操作区域和权限查看区域输入的数据,确定所述最优算法模型的权限管理信息;
所述将处理后的所述最优算法模型进行发布,包括:
将所述包括权限管理信息的最优算法模型进行发布。
进一步地,所述根据用户在所述权限操作区域和权限查看区域输入的数据,确定所述最优算法模型的权限管理信息,包括:
获取用户在所述权限操作区域输入的权限操作信息;
获取用户在所述权限查看区域输入的权限查看信息;
根据所述权限操作信息和权限查看信息确定所述最优算法模型的权限管理信息。
进一步地,所述权限操作信息包括流程图信息和用户信息;
所述流程图信息包括流程图名称、流程图编号、流程图创建时间中的任意一种或多种;
所述用户信息包括用户的姓名、性别、年龄、联系方式中的任意一种或多种。
进一步地,所述将处理后的所述最优算法模型进行发布,包括:
确定所述最优算法模型的空间占用率;
计算云端服务器集合中各服务器上的剩余空间;
确定所述各服务器中所述剩余空间大于所述空间占用率的目标服务器,并将所述最优算法模型发布到所述目标服务器上运行。
第二方面,本发明实施例提供了一种数据分析建模平台,该数据分析建模平台包括用于执行上述第一方面的数据分析建模方法的单元。
第三方面,本发明实施例提供了一种服务器,包括处理器、输入设备、输出设备和存储器,所述处理器、输入设备、输出设备和存储器相互连接,其中,所述存储器用于存储支持数据分析建模的数据分析建模平台执行上述方法的计算机程序,所述计算机程序包括程序,所述处理器被配置用于调用所述程序,执行上述第一方面的方法。
第四方面,本发明实施例提供了一种计算机可读存储介质,所述计算机存储介质存储有计算机程序,所述计算机程序被处理器执行以实现上述第一方面的方法。
本发明实施例,通过在监听到将一个或多个功能图标拖拽至建模聚合分析区域中的选取操作时,对每个功能图标进行连接得到建模流程图,获取用户在算法选取区域中选取的与每个功能图标对应的多个不同的算法,并根据不同的算法分别执行建模流程图对应的算法流程,将不同的算法结果数据进行对比,根据对比结果确定出最优算法模型,从而对最优算法模型的数据进行处理,并将处理后的所述最优算法模型进行发布,可实现对数据可视化分析建模,以及对建模产生的模型进行统一管理,减少了建模工作量,提高了建模的效率和有效性。
附图说明
为了更清楚地说明本发明实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的一种数据分析建模方法的示意流程图;
图2是本发明实施例提供的另一种数据分析建模方法的示意流程图;
图3是本发明实施例提供的一种数据分析建模平台的示意框图;
图4是本发明实施例提供的一种服务器的示意框图;
图5是本发明实施例提供的一种建模聚合分析区域中生成的建模流程图的示意图;
图6是本发明实施例提供的一种模型设置界面的示意图;
图7是本发明实施例提供的一种权限管理界面的示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例提供的数据分析建模方法可以由一种数据分析建模平台执行,其中,所述数据分析建模平台可以设置在服务器上。在某些实施例中,所述数据分析建模平台可以安装在服务器上;在某些实施例中,所述数据分析建模平台可以在空间上独立于所述服务器;在某些实施例中,所述数据分析建模平台可以是所述服务器的部件,即所述服务器包括数据分析建模平台。在某些实施例中,所述数据分析建模平台包括图标区域、建模聚合分析区域、算法选取区域等任意一种或多种区域。
本发明实施例,通过将图标区域的功能图标拖拽至建模聚合分析区域进行有向串联生成建模流程图,利用不同的算法和该建模流程图建立多个算法模型,并对各算法模型进行分析,确定出最优算法模型,从而对最优算法模型进行权限管理和/或数据处理后进行发布。通过这种方式,可以将数据挖掘、模型建立等通过一个统一的方式产生,建模的用户不需要具有工程经验,就可借助该数据分析建模平台进行可视化的建模,不同专业背景、不同技能背景的用户建立的模型能够得到有效、统一的管理和存放,提高了建模的效率和有效性。
下面结合附图对本发明实施例的数据分析建模方法进行示意性说明。
请参见图1,图1是本发明实施例提供的一种数据分析建模方法的示意流程图,如图1所示,该方法可以由数据分析建模平台执行,所述数据分析建模平台的具体解释如前所述,此处不再赘述。具体地,本发明实施例的所述方法包括如下步骤。
S101:监听用户对数据分析建模平台上图标区域中的一个或多个功能图标的选取操作。
本发明实施例中,数据分析建模平台可以监听用户对所述数据分析建模平台上图标区域中的一个或多个功能图标的选取操作。在一个示例中,所述数据分析建模平台可以为PowerAI平台。
在一个实施例中,用户可以登录数据分析建模平台,数据分析建模平台可以监听用户对所述数据分析建模平台中图标区域的各功能图标的选取操作。在某些实施例中,所述选取操作可以包括但不限于拖拽操作、点击操作等任意一种或多种操作。
S102:当监听到所述选取操作为将所述一个或多个功能图标拖拽至所述数据分析建模平台上的建模聚合分析区域中时,对所述建模聚合分析区域中的每个功能图标进行连接,得到建模流程图。
本发明实施例中,当监听到所述选取操作为将所述一个或多个功能图标拖拽至所述数据分析建模平台上的建模聚合分析区域中时,数据分析建模平台可以对所述建模聚合分析区域中的每个功能图标进行连接,得到建模流程图。
在一个实施例中,数据分析建模平台对所述建模聚合分析区域中的每个功能图标进行连接时,可以获取用户对所述建模聚合分析区域中的每个功能图标的选取操作的顺序,并根据所述选取操作的顺序,确定所述建模聚合分析区域中的每个功能图标的连接顺序,从而按照所述每个功能图标的连接顺序,以有向连接的方式对所述建模聚合分析区域中的每个功能图标进行连接。
在一个实施例中,用户登录数据分析建模平台后,用户可以自由选取功能图标,将功能图标拖拽到建模聚合分析区域,并将该建模聚合分析区域中的功能图标以有向连线的方式自由组合连接成一个建模流程图。在某些实施例中,所述有向连接的方式是根据用户的选取操作的顺序连接的;在某些实施例中,所述有向连接的方式表示指各功能图标之间存在顺序关系。
在一个示例中,所述建模流程图可以是如图5所示的流程图,图5是本发明实施例提供的一种建模聚合分析区域中生成的建模流程图的示意图。如图5所示,用户通过托拽的方式将如图5所示中的各功能图标拖拽到建模聚合分析区域,以使所述建模聚合分析区域中生成如图5所示的建模流程图。其中,所述用户拖拽至建模聚合分析区域的功能图标包括:数据加载图标51、类型与目标图标52、箱型图图标53、Q-Q图图标54、连续转离散图标55、离散转离散图标56、Min-Max图标(即最小化最大化图标)57、特征过滤图标58、线性回归图标59、岭回归图标510、随机森林图标511、线性回归模型应用图标512、岭回归模型应用图标513、随机森林模型应用图标514、存储图标515。其中,每个功能图标对应有各自的功能。
例如,假设所述数据分析建模平台为PowerAI平台,PowerAI平台存在ABCDEF几个功能图标,用户可以将ABCDEF这几个功能图标拖拽至建模聚合分析区域,如果用户拖拽ABCDEF这几个功能图标的顺序为ABDEFC,则用户可以确定各功能图标之间的顺序关系依次为ABDEFC,并以有向连接的方式将ABDEFC几个功能图标连接组成一个建模流程图。
S103:获取用户在数据分析建模平台中的算法选取区域中选取的与所述建模聚合分析区域中的每个功能图标对应的多个不同的算法,并根据所述不同的算法分别执行所述建模流程图对应的算法流程,得到不同的算法结果数据。
本发明实施例中,数据分析建模平台可以获取用户在所述数据分析建模平台中的算法选取区域中选取的与所述建模聚合分析区域中的每个功能图标对应的多个不同的算法,并根据所述不同的算法分别执行所述建模流程图对应的算法流程,得到不同的算法结果数据,其中,所述每个功能图标包括多个不同的算法,所述多个不同的算法任意组合。
在某些实施例中,所述空间区域中的各功能图标与所述数据分析建模平台算法选取区域中预先设置的一个或多个算法相对应。通过这种实施方式,用户可以为各功能图标选取不同的算法,以便后续通过不同的算法来实现建模流程图,从而确定出最优算法模型。
在一个示例中,数据分析建模平台为PowerAI平台,其中,所述PowerAI平台中预先设置的算法可以包括机器学习算法、深度学习算法、神经语言程序学(Neuro-LinguisticProgramming,NLP)算法等任意一种或多种,来实现分布式建模预测的功能。下面对所述PowerAI平台的算法进行简要介绍:
(1)机器学习算法:主要用于分类、聚类和回归,目前主流的机器学习算法有:线性回归、套索算法(Least Absolute Shrinkage and Selection Operator,Lasso)、岭回归、逻辑回归、回归决策树、分类决策树、高斯贝叶斯分类器、多项贝叶斯分类器、伯努利贝叶斯分类器、支持向量机、差分整合移动平均自回归模型(Autoregressive Integrated MovingAverage model,ARIMA)、随机森林、层次聚类等;
(2)深度学习算法:主要用于图片的识别,主要包含有:神经网络回归、神经网络分类、卷积神经网络、递归神经网络回归、递归神经网络分类等;
(3)NLP算法:主要用于文本处理,实现的功能有:分词、词性标注、词频统计、命名体识别、文章关键词提取、文章主题分析等。
在某些实施例中,所述数据分析建模平台还包括其他工作区域,所述其他工作区域用于提供用户建模的可视化工具、定义相关可视化工具的属性、可视化配置建模组件的节点属性等。
S104:将所述不同的算法结果数据进行对比,并根据对比结果确定出目标算法,以及确定由所述目标算法组成的建模流程图为最优算法模型。
本发明实施例中,数据分析建模平台可以将所述不同的算法结果数据进行对比,并根据对比结果确定出目标算法,以及确定由所述目标算法组成的建模流程图为最优算法模型,其中,所述目标算法是由所述每个功能图标对应的多个不同的算法的任意组合中的一种。
例如,假设建模流程图中包括的功能图标为:数据加载、数据分类、特征过滤、回归处理,如果用户在算法选取区域中预先设置的回归处理的功能图标对应的多个不同的算法包括:线性回归、岭回归、随机森林回归3种回归算法,则可以分别利用这3种回归算法对加载的数据进行回归处理,得到3种算法结果数据。具体实施过程中,首先可以对加载的数据进行分类,如果分类得到箱型图、QQ图、连续数据,则可以将箱型图和QQ图等图像数据删除,然后将连续数据转换为离散数据,对离散数据进行特征过滤得到过滤后的数据;接着可以利用线性回归算法对过滤后的数据进行回归处理,得到回归处理后的第一算法结果数据。同理,可以利用岭回归算法对过滤后的数据进行回归处理,得到回归处理后的第二算法结果数据。同理,可以利用随机森林归算法对过滤后的数据进行回归处理,得到回归处理后的第三算法结果数据。数据分析建模平台可以将第一算法结果数据、第二算法结果数据、第三算法结果数据分别与目标数据进行对比,如果确定出第二算法结果数据与目标数据最接近,则可以确定第二算法结果数据对应的岭回归算法为目标算法,并确定由岭回归算法组成的建模流程图对应的算法模型为最优算法模型。
S105:将所述最优算法模型进行发布。
本发明实施例中,数据分析建模平台可以将所述最优算法模型进行发布。
在一个实施例中,数据分析建模平台将所述最优算法模型进行发布之前,可以在所述数据分析建模平台输出模型设置界面,并根据用户在所述模型设置界面输入的数据,生成所述最优算法模型中参与计算的参数数据,所述在所述模型设置界面输入的数据包括模型名称、数据文件、计算方式、分割符中的任意一种或多种,以及根据所述参数数据对所述最优算法模型的数据进行处理。
具体可以图6为例进行说明,图6是本发明实施例提供的一种模型设置界面的示意图。如图6所示,所述模型设置界面包括数据输入区域61,所述数据输入区域61用于供用户输入或选取模型611、数据文件612、计算方式613、分割符号614等,以使数据分析建模平台可以根据所述数据输入区域61中输入的数据对所述最优算法模型的数据进行处理。
在一个实施例中,数据分析建模平台将所述最优算法模型进行发布时,可以确定所述最优算法模型的空间占用率,并计算云端服务器集合中各服务器上的剩余空间。数据分析建模平台可以确定所述各服务器中所述剩余空间大于所述空间占用率的目标服务器,并将所述最优算法模型发布到所述目标服务器上运行。
本发明实施例中,数据分析建模平台通过在监听到将一个或多个功能图标拖拽至建模聚合分析区域中的选取操作时,对每个功能图标进行连接得到建模流程图,获取用户在算法选取区域中选取的与每个功能图标对应的多个不同的算法,并根据不同的算法分别执行建模流程图对应的算法流程,将不同的算法结果数据进行对比,根据对比结果确定出最优算法模型,从而对最优算法模型的数据进行处理,并将处理后的所述最优算法模型进行发布。通过这种实施方式,可以实现对数据可视化分析建模,以及对建模产生的模型进行统一管理,减少了建模工作量,提高了建模的效率和有效性。
请参见图2,图2是本发明实施例提供的另一种数据分析建模方法的示意流程图,如图2所示,该方法可以由数据分析建模平台执行,该数据分析建模平台的具体解释如前所述,此处不再赘述。本发明实施例与上述图1所述实施例的区别在于,本发明实施例是对数据分析建模方法的详细实施过程进行示意性说明。具体地,本发明实施例的所述方法包括如下步骤。
S201:监听用户对数据分析建模平台上图标区域中的一个或多个功能图标的选取操作。
本发明实施例中,数据分析建模平台可以监听用户对所述数据分析建模平台上图标区域中的一个或多个功能图标的选取操作。
S202:当监听到所述选取操作为将所述一个或多个功能图标拖拽至所述数据分析建模平台上的建模聚合分析区域中时,对所述建模聚合分析区域中的每个功能图标进行连接,得到建模流程图。
本发明实施例中,当监听到所述选取操作为将所述一个或多个功能图标拖拽至所述数据分析建模平台上的建模聚合分析区域中时,数据分析建模平台可以对所述建模聚合分析区域中的每个功能图标进行连接,得到建模流程图。
S203:获取用户在数据分析建模平台中的算法选取区域中选取的与所述建模聚合分析区域中的每个功能图标对应的多个不同的算法,并根据所述不同的算法分别执行所述建模流程图对应的算法流程,得到不同的算法结果数据。
本发明实施例中,数据分析建模平台可以获取用户在所述数据分析建模平台中的算法选取区域中选取的与所述建模聚合分析区域中的每个功能图标对应的多个不同的算法,并根据所述不同的算法分别执行所述建模流程图对应的算法流程,得到不同的算法结果数据,其中,所述每个功能图标包括多个不同的算法,所述多个不同的算法任意组合。
S204:将所述不同的算法结果数据进行对比,并根据对比结果确定出目标算法,以及确定由所述目标算法组成的建模流程图为最优算法模型。
本发明实施例中,数据分析建模平台可以将所述不同的算法结果数据进行对比,并根据对比结果确定出由目标算法执行所述建模流程图得到的最优算法模型,其中,所述目标算法是由所述每个功能图标对应的多个不同的算法的任意组合中的一种。
S205:在所述数据分析建模平台输出权限管理界面,所述权限管理界面包括权限操作区域和权限查看区域。
本发明实施例中,数据分析建模平台可以在所述数据分析建模平台输出权限管理界面,所述权限管理界面包括权限操作区域和权限查看区域。通过这种实施方式,可以对建模流程图进行权限管理,实现了在建模过程中有选择性的赋权,保证流程图安全的同时也保证了数据的安全。
具体可以图7为例进行说明,图7是本发明实施例提供的一种权限管理界面的示意图。如图7所示,所述权限管理界面包括权限操作区域71和权限查看区域72,其中,所述权限操作区域71用于流图信息区域711和用户信息区域712,其中,所述流图信息区域711用于输入流图名称、流图编号、创建时间等;所述用户信息区域712用于输入用户名、查看信息、编辑信息等。
S206:根据用户在所述权限操作区域和权限查看区域输入的数据,确定所述最优算法模型的权限管理信息。
本发明实施例中,数据分析建模平台可以根据用户在所述权限操作区域和权限查看区域输入的数据,确定所述最优算法模型的权限管理信息。
在一个实施例中,数据分析建模平台根据用户在所述权限操作区域和权限查看区域输入的数据,确定所述最优算法模型的权限管理信息时,可以获取用户在所述权限操作区域输入的权限操作信息,并获取用户在所述权限查看区域输入的权限查看信息,从而根据所述权限操作信息和权限查看信息确定所述最优算法模型的权限管理信息。
在一个实施例中,所述权限操作信息包括流程图信息和用户信息;所述流程图信息包括流程图名称、流程图编号、流程图创建时间中的任意一种或多种;所述用户信息包括用户的姓名、性别、年龄、联系方式中的任意一种或多种。
以图7为例,用户可以在权限操作区域71的流图信息区域711输入流程图名称、流程图编号、流程图创建时间等,以及在用户信息区域712输入用户名、查看信息、编辑信息等。
S207:将所述包括权限管理信息的最优算法模型进行发布。
本发明实施例中,数据分析建模平台可以将所述包括权限管理信息的最优算法模型进行发布。
在一个实施例中,数据分析建模平台可以确定所述最优算法模型的空间占用率,并计算云端服务器集合中各服务器上的剩余空间,从而确定所述各服务器中所述剩余空间大于所述空间占用率的目标服务器,并将所述包括权限管理信息的最优算法模型发布到所述目标服务器上运行。
本发明实施例中,数据分析建模平台在确定出最优算法模型后,可以输出权限管理界面,并根据用户在所述权限操作区域和权限查看区域输入的数据,以确定所述最优算法模型的权限管理信息,从而将所述包括权限管理信息的最优算法模型进行发布。通过这种实施方式,可以对建模流程图进行权限管理,实现了在建模过程中有选择性的赋权,保证流程图安全的同时也保证了数据的安全。
本发明实施例还提供了一种数据分析建模平台,该数据分析建模平台用于执行前述任一项所述的方法的单元。具体地,参见图3,图3是本发明实施例提供的一种数据分析建模平台的示意框图。本实施例的数据分析建模平台包括:监听单元301、建模单元302、获取单元303、确定单元304、处理单元305。
监听单元301,用于监听用户对所述数据分析建模平台上图标区域中的一个或多个功能图标的选取操作;
建模单元302,用于当监听到所述选取操作为将所述一个或多个功能图标拖拽至所述数据分析建模平台上的建模聚合分析区域中时,对所述建模聚合分析区域中的每个功能图标进行连接,得到建模流程图;
获取单元303,用于获取用户在数据分析建模平台中的算法选取区域中选取的与所述建模聚合分析区域中的每个功能图标对应的多个不同的算法,并根据所述不同的算法分别执行所述建模流程图对应的算法流程,得到不同的算法结果数据,其中,所述每个功能图标包括多个不同的算法,所述多个不同的算法任意组合;
确定单元304,用于将所述不同的算法结果数据进行对比,并根据对比结果确定出目标算法,以及确定由所述目标算法组成的建模流程图为最优算法模型,其中,所述目标算法是由所述每个功能图标对应的多个不同的算法的任意组合中的一种;
发布单元305,用于将所述最优算法模型进行发布。
进一步地,所述建模单元302对所述建模聚合分析区域中的每个功能图标进行连接时,具体用于:
获取用户对所述建模聚合分析区域中的每个功能图标的选取操作的顺序;
根据所述选取操作的顺序,确定所述建模聚合分析区域中的每个功能图标的连接顺序;
按照所述每个功能图标的连接顺序,以有向连接的方式对所述建模聚合分析区域中的每个功能图标进行连接。
进一步地,所述发布单元305将所述最优算法模型进行发布之前,还包括:
在所述数据分析建模平台输出权限管理界面,所述权限管理界面包括权限操作区域和权限查看区域;
根据用户在所述权限操作区域和权限查看区域输入的数据,确定所述最优算法模型的权限管理信息;
所述发布单元305将所述最优算法模型进行发布时,具体用于:
将所述包括权限管理信息的最优算法模型进行发布。
进一步地,所述发布单元305根据用户在所述权限操作区域和权限查看区域输入的数据,确定所述最优算法模型的权限管理信息时,具体用于:
获取用户在所述权限操作区域输入的权限操作信息;
获取用户在所述权限查看区域输入的权限查看信息;
根据所述权限操作信息和权限查看信息确定所述最优算法模型的权限管理信息。
进一步地,所述权限操作信息包括流程图信息和用户信息;
所述流程图信息包括流程图名称、流程图编号、流程图创建时间中的任意一种或多种;
所述用户信息包括用户的姓名、性别、年龄、联系方式中的任意一种或多种。
进一步地,所述发布单元305将所述最优算法模型进行发布之前,还用于:
在所述数据分析建模平台输出模型设置界面;
根据用户在所述模型设置界面输入的数据,生成所述最优算法模型中参与计算的参数数据,所述在所述模型设置界面输入的数据包括模型名称、数据文件、计算方式、分割符中的任意一种或多种;
所述发布单元305将所述最优算法模型进行发布时,具体用于:
将包括所述参数数据的最优算法模型进行发布。
进一步地,所述发布单元305将所述最优算法模型进行发布时,具体用于:
确定所述最优算法模型的空间占用率;
计算云端服务器集合中各服务器上的剩余空间;
确定所述各服务器中所述剩余空间大于所述空间占用率的目标服务器,并将所述最优算法模型发布到所述目标服务器上运行。
本发明实施例中,数据分析建模平台通过在监听到将一个或多个功能图标拖拽至建模聚合分析区域中的选取操作时,对每个功能图标进行连接得到建模流程图,获取用户在算法选取区域中选取的与每个功能图标对应的多个不同的算法,并根据不同的算法分别执行建模流程图对应的算法流程,将不同的算法结果数据进行对比,根据对比结果确定出最优算法模型,从而对最优算法模型的数据进行处理,并将处理后的所述最优算法模型进行发布。通过这种实施方式,可以实现对数据可视化分析建模,以及对建模产生的模型进行统一管理,减少了建模工作量,提高了建模的效率和有效性。
参见图4,图4是本发明实施例提供的一种服务器的示意框图。如图所示的本实施例中的服务器可以包括:一个或多个处理器401;一个或多个输入设备402,一个或多个输出设备403和存储器404。上述处理器401、输入设备402、输出设备403和存储器404通过总线405连接。存储器404用于存储计算机程序,所述计算机程序包括程序,处理器401用于执行存储器404存储的程序。其中,处理器401被配置用于调用所述程序执行:
当监听到所述选取操作为将所述一个或多个功能图标拖拽至所述数据分析建模平台上的建模聚合分析区域中时,对所述建模聚合分析区域中的每个功能图标进行连接,得到建模流程图;
获取用户在所述数据分析建模平台中的算法选取区域中选取的与所述建模聚合分析区域中的每个功能图标对应的多个不同的算法,并根据所述不同的算法分别执行所述建模流程图对应的算法流程,得到不同的算法结果数据,其中,所述每个功能图标包括多个不同的算法,所述多个不同的算法任意组合;
将所述不同的算法结果数据进行对比,并根据对比结果确定出目标算法,以及确定由所述目标算法组成的建模流程图为最优算法模型,其中,所述目标算法是由所述每个功能图标对应的多个不同的算法的任意组合中的一种;
将所述最优算法模型进行发布。
进一步地,所述处理器401对所述建模聚合分析区域中的每个功能图标进行连接时,具体用于:
获取用户对所述建模聚合分析区域中的每个功能图标的选取操作的顺序;
根据所述选取操作的顺序,确定所述建模聚合分析区域中的每个功能图标的连接顺序;
按照所述每个功能图标的连接顺序,以有向连接的方式对所述建模聚合分析区域中的每个功能图标进行连接。
进一步地,所述处理器401将所述最优算法模型进行发布之前,还用于:
在所述数据分析建模平台输出权限管理界面,所述权限管理界面包括权限操作区域和权限查看区域;
根据用户在所述权限操作区域和权限查看区域输入的数据,确定所述最优算法模型的权限管理信息;
所述处理器401将所述最优算法模型进行发布时,具体用于:
将所述包括权限管理信息的最优算法模型进行发布。
进一步地,所述处理器401根据用户在所述权限操作区域和权限查看区域输入的数据,确定所述最优算法模型的权限管理信息时,具体用于:
获取用户在所述权限操作区域输入的权限操作信息;
获取用户在所述权限查看区域输入的权限查看信息;
根据所述权限操作信息和权限查看信息确定所述最优算法模型的权限管理信息。
进一步地,所述权限操作信息包括流程图信息和用户信息;
所述流程图信息包括流程图名称、流程图编号、流程图创建时间中的任意一种或多种;
所述用户信息包括用户的姓名、性别、年龄、联系方式中的任意一种或多种。
进一步地,所述处理器401将所述最优算法模型进行发布之前,还用于:
在所述数据分析建模平台输出模型设置界面;
根据用户在所述模型设置界面输入的数据,生成所述最优算法模型中参与计算的参数数据,所述在所述模型设置界面输入的数据包括模型名称、数据文件、计算方式、分割符中的任意一种或多种;
所述处理器401将所述最优算法模型进行发布时,具体用于:
将包括所述参数数据的最优算法模型进行发布。
进一步地,所述处理器401将处理后的所述最优算法模型进行发布时,具体用于:
确定所述最优算法模型的空间占用率;
计算云端服务器集合中各服务器上的剩余空间;
确定所述各服务器中所述剩余空间大于所述空间占用率的目标服务器,并将所述最优算法模型发布到所述目标服务器上运行。
本发明实施例中,服务器通过在监听到将一个或多个功能图标拖拽至建模聚合分析区域中的选取操作时,对每个功能图标进行连接得到建模流程图,获取用户在算法选取区域中选取的与每个功能图标对应的多个不同的算法,并根据不同的算法分别执行建模流程图对应的算法流程,将不同的算法结果数据进行对比,根据对比结果确定出最优算法模型,从而对最优算法模型的数据进行处理,并将处理后的所述最优算法模型进行发布。通过这种实施方式,可以实现对数据可视化分析建模,以及对建模产生的模型进行统一管理,减少了建模工作量,提高了建模的效率和有效性。
应当理解,在本发明实施例中,所称处理器401可以是中央处理单元(CenSralProcessing UniS,CPU),该处理器还可以是其他通用处理器、数字信号处理器(DigiSalSignal Processor,DSP)、专用集成电路(ApplicaSion Specific InSegraSed CircuiS,ASIC)、现成可编程门阵列(Field-Programmable GaSe Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
输入设备402可以包括触控板、麦克风等,输出设备403可以包括显示器(LCD等)、扬声器等。
该存储器404可以包括只读存储器和随机存取存储器,并向处理器401提供指令和数据。存储器404的一部分还可以包括非易失性随机存取存储器。例如,存储器404还可以存储设备类型的信息。
具体实现中,本发明实施例中所描述的处理器401、输入设备402、输出设备403可执行本发明实施例提供的数据分析建模方法的图1或图2所述的方法实施例中所描述的实现方式,也可执行本发明实施例图3所描述的数据分析建模平台的实现方式,在此不再赘述。
本发明实施例中还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现图1或图2所对应实施例中描述的数据分析建模方法,也可实现本发明图3所对应实施例的数据分析建模平台,在此不再赘述。
所述计算机可读存储介质可以是前述任一实施例所述的数据分析建模平台的内部存储单元,例如数据分析建模平台的硬盘或内存。所述计算机可读存储介质也可以是所述数据分析建模平台的外部存储设备,例如所述数据分析建模平台上配备的插接式硬盘,智能存储卡(SmarS Media Card,SMC),安全数字(Secure DigiSal,SD)卡,闪存卡(FlashCard)等。进一步地,所述计算机可读存储介质还可以既包括所述数据分析建模平台的内部存储单元也包括外部存储设备。所述计算机可读存储介质用于存储所述计算机程序以及所述数据分析建模平台所需的其他程序和数据。所述计算机可读存储介质还可以用于暂时地存储已经输出或者将要输出的数据。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分,或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,终端,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的计算机可读存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本发明的部分实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。

Claims (10)

1.一种数据分析建模方法,其特征在于,应用于数据分析建模平台,所述方法包括:
当监听到所述选取操作为将所述一个或多个功能图标拖拽至所述数据分析建模平台上的建模聚合分析区域中时,对所述建模聚合分析区域中的每个功能图标进行连接,得到建模流程图;
获取用户在所述数据分析建模平台中的算法选取区域中选取的与所述建模聚合分析区域中的每个功能图标对应的多个不同的算法,并根据所述不同的算法分别执行所述建模流程图对应的算法流程,得到不同的算法结果数据,其中,所述每个功能图标包括多个不同的算法,所述多个不同的算法任意组合;
将所述不同的算法结果数据进行对比,并根据对比结果确定出目标算法,以及确定由所述目标算法组成的建模流程图为最优算法模型,其中,所述目标算法是由所述每个功能图标对应的多个不同的算法的任意组合中的一种;
将所述最优算法模型进行发布。
2.根据权利要求1所述的方法,其特征在于,所述对所述建模聚合分析区域中的每个功能图标进行连接,包括:
获取用户对所述建模聚合分析区域中的每个功能图标的选取操作的顺序;
根据所述选取操作的顺序,确定所述建模聚合分析区域中的每个功能图标的连接顺序;
按照所述每个功能图标的连接顺序,以有向连接的方式对所述建模聚合分析区域中的每个功能图标进行连接。
3.根据权利要求1所述的方法,其特征在于,所述将所述最优算法模型进行发布之前,还包括:
在所述数据分析建模平台输出权限管理界面,所述权限管理界面包括权限操作区域和权限查看区域;
根据用户在所述权限操作区域和权限查看区域输入的数据,确定所述最优算法模型的权限管理信息;
所述将所述最优算法模型进行发布,包括:
将所述包括权限管理信息的最优算法模型进行发布。
4.根据权利要求3所述的方法,其特征在于,所述根据用户在所述权限操作区域和权限查看区域输入的数据,确定所述最优算法模型的权限管理信息,包括:
获取用户在所述权限操作区域输入的权限操作信息;
获取用户在所述权限查看区域输入的权限查看信息;
根据所述权限操作信息和权限查看信息确定所述最优算法模型的权限管理信息。
5.根据权利要求4所述的方法,其特征在于,
所述权限操作信息包括流程图信息和用户信息;
所述流程图信息包括流程图名称、流程图编号、流程图创建时间中的任意一种或多种;
所述用户信息包括用户的姓名、性别、年龄、联系方式中的任意一种或多种。
6.根据权利要求1所述的方法,其特征在于,所述将所述最优算法模型进行发布之前,还包括:
在所述数据分析建模平台输出模型设置界面;
根据用户在所述模型设置界面输入的数据,生成所述最优算法模型中参与计算的参数数据,所述在所述模型设置界面输入的数据包括模型名称、数据文件、计算方式、分割符中的任意一种或多种;
所述将所述最优算法模型进行发布,包括:
将包括所述参数数据的最优算法模型进行发布。
7.根据权利要求1所述的方法,其特征在于,所述将所述最优算法模型进行发布,包括:
确定所述最优算法模型的空间占用率;
计算云端服务器集合中各服务器上的剩余空间;
确定所述各服务器中所述剩余空间大于所述空间占用率的目标服务器,并将所述最优算法模型发布到所述目标服务器上运行。
8.一种数据分析建模平台,其特征在于,包括用于执行如权利要求1-7任一项权利要求所述的方法的单元。
9.一种服务器,其特征在于,包括处理器、输入设备、输出设备和存储器,所述处理器、输入设备、输出设备和存储器相互连接,其中,所述存储器用于存储计算机程序,所述计算机程序包括程序,所述处理器被配置用于调用所述程序,执行如权利要求1-7任一项所述的方法。
10.一种计算机可读存储介质,其特征在于,所述计算机存储介质存储有计算机程序,所述计算机程序被处理器执行以实现权利要求1-7任一项所述的方法。
CN202010044483.0A 2020-01-15 2020-01-15 一种数据分析建模方法、平台、服务器及可读存储介质 Pending CN111274452A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202010044483.0A CN111274452A (zh) 2020-01-15 2020-01-15 一种数据分析建模方法、平台、服务器及可读存储介质
PCT/CN2020/111661 WO2021143145A1 (zh) 2020-01-15 2020-08-27 一种数据分析建模方法、平台、服务器及可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010044483.0A CN111274452A (zh) 2020-01-15 2020-01-15 一种数据分析建模方法、平台、服务器及可读存储介质

Publications (1)

Publication Number Publication Date
CN111274452A true CN111274452A (zh) 2020-06-12

Family

ID=70997124

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010044483.0A Pending CN111274452A (zh) 2020-01-15 2020-01-15 一种数据分析建模方法、平台、服务器及可读存储介质

Country Status (2)

Country Link
CN (1) CN111274452A (zh)
WO (1) WO2021143145A1 (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112069245A (zh) * 2020-08-28 2020-12-11 福建博思软件股份有限公司 一种基于可视化web页面生成数据分析模型的方法和存储设备
CN112559829A (zh) * 2020-07-08 2021-03-26 北京德风新征程科技有限公司 一种基于大数据框架的交互式和自定义数据分析建模系统
CN112633754A (zh) * 2020-12-30 2021-04-09 国网新疆电力有限公司信息通信公司 一种数据分析模型的建模方法及系统
WO2021143145A1 (zh) * 2020-01-15 2021-07-22 平安科技(深圳)有限公司 一种数据分析建模方法、平台、服务器及可读存储介质

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108279890B (zh) * 2017-01-06 2021-12-24 阿里巴巴集团控股有限公司 组件发布方法、组件构建方法及图形化机器学习算法平台
CN107169575A (zh) * 2017-06-27 2017-09-15 北京天机数测数据科技有限公司 一种可视化机器学习训练模型的建模系统和方法
CN110598868B (zh) * 2018-05-25 2023-04-18 腾讯科技(深圳)有限公司 一种机器学习模型搭建方法、装置及相关设备
CN109948804B (zh) * 2019-03-15 2021-11-02 北京清瞳时代科技有限公司 跨平台拖拽式深度学习建模与训练方法及装置
CN110058985A (zh) * 2019-04-09 2019-07-26 美林数据技术股份有限公司 一种拖拽式构建企业级ai应用的系统及方法
CN111274452A (zh) * 2020-01-15 2020-06-12 平安科技(深圳)有限公司 一种数据分析建模方法、平台、服务器及可读存储介质

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021143145A1 (zh) * 2020-01-15 2021-07-22 平安科技(深圳)有限公司 一种数据分析建模方法、平台、服务器及可读存储介质
CN112559829A (zh) * 2020-07-08 2021-03-26 北京德风新征程科技有限公司 一种基于大数据框架的交互式和自定义数据分析建模系统
CN112069245A (zh) * 2020-08-28 2020-12-11 福建博思软件股份有限公司 一种基于可视化web页面生成数据分析模型的方法和存储设备
CN112633754A (zh) * 2020-12-30 2021-04-09 国网新疆电力有限公司信息通信公司 一种数据分析模型的建模方法及系统

Also Published As

Publication number Publication date
WO2021143145A1 (zh) 2021-07-22

Similar Documents

Publication Publication Date Title
CN111274452A (zh) 一种数据分析建模方法、平台、服务器及可读存储介质
CN109614238B (zh) 一种目标对象识别方法、装置、系统及可读存储介质
US10902339B2 (en) System and method providing automatic completion of task structures in a project plan
JP2020505670A (ja) コンポーネントリリース方法、グラフィック機械学習アルゴリズムプラットフォームベースのコンポーネント構築方法及びグラフィック機械学習アルゴリズムプラットフォーム
US20220300850A1 (en) End-to-end machine learning pipelines for data integration and analytics
CN111901171A (zh) 异常检测和归因方法、装置、设备及计算机可读存储介质
US10652290B2 (en) Persistent chat channel consolidation
CN108292383A (zh) 与通信相关联的任务的自动提取
CN112949172B (zh) 一种数据处理方法、装置、机器可读介质及设备
CN110704283A (zh) 一种统一生成告警信息的方法、装置和介质
CN112633754A (zh) 一种数据分析模型的建模方法及系统
CN108008942A (zh) 对数据记录进行处理的方法及系统
Avritzer et al. A multivariate characterization and detection of software performance antipatterns
CN115392501A (zh) 数据采集方法、装置、电子设备及存储介质
CN114237587A (zh) 一种基于IDEA技术服务SmartFlow的管控方法及系统
CN112817560B (zh) 一种基于表函数的计算任务处理方法、系统及计算机可读存储介质
CN112507323A (zh) 基于单向网络的模型训练方法、装置和计算设备
CN110781410A (zh) 一种社群检测方法及装置
CN115543428A (zh) 一种基于策略模板的模拟数据生成方法和装置
CN115907786A (zh) 一种基于知识图谱的供应商画像构建方法
CN115016735A (zh) 一种分布式缓存系统的控制方法、装置及介质
CN115185434A (zh) 一种车辆应用场景处理方法、装置、设备和存储介质
CN113886676A (zh) 信息流推荐策略处理方法、装置、设备及计算机存储介质
CN115292279A (zh) 一种用于数据的模型处理方法、系统及存储介质
RU2783782C1 (ru) Система и способ управления оповещениями

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination