数据分析结果的获取方法、装置、计算机设备和存储介质
技术领域
本发明涉及数据处理技术领域,特别是涉及一种数据分析结果的获取方法、数据分析结果的获取装置、计算机设备和计算机可读存储介质。
背景技术
随着信息技术的发展,通过终端、服务器等计算技术对海量的数据进行统计分析的需求越来越大,对数据进行统计分析在如经济学、数学、统计学、物流管理、生物学、心理学、地理学、医疗卫生、体育、农业、林业和商业等各个领域都有着广泛的应用,而高效获取数据的分析结果有利于各个领域基于该分析结果快速做出相应的决策。
在传统技术当中,一般的数据分析工具(如SAS系统,即STATISTICAL ANALYSISSYSTEM)通常是由大型机上的系统发展而来的,其操作仍以编程为主,所以在用户需要对数据进行分析的时候,需要在数据分析工具中编写相应程序来对这些数据进行分析才能得到数据的分析结果,而掌握这些数据分析工具需要花费一定的时间和精力,导致获取数据分析结果的效率偏低。
发明内容
基于此,有必要针对传统技术获取数据分析结果的效率低的技术问题,提供一种数据分析结果的获取方法、数据分析结果的获取装置、计算机设备和计算机可读存储介质。
一种数据分析结果的获取方法,包括步骤:
获取待分析数据;
获取用户对数据分析算法选项的选择操作;
将所述选择操作和待分析数据发送给服务器,触发所述服务器从预先封装的多个数据分析模型中提取与所述选择操作相匹配的数据分析模型,将所述待分析数据输入到所述数据分析模型生成分析结果;所述多个数据分析模型是分别对多种所述数据分析算法进行封装得到的模型;
接收所述服务器发送的分析结果,将所述分析结果进行展示。
一种数据分析结果的获取方法,包括步骤:
接收终端发送的待分析数据和选择操作;所述选择操作为所述终端获取的用户对数据分析算法选项的选择操作;
从预先封装的多个数据分析模型中提取与所述选择操作相匹配的数据分析模型,将所述待分析数据输入所述数据分析模型生成分析结果;所述多个数据分析模型是分别对多种所述数据分析算法进行封装得到的模型;
将所述分析结果发送给所述终端,触发所述终端将所述分析结果进行展示。
一种数据分析结果的获取装置,包括:
第一获取模块,用于获取待分析数据;
第二获取模块,用于获取用户对数据分析算法选项的选择操作;
第一生成模块,用于将所述选择操作和待分析数据发送给服务器,触发所述服务器从预先封装的多个数据分析模型中提取与所述选择操作相匹配的数据分析模型,将所述待分析数据输入到所述数据分析模型生成分析结果;所述多个数据分析模型是分别对多种所述数据分析算法进行封装得到的模型;
第一展示模块,用于接收所述服务器发送的分析结果,将所述分析结果进行展示。
一种数据分析结果的获取装置,包括:
接收模块,用于接收终端发送的待分析数据和选择操作;所述选择操作为所述终端获取的用户对数据分析算法选项的选择操作;
第二生成模块,用于从预先封装的多个数据分析模型中提取与所述选择操作相匹配的数据分析模型,将所述待分析数据输入所述数据分析模型生成分析结果;所述多个数据分析模型是分别对多种所述数据分析算法进行封装得到的模型;
第二展示模块,用于将所述分析结果发送给所述终端,触发所述终端将所述分析结果进行展示。
一种计算机设备,包括处理器和存储器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现如下步骤:
获取待分析数据;获取用户对数据分析算法选项的选择操作;将所述选择操作和待分析数据发送给服务器,触发所述服务器从预先封装的多个数据分析模型中提取与所述选择操作相匹配的数据分析模型,将所述待分析数据输入到所述数据分析模型生成分析结果;所述多个数据分析模型是分别对多种所述数据分析算法进行封装得到的模型;接收所述服务器发送的分析结果,将所述分析结果进行展示。
一种计算机设备,包括处理器和存储器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现如下步骤:
接收终端发送的待分析数据和选择操作;所述选择操作为所述终端获取的用户对数据分析算法选项的选择操作;从预先封装的多个数据分析模型中提取与所述选择操作相匹配的数据分析模型,将所述待分析数据输入所述数据分析模型生成分析结果;所述多个数据分析模型是分别对多种所述数据分析算法进行封装得到的模型;将所述分析结果发送给所述终端,触发所述终端将所述分析结果进行展示。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如下步骤:
获取待分析数据;获取用户对数据分析算法选项的选择操作;将所述选择操作和待分析数据发送给服务器,触发所述服务器从预先封装的多个数据分析模型中提取与所述选择操作相匹配的数据分析模型,将所述待分析数据输入到所述数据分析模型生成分析结果;所述多个数据分析模型是分别对多种所述数据分析算法进行封装得到的模型;接收所述服务器发送的分析结果,将所述分析结果进行展示。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如下步骤:
接收终端发送的待分析数据和选择操作;所述选择操作为所述终端获取的用户对数据分析算法选项的选择操作;从预先封装的多个数据分析模型中提取与所述选择操作相匹配的数据分析模型,将所述待分析数据输入所述数据分析模型生成分析结果;所述多个数据分析模型是分别对多种所述数据分析算法进行封装得到的模型;将所述分析结果发送给所述终端,触发所述终端将所述分析结果进行展示。
上述数据分析结果的获取方法、装置、计算机设备和存储介质,终端获取待分析数据和用户对数据分析算法选项的选择操作,然后终端可以将该待分析数据和选择操作发送给服务器,使得服务器从预先封装的多个数据分析模型中提取与该选择操作相匹配的数据分析模型,从而将待分析数据输入到该数据分析模型生成分析结果,然后服务器将该分析结果发送给终端,终端可以将该分析结果进行展示,克服了传统技术需要在分析数据时编写程序的缺陷,通过用户对数据分析算法选项的选择操作即可从预先封装的数据分析模型中选择相应的数据分析模型对数据进行分析生成分析结果,并在终端将分析结果进行展示,提高了数据分析结果获取的效率,也简化了用户的操作,用户体验也更好。
附图说明
图1为一个实施例中数据分析结果的获取方法的应用场景图;
图2为一个实施例中数据分析平台的逻辑架构图;
图3为一个实施例中数据分析结果的获取方法的流程示意图;
图4为另一个实施例中数据分析结果的获取方法的流程示意图;
图5为一个实施例中数据分析结果的获取装置的结构框图;
图6为另一个实施例中数据分析结果的获取装置的结构框图;
图7为一个实施例中计算机设备的内部结构图;
图8为另一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
需要说明的是,本发明实施例所涉及的术语“第一\第二”仅仅是是区别类似的对象,不代表针对对象的特定排序,可以理解地,“第一\第二”在允许的情况下可以互换特定的顺序或先后次序。应该理解“第一\第二”区分的对象在适当情况下可以互换,以使这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。
本发明提供的数据分析结果的获取方法,可以应用于如图1所示的应用场景中,图1为一个实施例中数据分析结果的获取方法的应用场景图,其中,终端100可以通过网络与服务器200进行通信,在该服务器200上可以部署有如图2所示的数据分析平台,该数据分析平台可以用于用户对相关数据进行分析,该数据分析平台可以包括数据处理模块、平台分析算法模块和分析结果汇总模块,数据处理模块可以对相关数据进行预处理,然后预处理后的数据可以通过平台分析算法模块进行分析输出分析结果,最后由分析结果汇总模块对分析结果进行汇总,实现数据分析结果的获取,使得用户可以在终端100上访问服务器200部署的数据分析平台从而获取相关数据的分析结果。
具体的,在用户需要对数据进行分析的时候,可以将相关的待分析数据导入到终端100上,终端100获取该待分析数据,然后终端100可以在如网页界面等显示界面上显示多个数据分析算法选项,每个数据分析算法选项分别对应不同的数据分析算法,使得用户可以选择特定的数据分析算法对待分析数据进行分析,例如用户可以在多个数据分析算法选项中选择其中一个,终端100可以获取该用户对相应的数据选择算法选项的选择操作,然后终端100可以将待分析数据和选择操作发送给服务器200,服务器200可以通过数据分析平台的数据处理模块接收待处理数据和选择操作,然后发送给平台分析算法模块,该平台分析算法模块可以预先封装有多个数据分析模型(如T检验模型、卡方检验模型、方差分析模型、非参数检验模型、相关与回归模型、逻辑回归模型、聚类分析模型、降维分析模型和生存分析模型等等),然后该平台分析算法模块可以根据用户做出的选择操作从多个数据分析模型中选择匹配的数据分析模型来对待分析数据进行分析并输出分析结果,该分析结果可以通过分析结果汇总模块进行汇总,汇总后可以将该分析结果发送给终端100,终端100在接收到分析结果后可以将该结果在网页界面等显示界面上进行展示,使得用户可以高效且直观地查看到这些分析结果。
其中,终端100可以但不限于是各种个人计算机、笔记本电脑、智能手机和平板电脑等设备,服务器200可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
在一个实施例中,提供了一种数据分析结果的获取方法,参考图3,图3为一个实施例中数据分析结果的获取方法的流程示意图,以该方法应用于图1中的终端100为例进行说明,该数据分析结果的获取方法可以包括以下步骤:
步骤S101,获取待分析数据。
本步骤中,当用户需要对相关数据进行分析时,可以将待分析数据导入到终端100上,终端100可以获取该待分析数据,待分析数据可以以表格、文档等形式的文件导入到终端100上,终端100可以从携带待分析数据的表格、文档等文件中提取出该待分析数据。以医学数据为例,待分析医学数据通常包括患者的性别、年龄、体重和各类医学检查参数(如血小板值、二氧化碳分压测定等等)等数据,而这些医学数据通常会通过EXCEL表格来进行存储,终端100可以从该EXCEL表格中提取出这些待分析数据。
步骤S102,获取用户对数据分析算法选项的选择操作。
本步骤主要是终端100可以获取用户对数据分析算法选项的选择操作,从而可以知道用户希望采用哪种数据分析算法来对待分析数据进行分析。其中,对于不同的领域的数据,通常会采用不同的数据分析算法来对数据进行分析,而由于数据分析算法通常包括多个,所以终端100可以以选项的形式对多种数据分析算法进行展示,使得用户可以根据实际需求来选择合适的算法来对待分析数据进行分析,例如数据分析算法包括数据分析算法A、数据分析算法B和数据分析算法C,则终端可以在如网页页面等显示界面上展示三个选项,包括选项A、选项B和选项C,而三个选项分别对应于不同的数据分析算法,如选项A对应数据分析算法A、选项B对应数据分析算法B等等,这样,用户就可以在终端100上对数据分析算法进行选择,终端100可以获取用户对数据分析算法选项的选择操作,如选择操作表明用户选择选项A,则说明用户希望通过数据分析算法A来对待分析数据进行分析。具体来说,终端100可以在其界面处展示“T检验选项”、“卡方检验选项”和“方差分析选项”,用户可以对该三个选项进行选择,如用户选择T检验选项则说明用户希望采用T检验分析算法对待分析数据进行分析。
步骤S103,将选择操作和待分析数据发送给服务器,触发服务器从预先封装的多个数据分析模型中提取与选择操作相匹配的数据分析模型,将待分析数据输入到数据分析模型生成分析结果;多个数据分析模型是分别对多种数据分析算法进行封装得到的模型。
本步骤中,终端100可以在获取选择操作和待分析数据后,将选择操作和待分析数据发送给服务器200,服务器200在接收到选择操作和待分析数据后,可以从预先封装好的多个数据分析模型中提取出于该选择操作相匹配的数据分析模型,然后将接收的待分析数据输入到该数据分析模型,该数据分析模型对输入的待分析数据进行分析并输出相应的分析结果,其中,服务器200中的多个数据分析模型是分别对多种数据分析算法进行封装得到的模型,这样,在用户选择好相应的数据分析算法选项以后,服务器200可以根据选择操作从而确定用户选择的数据分析算法选项,并进一步明确用户希望采用的数据分析算法,然后就可以调取出相应的数据分析模型来对待分析数据进行分析处理。
具体来说,服务器200可以预先封装有如图2所示的T检验模型、卡方检验模型、方差分析模型、非参数检验模型、相关与回归模型、逻辑回归模型、聚类分析模型、降维分析模型和生存分析模型等数据分析模型,当用户选择“T检验选项”后,服务器200可以根据用户对“T检验选项”的选择操作确定用户希望采用T检验分析算法来对待分析数据进行分析,从而可以提取出T检验模型来对待分析数据进行分析,得到相应的分析结果。
步骤S104,接收服务器发送的分析结果,将分析结果进行展示。
本步骤主要是在服务器200得到数据的分析结果后,服务器200可以将该分析结果反馈给终端100,终端100可以接收服务器200反馈的分析结果,然后终端100可以将该分析结果通过网页等形式的页面进行展示,而展示的具体形式可以包括多种,例如通过曲线图、分类图和残差表等形式将分析结果展示在终端100显示的页面上,使得分析结果展示形式丰富、规范,还可以直接用于实验报告和文章发表。
上述数据分析结果的获取方法,终端获取待分析数据和用户对数据分析算法选项的选择操作,然后终端可以将该待分析数据和选择操作发送给服务器,使得服务器从预先封装的多个数据分析模型中提取与该选择操作相匹配的数据分析模型,从而将待分析数据输入到该数据分析模型生成分析结果,然后服务器将该分析结果发送给终端,终端可以将该分析结果进行展示,克服了传统技术需要在分析数据时编写程序的缺陷,通过用户对数据分析算法选项的选择操作即可从预先封装的数据分析模型中选择相应的数据分析模型对数据进行分析生成分析结果,并在终端将分析结果进行展示,提高了数据分析结果获取的效率,也简化了用户的操作,用户体验也更好。
在一个实施例中,获取待分析数据的步骤可以包括:
获取源数据;确定数据分析模型的数据输入格式;根据数据输入格式对源数据进行预处理,生成待分析数据。
本实施例主要是考虑到用户需要进行分析的数据通常是未经过整理的,其数据格式通常不符合数据分析模型的数据输入格式标准,而将格式不符的数据输入到数据分析模型则容易导致分析结果不准确。本实施例中,源数据是指未经整理的数据,终端100可以获取用户导入的源数据,然后确定数据分析模型所规定的数据输入格式,基于该数据输入格式对该源数据进行预处理,使得预处理后的数据符合相关的数据输入格式,并作为待分析数据用于发送给服务器200进行分析。其中,对源数据进行预处理的形式可以包括多种,例如对源数据集中缺失值进行填充、删除、对源数据进行编码转换、标准化变化等,还可以对相关数据进行筛选、删除和合并等处理,使得预处理后的数据能够满足数据分析模型设定的数据输入格式,使得相关数据分析模型能够基于预处理后的数据进行分析,得到准确的分析结果。
可选的,还可以对待分析数据进行描述性分析,描述性分析是指将待分析数据以表格、图形等形式进行展示以便用户基于该展示内容对待分析数据进行初步分析,例如可以将该待分析数据以表格(如统计描述表和频数表等)和图形(直方图、箱线图、正态概率图、条形图、饼图和分布拟合图等)形式进行展示,基于该展示内容用户可以了解该待分析数据的基本数据特征,还能够基于该基本数据特征判断该待分析数据是否有相关数据缺陷,如缺少数据或导入了错误数据等,而在将待分析数据之前将该待分析数据进行描述性分析,有利于提高输入到服务器200中的数据分析模型的数据的准确度,从而也有利于获取比较准确的分析结果。
在一个实施例中,获取用户对数据分析算法选项的选择操作的步骤可以包括:
展示多个数据分析算法选项;各个数据分析算法选项分别与各个数据分析算法相对应;接收用户对多个数据分析算法选项的选择操作。
本实施例主要是终端100可以展示多个数据分析算法选项,其中,各个数据分析算法选项分别对应于不同的数据分析算法,然后用户可以同时对多个数据分析算法选项进行选择,从而终端100可以获取用户对多个数据分析算法选项的选择操作,这样,用户就可以同时采用多个数据分析算法来对待分析数据进行分析,相应的,服务器200可以调用多个数据分析模型来对待分析数据进行分析,从而生成对应于不同数据分析模型的分析结果,使得用户能够快速得到多个数据分析算法下的分析结果,进一步提高了获取分析结果的效率。而且,服务器200还可以同时对多个终端的待分析数据进行分析,每个终端都可以选择多个数据分析算法来对其待分析数据进行分析,达到对多终端的数据同时在线分析的效果。
其中,数据分析算法可以包括T检验、卡方检验、方差分析等差异性检验方法,T检验用以两平均数之间差异显著性的检验,方差分析用于两个及两个以上样本均数差别的显著性检验,卡方检验用来验证两个总体间某个比率之间是否存在显著性差异T检验可以包括:单样本T检验、独立样本T检验、配对样本T检验、非劣效检验,方差分析可以包括:完全随机设计方差分析、随机区组设计方差分析、析因设计资料的方差分析、重复测量资料方差分析和非参数检验,非参数检验可以包括:单样本非参数检验、两独立样本-非参数检验、两相关样本-非参数检验、多独立样本-非参数检验和多相关样本-非参数检验等。
数据分析算法也可以包括相关分析、多元线性回归分析和Logistic回归分析,例如二分类Logistic回归、有序多分类Logistic回归、无序多分类Logistic回归等,相关分析研究随机变量之间密切程度的统计方法,因变量与自变量之间的彼此关系,对数据求相关系数,并做相关性分析,服从正态性检验的资料,可以采用Pearson相关,非正态性资料或等级资料采用Spearman相关,两个有序分类变量之间是否存在相关,可以使用Kendall'stau-b相关分析。回归分析目前包含的算法有多元线性回归分析和二分类Logistic回归分析。研究一些变量如何随另一些变量变化或一些影响因素之间关系,当观察结果为连续型时,多元线性回归分析;观察结果为二分类或多分类时采用的Logistic回归分析。
数据分析算法还可以包括聚类或降维分析,如K-Means聚类、层次分析、主成分分析和因子分析等,其中,K-means聚类可以用于对个案进行聚类,选择(或人为指定)某些记录作为凝聚点,按就近原则将其余记录向凝聚点凝集,计算出各个初始分类的中心位置(均值),用计算出的中心位置重新进行聚类,如此反复循环,直到凝聚点位置收敛为止,而降维分析可以包括主成分分析和因子分析,而对于一些既考虑结局有考虑生存时间的数据,采用生存分析,可以包括ROC曲线、寿命表、Kaplan-Meier法和Cox风险比例回归等。
在一个实施例中,进一步的,展示多个数据分析算法选项的步骤可以包括:
确定待分析数据归属的领域类别;展示与领域类型相对应的多个数据分析算法选项。
由于不同领域通常会采用不同的数据分析算法来对数据进行分析,本实施例中,终端100可以在接收到待分析数据后,对该待分析数据所归属的领域进行分析从而确定该待分析数据归属的领域类别,如确定该待分析数据归属于医学领域、生物学领域或经济学领域等等,然后终端100可以展示出与该领域类别相对应的数据分析算法选项,该数据分析算法选项通常包括多个,其中,终端100可以预先对不同领域的数据分析算法进行归类,从而在确定待分析数据归属的领域类别以后,可以即使调取出相应的数据分析算法提供给用户进行选择,使得用户能够更加准确地选择出专业的数据分析算法来对数据进行分析,有利于提高分析结果的准确性和可靠性,也使得用户基于准确和可靠的分析结果做出准确的决策。
在一个实施例中,还可以包括步骤:
获取测试数据;将测试数据输入数据分析模型进行测试,获取数据分析模型输出的测试分析结果;获取标准分析结果;根据标准分析结果和测试分析结果对数据分析模型进行可靠性分析。
本实施例主要是对封装的数据分析模型进行可靠性分析,其中,各个数据分析模型可以基于R语言进行编写,例如通过R语言对如医学领域的相关数据分析算法进行程序编写,从而封装成数据分析模型,而在程序编写过程中可能会由于编写失误导致封装的数据分析模型对数据进行分析得到的分析结果不准确,所以在数据分析模型的封装完成以后,可以对该数据分析模型进行可靠性分析,终端100可以获取已知的测试数据,然后将该测试数据输入到数据分析模型当中进行测试,该数据分析模型基于该测试数据会输出相应的测试分析结果,为了查看该测试分析结果是否准确,终端100还获取标准分析结果,该标准分析结果可以是基于专业的统计分析工具对该已知的测试数据进行统计分析得到的结果,然后将该标准分析结果和测试分析结果进行比较,如果测试分析结果与标准分析结果一致,则说明封装的数据分析模型的可靠性较高,可以应用于对终端100的数据进行分析,如果测试分析结果与标准分析结果误差较大,则可以对数据分析模型进行优化,将优化后的数据分析模型再次进行测试,从而得到能够对数据进行准确分析的数据分析模型,保证分析结果的准确性。
在一个实施例中,提供了一种数据分析结果的获取方法,参考图4,图4为另一个实施例中数据分析结果的获取方法的流程示意图,以该方法应用于图1中的服务器为例进行说明,该数据分析结果的获取方法可以包括以下步骤:
步骤S401,接收终端发送的待分析数据和选择操作;选择操作为终端获取的用户对数据分析算法选项的选择操作。
本步骤主要是服务器200接收终端100发送的待分析数据和选择操作。
其中,当用户需要对相关数据进行分析时,可以将待分析数据导入到终端100上,终端100可以获取该待分析数据,待分析数据可以以表格、文档等形式的文件导入到终端100上,终端100可以从携带待分析数据的表格、文档等文件中提取出该待分析数据。以医学数据为例,待分析医学数据通常包括患者的性别、年龄、体重和各类医学检查参数(如血小板值、二氧化碳分压测定等等)等数据,而这些医学数据通常会通过EXCEL表格来进行存储,终端100可以从该EXCEL表格中提取出这些待分析数据。
终端100还可以获取用户对数据分析算法选项的选择操作,从而可以知道用户希望采用哪种数据分析算法来对待分析数据进行分析。其中,对于不同的领域的数据,通常会采用不同的数据分析算法来对数据进行分析,而由于数据分析算法通常包括多个,所以终端100可以以选项的形式对多种数据分析算法进行展示,使得用户可以根据实际需求来选择合适的算法来对待分析数据进行分析,例如数据分析算法包括数据分析算法A、数据分析算法B和数据分析算法C,则终端可以在如网页页面等显示界面上展示三个选项,包括选项A、选项B和选项C,而三个选项分别对应于不同的数据分析算法,如选项A对应数据分析算法A、选项B对应数据分析算法B等等,这样,用户就可以在终端100上对数据分析算法进行选择,终端100可以获取用户对数据分析算法选项的选择操作,如选择操作表明用户选择选项A,则说明用户希望通过数据分析算法A来对待分析数据进行分析。具体来说,终端100可以在其界面处展示“T检验选项”、“卡方检验选项”和“方差分析选项”,用户可以对该三个选项进行选择,如用户选择T检验选项则说明用户希望采用T检验分析算法对待分析数据进行分析。
步骤S402,从预先封装的多个数据分析模型中提取与选择操作相匹配的数据分析模型,将待分析数据输入数据分析模型生成分析结果;多个数据分析模型是分别对多种所述数据分析算法进行封装得到的模型。
服务器200在接收到选择操作和待分析数据后,可以从预先封装好的多个数据分析模型中提取出于该选择操作相匹配的数据分析模型,然后将接收的待分析数据输入到该数据分析模型,该数据分析模型对输入的待分析数据进行分析并输出相应的分析结果,其中,服务器200中的多个数据分析模型是分别对多种数据分析算法进行封装得到的模型,这样,在用户选择好相应的数据分析算法选项以后,服务器200可以根据选择操作从而确定用户选择的数据分析算法选项,并进一步明确用户希望采用的数据分析算法,然后就可以调取出相应的数据分析模型来对待分析数据进行分析处理。
具体来说,服务器200可以预先封装有如图2所示的T检验模型、卡方检验模型、方差分析模型、非参数检验模型、相关与回归模型、逻辑回归模型、聚类分析模型、降维分析模型和生存分析模型等数据分析模型,当用户选择“T检验选项”后,服务器200可以根据用户对“T检验选项”的选择操作确定用户希望采用T检验分析算法来对待分析数据进行分析,从而可以提取出T检验模型来对待分析数据进行分析,得到相应的分析结果。
步骤S403,将分析结果发送给终端,触发终端将分析结果进行展示。
服务器200得到数据的分析结果后,服务器200可以将该分析结果反馈给终端100,使得终端100可以接收服务器200反馈的分析结果,然后终端100可以将该分析结果通过网页等形式的页面进行展示,而展示的具体形式可以包括多种,例如通过曲线图、分类图和残差表等形式将分析结果展示在终端100显示的页面上,使得分析结果展示形式丰富、规范,还可以直接用于实验报告和文章发表。
上述数据分析结果的获取方法,终端获取待分析数据和用户对数据分析算法选项的选择操作,然后终端可以将该待分析数据和选择操作发送给服务器,使得服务器从预先封装的多个数据分析模型中提取与该选择操作相匹配的数据分析模型,从而将待分析数据输入到该数据分析模型生成分析结果,然后服务器将该分析结果发送给终端,终端可以将该分析结果进行展示,克服了传统技术需要在分析数据时编写程序的缺陷,通过用户对数据分析算法选项的选择操作即可从预先封装的数据分析模型中选择相应的数据分析模型对数据进行分析生成分析结果,并在终端将分析结果进行展示,提高了数据分析结果获取的效率,也简化了用户的操作,用户体验也更好。
在一个实施例中,终端可以通过如下方式获取待分析数据:
获取源数据,确定数据分析模型的数据输入格式,根据数据输入格式对源数据进行预处理,生成待分析数据。
本实施例主要是考虑到用户需要进行分析的数据通常是未经过整理的,其数据格式通常不符合数据分析模型的数据输入格式标准,而将格式不符的数据输入到数据分析模型则容易导致分析结果不准确。本实施例中,源数据是指未经整理的数据,终端100可以获取用户导入的源数据,然后确定数据分析模型所规定的数据输入格式,基于该数据输入格式对该源数据进行预处理,使得预处理后的数据符合相关的数据输入格式,并作为待分析数据用于发送给服务器200进行分析。其中,对源数据进行预处理的形式可以包括多种,例如对源数据集中缺失值进行填充、删除、对源数据进行编码转换、标准化变化等,还可以对相关数据进行筛选、删除和合并等处理,使得预处理后的数据能够满足数据分析模型设定的数据输入格式,使得相关数据分析模型能够基于预处理后的数据进行分析,得到准确的分析结果。
可选的,还可以对待分析数据进行描述性分析,描述性分析是指将待分析数据以表格、图形等形式进行展示以便用户基于该展示内容对待分析数据进行初步分析,例如可以将该待分析数据以表格(如统计描述表和频数表等)和图形(直方图、箱线图、正态概率图、条形图、饼图和分布拟合图等)形式进行展示,基于该展示内容用户可以了解该待分析数据的基本数据特征,还能够基于该基本数据特征判断该待分析数据是否有相关数据缺陷,如缺少数据或导入了错误数据等,而在将待分析数据之前将该待分析数据进行描述性分析,有利于提高输入到服务器200中的数据分析模型的数据的准确度,从而也有利于获取比较准确的分析结果。
在一个实施例中,终端可以通过如下方式获取用户对数据分析算法选项的选择操作:
展示多个数据分析算法选项;各个数据分析算法选项分别与各个数据分析算法相对应;接收用户对多个数据分析算法选项的选择操作。
本实施例主要是终端100可以展示多个数据分析算法选项,其中,各个数据分析算法选项分别对应于不同的数据分析算法,然后用户可以同时对多个数据分析算法选项进行选择,从而终端100可以获取用户对多个数据分析算法选项的选择操作,这样,用户就可以同时采用多个数据分析算法来对待分析数据进行分析,相应的,服务器200可以调用多个数据分析模型来对待分析数据进行分析,从而生成对应于不同数据分析模型的分析结果,使得用户能够快速得到多个数据分析算法下的分析结果,进一步提高了获取分析结果的效率。而且,服务器200还可以同时对多个终端的待分析数据进行分析,每个终端都可以选择多个数据分析算法来对其待分析数据进行分析,达到对多终端的数据同时在线分析的效果。
在一个实施例中,进一步的,终端可以通过如下方式展示多个数据分析算法选项:
确定待分析数据归属的领域类别;展示与领域类型相对应的多个数据分析算法选项。
由于不同领域通常会采用不同的数据分析算法来对数据进行分析,本实施例中,终端100可以在接收到待分析数据后,对该待分析数据所归属的领域进行分析从而确定该待分析数据归属的领域类别,如确定该待分析数据归属于医学领域、生物学领域或经济学领域等等,然后终端100可以展示出与该领域类别相对应的数据分析算法选项,该数据分析算法选项通常包括多个,其中,终端100可以预先对不同领域的数据分析算法进行归类,从而在确定待分析数据归属的领域类别以后,可以即使调取出相应的数据分析算法提供给用户进行选择,使得用户能够更加准确地选择出专业的数据分析算法来对数据进行分析,有利于提高分析结果的准确性和可靠性,也使得用户基于准确和可靠的分析结果做出准确的决策。
在一个实施例中,还可以包括步骤:
获取测试数据;将测试数据输入数据分析模型进行测试,获取数据分析模型输出的测试分析结果;获取标准分析结果;根据标准分析结果和测试分析结果对数据分析模型进行可靠性分析。
本实施例主要是对封装的数据分析模型进行可靠性分析,其中,各个数据分析模型可以基于R语言进行编写,例如通过R语言对如医学领域的相关数据分析算法进行程序编写,从而封装成数据分析模型,而在程序编写过程中可能会由于编写失误导致封装的数据分析模型对数据进行分析得到的分析结果不准确,所以在数据分析模型的封装完成以后,可以对该数据分析模型进行可靠性分析,终端100可以获取已知的测试数据,然后将该测试数据输入到数据分析模型当中进行测试,该数据分析模型基于该测试数据会输出相应的测试分析结果,为了查看该测试分析结果是否准确,终端100还获取标准分析结果,该标准分析结果可以是基于专业的统计分析工具对该已知的测试数据进行统计分析得到的结果,然后将该标准分析结果和测试分析结果进行比较,如果测试分析结果与标准分析结果一致,则说明封装的数据分析模型的可靠性较高,可以应用于对终端100的数据进行分析,如果测试分析结果与标准分析结果误差较大,则可以对数据分析模型进行优化,将优化后的数据分析模型再次进行测试,从而得到能够对数据进行准确分析的数据分析模型,保证分析结果的准确性。
在一个实施例中,提供了一种数据分析结果的获取装置,参考图5,图5为一个实施例中数据分析结果的获取装置的结构框图,该数据分析结果的获取装置可以包括:
第一获取模块101,用于获取待分析数据;
第二获取模块102,用于获取用户对数据分析算法选项的选择操作;
第一生成模块103,用于将所述选择操作和待分析数据发送给服务器,触发所述服务器从预先封装的多个数据分析模型中提取与所述选择操作相匹配的数据分析模型,将所述待分析数据输入到所述数据分析模型生成分析结果;所述多个数据分析模型是分别对多种所述数据分析算法进行封装得到的模型;
第一展示模块104,用于接收所述服务器发送的分析结果,将所述分析结果进行展示。
在一个实施例中,第一获取模块101进一步用于:
获取源数据;确定数据分析模型的数据输入格式;根据数据输入格式对源数据进行预处理,生成待分析数据。
在一个实施例中,第二获取模块102进一步用于:
展示多个数据分析算法选项;各个数据分析算法选项分别与各个数据分析算法相对应;接收用户对多个数据分析算法选项的选择操作。
在一个实施例中,第二获取模块102进一步用于:
确定待分析数据归属的领域类别;展示与领域类型相对应的多个数据分析算法选项。
在一个实施例中,还可以包括:
获取单元,用于获取测试数据;
测试单元,用于将测试数据输入数据分析模型进行测试,获取数据分析模型输出的测试分析结果;
获取单元,用于获取标准分析结果;
分析单元,用于根据标准分析结果和测试分析结果对数据分析模型进行可靠性分析。
在一个实施例中,还提供了一种数据分析结果的获取装置,参考图6,图6为另一个实施例中数据分析结果的获取装置的结构框图,该数据分析结果的获取装置可以包括:
接收模块401,用于接收终端发送的待分析数据和选择操作;选择操作为终端获取的用户对数据分析算法选项的选择操作;
第二生成模块402,用于从预先封装的多个数据分析模型中提取与选择操作相匹配的数据分析模型,将待分析数据输入数据分析模型生成分析结果;多个数据分析模型是分别对多种数据分析算法进行封装得到的模型;
第二展示模块403,用于将分析结果发送给终端,触发终端将分析结果进行展示。
本发明的数据分析结果的获取装置与本发明的数据分析结果的获取方法一一对应,关于数据分析结果的获取装置的具体限定可以参见上文中对于数据分析结果的获取方法的限定,在上述数据分析结果的获取方法的实施例阐述的技术特征及其有益效果均适用于数据分析结果的获取装置的实施例中,在此不再赘述。上述数据分析结果的获取装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图7所示,图7为一个实施例中计算机设备的内部结构图。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库可以用于存储数据分析结果的获取方法中涉及的如待分析数据、分析结果和数据分析模型等相关数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种数据分析结果的获取方法。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是终端,其内部结构图可以如图8所示,图8为另一个实施例中计算机设备的内部结构图。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口、显示屏和输入装置。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种数据分析结果的获取方法。该计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
本领域技术人员可以理解,图7和图8中示出的结构,仅仅是与本发明方案相关的部分结构的框图,并不构成对本发明方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机设备,包括处理器和存储器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
获取待分析数据;获取用户对数据分析算法选项的选择操作;将选择操作和待分析数据发送给服务器,触发服务器从预先封装的多个数据分析模型中提取与选择操作相匹配的数据分析模型,将待分析数据输入到数据分析模型生成分析结果;多个数据分析模型是分别对多种数据分析算法进行封装得到的模型;接收服务器发送的分析结果,将分析结果进行展示。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
获取源数据;确定数据分析模型的数据输入格式;根据数据输入格式对源数据进行预处理,生成待分析数据。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
展示多个数据分析算法选项;各个数据分析算法选项分别与各个数据分析算法相对应;接收用户对多个数据分析算法选项的选择操作。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
确定待分析数据归属的领域类别;展示与领域类型相对应的多个数据分析算法选项。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
获取测试数据;将测试数据输入数据分析模型进行测试,获取数据分析模型输出的测试分析结果;获取标准分析结果;根据标准分析结果和测试分析结果对数据分析模型进行可靠性分析。
在一个实施例中,提供了一种计算机设备,包括处理器和存储器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
接收终端发送的待分析数据和选择操作;选择操作为终端获取的用户对数据分析算法选项的选择操作;从预先封装的多个数据分析模型中提取与选择操作相匹配的数据分析模型,将待分析数据输入数据分析模型生成分析结果;多个数据分析模型是分别对多种所述数据分析算法进行封装得到的模型;将分析结果发送给终端,触发终端将分析结果进行展示。
上述计算机设备,通过所述处理器上运行的计算机程序,通过用户对数据分析算法选项的选择操作即可从预先封装的数据分析模型中选择相应的数据分析模型对数据进行分析生成分析结果,并在终端将分析结果进行展示,提高了数据分析结果获取的效率,也简化了用户的操作,用户体验也更好。
本领域普通技术人员可以理解实现如上任一项实施例所述的数据分析结果的获取方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本发明所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
据此,在一个实施例中提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:
获取待分析数据;获取用户对数据分析算法选项的选择操作;将选择操作和待分析数据发送给服务器,触发服务器从预先封装的多个数据分析模型中提取与选择操作相匹配的数据分析模型,将待分析数据输入到数据分析模型生成分析结果;多个数据分析模型是分别对多种数据分析算法进行封装得到的模型;接收服务器发送的分析结果,将分析结果进行展示。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
获取源数据;确定数据分析模型的数据输入格式;根据数据输入格式对源数据进行预处理,生成待分析数据。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
展示多个数据分析算法选项;各个数据分析算法选项分别与各个数据分析算法相对应;接收用户对多个数据分析算法选项的选择操作。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
确定待分析数据归属的领域类别;展示与领域类型相对应的多个数据分析算法选项。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
获取测试数据;将测试数据输入数据分析模型进行测试,获取数据分析模型输出的测试分析结果;获取标准分析结果;根据标准分析结果和测试分析结果对数据分析模型进行可靠性分析。
在一个实施例中,还提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:
接收终端发送的待分析数据和选择操作;选择操作为终端获取的用户对数据分析算法选项的选择操作;从预先封装的多个数据分析模型中提取与选择操作相匹配的数据分析模型,将待分析数据输入数据分析模型生成分析结果;多个数据分析模型是分别对多种所述数据分析算法进行封装得到的模型;将分析结果发送给终端,触发终端将分析结果进行展示。
上述计算机可读存储介质,通过其存储的计算机程序,通过用户对数据分析算法选项的选择操作即可从预先封装的数据分析模型中选择相应的数据分析模型对数据进行分析生成分析结果,并在终端将分析结果进行展示,提高了数据分析结果获取的效率,也简化了用户的操作,用户体验也更好。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。