CN113609195A - 报告生成方法、装置、电子设备及存储介质 - Google Patents
报告生成方法、装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN113609195A CN113609195A CN202110890014.5A CN202110890014A CN113609195A CN 113609195 A CN113609195 A CN 113609195A CN 202110890014 A CN202110890014 A CN 202110890014A CN 113609195 A CN113609195 A CN 113609195A
- Authority
- CN
- China
- Prior art keywords
- statistical analysis
- data set
- data
- target data
- analysis
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 104
- 238000007619 statistical method Methods 0.000 claims abstract description 196
- 238000004458 analytical method Methods 0.000 claims description 51
- 230000001419 dependent effect Effects 0.000 claims description 22
- 238000010219 correlation analysis Methods 0.000 claims description 10
- 238000007405 data analysis Methods 0.000 claims description 10
- 230000001960 triggered effect Effects 0.000 claims description 5
- 238000011160 research Methods 0.000 abstract description 17
- 230000000875 corresponding effect Effects 0.000 description 47
- 208000007788 Acute Liver Failure Diseases 0.000 description 16
- 206010000804 Acute hepatic failure Diseases 0.000 description 16
- 231100000836 acute liver failure Toxicity 0.000 description 15
- 238000012545 processing Methods 0.000 description 9
- HVYWMOMLDIMFJA-DPAQBDIFSA-N cholesterol Chemical compound C1C=C2C[C@@H](O)CC[C@]2(C)[C@@H]2[C@@H]1[C@@H]1CC[C@H]([C@H](C)CCCC(C)C)[C@@]1(C)CC2 HVYWMOMLDIMFJA-DPAQBDIFSA-N 0.000 description 8
- 230000036772 blood pressure Effects 0.000 description 7
- 238000010586 diagram Methods 0.000 description 7
- 230000006870 function Effects 0.000 description 6
- 230000003287 optical effect Effects 0.000 description 6
- 235000012000 cholesterol Nutrition 0.000 description 4
- 230000009286 beneficial effect Effects 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 2
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 2
- 238000001422 normality test Methods 0.000 description 2
- 239000013307 optical fiber Substances 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 206010020772 Hypertension Diseases 0.000 description 1
- 208000001953 Hypotension Diseases 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 230000036543 hypotension Effects 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 230000002035 prolonged effect Effects 0.000 description 1
- 230000008707 rearrangement Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000033772 system development Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/248—Presentation of query results
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2462—Approximate or statistical queries
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Computational Linguistics (AREA)
- Probability & Statistics with Applications (AREA)
- Fuzzy Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明实施例公开了一种报告生成方法、装置、电子设备及存储介质,该方法包括:当接收到数据统计分析请求时,确定目标数据集;基于预先设置的至少两种统计分析方法分别对所述目标数据集中的数据进行统计分析,得到与每种统计分析方法对应的统计分析结果;根据各统计分析结果生成多维度的统计分析报告。本发明实施例的技术方案,实现了多维度统计分析报告的一键生成,提高了数据统计分析的效率,缩短了科研工作的研究周期。
Description
技术领域
本发明实施例涉及数据处理技术领域,尤其涉及一种报告生成方法、装置、电子设备及存储介质。
背景技术
对数据进行统计分析是科研工作的重要组成部分,通过统计分析的过程,可以将独立的、简单的、杂乱无章的数据从整体上进行准确精炼地描述,从而帮助用户对大量数据进行深入研究。
现有技术对数据进行统计分析时,通常先利用数据统计分析软件对数据进行采集,再由工作人员对软件中部分参数进行设置,最后将这些数值型或字符型的数据转化为图表进行展示。然而,一方面,传统的数据统计分析软件使用方法较为复杂,用户的学习成本较高,仅通过图表反映数据的方式较为固化,需要用户根据图表进一步研究才能得到分析结果;另一方面,如果数据类型以及用户统计分析的目标较多时,需要利用软件对数据进行反复收集,延长了对数据的研究周期,效率较低,每次转化生成孤立的图表也不利于用户基于数据的整体发现更多的科研方向。
因此,相关技术提供的方案中,传统的数据分析软件使用不便,无法以高效的方式为用户提供多维度的数据分析结果,科研工作受到较大限制。
发明内容
本发明提供一种报告生成方法、装置、电子设备及存储介质,实现了多维度统计分析报告的一键生成,提高了数据统计分析的效率,缩短了科研工作的研究周期。
第一方面,本发明实施例提供了一种报告生成方法,该方法包括:
当接收到数据统计分析请求时,确定目标数据集;
基于预先设置的至少两种统计分析方法分别对所述目标数据集中的数据进行统计分析,得到与每种统计分析方法对应的统计分析结果;
根据各统计分析结果生成多维度的统计分析报告。
第二方面,本发明实施例还提供了一种报告生成装置,该装置包括:
目标数据集确定模块,用于当接收到数据统计分析请求时,确定目标数据集;
统计分析结果确定模块,用于基于预先设置的至少两种统计分析方法分别对所述目标数据集中的数据进行统计分析,得到与每种统计分析方法对应的统计分析结果;
统计分析报告生成模块,用于根据各统计分析结果生成多维度的统计分析报告。
第三方面,本发明实施例还提供了一种电子设备,所述电子设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如本发明实施例任一所述的报告生成方法。
第四方面,本发明实施例还提供了一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行如本发明实施例任一所述的报告生成方法。
本发明实施例的技术方案,当接收到数据统计分析请求时,自动确定出目标数据集,并基于预先设置的至少两种统计分析方法分别对目标数据集中的数据进行统计分析,得到与每种统计分析方法对应的统计分析结果,根据各统计分析结果生成多维度的统计分析报告,不仅实现了多维度统计分析报告的一键生成,还可以在报告生成过程中调用多种统计分析方法,提高了数据统计分析的效率,进而缩短了科研工作的研究周期。
附图说明
为了更加清楚地说明本发明示例性实施例的技术方案,下面对描述实施例中所需要用到的附图做一简单介绍。显然,所介绍的附图只是本发明所要描述的一部分实施例的附图,而不是全部的附图,对于本领域普通技术人员,在不付出创造性劳动的前提下,还可以根据这些附图得到其他的附图。
图1为本发明实施例一所提供的一种报告生成方法的流程示意图;
图2为本发明实施例二所提供的一种报告生成方法的流程示意图;
图3为本发明实施例三所提供的一种报告生成装置的结构框图;
图4为本发明实施例四所提供的一种电子设备的结构示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
实施例一
图1为本发明实施例一所提供的一种报告生成方法的流程示意图,本实施例可适用于在单次报告生成过程中,运用多种统计分析方法对数据集中的数据进行分析的情况,该方法可以由报告生成装置来执行,该装置可以通过软件和/或硬件的形式实现,该硬件可以是电子设备,如移动终端、PC端或服务器等。
为了清楚的介绍本实施例的技术方案,可以以医疗系统中的数据为例,对本实施例应用的场景进行介绍。当系统中存在大量用户信息时,工作人员希望利用多种方法对这些数据进行分析,从而得出一些整体性的结论、并发现更多有意义的研究方向,如,用户哪些身体因素对某项疾病的产生存在重大影响。同时,工作人员还希望数据统计分析系统能够以较高的效率得到自己想要的统计分析结果,而不是在经过自己多次手动设置后,才得到与每次设置的参数所对应的、需要自己进一步分析的柱状图。因此,本实施例则是在系统中包括大量需要以多种方法进行分析的数据,且工作人员对数据统计分析系统存在高效性和易用性诉求的情况下实施的。
如图1所示,该方法具体包括如下步骤:
S110、当接收到数据统计分析请求时,确定目标数据集。
其中,数据统计分析请求可以是用户通过特定控件向系统发送的请求,用于触发系统对数据的统计分析操作。示例性的,可以在系统中开发一个标识为“开始分析”的控件,当该控件被触发时,即表明接收到数据统计分析请求,从而基于该控件向系统下达数据统计分析操作的执行命令。
对应的,根据上述执行命令,系统统计分析的对象即是目标数据集,本领域技术人员应当理解,在服务器中预先存储有多组数据集,每组数据集中的信息可以是文本的形式,也可以是列表的形式,其中包含多种维度的信息,例如,在医疗系统的服务器中,数据集中包括多组样本值和变量,样本值可以是用户的个人信息对应的具体数据,变量可以是与这些数据对应的年龄、性别、区域、体重、身高、最高/最低血压等参数。
在本实施例中,基于数据统计分析请求,即可在多组数据集中确定出目标数据集。示例性的,在医疗系统的服务器中,基于做过手术的用户的信息构建出一个集合,并将该集合作为一个数据集,为该数据集分配标识A,基于未做过手术的用户的信息构建出一个集合,并将该集合作为另一个数据集,为该数据集分配标识B。同时,因为上述示例中的控件被触发时,会向系统下达数据统计分析操作的执行命令,该命令也携带有对应的数据集标识A,因此,通过对命令携带的数据集标识进行读取和匹配,即可确定出做过手术的用户的信息为目标数据集。
S120、基于预先设置的至少两种统计分析方法分别对目标数据集中的数据进行统计分析,得到与每种统计分析方法对应的统计分析结果。
其中,在服务器中确定出目标数据集之后,系统还可以对与目标数据集相关联的多种数据进行采集,采集方式不限于离线采集方式和实时采集方式,本领域技术人员应当理解,具体的采集方式应当根据实际情况进行选择,本公开实施例在此不做具体的限定。进一步的,数据采集完成后,即可得到对应的采集结果。
在本实施例中,对于采集得到的目标数据集中的数据,系统至少可以选择两种统计分析方法对这些数据进行统计分析处理,例如,采用描述统计分析方法和信度分析的方法对数据进行处理。可以理解,多种统计分析算法预先存储在系统中,当目标数据集中的数据采集完毕后,即可对这些统计分析算法进行调用,再将目标数据集中的数据与算法中特定的项进行对应,即可完成数据统计分析的过程,需要说明的是,多种统计分析方法在线程中是以并行的方式对目标数据集中的数据进行处理的。
在本实施例中,基于多种统计分析方法对目标数据集中的数据进行处理后,即可得到对应的统计分析结果,本领域技术人员应当理解,统计分析结果可以是统计表的形式,即,通过表格的形式来反映统计指标以及结果数据。
S130、根据各统计分析结果生成多维度的统计分析报告。
在本实施例中,基于至少两种统计分析方法对目标数据集中的数据进行分析,并分别得到对应的统计分析结果后,系统还可以将这些统计分析结果进行整合,并生成一份统计分析报告。
其中,统计分析报告即是对数据进行统计分析后所形成的论点、论据以及结论的集中表现,是一种运用统计资料和统计方法对数字和文字的结合。统计分析报告以目标数据集中的数据为主体,以特有的表达方式以及结构来反映与至少两种统计分析方法所对应的统计分析结果,也即是说,统计分析报告是一份将数据、情况、问题以及建议相融合、有助于工作人员从中发现更多问题和研究方向的文件,至少能够从多个维度反映对目标数据集中数据的统计分析结果。
需要说明的是,在本实施例中,可以基于Java编写相应的代码以将多个分析结果进行整合,同时在程序运行过程中还可以调用多种jar包或开源组件,具体的调用方式和规则应根据实际情况进行选择和设置,本公开实施例在此不做赘述。
本实施例的技术方案,当接收到数据统计分析请求时,自动确定出目标数据集,并基于预先设置的至少两种统计分析方法分别对目标数据集中的数据进行统计分析,得到与每种统计分析方法对应的统计分析结果,根据各统计分析结果生成多维度的统计分析报告,不仅实现了多维度统计分析报告的一键生成,还可以在报告生成过程中调用多种统计分析方法,提高了数据统计分析的效率,进而缩短了科研工作的研究周期。
实施例二
图2为本发明实施例二所提供的一种报告生成方法的流程示意图,在前述实施例的基础上,确定出目标数据集后,在数据显示页面显示对应的基本统计信息概览图,如果出现误选,可以利用数据集选择控件对目标数据集进行更新;利用多种统计分析方法对数据进行分析,至少可以帮助工作人员了解数据的整体特征情况以及变量之间的统计学关联,提高了工作人员对目标数据集中数据的分析研究效率;进一步的,为用户提供一键获取文档的调取链接的功能,提升了系统的易用性,优化了用户体验。其具体的实施方式可以参见本实施例技术方案。其中,与上述实施例相同或者相应的技术术语在此不再赘述。
如图2所示,该方法具体包括如下步骤:
S210、当接收到对数据集选择控件的触发指令时,在下拉菜单中显示至少一个待选择数据集;当接收到数据集选择指令时,基于下拉菜单中的待选择数据集得到待确定数据集,并在数据集选择控件中进行显示,以在接收到数据统计分析请求时,将数据集选择控件中显示的待确定数据集作为目标数据集。
在本实施例中,在系统中可以开发一个数据集选择控件,用于根据用户的触发指令确定出对应的数据集,因此,数据集选择控件下拉菜单中的至少一组数据集即是待选择数据集。进一步的,当根据数据集选择指令在待选择数据集中确定出一组数据集后,该数据集即是待确定数据集,表示用户希望对该数据集中的数据进行统计分析,同时,待确定数据集可以在该控件中进行显示。
需要说明的是,为了使系统在接收到数据分析请求时,将控件中当前显示的待确定数据集作为目标数据集,在在系统开发过程中,该控件还需要与至少一组待选择数据集的数据进行绑定,具体的,可以将数据集选择控件与至少一组待选择数据集的标识进行绑定,进而在确定出目标数据集后,根据目标数据集的标识在数据库的特定存储位置确定出目标数据。
S220、当接收到数据统计分析请求时,确定目标数据集。
S230、弹出数据显示页面,并在数据显示页面中显示与目标数据集相对应的基本统计信息概览图。
在本实施例中,系统确定出目标数据集后,可以自动弹出数据显示页面。具体的,可以是系统接收到对“开始分析”按钮的触发指令后,弹出数据显示页面,并在页面中加载与目标数据集相对应的基本统计信息概览图。
其中,基本统计信息概览图可以是图表的形式,如柱状图、饼状图等,基本统计信息概览图是根据目标数据集的因变量和问题类型确定的,至少可以反映目标数据集的部分关键信息。因变量即是随目标数据集中变量变化而发生适应性改变的变量,例如,在医疗系统的数据平台中因变量可以是用户的住院情况。同时,可以根据因变量以及系统中预先设定的判定规则,确定出对应问题类型,如,分类问题和联系问题。
示例性的,在医疗系统数据平台中,当确定出目标数据集为已经在医院挂号的全部用户后,可以确定出住院情况作为目标数据集的因变量。进一步的,对于各因变量来说,系统中预先设置有判定规则,当因变量的结果类型小于5种时,判定为分类问题,当因变量的结果类型不小于5种时,判定为联系问题。在此基础上,由于住院情况仅分为住院和未住院两种结果,因此可以确定出该因变量对应的问题类型为分类问题。确定出因变量和问题类型后,即可将住院的用户人数和未住院的用户人数以柱状图的形式在数据显示页面中进行加载。
在确定出目标数据集后,通过确定出对应的因变量和问题类型,从而向用户展示基本统计信息概览图,有助于工作人员对所选择的数据集进行初步的确认,避免用户误选与科研工作无关的数据集的情况发生。
可选的,当接收到对数据集选择控件的触发指令时,基于触发的待选择数据集更新目标数据集,并基于目标数据集生成基本统计信息概览图。
在本实施例中,即使出现工作人员误选与科研工作无关的数据集的情况,数据集选择控件依然可以根据触发指令,对目标数据集进行更新。具体的,可以在数据集选择控件接收到用户的触发指令时,基于触发指令在至少两组待选择数据集中确定出一组新的数据集,并将新确定的数据集作为目标数据集,从而实现目标数据集的更新。进一步地,基于新确定的目标数据集确定出对应的因变量和问题类型,并生成基本统计信息概览图加载在数据显示页面中,以使工作人员在了解该数据集部分关键信息的同时,再次对新的目标数据集进行确认。
S240、基于预先设置的至少两种统计分析方法分别对目标数据集中的数据进行统计分析,得到与每种统计分析方法对应的统计分析结果。
其中,至少两种统计分析方法包括:描述性分析方法、相关性分析方法、影响性分析方法、预测性分析方法、变量缺失分析方法、样本缺失分析方法、重复数据分析方法以及脏数据分析方法。
可选的,当采用描述性分析方法对目标数据集中的数据进行统计分析时,基于预先设置的配置项对目标数据集中的数据进行分类,得到对应的项目数据和分析参数,并将项目数据和分析参数整合为图文形式的统计分析结果。其中,项目数据包括目标数据集中至少一组样本值(如,用户年龄、性别、体重以及身高等参数的具体数值),分析参数包括目标数据集中至少两个变量(如,年龄、性别、体重以及身高)。
示例性的,在医疗系统的数据平台中,选定特定分组用户的数据作为目标数据集时,可以先根据配置项确定出数据中的样本值和变量,也即是说,确定出这些用户年龄、性别、区域、体重、身高、腰围、最高血压、最低血压以及总胆固醇等多种变量的具体数值,同时,还可以确定出这组目标数据集对应的因变量,即用户的急性肝衰竭情况,通过判定规则可以确定因变量的问题类型为分类问题(即只存在患有急性肝衰竭以及未患有急性肝衰竭两种结果)。进一步的,对这些信息进行整理和归纳,即可以图文结合的形式将样本值和变量进行展示,如,在表格中显示患有急性肝衰竭的用户为6名,未患有急性肝衰竭的用户有41名。
需要说明的是,展示的结果不仅仅局限于上述信息,对其中的单一变量来说,还可以包括平均数、百分比等统计分析结果,如,对于急性肝衰竭这一因变量,还可以显示出患有急性肝衰竭的用户占总用户比例为12.8%,未患有急性肝衰竭的用户占总用户比例为87.2%。进一步的,对于单一变量来说,还可以结合因变量,以分组的形式展示上述统计分析结果,如,对于腰围这一变量,除了各用户对应的腰围样本值,还可以结合急性肝衰竭这一因变量将表格的信息列分为两列,也即是说,在表格的两列信息中,一列展示患有急性肝衰竭的6名用户的腰围均值、标准差以及偏度信息,另一列展示未患有急性肝衰竭的41名用户的腰围均值、标准差以及偏度信息。
在本实施例中,还可以对单一变量进行正态性检验,也即是说,判断目标数据集中的特定数据是否符合正态分布。例如,在医疗系统的数据平台中,针对用户腰围这一参数,可以在采集到对应数据后,调用统计产品与服务解决方案软件(Statistical Product andService Solutions,SPSS)对所采集的腰围样本值进行分析,得到腰围变量的峰度、偏度等正态性描述统计指标,进而确定腰围样本值是否符合正态分布,如果不符合正态分布,还可以确定出与正态分布之间的差距。得到正态性检验结果后,可以将其以Q-Q图、P-P图或直方图等方式进行反映。
通过对目标数据集中数据的描述性分析,至少可以帮助工作人员了解这些数据整体的特征情况。
可选的,当采用相关性分析方法对目标数据集中的数据进行统计分析时,基于预先设置的配置项对目标数据集中的数据进行分类,得到对应的项目数据和分析参数,基于项目数据确定出分析参数之间的相关系数,并将分析参数和相关系数整合为图文形式的统计分析结果。
本领域技术人员应当理解,通过数据的相关性分析可以衡量出两个或多个变量的相关密切程度(即相关系数)。在此继续以上述医疗系统的数据平台为例进行说明,其中,确定目标数据集中项目数据和分析参数的过程与描述性分析方法中的过程相似,在此不再赘述。确定出上述信息后,即可将项目数据中的最低血压样本值以及腰围样本值作为输入,基于预设的相关系数确定算法对其进行处理,进而得到变量中最低血压以及腰围之间的相关系数,如,两者相关系数为0.997,利用同样的方式,还可以得到总胆固醇与腰围之间的相关系数为0.598。通过上述两组数据即可确定,最低血压和腰围这两个变量的相关性明显高于总胆固醇与腰围的相关性。需要说明的是,在本实施例中,所得到的相关性系数不仅可以生成表格进行显示,还可以生成对应的相关性矩阵。
与描述性分析相似的是,对于一组需要进行相关性分析的变量来说,同样可以将其相关系数结合因变量(急性肝衰竭患病情况)进行展示。如,可以通过表格中的两行信息,一行展示患有急性肝衰竭的用户的最低血压和腰围的相关系数,另一行展示未患有急性肝衰竭的用户的最低血压和腰围的相关系数。
通过对目标数据集中数据的相关性分析,至少可以判断两个或多个变量之间的统计学关联,进而帮助工作人员分析其关联强度并确定出未来的研究方向。
在本实施例中,还可以利用多种方法对目标数据集中的数据进行统计分析,如,在医疗系统的数据平台中,利用影响性分析确定出哪些变量对急性肝衰竭这一病症的影响最大;利用预测性分析可以确定出样本值对应的哪些用户存在患急性肝衰竭的可能性;利用变量缺失分析方法可以确定出用户样本值中与变量对应的哪些数据存在缺失,进而根据所缺失的数据选择对应的处理方法;利用样本缺失分析方法可以确定出所确定的目标数据集中还缺少哪些对统计分析有帮助的样本值;利用重复数据数据分析方法可以对相应的数据进行剔除,即通过对数据的加工使统计分析结果更加整洁清楚;利用脏数据分析方法可以确定出目标数据集中对业务和工作没有帮助的、或格式错误的数据,进而通过结构化、规范化、可关联的形式对脏数据进行处理,将脏数据剔除,或恢复成系统可以读取的数据。
利用上述多种方法对目标数据集中的数据进行处理,避免了在数据统计分析的过程中为了执行上述方法而分别多次采集数据的情况,也即是说,通过本实施例中的方案,仅通过一次数据采集过程,即可得到多维度的统计分析结果,提高了工作人员对目标数据集中数据的分析研究效率。
S250、根据各统计分析结果生成多维度的统计分析报告。
在本实施例中,基于上述至少两种统计分析方法得到对应的统计分析结果后,还可以将至少两组统计分析结果进行整合,生成多维度的统计分析报告,并将统计分析报告在特定网页中进行显示,例如,将生成的多维度统计分析报告通过frame框架集成到web页面中。通过在特定网页中显示多维度的统计分析报告,使目标数据集中数据统计分析结果实现了可视化。
S260、当接收到获取统计分析报告的请求时,将统计分析报告存储至目标服务器中;根据统计分析报告在目标服务器中的存储地址生成调取链接,并将调取链接反馈给客户端,以使与客户端对应的目标用户获取统计分析报告。
在本实施例中,还可以开发一个获取统计分析报告的请求控件,可以理解,该控件向用户提供了一种获取多维度统计分析报告的途径。具体的,当接收到对该请求控件的触发指令时,可以利用浏览器中的插件将显示统计分析报告的网页进行格式转换,生成pdf格式的文件,并将所生成的文件存储到目标服务器中。进一步的,根据对应的程序代码以及文件存储地址即可生成统计分析报告的调取链接,例如,统一资源定位器(Uniform ResourceLocator,URL)形式的链接,将调取链接返回客户端后,用户即可利用该链接下载pdf格式的统计分析报告。
本实施例的技术方案,确定出目标数据集后,在数据显示页面显示对应的基本统计信息概览图,有助于工作人员对所选择的数据集进行初步的确认,避免了误选与工作无关的数据集的情况发生,即使出现误选,还可以利用数据集选择控件对目标数据集进行更新;利用多种统计分析方法对数据进行分析,至少可以帮助工作人员了解数据的整体特征情况以及变量之间的统计学关联,提高了工作人员对目标数据集中数据的分析研究效率;进一步的,为用户提供一键获取文档的调取链接的功能,提升了系统的易用性,优化了用户体验。
实施例三
图3为本发明实施例三所提供的一种报告生成装置的结构框图,可执行本发明任意实施例所提供的报告生成方法,具备执行方法相应的功能模块和有益效果。如图3所示,该装置具体包括:目标数据集确定模块310、统计分析结果确定模块320以及统计分析报告生成模块330。
目标数据集确定模块310,用于当接收到数据统计分析请求时,确定目标数据集。
统计分析结果确定模块320,用于基于预先设置的至少两种统计分析方法分别对所述目标数据集中的数据进行统计分析,得到与每种统计分析方法对应的统计分析结。
统计分析报告生成模块330,用于根据各统计分析结果生成多维度的统计分析报告。
在上述各技术方案的基础上,报告生成装置还包括待确定数据集确定模块。
待确定数据集确定模块,用于当接收到对数据集选择控件的触发指令时,在下拉菜单中显示至少一个待选择数据集;当接收到数据集选择指令时,基于所述下拉菜单中的待选择数据集得到待确定数据集,并在所述数据集选择控件中进行显示,以在接收到数据统计分析请求时,将所述数据集选择控件中显示的待确定数据集作为目标数据集。
在上述各技术方案的基础上,报告生成装置还包括基本统计信息概览图显示模块。
基本统计信息概览图显示模块,用于弹出数据显示页面,并在所述数据显示页面中显示与所述目标数据集相对应的基本统计信息概览图;其中,所述基本统计信息概览图是根据所述目标数据集的因变量和问题类型确定的。
可选的,基本统计信息概览图显示模块,还用于当接收到对数据集选择控件的触发指令时,基于触发的待选择数据集更新所述目标数据集,并基于所述目标数据集生成基本统计信息概览图。
在上述各技术方案的基础上,所述至少两种统计分析方法包括:描述性分析方法、相关性分析方法、影响性分析方法、预测性分析方法、变量缺失分析方法、样本缺失分析方法、重复数据分析方法以及脏数据分析方法。
在上述各技术方案的基础上,统计分析结果确定模块320包括描述性分析单元以及相关性分析单元。
描述性分析单元,用于当采用描述性分析方法对所述目标数据集中的数据进行统计分析时,基于预先设置的配置项对所述目标数据集中的数据进行分类,得到对应的项目数据和分析参数,并将所述项目数据和所述分析参数整合为图文形式的统计分析结果;其中,所述项目数据包括所述目标数据集中至少一组样本值,所述分析参数包括所述目标数据集中至少两个变量。
相关性分析单元,用于当采用相关性分析方法对所述目标数据集中的数据进行统计分析时,基于预先设置的配置项对所述目标数据集中的数据进行分类,得到对应的项目数据和分析参数,基于所述项目数据确定出所述分析参数之间的相关系数,并将所述分析参数和所述相关系数整合为图文形式的统计分析结果。
在上述各技术方案的基础上,报告生成装置还包括统计分析报告调取链接生成模块。
统计分析报告调取链接生成模块,用于当接收到获取所述统计分析报告的请求时,将所述统计分析报告存储至目标服务器中;根据所述统计分析报告在所述目标服务器中的存储地址生成调取链接,并将所述调取链接反馈给客户端,以使与所述客户端对应的目标用户获取所述统计分析报告。
本实施例所提供的技术方案,当接收到数据统计分析请求时,自动确定出目标数据集,并基于预先设置的至少两种统计分析方法分别对目标数据集中的数据进行统计分析,得到与每种统计分析方法对应的统计分析结果,根据各统计分析结果生成多维度的统计分析报告,不仅实现了多维度统计分析报告的一键生成,还可以在报告生成过程中调用多种统计分析方法,提高了数据统计分析的效率,进而缩短了科研工作的研究周期。
本发明实施例所提供的报告生成装置可执行本发明任意实施例所提供的报告生成方法,具备执行方法相应的功能模块和有益效果。
值得注意的是,上述装置所包括的各个单元和模块只是按照功能逻辑进行划分的,但并不局限于上述的划分,只要能够实现相应的功能即可;另外,各功能单元的具体名称也只是为了便于相互区分,并不用于限制本发明实施例的保护范围。
实施例四
图4为本发明实施例四所提供的一种电子设备的结构示意图。图4示出了适于用来实现本发明实施例实施方式的示例性电子设备40的框图。图4显示的电子设备40仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图4所示,电子设备40以通用计算设备的形式表现。电子设备40的组件可以包括但不限于:一个或者多个处理器或者处理单元401,系统存储器402,连接不同系统组件(包括系统存储器402和处理单元401)的总线403。
总线403表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(ISA)总线,微通道体系结构(MAC)总线,增强型ISA总线、视频电子标准协会(VESA)局域总线以及外围组件互连(PCI)总线。
电子设备40典型地包括多种计算机系统可读介质。这些介质可以是任何能够被电子设备40访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
系统存储器402可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器(RAM)404和/或高速缓存存储器405。电子设备40可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例,存储系统406可以用于读写不可移动的、非易失性磁介质(图4未显示,通常称为“硬盘驱动器”)。尽管图4中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如CD-ROM,DVD-ROM或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线403相连。存储器402可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本发明各实施例的功能。
具有一组(至少一个)程序模块407的程序/实用工具408,可以存储在例如存储器402中,这样的程序模块407包括但不限于操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块407通常执行本发明所描述的实施例中的功能和/或方法。
电子设备40也可以与一个或多个外部设备409(例如键盘、指向设备、显示器410等)通信,还可与一个或者多个使得用户能与该电子设备40交互的设备通信,和/或与使得该电子设备40能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口411进行。并且,电子设备40还可以通过网络适配器412与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器412通过总线403与电子设备40的其它模块通信。应当明白,尽管图4中未示出,可以结合电子设备40使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
处理单元401通过运行存储在系统存储器402中的程序,从而执行各种功能应用以及数据处理,例如实现本发明实施例所提供的报告生成方法。
实施例五
本发明实施例五还提供一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行报告生成方法。
该方法包括:
当接收到数据统计分析请求时,确定目标数据集;
基于预先设置的至少两种统计分析方法分别对所述目标数据集中的数据进行统计分析,得到与每种统计分析方法对应的统计分析结果;
根据各统计分析结果生成多维度的统计分析报告。
本发明实施例的计算机存储介质,可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的项目代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
计算机可读介质上包含的项目代码可以用任何适当的介质传输,包括——但不限于无线、电线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本发明实施例操作的计算机项目代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言——诸如“C”语言或类似的程序设计语言。项目代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。
Claims (10)
1.一种报告生成方法,其特征在于,包括:
当接收到数据统计分析请求时,确定目标数据集;
基于预先设置的至少两种统计分析方法分别对所述目标数据集中的数据进行统计分析,得到与每种统计分析方法对应的统计分析结果;
根据各统计分析结果生成多维度的统计分析报告。
2.根据权利要求1所述的方法,其特征在于,在所述当接收到数据统计分析请求时,确定目标数据集之前,还包括:
当接收到对数据集选择控件的触发指令时,在下拉菜单中显示至少一个待选择数据集;
当接收到数据集选择指令时,基于所述下拉菜单中的待选择数据集得到待确定数据集,并在所述数据集选择控件中进行显示,以在接收到数据统计分析请求时,将所述数据集选择控件中显示的待确定数据集作为目标数据集。
3.根据权利要求1所述的方法,其特征在于,在所述当接收到数据统计分析请求时,确定目标数据集之后,还包括:
弹出数据显示页面,并在所述数据显示页面中显示与所述目标数据集相对应的基本统计信息概览图;
其中,所述基本统计信息概览图是根据所述目标数据集的因变量和问题类型确定的。
4.根据权利要求3所述的方法,其特征在于,在所述弹出数据显示页面,并在所述数据显示页面中显示与所述目标数据集相对应的基本统计信息概览图之后,还包括:
当接收到对数据集选择控件的触发指令时,基于触发的待选择数据集更新所述目标数据集,并基于所述目标数据集生成基本统计信息概览图。
5.根据权利要求1所述的方法,其特征在于,所述至少两种统计分析方法包括:描述性分析方法、相关性分析方法、影响性分析方法、预测性分析方法、变量缺失分析方法、样本缺失分析方法、重复数据分析方法以及脏数据分析方法。
6.根据权利要求5所述的方法,其特征在于,所述基于预先设置的至少两种统计分析方法分别对所述目标数据集中的数据进行统计分析,得到与每种统计分析方法对应的统计分析结果,包括:
当采用描述性分析方法对所述目标数据集中的数据进行统计分析时,基于预先设置的配置项对所述目标数据集中的数据进行分类,得到对应的项目数据和分析参数,并将所述项目数据和所述分析参数整合为图文形式的统计分析结果;
当采用相关性分析方法对所述目标数据集中的数据进行统计分析时,基于预先设置的配置项对所述目标数据集中的数据进行分类,得到对应的项目数据和分析参数,基于所述项目数据确定出所述分析参数之间的相关系数,并将所述分析参数和所述相关系数整合为图文形式的统计分析结果;
其中,所述项目数据包括所述目标数据集中至少一组样本值,所述分析参数包括所述目标数据集中至少两个变量。
7.根据权利要求1述的方法,其特征在于,还包括:
当接收到获取所述统计分析报告的请求时,将所述统计分析报告存储至目标服务器中;
根据所述统计分析报告在所述目标服务器中的存储地址生成调取链接,并将所述调取链接反馈给客户端,以使与所述客户端对应的目标用户获取所述统计分析报告。
8.一种报告生成装置,其特征在于,包括:
目标数据集确定模块,用于当接收到数据统计分析请求时,确定目标数据集;
统计分析结果确定模块,用于基于预先设置的至少两种统计分析方法分别对所述目标数据集中的数据进行统计分析,得到与每种统计分析方法对应的统计分析结果;
统计分析报告生成模块,用于根据各统计分析结果生成多维度的统计分析报告。
9.一种电子设备,其特征在于,所述电子设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-7中任一所述的报告生成方法。
10.一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行如权利要求1-7中任一所述的报告生成方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110890014.5A CN113609195A (zh) | 2021-08-04 | 2021-08-04 | 报告生成方法、装置、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110890014.5A CN113609195A (zh) | 2021-08-04 | 2021-08-04 | 报告生成方法、装置、电子设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113609195A true CN113609195A (zh) | 2021-11-05 |
Family
ID=78306699
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110890014.5A Pending CN113609195A (zh) | 2021-08-04 | 2021-08-04 | 报告生成方法、装置、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113609195A (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109830303A (zh) * | 2019-02-01 | 2019-05-31 | 上海众恒信息产业股份有限公司 | 基于互联网一体化医疗平台的临床数据挖掘分析与辅助决策方法 |
CN111126034A (zh) * | 2019-12-17 | 2020-05-08 | 南京医基云医疗数据研究院有限公司 | 医学变量关系的处理方法及装置、计算机介质和电子设备 |
CN111243753A (zh) * | 2020-02-27 | 2020-06-05 | 西安交通大学 | 一种面向医疗数据的多因素相关性交互式分析方法 |
CN111383768A (zh) * | 2018-12-28 | 2020-07-07 | 医渡云(北京)技术有限公司 | 医疗数据回归分析方法、装置、电子设备及可读介质 |
CN113053479A (zh) * | 2019-12-27 | 2021-06-29 | 天津幸福生命科技有限公司 | 医学数据处理方法、装置、介质及电子设备 |
-
2021
- 2021-08-04 CN CN202110890014.5A patent/CN113609195A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111383768A (zh) * | 2018-12-28 | 2020-07-07 | 医渡云(北京)技术有限公司 | 医疗数据回归分析方法、装置、电子设备及可读介质 |
CN109830303A (zh) * | 2019-02-01 | 2019-05-31 | 上海众恒信息产业股份有限公司 | 基于互联网一体化医疗平台的临床数据挖掘分析与辅助决策方法 |
CN111126034A (zh) * | 2019-12-17 | 2020-05-08 | 南京医基云医疗数据研究院有限公司 | 医学变量关系的处理方法及装置、计算机介质和电子设备 |
CN113053479A (zh) * | 2019-12-27 | 2021-06-29 | 天津幸福生命科技有限公司 | 医学数据处理方法、装置、介质及电子设备 |
CN111243753A (zh) * | 2020-02-27 | 2020-06-05 | 西安交通大学 | 一种面向医疗数据的多因素相关性交互式分析方法 |
Non-Patent Citations (2)
Title |
---|
于磊;张茂祥;李昂;曲思杨;刘美娜;: "医院过敏患者数据信息系统在线统计分析功能的实现", 中国卫生信息管理杂志, no. 06, 20 December 2015 (2015-12-20), pages 98 - 107 * |
陆慧菁;杨广黔;彭俊丰;陈联忠;王强;: "基于智能医学数据中台的大数据科研平台应用实现", 中国数字医学, no. 04, 15 April 2020 (2020-04-15), pages 22 - 25 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108519967B (zh) | 图表可视化方法、装置、终端和存储介质 | |
US8601438B2 (en) | Data transformation based on a technical design document | |
US10175954B2 (en) | Method of processing big data, including arranging icons in a workflow GUI by a user, checking process availability and syntax, converting the workflow into execution code, monitoring the workflow, and displaying associated information | |
WO2021147559A1 (zh) | 业务数据质量检测方法、装置、计算机设备及存储介质 | |
CN112463800A (zh) | 数据读取方法、装置、服务器及存储介质 | |
CN110990411A (zh) | 数据结构的生成方法及装置、调用方法及装置 | |
CN110990445A (zh) | 一种数据处理方法、装置、设备和介质 | |
CN113760839A (zh) | 日志数据压缩处理方法、装置、电子设备和存储介质 | |
CN111913922B (zh) | 二进制结构化日志的生成方法、装置、设备及存储介质 | |
CN114201615B (zh) | 基于数据快照的科研数据变动回顾方法及服务器 | |
US9880991B2 (en) | Transposing table portions based on user selections | |
US20160224741A1 (en) | Data input method | |
CN113760894A (zh) | 数据调取方法、装置、电子设备及存储介质 | |
CN112799760A (zh) | 一种表单渲染方法及其装置 | |
US9104573B1 (en) | Providing relevant diagnostic information using ontology rules | |
CN116910102A (zh) | 一种基于用户反馈的企业查询方法、装置及电子设备 | |
CN115062084B (zh) | 基于数据库元数据构建api接口方法及装置 | |
CN113609195A (zh) | 报告生成方法、装置、电子设备及存储介质 | |
CN113792138B (zh) | 报表生成方法、装置、电子设备及存储介质 | |
CN112542244B (zh) | 辅助信息的生成方法、相关装置及计算机程序产品 | |
CN112071406B (zh) | 医疗质量考核数据处理方法、装置及存储介质 | |
CN114238391A (zh) | 数据分页查询方法、装置、电子设备及存储介质 | |
CA3153550A1 (en) | Core recommendation method, device and system | |
CN113656391A (zh) | 数据检测方法及装置、存储介质及电子设备 | |
CN116204477A (zh) | Can信号的解析方法、生成方法、设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |