CN114780074B - 一种用于实现大数据分析的信息计算系统及构建方法 - Google Patents

一种用于实现大数据分析的信息计算系统及构建方法 Download PDF

Info

Publication number
CN114780074B
CN114780074B CN202210700905.4A CN202210700905A CN114780074B CN 114780074 B CN114780074 B CN 114780074B CN 202210700905 A CN202210700905 A CN 202210700905A CN 114780074 B CN114780074 B CN 114780074B
Authority
CN
China
Prior art keywords
variable
function
data
global
module
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210700905.4A
Other languages
English (en)
Other versions
CN114780074A (zh
Inventor
李海波
白猛
刘杰
杨其霖
毛智
倪文涛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Fengrui Kelin Medical Technology Co ltd
Original Assignee
Beijing Fengrui Kelin Medical Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Fengrui Kelin Medical Technology Co ltd filed Critical Beijing Fengrui Kelin Medical Technology Co ltd
Priority to CN202210700905.4A priority Critical patent/CN114780074B/zh
Publication of CN114780074A publication Critical patent/CN114780074A/zh
Application granted granted Critical
Publication of CN114780074B publication Critical patent/CN114780074B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F8/00Arrangements for software engineering
    • G06F8/30Creation or generation of source code
    • G06F8/31Programming languages or programming paradigms
    • G06F8/315Object-oriented languages
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F8/00Arrangements for software engineering
    • G06F8/30Creation or generation of source code
    • G06F8/34Graphical or visual programming
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F8/00Arrangements for software engineering
    • G06F8/60Software deployment
    • G06F8/65Updates
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Security & Cryptography (AREA)
  • Computing Systems (AREA)
  • Devices For Executing Special Programs (AREA)
  • Stored Programmes (AREA)

Abstract

本申请提出一种用于实现大数据分析的信息计算系统及构建方法,属于数据分析技术领域。系统包括:交互层、接口层、分析层、全局层;方法包括:针对数据分析功能、绘图功能、选项功能,采用Python语言与R语言进行交互式编写自定义封装函数;采用多个数据库同时接收一组或多组数据;根据一组或多组数据创建变量列表;根据数据分析功能以及选项功能二者中已选择的功能调用对应的自定义封装函数,传输所述自定义封装函数所需参数值,完成对应自定义封装函数指定的功能,得到数据分析结果以及对应图形;显示数据分析结果、图形以及实时更新的变量列表。本申请的构架在包含众多的统计分析功能的前提下,大幅度提高了计算效率和运行速度。

Description

一种用于实现大数据分析的信息计算系统及构建方法
技术领域
本申请属于数据分析技术领域,具体涉及一种用于实现大数据分析的信息计算系统及构建方法。
背景技术
现有的统计分析软件存在分析统计功能不全、代码繁琐复杂、运行速度慢的问题,已经不能满足客户的需要,如果在现有的技术框架下大规模增加不同的分析统计功能,则会造成统计分析软件运行速度更加缓慢,尤其针对大规模数据的运行和处理上,运行速度已经成为统计分析软件发展的壁垒。其次,当前大数据统计软件限于功能单一、分散的各种基础统计模块,不利于用户快速、高效的进行数据清洗、数据分析。
发明内容
针对以上技术问题,本申请提出一种用于实现大数据分析的信息计算系统及构建方法,在增加了众多分析统计功能的前提下,免除复杂的代码撰写,大幅度提高计算效率和运行速度。
本申请提出一种用于实现大数据分析的信息计算系统,包括:交互层、接口层、分析层、全局层;
所述交互层用于针对输入数据、变量列表、数据分析功能、绘图功能、选项功能、数据分析结果以及错误日志提供人机交互显示界面;
所述接口层用于针对数据分析功能、绘图功能、选项功能,采用Python语言与R语言进行交互式编写自定义封装函数;
所述分析层用于根据所述输入数据创建变量列表,根据数据分析功能以及选项功能二者中已选择的功能调用对应的自定义封装函数,传输所述自定义封装函数所需参数值,完成对应自定义封装函数指定的功能,得到数据分析结果以及对应图形,并将数据分析结果传递给交互层和/或保存于本地,将分析过程中对应变量的修改结果发送到全局层;
所述全局层用于实时获取变量的修改结果,并将变量的修改结果实时发送到交互层。
所述交互层,包括:输入模块、处理模块、绘图模块;
所述输入模块用于接收一组或多组输入数据,并将所述一组或多组输入数据发送到所述处理模块;
所述处理模块用于针对所述一组或多组输入数据对应建立并显示一个或多个数据库,以功能名称的树形结构方式显示数据分析功能以及所述数据分析功能对应的选项功能;
所述绘图模块用于选择绘图功能,并针对所述绘图功能的选项功能进行配置,根据配置结果将数据分析结果以及对应图形进行显示。
所述交互层还包括:变量模块以及错误日志模块,分别与所述分析层相连接;
所述变量模块用于接收分析层传递过来的变量列表,所述变量列表包括:变量类型列表和变量分布列表,并根据全局层传递过来的变量的修改结果,实时显示最新的变量类型列表和变量分布列表;
所述错误日志模块用于在所述分析层在分析过程中出现错误的情况下,将错误和原因反馈到错误日志中。
所述接口层将所述自定义封装函数以及系统的所有逻辑编译为dll格式文件,将所述dll格式文件以及Python模块包和R模块包放置在同一个文件夹中执行。
所述分析层包括:生成模块、执行模块、保存模块;
所述生成模块用于根据一组或多组输入数据生成变量类型列表和变量分布列表;
所述执行模块用于根据已选择的所述数据分析功能、所述数据分析功能对应的选项功能、绘图功能、绘图功能对应的选项功能调用对应的自定义封装函数,传输函数所需参数值,执行对应自定义封装函数指定的功能,得到数据分析结果以及图形,将所述数据分析结果以及图形传递给所述保存模块,将分析过程中对应变量的修改结果发送到全局层;
所述保存模块用于将所述数据分析结果以及图形保存到本地。
所述交互层还包括:读取模块,用于从分析层读取保存到本地的数据分析结果以及图形;
所述分析层还包括:判断模块,与所述读取模块相连接,用于当接受读取模块的读取请求后,选择是否同时将读取过程中对应变量的修改结果发送到全局层,若选择是,则将读取过程中对应变量的修改结果同时发送到全局层,若选择否,则直接将分析结果以及图形发送到读取模块。
所述全局层包括:变量设定单元、变量写入单元、变量更新单元、变量调用单元;
所述变量设定单元用于设定全局变量以及全局数据变量;
所述变量写入单元用于将Python语言与R语言进行交互的结果写入全局数据变量,得到新的全局数据变量;
所述变量更新单元用于采用所述新的全局数据变量更新所述全局变量,得到更新后的全局变量;
所述变量调用单元用于在更新后的全局变量下主动调用变量列表,完成对所述变量列表的实时更新。
本申请还提出一种用于实现大数据分析的信息计算系统的构建方法,包括如下步骤:
针对数据分析功能、绘图功能、选项功能,采用Python语言与R语言进行交互式编写自定义封装函数;
采用多个数据库同时接收一组或多组数据;
根据一组或多组数据创建变量列表;
根据数据分析功能以及选项功能二者中已选择的功能调用对应的自定义封装函数,传输所述自定义封装函数所需参数值,完成对应自定义封装函数指定的功能,得到数据分析结果以及对应图形;
显示数据分析结果、图形以及实时更新的变量列表。
所述针对数据分析功能、绘图功能、选项功能,采用Python语言与R语言进行交互式编写自定义封装函数,包括如下步骤:将所述自定义封装函数以及系统的所有逻辑编译为dll格式文件,将所述dll格式文件以及Python模块包和R模块包放置在同一个文件夹中执行。
所述实时更新的变量列表,包括:实时更新的变量类型列表和变量分布列表,实现过程如下:
设定全局变量以及全局数据变量;
将Python语言与R语言进行交互的结果写入全局数据变量,得到新的全局数据变量;
采用所述新的全局数据变量更新所述全局变量,得到更新后的全局变量;
在更新后的全局变量下主动调用变量列表,完成对所述变量列表的实时更新。
有益技术效果:
本申请提出一种用于实现大数据分析的信息计算系统及构建方法,避免了现有技术中每次从服务器调用,生成代码,并且依靠网络才完成分析函数的运算,解决了运行速度慢的问题,本申请的构架既能包含众多的功能、多数据库运行、实时更新变量列表,还能够大幅度提高运行速度。
附图说明
图1为本申请实施例的一种用于实现大数据分析的信息计算系统原理框图;
图2为本申请实施例的交互层原理框图;
图3为本申请实施例分析层原理框图;
图4为本申请实施例全局层原理框图;
图5为本申请实施例的一种用于实现大数据分析的信息计算系统的构建方法流程图;
图6为本申请实施例的实时更新变量列表流程图。
具体实施方式
下面结合附图对本申请作进一步描述。以下实施例仅用于更加清楚地说明本发明的技术方案,而不能以此来限制本申请的保护范围。
本申请提出一种用于实现大数据分析的信息计算系统及构建方法,本申请能够同时进行多个数据库的操作,能够实现多个数据库之间的数据合并和数据转换。本申请拥有很多的分析函数,并且具有众多的高级选项,并且,本申请在增加了众多分析统计功能的前提下,免除复杂的代码撰写,大幅度提高计算效率和运行速度,同时,根据众多现有的科研或者工程案例,本申请设计了一整套的数据处理、统计分析、统计作图等的线性分析流。在免除用户编写代码的前提下,可以更清晰的使用户掌握现代化的数据清洗流程,并可以根据现有处理模块用户自定义的设计适合自己数据的高效简洁可视化的数据清洗过程。在用户清洗完生产环境数据后,根据本申请的统计分析功能可以快速了解数据间的统计关系以及更深层次的关联关系,并在此基础上根据数据类型设计符合数据的预测模型,从比较深的层面帮助用户理解数据内部的潜在利用价值。本申请支持自定义图形制作功能,可以使用户充分从各个角度在可视化层面去了解数据的分布、关系等,极大辅助和提高了数据分析的整个流程。
本申请提出一种用于实现大数据分析的信息计算系统,如图1所示,交互层、接口层、分析层、全局层;
所述交互层用于针对输入数据、变量列表、数据分析功能、绘图功能、选项功能、数据分析结果以及错误日志提供人机交互显示界面;
所述接口层用于针对数据分析功能、绘图功能、选项功能,采用Python语言与R语言进行交互式编写自定义封装函数;
所述分析层用于根据所述输入数据创建变量列表,根据数据分析功能以及选项功能二者中已选择的功能调用对应的自定义封装函数,传输所述自定义封装函数所需参数值,完成对应自定义封装函数指定的功能,得到数据分析结果以及对应图形,并将数据分析结果传递给交互层和/或保存于本地,将分析过程中对应变量的修改结果发送到全局层;
所述全局层用于实时获取变量的修改结果,并将变量的修改结果实时发送到交互层。
本申请提出的一种用于实现大数据分析的信息计算系统具有众多的数据分析功能,能够用于数据的整理,包括:数据库预览、变量可视化、变量名修改、变量属性查看修改、变量分布查看、连续变量转换、分类变量转换、计算新变量、重复记录处理、日期变量计算、异常值处理、缺失值处理、变量深度描述、数据量纲转换、数据库横向合并、数据库纵向追加、删除行、删除列、数据库备份、多数据库操作、数据导出等等。
数据分析功能包括:线性/Logistic/Cox单因素分析、线性/Logistic/Cox回归多因素分析、线性/Logistic/Cox亚组分析、线性/Logistic/Cox-拐点分析、协变量筛查、倾向性评分、多重插补、诊断实验与ROC分析、时间依赖ROC分析、logistic预测模型分析、cox预测模型分析、Survey数据分析。
所述数据分析功能具有对应的选项功能,例如,针对数据分析功能的Survey数据分析中的Survey人群描述功能,具有对应的选项功能,详述如下:Survey人群描述功能用于人群基本特征描述,可用于复杂抽样、存在调查权重的数据分析,其分组变量:需要用来列分组变量,只可选择一个变量。变量列表:需要用来分析的变量,可选择多个变量。偏态分布变量:需要使用中位数(四分位间距值)描述的偏态分布连续变量;对应的选项功能可以包括:权重、区组变量、分层抽样变量、fpc(finite population correction,有限总体校正,选择一个变量,默认为空,表示不涉及此内容)、nest(字符串)、contDigits(连续变量的小数点位数,默认为3)、catDigits(分类变量的小数点位数,默认为2)、pDigits(P值的小数点位数,默认为4)、smd(结果表格是否展示标准差SMD,选择T/F,默认为T)、showAllLevels(结果表格中分类变量是否展示全部行值情况,选择T/F,默认为T)、addOveral(结果表格是否展示总人群汇总结果,选择T/F,默认为T)、minMax(结果表格中偏态连续变量是否展示最大值最小值,选择T/F,默认F),其中,T代表值为真,F代表值为假。本申请每一个数据分析功能具有自己独有的对应的选项功能(或称为高级选项功能)。绘图功能包括:拟合曲线gaussian、分层拟合曲线gaussian、拟合曲线logistic、分成拟合曲线logistic、拟合曲线Cox、分层拟合曲线cox、生存曲线、森林图、相关矩阵图、柱状图、作图界面重置。同理,每个绘图功能也拥有自己独有的对应选项功能,例如拟合曲线gaussian包括:Y变量:Y变量,只可选择一个。X变量:待分析自变量,只可选择一个,需为连续型变量类。协变量:组,可选择多个。拟合曲线gaussian绘图功能对应的选项功能:权重:加权变量选择,点右侧倒三角,可出现数据库中各项变量;k:knots,整值(2~20),默认为4,曲线拟合度;xlab:x轴标题,默认为轴标题,默认为X变量名称;ylab:y轴标题,默认为轴标题,默认为Y变量名称;breaks.n:直方图单个柱子宽度,默认为50;X下限%:x轴下限百分比,数值(0~100),默认为0;X上限%:x轴上限百分比,数值(0~100),默认为99.9;Y下限%:y轴下限百分比,数值(0~100),默认为0.1;上限%:y轴上限百分比,数值(0~100),默认为10;lty:线条类型,整值(1~5),默认为1;lwd:线条宽度,整值(1~10),默认为3;band:是否显示置信区间,选择(T/F),默认为"T";rug:是否显示地柱,选择(T/F),默认为"F";col.line:线条颜色,默认为"grey21";hist:是否显示直方图,选择 (T/F),默认"T";border:直方图边缘线条,颜色(字符),默认为"grey21";col.hist:直方图柱体:颜色(字符),默认为"grey71";col.fill,拟合曲线置信区间,填充颜色,默认为#B5B5B570,其中后两位70表示透明度;ci.line:是否绘制置信区间虚线:是否绘制置信区间虚线,选择(T/F),默认为"T";p.nonlinear:是否显示Non-lineartest P值,选择(T/F),默认"T";smooth:拟合曲线方法:选择spline(自然平滑样条)/rcs(限制立方样条),默认为"spline";rcs.point:限制立方样条结点所在自变量百分位数值,逗号分割,默认为(5,35,65,95);pn.xvar:Non-linear test P值所在X轴位置,默认为软件自动设置;pn.yvar:Non-linear test P值所在Y轴位置,默认为软件自动设置;height.pdf:生成本地pdf图片高度,单位图片高度,单位cm,默认为8;width.pdf:生成本地pdf图片高度,单位图片高度,单位cm,默认为8。如上所述,本申请提出的系统拥有的功能众多,功能下还具有对应的高级选项,相当于子功能,故这种系统本身也需要提高运行速度,否则这么多功能将会导致系统运行缓慢。
所述交互层,如图2所示,所述交互层,包括:输入模块、处理模块、绘图模块;
所述输入模块用于接收一组或多组输入数据,并将所述一组或多组输入数据发送到所述处理模块;
所述处理模块用于针对所述一组或多组输入数据对应建立并显示一个或多个数据库,以功能名称的树形结构方式显示数据分析功能以及所述数据分析功能对应的选项功能;
所述绘图模块用于选择绘图功能,并针对所述绘图功能的选项功能进行配置,根据配置结果将数据分析结果以及对应图形进行显示。
所述交互层还包括:变量模块以及错误日志模块,分别与所述分析层相连接;
所述变量模块用于接收分析层传递过来的变量列表,所述变量列表包括:变量类型列表和变量分布列表,并根据全局层传递过来的变量的修改结果,实时显示最新的变量类型列表和变量分布列表;
所述错误日志模块用于在所述分析层在分析过程中出现错误的情况下,将错误和原因反馈到错误日志中。
所述接口层将所述自定义封装函数以及系统的所有逻辑编译为dll格式文件,将所述dll格式文件以及Python模块包和R模块包放置在同一个文件夹中执行。dll文件(Dynamic Link Library)为动态链接库文件,又称“应用程序拓展”,是软件文件类型。所述系统的所有逻辑包括:交互层、接口层、分析层、全局层之间的调用关系逻辑。
由于采用Python语言与R语言进行交互式编写自定义封装函数,因此在所述接口层通过调用名为rpy2的Python库,读取R模块包生成的数据,并将Python模块包与R模块包各自生成的数据进行格式转换,从而使Python模块包与R模块包双方可以解读对方提供的信息。
所述分析层,如图3所示,包括:生成模块、执行模块、保存模块;
所述生成模块用于根据一组或多组输入数据生成变量类型列表和变量分布列表;
在具体实施中:是通过一个自定义封装函数从R模块包的dataframe中提取现在的变量名称及类型,然后将结果发送到Python模块包,Python模块包再将R的数据格式转为Python的数据格式,然后将Python格式的变量名称及类型显示到右侧的变量列表即可。其中,自定义封装函数是根据不同的功能定义不同的函数,是本领域技术人员公知的常识,本申请不进行赘述。
所述执行模块用于根据已选择的所述数据分析功能、所述数据分析功能对应的选项功能、绘图功能、绘图功能对应的选项功能调用对应的自定义封装函数,传输函数所需参数值,执行对应自定义封装函数指定的功能,得到数据分析结果以及图形,将所述数据分析结果以及图形传递给所述保存模块,将分析过程中对应变量的修改结果发送到全局层;
所述保存模块用于将所述数据分析结果以及图形保存到本地。
所述交互层还包括:读取模块,用于从分析层读取保存到本地的数据分析结果以及图形;
所述分析层还包括:判断模块,与所述读取模块相连接,用于当接受读取模块的读取请求后,选择是否同时将读取过程中对应变量的修改结果发送到全局层,若选择是,则将读取过程中对应变量的修改结果同时发送到全局层,若选择否,则直接将分析结果以及图形发送到读取模块。所述变量的修改包括:增加变量操作、删除变量操作以及更改变量操作。
所述全局层,如图4所示,包括:包括:变量设定单元、变量写入单元、变量更新单元、变量调用单元;
变量设定单元、变量写入单元、变量更新单元、变量调用单元;
所述变量设定单元用于设定全局变量以及全局数据变量;
所述变量写入单元用于将Python语言与R语言进行交互的结果写入全局数据变量,得到新的全局数据变量;
所述变量更新单元用于采用所述新的全局数据变量更新所述全局变量,得到更新后的全局变量;
所述变量调用单元用于在更新后的全局变量下主动调用变量列表,完成对所述变量列表的实时更新。
本申请的创造性在于:在更新了全局变量后主动调用变量类型列表和变量分布列表,而传统做法需要通过多线程,由全局map自己实时更新自己来判断是否更新了。本申请采用此方法通过1ms基本就可以实现实时更新变量类型列表和变量分布列表。
本还申请提出一种用于实现大数据分析的信息计算系统的构建方法,如图5所示,包括如下步骤:
步骤S1:针对数据分析功能、绘图功能、选项功能,采用Python语言与R语言进行交互式编写自定义封装函数;
步骤S2:采用多个数据库同时接收一组或多组数据;
步骤S3:根据一组或多组数据创建变量列表;
步骤S4:根据数据分析功能以及选项功能二者中已选择的功能调用对应的自定义封装函数,传输所述自定义封装函数所需参数值,完成对应自定义封装函数指定的功能,得到数据分析结果以及对应图形;
步骤S5:显示数据分析结果、图形以及实时更新的变量列表。
所述针对数据分析功能、绘图功能、选项功能,采用Python语言与R语言进行交互式编写自定义封装函数,包括如下步骤:将所述自定义封装函数以及系统的所有逻辑编译为dll格式文件,将所述dll格式文件以及Python模块包和R模块包放置在同一个文件夹中执行。
所述实时更新的变量列表,包括:实时更新的变量类型列表和变量分布列表,如图6所示,实现过程如下:
步骤S5.1:设定全局变量以及全局数据变量;
步骤S5.2:将Python语言与R语言进行交互的结果写入全局数据变量,得到新的全局数据变量;
步骤S5.3:采用所述新的全局数据变量更新所述全局变量,得到更新后的全局变量;
步骤S5.4:在更新后的全局变量下主动调用变量列表,完成对所述变量列表的实时更新。
本发明申请人结合说明书附图对本发明的实施示例做了详细的说明与描述,但是本领域技术人员应该理解,以上实施示例仅为本发明的优选实施方案,详尽的说明只是为了帮助读者更好地理解本发明精神,而并非对本发明保护范围的限制,相反,任何基于本发明的发明精神所作的任何改进或修饰都应当落在本发明的保护范围之内。

Claims (9)

1.一种用于实现大数据分析的信息计算系统,其特征在于,包括:交互层、接口层、分析层、全局层;
所述交互层用于针对输入数据、变量列表、数据分析功能、绘图功能、选项功能、数据分析结果以及错误日志提供人机交互显示界面;
所述接口层用于针对数据分析功能、绘图功能、选项功能,采用Python语言与R语言进行交互式编写自定义封装函数;
所述分析层用于根据所述输入数据创建变量列表,根据数据分析功能以及选项功能二者中已选择的功能调用对应的自定义封装函数,传输所述自定义封装函数所需参数值,完成对应自定义封装函数指定的功能,得到数据分析结果以及对应图形,并将数据分析结果传递给交互层和/或保存于本地,将分析过程中对应变量的修改结果发送到全局层;
所述全局层用于实时获取变量的修改结果,并将变量的修改结果实时发送到交互层;
所述分析层包括:生成模块;所述生成模块用于根据一组或多组输入数据生成变量类型列表和变量分布列表,包括:
通过一个自定义封装函数从R模块包的dataframe中提取变量名称及类型,然后将提取结果发送到Python模块包,Python模块包再将R的数据格式转为Python的数据格式,然后将Python格式的变量名称及类型显示到变量列表;
所述全局层包括:变量设定单元、变量写入单元、变量更新单元、变量调用单元;
所述变量设定单元用于设定全局变量以及全局数据变量;
所述变量写入单元用于将Python语言与R语言进行交互的结果写入全局数据变量,得到新的全局数据变量;
所述变量更新单元用于采用所述新的全局数据变量更新所述全局变量,得到更新后的全局变量;
所述变量调用单元用于在更新后的全局变量下主动调用变量列表,完成对所述变量列表的实时更新。
2.如权利要求1所述的用于实现大数据分析的信息计算系统,其特征在于,所述交互层,包括:输入模块、处理模块、绘图模块;
所述输入模块用于接收一组或多组输入数据,并将所述一组或多组输入数据发送到所述处理模块;
所述处理模块用于针对所述一组或多组输入数据对应建立并显示一个或多个数据库,以功能名称的树形结构方式显示数据分析功能以及所述数据分析功能对应的选项功能;
所述绘图模块用于选择绘图功能,并针对所述绘图功能的选项功能进行配置,根据配置结果将数据分析结果以及对应图形进行显示。
3.如权利要求1或2所述的用于实现大数据分析的信息计算系统,其特征在于,所述交互层还包括:变量模块以及错误日志模块,分别与所述分析层相连接;
所述变量模块用于接收分析层传递过来的变量列表,所述变量列表包括:变量类型列表和变量分布列表,并根据全局层传递过来的变量的修改结果,实时显示最新的变量类型列表和变量分布列表;
所述错误日志模块用于在所述分析层在分析过程中出现错误的情况下,将错误和原因反馈到错误日志中。
4.如权利要求1所述的用于实现大数据分析的信息计算系统,其特征在于,所述接口层将所述自定义封装函数以及系统的所有逻辑编译为dll格式文件,将所述dll格式文件以及Python模块包和R模块包放置在同一个文件夹中执行。
5.如权利要求1所述的用于实现大数据分析的信息计算系统,其特征在于,所述分析层包括:执行模块、保存模块;
所述执行模块用于根据已选择的所述数据分析功能、所述数据分析功能对应的选项功能、绘图功能、绘图功能对应的选项功能调用对应的自定义封装函数,传输函数所需参数值,执行对应自定义封装函数指定的功能,得到数据分析结果以及图形,将所述数据分析结果以及图形传递给所述保存模块,将分析过程中对应变量的修改结果发送到全局层;
所述保存模块用于将所述数据分析结果以及图形保存到本地。
6.如权利要求1所述的用于实现大数据分析的信息计算系统,其特征在于,所述交互层还包括:读取模块,用于从分析层读取保存到本地的数据分析结果以及图形;
所述分析层还包括:判断模块,与所述读取模块相连接,用于当接受读取模块的读取请求后,选择是否同时将读取过程中对应变量的修改结果发送到全局层,若选择是,则将读取过程中对应变量的修改结果同时发送到全局层,若选择否,则直接将分析结果以及图形发送到读取模块。
7.一种用于实现大数据分析的信息计算系统的构建方法,其特征在于,包括如下步骤:
针对数据分析功能、绘图功能、选项功能,采用Python语言与R语言进行交互式编写自定义封装函数;
采用多个数据库同时接收一组或多组数据;
根据一组或多组数据创建变量列表;
根据数据分析功能以及选项功能二者中已选择的功能调用对应的自定义封装函数,传输所述自定义封装函数所需参数值,完成对应自定义封装函数指定的功能,得到数据分析结果以及对应图形;
显示数据分析结果、图形以及实时更新的变量列表;
所述根据一组或多组数据创建变量列表,包括:
通过一个自定义封装函数从R模块包的dataframe中提取变量名称及类型,然后将提取结果发送到Python模块包,Python模块包再将R的数据格式转为Python的数据格式,然后将Python格式的变量名称及类型显示到变量列表;
所述实时更新的变量列表包括:
设定全局变量以及全局数据变量;
将Python语言与R语言进行交互的结果写入全局数据变量,得到新的全局数据变量;
采用所述新的全局数据变量更新所述全局变量,得到更新后的全局变量;
在更新后的全局变量下主动调用变量列表,完成对所述变量列表的实时更新。
8.如权利要求7所述的用于实现大数据分析的信息计算系统的构建方法,其特征在于,所述针对数据分析功能、绘图功能、选项功能,采用Python语言与R语言进行交互式编写自定义封装函数,包括如下步骤:将所述自定义封装函数以及系统的所有逻辑编译为dll格式文件,将所述dll格式文件以及Python模块包和R模块包放置在同一个文件夹中执行。
9.如权利要求7所述的用于实现大数据分析的信息计算系统的构建方法,其特征在于,所述实时更新的变量列表,包括:实时更新的变量类型列表和变量分布列表,实现过程如下:
设定全局变量以及全局数据变量;
将Python语言与R语言进行交互的结果写入全局数据变量,得到新的全局数据变量;
采用所述新的全局数据变量更新所述全局变量,得到更新后的全局变量;
在更新后的全局变量下主动调用变量列表,完成对所述变量列表的实时更新。
CN202210700905.4A 2022-06-20 2022-06-20 一种用于实现大数据分析的信息计算系统及构建方法 Active CN114780074B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210700905.4A CN114780074B (zh) 2022-06-20 2022-06-20 一种用于实现大数据分析的信息计算系统及构建方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210700905.4A CN114780074B (zh) 2022-06-20 2022-06-20 一种用于实现大数据分析的信息计算系统及构建方法

Publications (2)

Publication Number Publication Date
CN114780074A CN114780074A (zh) 2022-07-22
CN114780074B true CN114780074B (zh) 2022-09-16

Family

ID=82421236

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210700905.4A Active CN114780074B (zh) 2022-06-20 2022-06-20 一种用于实现大数据分析的信息计算系统及构建方法

Country Status (1)

Country Link
CN (1) CN114780074B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102918522A (zh) * 2010-04-05 2013-02-06 昕易软件公司 用于生成统计研究信息的系统、方法以及逻辑
CN104915793A (zh) * 2015-06-30 2015-09-16 北京西塔网络科技股份有限公司 基于大数据分析挖掘的公共信息智能分析平台
CN106354786A (zh) * 2016-08-23 2017-01-25 冯村 一种可视分析方法及系统
CN107766401A (zh) * 2017-05-26 2018-03-06 温州市勘察测绘研究院 基于大数据的人行道违停分析方法及系统
CN110110002A (zh) * 2019-05-13 2019-08-09 江南大学 大数据可视化交互系统

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107943463B (zh) * 2017-12-15 2018-10-16 清华大学 交互式自动化大数据分析应用开发系统
US11301816B1 (en) * 2019-07-12 2022-04-12 Palantir Technologies Inc. Interactive data analysis and scheduling
CN113592440B (zh) * 2021-07-20 2022-07-01 深圳市德邦物流有限公司 一种基于大数据的智慧物流取件分析系统及方法
CN113449018A (zh) * 2021-08-27 2021-09-28 四川垣石智慧科技有限公司 一种基于云平台的统计分析及可视化系统

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102918522A (zh) * 2010-04-05 2013-02-06 昕易软件公司 用于生成统计研究信息的系统、方法以及逻辑
CN104915793A (zh) * 2015-06-30 2015-09-16 北京西塔网络科技股份有限公司 基于大数据分析挖掘的公共信息智能分析平台
CN106354786A (zh) * 2016-08-23 2017-01-25 冯村 一种可视分析方法及系统
CN107766401A (zh) * 2017-05-26 2018-03-06 温州市勘察测绘研究院 基于大数据的人行道违停分析方法及系统
CN110110002A (zh) * 2019-05-13 2019-08-09 江南大学 大数据可视化交互系统

Also Published As

Publication number Publication date
CN114780074A (zh) 2022-07-22

Similar Documents

Publication Publication Date Title
US11768875B2 (en) Monitoring system control interface for asset tree determination
CN106886418B (zh) Html界面控件贴
US11763076B2 (en) Document applet generation
CN110673848B (zh) 一种基于JavaWeb的企业信息管理系统配置装置
US11693871B1 (en) Graphical user interface for dynamic elements of asset monitoring and reporting system
CN111538731B (zh) 一种工业数据自动生成报表系统
CN103984755A (zh) 基于多维度模型的油气资源数据要览系统实现方法及系统
US11809439B1 (en) Updating client dashboarding component of an asset monitoring and reporting system
JP6813634B2 (ja) グラフィックインタフェースに基づく、イベント動作をプログラミングするwebレポーティングデザインシステム
CN102907069A (zh) 执行图形应用的方法和系统
CN109976729B (zh) 一种存算显全局可配置的数据分析软件架构设计方法
CN112988130A (zh) 一种基于大数据的可视化建模方法、装置、设备及介质
CN110032368B (zh) 信息配置方法及装置
CN113420009B (zh) 一种基于大数据的电磁数据分析装置、系统及方法
CN114138269A (zh) 业务数据的可视化应用构建方法和装置
CN116468010A (zh) 报表生成方法、装置、终端及存储介质
CN112199363A (zh) 一种农业多源异构数据的融合存储方法与系统
CN114896691A (zh) 一种基于mbd设备模型的三维标注方法
CN114780074B (zh) 一种用于实现大数据分析的信息计算系统及构建方法
CN112131300A (zh) 一种基于Flutter的跨平台数据制作方法和装置
CN109948133B (zh) 一种基于Layui的数据表格的实现方法
US20130218893A1 (en) Executing in-database data mining processes
US20140344235A1 (en) Determination of data modification
CN115130442A (zh) 报表生成的方法、装置、存储介质及计算机设备
US9218677B2 (en) Presenting data records based on binning and randomization

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant