CN111274243B - 一种基于多维模型表单的信息处理方法及系统 - Google Patents

一种基于多维模型表单的信息处理方法及系统 Download PDF

Info

Publication number
CN111274243B
CN111274243B CN202010014853.6A CN202010014853A CN111274243B CN 111274243 B CN111274243 B CN 111274243B CN 202010014853 A CN202010014853 A CN 202010014853A CN 111274243 B CN111274243 B CN 111274243B
Authority
CN
China
Prior art keywords
dimensional
dimension
module
data
multidimensional
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010014853.6A
Other languages
English (en)
Other versions
CN111274243A (zh
Inventor
杨光
曹毓琳
滕睿頔
杨蕊
白志惠
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Tangyihuikang Biomedical Technology Co ltd
Original Assignee
Beijing Tangyihuikang Biomedical Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Tangyihuikang Biomedical Technology Co ltd filed Critical Beijing Tangyihuikang Biomedical Technology Co ltd
Priority to CN202010014853.6A priority Critical patent/CN111274243B/zh
Publication of CN111274243A publication Critical patent/CN111274243A/zh
Application granted granted Critical
Publication of CN111274243B publication Critical patent/CN111274243B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2282Tablespace storage structures; Management thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/283Multi-dimensional databases or data warehouses, e.g. MOLAP or ROLAP

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供了一种基于多维模型表单的信息处理方法,该方法包括以下步骤:获取多维数据表单;根据多维数据表单的维度,对多维数据进行降维处理,将多维数据表单处理成放射型结构,放射型结构包括中央节点和分支节点,中央节点为多维表单,多维数据表单为星型结构的中央节点,降维处理后的表单为分支节点;根据放射型结构中的中央节点和分支节点进行数据分析,得到数据分析结果;本发明提供的方法能够基于多维数据表单生成放射型结构,由中央节点和分支节点表示不同维度的表单数据,使用时可直接获取相应维度的表单数据,提高数据分析速度,且即使增加维度,数据量也易于控制。

Description

一种基于多维模型表单的信息处理方法及系统
技术领域
本发明属于数据处理技术领域,特别涉及一种基于多维模型表单的信息处理方法及系统。
背景技术
多维数据分析是以数据库或数据仓库为基础的,其最终数据来自底层的数据库系统,多维数据分析更适合以数据仓库为基础的数据分析处理,多维数据处理方法对数据从多个角度即多个维度进行观察和分析,多维的分析操作是指通过对多维形式组织起来的数据进行切片、切块、聚合、钻去、旋转等分析操作,以求剖析数据,使用户能够从多种维度、多个侧面、多种数据综合度查看数据,从而深入地了解包在数据中的信息和内涵,目前,通过联机分析处理对多维数据进行多维度分析时可分为关系联机分析处理和多维联机分析处理,其中,多维联机分析处理使用多维数组存储数据,关系联机分析处理将多维数据库的多维数据结构划分为两类表,一类是事实表,用来存储数据和维关键字,另一类是维表,对每个维至少使用一个表来存放维的层次、成员类别等维的描述信息,在使用时,随着剧数量的增大,关系联机分析处理存在分析速度慢的问题,多维联机分析处理存在数据量控制困难的问题。
发明内容
为了解决以上技术问题,本发明提供了一种基于多维模型表单的信息处理方法及系统。
本发明具体技术方案如下:
本发明提供了一种基于多维模型表单的信息处理方法,该方法包括以下步骤:
获取多维数据表单;
根据多维数据表单的维度,对多维数据进行降维处理,将多维数据表单处理成放射型结构,放射型结构包括中央节点和分支节点,中央节点为多维表单,多维数据表单为星型结构的中央节点,降维处理后的表单为分支节点;
根据放射型结构中的中央节点和分支节点进行数据分析,得到数据分析结果。
本发明还提供了一种基于多维模型表单的信息处理系统,该信息处理系统包括表单获取模块、降维模块和分析模块;
表单获取模块:被配置为获取多维数据表单;
降维模块:被配置为根据多维数据表单的维度,对多维数据进行降维处理,将多维数据表单处理成放射型结构,放射型结构包括中央节点和分支节点,中央节点为多维表单,多维数据表单为星型结构的中央节点,降维处理后的表单为分支节点;
分析模块:被配置为根据放射型结构中的中央节点和分支节点进行数据分析,得到数据分析结果。
与现有技术相比,本发明提供的方法能够基于多维数据表单生成放射型结构,由中央节点和分支节点表示不同维度的表单数据,使用时可直接获取相应维度的表单数据,提高数据分析速度,且即使增加维度,数据量也易于控制。
附图说明
图1为本公开基于多维模型表单的信息处理方法的流程图;
图2为本公开中放射型结构的一种示意图;
图3为本公开中放射型结构的第二种示意图;
图4为本公开中放射型结构的第三种示意图;
图5为本公开基于多维模型表单的信息处理方法的流程图;
图6为本公开基于多维模型表单的信息处理方法的流程图;
图7为本公开基于多维模型表单的信息处理系统的结构框图;
图8为本公开降维模块的结构框图;
图9为本公开基于多维模型表单的信息处理系统的结构框图;
图10为本公开更新模块的结构框图;
图11为本公开新生各维度表单生成模块的结构框图。
具体实施方式
下面结合附图和实施例对本发明作进一步的描述,下列实施例仅用于解释本发明的发明内容,不用于限定本发明的保护范围。
附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所描述的步骤。
参见图1,示出了基于多维模型表单的信息处理方法的流程图,该方法包括以下步骤:
获取多维数据表单;
根据多维数据表单的维度,对多维数据进行降维处理,将多维数据表单处理成放射型结构,放射型结构包括中央节点和分支节点,中央节点为多维表单,多维数据表单为星型结构的中央节点,降维处理后的表单为分支节点;
根据放射型结构中的中央节点和分支节点进行数据分析,得到数据分析结果;
其中,放射型结构如图2所示,即将多维表单作为中央节点,降维后的各维度表单(如一维表单、二维表单等)作为分支节点构成的结构,降维处理方法为现有技术,本示例不做赘述;
本发明提供的方法能够基于多维数据表单生成放射型结构,由中央节点和分支节点表示不同维度的表单数据,使用时可直接获取相应维度的表单数据,提高数据分析速度。
其中,放射型结构中的分支节点通过以下步骤获得:
将多维数据表单拆分为n个一维表单、
Figure BDA0002358487730000041
个二维表单、/>
Figure BDA0002358487730000042
个三维表单…/>
Figure BDA0002358487730000043
个m维表单和1个n维表单,将拆分生成的所有表单作为放射型结构的分支节点;
Figure BDA0002358487730000044
个m维表单是将多维表单中任意m个维度元素聚合得到的表单的集合;
如图2所示,n维表单即为放射型结构的中央节点,将多维数据表单拆分得到的一维表单、二维表单、三维表单…m维表单…n-1维表单都是分支节点;
作为一种示例,参见图3,示出了放射型结构的第二种示意图,即维度元素分别为冻存、耗材、试剂、设备的四维表单经处理后的放射型结构,当又新增一个维度元素,即“冻存”时,则如图4所示,生成附加分支节点和新的中央节点,具体的生成方法包括以下步骤:
如图5所示,信息处理方法还包括以下步骤:针对多维数据表单判断是否增加新的维度元素,如果未增加新的维度元素,则不做处理,如果判断结果为增加新的维度元素,则针对新的维度元素生成附加分支节点和中央节点;
如图6所示,附加分支节点的生成方法包括:
步骤S1:判断新增的维度元素的数量T,如果T=1,则以维度元素作为新增元素,生成新生各维度表单作为附加分支节点,如果T>1,则进行步骤S2;
步骤S2:任意选择其中一个维度元素,以任意选择的维度元素作为新增元素,生成新生各维度表单作为附加分支节点;
步骤S3:判断T-1与1的大小,如果T-1大于1,则进行步骤S2,如果T-1=1,则进行步骤S1;
生成新生各维度表单的具体方法为:将新增维度元素k进行处理生成附加一维表单,将新增维度元素k与原n维表单生成的所有的一维表单聚合得到附加二维表单…将新增维度元素k与原n维表单生成的所有的x维表单聚合得到附加x+1维表单,x<n,附加一维表单、附加二维表的和附加x+1表单均为附加分支节点,将原n维表单与新增维度元素k处理成n+1维表单作为新的中央节点。
本发明公开的方法无需将新增维度元素后的多维表单再次重新拆分一遍,只需将新的维度元素与原拆分后的表单生成附加分支节点和中央节点即可,避免重复生成相同的表单。
参见图7,示出了基于多维模型的表单构建系统的结构框图,该系统包括表单获取模块1、降维模块2和分析模块3;
表单获取模块1:被配置为获取多维数据表单;
降维模块2:被配置为根据多维数据表单的维度,对多维数据进行降维处理,将多维数据表单处理成放射型结构,放射型结构包括中央节点和分支节点,中央节点为多维表单,多维数据表单为星型结构的中央节点,降维处理后的表单为分支节点;
分析模块3:被配置为根据放射型结构中的中央节点和分支节点进行数据分析,得到数据分析结果。
作为一种示例,参见图8,示出了降维模块的降维模块的结构框图,降维模块2包括:一维表单拆分模块21、二维表单拆分模块22、三维表单拆分模块23…m维表单拆分模块24…n维表单拆分模块25;
一维表单拆分模块21:被配置为将多维数据表单拆分为n个一维表单;
二维表单拆分模块22:被配置为将多维数据表单拆分为
Figure BDA0002358487730000061
个二维表单;
三维表单拆分模块23:被配置为将多维数据表单拆分为
Figure BDA0002358487730000062
个三维表单;
m维表单拆分模块24:被配置为将多维数据表单拆分为
Figure BDA0002358487730000071
个m维表单;
n维表单拆分模块25:被配置为将多维数据表单拆分为1个n维表单;
其中,
Figure BDA0002358487730000072
个m维表单是将多维表单中任意m个维度元素聚合得到的表单的集合;
作为一种示例,参见图9,示出了本公开基于多维模型表单的信息处理系统的结构框图,在图7的基础上,本示例的信息处理系统还包括维度增加判断模块4和更新模块5;
维度增加判断模块4:被配置为针对多维数据表单判断是否增加新的维度元素,如果未增加新的维度元素,则不做处理,如果判断结果为增加新的维度元素,则向更新模块5发送指令;
更新模块5:被配置为针对新的维度元素生成附加分支节点和中央节点。
作为一种示例,参见图10,示出了本公开更新模块的结构框图,更新模块5包括维度元素数量判断模块51、任选模块52、新生各维度表单生成模块53和循环模块54;
维度元素数量判断模块51:被配置为判断新增的维度元素的数量T,如果T=1,则以维度元素作为新增元素,并向新生各维度表单生成模块53发送指令,如果T>1,向任选模块52发送指令;
任选模块52:被配置为任意选择其中一个维度元素,以任意选择的维度元素作为新增元素,并向新生各维度表单生成模块53发送指令;
新生各维度表单生成模块53:被配置为生成新生各维度表单作为附加分支节点;
循环模块54:被配置为判断T-1与1的大小,如果T-1大于1,则向任选模块52发送指令,如果T-1=1,则向维度元素数量判断模块51发送指令;
作为一种示例,参见图11,示出了本公开新生各维度表单生成模块的结构框图,新生各维度表单生成模块53包括新生一维表单生成模块531和新生x维表单生成模块532;
新生一维表单生成模块531:被配置为将新增维度元素k进行处理生成附加一维表单,
新生x维表单生成模块532:被配置为将新增维度元素k与原n维表单生成的所有的x维表单聚合得到附加x+1维表单,x<n。
综上,仅为本发明之较佳实施例,不以此限定本发明的保护范围,凡依本发明专利范围及说明书内容所作的等效变化与修饰,皆为本发明专利涵盖的范围之内。

Claims (7)

1.一种基于多维模型表单的信息处理方法,其特征在于,所述方法包括以下步骤:
获取多维数据表单;
根据多维数据表单的维度,对所述多维数据进行降维处理,将所述多维数据表单处理成放射型结构,所述放射型结构包括中央节点和分支节点,所述中央节点为多维表单,所述多维数据表单为星型结构的中央节点,所述降维处理后的表单为分支节点;
根据所述放射型结构中的所述中央节点和所述分支节点进行数据分析,得到数据分析结果;
所述信息处理方法还包括以下步骤:
针对所述多维数据表单判断是否增加新的维度元素,如果未增加新的维度元素,则不做处理,如果判断结果为增加新的维度元素,则针对新的维度元素生成附加分支节点和中央节点;
所述附加分支节点的生成方法包括:
步骤S1:判断新增的维度元素的数量T,如果T=1,则以所述维度元素作为新增元素,生成新生各维度表单作为附加分支节点,如果T>1,则进行步骤S2;
步骤S2:任意选择其中一个维度元素,以任意选择的维度元素作为新增元素,生成新生各维度表单作为附加分支节点;
步骤S3:判断T-1与1的大小,如果T-1大于1,则进行步骤S2,如果T-1=1,则进行步骤S1。
2.如权利要求1所述的基于多维模型表单的信息处理方法,其特征在于,所述放射型结构中的分支节点通过以下步骤获得:
将所述多维数据表单拆分为n个一维表单、
Figure QLYQS_1
个二维表单、/>
Figure QLYQS_2
个三维表单…/>
Figure QLYQS_3
个m维表单和1个n维表单,将拆分生成的所有表单作为放射型结构的分支节点。
3.如权利要求2所述的基于多维模型表单的信息处理方法,其特征在于,
Figure QLYQS_4
个m维表单是将多维表单中任意m个维度元素聚合得到的表单的集合。
4.如权利要求1所述的基于多维模型表单的信息处理方法,其特征在于,所述生成新生各维度表单的具体方法为:将新增维度元素k进行处理生成附加一维表单,将新增维度元素k与原n维表单生成的所有的一维表单聚合得到附加二维表单…将新增维度元素k与原n维表单生成的所有的x维表单聚合得到附加x+1维表单,x<n,所述附加一维表单、附加二维表的和附加x+1表单均为附加分支节点,将原n维表单与新增维度元素k处理成n+1维表单作为新的中央节点。
5.一种基于多维模型表单的信息处理系统,其特征在于,所述信息处理系统包括表单获取模块(1)、降维模块(2)和分析模块(3);
所述表单获取模块(1):被配置为获取多维数据表单;
所述降维模块(2):被配置为根据多维数据表单的维度,对所述多维数据进行降维处理,将所述多维数据表单处理成放射型结构,所述放射型结构包括中央节点和分支节点,所述中央节点为多维表单,所述多维数据表单为星型结构的中央节点,所述降维处理后的表单为分支节点;
所述分析模块(3):被配置为根据所述放射型结构中的所述中央节点和所述分支节点进行数据分析,得到数据分析结果;
所述信息处理系统还包括维度增加判断模块(4)和更新模块(5);
所述维度增加判断模块(4):被配置为针对所述多维数据表单判断是否增加新的维度元素,如果未增加新的维度元素,则不做处理,如果判断结果为增加新的维度元素,则向所述更新模块(5)发送指令;
所述更新模块(5):被配置为针对新的维度元素生成附加分支节点和中央节点;
所述更新模块(5)包括维度元素数量判断模块(51)、任选模块(52)、新生各维度表单生成模块(53)和循环模块(54);
所述维度元素数量判断模块(51):被配置为判断新增的维度元素的数量T,如果T=1,则以所述维度元素作为新增元素,并向所述新生各维度表单生成模块(53)发送指令,如果T>1,向任选模块(52)发送指令;
所述任选模块(52):被配置为任意选择其中一个维度元素,以任意选择的维度元素作为新增元素,并向所述新生各维度表单生成模块(53)发送指令;
所述新生各维度表单生成模块(53):被配置为生成新生各维度表单作为附加分支节点;
所述循环模块(54):被配置为判断T-1与1的大小,如果T-1大于1,则向所述任选模块(52)发送指令,如果T-1=1,则向所述维度元素数量判断模块(51)发送指令。
6.如权利要求5所述的基于多维模型表单的信息处理系统,其特征在于,所述降维模块(2)包括:一维表单拆分模块(21)、二维表单拆分模块(22)、三维表单拆分模块(23)…m维表单拆分模块(24)…n维表单拆分模块(25);
所述一维表单拆分模块(21):被配置为将所述多维数据表单拆分为n个一维表单;
所述二维表单拆分模块(22):被配置为将所述多维数据表单拆分为
Figure QLYQS_5
个二维表单;
所述三维表单拆分模块(23):被配置为将所述多维数据表单拆分为
Figure QLYQS_6
个三维表单;
所述m维表单拆分模块(24):被配置为将所述多维数据表单拆分为
Figure QLYQS_7
个m维表单;
所述n维表单拆分模块(25):被配置为将所述多维数据表单拆分为1个n维表单;
其中,
Figure QLYQS_8
个m维表单是将多维表单中任意m个维度元素聚合得到的表单的集合。/>
7.如权利要求5所述的基于多维模型表单的信息处理系统,其特征在于,所述新生各维度表单生成模块(53)包括新生一维表单生成模块(531)和新生x维表单生成模块(532);
所述新生一维表单生成模块(531):被配置为将新增维度元素k进行处理生成附加一维表单,
所述新生x维表单生成模块(532):被配置为将新增维度元素k与原n维表单生成的所有的x维表单聚合得到附加x+1维表单,x<n。
CN202010014853.6A 2020-01-07 2020-01-07 一种基于多维模型表单的信息处理方法及系统 Active CN111274243B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010014853.6A CN111274243B (zh) 2020-01-07 2020-01-07 一种基于多维模型表单的信息处理方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010014853.6A CN111274243B (zh) 2020-01-07 2020-01-07 一种基于多维模型表单的信息处理方法及系统

Publications (2)

Publication Number Publication Date
CN111274243A CN111274243A (zh) 2020-06-12
CN111274243B true CN111274243B (zh) 2023-05-23

Family

ID=71111945

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010014853.6A Active CN111274243B (zh) 2020-01-07 2020-01-07 一种基于多维模型表单的信息处理方法及系统

Country Status (1)

Country Link
CN (1) CN111274243B (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106897745A (zh) * 2017-02-27 2017-06-27 山东浪潮云服务信息科技有限公司 一种多维数据集的降维处理方法及装置
CN107832347A (zh) * 2017-10-16 2018-03-23 北京京东尚科信息技术有限公司 数据降维方法、系统及电子设备
CN108009193A (zh) * 2017-10-19 2018-05-08 东软集团股份有限公司 数据分析方法及装置、存储介质、电子设备
CN108694245A (zh) * 2018-05-15 2018-10-23 东软集团股份有限公司 多维数据显示方法、装置、可读存储介质及电子设备

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7305408B2 (en) * 2003-08-12 2007-12-04 Oracle International Corporation System and method for cross attribute analysis and manipulation in online analytical processing (OLAP) and multi-dimensional planning applications by dimension splitting
US8204914B2 (en) * 2006-12-05 2012-06-19 Sap Ag Method and system to process multi-dimensional data

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106897745A (zh) * 2017-02-27 2017-06-27 山东浪潮云服务信息科技有限公司 一种多维数据集的降维处理方法及装置
CN107832347A (zh) * 2017-10-16 2018-03-23 北京京东尚科信息技术有限公司 数据降维方法、系统及电子设备
CN108009193A (zh) * 2017-10-19 2018-05-08 东软集团股份有限公司 数据分析方法及装置、存储介质、电子设备
CN108694245A (zh) * 2018-05-15 2018-10-23 东软集团股份有限公司 多维数据显示方法、装置、可读存储介质及电子设备

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
段江娇,薛永生,令狐荣珊.数据仓库的多维数据分析器设计与实现.厦门大学学报(自然科学版).2002,(06),全文. *
王鑫,宿红毅,白琳,王娜.OLAP在人力成本核算系统中的多维数据分析研究.计算机工程与设计.2005,(10),全文. *

Also Published As

Publication number Publication date
CN111274243A (zh) 2020-06-12

Similar Documents

Publication Publication Date Title
Popat et al. Review and comparative study of clustering techniques
CN107292186B (zh) 一种基于随机森林的模型训练方法和装置
CN107515878B (zh) 一种数据索引的管理方法及装置
Chandra et al. Comprehensive survey on data warehousing research
US7743058B2 (en) Co-clustering objects of heterogeneous types
Queiroz-Sousa et al. A review on OLAP technologies applied to information networks
AU2016270327B2 (en) Methods and systems for selectively retrieving data to provide a limited dataset for incorporation into a pivot table
US9798808B2 (en) Data visualization system
CN111627552B (zh) 一种医疗流式数据血缘关系分析、存储方法及装置
WO2006055894A2 (en) Data mining of very large spatial dataset
CN103970871A (zh) 存储系统中基于溯源信息的文件元数据查询方法与系统
CN111046042A (zh) 基于时空碰撞的快速检索方法及系统
CN105808582A (zh) 基于分层策略的决策树并行生成方法和装置
CN106605222A (zh) 有指导的数据探索
CN106294805A (zh) 数据处理方法及装置
US10810458B2 (en) Incremental automatic update of ranked neighbor lists based on k-th nearest neighbors
EP4276623A1 (en) Sorting device and method
CN111274243B (zh) 一种基于多维模型表单的信息处理方法及系统
Ying et al. A nonlinear service composition method based on the Skyline operator
Mola et al. Discriminant analysis and factorial multiple splits in recursive partitioning for data mining
CN115168326A (zh) Hadoop大数据平台分布式能源数据清洗方法及系统
Jiang et al. A hybrid clustering algorithm
CN113256793A (zh) 一种三维数据处理方法及系统
CN112148830A (zh) 一种基于最大区域网格的语义数据存储与检索的方法及装置
CN113516224A (zh) 神经网络的优化方法及装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant