CN108170696A - 一种数据挖掘的方法 - Google Patents

一种数据挖掘的方法 Download PDF

Info

Publication number
CN108170696A
CN108170696A CN201710429062.8A CN201710429062A CN108170696A CN 108170696 A CN108170696 A CN 108170696A CN 201710429062 A CN201710429062 A CN 201710429062A CN 108170696 A CN108170696 A CN 108170696A
Authority
CN
China
Prior art keywords
resource
tree
data
component
node
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710429062.8A
Other languages
English (en)
Inventor
韩超
季统凯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
G Cloud Technology Co Ltd
Original Assignee
G Cloud Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by G Cloud Technology Co Ltd filed Critical G Cloud Technology Co Ltd
Priority to CN201710429062.8A priority Critical patent/CN108170696A/zh
Publication of CN108170696A publication Critical patent/CN108170696A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2228Indexing structures
    • G06F16/2246Trees, e.g. B+trees
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2465Query processing support for facilitating data mining operations in structured databases

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Fuzzy Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及数据分析挖掘领域,具体涉及一种数据挖掘的方法。本发明所述的方法是对部件资源采用树形组织结构进行组织;资源树采用自定义的树状数据结构并整体存储数据库,通过解释后得到具体的树状信息;由用户自定义执行流程;资源树使用B+树算法实现;子树记录着下层子树创建的时间、节点类型;叶子结点记录文件资源的创建时间、资源类型、节点类型、资源ID;树资源的信息通过持久化整体以二进制的形式存储在数据库。本发明通过对数据挖掘中所使用到的资源进行有效的管理,简化使用流程,在用户选择算法等资源的时候给出相应的使用建议,降低各种挖掘算法使用的复杂度,使得一般的用户使用更加方便地使用本方法实现的系统。

Description

一种数据挖掘的方法
技术领域
本发明涉及数据分析挖掘领域,具体涉及一种数据挖掘的方法。
背景技术
随着计算机技术的不断发展,数据的分析挖掘、数据的组织和展示显得尤为重要,数据的价值需要通过挖掘和分析才能充分地体现出来,而挖掘通常要涉及各种流程,资源的管理涉及组织形式和存储,通过合理的资源组织能够是系统对资源的管理更加简便高效。而合理的数据挖掘流程能够使得系统具有便捷性,数据的展示更具有多样性。
发明内容
本发明解决的技术问题在于提供一种数据挖掘的方法统,使得对于普通用户来说,数据挖掘更加易于使用,系统的管理更加高效,节约成本。
本发明解决上述技术问题的技术方案是:
所述的方法是对部件资源采用树形组织结构进行组织;资源树采用自定义的树状数据结构并整体存储数据库,通过解释后得到具体的树状信息;由用户自定义执行流程;
所述的资源树使用B+树算法实现;子树记录着下层子树创建的时间、节点类型;叶子结点记录文件资源的创建时间、资源类型、节点类型、资源lD;树资源的信息通过持久化整体以二进制的形式存储在数据库。
数据源、算法库、可视化图表和用户自定义创建的文件资源都以树的分支或者叶子节点的方式组织。
用户以拖拽的方式从资源树中选择流程环节部件,当所有或部分的部件都选择完成后,通过箭头连接完成执行流程顺序。
所述方法的工作流程如下:
(1)、系统从数据库读取树结构;
(2)、根据读取的结果进行解释,得到一棵完整的资源树,并根据叶子结点查询相应资源的位置,生成json或者xml格式的数据返回到前台;
(3)、前台根据后台返回的json数据或者xml数据,把树形结构的组织数据展示出来,并且实现节点的折叠;
(4)、通过拖拽的选择方式,把组件放置面板,包括数据源组件、算法组件和可视化组件;
(5)、通过使用系统提供的箭头,把组件依次连接起来,系统按照所设置的参数依次执行流程,最后得到结果;
(6)、点击保存按钮后,资源树通过json格式或者xml格式返回,后台解释后存入数据库。
本发明通过对数据挖掘中所使用到的资源进行有效的管理,简化使用流程,在用户选择算法等资源的时候给出相应的使用建议,降低各种挖掘算法使用的复杂度,使得一般的用户使用更加方便地使用本方法实现的系统。
本发明通过以树形结构组织资源并展示给用户,用户通过拖拽资源部件到面板,并以箭头线连接部件,表示执行的流程。除了系统固定部分的资源,用户是可以在资源树上新建文件资源,为了减少数据库设计的复杂性和提高效率,资源树以持久化二进制文件的方式存储于数据库。
附图说明
下面结合附图对本发明进一步说明:
图1是本发明用户自定义挖掘流程图;
图2是本发明资源树解释流程图。
具体实施方式
本发明所述的方法的主要思想是:通过以树形结构组织资源并展示给用户,用户通过拖拽资源部件到面板,并以箭头线连接部件,表示执行的流程。除了系统固定部分的资源,用户是可以在资源树上新建文件资源,为了减少数据库设计的复杂性和提高效率,资源树以持久化二进制文件的方式存储于数据库。
如图1所示,整个工作详细流程如下:
1、系统从数据库读取树结构;
2、根据读取的结果进行解释,得到一棵完整的资源树,并根据叶子结点查询相应资源的位置,生成json或者xml格式的数据返回到前台;
3、前台根据后台返回的json数据或者xml数据,把树形结构的组织数据展示出来,并且实现节点的折叠;
4、通过拖拽的选择方式,把组件放置面板,包括数据源组件、算法组件和可视化组件;
5、通过使用系统提供的箭头,把组件依次连接起来,系统会按照所设置的参数依次执行流程,最后得到结果;
6、点击保存按钮后,资源树通过json格式或者xml格式返回,后台解释后存入数据库。
见图2所示,本发明首先通过读取数据库的树信息,然后解释成json或者xml的数据格式后,返回给前端进行展示。如果前端发生创建或者删除节点的事件,将会及时反馈到后台,后台重新构造树结构,把构造的结果返回前端,并且把新的树信息存储到数据库。
本发明设置流程环节所涉及的部件包括数据源、算法库和可视化图表。数据源包括如下形式的数据:关系型数据库、文本类型数据、HDFS大数据、虚拟数据库数据;算法库是一个如同容器一样的可以动态更新算法的部件;可视化图表包括2D图表和3D图表,用于对挖掘结果或者数据的直接展示。

Claims (5)

1.一种数据挖掘的方法,其特征在于:所述的方法是对部件资源采用树形组织结构进行组织;资源树采用自定义的树状数据结构并整体存储数据库,通过解释后得到具体的树状信息;由用户自定义执行流程;
所述的资源树使用B+树算法实现;子树记录着下层子树创建的时间、节点类型;叶子结点记录文件资源的创建时间、资源类型、节点类型、资源ID;树资源的信息通过持久化整体以二进制的形式存储在数据库。
2.根据权利要求1所述的数据挖掘的方法,树形组织结构,其特征在于:数据源、算法库、可视化图表和用户自定义创建的文件资源都以树的分支或者叶子节点的方式组织。
3.根据权利要求1所述的数据挖掘的方法,其特点在于:用户以拖拽的方式从资源树中选择流程环节部件,当所有或部分的部件都选择完成后,通过箭头连接完成执行流程顺序。
4.根据权利要求2所述的数据挖掘的方法,其特点在于:用户以拖拽的方式从资源树中选择流程环节部件,当所有或部分的部件都选择完成后,通过箭头连接完成执行流程顺序。
5.根据权利要求1至4任一项所述的数据挖掘的方法,其特点在于:所述方法的工作流程如下:
(1)、系统从数据库读取树结构;
(2)、根据读取的结果进行解释,得到一棵完整的资源树,并根据叶子结点查询相应资源的位置,生成json或者xml格式的数据返回到前台;
(3)、前台根据后台返回的json数据或者xml数据,把树形结构的组织数据展示出来,并且实现节点的折叠;
(4)、通过拖拽的选择方式,把组件放置面板,包括数据源组件、算法组件和可视化组件;
(5)、通过使用系统提供的箭头,把组件依次连接起来,系统按照所设置的参数依次执行流程,最后得到结果;
(6)、点击保存按钮后,资源树通过json格式或者xml格式返回,后台解释后存入数据库。
CN201710429062.8A 2017-06-08 2017-06-08 一种数据挖掘的方法 Pending CN108170696A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710429062.8A CN108170696A (zh) 2017-06-08 2017-06-08 一种数据挖掘的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710429062.8A CN108170696A (zh) 2017-06-08 2017-06-08 一种数据挖掘的方法

Publications (1)

Publication Number Publication Date
CN108170696A true CN108170696A (zh) 2018-06-15

Family

ID=62527281

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710429062.8A Pending CN108170696A (zh) 2017-06-08 2017-06-08 一种数据挖掘的方法

Country Status (1)

Country Link
CN (1) CN108170696A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110727729A (zh) * 2018-06-29 2020-01-24 贵州白山云科技股份有限公司 一种实现智能运算的方法及装置

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1341895A (zh) * 2000-09-05 2002-03-27 英业达股份有限公司 在网页上利用目录树进行快速分类浏览的方法
CN101483545A (zh) * 2008-12-31 2009-07-15 中国建设银行股份有限公司 一种金融业务监控方法及系统
US7757271B2 (en) * 2000-04-19 2010-07-13 Hewlett-Packard Development Company, L.P. Computer system security service
US7890877B2 (en) * 2003-02-27 2011-02-15 Oracle International Corporation Systems and methods for improved portal development
CN105550268A (zh) * 2015-12-10 2016-05-04 江苏曙光信息技术有限公司 大数据流程建模分析引擎
CN105976158A (zh) * 2016-04-26 2016-09-28 中国电子科技网络信息安全有限公司 一种可视化的etl流程管理与调度监控方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7757271B2 (en) * 2000-04-19 2010-07-13 Hewlett-Packard Development Company, L.P. Computer system security service
CN1341895A (zh) * 2000-09-05 2002-03-27 英业达股份有限公司 在网页上利用目录树进行快速分类浏览的方法
US7890877B2 (en) * 2003-02-27 2011-02-15 Oracle International Corporation Systems and methods for improved portal development
CN101483545A (zh) * 2008-12-31 2009-07-15 中国建设银行股份有限公司 一种金融业务监控方法及系统
CN105550268A (zh) * 2015-12-10 2016-05-04 江苏曙光信息技术有限公司 大数据流程建模分析引擎
CN105976158A (zh) * 2016-04-26 2016-09-28 中国电子科技网络信息安全有限公司 一种可视化的etl流程管理与调度监控方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110727729A (zh) * 2018-06-29 2020-01-24 贵州白山云科技股份有限公司 一种实现智能运算的方法及装置

Similar Documents

Publication Publication Date Title
US8677279B2 (en) Visual hierarchy explorer
US7409679B2 (en) System and method for computer-aided graph-based dependency analysis
US7502771B2 (en) Method, system and apparatus for generating decision trees integrated with petro-technical workflows
US20080163159A1 (en) System and method for extracting UML models from legacy applications
CN105095249B (zh) 一种生成多维度报表的方法
US20110307856A1 (en) Workflow visualization
US20060293939A1 (en) Design managing means, design tool and method for work breakdown structure
CN101313294A (zh) 图形节点的智能复制/粘贴
CN111079244B (zh) 一种基于行为树的分布式仿真平台
CN105808244A (zh) 一种基于工作流的动态数据可视化分析工具
CN109821242B (zh) 地图可视化编辑方法及其系统
CN109284152A (zh) 一种菜单可视化配置方法、设备及计算机可读存储介质
CN107480380B (zh) 一种基于模板的工程图纸生成方法
CN103413002A (zh) 一种拓扑图编辑后方法及拓扑图编辑器
CN108595604A (zh) 一种智能报表的数据可视化系统及方法
CN109002334A (zh) 一种运维平台及其数据处理方法
CN110083671A (zh) 一种可配置化管理的WebGIS系统
CN103927185A (zh) 基于能源管理的网络拓扑建模装置及其引导方法
CN108038547A (zh) 基于图形化的卫星遥测数据诊断规则编辑系统
Arruda et al. Towards a requirements engineering artefact model in the context of big data software development projects: Research in progress
Melo et al. Extracting and visualising tree-like structures from concept lattices
CN108170696A (zh) 一种数据挖掘的方法
CN107562763A (zh) 数据变化的显示方法及装置
CN103605806A (zh) 可配置的结构化数据组织方式的实现方法
CN111814438A (zh) 一种网络图的绘制系统及方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information

Address after: 19 / F, Cloud Computing Center, Chinese Academy of Sciences, No.1 Kehui Road, Songshanhu high tech Industrial Development Zone, Dongguan City, Guangdong Province, 523000

Applicant after: G-CLOUD TECHNOLOGY Co.,Ltd.

Address before: 523808 No. 14 Building, Songke Garden, Songshan Lake Science and Technology Industrial Park, Dongguan City, Guangdong Province

Applicant before: G-CLOUD TECHNOLOGY Co.,Ltd.

CB02 Change of applicant information
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20180615

WD01 Invention patent application deemed withdrawn after publication