CN109241135B - 一种智能抽取数据的挖掘系统 - Google Patents

一种智能抽取数据的挖掘系统 Download PDF

Info

Publication number
CN109241135B
CN109241135B CN201810968040.3A CN201810968040A CN109241135B CN 109241135 B CN109241135 B CN 109241135B CN 201810968040 A CN201810968040 A CN 201810968040A CN 109241135 B CN109241135 B CN 109241135B
Authority
CN
China
Prior art keywords
data
module
extraction
mining
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810968040.3A
Other languages
English (en)
Other versions
CN109241135A (zh
Inventor
程杰
李大鹏
吴闪闪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hainan Changhang Technology Co.,Ltd.
Original Assignee
Wonder Software Wuhan Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wonder Software Wuhan Co ltd filed Critical Wonder Software Wuhan Co ltd
Priority to CN201810968040.3A priority Critical patent/CN109241135B/zh
Publication of CN109241135A publication Critical patent/CN109241135A/zh
Application granted granted Critical
Publication of CN109241135B publication Critical patent/CN109241135B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种智能抽取数据的挖掘系统,包括系统管理模块,所述系统管理模块与多通道数据分类抽取系统实现双向连接,所述多通道数据分类抽取系统包括时间数据分类抽取模块、数据格式分类抽取模块和数据大小分类抽取模块,所述时间数据分类抽取模块的输出端与数据格式分类抽取模块的输入端连接,且数据格式分类抽取模块的输出端与数据大小分类抽取模块的输入端连接,涉及数据挖掘技术领域。该智能抽取数据的挖掘系统,可实现对需要抽取的数据进行多通道分类抽取,很好的达到了增加数据抽取的针对性和准确性的目的,实现了方便用户能够更加快捷、更加精确的得到所需数据,从而大大方便了用户的数据挖掘工作。

Description

一种智能抽取数据的挖掘系统
技术领域
本发明涉及数据挖掘技术领域,具体为一种智能抽取数据的挖掘系统。
背景技术
数据挖掘是从大量的、不完全的、有噪声的、模糊的、随机的实际数据中,提取隐含在其中的、人们所不知道的、但又是潜在有用信息和知识的过程,数据挖掘是一种崭新的商业信息处理技术,其主要特点是对商业数据库中的大量业务数据进行抽取、转化、分析和模式化处理,从中提取辅助商业决策的关键知识,其中数据抽取是数据挖掘里最为重要的一项,数据抽取是指从源数据系统的数据库抽取数据,并将数据加载到目标系统中去以满足后续的各类数据应用的过程,实际应用中,数据源较多采用的是关系数据库,从数据库中抽取数据一般有以下几种方式,一、全量抽取:全量抽取类似于数据迁移或数据复制,它将数据源中的表或视图的数据原封不动的从数据库中抽取出来,并转换成自己的ETL工具可以识别的格式,全量抽取比较简单,二、增量抽取:增量抽取指抽取自上次抽取以来数据库中要抽取的表中新增、修改、删除的数据,在ETL使用过程中,增量抽取较全量抽取应用更广,如何捕获变化的数据是增量抽取的关键,对捕获方法一般有两点要求:准确性,能够将业务系统中的变化数据准确地捕获到性能,尽量减少对业务系统造成太大的压力,影响现有业务。
目前的数据挖掘的数据抽取过程中,大多直接进行数据抽取,然而,这样的数据抽取方式不能实现对需要抽取的数据进行多通道分类抽取,无法达到增加数据抽取的针对性和准确性的目的,不能实现方便用户能够更加快捷、更加精确的得到所需数据,从而给用户的数据挖掘工作带来了极大的不便。
发明内容
(一)解决的技术问题
针对现有技术的不足,本发明提供了一种智能抽取数据的挖掘系统,解决了现有的数据抽取方式不能实现对需要抽取的数据进行多通道分类抽取,无法达到增加数据抽取的针对性和准确性的目的,不能实现方便用户能够更加快捷、更加精确的得到所需数据,从而给用户的数据挖掘工作带来了极大不便的问题。
(二)技术方案
为实现以上目的,本发明通过以下技术方案予以实现:一种智能抽取数据的挖掘系统,包括系统管理模块,所述系统管理模块与多通道数据分类抽取系统实现双向连接,所述多通道数据分类抽取系统包括时间数据分类抽取模块、数据格式分类抽取模块和数据大小分类抽取模块,所述时间数据分类抽取模块的输出端与数据格式分类抽取模块的输入端连接,且数据格式分类抽取模块的输出端与数据大小分类抽取模块的输入端连接,所述系统管理模块与联网大数据库实现双向连接,且联网大数据库与多通道数据分类抽取系统实现双向连接。
优选的,所述系统管理模块与抽取对象输入单元实现双向连接,且抽取对象输入单元的输出端与抽取对象转化模块的输入端连接,所述抽取对象转化模块与习惯管理模块实现双向连接。
优选的,所述抽取对象输入单元包括抽取内容输入模块、抽取限定条件输入模块和信息输入确认模块,所述抽取内容输入模块的输出端与抽取限定条件输入模块的输入端连接,且抽取限定条件输入模块的输出端与信息输入确认模块的输入端连接。
优选的,所述系统管理模块与卷积神经网络智能识别模块实现双向连接,且卷积神经网络智能识别模块的输入端与抽取对象转化模块的输出端连接,所述卷积神经网络智能识别模块与联网大数据库实现双向连接。
优选的,所述系统管理模块与大数据更新模块实现双向连接,且系统管理模块与数据挖掘系统实现双向连接。
优选的,所述数据挖掘系统包括数据解析模块、数据挖掘报表生成模块和数据挖掘报表打印模块,所述数据解析模块的输出端与数据挖掘报表生成模块的输入端连接,且数据挖掘报表生成模块的输出端与数据挖掘报表打印模块的输入端连接。
优选的,所述系统管理模块与抽取数据显示模块实现双向连接。
优选的,所述系统管理模块与系统安全检测维护模块实现双向连接。
(三)有益效果
本发明提供了一种智能抽取数据的挖掘系统。与现有技术相比具备以下
有益效果:
(1)、该智能抽取数据的挖掘系统,通过在系统管理模块与多通道数据分类抽取系统实现双向连接,且多通道数据分类抽取系统包括时间数据分类抽取模块、数据格式分类抽取模块和数据大小分类抽取模块,再分别通过联网大数据库、抽取对象转化模块和卷积神经网络智能识别模块的配合设置,可实现对需要抽取的数据进行多通道分类抽取,很好的达到了增加数据抽取的针对性和准确性的目的,实现了方便用户能够更加快捷、更加精确的得到所需数据,从而大大方便了用户的数据挖掘工作。
(2)、该智能抽取数据的挖掘系统,通过在系统管理模块与抽取对象输入单元实现双向连接,再通过抽取对象输入单元包括抽取内容输入模块、抽取限定条件输入模块和信息输入确认模块,可方便用户将需要抽取的数据特征和抽取数据约束条件输入抽取系统内,从而实现对特定数据的抽取。
(3)、该智能抽取数据的挖掘系统,通过在系统管理模块与数据挖掘系统实现双向连接,再通过数据挖掘系统包括数据解析模块、数据挖掘报表生成模块和数据挖掘报表打印模块,可实现对抽取的数据进行很好的解析和挖掘,从而实现对挖掘数据的很好利用。
附图说明
图1为本发明系统的结构原理框图;
图2为本发明数据挖掘系统的结构原理框图;
图3为本发明抽取对象输入单元的结构原理框图。
图中,1系统管理模块、2多通道数据分类抽取系统、21时间数据分类抽取模块、22数据格式分类抽取模块、23数据大小分类抽取模块、3联网大数据库、4抽取对象输入单元、41抽取内容输入模块、42抽取限定条件输入模块、43信息输入确认模块、5抽取对象转化模块、6卷积神经网络智能识别模块、7大数据更新模块、8数据挖掘系统、81数据解析模块、82数据挖掘报表生成模块、83数据挖掘报表打印模块、9抽取数据显示模块、10系统安全检测维护模块。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图1-3,本发明实施例提供一种技术方案:一种智能抽取数据的挖掘系统,包括系统管理模块1,系统管理模块1与卷积神经网络智能识别模块6实现双向连接,卷积神经网络智能识别模块6可实现对数据进行一维或二维识别,且卷积神经网络智能识别模块6的输入端与抽取对象转化模块5的输出端连接,卷积神经网络智能识别模块6与联网大数据库3实现双向连接,系统管理模块1与大数据更新模块7实现双向连接,大数据更新模块7可进行实时数据更新,且系统管理模块1与数据挖掘系统8实现双向连接,系统管理模块1与抽取数据显示模块9实现双向连接,系统管理模块1与系统安全检测维护模块10实现双向连接,系统安全检测维护模块10可对系统进行很好的安全检测和维护,系统管理模块1与多通道数据分类抽取系统2实现双向连接,多通道数据分类抽取系统2包括时间数据分类抽取模块21、数据格式分类抽取模块22和数据大小分类抽取模块23,时间数据分类抽取模块21的输出端与数据格式分类抽取模块22的输入端连接,且数据格式分类抽取模块22的输出端与数据大小分类抽取模块23的输入端连接,系统管理模块1与联网大数据库3实现双向连接,且联网大数据库3与多通道数据分类抽取系统2实现双向连接,系统管理模块1与抽取对象输入单元4实现双向连接,且抽取对象输入单元4的输出端与抽取对象转化模块5的输入端连接,抽取对象转化模块5与习惯管理模块1实现双向连接,抽取对象输入单元4包括抽取内容输入模块41、抽取限定条件输入模块42和信息输入确认模块43,抽取内容输入模块41的输出端与抽取限定条件输入模块42的输入端连接,且抽取限定条件输入模块42的输出端与信息输入确认模块43的输入端连接,数据挖掘系统8包括数据解析模块81、数据挖掘报表生成模块82和数据挖掘报表打印模块83,数据解析模块81的输出端与数据挖掘报表生成模块82的输入端连接,且数据挖掘报表生成模块82的输出端与数据挖掘报表打印模块83的输入端连接。
使用时,首先用户可通过抽取对象输入单元4内的抽取内容输入模块41和抽取限定条件输入模块42,将需要抽取数据的检索头序列和抽取数据的限定条件输入到系统内,然后信息输入确认模块43确认输入结果后,将输入的数据抽取内容和限定条件传送至抽取对象转化模块5内进行数据转化,之后将转化的数据信息传送至卷积神经网络智能识别模块6内,系统管理模块1可控制卷积神经网络智能识别模块6对接收的数据进行一维或二维的卷积神经识别,内并根据识别结果向联网大数据库3内进行数据检索,当检索到所需的范围数据集群时,系统管理模块1可控制多通道数据分类抽取系统2内的时间数据分类抽取模块21、数据格式分类抽取模块22和数据大小分类抽取模块23分别对抽取的数据进行时间、格式和数据大小进行分类抽取,从而实现快速锁定用户所需的抽取数据,之后系统管理模块1可将抽取的数据传送至数据挖掘系统8内,并控制数据挖掘系统8内的数据解析模块81先对抽取的数据进行解析,再通过数据挖掘报表生成模块82快速生成挖掘报表,之后通过数据挖掘报表打印模块83进行打印,同时将挖掘信息传送至系统管理模块1内,系统管理模块1再将数据信息传送至抽取数据显示模块9进行显示,同时系统管理模块1可控制大数据更新模块7对联网大数据库进行实时更新,并控制系统安全检测维护模块10对整个系统进行安全检测和维护,这样就完成了该智能抽取数据的挖掘系统的整个工作过程。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。

Claims (8)

1.一种智能抽取数据的挖掘系统,包括系统管理模块(1)、抽取对象输入单元(4)、抽取对象转化模块(5)、卷积神经网络智能识别模块(6)、大数据更新模块(7)、数据挖掘系统(8)、抽取数据显示模块(9)和系统安全检测维护模块(10),其特征在于:所述系统管理模块(1)与多通道数据分类抽取系统(2)实现双向连接,所述多通道数据分类抽取系统(2)包括时间数据分类抽取模块(21)、数据格式分类抽取模块(22)和数据大小分类抽取模块(23),所述时间数据分类抽取模块(21)的输出端与数据格式分类抽取模块(22)的输入端连接,且数据格式分类抽取模块(22)的输出端与数据大小分类抽取模块(23)的输入端连接,所述系统管理模块(1)与联网大数据库(3)实现双向连接,且联网大数据库(3)与多通道数据分类抽取系统(2)实现双向连接,所述抽取对象输入单元(4)包括抽取内容输入模块(41)、抽取限定条件输入模块(42)和信息输入确认模块(43),且数据挖掘系统(8)包括数据解析模块(81)、数据挖掘报表生成模块(82)和数据挖掘报表打印模块(83);
使用时,首先通过抽取对象输入单元(4)内的抽取内容输入模块(41)和抽取限定条件输入模块(42),将需要抽取数据的检索头序列和抽取数据的限定条件输入到系统内,然后信息输入确认模块(43)确认输入结果后,将输入的数据抽取内容和限定条件传送至抽取对象转化模块(5)内进行数据转化,之后将转化的数据信息传送至卷积神经网络智能识别模块(6)内,系统管理模块(1)控制卷积神经网络智能识别模块(6)对接收的数据进行一维或二维的卷积神经识别,并根据识别结果向联网大数据库(3)内进行数据检索,当检索到所需的范围数据集群时,系统管理模块(1)控制多通道数据分类抽取系统(2)内的时间数据分类抽取模块(21)、数据格式分类抽取模块(22)和数据大小分类抽取模块(23)分别对抽取的数据进行时间、格式和数据大小进行分类抽取,从而实现快速锁定用户所需的抽取数据,之后系统管理模块(1)将抽取的数据传送至数据挖掘系统(8)内,并控制数据挖掘系统(8)内的数据解析模块(81)先对抽取的数据进行解析,再通过数据挖掘报表生成模块(82)快速生成挖掘报表,之后通过数据挖掘报表打印模块(83)进行打印,同时将挖掘信息传送至系统管理模块(1)内,系统管理模块(1)再将数据信息传送至抽取数据显示模块(9)进行显示,同时系统管理模块(1)控制大数据更新模块(7)对联网大数据库(3)进行实时更新,并控制系统安全检测维护模块(10)对整个系统进行安全检测和维护。
2.根据权利要求1所述的一种智能抽取数据的挖掘系统,其特征在于:所述系统管理模块(1)与抽取对象输入单元(4)实现双向连接,且抽取对象输入单元(4)的输出端与抽取对象转化模块(5)的输入端连接,所述抽取对象转化模块(5)与习惯管理模块(1)实现双向连接。
3.根据权利要求2所述的一种智能抽取数据的挖掘系统,其特征在于:所述抽取内容输入模块(41)的输出端与抽取限定条件输入模块(42)的输入端连接,且抽取限定条件输入模块(42)的输出端与信息输入确认模块(43)的输入端连接。
4.根据权利要求1所述的一种智能抽取数据的挖掘系统,其特征在于:所述系统管理模块(1)与卷积神经网络智能识别模块(6)实现双向连接,且卷积神经网络智能识别模块(6)的输入端与抽取对象转化模块(5)的输出端连接,所述卷积神经网络智能识别模块(6)与联网大数据库(3)实现双向连接。
5.根据权利要求1所述的一种智能抽取数据的挖掘系统,其特征在于:所述系统管理模块(1)与大数据更新模块(7)实现双向连接,且系统管理模块(1)与数据挖掘系统(8)实现双向连接。
6.根据权利要求5所述的一种智能抽取数据的挖掘系统,其特征在于:所述数据解析模块(81)的输出端与数据挖掘报表生成模块(82)的输入端连接,且数据挖掘报表生成模块(82)的输出端与数据挖掘报表打印模块(83)的输入端连接。
7.根据权利要求1所述的一种智能抽取数据的挖掘系统,其特征在于:所述系统管理模块(1)与抽取数据显示模块(9)实现双向连接。
8.根据权利要求1所述的一种智能抽取数据的挖掘系统,其特征在于:所述系统管理模块(1)与系统安全检测维护模块(10)实现双向连接。
CN201810968040.3A 2018-08-23 2018-08-23 一种智能抽取数据的挖掘系统 Active CN109241135B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810968040.3A CN109241135B (zh) 2018-08-23 2018-08-23 一种智能抽取数据的挖掘系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810968040.3A CN109241135B (zh) 2018-08-23 2018-08-23 一种智能抽取数据的挖掘系统

Publications (2)

Publication Number Publication Date
CN109241135A CN109241135A (zh) 2019-01-18
CN109241135B true CN109241135B (zh) 2021-03-05

Family

ID=65069487

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810968040.3A Active CN109241135B (zh) 2018-08-23 2018-08-23 一种智能抽取数据的挖掘系统

Country Status (1)

Country Link
CN (1) CN109241135B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114201238B (zh) * 2022-02-16 2022-05-10 深圳市紫川软件有限公司 一种基于大数据的智慧企业软件组件管理系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103473360A (zh) * 2013-09-26 2013-12-25 浪潮齐鲁软件产业有限公司 一种大数据智能抽取的管理方法
CN104361060A (zh) * 2014-10-31 2015-02-18 广东工业大学 一种应用于制造物联网的数据挖掘方法及系统
CN106649329A (zh) * 2015-10-30 2017-05-10 深圳市华威世纪科技股份有限公司 一种安全生产大数据挖掘系统
CN107436902A (zh) * 2016-05-27 2017-12-05 北京京东尚科信息技术有限公司 基于海量数据的数据抽取方法和系统

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8117143B2 (en) * 2004-05-28 2012-02-14 Intel Corporation Using affinity measures with supervised classifiers
US7475335B2 (en) * 2004-11-03 2009-01-06 International Business Machines Corporation Method for automatically and dynamically composing document management applications
CN107679183B (zh) * 2017-09-29 2020-11-06 百度在线网络技术(北京)有限公司 分类器用训练数据获取方法和装置、服务器及存储介质

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103473360A (zh) * 2013-09-26 2013-12-25 浪潮齐鲁软件产业有限公司 一种大数据智能抽取的管理方法
CN104361060A (zh) * 2014-10-31 2015-02-18 广东工业大学 一种应用于制造物联网的数据挖掘方法及系统
CN106649329A (zh) * 2015-10-30 2017-05-10 深圳市华威世纪科技股份有限公司 一种安全生产大数据挖掘系统
CN107436902A (zh) * 2016-05-27 2017-12-05 北京京东尚科信息技术有限公司 基于海量数据的数据抽取方法和系统

Also Published As

Publication number Publication date
CN109241135A (zh) 2019-01-18

Similar Documents

Publication Publication Date Title
CN106779581A (zh) 一种人力资源管理系统
CN105117833A (zh) 一种工程项目现场管理用pda应用系统
CN104679827A (zh) 一种基于大数据的公开信息关联方法及挖掘引擎
CN108195423A (zh) 一种工程监测数据一体化系统及方法
CN105095479A (zh) 一种移动终端及其实现照片分类管理的方法
CN111737549B (zh) 一种经济指标智能分析系统
CN109241135B (zh) 一种智能抽取数据的挖掘系统
CN108959645A (zh) 一种政策法规收集分析系统
CN106713859A (zh) 一种图片视觉监控搜索系统及其搜索方法
CN116506196A (zh) 一种基于大数据的通信检测预警平台
CN201247234Y (zh) 一种食物中毒调查及智能分析装置及系统
CN112598142A (zh) 一种风电机组检修工作质量审查辅助方法与系统
CN110659277A (zh) 一种能源互联网数据采集方法及装置
CN202679425U (zh) 具有数据采集功能和数据同步处理功能的系统
CN202282008U (zh) 基于二维码的设备巡视管理装置
CN107122498A (zh) 基于云计算的信息检索分类系统及方法
CN109783681B (zh) 一种农产品价格信息采集及处理装置和方法
CN106528644A (zh) 一种遥感数据的检索方法及装置
CN110489311B (zh) 自动检测电脑用户行为及自动更新检测模型的方法和系统
CN111077861A (zh) 一种智慧工厂的远程运维系统
CN110727427A (zh) 调度自动化主站模型安全智能校核方法
CN214098164U (zh) 一种密集架的语音识别操作控制系统
CN115841312B (zh) 用于企业管理文件数据实时采集分析系统及其采集终端
CN112925847B (zh) 一种针对区块链的数据处理与网络分析工具
CN115269692A (zh) 一种智能增强数据分析方法、系统、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CP03 Change of name, title or address

Address after: 210000 8 Huyue East Road, Longchi street, Liuhe District, Nanjing City, Jiangsu Province

Patentee after: Haizhida network technology (Nanjing) Co.,Ltd.

Address before: Room a206-1, standard workshop, building 1, Wuhan great wall innovation and Technology Park, Tangxun Hubei Road, Donghu New Technology Development Zone, Wuhan City, Hubei Province, 430000

Patentee before: WONDER SOFTWARE (WUHAN) Co.,Ltd.

CP03 Change of name, title or address
TR01 Transfer of patent right

Effective date of registration: 20220720

Address after: 571900 5001, 2nd floor, building A17, Hainan Ecological Software Park, high tech Industrial Demonstration Zone, old town, Chengmai County, Hainan Province

Patentee after: Hainan Changhang Technology Co.,Ltd.

Address before: 210000 8 Huyue East Road, Longchi street, Liuhe District, Nanjing City, Jiangsu Province

Patentee before: Haizhida network technology (Nanjing) Co.,Ltd.

TR01 Transfer of patent right