CN113515558B

CN113515558B - 基于推理技术的数据挖掘的方法

Info

Publication number: CN113515558B
Application number: CN202110726652.3A
Authority: CN
Inventors: 祖玉宁
Original assignee: Shanghai Sesns Network Technology Co ltd
Current assignee: Shanghai Sesns Network Technology Co ltd
Priority date: 2021-06-29
Filing date: 2021-06-29
Publication date: 2024-03-22
Anticipated expiration: 2041-06-29
Also published as: CN113515558A

Abstract

本发明属于推理技术的数据挖掘技术领域，尤其涉及基于推理技术的数据挖掘的方法，设立数据库云盘，将数据库云盘设置自动收集模块、分拣模块和加密模块，通过数据库云盘的自动收集模块自动在全网自动收集需要挖掘的数据相关信息，收集好的相关数据通过分拣模块进行快速的分类和识别，分拣模块将根据日期时间和数据种类进行快速的分类。该基于推理技术的数据挖掘的方法，能够通过建立数据库初期，通过自动收集模块、分拣模块、加密模块、展示模块、删改模块、恢复模块、屏蔽模块、分类模块和识别模块，就能对手机的数据进行初步的挖掘和整理，便于后期在收集数据的基础上进行挖掘，能够有效的初步达到数据挖掘结果针对性好的目的。

Description

基于推理技术的数据挖掘的方法

技术领域

本发明涉及推理技术的数据挖掘技术领域，具体为基于推理技术的数据挖掘的方法。

背景技术

需要是发明之母。近年来，数据挖掘引起了信息产业界的极大关注，其主要原因是存在大量数据，可以广泛使用，并且迫切需要将这些数据转换成有用的信息和知识。获取的信息和知识可以广泛用于各种应用，包括商务管理，生产控制，市场分析，工程设计和科学探索等。

数据挖掘是人工智能和数据库领域研究的热点问题，所谓数据挖掘是指从数据库的大量数据中揭示出隐含的、先前未知的并有潜在价值的信息的非平凡过程。数据挖掘是一种决策支持过程，它主要基于人工智能、机器学习、模式识别、统计学、数据库、可视化技术等，高度自动化地分析企业的数据，作出归纳性的推理，从中挖掘出潜在的模式，帮助决策者调整市场策略，减少风险，作出正确的决策。知识发现过程由以下三个阶段组成：数据准备；数据挖掘；结果表达和解释。数据挖掘可以与用户或知识库交互。

现有的数据挖掘结果针对性较差，不能在根据关键的数据得到关键的结构，只能得到相对应的数据，需要进行人工检索和筛选，效率较低，且得到的关键数据，不一定为最终的挖掘结果，因此需要进行改进。

发明内容

本发明的目的在于提供基于推理技术的数据挖掘的方法，以解决上述背景技术中提出的问题。

为实现上述目的，本发明提供如下技术方案：基于推理技术的数据挖掘的方法，包括以下步骤：

S1、构建数据库

设立数据库云盘，将数据库云盘设置自动收集模块、分拣模块和加密模块，通过数据库云盘的自动收集模块自动在全网自动收集需要挖掘的数据相关信息，收集好的相关数据通过分拣模块进行快速的分类和识别，分拣模块将根据日期时间和数据种类进行快速的分类，分类完成后分拣模块将分类好的数据中无效、错误和不能使用的数据进行删除和修改，从而再通过加密模块将处理后的数据进行快速的加密最终储存在数据库内。

S2、检索初步挖掘数据

进行挖掘数据输时，根据提供的第一关键数据和第二关键数据在数据库内进行检索，从而根据数据库提供的相关联的数据进行初步的筛选，筛选后得到的初步挖掘出来的数据，建立权重积分模型，根据权重积分模型得到相对重要的关键数据。

S3、挖掘处理数据

根据步骤S2中得到的关键数据将其通过MapReduce处理，通过指定关键输用来处理键值对(Key/Value)的map函数来生成一个中间键值对集合，然后，再指定一个reduce函数，它用来合并所有的具有相同中间key的中间value，得到相应的数据处理结果。

S4、推理挖掘数据

根据步骤S3作用得到的MapReduce处理数据处理结果，在通过步骤S2从而数据库内得到一个反向的关键数据，在将得到的反向的关键数据输入到步骤S3中进行MapReduce处理得到一个相应的反向数据处理结果，将得到的数据和反向数据建立一个中心图形和周边图形元素，根据得到的中心图形元素和周边图形元素进行分析，从而得到最终推理的数据，即为最终需要挖掘的数据。

S5、知识图谱推理

对数据壳内的数据建立正常的正向数据检索挖掘和反向的反向数据挖掘，在正向数据检索挖掘过程中，通过正向数据推理数据挖掘和反向符号推理挖掘，对数据建立双向的推理挖掘，当数据挖掘到后结束，当数据没有挖掘到查找出问题，进行排难处理并同时解决困难，困难解决后如果数据正常挖掘到后结束，在反向数据检索挖掘过程中，通过反向数据推理和反向子模块推理对数据进行挖掘，反向数据挖掘到将其移动至正向数据检索挖掘，从而得到挖掘数据并结束，未挖掘到查找出问题，进行排难处理并同时解决困难，从而挖掘出数据并结束。

S6、建模

根据特征变量库构建特征变量宽表，进行同质性检查，再对特征变量变量过滤，过滤完成后进行变量粗选，然后进行WOE/IV计算、相关性计算和PSI计算，同时可以直接根据特征变量宽表进行计算，计算得到的结果进行筛选，筛选后得到建模宽表，再根据建模宽表进行样本排除，排出后通过变量分箱，再根据变量分箱进行模型训练和自动模型生成。

优选的，所述步骤S1中数据库为百度云盘和阿里云盘，设立的输云盘在自动收集模块、分拣模块和加密模块基础上增设有删改模块、恢复模块、屏蔽模块和展示模块，且展示模块对应加密模块设置有解密模块，分拣模块设置有分类模块和识别模块。

优选的，所述数据发射端信号连接有自动收集模块、分拣模块和加密模块接收端，所述分拣模块发射端信号连接有识别模块和分类模块接收端，所述数据库发射端信号连接有展示模块、删改模块、恢复模块和屏蔽模块接收端，所述展示模块发射端信号连接有解密模块接收端。

优选的，所述解密模块发射端信号连接有加密模块接收端，所述删改模块、恢复模块和屏蔽模块发射端信号连接有分拣模块。

优选的，所述数据库通过以太网和交换机信号连接有自动收集模块、分拣模块、加密模块、展示模块、删改模块、恢复模块、屏蔽模块、分类模块和识别模块，且数据库信号连接有单片机和处理器。

优选的，所述步骤S2中，第一关键数据和第二关键数据为随机指定的数据，且针对检索挖掘数据在数据库上增设有检索模块。

优选的，所述步骤S3中，MapReduce能够允许提供一个可选的Combiner函数，在数据通过网络发送之前，可以通过该函数将数据进行部分合并，得到最终的数据处理结果。

优选的，所述步骤S4中，在设定的一个反向数据不能得到最终有效的数据时，可以通过设置多个反向数据，进行步骤S2从而数据库内得到多个反向的关键数据，在将得到的反向的关键数据输入到步骤S3中进行MapReduce处理得到多个相应的反向数据处理结果，最终进行比较，得到有效的挖掘数据。

与现有技术相比，本发明的有益效果是：

1、该基于推理技术的数据挖掘的方法，能够通过建立数据库初期，通过自动收集模块、分拣模块、加密模块、展示模块、删改模块、恢复模块、屏蔽模块、分类模块和识别模块，就能对手机的数据进行初步的挖掘和整理，便于后期在收集数据的基础上进行挖掘，能够有效的初步达到数据挖掘结果针对性好的目的。

2、该基于推理技术的数据挖掘的方法，通过检索模块，进行初步挖掘，能够在建立权重积分模型，根据权重积分模型得到相对重要的关键数据，进一步对数据进行了针对性的准确挖掘，有效的避免了后期的需要人工的检索和筛选，达到了效率高的目的。

3、该基于推理技术的数据挖掘的方法，通过推理挖掘数据，能够通过不同的方向在数据库内得到关键数据，在将得到的关键数据输入到步骤S3中进行MapReduce处理得到一个相应的反向数据处理结果，将得到的不同数据建立一个中心图形和周边图形元素，根据得到的中心图形元素和周边图形元素进行分析来得到最终挖掘的数据，能够达到得到的数据为最终的挖掘结果的目的。

附图说明

图1为本发明流程示意图；

图2为步骤S1和S2中模块流程示意图；

图3为推理知识图谱；

图4为建模流程图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

请参阅图1-4，本发明提供技术方案：基于推理技术的数据挖掘的方法，包括以下步骤：

S1、构建数据库

设立数据库云盘，将数据库云盘设置自动收集模块、分拣模块和加密模块，通过数据库云盘的自动收集模块自动在全网自动收集需要挖掘的数据相关信息，收集好的相关数据通过分拣模块进行快速的分类和识别，分拣模块将根据日期时间和数据种类进行快速的分类，分类完成后分拣模块将分类好的数据中无效、错误和不能使用的数据进行删除和修改，从而再通过加密模块将处理后的数据进行快速的加密最终储存在数据库内，数据库为百度云盘和阿里云盘，设立的输云盘在自动收集模块、分拣模块和加密模块基础上增设有删改模块、恢复模块、屏蔽模块和展示模块，且展示模块对应加密模块设置有解密模块，分拣模块设置有分类模块和识别模块，数据发射端信号连接有自动收集模块、分拣模块和加密模块接收端，所述分拣模块发射端信号连接有识别模块和分类模块接收端，所述数据库发射端信号连接有展示模块、删改模块、恢复模块和屏蔽模块接收端，所述展示模块发射端信号连接有解密模块接收端，解密模块发射端信号连接有加密模块接收端，所述删改模块、恢复模块和屏蔽模块发射端信号连接有分拣模块，数据库通过以太网和交换机信号连接有自动收集模块、分拣模块、加密模块、展示模块、删改模块、恢复模块、屏蔽模块、分类模块和识别模块，且所述数据库信号连接有单片机和处理器。

S2、检索初步挖掘数据

进行挖掘数据输时，根据提供的第一关键数据和第二关键数据在数据库内进行检索，从而根据数据库提供的相关联的数据进行初步的筛选，筛选后得到的初步挖掘出来的数据，建立权重积分模型，根据权重积分模型得到相对重要的关键数据，第一关键数据和第二关键数据为随机指定的数据，且针对检索挖掘数据在数据库上增设有检索模块。

S3、挖掘处理数据

根据步骤S2中得到的关键数据将其通过MapReduce处理，通过指定关键输用来处理键值对(Key/Value)的map函数来生成一个中间键值对集合，然后，再指定一个reduce函数，它用来合并所有的具有相同中间key的中间value，得到相应的数据处理结果，MapReduce能够允许提供一个可选的Combiner函数，在数据通过网络发送之前，可以通过该函数将数据进行部分合并，得到最终的数据处理结果。

S4、推理挖掘数据

根据步骤S3作用得到的MapReduce处理数据处理结果，在通过步骤S2从而数据库内得到一个反向的关键数据，在将得到的反向的关键数据输入到步骤S3中进行MapReduce处理得到一个相应的反向数据处理结果，将得到的数据和反向数据建立一个中心图形和周边图形元素，根据得到的中心图形元素和周边图形元素进行分析，从而得到最终推理的数据，即为最终需要挖掘的数据，在设定的一个反向数据不能得到最终有效的数据时，可以通过设置多个反向数据，进行步骤S2从而数据库内得到多个反向的关键数据，在将得到的反向的关键数据输入到步骤S3中进行MapReduce处理得到多个相应的反向数据处理结果，最终进行比较，得到有效的挖掘数据。

S5、知识图谱推理

S6、建模

该基于推理技术的数据挖掘的方法，能够通过建立数据库初期，通过自动收集模块、分拣模块、加密模块、展示模块、删改模块、恢复模块、屏蔽模块、分类模块和识别模块，就能对手机的数据进行初步的挖掘和整理，便于后期在收集数据的基础上进行挖掘，能够有效的初步达到数据挖掘结果针对性好的目的，通过检索模块，进行初步挖掘，能够在建立权重积分模型，根据权重积分模型得到相对重要的关键数据，进一步对数据进行了针对性的准确挖掘，有效的避免了后期的需要人工的检索和筛选，达到了效率高的目的，通过推理挖掘数据，能够通过不同的方向在数据库内得到关键数据，在将得到的关键数据输入到步骤S3中进行MapReduce处理得到一个相应的反向数据处理结果，将得到的不同数据建立一个中心图形和周边图形元素，根据得到的中心图形元素和周边图形元素进行分析来得到最终挖掘的数据，能够达到得到的数据为最终的挖掘结果的目的。

需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。

最后应说明的是：以上所述仅为本发明的优选实施例而已，并不用于限制本发明，尽管参照前述实施例对本发明进行了详细的说明，对于本领域的技术人员来说，其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.基于推理技术的数据挖掘的方法，其特征在于，包括以下步骤：

S1、构建数据库

设立数据库云盘，将数据库云盘设置自动收集模块、分拣模块和加密模块，通过数据库云盘的自动收集模块自动在全网自动收集需要挖掘的数据相关信息，收集好的相关数据通过分拣模块进行快速的分类和识别，分拣模块将根据日期时间和数据种类进行快速的分类，分类完成后分拣模块将分类好的数据中无效、错误和不能使用的数据进行删除和修改，从而再通过加密模块将处理后的数据进行快速的加密最终储存在数据库内；

S2、检索初步挖掘数据

进行挖掘数据输时，根据提供的第一关键数据和第二关键数据在数据库内进行检索，从而根据数据库提供的相关联的数据进行初步的筛选，筛选后得到的初步挖掘出来的数据，建立权重积分模型，根据权重积分模型得到相对重要的关键数据；

S3、挖掘处理数据

根据步骤S2中得到的关键数据将其通过MapReduce处理，通过指定关键输用来处理键值对(Key/Value)的map函数来生成一个中间键值对集合，然后，再指定一个reduce函数，它用来合并所有的具有相同中间key的中间value，得到相应的数据处理结果；

S4、推理挖掘数据

根据步骤S3作用得到的MapReduce处理数据处理结果，在通过步骤S2从而数据库内得到一个反向的关键数据，在将得到的反向的关键数据输入到步骤S3中进行MapReduce处理得到一个相应的反向数据处理结果，将得到的数据和反向数据建立一个中心图形和周边图形元素，根据得到的中心图形元素和周边图形元素进行分析，从而得到最终推理的数据，即为最终需要挖掘的数据；

S5、知识图谱推理

对数据壳内的数据建立正常的正向数据检索挖掘和反向的反向数据挖掘，在正向数据检索挖掘过程中，通过正向数据推理数据挖掘和反向符号推理挖掘，对数据建立双向的推理挖掘，当数据挖掘到后结束，当数据没有挖掘到查找出问题，进行排难处理并同时解决困难，困难解决后如果数据正常挖掘到后结束，在反向数据检索挖掘过程中，通过反向数据推理和反向子模块推理对数据进行挖掘，反向数据挖掘到将其移动至正向数据检索挖掘，从而得到挖掘数据并结束，未挖掘到查找出问题，进行排难处理并同时解决困难，从而挖掘出数据；

S6、建模

2.根据权利要求1所述的基于推理技术的数据挖掘的方法，其特征在于：所述步骤S1中数据库为百度云盘和阿里云盘，设立的输云盘在自动收集模块、分拣模块和加密模块基础上增设有删改模块、恢复模块、屏蔽模块和展示模块，且展示模块对应加密模块设置有解密模块，分拣模块设置有分类模块和识别模块。

3.根据权利要求2所述的基于推理技术的数据挖掘的方法，其特征在于：所述数据库发射端信号连接有自动收集模块、分拣模块和加密模块接收端，所述分拣模块发射端信号连接有识别模块和分类模块接收端，所述数据库发射端信号连接有展示模块、删改模块、恢复模块和屏蔽模块接收端，所述展示模块发射端信号连接有解密模块接收端。

4.根据权利要求3所述的基于推理技术的数据挖掘的方法，其特征在于：所述解密模块发射端信号连接有加密模块接收端，所述删改模块、恢复模块和屏蔽模块发射端信号连接有分拣模块。

5.根据权利要求3所述的基于推理技术的数据挖掘的方法，其特征在于：所述数据库通过以太网和交换机信号连接有自动收集模块、分拣模块、加密模块、展示模块、删改模块、恢复模块、屏蔽模块、分类模块和识别模块，且数据库信号连接有单片机和处理器。

6.根据权利要求1所述的基于推理技术的数据挖掘的方法，其特征在于：所述步骤S2中，第一关键数据和第二关键数据为随机指定的数据，且针对检索挖掘数据在数据库上增设有检索模块。

7.根据权利要求1所述的基于推理技术的数据挖掘的方法，其特征在于：所述步骤S3中，MapReduce能够允许提供一个可选的Combiner函数，在数据通过网络发送之前，可以通过该函数将数据进行部分合并，得到最终的数据处理结果。

8.根据权利要求1所述的基于推理技术的数据挖掘的方法，其特征在于：所述步骤S4中，在设定的一个反向数据不能得到最终有效的数据时，可以通过设置多个反向数据，进行步骤S2从而数据库内得到多个反向的关键数据，在将得到的反向的关键数据输入到步骤S3中进行MapReduce处理得到多个相应的反向数据处理结果，最终进行比较，得到有效的挖掘数据。