CN117892091A

CN117892091A - 基于人工智能的数据智能分析方法及系统

Info

Publication number: CN117892091A
Application number: CN202410265132.0A
Authority: CN
Inventors: 袁元; 闫艳; 夏存兴; 赵杨; 沈思鹏; 邵方
Original assignee: NANJING MUNICIPAL CENTER FOR DISEASE CONTROL AND PREVENTION; Nanjing Hanwei Public Health Research Institute Co ltd
Current assignee: NANJING MUNICIPAL CENTER FOR DISEASE CONTROL AND PREVENTION; Nanjing Hanwei Public Health Research Institute Co ltd
Priority date: 2024-03-08
Filing date: 2024-03-08
Publication date: 2024-04-16
Anticipated expiration: 2044-03-08
Also published as: CN117892091B

Abstract

本发明公开了一种基于人工智能的数据智能分析方法及系统，涉及机器学习技术领域，包括：确定慢性病关联类下的属性特征数据及标签数据，并建立评估分析模型，模型以慢性病关联类下的属性特征数据作为输入，获得多个分析预测数值，构建评估分析预测数值矩阵，基于评估分析预测数值矩阵，建立线性分析模型，将测试集的特征数据和评估分析预测数值矩阵中的预测结果作为输入，将测试集中的真实标签数据作为输出，获得最终预测结果，基于最终预测结果，确定人工智能的数据智能分析输出决策。本发明的优点在于：通过本方案可有效可有效提高慢性病的预测结果的准确性和稳定性、为决策者提供有针对性的建议。

Description

基于人工智能的数据智能分析方法及系统

技术领域

本发明涉及机器学习领域技术领域，具体是涉及基于人工智能的数据智能分析方法及系统。

背景技术

人工智能的数据智能分析是指利用人工智能技术和算法对大规模数据进行处理、分析和挖掘，以获取有价值的洞察和决策支持。它包括数据的收集、清理、整合和转换，以及利用机器学习、深度学习、自然语言处理使用人工智能的数据智能分析，可以发现隐藏在数据中的关联规律、趋势和异常，帮助企业和组织做出决策、改进业务流程和提供个性化的产品或服务。

现有的人工智能缺点在于，对于源数据过于依赖，不准确的数据导致分析结果不准确，其次在大量数据学习下容易出现偏差，即输入目标和获得结果差距较大，其次，人工智能模型通常在特定的训练环境中进行训练和优化，对于新的未见过的慢性病情境表现不佳。训练出的模型无法适应新的慢性病数据分布或处理新的慢性病问题，需要重新训练或调整。

发明内容

为解决上述技术问题，提供基于人工智能的数据智能分析方法及系统，本技术方案解决了上述的现有的人工智能缺点在于，对于源数据过于依赖，不准确的数据导致分析结果不准确，其次在大量数据学习下容易出现偏差，即输入目标和获得结果差距较大，其次，人工智能模型通常在特定的训练环境中进行训练和优化，对于新的未见过的慢性病情境表现不佳。训练出的模型无法适应新的慢性病数据分布或处理新的慢性病问题，需要重新训练或调整的问题。

为达到以上目的，本发明采用的技术方案为：

一种基于人工智能的数据智能分析方法，其特征在于，包括：

获取分析目标的慢性病关联类，确定慢性病关联类下的属性特征数据及标签数据；

基于慢性病关联类下的属性特征数据及标签数据，建立评估分析模型，模型以慢性病关联类下的属性特征数据作为输入，以慢性病关联类下的属性标签数据作为输出，获得多个分析预测数值，构建评估分析预测数值矩阵；

基于评估分析预测数值矩阵，建立线性分析模型，将测试集的特征数据和评估分析预测数值矩阵中的预测结果作为输入，将测试集中的真实标签数据作为输出，获得最终预测结果；

基于最终预测结果，确定人工智能的数据智能分析输出决策。

优选的，基于慢性病关联类下的属性特征数据及标签数据，建立评估分析模型，模型以慢性病关联类下的属性特征数据作为输入，以慢性病关联类下的属性标签数据作为输出，获得多个分析预测数值，构建分析预测数值矩阵具体包括：

基于慢性病关联类下的属性特征数据及标签数据，将特征数据及标签数据组合成训练数据集；

将训练数据集，划分为训练集与验证集，训练集占总训练数据集的百分之70，验证集占总训练数据集的百分之30；

建立评估分析模型；

基于评估分析模型，确定慢性病关联类下的属性基础类标签，获取慢性病关联类下的属性生成若干个关联属性特征子节点，并设置若干个子节点的分割阈值；

基于评估分析模型，以训练集中慢性病关联类下的属性特征数据作为输入，所述评估分析模型以训练集中慢性病关联类下的属性标签数据作为输出；以最小化各个叶子节点上的样本的预测误差之和作为训练目标，直至误差之和达到收敛时停止训练；

基于评估分析模型预测的若干个预测值，构建分析预测数值矩阵A；

其中，子节点的分割阈值具体为：

式中，为子节点的分割阈值，H为熵阈值，X为训练样本，n为训练样本的总数，为第i个训练样本的取值；

其中，叶子节点上的样本的预测误差之和作为训练目标具体为：

式中，为每一个叶子节点上第i个样本的误差值，D为子节点，/>为第i个训练样本的实际值，/>为第i个训练样本的预测值，L为叶子节点的误差之和；

其中，基于评估分析模型预测的若干个预测值，构建分析预测数值矩阵A具体为：

式中，A为分析预测数值矩阵，为第j个叶子节点的第i个训练样本的预测值，m为叶子节点的总数，n为样本的总数。

优选的，基于评估分析预测数值矩阵，建立线性分析模型，将训练集的特征数据和评估分析预测数值矩阵中的预测结果作为输入，将训练集中的真实标签数据作为输出，获得最终预测结果具体包括：

基于划分的验证集与预测分析预测数值矩阵A，将验证集中的每一个特征数据与每一个预测值关系进行映射，建立特征映射预测值矩阵B；

其中，为特征映射预测值矩阵，/>为第k个特征数据的第i个训练样本映射预测值，s为特征数据的总数；

对特征映射预测值矩阵B进行标准化处理，使每一个特征数据的均值为0，标准差为1，获得标准化特征映射预测值矩阵；

将验证集中的每一个标签数据整合成若干个标签向量；

建立线性分析模型；

基于线性分析模型，将标准化特征映射预测值矩阵中每一个标准化特征均值作为输入，以验证集中标签向量作为输出，以模型的损失函数预测值与真实标签之间的误差之和最为模型训练结束，直至误差之和达到收敛时停止训练；

其中，线性分析模型具体为：

式中，r为预测的标签向量，，/>，/>，/>均为模型的系数。

进一步的，提出一种基于人工智能的数据智能分析系统，用于实现如上所述的一种基于人工智能的数据智能分析方法，包括：

数据采集模块，所述数据采集模块用于获取分析目标的慢性病关联类，确定慢性病关联类下的属性特征数据及标签数据；

第一处理模块，第一处理模块与数据采集模块电性连接，所述第一处理模块用于基于慢性病关联类下的属性特征数据及标签数据，建立评估分析模型，模型以慢性病关联类下的属性特征数据作为输入，以慢性病关联类下的属性标签数据作为输出，获得多个分析预测数值，构建评估分析预测数值矩阵；

第二处理模块，第二处理模块与第一处理模块电性连接，所述第二处理模块基于评估分析预测数值矩阵，建立线性分析模型，将测试集的特征数据和评估分析预测数值矩阵中的预测结果作为输入，将测试集中的真实标签数据作为输出，获得最终预测结果；

输出模块，输出模块与第二处理模块电性连接，输出模块用于基于最终预测结果，确定人工智能的数据智能分析输出决策。

可选地，所述第一处理模块内部包括：

训练数据集单元，基于慢性病关联类下的属性特征数据及标签数据，将特征数据及标签数据组合成训练数据集；

划分单元，将训练数据集，划分为训练集与验证集，训练集占总训练数据集的百分之70，验证集占总训练数据集的百分之30；

第一模型单元，建立评估分析模型。

可选地，所述模型单元内部包括：

节点子单元，基于评估分析模型，确定慢性病关联类下的属性基础类标签，获取慢性病关联类下的属性生成若干个关联属性特征子节点，并设置若干个子节点的分割阈值；

第一训练子单元，基于线性分析模型，以训练集中慢性病关联类下的属性特征数据作为输入，评估分析模型以训练集中慢性病关联类下的属性标签数据作为输出；以最小化各个叶子节点上的样本的预测误差之和作为训练目标，直至误差之和达到收敛时停止训练；

第一矩阵子单元，基于评估分析模型预测的若干个预测值，构建分析预测数值矩阵A。

可选地，所述第二处理模块内部包括：

映射矩阵单元，基于划分的验证集与预测分析预测数值矩阵A，将验证集中的每一个特征数据与每一个预测值关系进行映射，建立特征映射预测值矩阵B；

标准化单元，对特征映射预测值矩阵B进行标准化处理，使每一个特征数据的均值为0，标准差为1，获得标准化特征映射预测值矩阵；

向量单元，将验证集中的每一个标签数据整合成若干个标签向量；

第二模型单元，建立线性分析模型。

可选地，所述第二模型单元内部包括：

第二训练子单元，基于线性分析模型，将标准化特征映射预测值矩阵中每一个标准化特征均值作为输入，以验证集中标签向量作为输出，以模型的损失函数预测值与真实标签之间的误差之和最为模型训练结束，直至误差之和达到收敛时停止训练。

与现有技术相比，本发明的有益效果在于：

本发明提出一种基于人工智能的数据智能分析方法及系统，通过确定需要进行分析的慢性病，并找出与慢性病相关的类别，获取属性特征数据和标签数据：从关联类中选择合适的属性特征数据和标签数据，建立评估分析模型：使用属性特征数据作为输入，标签数据作为输出，建立评估分析模型，并获得预测数值构建预测数值矩阵，建立线性分析模型：基于预测数值矩阵，将测试集的特征数据和预测结果作为输入，真实标签数据作为输出，建立线性分析模型，确定数据智能分析输出决策：根据线性分析模型的预测结果，确定人工智能的数据智能分析输出决策。通过此方案，可有效提高慢性病的预测结果的准确性和稳定性、为决策者提供有针对性的建议。

附图说明

图1为本发明的一种基于人工智能的数据智能分析方法流程图；

图2为本发明的建立评估分析模型的方法流程图；

图3为本发明的建立线性分析模型方法流程图；

图4为本发明的一种基于人工智能的数据智能分析系统框架图。

具体实施方式

以下描述用于揭露本发明以使本领域技术人员能够实现本发明。以下描述中的优选实施例只作为举例，本领域技术人员可以想到其他显而易见的变型。

参照图1所示，一种基于人工智能的数据智能分析方法，包括：

本方案基于最终预测结果，确定人工智能的数据智能分析输出决策。通过确定需要进行分析的慢性病，并找出与慢性病相关的类别，获取属性特征数据和标签数据：从关联类中选择合适的属性特征数据和标签数据，建立评估分析模型：使用属性特征数据作为输入，标签数据作为输出，建立评估分析模型，并获得预测数值构建预测数值矩阵，建立线性分析模型：基于预测数值矩阵，将测试集的特征数据和预测结果作为输入，真实标签数据作为输出，建立线性分析模型，确定数据智能分析输出决策：根据线性分析模型的预测结果，确定人工智能的数据智能分析输出决策。通过此方案，可有效提高慢性病的预测结果的准确性和稳定性、为决策者提供有针对性的建议。

参照图2所示，基于慢性病关联类下的属性特征数据及标签数据，建立评估分析模型，模型以慢性病关联类下的属性特征数据作为输入，以慢性病关联类下的属性标签数据作为输出，获得多个分析预测数值，构建分析预测数值矩阵具体包括：

建立评估分析模型；

基于评估分析模型，以训练集中慢性病关联类下的属性特征数据作为输入，评估分析模型以训练集中慢性病关联类下的属性标签数据作为输出；以最小化各个叶子节点上的样本的预测误差之和作为训练目标，直至误差之和达到收敛时停止训练；

其中，子节点的分割阈值具体为：

式中，A为分析预测数值矩阵，为第j个叶子节点的第i个训练样本的预测值，m为叶子节点的总数，n为样本的总数；

本步骤的目的在于，基于大数据下的若干个类别与类别的属性获得相关的特征数据与标签数据，根据特征数据与标签数据进行预测相关的预测结果，并将预测的结果根据类别进行归类，例如：在大数据下一款类别为水杯的产品存在若干个属性，带把手，不带把手皆可理解为类别下的属性，根据属性对预测值进行分类后构建预测值矩阵，减少后续数据处理，提高智能分析效率。

参照图3所示，基于评估分析预测数值矩阵，建立线性分析模型，将训练集的特征数据和评估分析预测数值矩阵中的预测结果作为输入，将训练集中的真实标签数据作为输出，获得最终预测结果具体包括：

将验证集中的每一个标签数据整合成若干个标签向量；

建立线性分析模型；

其中，线性分析模型具体为：

式中，r为预测的标签向量，，/>，/>，/>均为模型的系数。

本方案根据预测数值矩阵中预测值与特征数据建立特征映射预测值矩阵，使每一个预测试与特征数据进行绑定，根据绑定后的数据对标签数据进行查找，寻找出最优标签数据，作为分析输出，保证了输出数据的精确性。

进一步的，参照图4所示，基于与上述一种基于人工智能的数据智能分析方法相同发明构思，提出一种基于人工智能的数据智能分析系统，包括：

输出模块，输出模块与第二处理模块电性连接，所述输出模块基于最终预测结果，确定人工智能的数据智能分析输出决策。

第一处理模块内部包括：

第一模型单元，建立评估分析模型；

第一模型单元内部包括：

节点子单元，基于评估分析模型，确定慢性病关联类下的属性基础类标签，获取慢性病类下的属性生成若干个关联属性特征子节点，并设置若干个子节点的分割阈值；

第一训练子单元，基于线性分析模型，以训练集中慢性病关联类下的属性特征数据作为输入，所述评估分析模型以训练集中慢性病关联类下的属性标签数据作为输出；以最小化各个叶子节点上的样本的预测误差之和作为训练目标，直至误差之和达到收敛时停止训练；

第二处理模块内部包括：

第二模型单元，建立线性分析模型；

第二模型单元内部包括：

上述的一种基于人工智能的数据智能分析系统使用过程为：

步骤1获取分析目标的慢性病关联类，确定慢性病关联类下的属性特征数据及标签数据；

步骤2：基于慢性病关联类下的属性特征数据及标签数据，将特征数据及标签数据组合成训练数据集；

步骤3：将训练数据集，划分为训练集与验证集，训练集占总训练数据集的百分之70，验证集占总训练数据集的百分之30；

步骤4：建立评估分析模型；

步骤5：基于评估分析模型，确定慢性病关联类下的属性基础类标签，获取慢性病关联类下的属性生成若干个关联属性特征子节点，并设置若干个子节点的分割阈值；

步骤6：基于评估分析模型，以训练集中慢性病关联类下的属性特征数据作为输入，所述评估分析模型以训练集中慢性病关联类下的属性标签数据作为输出；以最小化各个叶子节点上的样本的预测误差之和作为训练目标，直至误差之和达到收敛时停止训练；

步骤7：基于评估分析模型预测的若干个预测值，构建分析预测数值矩阵A；

步骤8：基于划分的验证集与预测分析预测数值矩阵A，将验证集中的每一个特征数据与每一个预测值关系进行映射，建立特征映射预测值矩阵B；

步骤9：对特征映射预测值矩阵B进行标准化处理，使每一个特征数据的均值为0，标准差为1，获得标准化特征映射预测值矩阵；

步骤10：将验证集中的每一个标签数据整合成若干个标签向量；

步骤11：建立线性分析模型；

步骤12：基于线性分析模型，将标准化特征映射预测值矩阵中每一个标准化特征均值作为输入，以验证集中标签向量作为输出，以模型的损失函数预测值与真实标签之间的误差之和最为模型训练结束，直至误差之和达到收敛时停止训练。

步骤13：基于最终预测结果，确定人工智能的数据智能分析输出决策。

本发明的优点在于：通过确定需要进行分析的慢性病，并找出与慢性病相关的类别，获取属性特征数据和标签数据：从关联类中选择合适的属性特征数据和标签数据，建立评估分析模型：使用属性特征数据作为输入，标签数据作为输出，建立评估分析模型，并获得预测数值构建预测数值矩阵，建立线性分析模型：基于预测数值矩阵，将测试集的特征数据和预测结果作为输入，真实标签数据作为输出，建立线性分析模型，确定数据智能分析输出决策：根据线性分析模型的预测结果，确定人工智能的数据智能分析输出决策。通过此方案，可有效提高慢性病的预测结果的准确性和稳定性、为决策者提供有针对性的建议。

以上显示和描述了本发明的基本原理、主要特征和本发明的优点。本行业的技术人员应该了解，本发明不受上述实施例的限制，上述实施例和说明书中描述的只是本发明的原理，在不脱离本发明精神和范围的前提下本发明还会有各种变化和改进，这些变化和改进都落入要求保护的本发明的范围内。本发明要求的保护范围由所附的权利要求书及其等同物界定。

Claims

1.一种基于人工智能的数据智能分析方法，其特征在于，包括：

2.根据权利要求1所述的一种基于人工智能的数据智能分析方法，其特征在于，基于慢性病关联类下的属性特征数据及标签数据，建立评估分析模型，模型以慢性病关联类下的属性特征数据作为输入，以慢性病关联类下的属性标签数据作为输出，获得多个分析预测数值，构建分析预测数值矩阵具体包括：

建立评估分析模型；

其中，子节点的分割阈值具体为：

式中，为子节点的分割阈值，H为熵阈值，X为训练样本，n为训练样本的总数，/>为第i个训练样本的取值；

3.根据权利要求2所述的一种基于人工智能的数据智能分析方法，其特征在于，基于评估分析预测数值矩阵，建立线性分析模型，将训练集的特征数据和评估分析预测数值矩阵中的预测结果作为输入，将训练集中的真实标签数据作为输出，获得最终预测结果具体包括：

将验证集中的每一个标签数据整合成若干个标签向量；

建立线性分析模型；

其中，线性分析模型具体为：

式中，r为预测的标签向量，，/>，/>，/>均为模型的系数。

4.一种基于人工智能的数据智能分析系统，用于实现如权利要求1-3任一项所述的一种基于人工智能的数据智能分析方法，其特征在于，包括：

5.根据权利要求4所述的一种基于人工智能的数据智能分析系统，其特征在于，所述第一处理模块内部包括：

第一模型单元，建立评估分析模型。

6.根据权利要求4所述的一种基于人工智能的数据智能分析系统，其特征在于，所述模型单元内部包括：

7.根据权利要求4所述的一种基于人工智能的数据智能分析系统，其特征在于，所述第二处理模块内部包括：

第二模型单元，建立线性分析模型。

8.根据权利要求4所述的一种基于人工智能的数据智能分析系统，其特征在于，所述第二模型单元内部包括：