CN117892091A - 基于人工智能的数据智能分析方法及系统 - Google Patents
基于人工智能的数据智能分析方法及系统 Download PDFInfo
- Publication number
- CN117892091A CN117892091A CN202410265132.0A CN202410265132A CN117892091A CN 117892091 A CN117892091 A CN 117892091A CN 202410265132 A CN202410265132 A CN 202410265132A CN 117892091 A CN117892091 A CN 117892091A
- Authority
- CN
- China
- Prior art keywords
- data
- training
- analysis
- chronic disease
- attribute
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000004458 analytical method Methods 0.000 title claims abstract description 195
- 238000013473 artificial intelligence Methods 0.000 title claims abstract description 39
- 239000011159 matrix material Substances 0.000 claims abstract description 99
- 208000017667 Chronic Disease Diseases 0.000 claims abstract description 94
- 238000011156 evaluation Methods 0.000 claims abstract description 78
- 238000000034 method Methods 0.000 claims abstract description 26
- 238000012360 testing method Methods 0.000 claims abstract description 18
- 238000012549 training Methods 0.000 claims description 125
- 238000013507 mapping Methods 0.000 claims description 45
- 238000012795 verification Methods 0.000 claims description 42
- 238000012545 processing Methods 0.000 claims description 27
- 239000013598 vector Substances 0.000 claims description 20
- 238000007405 data analysis Methods 0.000 claims description 12
- 230000011218 segmentation Effects 0.000 claims description 12
- 238000010606 normalization Methods 0.000 claims description 6
- 238000010801 machine learning Methods 0.000 abstract description 3
- 230000006870 function Effects 0.000 description 5
- 230000007547 defect Effects 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于人工智能的数据智能分析方法及系统,涉及机器学习技术领域,包括:确定慢性病关联类下的属性特征数据及标签数据,并建立评估分析模型,模型以慢性病关联类下的属性特征数据作为输入,获得多个分析预测数值,构建评估分析预测数值矩阵,基于评估分析预测数值矩阵,建立线性分析模型,将测试集的特征数据和评估分析预测数值矩阵中的预测结果作为输入,将测试集中的真实标签数据作为输出,获得最终预测结果,基于最终预测结果,确定人工智能的数据智能分析输出决策。本发明的优点在于:通过本方案可有效可有效提高慢性病的预测结果的准确性和稳定性、为决策者提供有针对性的建议。
Description
技术领域
本发明涉及机器学习领域技术领域,具体是涉及基于人工智能的数据智能分析方法及系统。
背景技术
人工智能的数据智能分析是指利用人工智能技术和算法对大规模数据进行处理、分析和挖掘,以获取有价值的洞察和决策支持。它包括数据的收集、清理、整合和转换,以及利用机器学习、深度学习、自然语言处理使用人工智能的数据智能分析,可以发现隐藏在数据中的关联规律、趋势和异常,帮助企业和组织做出决策、改进业务流程和提供个性化的产品或服务。
现有的人工智能缺点在于,对于源数据过于依赖,不准确的数据导致分析结果不准确,其次在大量数据学习下容易出现偏差,即输入目标和获得结果差距较大,其次,人工智能模型通常在特定的训练环境中进行训练和优化,对于新的未见过的慢性病情境表现不佳。训练出的模型无法适应新的慢性病数据分布或处理新的慢性病问题,需要重新训练或调整。
发明内容
为解决上述技术问题,提供基于人工智能的数据智能分析方法及系统,本技术方案解决了上述的现有的人工智能缺点在于,对于源数据过于依赖,不准确的数据导致分析结果不准确,其次在大量数据学习下容易出现偏差,即输入目标和获得结果差距较大,其次,人工智能模型通常在特定的训练环境中进行训练和优化,对于新的未见过的慢性病情境表现不佳。训练出的模型无法适应新的慢性病数据分布或处理新的慢性病问题,需要重新训练或调整的问题。
为达到以上目的,本发明采用的技术方案为:
一种基于人工智能的数据智能分析方法,其特征在于,包括:
获取分析目标的慢性病关联类,确定慢性病关联类下的属性特征数据及标签数据;
基于慢性病关联类下的属性特征数据及标签数据,建立评估分析模型,模型以慢性病关联类下的属性特征数据作为输入,以慢性病关联类下的属性标签数据作为输出,获得多个分析预测数值,构建评估分析预测数值矩阵;
基于评估分析预测数值矩阵,建立线性分析模型,将测试集的特征数据和评估分析预测数值矩阵中的预测结果作为输入,将测试集中的真实标签数据作为输出,获得最终预测结果;
基于最终预测结果,确定人工智能的数据智能分析输出决策。
优选的,基于慢性病关联类下的属性特征数据及标签数据,建立评估分析模型,模型以慢性病关联类下的属性特征数据作为输入,以慢性病关联类下的属性标签数据作为输出,获得多个分析预测数值,构建分析预测数值矩阵具体包括:
基于慢性病关联类下的属性特征数据及标签数据,将特征数据及标签数据组合成训练数据集;
将训练数据集,划分为训练集与验证集,训练集占总训练数据集的百分之70,验证集占总训练数据集的百分之30;
建立评估分析模型;
基于评估分析模型,确定慢性病关联类下的属性基础类标签,获取慢性病关联类下的属性生成若干个关联属性特征子节点,并设置若干个子节点的分割阈值;
基于评估分析模型,以训练集中慢性病关联类下的属性特征数据作为输入,所述评估分析模型以训练集中慢性病关联类下的属性标签数据作为输出;以最小化各个叶子节点上的样本的预测误差之和作为训练目标,直至误差之和达到收敛时停止训练;
基于评估分析模型预测的若干个预测值,构建分析预测数值矩阵A;
其中,子节点的分割阈值具体为:
式中,为子节点的分割阈值,H为熵阈值,X为训练样本,n为训练样本的总数,为第i个训练样本的取值;
其中,叶子节点上的样本的预测误差之和作为训练目标具体为:
式中,为每一个叶子节点上第i个样本的误差值,D为子节点,/>为第i个训练样本的实际值,/>为第i个训练样本的预测值,L为叶子节点的误差之和;
其中,基于评估分析模型预测的若干个预测值,构建分析预测数值矩阵A具体为:
式中,A为分析预测数值矩阵,为第j个叶子节点的第i个训练样本的预测值,m为叶子节点的总数,n为样本的总数。
优选的,基于评估分析预测数值矩阵,建立线性分析模型,将训练集的特征数据和评估分析预测数值矩阵中的预测结果作为输入,将训练集中的真实标签数据作为输出,获得最终预测结果具体包括:
基于划分的验证集与预测分析预测数值矩阵A,将验证集中的每一个特征数据与每一个预测值关系进行映射,建立特征映射预测值矩阵B;
其中,为特征映射预测值矩阵,/>为第k个特征数据的第i个训练样本映射预测值,s为特征数据的总数;
对特征映射预测值矩阵B进行标准化处理,使每一个特征数据的均值为0,标准差为1,获得标准化特征映射预测值矩阵;
将验证集中的每一个标签数据整合成若干个标签向量;
建立线性分析模型;
基于线性分析模型,将标准化特征映射预测值矩阵中每一个标准化特征均值作为输入,以验证集中标签向量作为输出,以模型的损失函数预测值与真实标签之间的误差之和最为模型训练结束,直至误差之和达到收敛时停止训练;
其中,线性分析模型具体为:
式中,r为预测的标签向量,,/>,/>,/>均为模型的系数。
进一步的,提出一种基于人工智能的数据智能分析系统,用于实现如上所述的一种基于人工智能的数据智能分析方法,包括:
数据采集模块,所述数据采集模块用于获取分析目标的慢性病关联类,确定慢性病关联类下的属性特征数据及标签数据;
第一处理模块,第一处理模块与数据采集模块电性连接,所述第一处理模块用于基于慢性病关联类下的属性特征数据及标签数据,建立评估分析模型,模型以慢性病关联类下的属性特征数据作为输入,以慢性病关联类下的属性标签数据作为输出,获得多个分析预测数值,构建评估分析预测数值矩阵;
第二处理模块,第二处理模块与第一处理模块电性连接,所述第二处理模块基于评估分析预测数值矩阵,建立线性分析模型,将测试集的特征数据和评估分析预测数值矩阵中的预测结果作为输入,将测试集中的真实标签数据作为输出,获得最终预测结果;
输出模块,输出模块与第二处理模块电性连接,输出模块用于基于最终预测结果,确定人工智能的数据智能分析输出决策。
可选地,所述第一处理模块内部包括:
训练数据集单元,基于慢性病关联类下的属性特征数据及标签数据,将特征数据及标签数据组合成训练数据集;
划分单元,将训练数据集,划分为训练集与验证集,训练集占总训练数据集的百分之70,验证集占总训练数据集的百分之30;
第一模型单元,建立评估分析模型。
可选地,所述模型单元内部包括:
节点子单元,基于评估分析模型,确定慢性病关联类下的属性基础类标签,获取慢性病关联类下的属性生成若干个关联属性特征子节点,并设置若干个子节点的分割阈值;
第一训练子单元,基于线性分析模型,以训练集中慢性病关联类下的属性特征数据作为输入,评估分析模型以训练集中慢性病关联类下的属性标签数据作为输出;以最小化各个叶子节点上的样本的预测误差之和作为训练目标,直至误差之和达到收敛时停止训练;
第一矩阵子单元,基于评估分析模型预测的若干个预测值,构建分析预测数值矩阵A。
可选地,所述第二处理模块内部包括:
映射矩阵单元,基于划分的验证集与预测分析预测数值矩阵A,将验证集中的每一个特征数据与每一个预测值关系进行映射,建立特征映射预测值矩阵B;
标准化单元,对特征映射预测值矩阵B进行标准化处理,使每一个特征数据的均值为0,标准差为1,获得标准化特征映射预测值矩阵;
向量单元,将验证集中的每一个标签数据整合成若干个标签向量;
第二模型单元,建立线性分析模型。
可选地,所述第二模型单元内部包括:
第二训练子单元,基于线性分析模型,将标准化特征映射预测值矩阵中每一个标准化特征均值作为输入,以验证集中标签向量作为输出,以模型的损失函数预测值与真实标签之间的误差之和最为模型训练结束,直至误差之和达到收敛时停止训练。
与现有技术相比,本发明的有益效果在于:
本发明提出一种基于人工智能的数据智能分析方法及系统,通过确定需要进行分析的慢性病,并找出与慢性病相关的类别,获取属性特征数据和标签数据:从关联类中选择合适的属性特征数据和标签数据,建立评估分析模型:使用属性特征数据作为输入,标签数据作为输出,建立评估分析模型,并获得预测数值构建预测数值矩阵,建立线性分析模型:基于预测数值矩阵,将测试集的特征数据和预测结果作为输入,真实标签数据作为输出,建立线性分析模型,确定数据智能分析输出决策:根据线性分析模型的预测结果,确定人工智能的数据智能分析输出决策。通过此方案,可有效提高慢性病的预测结果的准确性和稳定性、为决策者提供有针对性的建议。
附图说明
图1为本发明的一种基于人工智能的数据智能分析方法流程图;
图2为本发明的建立评估分析模型的方法流程图;
图3为本发明的建立线性分析模型方法流程图;
图4为本发明的一种基于人工智能的数据智能分析系统框架图。
具体实施方式
以下描述用于揭露本发明以使本领域技术人员能够实现本发明。以下描述中的优选实施例只作为举例,本领域技术人员可以想到其他显而易见的变型。
参照图1所示,一种基于人工智能的数据智能分析方法,包括:
获取分析目标的慢性病关联类,确定慢性病关联类下的属性特征数据及标签数据;
基于慢性病关联类下的属性特征数据及标签数据,建立评估分析模型,模型以慢性病关联类下的属性特征数据作为输入,以慢性病关联类下的属性标签数据作为输出,获得多个分析预测数值,构建评估分析预测数值矩阵;
基于评估分析预测数值矩阵,建立线性分析模型,将测试集的特征数据和评估分析预测数值矩阵中的预测结果作为输入,将测试集中的真实标签数据作为输出,获得最终预测结果;
基于最终预测结果,确定人工智能的数据智能分析输出决策。
本方案基于最终预测结果,确定人工智能的数据智能分析输出决策。通过确定需要进行分析的慢性病,并找出与慢性病相关的类别,获取属性特征数据和标签数据:从关联类中选择合适的属性特征数据和标签数据,建立评估分析模型:使用属性特征数据作为输入,标签数据作为输出,建立评估分析模型,并获得预测数值构建预测数值矩阵,建立线性分析模型:基于预测数值矩阵,将测试集的特征数据和预测结果作为输入,真实标签数据作为输出,建立线性分析模型,确定数据智能分析输出决策:根据线性分析模型的预测结果,确定人工智能的数据智能分析输出决策。通过此方案,可有效提高慢性病的预测结果的准确性和稳定性、为决策者提供有针对性的建议。
参照图2所示,基于慢性病关联类下的属性特征数据及标签数据,建立评估分析模型,模型以慢性病关联类下的属性特征数据作为输入,以慢性病关联类下的属性标签数据作为输出,获得多个分析预测数值,构建分析预测数值矩阵具体包括:
基于慢性病关联类下的属性特征数据及标签数据,将特征数据及标签数据组合成训练数据集;
将训练数据集,划分为训练集与验证集,训练集占总训练数据集的百分之70,验证集占总训练数据集的百分之30;
建立评估分析模型;
基于评估分析模型,确定慢性病关联类下的属性基础类标签,获取慢性病关联类下的属性生成若干个关联属性特征子节点,并设置若干个子节点的分割阈值;
基于评估分析模型,以训练集中慢性病关联类下的属性特征数据作为输入,评估分析模型以训练集中慢性病关联类下的属性标签数据作为输出;以最小化各个叶子节点上的样本的预测误差之和作为训练目标,直至误差之和达到收敛时停止训练;
基于评估分析模型预测的若干个预测值,构建分析预测数值矩阵A;
其中,子节点的分割阈值具体为:
式中,为子节点的分割阈值,H为熵阈值,X为训练样本,n为训练样本的总数,为第i个训练样本的取值;
其中,叶子节点上的样本的预测误差之和作为训练目标具体为:
式中,为每一个叶子节点上第i个样本的误差值,D为子节点,/>为第i个训练样本的实际值,/>为第i个训练样本的预测值,L为叶子节点的误差之和;
其中,基于评估分析模型预测的若干个预测值,构建分析预测数值矩阵A具体为:
式中,A为分析预测数值矩阵,为第j个叶子节点的第i个训练样本的预测值,m为叶子节点的总数,n为样本的总数;
本步骤的目的在于,基于大数据下的若干个类别与类别的属性获得相关的特征数据与标签数据,根据特征数据与标签数据进行预测相关的预测结果,并将预测的结果根据类别进行归类,例如:在大数据下一款类别为水杯的产品存在若干个属性,带把手,不带把手皆可理解为类别下的属性,根据属性对预测值进行分类后构建预测值矩阵,减少后续数据处理,提高智能分析效率。
参照图3所示,基于评估分析预测数值矩阵,建立线性分析模型,将训练集的特征数据和评估分析预测数值矩阵中的预测结果作为输入,将训练集中的真实标签数据作为输出,获得最终预测结果具体包括:
基于划分的验证集与预测分析预测数值矩阵A,将验证集中的每一个特征数据与每一个预测值关系进行映射,建立特征映射预测值矩阵B;
其中,为特征映射预测值矩阵,/>为第k个特征数据的第i个训练样本映射预测值,s为特征数据的总数;
对特征映射预测值矩阵B进行标准化处理,使每一个特征数据的均值为0,标准差为1,获得标准化特征映射预测值矩阵;
将验证集中的每一个标签数据整合成若干个标签向量;
建立线性分析模型;
基于线性分析模型,将标准化特征映射预测值矩阵中每一个标准化特征均值作为输入,以验证集中标签向量作为输出,以模型的损失函数预测值与真实标签之间的误差之和最为模型训练结束,直至误差之和达到收敛时停止训练;
其中,线性分析模型具体为:
式中,r为预测的标签向量,,/>,/>,/>均为模型的系数。
本方案根据预测数值矩阵中预测值与特征数据建立特征映射预测值矩阵,使每一个预测试与特征数据进行绑定,根据绑定后的数据对标签数据进行查找,寻找出最优标签数据,作为分析输出,保证了输出数据的精确性。
进一步的,参照图4所示,基于与上述一种基于人工智能的数据智能分析方法相同发明构思,提出一种基于人工智能的数据智能分析系统,包括:
数据采集模块,所述数据采集模块用于获取分析目标的慢性病关联类,确定慢性病关联类下的属性特征数据及标签数据;
第一处理模块,第一处理模块与数据采集模块电性连接,所述第一处理模块用于基于慢性病关联类下的属性特征数据及标签数据,建立评估分析模型,模型以慢性病关联类下的属性特征数据作为输入,以慢性病关联类下的属性标签数据作为输出,获得多个分析预测数值,构建评估分析预测数值矩阵;
第二处理模块,第二处理模块与第一处理模块电性连接,所述第二处理模块基于评估分析预测数值矩阵,建立线性分析模型,将测试集的特征数据和评估分析预测数值矩阵中的预测结果作为输入,将测试集中的真实标签数据作为输出,获得最终预测结果;
输出模块,输出模块与第二处理模块电性连接,所述输出模块基于最终预测结果,确定人工智能的数据智能分析输出决策。
第一处理模块内部包括:
训练数据集单元,基于慢性病关联类下的属性特征数据及标签数据,将特征数据及标签数据组合成训练数据集;
划分单元,将训练数据集,划分为训练集与验证集,训练集占总训练数据集的百分之70,验证集占总训练数据集的百分之30;
第一模型单元,建立评估分析模型;
第一模型单元内部包括:
节点子单元,基于评估分析模型,确定慢性病关联类下的属性基础类标签,获取慢性病类下的属性生成若干个关联属性特征子节点,并设置若干个子节点的分割阈值;
第一训练子单元,基于线性分析模型,以训练集中慢性病关联类下的属性特征数据作为输入,所述评估分析模型以训练集中慢性病关联类下的属性标签数据作为输出;以最小化各个叶子节点上的样本的预测误差之和作为训练目标,直至误差之和达到收敛时停止训练;
第一矩阵子单元,基于评估分析模型预测的若干个预测值,构建分析预测数值矩阵A。
第二处理模块内部包括:
映射矩阵单元,基于划分的验证集与预测分析预测数值矩阵A,将验证集中的每一个特征数据与每一个预测值关系进行映射,建立特征映射预测值矩阵B;
标准化单元,对特征映射预测值矩阵B进行标准化处理,使每一个特征数据的均值为0,标准差为1,获得标准化特征映射预测值矩阵;
向量单元,将验证集中的每一个标签数据整合成若干个标签向量;
第二模型单元,建立线性分析模型;
第二模型单元内部包括:
第二训练子单元,基于线性分析模型,将标准化特征映射预测值矩阵中每一个标准化特征均值作为输入,以验证集中标签向量作为输出,以模型的损失函数预测值与真实标签之间的误差之和最为模型训练结束,直至误差之和达到收敛时停止训练。
上述的一种基于人工智能的数据智能分析系统使用过程为:
步骤1获取分析目标的慢性病关联类,确定慢性病关联类下的属性特征数据及标签数据;
步骤2:基于慢性病关联类下的属性特征数据及标签数据,将特征数据及标签数据组合成训练数据集;
步骤3:将训练数据集,划分为训练集与验证集,训练集占总训练数据集的百分之70,验证集占总训练数据集的百分之30;
步骤4:建立评估分析模型;
步骤5:基于评估分析模型,确定慢性病关联类下的属性基础类标签,获取慢性病关联类下的属性生成若干个关联属性特征子节点,并设置若干个子节点的分割阈值;
步骤6:基于评估分析模型,以训练集中慢性病关联类下的属性特征数据作为输入,所述评估分析模型以训练集中慢性病关联类下的属性标签数据作为输出;以最小化各个叶子节点上的样本的预测误差之和作为训练目标,直至误差之和达到收敛时停止训练;
步骤7:基于评估分析模型预测的若干个预测值,构建分析预测数值矩阵A;
步骤8:基于划分的验证集与预测分析预测数值矩阵A,将验证集中的每一个特征数据与每一个预测值关系进行映射,建立特征映射预测值矩阵B;
步骤9:对特征映射预测值矩阵B进行标准化处理,使每一个特征数据的均值为0,标准差为1,获得标准化特征映射预测值矩阵;
步骤10:将验证集中的每一个标签数据整合成若干个标签向量;
步骤11:建立线性分析模型;
步骤12:基于线性分析模型,将标准化特征映射预测值矩阵中每一个标准化特征均值作为输入,以验证集中标签向量作为输出,以模型的损失函数预测值与真实标签之间的误差之和最为模型训练结束,直至误差之和达到收敛时停止训练。
步骤13:基于最终预测结果,确定人工智能的数据智能分析输出决策。
本发明的优点在于:通过确定需要进行分析的慢性病,并找出与慢性病相关的类别,获取属性特征数据和标签数据:从关联类中选择合适的属性特征数据和标签数据,建立评估分析模型:使用属性特征数据作为输入,标签数据作为输出,建立评估分析模型,并获得预测数值构建预测数值矩阵,建立线性分析模型:基于预测数值矩阵,将测试集的特征数据和预测结果作为输入,真实标签数据作为输出,建立线性分析模型,确定数据智能分析输出决策:根据线性分析模型的预测结果,确定人工智能的数据智能分析输出决策。通过此方案,可有效提高慢性病的预测结果的准确性和稳定性、为决策者提供有针对性的建议。
以上显示和描述了本发明的基本原理、主要特征和本发明的优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是本发明的原理,在不脱离本发明精神和范围的前提下本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明的范围内。本发明要求的保护范围由所附的权利要求书及其等同物界定。
Claims (8)
1.一种基于人工智能的数据智能分析方法,其特征在于,包括:
获取分析目标的慢性病关联类,确定慢性病关联类下的属性特征数据及标签数据;
基于慢性病关联类下的属性特征数据及标签数据,建立评估分析模型,模型以慢性病关联类下的属性特征数据作为输入,以慢性病关联类下的属性标签数据作为输出,获得多个分析预测数值,构建评估分析预测数值矩阵;
基于评估分析预测数值矩阵,建立线性分析模型,将测试集的特征数据和评估分析预测数值矩阵中的预测结果作为输入,将测试集中的真实标签数据作为输出,获得最终预测结果;
基于最终预测结果,确定人工智能的数据智能分析输出决策。
2.根据权利要求1所述的一种基于人工智能的数据智能分析方法,其特征在于,基于慢性病关联类下的属性特征数据及标签数据,建立评估分析模型,模型以慢性病关联类下的属性特征数据作为输入,以慢性病关联类下的属性标签数据作为输出,获得多个分析预测数值,构建分析预测数值矩阵具体包括:
基于慢性病关联类下的属性特征数据及标签数据,将特征数据及标签数据组合成训练数据集;
将训练数据集,划分为训练集与验证集,训练集占总训练数据集的百分之70,验证集占总训练数据集的百分之30;
建立评估分析模型;
基于评估分析模型,确定慢性病关联类下的属性基础类标签,获取慢性病关联类下的属性生成若干个关联属性特征子节点,并设置若干个子节点的分割阈值;
基于评估分析模型,以训练集中慢性病关联类下的属性特征数据作为输入,所述评估分析模型以训练集中慢性病关联类下的属性标签数据作为输出;以最小化各个叶子节点上的样本的预测误差之和作为训练目标,直至误差之和达到收敛时停止训练;
基于评估分析模型预测的若干个预测值,构建分析预测数值矩阵A;
其中,子节点的分割阈值具体为:
式中,为子节点的分割阈值,H为熵阈值,X为训练样本,n为训练样本的总数,/>为第i个训练样本的取值;
其中,叶子节点上的样本的预测误差之和作为训练目标具体为:
式中,为每一个叶子节点上第i个样本的误差值,D为子节点,/>为第i个训练样本的实际值,/>为第i个训练样本的预测值,L为叶子节点的误差之和;
其中,基于评估分析模型预测的若干个预测值,构建分析预测数值矩阵A具体为:
式中,A为分析预测数值矩阵,为第j个叶子节点的第i个训练样本的预测值,m为叶子节点的总数,n为样本的总数。
3.根据权利要求2所述的一种基于人工智能的数据智能分析方法,其特征在于,基于评估分析预测数值矩阵,建立线性分析模型,将训练集的特征数据和评估分析预测数值矩阵中的预测结果作为输入,将训练集中的真实标签数据作为输出,获得最终预测结果具体包括:
基于划分的验证集与预测分析预测数值矩阵A,将验证集中的每一个特征数据与每一个预测值关系进行映射,建立特征映射预测值矩阵B;
其中,为特征映射预测值矩阵,/>为第k个特征数据的第i个训练样本映射预测值,s为特征数据的总数;
对特征映射预测值矩阵B进行标准化处理,使每一个特征数据的均值为0,标准差为1,获得标准化特征映射预测值矩阵;
将验证集中的每一个标签数据整合成若干个标签向量;
建立线性分析模型;
基于线性分析模型,将标准化特征映射预测值矩阵中每一个标准化特征均值作为输入,以验证集中标签向量作为输出,以模型的损失函数预测值与真实标签之间的误差之和最为模型训练结束,直至误差之和达到收敛时停止训练;
其中,线性分析模型具体为:
式中,r为预测的标签向量,,/>,/>,/>均为模型的系数。
4.一种基于人工智能的数据智能分析系统,用于实现如权利要求1-3任一项所述的一种基于人工智能的数据智能分析方法,其特征在于,包括:
数据采集模块,所述数据采集模块用于获取分析目标的慢性病关联类,确定慢性病关联类下的属性特征数据及标签数据;
第一处理模块,第一处理模块与数据采集模块电性连接,所述第一处理模块用于基于慢性病关联类下的属性特征数据及标签数据,建立评估分析模型,模型以慢性病关联类下的属性特征数据作为输入,以慢性病关联类下的属性标签数据作为输出,获得多个分析预测数值,构建评估分析预测数值矩阵;
第二处理模块,第二处理模块与第一处理模块电性连接,所述第二处理模块基于评估分析预测数值矩阵,建立线性分析模型,将测试集的特征数据和评估分析预测数值矩阵中的预测结果作为输入,将测试集中的真实标签数据作为输出,获得最终预测结果;
输出模块,输出模块与第二处理模块电性连接,所述输出模块基于最终预测结果,确定人工智能的数据智能分析输出决策。
5.根据权利要求4所述的一种基于人工智能的数据智能分析系统,其特征在于,所述第一处理模块内部包括:
训练数据集单元,基于慢性病关联类下的属性特征数据及标签数据,将特征数据及标签数据组合成训练数据集;
划分单元,将训练数据集,划分为训练集与验证集,训练集占总训练数据集的百分之70,验证集占总训练数据集的百分之30;
第一模型单元,建立评估分析模型。
6.根据权利要求4所述的一种基于人工智能的数据智能分析系统,其特征在于,所述模型单元内部包括:
节点子单元,基于评估分析模型,确定慢性病关联类下的属性基础类标签,获取慢性病关联类下的属性生成若干个关联属性特征子节点,并设置若干个子节点的分割阈值;
第一训练子单元,基于线性分析模型,以训练集中慢性病关联类下的属性特征数据作为输入,所述评估分析模型以训练集中慢性病关联类下的属性标签数据作为输出;以最小化各个叶子节点上的样本的预测误差之和作为训练目标,直至误差之和达到收敛时停止训练;
第一矩阵子单元,基于评估分析模型预测的若干个预测值,构建分析预测数值矩阵A。
7.根据权利要求4所述的一种基于人工智能的数据智能分析系统,其特征在于,所述第二处理模块内部包括:
映射矩阵单元,基于划分的验证集与预测分析预测数值矩阵A,将验证集中的每一个特征数据与每一个预测值关系进行映射,建立特征映射预测值矩阵B;
标准化单元,对特征映射预测值矩阵B进行标准化处理,使每一个特征数据的均值为0,标准差为1,获得标准化特征映射预测值矩阵;
向量单元,将验证集中的每一个标签数据整合成若干个标签向量;
第二模型单元,建立线性分析模型。
8.根据权利要求4所述的一种基于人工智能的数据智能分析系统,其特征在于,所述第二模型单元内部包括:
第二训练子单元,基于线性分析模型,将标准化特征映射预测值矩阵中每一个标准化特征均值作为输入,以验证集中标签向量作为输出,以模型的损失函数预测值与真实标签之间的误差之和最为模型训练结束,直至误差之和达到收敛时停止训练。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410265132.0A CN117892091B (zh) | 2024-03-08 | 2024-03-08 | 基于人工智能的数据智能分析方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410265132.0A CN117892091B (zh) | 2024-03-08 | 2024-03-08 | 基于人工智能的数据智能分析方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117892091A true CN117892091A (zh) | 2024-04-16 |
CN117892091B CN117892091B (zh) | 2024-05-14 |
Family
ID=90649502
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410265132.0A Active CN117892091B (zh) | 2024-03-08 | 2024-03-08 | 基于人工智能的数据智能分析方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117892091B (zh) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108231201A (zh) * | 2018-01-25 | 2018-06-29 | 华中科技大学 | 一种疾病数据分析处理模型的构建方法、系统及应用 |
CN116757534A (zh) * | 2023-06-15 | 2023-09-15 | 中国标准化研究院 | 一种基于神经训练网络的智能冰箱可靠性分析方法 |
CN117174313A (zh) * | 2023-09-03 | 2023-12-05 | 南通市康复医院(南通市第二人民医院) | 一种脑出血患者神经功能预后预测模型的建立方法及系统 |
-
2024
- 2024-03-08 CN CN202410265132.0A patent/CN117892091B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108231201A (zh) * | 2018-01-25 | 2018-06-29 | 华中科技大学 | 一种疾病数据分析处理模型的构建方法、系统及应用 |
CN116757534A (zh) * | 2023-06-15 | 2023-09-15 | 中国标准化研究院 | 一种基于神经训练网络的智能冰箱可靠性分析方法 |
CN117174313A (zh) * | 2023-09-03 | 2023-12-05 | 南通市康复医院(南通市第二人民医院) | 一种脑出血患者神经功能预后预测模型的建立方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN117892091B (zh) | 2024-05-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112069310B (zh) | 基于主动学习策略的文本分类方法及系统 | |
CN111126386B (zh) | 场景文本识别中基于对抗学习的序列领域适应方法 | |
CN108399428B (zh) | 一种基于迹比准则的三元组损失函数设计方法 | |
CN110335168B (zh) | 基于gru优化用电信息采集终端故障预测模型的方法及系统 | |
CN103559504A (zh) | 图像目标类别识别方法及装置 | |
CN110647830B (zh) | 基于卷积神经网络和高斯混合模型的轴承故障诊断方法 | |
CN108563791A (zh) | 一种建筑质量投诉文本分类的方法和系统 | |
CN111899254A (zh) | 基于半监督学习自动标注工业产品外观缺陷图像的方法 | |
CN112756759B (zh) | 点焊机器人工作站故障判定方法 | |
CN111914550B (zh) | 一种面向限定领域的知识图谱更新方法及系统 | |
CN117131449A (zh) | 面向数据治理的具有传播学习能力的异常识别方法及系统 | |
CN115358481A (zh) | 一种企业外迁预警识别的方法、系统及装置 | |
CN115146062A (zh) | 融合专家推荐与文本聚类的智能事件分析方法和系统 | |
CN112685374A (zh) | 日志分类方法、装置及电子设备 | |
CN112489689B (zh) | 基于多尺度差异对抗的跨数据库语音情感识别方法及装置 | |
CN111984790B (zh) | 一种实体关系抽取方法 | |
CN104850862B (zh) | 一种基于单位代价收益敏感决策树的分类方法 | |
CN113535928A (zh) | 基于注意力机制下长短期记忆网络的服务发现方法及系统 | |
CN111967501B (zh) | 一种遥测原始数据驱动的载荷状态判别方法及判别系统 | |
CN117892091B (zh) | 基于人工智能的数据智能分析方法及系统 | |
CN110334080B (zh) | 一种实现自主学习的知识库构建方法 | |
CN117372144A (zh) | 应用于小样本场景的风控策略智能化方法及系统 | |
CN114996466B (zh) | 一种医学标准映射模型的建立方法、系统及使用方法 | |
CN111105041A (zh) | 一种用于智慧数据碰撞的机器学习方法及装置 | |
CN113780405B (zh) | 基于深度神经网络的空调机参数回归优化方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |