CN116564540A - 基于集成学习算法的角膜塑形镜参数预测方法及系统 - Google Patents

基于集成学习算法的角膜塑形镜参数预测方法及系统 Download PDF

Info

Publication number
CN116564540A
CN116564540A CN202310840292.9A CN202310840292A CN116564540A CN 116564540 A CN116564540 A CN 116564540A CN 202310840292 A CN202310840292 A CN 202310840292A CN 116564540 A CN116564540 A CN 116564540A
Authority
CN
China
Prior art keywords
data
feature
base learner
error
learner
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202310840292.9A
Other languages
English (en)
Other versions
CN116564540B (zh
Inventor
佟颖
张星
韩宝珠
马琳云
葛晓康
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tianjin Normal University
Original Assignee
Tianjin Normal University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tianjin Normal University filed Critical Tianjin Normal University
Priority to CN202310840292.9A priority Critical patent/CN116564540B/zh
Publication of CN116564540A publication Critical patent/CN116564540A/zh
Application granted granted Critical
Publication of CN116564540B publication Critical patent/CN116564540B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/20Ensemble learning
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Medical Informatics (AREA)
  • Public Health (AREA)
  • Health & Medical Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Primary Health Care (AREA)
  • Databases & Information Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Pathology (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Epidemiology (AREA)
  • Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Biomedical Technology (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及数据处理领域,公开了一种基于集成学习算法的角膜塑形镜参数预测方法及系统,用于提高对角膜塑形镜参数预测时的准确率。方法包括:对历史视光检查数据集进行子集分割得到多个特征子集;对每个特征子集进行角膜塑形镜参数预测,得到候选预测数据;对真实数据与候选预测数据进行误差分析,得到误差数据;对每个基学习器进行权重计算得到每个基学习器的权重数据;对候选预测数据进行样本权重分析生成样本权重集合,对多个候选预测数据进行加权处理得到待分析特征数据集;通过每个基学习器对应的权重数据对待分析特征数据集进行加权处理,得到目标特征数据集;将目标特征数据集输入元学习器进行角膜塑形镜参数预测得到目标预测数据。

Description

基于集成学习算法的角膜塑形镜参数预测方法及系统
技术领域
本发明涉及数据处理技术领域,尤其涉及一种基于集成学习算法的角膜塑形镜参数预测方法及系统。
背景技术
角膜塑形镜基本原理是近视患者通过佩戴一种硬性透气性角膜接触镜片,利用镜片下泪液分布不均匀而产生的流体力学效应改变其角膜几何形态,逐步使角膜弯曲度变平,从而达到缩短眼轴、控制近视增长的目的。该方法可在短期内暂时性提高稳定的裸眼视力,近视患者通过夜间佩戴后,白天即使不佩戴框架眼镜/隐形近视眼镜,也能获得清晰的视力,对青少年的进行性近视可发挥有效延缓加深的作用。多年来的临床观察表明:在专业眼视光医生的参与、监督指导下,采用角膜塑形镜矫治近视基本上是安全的,控制近视发展的疗效确切。因此角膜塑形镜的精准验配研究对于青少年近视防控具有非常重要的意义。
但是,在数据量有限的情况下,如何在充分利用数据资源的同时提高模型泛化能力,是集成学习算法需解决的重要问题之一,角膜塑形镜的验配对医师的要求较高,临床经验丰富的医师可以依据患者眼部检查参数,较为准确地分析得出试戴片参数,减少患者试戴次数,降低因多次试戴导致的感染风险,提升患者验配体验及验配效率。然而纵观眼科医学领域,眼病客观诊疗需求同优质医生及医疗资源之间存在较为严重的不匹配现象,同时,在对角膜塑形镜参数预测时,往往数据量不足,同时通过历史数据对角膜塑形镜参数预测时往往会产生过拟合的情况,因此,在对角膜塑形镜参数预测时准确率较低。
发明内容
有鉴于此,本发明实施例提供了一种基于集成学习算法的角膜塑形镜参数预测方法及系统,解决了对角膜塑形镜参数预测时准确率较低的技术问题。
本发明提供了一种基于集成学习算法的角膜塑形镜参数预测方法,包括:获取历史视光检查数据集,并对所述历史视光检查数据集进行子集分割,得到多个特征子集;通过每个所述特征子集对应的基学习器分别对每个所述特征子集进行角膜塑形镜参数预测,得到每个所述特征子集对应的候选预测数据;采集多个所述特征子集对应的真实数据,并对所述真实数据与所述候选预测数据进行误差分析,得到每个所述特征子集对应的误差数据;通过每个所述特征子集对应的误差数据分别对每个所述基学习器进行权重计算,得到每个所述基学习器对应的权重数据;对每个所述特征子集的候选预测数据进行样本权重分析,生成样本权重集合,并通过所述样本权重集合对多个所述候选预测数据进行第一加权处理,得到待分析特征数据集;通过每个所述基学习器对应的权重数据对所述待分析特征数据集进行第二加权处理,得到目标特征数据集;将所述目标特征数据集输入预置的元学习器进行角膜塑形镜参数预测,得到对应的目标预测数据。
在本发明中,所述获取历史视光检查数据集,并对所述历史视光检查数据集进行子集分割,得到多个特征子集步骤,包括:对所述历史视光检查数据集进行数据特征提取,得到多个数据特征;对所述多个数据特征进行特征数量分析,确定待处理特征数量;对所述待处理特征数量进行子集特征数量分析,确定目标特征数量;通过所述目标特征数量对所述历史视光检查数据集进行子集分割,得到多个特征子集。
在本发明中,在获取历史视光检查数据集,并对所述历史视光检查数据集进行子集分割,得到多个数据子集步骤之后,在所述通过每个所述特征子集对应的基学习器分别对每个所述特征子集进行角膜塑形镜参数预测,得到每个所述特征子集对应的候选预测数据之前,还包括:对多个所述特征子集进行数量分析,确定子集数量;基于所述子集数量进行基学习器构建,得到每个所述特征子集对应的基学习器。
在本发明中,所述通过每个所述特征子集对应的误差数据分别对每个所述基学习器进行权重计算,得到每个所述基学习器对应的权重数据步骤,包括:通过每个所述特征子集对应的误差数据分别对每个所述基学习器进行数据贡献度分析,得到每个所述基学习器对应的数据贡献度;通过每个所述特征子集对应的数据贡献度分别对每个所述基学习器进行权重分析,得到每个所述基学习器对应的权重数据。
在本发明中,所述通过每个所述特征子集对应的误差数据分别对每个所述基学习器进行数据贡献度分析,得到每个所述基学习器对应的数据贡献度步骤,包括:通过每个所述特征子集对应的误差数据分别对每个所述基学习器进行归一化样本误差计算,得到每个所述基学习器对应的归一化样本误差集合;基于每个所述基学习器对应的归一化样本误差集合分别对每个所述基学习器进行平均归一化样本误差分析,得到每个所述基学习器对应的平均归一化样本误差数据;基于每个所述基学习器对应的平均归一化样本误差数据,分别对每个所述基学习器进行数据贡献度分析,得到每个所述基学习器对应的数据贡献度。
在本发明中,所述通过每个所述特征子集对应的误差数据分别对每个所述基学习器进行归一化样本误差计算,得到每个所述基学习器对应的归一化样本误差集合步骤,包括:
基于归一化样本误差计算公式,通过每个所述特征子集对应的误差数据分别对每个所述基学习器进行归一化样本误差计算,得到每个所述基学习器对应的归一化样本误差集合,其中,所述归一化样本误差计算公式如下所示:
其中,表示特征子集中第/>个样本/>对应的归一化样本误差,/>表示特征子集中第/>个样本对应的真实标签,/>表示第n个基学习器对特征子集中第/>个样本/>的候选预测数据,/>表示第n个基学习器的最大预测误差。
在本发明中,在所述将所述目标特征数据集输入预置的元学习器进行角膜塑形镜参数预测,得到对应的目标预测数据步骤之后,还包括:对所述目标预测数据进行表格创建,得到预测数据表;将所述预测数据表传输至预置的数据展示终端。
本发明还提供了一种基于集成学习算法的角膜塑形镜参数预测系统,包括:
获取模块,用于获取历史视光检查数据集,并对所述历史视光检查数据集进行子集分割,得到多个特征子集;
第一预测模块,用于通过每个所述特征子集对应的基学习器分别对每个所述特征子集进行角膜塑形镜参数预测,得到每个所述特征子集对应的候选预测数据;
误差分析模块,用于采集多个所述特征子集对应的真实数据,并对所述真实数据与所述候选预测数据进行误差分析,得到每个所述特征子集对应的误差数据;
计算模块,用于通过每个所述特征子集对应的误差数据分别对每个所述基学习器进行权重计算,得到每个所述基学习器对应的权重数据;
权重分析模块,用于对每个所述特征子集的候选预测数据进行样本权重分析,生成样本权重集合,并通过所述样本权重集合对多个所述候选预测数据进行第一加权处理,得到待分析特征数据集;
处理模块,用于通过每个所述基学习器对应的权重数据对所述待分析特征数据集进行第二加权处理,得到目标特征数据集;
第二预测模块,用于将所述目标特征数据集输入预置的元学习器进行角膜塑形镜参数预测,得到对应的目标预测数据。
本发明提供的技术方案中,获取历史视光检查数据集,并对所述历史视光检查数据集进行子集分割,得到多个特征子集;通过每个所述特征子集对应的基学习器分别对每个所述特征子集进行角膜塑形镜参数预测,得到每个所述特征子集对应的候选预测数据;采集多个所述特征子集对应的真实数据,并对所述真实数据与所述候选预测数据进行误差分析,得到每个所述特征子集对应的误差数据;通过每个所述特征子集对应的误差数据分别对每个所述基学习器进行权重计算,得到每个所述基学习器对应的权重数据;对每个所述特征子集的候选预测数据进行样本权重分析,生成样本权重集合,并通过所述样本权重集合对多个所述候选预测数据进行第一加权处理,得到待分析特征数据集;通过每个所述基学习器对应的权重数据对所述待分析特征数据集进行第二加权处理,得到目标特征数据集;将所述目标特征数据集输入预置的元学习器进行角膜塑形镜参数预测,得到对应的目标预测数据。在本申请中,采用“去一法”对每个基学习器的输入特征进行筛选,根据基学习器的训练结果判断各特征对于预测结果的重要性,并以此为依据设定首层学习器的预测结果在输入二层学习器训练时的权重,同时,每个基学习器建模使用n-1个特征,通过对比基学习器预测结果之间的差异,能够体现每个基学习器所使用的特征子集中缺失特征对于预测结果的重要性,为特征筛选提供依据,利用更少的特征进行建模,能够在一定程度上降低模型对数据集样本数量的要求,防止过拟合,以进一步提高对角膜塑形镜参数预测时的准确率。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例中基于集成学习算法的角膜塑形镜参数预测方法的流程图。
图2为本发明实施例中通过每个特征子集对应的误差数据分别对每个基学习器进行权重计算的流程图。
图3为本发明实施例中基于集成学习算法的角膜塑形镜参数预测系统的示意图。
附图标记:
3001、获取模块;3002、第一预测模块;3003、误差分析模块;3004、计算模块;3005、权重分析模块;3006、处理模块;3007、第二预测模块;3008、数量分析模块;3009、构建模块;3010、创建模块。
具体实施方式
下面将结合附图对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在本发明的描述中,需要说明的是,术语“中心”、“上”、“下”、“左”、“右”、“竖直”、“水平”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。此外,术语“第一”、“第二”、“第三”仅用于描述目的,而不能理解为指示或暗示相对重要性。
此外,下面所描述的本发明不同实施方式中所涉及的技术特征只要彼此之间未构成冲突就可以相互结合。
为便于理解,下面对本发明实施例的具体流程进行描述,请参阅图1,图1是本发明实施例的基于集成学习算法的角膜塑形镜参数预测方法的流程图,如图1所示,包括以下步骤:
S101、获取历史视光检查数据集,并对历史视光检查数据集进行子集分割,得到多个特征子集;
具体的,服务器获取历史视光检查数据集,首先,确定该历史角膜塑形镜参数的数据源类型以及格式,进一步的,服务器对历史视光检查数据集进行子集分割,将历史视光检查数据集划分为多个特征子集,需要说明的是,在本发明实施例中,将数据集全部特征通过“去一法”建立特征子集,即由N个特征构成的原数据集将被分割为由N-1个特征构成的N个子集。
需要说明的是,在本发明实施例中,在对历史视光检查数据集进行子集分割之前,服务器对历史角膜塑形镜参数进行预处理,例如数据清洗、去除异常值、归一化等。
需要说明的是,本发明实施例中的历史视光检查数据集,包含有效数据项共1454条,记录了727位年龄在7-15岁的青少年近视患者的双眼检查数据。针对梦戴维品牌角膜塑形镜验配需要,该数据集特征与标签情况如下:数据集特征部分为“性别”、“年龄”、“FK”、“SK”、“平均E值”、“角膜直径”、“前房深度”、“眼轴”、“球镜”、“柱镜”、“轴向”共11个数值,而需要模型进行预测的角膜塑形镜参数包括:“降幅”、“AC”、“CP”、“直径”共四个标签。
S102、通过每个特征子集对应的基学习器分别对每个特征子集进行角膜塑形镜参数预测,得到每个特征子集对应的候选预测数据;
具体的,服务器建立与特征子集数量相同的多个同质基学习器,并对每个特征子集分别进行交叉验证并求平均值,得到多个候选预测数据,构成集成模型的首层结构,需要说明的是,在选择基学习器时,根据特征子集中的数据类型构建,例如,当特征子集中的数据为数值型时,通过线性回归算法构建基学习器,进而在角膜塑形镜参数预测时,服务器将历史角膜塑形镜参数输入到相应的基学习器中进行训练,并对每个特征子集进行角膜塑形镜参数预测,得到每个特征子集对应的候选预测数据。
S103、采集多个特征子集对应的真实数据,并对真实数据与候选预测数据进行误差分析,得到每个特征子集对应的误差数据;
S104、通过每个特征子集对应的误差数据分别对每个基学习器进行权重计算,得到每个基学习器对应的权重数据;
具体的,以基学习器为研究对象,通过计算该学习器预测值与真实值的归一化样本误差的均值,判断该学习器特征子集中从原数据集去掉的属性对模型的贡献度,并以此为依据设定该基学习器权重,其中,在采集多个特征子集对应的真实数据时,例如,当预测角膜塑形镜参数时,可以采集历史塑形镜参数、属性等数据,并且,在计算预测误差时,获取误差度量指标,例如,对于回归模型,通过均方误差(MSE)或平均绝对误差(MAE)等指标来评估模型的拟合程度和准确性。对于分类模型,则通常使用准确率、精确率、召回率或F1值等指标来评估模型的分类效果。在计算误差时,需要考虑异常值、缺失值和噪声等因素,并做出相应的处理和调整,同时,在可视化和分析误差数据时,通过多种图表和工具来帮助观察误差分布和变化趋势。例如,通过绘制误差分布图,分析预测误差的分布情况,并发现异常值和离群点;通过绘制箱线图比较不同模型和算法的性能差异,并观察误差的中位数、四分位数和范围等参数;通过绘制残差分析图,判断数据之间的拟合程度和线性关系,进而分别对每个基学习器进行权重计算,得到每个基学习器对应的权重数据。
S105、对每个特征子集的候选预测数据进行样本权重分析,生成样本权重集合,并通过样本权重集合对多个候选预测数据进行第一加权处理,得到待分析特征数据集;
S106、通过每个基学习器对应的权重数据对待分析特征数据集进行第二加权处理,得到目标特征数据集;
S107、将目标特征数据集输入预置的元学习器进行角膜塑形镜参数预测,得到对应的目标预测数据。
具体的,对每个特征子集的候选预测数据进行样本权重分析,生成样本权重集合,并通过样本权重集合对多个候选预测数据进行第一加权处理,得到待分析特征数据集,通过每个基学习器对应的权重数据对待分析特征数据集进行第二加权处理,得到目标特征数据集,其中,需要说明的是,在本发明实施例中,根据各基学习器对每个特征子集的候选预测数据的整体表现,计算在进行元学习器训练时使用的该样本的权重。根据首层各基学习器的预测结果,确定各基学习器权重,并将预测结果与权重的积视为通过首层学习器提取的新特征,选择性能稳定的算法构成模型的第二层元学习器,根据计算得到的样本权重对待分析特征数据集进行加权,作为第二层元学习器的输入数据,也即目标特征数据集,元学习器经训练后得出集成模型的最终预测结果。
通过执行上述步骤,获取历史视光检查数据集,并对历史视光检查数据集进行子集分割,得到多个特征子集;通过每个特征子集对应的基学习器分别对每个特征子集进行角膜塑形镜参数预测,得到每个特征子集对应的候选预测数据;采集多个特征子集对应的真实数据,并对真实数据与候选预测数据进行误差分析,得到每个特征子集对应的误差数据;通过每个特征子集对应的误差数据分别对每个基学习器进行权重计算,得到每个基学习器对应的权重数据;对每个特征子集的候选预测数据进行样本权重分析,生成样本权重集合,并通过样本权重集合对多个候选预测数据进行第一加权处理,得到待分析特征数据集;通过每个基学习器对应的权重数据对待分析特征数据集进行第二加权处理,得到目标特征数据集;将目标特征数据集输入预置的元学习器进行角膜塑形镜参数预测,得到对应的目标预测数据。在本申请中,采用“去一法”对每个基学习器的输入特征进行筛选,根据基学习器的训练结果判断各特征对于预测结果的重要性,并以此为依据设定首层学习器的预测结果在输入二层学习器训练时的权重,同时,每个基学习器建模使用n-1个特征,通过对比基学习器预测结果之间的差异,能够体现每个基学习器所使用的特征子集中缺失特征对于预测结果的重要性,为特征筛选提供依据,利用更少的特征进行建模,能够在一定程度上降低模型对数据集样本数量的要求,防止过拟合,以进一步提高对角膜塑形镜参数预测时的准确率。
在一具体实施例中,执行步骤S101的过程可以具体包括如下步骤:
(1)对历史视光检查数据集进行数据特征提取,得到多个数据特征;
(2)对多个数据特征进行特征数量分析,确定待处理特征数量;
(3)对待处理特征数量进行子集特征数量分析,确定目标特征数量;
(4)通过目标特征数量对历史视光检查数据集进行子集分割,得到多个特征子集。
具体的,对历史视光检查数据集进行数据特征提取,得到多个数据特征,进而通过该多个数据特征进行数量分析和子集分割,以确定最终的目标特征数量和特征子集。其中,首先对多个数据特征进行特征数量分析,在本发明实施例中,服务器通过主成分分析进行筛选特征,以减少特征数量和消除冗余信息,同时,确定对应的待处理特征数量,其次,在确定待处理特征数量后,将该待处理特征数量作为子集特征数量,最终得到目标特征数量,最终,服务器通过目标特征数量对历史视光检查数据集进行子集分割,得到多个特征子集,具体的,服务器获取历史视光检查数据集,首先,确定该历史角膜塑形镜参数的数据源类型以及格式,进一步的,服务器对历史视光检查数据集进行子集分割,将历史视光检查数据集划分为多个特征子集,需要说明的是,在本发明实施例中,将数据集全部特征通过“去一法”建立特征子集,即由N个特征构成的原数据集将被分割为由N-1个特征构成的N个子集。
在一具体实施例中,在步骤S101之后,在步骤S102之前,还可以具体包括如下步骤:
(1)对多个特征子集进行数量分析,确定子集数量;
(2)基于子集数量进行基学习器构建,得到每个特征子集对应的基学习器。
首先,服务器对多个特征子集进行数量分析,具体的,服务器通过聚类分析将所有特征子集分成若干个互不重叠的子集,并根据每个子集的规模、复杂度、相关性等特征来确定最终的子集数量,在确定子集数量后,基于子集数量进行基学习器构建,需要说明的是,基学习器是一种具有简单结构和较弱预测能力的模型,例如决策树、支持向量机、逻辑回归等。针对每个特征子集训练一个基学习器,并通过交叉验证、留一法等方法来评估模型的性能和泛化能力,最终得到每个特征子集对应的基学习器。
在一具体实施例中,在步骤S106之后,还可以具体包括如下步骤:
(1)对目标预测数据进行表格创建,得到预测数据表;
(2)将预测数据表传输至预置的数据展示终端。
具体的,首先,在对每个目标特征子集进行预测后,将预测结果整理成一个预测数据表。具体的,预测数据表一般包括若干行和若干列,其中每一行代表一个或塑形镜参数,每一列代表一个预测特征或目标变量,使用Excel、CSV等文件格式来创建和存储预测数据表,并根据需要进行格式化和排序等操作,进而,将预测数据表传输至预置的数据展示终端,需要说明的是,数据展示终端通常是一种能够实时显示和分析数据的软件或硬件设备,例如云平台、Web应用程序、移动客户端等。通过将预测数据表传输至数据展示终端,用户可以方便地查看和分析模型的预测结果,并根据需求进行进一步处理和决策。
在一具体实施例中,如图2所示,执行步骤S104的过程可以具体包括如下步骤:
S201、通过每个特征子集对应的误差数据分别对每个基学习器进行数据贡献度分析,得到每个基学习器对应的数据贡献度;
S202、通过每个特征子集对应的数据贡献度分别对每个基学习器进行权重分析,得到每个基学习器对应的权重数据。
具体的,在完成每个特征子集的预测后,使用真实值与预测值之间的误差来衡量模型的预测性能。具体的,计算每个样本的预测误差,并根据误差大小和方向,确定每个基学习器在模型中的数据贡献度。例如,如果一个基学习器的预测误差较小,说明该基学习器对模型的预测结果有较大的贡献;反之,如果一个基学习器的预测误差较大,则说明该基学习器对模型的预测结果没有明显的贡献,进而,在确定每个基学习器的数据贡献度后,通过每个特征子集对应的数据贡献度分别对每个基学习器进行权重分析。具体的,根据每个基学习器的数据贡献度大小和特征子集复杂度等因素,确定每个基学习器在模型中的权重值,并将其作为一种评估标准和参考指标。例如,如果一个基学习器在某个特征子集中的数据贡献度较大,而该特征子集的复杂度又较低,则说明该基学习器对模型的预测结果有很大的权重;反之,如果一个基学习器在某个特征子集中的数据贡献度较小,或者该特征子集的复杂度较高,则说明该基学习器对模型的预测结果的权重较小,需要说明的是,在进行基学习器的权重计算时,根据具体集成方法来选择合适的算法和模型。例如,在Boosting算法中,使用残差误差或梯度信息来计算每个基学习器的权重;在Bagging算法中,则通常采用投票或平均法来计算每个基学习器的权重。同时,在进行权重计算时,也需要考虑数据的质量和特征的相关性,并使用交叉验证、留一法等方法来降低过拟合和欠拟合问题,在可视化和分析基学习器的权重数据时,使用多种图表和工具来帮助观察权重分布和变化趋势。例如,通过绘制权重柱状图,比较不同基学习器的贡献程度,并观察其相互关系和特征选择情况;通过绘制热力图,发现不同特征子集和基学习器之间的关联和相关性;通过绘制散点图,判断权重数据的稳定性和泛化能力,并优化集成方法的参数和效果,最终,通过每个特征子集对应的数据贡献度分别对每个基学习器进行权重分析,得到每个基学习器对应的权重数据。
在一具体实施例中,执行步骤S201的过程可以具体包括如下步骤:
(1)通过每个特征子集对应的误差数据分别对每个基学习器进行归一化样本误差计算,得到每个基学习器对应的归一化样本误差集合;
(2)基于每个基学习器对应的归一化样本误差集合分别对每个基学习器进行平均归一化样本误差分析,得到每个基学习器对应的平均归一化样本误差数据;
(3)基于每个基学习器对应的平均归一化样本误差数据,分别对每个基学习器进行数据贡献度分析,得到每个基学习器对应的数据贡献度。
具体的,首先,在完成每个特征子集的预测后,使用真实值与预测值之间的误差来衡量模型的预测性能。具体的,计算每个样本的预测误差,并将其进行归一化处理,得到每个基学习器对应的归一化样本误差集合。归一化操作可以将误差范围缩放到0-1之间,使得不同特征子集中的误差数据可以进行比较和组合。进而,在得到每个基学习器对应的归一化样本误差集合后,基于每个基学习器对应的归一化样本误差集合分别计算平均归一化样本误差,并将其作为一种评估标准和参考指标。具体的,将每个归一化样本误差值相加,并除以总样本数,得到每个基学习器对应的平均归一化样本误差数据。平均归一化样本误差值越小,说明该基学习器在模型中的贡献度越大。最后,在确定每个基学习器的平均归一化样本误差数据后,通过对每个基学习器的平均归一化样本误差进行排序和分析,得到每个基学习器对应的数据贡献度大小。具体的,按照平均归一化样本误差从小到大排序,然后根据排序结果确定每个基学习器在模型中的数据贡献度。例如,排名靠前的基学习器对模型的预测结果贡献较大;反之,排名靠后的基学习器对模型的预测结果贡献较小,在本申请中,可以使用元学习器对目标特征数据集进行角膜塑形镜参数预测,得到目标预测数据。
在一具体实施例中,执行通过每个特征子集对应的误差数据分别对每个基学习器进行归一化样本误差计算,得到每个基学习器对应的归一化样本误差集合步骤的过程,包括如下步骤:
基于归一化样本误差计算公式,通过每个特征子集对应的误差数据分别对每个基学习器进行归一化样本误差计算,得到每个基学习器对应的归一化样本误差集合,其中,归一化样本误差计算公式如下所示:
其中,表示特征子集中第/>个样本/>对应的归一化样本误差,/>表示特征子集中第/>个样本对应的真实标签,/>表示第n个基学习器对特征子集中第/>个样本/>的候选预测数据,/>表示第n个基学习器的最大预测误差。
同时,还需要说明的是,在得到归一化样本误差后,计算每个基学习器的平均归一化样本误差,最终,基于每个特征子集对应的误差数据,通过权重计算公式,分别对每个基学习器进行权重计算,得到每个基学习器对应的权重数据,其中,该权重计算公式如下所示:
其中,为平均化归一化样本误差,/>为第n个基学习器对应的权重数据。
需要说明的是,在本申请实施例中,得到每个基学习器对应的权重数据之后,通过平均误差计算公式,计算特征子集中各样本预测值对应的样本平均误差,进而,通过样本平均误差计算得到每个样本对应的权重数据,其中,该平均误差计算公式如下所示:
其中,表示特征子集中第/>个样本/>对应的平均误差;/>表示基学习器的数量,进而计算所有样本的平均误差,计算公式如下所示:
其中,为样本数量,进一步的,计算样本的权重系数,计算公式如下所示:
其中,为权重系数。最终,根据该权重系数,计算特征子集中第/>个样本/>对应的训练权重,计算公式如下所示:
其中,为特征子集中第/>个样本/>对应的训练权重,/>表示规范化因子,其中,规范化因子/>的计算公式如下:
本发明实施例还提供了一种基于集成学习算法的角膜塑形镜参数预测系统,如图3所示,该基于集成学习算法的角膜塑形镜参数预测系统具体包括:
获取模块3001,用于获取历史视光检查数据集,并对所述历史视光检查数据集进行子集分割,得到多个特征子集;
第一预测模块3002,用于通过每个所述特征子集对应的基学习器分别对每个所述特征子集进行角膜塑形镜参数预测,得到每个所述特征子集对应的候选预测数据;
误差分析模块3003,用于采集多个所述特征子集对应的真实数据,并对所述真实数据与所述候选预测数据进行误差分析,得到每个所述特征子集对应的误差数据;
计算模块3004,用于通过每个所述特征子集对应的误差数据分别对每个所述基学习器进行权重计算,得到每个所述基学习器对应的权重数据;
权重分析模块3005,用于对每个所述特征子集的候选预测数据进行样本权重分析,生成样本权重集合,并通过所述样本权重集合对多个所述候选预测数据进行第一加权处理,得到待分析特征数据集;
处理模块3006,用于通过每个所述基学习器对应的权重数据对所述待分析特征数据集进行第二加权处理,得到目标特征数据集;
第二预测模块3007,用于将所述目标特征数据集输入预置的元学习器进行角膜塑形镜参数预测,得到对应的目标预测数据。
可选的,所述获取模块301具体用于:对所述历史视光检查数据集进行数据特征提取,得到多个数据特征;对所述多个数据特征进行特征数量分析,确定待处理特征数量;对所述待处理特征数量进行子集特征数量分析,确定目标特征数量;通过所述目标特征数量对所述历史视光检查数据集进行子集分割,得到多个特征子集。
可选的,所述基于集成学习算法的角膜塑形镜参数预测系统还包括:
数量分析模块3008,用于对多个所述特征子集进行数量分析,确定子集数量;
构建模块3009,用于基于所述子集数量进行基学习器构建,得到每个所述特征子集对应的基学习器。
可选的,所述计算模块3004还包括:
第一分析子模块,用于通过每个所述特征子集对应的误差数据分别对每个所述基学习器进行数据贡献度分析,得到每个所述基学习器对应的数据贡献度;
第二分析子模块,用于通过每个所述特征子集对应的数据贡献度分别对每个所述基学习器进行权重分析,得到每个所述基学习器对应的权重数据。
可选的,所述第一分析子模块还包括:
计算单元,用于通过每个所述特征子集对应的误差数据分别对每个所述基学习器进行归一化样本误差计算,得到每个所述基学习器对应的归一化样本误差集合;
误差分析单元,用于基于每个所述基学习器对应的归一化样本误差集合分别对每个所述基学习器进行平均归一化样本误差分析,得到每个所述基学习器对应的平均归一化样本误差数据;
贡献度分析单元,用于基于每个所述基学习器对应的平均归一化样本误差数据,分别对每个所述基学习器进行数据贡献度分析,得到每个所述基学习器对应的数据贡献度。
可选的,所述计算单元具体用于:基于归一化样本误差计算公式,通过每个所述特征子集对应的误差数据分别对每个所述基学习器进行归一化样本误差计算,得到每个所述基学习器对应的归一化样本误差集合,其中,所述归一化样本误差计算公式如下所示:
其中,表示特征子集中第/>个样本/>对应的归一化样本误差,/>表示特征子集中第/>个样本对应的真实标签,/>表示第n个基学习器对特征子集中第/>个样本/>的候选预测数据,/>表示第n个基学习器的最大预测误差。
可选的,基于集成学习算法的角膜塑形镜参数预测系统还包括:
创建模块3010,用于对所述目标预测数据进行表格创建,得到预测数据表;将所述预测数据表传输至预置的数据展示终端。
通过上述各个模块的协同合作,获取历史视光检查数据集,并对所述历史视光检查数据集进行子集分割,得到多个特征子集;通过每个所述特征子集对应的基学习器分别对每个所述特征子集进行角膜塑形镜参数预测,得到每个所述特征子集对应的候选预测数据;采集多个所述特征子集对应的真实数据,并对所述真实数据与所述候选预测数据进行误差分析,得到每个所述特征子集对应的误差数据;通过每个所述特征子集对应的误差数据分别对每个所述基学习器进行权重计算,得到每个所述基学习器对应的权重数据;对每个所述特征子集的候选预测数据进行样本权重分析,生成样本权重集合,并通过所述样本权重集合对多个所述候选预测数据进行第一加权处理,得到待分析特征数据集;通过每个所述基学习器对应的权重数据对所述待分析特征数据集进行第二加权处理,得到目标特征数据集;将所述目标特征数据集输入预置的元学习器进行角膜塑形镜参数预测,得到对应的目标预测数据。在本申请中,采用“去一法”对每个基学习器的输入特征进行筛选,根据基学习器的训练结果判断各特征对于预测结果的重要性,并以此为依据设定首层学习器的预测结果在输入二层学习器训练时的权重,同时,每个基学习器建模使用n-1个特征,通过对比基学习器预测结果之间的差异,能够体现每个基学习器所使用的特征子集中缺失特征对于预测结果的重要性,为特征筛选提供依据,利用更少的特征进行建模,能够在一定程度上降低模型对数据集样本数量的要求,防止过拟合,以进一步提高对角膜塑形镜参数预测时的准确率。
以上实施例仅用以说明本发明的技术方案而非对其限制,尽管参照实施例对本发明进行了详细的说明,所属领域的普通技术人员应当理解:依然可以对本发明的具体实施方式进行修改或者等同替换,而未脱离本发明精神和范围的任何修改或者等同替换,其均应涵盖在本发明的权利要求范围当中。

Claims (8)

1.一种基于集成学习算法的角膜塑形镜参数预测方法,其特征在于,方法包括:
获取历史视光检查数据集,并对所述历史视光检查数据集进行子集分割,得到多个特征子集;
通过每个所述特征子集对应的基学习器分别对每个所述特征子集进行角膜塑形镜参数预测,得到每个所述特征子集对应的候选预测数据;
采集多个所述特征子集对应的真实数据,并对所述真实数据与所述候选预测数据进行误差分析,得到每个所述特征子集对应的误差数据;
通过每个所述特征子集对应的误差数据分别对每个所述基学习器进行权重计算,得到每个所述基学习器对应的权重数据;
对每个所述特征子集的候选预测数据进行样本权重分析,生成样本权重集合,并通过所述样本权重集合对多个所述候选预测数据进行第一加权处理,得到待分析特征数据集;
通过每个所述基学习器对应的权重数据对所述待分析特征数据集进行第二加权处理,得到目标特征数据集;
将所述目标特征数据集输入预置的元学习器进行角膜塑形镜参数预测,得到对应的目标预测数据。
2.根据权利要求1所述的基于集成学习算法的角膜塑形镜参数预测方法,其特征在于,所述获取历史视光检查数据集,并对所述历史视光检查数据集进行子集分割,得到多个特征子集步骤,包括:
对所述历史视光检查数据集进行数据特征提取,得到多个数据特征;
对所述多个数据特征进行特征数量分析,确定待处理特征数量;
对所述待处理特征数量进行子集特征数量分析,确定目标特征数量;
通过所述目标特征数量对所述历史视光检查数据集进行子集分割,得到多个特征子集。
3.根据权利要求1所述的基于集成学习算法的角膜塑形镜参数预测方法,其特征在于,在获取历史视光检查数据集,并对所述历史视光检查数据集进行子集分割,得到多个数据子集步骤之后,在所述通过每个所述特征子集对应的基学习器分别对每个所述特征子集进行角膜塑形镜参数预测,得到每个所述特征子集对应的候选预测数据之前,还包括:
对多个所述特征子集进行数量分析,确定子集数量;
基于所述子集数量进行基学习器构建,得到每个所述特征子集对应的基学习器。
4.根据权利要求1所述的基于集成学习算法的角膜塑形镜参数预测方法,其特征在于,所述通过每个所述特征子集对应的误差数据分别对每个所述基学习器进行权重计算,得到每个所述基学习器对应的权重数据步骤,包括:
通过每个所述特征子集对应的误差数据分别对每个所述基学习器进行数据贡献度分析,得到每个所述基学习器对应的数据贡献度;
通过每个所述特征子集对应的数据贡献度分别对每个所述基学习器进行权重分析,得到每个所述基学习器对应的权重数据。
5.根据权利要求4所述的基于集成学习算法的角膜塑形镜参数预测方法,其特征在于,所述通过每个所述特征子集对应的误差数据分别对每个所述基学习器进行数据贡献度分析,得到每个所述基学习器对应的数据贡献度步骤,包括:
通过每个所述特征子集对应的误差数据分别对每个所述基学习器进行归一化样本误差计算,得到每个所述基学习器对应的归一化样本误差集合;
基于每个所述基学习器对应的归一化样本误差集合分别对每个所述基学习器进行平均归一化样本误差分析,得到每个所述基学习器对应的平均归一化样本误差数据;
基于每个所述基学习器对应的平均归一化样本误差数据,分别对每个所述基学习器进行数据贡献度分析,得到每个所述基学习器对应的数据贡献度。
6.根据权利要求5所述的基于集成学习算法的角膜塑形镜参数预测方法,其特征在于,所述通过每个所述特征子集对应的误差数据分别对每个所述基学习器进行归一化样本误差计算,得到每个所述基学习器对应的归一化样本误差集合步骤,包括:
基于归一化样本误差计算公式,通过每个所述特征子集对应的误差数据分别对每个所述基学习器进行归一化样本误差计算,得到每个所述基学习器对应的归一化样本误差集合,其中,所述归一化样本误差计算公式如下所示:
其中,表示特征子集中第/>个样本/>对应的归一化样本误差,/>表示特征子集中第个样本对应的真实标签,/>表示第n个基学习器对特征子集中第/>个样本/>的候选预测数据,/>表示第n个基学习器的最大预测误差。
7.根据权利要求1所述的基于集成学习算法的角膜塑形镜参数预测方法,其特征在于,在所述将所述目标特征数据集输入预置的元学习器进行角膜塑形镜参数预测,得到对应的目标预测数据步骤之后,还包括:
对所述目标预测数据进行表格创建,得到预测数据表;
将所述预测数据表传输至预置的数据展示终端。
8.一种基于集成学习算法的角膜塑形镜参数预测系统,用以执行如权利要求1至7任一项所述的基于集成学习算法的角膜塑形镜参数预测方法,其特征在于,包括:
获取模块,用于获取历史视光检查数据集,并对所述历史视光检查数据集进行子集分割,得到多个特征子集;
第一预测模块,用于通过每个所述特征子集对应的基学习器分别对每个所述特征子集进行角膜塑形镜参数预测,得到每个所述特征子集对应的候选预测数据;
误差分析模块,用于采集多个所述特征子集对应的真实数据,并对所述真实数据与所述候选预测数据进行误差分析,得到每个所述特征子集对应的误差数据;
计算模块,用于通过每个所述特征子集对应的误差数据分别对每个所述基学习器进行权重计算,得到每个所述基学习器对应的权重数据;
权重分析模块,用于对每个所述特征子集的候选预测数据进行样本权重分析,生成样本权重集合,并通过所述样本权重集合对多个所述候选预测数据进行第一加权处理,得到待分析特征数据集;
处理模块,用于通过每个所述基学习器对应的权重数据对所述待分析特征数据集进行第二加权处理,得到目标特征数据集;
第二预测模块,用于将所述目标特征数据集输入预置的元学习器进行角膜塑形镜参数预测,得到对应的目标预测数据。
CN202310840292.9A 2023-07-11 2023-07-11 基于集成学习算法的角膜塑形镜参数预测方法及系统 Active CN116564540B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310840292.9A CN116564540B (zh) 2023-07-11 2023-07-11 基于集成学习算法的角膜塑形镜参数预测方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310840292.9A CN116564540B (zh) 2023-07-11 2023-07-11 基于集成学习算法的角膜塑形镜参数预测方法及系统

Publications (2)

Publication Number Publication Date
CN116564540A true CN116564540A (zh) 2023-08-08
CN116564540B CN116564540B (zh) 2023-09-08

Family

ID=87495154

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310840292.9A Active CN116564540B (zh) 2023-07-11 2023-07-11 基于集成学习算法的角膜塑形镜参数预测方法及系统

Country Status (1)

Country Link
CN (1) CN116564540B (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN203957995U (zh) * 2014-06-09 2014-11-26 天津师范大学 汽车鸣笛身份识别装置
CN115543638A (zh) * 2022-12-01 2022-12-30 中南大学 基于不确定性的边缘计算数据收集分析方法、系统及设备
CN115910328A (zh) * 2022-12-23 2023-04-04 天津鹏升科技有限公司 一种基于人工智能分析的角膜塑形镜验配系统
US20230106667A1 (en) * 2021-10-05 2023-04-06 Unitedhealth Group Incorporated Machine learning techniques using iterative feature refinement routines
CN115998243A (zh) * 2023-01-06 2023-04-25 天津市眼科医院视光中心有限公司 一种基于眼轴增长预测和角膜信息验配角膜塑形镜的方法
WO2023077411A1 (en) * 2021-11-05 2023-05-11 Carl Zeiss Vision International Gmbh Devices and methods for determining data related to a progression of refractive values of a person

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN203957995U (zh) * 2014-06-09 2014-11-26 天津师范大学 汽车鸣笛身份识别装置
US20230106667A1 (en) * 2021-10-05 2023-04-06 Unitedhealth Group Incorporated Machine learning techniques using iterative feature refinement routines
WO2023077411A1 (en) * 2021-11-05 2023-05-11 Carl Zeiss Vision International Gmbh Devices and methods for determining data related to a progression of refractive values of a person
CN115543638A (zh) * 2022-12-01 2022-12-30 中南大学 基于不确定性的边缘计算数据收集分析方法、系统及设备
CN115910328A (zh) * 2022-12-23 2023-04-04 天津鹏升科技有限公司 一种基于人工智能分析的角膜塑形镜验配系统
CN115998243A (zh) * 2023-01-06 2023-04-25 天津市眼科医院视光中心有限公司 一种基于眼轴增长预测和角膜信息验配角膜塑形镜的方法

Also Published As

Publication number Publication date
CN116564540B (zh) 2023-09-08

Similar Documents

Publication Publication Date Title
Tan et al. Age-related macular degeneration detection using deep convolutional neural network
CN111598867B (zh) 用于检测特定面部综合征的方法、装置及计算机可读存储介质
CN109923618A (zh) 用于确定预测主观验光数据或预测矫正值的设备和计算机程序
US20230157533A1 (en) A computer-implemented system and method for assessing a level of activity of a disease or condition in a patient's eye
CN112700858B (zh) 一种儿童青少年近视预警方法及设备
Gupta et al. An efficient model for detection and classification of internal eye diseases using deep learning
CN115731203A (zh) 白内障图像识别方法、装置、计算机设备和可读存储介质
CN116864139A (zh) 疾病风险评估方法、装置、计算机设备及可读存储介质
Ovreiu et al. An exploratory study for glaucoma detection using densely connected neural networks
CN116564540B (zh) 基于集成学习算法的角膜塑形镜参数预测方法及系统
CN117338234A (zh) 一种屈光度与视力联合检测方法
Praveena et al. Classification of autism spectrum disorder and typically developed children for eye gaze image dataset using convolutional neural network
CN108346471B (zh) 一种病理数据的分析方法及装置
Ying Classification of Diabetic Retinopathy Based on B-ResNet
CN115223232A (zh) 一种眼健康综合管理系统
Aatila et al. Transfer Learning in Keratoconus Classification.
Panahi et al. Autonomous assessment of spontaneous retinal venous pulsations in fundus videos using a deep learning framework
CN113782121A (zh) 随机分组方法、装置、计算机设备及存储介质
CN115836838A (zh) 一种屈光度精准评估的方法及应用
CN116725479B (zh) 一种自助式验光仪以及自助验光方法
CN116822260B (zh) 一种基于数值转换的眼球仿真方法、电子设备及存储介质
Liu et al. Improved PSP-net segmentation network for automatic detection of neovascularization in color fundus images
Khajeha et al. Diagnosis of glaucoma using multi‐scale attention block in convolution neural network and data augmentation techniques
Bucur et al. Predicting necessary treatment plans for patients with Age-Related Macular Degeneration using characteristics derived from optical coherence tomography B-scans
Kallel et al. Deep learning models based on CNN architecture for early keratoconus detection using corneal topographic maps

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant