CN117274236B - 基于高光谱图像的尿液成分异常检测方法及系统 - Google Patents
基于高光谱图像的尿液成分异常检测方法及系统 Download PDFInfo
- Publication number
- CN117274236B CN117274236B CN202311489392.8A CN202311489392A CN117274236B CN 117274236 B CN117274236 B CN 117274236B CN 202311489392 A CN202311489392 A CN 202311489392A CN 117274236 B CN117274236 B CN 117274236B
- Authority
- CN
- China
- Prior art keywords
- wavelength
- characteristic
- information
- image
- urine
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 210000002700 urine Anatomy 0.000 title claims abstract description 66
- 238000001514 detection method Methods 0.000 title claims abstract description 17
- 230000005856 abnormality Effects 0.000 title claims abstract description 12
- 238000001228 spectrum Methods 0.000 claims abstract description 35
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 30
- 102000004169 proteins and genes Human genes 0.000 claims abstract description 30
- 230000003595 spectral effect Effects 0.000 claims abstract description 14
- 238000000034 method Methods 0.000 claims description 51
- 230000002159 abnormal effect Effects 0.000 claims description 25
- 230000008569 process Effects 0.000 claims description 16
- 238000012549 training Methods 0.000 claims description 13
- 238000005070 sampling Methods 0.000 claims description 9
- 238000012216 screening Methods 0.000 claims description 9
- 238000012937 correction Methods 0.000 claims description 8
- 239000011159 matrix material Substances 0.000 claims description 8
- 238000012545 processing Methods 0.000 claims description 6
- 238000000605 extraction Methods 0.000 claims description 5
- 238000007781 pre-processing Methods 0.000 claims description 5
- 238000000611 regression analysis Methods 0.000 claims description 5
- 238000002310 reflectometry Methods 0.000 claims description 3
- 230000035945 sensitivity Effects 0.000 claims description 3
- 230000008859 change Effects 0.000 claims description 2
- 238000010191 image analysis Methods 0.000 abstract description 2
- 239000000523 sample Substances 0.000 description 43
- 210000003734 kidney Anatomy 0.000 description 9
- 238000002054 transplantation Methods 0.000 description 7
- 238000013145 classification model Methods 0.000 description 6
- 208000017169 kidney disease Diseases 0.000 description 5
- 238000004590 computer program Methods 0.000 description 4
- 201000005206 focal segmental glomerulosclerosis Diseases 0.000 description 4
- 231100000854 focal segmental glomerulosclerosis Toxicity 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 238000000701 chemical imaging Methods 0.000 description 3
- 239000000470 constituent Substances 0.000 description 3
- 238000002790 cross-validation Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000003384 imaging method Methods 0.000 description 3
- 239000000126 substance Substances 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 239000013598 vector Substances 0.000 description 3
- 239000000370 acceptor Substances 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 239000013610 patient sample Substances 0.000 description 2
- 201000001474 proteinuria Diseases 0.000 description 2
- 230000000306 recurrent effect Effects 0.000 description 2
- 102000009027 Albumins Human genes 0.000 description 1
- 108010088751 Albumins Proteins 0.000 description 1
- 208000035999 Recurrence Diseases 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000009535 clinical urine test Methods 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000005286 illumination Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000003834 intracellular effect Effects 0.000 description 1
- 238000012804 iterative process Methods 0.000 description 1
- 230000031700 light absorption Effects 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 239000000047 product Substances 0.000 description 1
- 230000002797 proteolythic effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 239000004575 stone Substances 0.000 description 1
- 239000006228 supernatant Substances 0.000 description 1
- 238000001356 surgical procedure Methods 0.000 description 1
- 208000024891 symptom Diseases 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/0002—Inspection of images, e.g. flaw detection
- G06T7/0012—Biomedical image inspection
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/17—Systems in which incident light is modified in accordance with the properties of the material investigated
- G01N21/25—Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/17—Systems in which incident light is modified in accordance with the properties of the material investigated
- G01N21/25—Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
- G01N21/31—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
- G01N21/33—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using ultraviolet light
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/764—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H10/00—ICT specially adapted for the handling or processing of patient-related medical or healthcare data
- G16H10/40—ICT specially adapted for the handling or processing of patient-related medical or healthcare data for data related to laboratory analysis, e.g. patient specimen analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10052—Images from lightfield camera
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Artificial Intelligence (AREA)
- Computing Systems (AREA)
- Software Systems (AREA)
- Multimedia (AREA)
- Chemical & Material Sciences (AREA)
- Pathology (AREA)
- Immunology (AREA)
- Biochemistry (AREA)
- Analytical Chemistry (AREA)
- Databases & Information Systems (AREA)
- Computational Linguistics (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Epidemiology (AREA)
- Primary Health Care (AREA)
- Public Health (AREA)
- Molecular Biology (AREA)
- Data Mining & Analysis (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Radiology & Medical Imaging (AREA)
- Quality & Reliability (AREA)
- Investigating Or Analysing Biological Materials (AREA)
Abstract
本发明涉及图像分析技术领域,具体为基于高光谱图像的尿液成分异常检测方法及系统,包括以下步骤:获取待测尿液样本的高光谱图像,并利用校准图像得到光谱信息;得到的光谱信息经预处理后,提取特征波长;在得到的特征波长中选择一个初始波长集作为特征集合的起点,从未包括在当前特征集合中的波长中选择一个波长,将其添加到当前集合中实现迭代,每次迭代后确定是否保留新添加的波长,直至满足设定迭代次数或设定需求,得到筛选后的特征波长,基于筛选后的特征波长生成表征尿液样本中蛋白信息的伪彩色图像。
Description
技术领域
本发明涉及图像分析技术领域,具体为基于高光谱图像的尿液成分异常检测方法及系统。
背景技术
本部分的陈述仅仅是提供了与本发明相关的背景技术信息,不必然构成在先技术。
通过对尿液样本的高光谱图像进行分析,能够获得样本中各类蛋白的形态,从而确定尿液中存在异常的成分。现有技术处理此类高光谱图像时,会利用样本中蛋白分子对光线吸收和散射的能力,从获取的图像中选取感兴趣区域,将拍摄区域内RGB图像重建为高光谱图像并提取特征值,从而得到所需的蛋白形态等参数。由于高光谱图像中除了包含被拍摄目标的信息以外还包含有光谱信息,虽然利用这一特性可以从图像中分析一些肉眼无法观察到的信息,但得到的数据维度过大,使得对计算机和存储器的需求较高。
发明内容
为了解决上述背景技术中存在的技术问题,本发明提供基于高光谱图像的尿液成分异常检测方法及系统,通过获取尿液样本的高光谱图像,分析出图像中所需的蛋白类物质的信息,处理图像的过程中,特征波长经过二次筛选,减少数据的维度,并能够平衡波长的多样性和相关性。
为了实现上述目的,本发明采用如下技术方案:
本发明的第一个方面提供基于高光谱图像的尿液成分异常检测方法,包括以下步骤:
获取待测尿液样本的高光谱图像,并利用校准图像得到光谱信息;
得到的光谱信息经预处理后,提取特征波长;
在得到的特征波长中选择一个初始波长集作为特征集合的起点,从未包括在当前特征集合中的波长中选择一个波长,将其添加到当前集合中实现迭代,每次迭代后确定是否保留新添加的波长,直至满足设定迭代次数或设定需求,得到筛选后的特征波长,基于筛选后的特征波长生成表征尿液样本中蛋白信息的伪彩色图像。
进一步的,校准图像包括第一校准图像和第二校准图像;
第一校准图像为没有光源的图像,该图像包含暗电流的均值和标准差信息;
第二校准图像为在均匀光源下获取的白板图像,该图像包含不同波长下的反射率和敏感度信息。
进一步的,预处理,具体为,基于光谱阵的行对没一条光谱信息进行处理,消除光谱信息采集过程中的背景噪声、基线漂移和杂散光。
进一步的,得到的光谱信息经预处理后,提取特征波长,具体为,
基于权重二进制矩阵采样法将光谱数据进行随机组合,产生子数据集;
将得到的子数据集作为校正集模型进行回归分析;
分析比较若干个子模型的均方根误差和平均预测误差,取设定数量的模型中两值较低的子模型,求得每个波长在这些子模型中出现的次数,并重新定义该波长的权重;
重回归分析和重定义波长权重的过程来变换波长和权重值,当所有子模型的均方根误差和平均预测误差不再改变时,通过权重结果满足设定值的波长,得到原始光谱数据的特征波长。
进一步的,基于筛选后的特征波长生成表征尿液样本中蛋白信息的伪彩色图像,具体的:
设定尿液样本的异常类型与对应的蛋白信息;
根据蛋白信息中得到的特征波长与设定的异常类型进行模型训练;
基于训练完毕的模型输出表征尿液样本中蛋白信息的伪彩色图像,该图像与设定的尿液样本异常类型对应。
本发明的第二个方面提供实现上述方法所需的系统,包括:
图像采集模块,被配置为:获取待测尿液样本的高光谱图像,并利用校准图像得到光谱信息;
特征波长提取模块,被配置为:得到的光谱信息经预处理后,提取特征波长;
特征波长筛选模块,被配置为:在得到的特征波长中选择一个初始波长集作为特征集合的起点,从未包括在当前特征集合中的波长中选择一个波长,将其添加到当前集合中实现迭代,每次迭代后确定是否保留新添加的波长,直至满足设定迭代次数或设定需求,得到筛选后的特征波长,基于筛选后的特征波长生成表征尿液样本中蛋白信息的伪彩色图像。
本发明的第三个方面提供一种计算机可读存储介质。
一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上述所述的基于高光谱图像的尿液成分异常检测方法中的步骤。
本发明的第四个方面提供一种计算机设备。
一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述所述的基于高光谱图像的尿液成分异常检测方法中的步骤。
与现有技术相比,以上一个或多个技术方案存在以下有益效果:
1、通过获取尿液样本的高光谱图像,分析出图像中蛋白类物质的信息,处理图像的过程中,特征波长经过二次筛选能够减少数据的维度,降低对计算机和存储器的资源消耗。
2、二次筛选的过程倾向于选择具有高变异性的波长,这有助于捕捉到特征数据,能够平衡波长的多样性和相关性,提高模型泛化能力,从而确保模型最终选取所需的信息。
3、通过提取尿液样本高光谱图像中每个像素的光谱值,结合筛选出的最佳特征波段,对特征波段或非特征波段赋予相应的更高或更低权重系数,以此通过伪彩色图像不同区域的颜色差异及深浅表示蛋白质含量和空间分布情况,最终生成的伪彩色图像利用色彩替代灰阶,能够提高人眼分辨率,补偿人眼的生理缺陷。
附图说明
构成本发明的一部分的说明书附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。
图1是本发明一个或多个实施例提供的基于高光谱图像的尿液成分异常检测整体过程示意图;
图2是本发明一个或多个实施例提供的基于高光谱图像的尿液成分异常检测的应用过程示意图。
具体实施方式
下面结合附图与实施例对本发明作进一步说明。
应该指出,以下详细说明都是示例性的,旨在对本发明提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本发明所属技术领域的普通技术人员通常理解的相同含义。
正如背景技术中所介绍的,由于高光谱图像中除了包含被拍摄目标的信息以外还包含有光谱信息,虽然利用这一特性可以从图像中分析一些肉眼无法观察到的信息,但得到的数据维度过大,使得对计算机和存储器的需求较高。
因此,以下实施例给出基于高光谱图像的尿液成分异常检测方法及系统,以肾移植术后肾病复发检测期间所需的尿液检验为例,通过获取尿液样本的高光谱图像,分析出图像中有关肾移植术后肾病复发的相关蛋白类物质的信息,处理图像的过程中,特征波长经过二次筛选,减少数据的维度,并能够平衡波长的多样性和相关性。
实施例一:
如图1-图2所示,基于高光谱图像的尿液成分异常检测方法,包括以下步骤:
一、采集接受肾移植手术的受体的尿液,取其上清液制作为样本;
二、利用高光谱成像设备系统获取受体尿液样本的光谱信息:高光谱图像由紫外(波长范围10~380nm)高光谱成像系统获取;由于肾移植受体术后肾病复发会产生蛋白尿的症状,故主要波长集中在蛋白质的紫外特征波段200~380nm。在高光谱图像采集前需要进行对焦和黑白校准。
1.黑校准中,遮挡相机镜头获得黑暗图像,获得包含暗电流的均值和标准差等信息的黑校正帧。在实际成像过程中,黑校正帧和实际的成像帧相减,从而消除暗电流噪声的影响。
2.白校准中,相机镜头面向一个均匀光源拍摄一系列白板图像,捕获传感器在统一亮度下的响应。获得包含传感器对于不同波长下的反射率和敏感度等信息的白校正帧。在实际成像过程中,白校正帧校正原始的高光谱图像,消除非均匀性和光照差异的影响。
通过黑白校正,高光谱成像系统能够提供更准确和可靠的图像数据,以保证后续分析和应用的准确性和可重复性。
采集到受体尿液样本的光谱信息后,通过SNV(标准正态变量)对原始光谱数据进行预处理,消除光谱采集过程中存在的背景噪声、基线漂移和杂散光等干扰信号,降低模型的复杂性。SNV主要用来消除固体颗粒大小、表面散射以及光程变化对光谱信息的影响。SNV算法基于光谱阵的行对一条光谱进行处理:;其中,/>表示第i个样本的光谱数据平均值,i=1, 2,…n, n为需矫正样品数;/>表示第i个样本中待处理的高光谱数据,k=1, 2,…, m,m为波长点数,波长点数描述光谱中所采样的波长数量,表示光谱中离散波长值的数量,反映光谱数据的分辨率和精度程度;/>表示第i个样本预处理后的高光谱数据,通过对光谱信息进行预处理能够提高模型的准确性和稳定性。
三、利用iVISSA-IRIV模型进行特征波长提取。提取特征波长能够删除样本中关注成分以外的光谱信息,缩短运算时间,提高运算效率,增强模型稳定性。
iVISSA算法利用波段权重对整体和个体进行分析选,同时保证波段宽度以及间隔位置。
设光谱数据为X,样品个数为n,波长变量个数为p。其原理如下:
(1)采用权重二进制矩阵采样法( WBMS) 将X进行随机组合,产生子数据集x(k×p),其中0<k<n,权重列数为0.5,且x个数均为0.5k,保证了波长变量在运算时有相同的可能性;
(2)将得到的子数据集x作为校正集模型进行回归分析;
(3) 分析比较m个子模型的RMSECV值和RMSEP值,取k个模型中两值较低子模型,求得每个波长在这些子模型中出现的次数fi,从而重新定义该波长的权重,为。
通过重复(2)和(3)过程来变换波长和权重值,当所有子模型的RMSECV值和RMSEP值误差不改变时,权重结果为1的波长构成原始光谱数据的特征波长,运行程序结束。
权重二进制矩阵采样法是一种随机抽样方法,通过使用二进制矩阵和样本权重来进行抽样。这种方法首先准备一个与样本数量相同大小的权重矩阵,然后根据样本的权重将其分配到矩阵中。接下来,通过生成随机数与权重矩阵进行比较,选择权重超过随机数的样本进行抽样。这样可以实现根据权重进行有偏向性的抽样,适用于各种抽样场景。
其中,RMSECV表示交叉验证中的均方根误差,用于评估在交叉验证过程中模型的预测误差。较小的RMSECV值表示模型的预测误差较小,性能较好;RMSEP表示模型在预测新样本时的平均预测误差大小,计算预测结果与实际观测值之间的均方根误差。RMSEP值越小,表示模型的预测能力越好。
IRIV是一种迭代保留信息变量以在多元校准中选择最优变量子集的策略。考虑随机组合产生的变量之间的相互作用,称为迭代保留信息变量。变量分为四类:强信息、弱信息、非信息和干扰变量。IRIV在每轮迭代中同时保留强和弱信息变量,直到不存在非信息和干扰变量,最后反向消除弱信息变量,将强信息变量作为特征变量。
在通过iVISSA法筛选的波长数据中选择一个初始波长集,作为特征集的起点,这些波长可以是iVISSA筛选出的最相关波长。通过IRIV方法迭代,逐步添加或者删除波长,步骤如下:
(1)每次迭代中,从未包括在当前特征集合中的波长中选择一个波长,将其添加到当前集合中;
(2)使用扩展的特征集合重新训练模型;
(3)每次迭代后使用均方根误差RMSE评估模型性能,并决定是否保留新添加的波长。如果新添加的波长显著提高模型性能则将其保留,否则将其删除。
当达到预定的迭代次数或者模型性能不再显著提升时终止IRIV并获得最终模型。
利用IRIV法对iVISSA法筛选出的波长进行二次提取,形成了iVISSA-IRIV变量选择混合方法,iVISSA方法倾向于选择具有高变异性的波长,这有助于捕捉到特征数据,IRIV方法则通过迭代过程,结合模型性能评估,更注重特征预测能力。结合两种方法可以平衡更选择波长的多样性和相关性,提高模型的泛化能力,从而确保模型最终选取最能代表肾病复发受体的样本信息。iVISSA-IRIV方法显著降低数据维度,减少计算和存储的需求,这对处理大型光谱数据集尤为重要。
由于上述方法通过筛选特征波段提高模型的可解释性,强调了对预测分类模型至关重要的波段,能够提升模型预测和分类准确性,可以利用这一特性,使得到的蛋白质信息与常见的异常类型对应起来,最终得到设定的异常类型。可以通过下列步骤实现:
设定尿液样本的异常类型与对应的蛋白信息;
根据蛋白信息中得到的特征波长与设定的异常类型进行模型训练;
基于训练完毕的模型输出表征尿液样本中蛋白信息的伪彩色图像,该图像与设定的尿液样本异常类型对应。
建立常见异常类型模型:肾移植受体术后常见的复发类型有:IgA,局灶性节段性肾小球硬化(FSGS),膜性等,受体在肾移植术后复发类型不同,其蛋白尿中主要成分也会不同,IgA患者尿液样本中以IgA蛋白为主,FSGS患者样本则以白蛋白为主,膜性患者样本以尿蛋白酶解产物UPR3为主要成分。
因此可根据不同类型的特征蛋白在特征波段的峰值差异,实现基于SVM分类模型的肾病复发常见病识别模型。SVM可以将高维的数据降维,从而减少特征的数量,消除一些噪音,有助于改善分类模型的性能,在本实施例中,基于SVM建立分类模型可以选择更具代表性的特征波段,有助于更好地区分不同类别。
其步骤如下:
1.对肾移植术后,受体发生的常见异常类型进行分类,同时不断采集新鲜尿液样本扩充数据库样本数量:采集足够的IgA,(FSGS),膜性和正常受体的尿液样本,使用SPXY算法(一种划分样本的算法)按照8:2划分训练集、测试集;SPXY算法在Kennard-Stone算法基础上发展而来,选择欧氏距离最远的两个样本进入训练集,再计算剩下的每个样本到训练集内已知样本的欧式距离,将拥有最大最小距离的待选样本放入训练集,保证训练集中样本按照空间距离分布;SPXY在计算样本间距离时能够将光谱和蛋白含量同时考虑,利用两种变量同时计算样品间距离以保证最大程度表征样本分布,有效地覆盖多维向量空间,增加样本间的差异性和代表性,提高模型稳定性。
2.提取各类类型的患者和未复发受体尿液样本的高光谱信息,基于SVM分类模型机器学习,建立识别模型:常见异常类型和正常受体样本的光谱信息峰值和峰值所在特征波长存在差异,故将已有样本按不同异常类型进行分类,每类都将所有像素点光谱平均值作为代表性光谱数据,选用SVM分类器。
具体建模步骤如下:
(1)收集并准备训练数据集,包括特征向量和相应的类别标签。特征进行适当的预处理;选择合适的特征并进行提取。
(2)将数据集划分为训练集和测试集(也可以使用交叉验证)。
(3)在训练集上使用SVM算法训练模型。在训练过程中,优化模型参数(权重和偏置)以最小化目标函数。线性SVM的目标是找到一个超平面,使得不同类别的样本能够在该超平面上有最大的边缘(Margin)。Margin是离超平面最近的样本点到超平面的距离。线性SVM目标函数:;其中,w是超平面法向量,b是偏置项,xi是第i个样本的特征向量,yi是第i个样本的类别标签,取值1或-1,C是正则化参数,用于平衡Margin的最大化和误分类惩罚。SVM使用Hinge Loss函数来测量误分类的程度。对于样本(xi, yi),Hinge Loss可以表示为:/>。
当样本被正确分类时,Hinge Loss为0。当样本被错误分类时,Hinge Loss将为正数,其值随着误分类程度的增加而增加。SVM的决策函数是基于超平面的方程构建的,可以表示为:。如果f(x)>0,则预测为正类;如果f(x)<0,则预测为负类。
(4)使用测试集评估模型的性能。可以计算准确率、精确度、召回率指标来衡量模型的效果。
3.保存模型,实现肾移植术后常见异常类型分类:通过对经验样本的深度学习,基于SVM分类模型,提取每一种不同异常类型样本的光谱信息特征,根据关键特征对未知样本进行判断。在临床应用上,当获得未知情况的肾移植受体尿液样本时,通过观察其高光谱特征波段特征信息,将其与各种分类结果进行比较,依据机器学习形成的分类模型由相似度高低,给出最可能的类型,从而提供建议。
生成伪彩色图像,可视化细胞内成分空间信息:伪彩色图像利用色彩替代灰阶,能够提高人眼分辨率,补偿人眼的生理缺陷。通过提取尿液样本高光谱图像中每个像素的光谱值,结合最佳特征波段选择模型,对特征波段或非特征波段赋予相应的更高或更低权重系数,以此通过伪彩色图像不同区域的颜色差异及深浅表示蛋白质含量和空间分布情况。在面向使用者的伪彩色图像模块中,通过含量数据能够更直观地向医生体现异常类型的严重程度,通过颜色深浅还可向病患及其家属展示诊断结果,提升医患交流效率。
实施例二:
实现上述方法的系统,包括:
图像采集模块,被配置为:获取待测尿液样本的高光谱图像,并利用校准图像得到光谱信息;
特征波长提取模块,被配置为:得到的光谱信息经预处理后,提取特征波长;
特征波长筛选模块,被配置为:在得到的特征波长中选择一个初始波长集作为特征集合的起点,从未包括在当前特征集合中的波长中选择一个波长,将其添加到当前集合中实现迭代,每次迭代后确定是否保留新添加的波长,直至满足设定迭代次数或设定需求,得到筛选后的特征波长,基于筛选后的特征波长生成表征尿液样本中蛋白信息的伪彩色图像。
实施例三:
本实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上述实施例一所述的基于高光谱图像的尿液成分异常检测方法中的步骤。
实施例四:
本实施例提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述实施例一所述的基于高光谱图像的尿液成分异常检测方法中的步骤。
以上实施例二至四中涉及的各步骤或网络与实施例一相对应,具体实施方式可参见实施例一的相关说明部分。术语“计算机可读存储介质”应该理解为包括一个或多个指令集的单个介质或多个介质;还应当被理解为包括任何介质,所述任何介质能够存储、编码或承载用于由处理器执行的指令集并使处理器执行本发明中的任一方法。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (7)
1.基于高光谱图像的尿液成分异常检测方法,其特征在于,包括以下步骤:
获取待测尿液样本的高光谱图像,并利用校准图像得到光谱信息;
得到的光谱信息经预处理后,提取特征波长;
利用iVISSA-IRIV模型进行特征波长提取,iVISSA算法利用波段权重对整体和个体进行分析选择,同时保证波段宽度以及间隔位置;
利用IRIV法对iVISSA法筛选出的波长进行二次提取,IRIV在每轮迭代中同时保留强和弱信息变量,直到不存在非信息和干扰变量,最后反向消除弱信息变量,将强信息变量作为特征变量;
具体地,在得到的特征波长中选择一个初始波长集作为特征集合的起点,从未包括在当前特征集合中的波长中选择一个波长,将其添加到当前集合中实现迭代,每次迭代后确定是否保留新添加的波长,直至满足设定迭代次数或设定需求,得到筛选后的特征波长;
基于筛选后的特征波长生成表征尿液样本中蛋白信息的伪彩色图像;
基于筛选后的特征波长生成表征尿液样本中蛋白信息的伪彩色图像,包括:设定尿液样本的异常类型与对应的蛋白信息;
根据蛋白信息中得到的特征波长与设定的异常类型进行模型训练;
基于训练完毕的模型输出表征尿液样本中蛋白信息的伪彩色图像,该图像与设定的尿液样本异常类型对应。
2.如权利要求1所述的基于高光谱图像的尿液成分异常检测方法,其特征在于,所述校准图像包括第一校准图像和第二校准图像。
3.如权利要求2所述的基于高光谱图像的尿液成分异常检测方法,其特征在于,所述第一校准图像为没有光源的图像,该图像包含暗电流的均值和标准差信息。
4.如权利要求2所述的基于高光谱图像的尿液成分异常检测方法,其特征在于,所述第二校准图像为在均匀光源下获取的白板图像,该图像包含不同波长下的反射率和敏感度信息。
5.如权利要求1所述的基于高光谱图像的尿液成分异常检测方法,其特征在于,所述预处理,具体为:基于光谱阵的行对没一条光谱信息进行处理,消除光谱信息采集过程中的背景噪声、基线漂移和杂散光。
6.如权利要求1所述的基于高光谱图像的尿液成分异常检测方法,其特征在于,得到的光谱信息经预处理后,提取特征波长,具体为:
基于权重二进制矩阵采样法将光谱数据进行随机组合,产生子数据集;
将得到的子数据集作为校正集模型进行回归分析;
分析比较若干个子模型的均方根误差和平均预测误差,取设定数量的模型中两值较低的子模型,求得每个波长在这些子模型中出现的次数,并重新定义该波长的权重;
重复回归分析和重定义波长权重的过程来变换波长和权重值,当所有子模型的均方根误差和平均预测误差不再改变时,通过权重结果满足设定值的波长,得到原始光谱数据的特征波长。
7.基于高光谱图像的尿液成分异常检测系统,其特征在于,包括:
图像采集模块,被配置为:获取待测尿液样本的高光谱图像,并利用校准图像得到光谱信息;
特征波长提取模块,被配置为:得到的光谱信息经预处理后,提取特征波长;
特征波长筛选模块,被配置为:在得到的特征波长中选择一个初始波长集作为特征集合的起点,从未包括在当前特征集合中的波长中选择一个波长,将其添加到当前集合中实现迭代,每次迭代后确定是否保留新添加的波长,直至满足设定迭代次数或设定需求,得到筛选后的特征波长,基于筛选后的特征波长生成表征尿液样本中蛋白信息的伪彩色图像;
利用iVISSA-IRIV模型进行特征波长提取,iVISSA算法利用波段权重对整体和个体进行分析选择,同时保证波段宽度以及间隔位置;
利用IRIV法对iVISSA法筛选出的波长进行二次提取,IRIV在每轮迭代中同时保留强和弱信息变量,直到不存在非信息和干扰变量,最后反向消除弱信息变量,将强信息变量作为特征变量;
基于筛选后的特征波长生成表征尿液样本中蛋白信息的伪彩色图像,包括:设定尿液样本的异常类型与对应的蛋白信息;
根据蛋白信息中得到的特征波长与设定的异常类型进行模型训练;
基于训练完毕的模型输出表征尿液样本中蛋白信息的伪彩色图像,该图像与设定的尿液样本异常类型对应。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311489392.8A CN117274236B (zh) | 2023-11-10 | 2023-11-10 | 基于高光谱图像的尿液成分异常检测方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311489392.8A CN117274236B (zh) | 2023-11-10 | 2023-11-10 | 基于高光谱图像的尿液成分异常检测方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117274236A CN117274236A (zh) | 2023-12-22 |
CN117274236B true CN117274236B (zh) | 2024-03-08 |
Family
ID=89217933
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311489392.8A Active CN117274236B (zh) | 2023-11-10 | 2023-11-10 | 基于高光谱图像的尿液成分异常检测方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117274236B (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105844297A (zh) * | 2016-03-22 | 2016-08-10 | 西安电子科技大学 | 基于局部空间信息的封装式高光谱波段选择方法 |
CN105954252A (zh) * | 2016-04-21 | 2016-09-21 | 北京航空航天大学 | 一种饲料原料中非法添加物苏丹红的定性检测方法 |
JP2019128295A (ja) * | 2018-01-25 | 2019-08-01 | 国立研究開発法人産業技術総合研究所 | 撮像装置、撮像システム、及び撮像方法 |
CN111289446A (zh) * | 2020-03-30 | 2020-06-16 | 天津工业大学 | 一种复杂溶液成分浓度的检测方法及系统 |
CN114445362A (zh) * | 2022-01-25 | 2022-05-06 | 腾讯科技(深圳)有限公司 | 图像处理方法、装置、设备、可读存储介质及程序产品 |
CN116129140A (zh) * | 2023-02-08 | 2023-05-16 | 湖南大学 | 一种融合视觉与光谱显著性的高光谱药液异物检测方法 |
-
2023
- 2023-11-10 CN CN202311489392.8A patent/CN117274236B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105844297A (zh) * | 2016-03-22 | 2016-08-10 | 西安电子科技大学 | 基于局部空间信息的封装式高光谱波段选择方法 |
CN105954252A (zh) * | 2016-04-21 | 2016-09-21 | 北京航空航天大学 | 一种饲料原料中非法添加物苏丹红的定性检测方法 |
JP2019128295A (ja) * | 2018-01-25 | 2019-08-01 | 国立研究開発法人産業技術総合研究所 | 撮像装置、撮像システム、及び撮像方法 |
CN111289446A (zh) * | 2020-03-30 | 2020-06-16 | 天津工业大学 | 一种复杂溶液成分浓度的检测方法及系统 |
CN114445362A (zh) * | 2022-01-25 | 2022-05-06 | 腾讯科技(深圳)有限公司 | 图像处理方法、装置、设备、可读存储介质及程序产品 |
CN116129140A (zh) * | 2023-02-08 | 2023-05-16 | 湖南大学 | 一种融合视觉与光谱显著性的高光谱药液异物检测方法 |
Non-Patent Citations (3)
Title |
---|
Improved model population analysis in near infrared spectroscopy;Hasan Ali Gamal Al-Kaf 等;2019 First International Conference of Intelligent Computing and Engineering (ICOICE);全文 * |
受激拉曼散射显微技术用于快速无标记病理成像;张博涵 等;中国激光;第47卷(第2期);第4-5页 * |
近红外光谱定量分析中三种新型波长选择方法研究;宋相中;中国博士学位论文全文数据库工程科技I辑(第08期);第4.3、5.2节 * |
Also Published As
Publication number | Publication date |
---|---|
CN117274236A (zh) | 2023-12-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Lowe et al. | Hyperspectral image analysis techniques for the detection and classification of the early onset of plant disease and stress | |
Al-Hiary et al. | Fast and accurate detection and classification of plant diseases | |
Huang et al. | Hyperspectral image analysis based on BoSW model for rice panicle blast grading | |
IL249566A (en) | Orthonormal system and method are optimized to reduce the dimensions of spectral figures | |
Rojas-Moraleda et al. | A frame-based ANN for classification of hyperspectral images: assessment of mechanical damage in mushrooms | |
KR102448123B1 (ko) | 농산물 신선도 예측 방법 및 장치 | |
US20240290008A1 (en) | Method and apparatus for image processing | |
Song et al. | Evaluation of machine learning methods for organic apple authentication based on diffraction grating and image processing | |
CN107895136B (zh) | 一种煤矿区域识别方法及系统 | |
WO2023026742A1 (ja) | 色素画像取得方法、色素画像取得装置、及び色素画像取得プログラム | |
CN115294404A (zh) | 一种基于随机森林算法的底栖动物高光谱数据分类方法 | |
CN111626224A (zh) | 基于近红外光谱和ssa优化的elm的煤矸石快速识别方法 | |
CN116167964A (zh) | 基于肿瘤高光谱图像的肿瘤分类方法及系统 | |
Bu et al. | ResNet incorporating the fusion data of RGB & hyperspectral images improves classification accuracy of vegetable soybean freshness | |
Wang et al. | SVM classification method of waxy corn seeds with different vitality levels based on hyperspectral imaging | |
Zhu et al. | Detection of fungal infection in apple using hyperspectral transformation of RGB images with kernel regression | |
CN117274236B (zh) | 基于高光谱图像的尿液成分异常检测方法及系统 | |
Gampa | A data-driven approach for detecting stress in plants using hyperspectral imagery | |
Jin et al. | An innovative fusion feature method of spectrum and visual image for diagnosing ‘Akizuki’pear cork spot disorder | |
CN110095436A (zh) | 苹果轻微损伤分类方法 | |
Tschannerl | Effective hyperspectral band selection and multispectral sensing based data reduction and applications in food analysis | |
JP7564408B1 (ja) | 色素データ取得方法、色素データ取得装置、及び色素データ取得プログラム | |
GORLINI et al. | Hyperspectral imaging and deep learning for automatic food quality inspection | |
US20240185419A1 (en) | Systems and processes for automated detection and characterization of skin features using machine learning | |
CN117765041B (zh) | 一种基于配准增强和最优传输gan的dsa图像生成方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |