CN117036269A - 一种基于尿液样品高光谱图像的肾小球疾病分类诊断模型构建方法 - Google Patents

一种基于尿液样品高光谱图像的肾小球疾病分类诊断模型构建方法 Download PDF

Info

Publication number
CN117036269A
CN117036269A CN202310961156.5A CN202310961156A CN117036269A CN 117036269 A CN117036269 A CN 117036269A CN 202310961156 A CN202310961156 A CN 202310961156A CN 117036269 A CN117036269 A CN 117036269A
Authority
CN
China
Prior art keywords
sample
training
hyperspectral
spectrum
classifier
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310961156.5A
Other languages
English (en)
Inventor
王尊松
侯相宇
刘雯
石玉甄
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
First Affiliated Hospital of Shandong First Medical University
Original Assignee
First Affiliated Hospital of Shandong First Medical University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by First Affiliated Hospital of Shandong First Medical University filed Critical First Affiliated Hospital of Shandong First Medical University
Priority to CN202310961156.5A priority Critical patent/CN117036269A/zh
Publication of CN117036269A publication Critical patent/CN117036269A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • G06T7/0012Biomedical image inspection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/0464Convolutional networks [CNN, ConvNet]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/764Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20084Artificial neural networks [ANN]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30004Biomedical image processing
    • G06T2207/30084Kidney; Renal

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Medical Informatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Mathematical Physics (AREA)
  • General Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Molecular Biology (AREA)
  • Databases & Information Systems (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Radiology & Medical Imaging (AREA)
  • Quality & Reliability (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

本发明涉及临床检验诊断技术领域,涉及一种基于尿液样品高光谱图像的肾小球疾病分类诊断模型构建方法,包括收集并离心临床患者尿液样本;获取尿液样本高光谱图像及相应漫反射光谱数据;对高光谱图像进行预处理;对不同病理类型肾脏疾病尿液样本特异性光谱波段进行空‑光谱特征提取,并对部分样本进行标签处理;利用高光谱图像组成有标签样本集和无标签样本集,利用有标签样本集分别训练CNN分类器和RF分类器,再识别无标签样本集;根据两种分类器得到的标签及置信度对原训练样本集进行扩充,组建候选样本集;候选样本集进行增强处理,为构建增强样本集;最终,利用增强样本集的空‑光谱特征重新训练CNN分类器,得到肾脏疾病分类诊断模型。

Description

一种基于尿液样品高光谱图像的肾小球疾病分类诊断模型构 建方法
技术领域
本发明涉及临床检验诊断技术领域,尤其涉及一种基于尿液样品高光谱图像的肾小球疾病分类诊断模型构建方法。
背景技术
目前肾脏常见疾病的诊断及治疗方案的指导主要依靠肾脏病理活检及尿液生化检查结果。肾脏病理活检主要采用经皮超声引导下肾脏穿刺活检,局麻后,在超声引导下进针,穿刺枪迅速自动推进套管完成取材操作,迅速拔出穿刺针,取出肾组织。病理活检虽是肾脏疾病诊断的“金标准”,但由于各种原因,其临床应用存在一定的局限性。活检后患者3级出血的发生率为0.3%,死亡风险估计为0.02%。25%的活组织检查由于其获取的标本不充分,可能会出现诊断错误。另外,患者肥胖图像衰减,肌肉紧张、进针深则针头易偏移;慢性弥漫性肾病肾脏缩小、固缩,标本不易切割。肾病综合征肾水肿,标本易碎、不成形。肾下垂和肾上移,选点困难,腹腔积液时肾脏不易固定;弹簧疲劳;患者对活检接受度差等均影响穿刺成功率和组织标本块质量。
而采取尿液生化检验时,采用全自动生化分析仪器,通过加入特定检测试剂检测血清甘油三酯、血红蛋白及果糖胺等特异性标志物水平。在肾脏疾病的早期诊断当中,生化检验的操作虽较肾组织活检简便易行,但其诊断准确率却明显下降,同时受检测试剂种类限制,该方法仅能诊断部分肾脏疾病。因此,临床上迫切需要一种兼具简便易行,接受度高,泛用性广等特点的新型辅助诊断方法。
发明内容
针对现有技术中存在的技术问题,本发明的目的在于提供一种基于尿液样品高光谱图像的肾小球疾病分类诊断模型构建方法。
本发明的技术实施方案是:
一种基于尿液样品高光谱图像的肾小球疾病分类诊断模型构建方法,包括以下步骤:
步骤1:收集并离心临床肾脏病患者尿液样本;
步骤2:利用高光谱成像仪获取尿液样本高光谱图像及相应漫反射光谱数据;
步骤3:对尿液样本高光谱图像及相应的漫反射光谱数据进行预处理;
步骤4:完成上述步骤预处理后,对部分尿液样本高光谱图像进行标签,得到有标签样本集和无标签样本集;
步骤5:提取有标签样本集的空-光谱特征,以空-光谱特征二维图像作为输入数据,分别训练CNN分类器和RF分类器,得到对应分类模型;
步骤6:利用两种分类模型分别识别无标签样本集,利用所得输出标签及输出置信度对训练集样本量进行扩充,得到候选样本集;
步骤7:对候选样本集进行增强处理获得增强样本集;
步骤8:增强样本集按一定比例分为训练集和测试集,训练集高光谱图像中所提取的空-光谱特征用于重新训练CNN分类器,测试集用于验证训练后的模型最终性能,最终得到肾小球疾病分类诊断模型。
上述技术方案中优选的,光谱采集包括如下:
步骤201:滤除高光谱成像仪自身无效噪音;
步骤202:高光谱成像仪的物镜头移至尿液样本正上方;
步骤203:选取镜头下视野,完成高光谱图像及光谱数据采集。
上述技术方案中优选的,预处理包括对高光谱图像筛选和光谱数据归一化处理。
作为本发明的一种优选技术方案,空-光谱特征提取方法如下:每幅高光谱图像中随机间隔取若干像素点,将上述像素点的光谱信息平铺并拼接起来,组成含有空间信息及光谱信息的二维图像,通过训练过程中不同病理类型肾脏疾病的光谱数据对比,找到各类型肾脏疾病对应的特征性空-光谱信息二维图像。
更进一步地,CNN分类器和RF分类器训练过程如下:每一类肾脏疾病的标签化空-光谱特征二维图像按8:2比例划分训练集与测试集,训练集用来训练CNN分类器和RF分类器,同时在训练过程中,训练集按照7:3比例随机划分为训练集与验证集,验证集数据在分类器上的误差被作为分类器在现实应用场景里的泛化误差。
更进一步地,训练集样本量扩充过程如下:
步骤601:将无标签样本集提取的空-光谱特征分别输入训练得到的CNN分类器和RF分类器进行标签预测;
步骤602:当无标签样本在两分类器中标签预测一致时,直接以该标签对应样本加入原训练集以扩充训练样本量;
步骤603:当无标签样本在两分类器中标签预测不一致时,比较两者置信度,以置信度大者的标签对应样本加入原训练集以扩充训练样本量。
与现有技术相比,本发明具有如下优点:
本发明构建的肾小球疾病分类诊断模型可用于不同病理类型肾脏疾病早期无创诊断,不受病理医生的视图水平及主观判断的影响,大大减轻病理医生的工作负担,为医疗资源匮乏地区提供了更适宜的辅助诊断手段。且能够提高患者对肾脏疾病诊断相关辅助检查的依从性,可提高肾脏疾病诊断率。基于临床采集尿液样本高光谱数据建立的肾脏疾病无创液体活检分类模型,目前对于已有数据的预测灵敏度高于94%,特异度高于98%,相较于临床上应用的其他尿液生化检查方法具有一定优势。
附图说明
图1为本发明的肾小球疾病分类诊断模型构建流程图。
图2为高光谱采集设备结构图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1是肾小球疾病分类诊断模型构建流程图,主要包括尿液样本收集处理、高光谱图片及光谱采集、光谱数据预处理、空-光谱特征提取及图片标记、分类器训练、样本扩充、样本增强、诊断模型构建几个步骤。具体包括以下内容:
步骤1:收集并离心临床肾脏病患者尿液样本
临床采集肾脏疾病患者中段清洁晨尿,2小时内全部离心(室温,1500g,5min)处理,取上清液样本5℃低温保存;
步骤2:利用高光谱成像仪获取尿液样本高光谱图像及相应漫反射光谱数据;
步骤3:对尿液样本高光谱图像及相应的漫反射光谱数据进行预处理;
步骤4:完成上述步骤预处理后,对部分尿液样本高光谱图像进行标签,得到有标签样本集和无标签样本集;
步骤5:提取有标签样本集的空-光谱特征,以空-光谱特征二维图像作为输入数据,分别训练CNN分类器和RF分类器,得到对应分类模型;
步骤6:利用两种分类模型分别识别无标签样本集,利用所得输出标签及输出置信度对训练集样本量进行扩充,得到候选样本集;
步骤7:对候选样本集进行增强处理获得增强样本集;
步骤8:增强样本集按一定比例分为训练集和测试集,训练集高光谱图像中所提取的空-光谱特征用于重新训练CNN分类器,测试集用于验证训练后的模型最终性能,最终得到肾小球疾病分类诊断模型。
高光谱成像仪的光源经尿液样本表面漫反射后,样本反射光经成像仪棱镜-光栅-棱镜色散,由成像系统将光能按波长顺序成像在探测器不同位置,得到被测物二维空间信息与光谱信息。
选取显微高光谱成像仪10X物镜,物镜头移至尿液样本正上方1-2cm处,保证充分的漫反射光被检测到,同时该大小视野可尽量包含尿液样本所有光谱信息。选取任意清洁明亮视野进行图片及光谱数据采集,避免尿中杂菌及其生成物对尿液光谱信息造成干扰。
图2为高光谱采集设备结构图,高光谱采集设备主要包含显微镜、光源、GaiaField便携式光谱成像仪和计算机。从可见光源产生的光到达尿液样本表面,光线经过样本后发生漫反射,再由光谱成像仪接收,经成像仪内置棱镜-光栅-棱镜色散,由成像系统将光能按波长顺序成像在探测器不同位置,得到被测尿液样本的二维空间信息与光谱信息,最后上述信息数据收入计算机保存。
实验发现,不同病理类型肾脏疾病尿液样本的光谱通道在某些波段有较为明显的波形差异,以含有这些特异性波形的光谱波段作为特征样本,提取所述波段内敏感性较高的光谱曲线形状可以作为区分不同病理类型肾脏疾病的标志。
成像仪内置相机曝光时间可调,预设值为20ms,增益为2.高光谱图像及光谱数据采集主要包括以下几个步骤:
步骤201:预存当前检测环境黑暗时的光谱数据,作为光谱背景,便于滤除高光谱成像仪自身无效噪音;
步骤202:显微高光谱成像仪10X倍率物镜移至盛有上清液样本的载玻片上方1-2cm处;
步骤203:选取镜头视野下任意清洁明亮视野,完成对该视野的高光谱图像及光谱数据采集,并可对理想图片区域进行勾画;
步骤204:高光谱成像仪使用结束后,保存已采集数据,并进行设备消毒。
由于人为操作影响,会存在不合格光谱。对不合格光谱图像进行筛除后,对合格光谱数据进行归一化处理,后保存于数据库中。
步骤5中提取空-光谱特征的方法如下:每幅高光谱图像中随机间隔取样若干像素点,将上述像素点的光谱信息平铺并拼接起来,组成含有空间信息及光谱信息的二维图像,通过训练过程中不同病理类型肾脏疾病的光谱数据对比,找到各类型肾脏疾病对应的特征性空-光谱信息二维图像。
CNN分类器和RF分类器分类器训练方法如下:每一类肾脏疾病的标签化空-光谱特征二维图像按8:2比例划分训练集与测试集,训练集用来训练CNN分类器和RF分类器,同时在训练过程中,训练集按照7:3比例随机划分为训练集与验证集,验证集数据在模型上的误差被作为模型在现实应用场景里的泛化误差,以此来提高模型的泛化能力。
由于肾脏疾病所得有标签训练样本量往往较小,为提高最终CNN诊断模型诊断准确率,可利用已训练分类模型对未知的无标签样本进行预测标记,以扩充当前训练样本量。训练集样本量扩充过程如下:
步骤601:将无标签样本集提取的空-光谱特征分别输入训练得到的CNN分类器和RF分类器进行标签预测;
步骤602:当无标签样本在两分类器中标签预测一致时,直接以该标签对应样本加入原训练集以扩充训练样本量;
步骤603:当无标签样本在两分类器中标签预测不一致时,比较两者置信度,以置信度大者的标签对应样本加入原训练集以扩充训练样本量。
对扩充后的样本集图片进行翻转、旋转、缩放、裁剪增强处理获得增强样本集,可提取更多高光谱图片的光谱特征。
以增强样本集中训练集的空-光谱特征二维图像为输入,重新训练CNN分类器,在多个训练模型中选择准确率最高的作为最终的CNN肾脏疾病分类诊断模型。当有新获取尿液样本光谱数据需要进行预测时,利用该模型输出预测结果,即是否患有肾脏疾病及其可能的病理类型。
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。

Claims (6)

1.一种基于尿液样品高光谱图像的肾小球疾病分类诊断模型构建方法,其特征在于,包括以下步骤:
步骤1:收集并离心临床肾脏病患者尿液样本;
步骤2:利用高光谱成像仪获取尿液样本高光谱图像及相应漫反射光谱数据;
步骤3:对尿液样本高光谱图像及相应的漫反射光谱数据进行预处理;
步骤4:完成上述步骤预处理后,对部分尿液样本高光谱图像进行标签,得到有标签样本集和无标签样本集;
步骤5:提取有标签样本集的空-光谱特征,以空-光谱特征二维图像作为输入数据,分别训练CNN分类器和RF分类器,得到对应分类模型;
步骤6:利用两种分类模型分别识别无标签样本集,利用所得输出标签及输出置信度对训练集样本量进行扩充,得到候选样本集;
步骤7:对候选样本集进行增强处理获得增强样本集;
步骤8:增强样本集按一定比例分为训练集和测试集,训练集高光谱图像中所提取的空-光谱特征用于重新训练CNN分类器,测试集用于验证训练后的模型最终性能,最终得到肾小球疾病分类诊断模型。
2.根据权利要求1所述的一种基于尿液样品高光谱图像的肾小球疾病分类诊断模型构建方法,其特征在于,光谱采集包括如下:
步骤201:滤除高光谱成像仪自身无效噪音;
步骤202:高光谱成像仪的物镜头移至尿液样本正上方;
步骤203:选取镜头下视野,完成高光谱图像及光谱数据采集。
3.根据权利要求1所述的一种基于尿液样品高光谱图像的肾小球疾病分类诊断模型构建方法,其特征在于,预处理包括对高光谱图像筛选和光谱数据归一化处理。
4.根据权利要求3所述的一种基于尿液样品高光谱图像的肾小球疾病分类诊断模型构建方法,其特征在于,空-光谱特征提取方法如下:每幅高光谱图像中随机间隔取若干像素点,将上述像素点的光谱信息平铺并拼接起来,组成含有空间信息及光谱信息的二维图像,通过训练过程中不同病理类型肾脏疾病的光谱数据对比,找到各类型肾脏疾病对应的特征性空-光谱信息二维图像。
5.根据权利要求4所述的一种基于尿液样品高光谱图像的肾小球疾病分类诊断模型构建方法,其特征在于,CNN分类器和RF分类器训练过程如下:每一类肾脏疾病的标签化空-光谱特征二维图像按8:2比例划分训练集与测试集,训练集用来训练CNN分类器和RF分类器,同时在训练过程中,训练集按照7:3比例随机划分为训练集与验证集,验证集数据在分类器上的误差被作为分类器在现实应用场景里的泛化误差。
6.根据权利要求4所述的一种基于尿液样品高光谱图像的肾小球疾病分类诊断模型构建方法,其特征在于,训练集样本量扩充过程如下:
步骤601:将无标签样本集提取的空-光谱特征分别输入训练得到的CNN分类器和RF分类器进行标签预测;
步骤602:当无标签样本在两分类器中标签预测一致时,直接以该标签对应样本加入原训练集以扩充训练样本量;
步骤603:当无标签样本在两分类器中标签预测不一致时,比较两者置信度,以置信度大者的标签对应样本加入原训练集以扩充训练样本量。
CN202310961156.5A 2023-08-01 2023-08-01 一种基于尿液样品高光谱图像的肾小球疾病分类诊断模型构建方法 Pending CN117036269A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310961156.5A CN117036269A (zh) 2023-08-01 2023-08-01 一种基于尿液样品高光谱图像的肾小球疾病分类诊断模型构建方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310961156.5A CN117036269A (zh) 2023-08-01 2023-08-01 一种基于尿液样品高光谱图像的肾小球疾病分类诊断模型构建方法

Publications (1)

Publication Number Publication Date
CN117036269A true CN117036269A (zh) 2023-11-10

Family

ID=88640552

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310961156.5A Pending CN117036269A (zh) 2023-08-01 2023-08-01 一种基于尿液样品高光谱图像的肾小球疾病分类诊断模型构建方法

Country Status (1)

Country Link
CN (1) CN117036269A (zh)

Similar Documents

Publication Publication Date Title
US10755406B2 (en) Systems and methods for co-expression analysis in immunoscore computation
US9495745B2 (en) Method for analyzing biological specimens by spectral imaging
AU2012272604B2 (en) Method for analyzing biological specimens by spectral imaging
CA2803933C (en) Method for analyzing biological specimens by spectral imaging
JP5469070B2 (ja) 生物検体を処理するための複数の波長を用いる方法およびシステム
AU2012318445A1 (en) Method and system for analyzing biological specimens by spectral imaging
CN109297949B (zh) 显微影像结合透射拉曼光谱的肿瘤细胞检测方法及装置
CN116152185A (zh) 一种基于深度学习的胃癌病理诊断系统
US20040014165A1 (en) System and automated and remote histological analysis and new drug assessment
CN113674839A (zh) 无创成像筛查与微创取样核酸分型的联合检测系统
AU2014321134A1 (en) An apparatus and method for identifying plant varieties from leaf samples taken whilst in the field.
JP6246978B2 (ja) 線維化を検出及び定量化する方法
CN117036269A (zh) 一种基于尿液样品高光谱图像的肾小球疾病分类诊断模型构建方法
WO2022121284A1 (zh) 大视场高通量高分辨病理切片分析仪
US10753857B2 (en) Apparatus and method for measuring microscopic object velocities in flow
RU2785853C1 (ru) Способ дифференциальной диагностики злокачественной опухоли и доброкачественного процесса костной ткани на отсканированных изображениях гистологического стекла
Soares de Oliveira et al. Simulated fine-needle aspiration diagnosis of follicular thyroid nodules by hyperspectral Raman microscopy and chemometric analysis
RU2698909C1 (ru) Способ диагностики злокачественного плеврального выпота
Sheikhzadeh Improving cervical neoplasia diagnosis via novel in vivo imaging technologies and deep learning algorithms
Galatus et al. Proposal for a Computerized Cytological Screening System
CN113052004A (zh) 一种基于泊松融合的算法增加粪便寄生虫数据集的方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication