CN115184336B - 一种基于血清拉曼光谱干燥综合征和间质性肺病识别方法 - Google Patents

一种基于血清拉曼光谱干燥综合征和间质性肺病识别方法 Download PDF

Info

Publication number
CN115184336B
CN115184336B CN202210829567.4A CN202210829567A CN115184336B CN 115184336 B CN115184336 B CN 115184336B CN 202210829567 A CN202210829567 A CN 202210829567A CN 115184336 B CN115184336 B CN 115184336B
Authority
CN
China
Prior art keywords
raman spectrum
interstitial lung
lung disease
syndrome
identifying
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210829567.4A
Other languages
English (en)
Other versions
CN115184336A (zh
Inventor
武丽君
吕小毅
陈晨
陈程
吴雪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xinjiang University
Peoples Hospital of Xinjiang Uygur Autonomous Region
Original Assignee
Xinjiang University
Peoples Hospital of Xinjiang Uygur Autonomous Region
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xinjiang University, Peoples Hospital of Xinjiang Uygur Autonomous Region filed Critical Xinjiang University
Priority to CN202210829567.4A priority Critical patent/CN115184336B/zh
Publication of CN115184336A publication Critical patent/CN115184336A/zh
Application granted granted Critical
Publication of CN115184336B publication Critical patent/CN115184336B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/62Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light
    • G01N21/63Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light optically excited
    • G01N21/65Raman scattering
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Health & Medical Sciences (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Immunology (AREA)
  • Pathology (AREA)
  • Investigating, Analyzing Materials By Fluorescence Or Luminescence (AREA)

Abstract

本发明提供了一种基于血清拉曼光谱干燥综合征和间质性肺病识别方法,属于医学图像处理领域。具体采用拉曼光谱进行干燥综合征和间质性肺病辅助识别特征数据,为了提升分类准确性,针对性的提出一种改进拉曼光谱数据分类方法。通过本申请的拉曼光谱结合改进的机器学习算法是辅助诊断干燥综合征合并间质性肺病患者的一种有价值工具,具有广阔的应用前景,可以为医生诊断做辅助参考结果。

Description

一种基于血清拉曼光谱干燥综合征和间质性肺病识别方法
技术领域
本发明属于医学图像处理领域,具体涉及一种基于血清拉曼光谱干燥综合征和间质性肺病识别方法。
背景技术
原发性燥综合征(pSS)是一种以慢性淋巴细胞浸润为特征的自身免疫性疾病,发病与遗传和环境等多因素有关,影响约0.06%普通人群。主要累及外分泌腺体,表现为眼干、口干等症状,其中有30%-40%患者会出现腺体外表现,例如关节炎、间质性肾病以及神经系统受累。
间质性肺病(ILD)是pSS患者的主要并发症也是导致患者死亡的主要因素之一,患病率约为13%,典型的病理表现为弥漫性肺实质、肺泡炎症和间质纤维化,主要表现为乏力、呼吸困难、咳嗽等。目前ILD的诊断主要依靠高分辨率计算机断层扫描(High-resolution computed tomography,HRCT)及肺功能(Pulmonary Function Testing,PFTs)等[7-8],此外,也有学者尝试应用MRI用于ILD的诊断[9],但上述方法仍有一定局限性。虽然HRCT是诊断ILD的主要工具,但辐射暴露限制了其广泛重复用作筛查测试。PFTs在疾病早期阶段的敏感性相当低,因此不能作为ILD诊断的筛查方法。手术肺活检(surgical lungbiopsy,SLB)虽然是诊断金标准,但为有创检查,且还可能造成早期疾病急性加重,所以SLB仅能用于非典型ILDs的诊断。
拉曼光谱是一种散射光谱,能够反映入射光子和振动分子的能量差,并且提供物质分子结构、组织构造及指纹信息。拉曼光谱不仅具有信息提取容易、无损检测及指纹分辨率高的优点,还具有快速、非侵入性、干扰小、准确等优点[11]。然而,目前还没有利用拉曼光谱对pSS和pSS-ILD进行鉴别的研究。因此,利用拉曼光谱开发一种无创、价格低廉、稳定的pSS-ILD检测技术具有重要意义。综上,本申请提供了一种可以辅助快速、高准确且无创的干燥综合征和间质性肺病辅助识别方法。
发明内容
本发明的目的在于解决上述现有技术中存在的难题,提供一种基于血清拉曼光谱干燥综合征和间质性肺病识别方法。本发明是通过以下技术方案实现的:
步骤1,对N例干燥综合征患者、M例干燥综合征合并间质性肺病(pSS-ILD)患者和L例健康对照组(JK)的血清进行拉曼光谱检测得到原始光谱;
本实施例中N=150、M=150、L=150,检测中激光波长为532nm,激光功率为20mW。在22℃的室温下,激光束通过一个10倍的物镜聚焦在样本血管表面进行测量。光谱测量范围从600cm-1到1800cm-1,每个样本在不同的位置被测量5次,获得450个光谱数据,包括150个pSS数据、150个pSS-ILD数据和150个JK对照数据。
步骤2,对原始光谱进行预处理,波段选择、基线校正、平滑处理、进行异常值剔除和归一化预处理;本申请选择拉曼光谱600-1800cm-1波段,该部位属于拉曼光谱的指纹区域,能够提高诊断的准确性;基线校正采用airPLS方法,平滑滤波采用SG方法;剔除异常值方法选用t-SNE;对预处理后的拉曼光谱进行归一化处理,对特征值进行缩放,以降低数据复杂度;
步骤3,进行训练集和测试集的划分,对预处理后的数据使用PCA进行降维。对数据降维后,选择合适的特征数输入分类模型,对PCA特征提取前100维光谱数据作为后续分类模型的输入;
本实施例中训练集和测试集分别为100组和50组;将划分后的数据集进行PCA特征提取。将训练集和测试集贡献率最高的3个主要成分PC1、PC2和PC3进行绘图和分析,得到结果示意图如附图2。
步骤4,针对上述得到的PCA特征作为分类特征,由于各类别数据强度波形一致性较高,分类准确性仍然较低,为了提升数据分类的准确性,本申请针对性的提出一种改进拉曼光谱数据分类方法得到识别结果。
Step1:确定每个类别的PCA特征空间的中心点,计算每个样本距离类内中心点mp之间的相似度,计算每个样本距离类间中心点mk之间的相似度;
Step2:计算类内散度相似度矩阵Sp与类间散度相似度矩阵Sn;其中Sp和Sn通过如下公式计算得到:
其中wic为相似度权值,/>0<s<1可变参数;mp为类内中心点;
其中wic为相似度权值,0<s<1可变参数,mp为类内中心点,mk为类间中心点;
Step3:求解(Sp)-1Sn前k个最大特征值对应的d个特征向量p1,...,pk,设P=[p1,...,pk],则每一个拉曼光谱样本x在d维特征空间中的表示为y=PTx。
Step4:根据样本x在k维特征空间中的表示y,可采用多分类器对y进行分类,本申请中采用KNN、SVM和RF任意一种作为多分类器的基分类器。
Step5:输出分类结果为干燥综合征、干燥综合征合并间质性肺病、健康三种结果之一。
本实施例中采用SVM、KNN和RF作为分类模型,其中SVM核函数选择为多项式核函数(poly)。在三种模型上的识别平均准确率、敏感性、精确率、AUC结果如表所示。
上述灵敏度(Sensitivity)、精确率(Precision)、准确率(Accuracy)公式分别如下;
现有技术相比,本发明的有益效果是:本申请提供了一种高准确且无创的干燥综合征和间质性肺病辅助识别方法。相对于现有技术,本申请采用拉曼光谱进行干燥综合征和间质性肺病辅助识别特征数据,为了提升分类准确性,针对性的提出一种改进拉曼光谱数据分类方法。通过本申请的拉曼光谱结合改进的机器学习算法是辅助诊断干燥综合征合并间质性肺病患者的一种有价值工具,具有广阔的应用前景,可以为医生诊断做辅助参考结果。
附图说明
图1本申请血清拉曼光谱干燥综合征和间质性肺病识别方法流程图;
图2本申请训练集和测试集贡献率最高的3个主要成分PC1、PC2和PC3绘图。
具体实施方式
下面结合附图1-2对本发明作进一步详细描述:本发明是通过以下技术方案实现的:
步骤1,对N例干燥综合征患者、M例干燥综合征合并间质性肺病(pSS-ILD)患者和L例健康对照组(JK)的血清进行拉曼光谱检测得到原始光谱;
本实施例中N=150、M=150、L=150,检测中激光波长为532nm,激光功率为20mW。在22℃的室温下,激光束通过一个10倍的物镜聚焦在样本血管表面进行测量。光谱测量范围从600cm-1到1800cm-1,每个样本在不同的位置被测量5次,获得450个光谱数据,包括150个pSS数据、150个pSS-ILD数据和150个JK对照数据。
步骤2,对原始光谱进行预处理,波段选择、基线校正、平滑处理、进行异常值剔除和归一化预处理;本申请选择拉曼光谱600-1800cm-1波段,该部位属于拉曼光谱的指纹区域,能够提高诊断的准确性;基线校正采用airPLS方法,平滑滤波采用SG方法;剔除异常值方法选用t-SNE;对预处理后的拉曼光谱进行归一化处理,对特征值进行缩放,以降低数据复杂度;
步骤3,进行训练集和测试集的划分,对预处理后的数据使用PCA进行降维。对数据降维后,选择合适的特征数输入分类模型,对PCA特征提取前100维光谱数据作为后续分类模型的输入;
本实施例中训练集和测试集分别为100组和50组;将划分后的数据集进行PCA特征提取。将训练集和测试集贡献率最高的3个主要成分PC1、PC2和PC3进行绘图和分析,得到结果示意图如附图2。
步骤4,针对上述得到的PCA特征作为分类特征,由于各类别数据强度波形一致性较高,分类准确性仍然较低,为了提升数据分类的准确性,本申请针对性的提出一种改进拉曼光谱数据分类方法得到识别结果。
Step1:确定每个类别的PCA特征空间的中心点,计算每个样本距离类内中心点mp之间的相似度,计算每个样本距离类间中心点mk之间的相似度;
Step2:计算类内散度相似度矩阵Sp与类间散度相似度矩阵Sn;其中Sp和Sn通过如下公式计算得到:
其中wic为相似度权值,/><s<1可变参数;mp为类内中心点;
其中wic为相似度权值,0<s<1可变参数,mp为类内中心点,mk为类间中心点;
Step3:求解(Sp)-1Sn前k个最大特征值对应的d个特征向量p1,...,pk,设P=[p1,...,pk],则每一个拉曼光谱样本x在d维特征空间中的表示为y=PTx。
Step4:根据样本x在k维特征空间中的表示y,可采用多分类器对y进行分类,本申请中采用KNN、SVM和RF任意一种作为多分类器的基分类器。
Step5:输出分类结果为干燥综合征、干燥综合征合并间质性肺病、健康三种结果之一
本实施例中采用SVM、KNN和RF作为分类模型,其中SVM核函数选择为多项式核函数(poly)。在三种模型上的识别平均准确率、敏感性、精确率、AUC结果如表所示。
上述灵敏度(Sensitivity)、精确率(Precision)、准确率(Accuracy)公式分别如下;
除此之外,本申请还提供了一种血清拉曼光谱干燥综合征和间质性肺病识别方法对应的计算设备以及计算机可读存储介质,包括处理器和存储器,所述存储器存储有能够被所述处理器执行的计算机可执行指令,所述处理器执行所述计算机可执行指令以实现上述识别方法方法。
在本发明的描述中,需要说明的是,除非另有明确的规定和限定,术语“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本发明中的具体含义。
在本发明的描述中,除非另有说明,术语“上”、“下”、“左”、“右”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。
最后应说明的是,上述技术方案只是本发明的一种实施方式,对于本领域内的技术人员而言,在本发明公开了应用方法和原理的基础上,很容易做出各种类型的改进或变形,而不仅限于本发明上述具体实施方式所描述的方法,因此前面描述的方式只是优选的,而并不具有限制性的意义。

Claims (9)

1.一种基于血清拉曼光谱干燥综合征和间质性肺病识别方法,其特征在于:
步骤1,对N例干燥综合征患者、M例干燥综合征合并间质性肺病患者和L例健康对照组的血清进行拉曼光谱检测得到原始光谱;
步骤2,对原始光谱进行预处理,波段选择、基线校正、平滑处理、进行异常值剔除和归一化预处理;
步骤3,进行训练集和测试集的划分,对预处理后的数据使用PCA进行降维;
步骤4,针对上述得到的PCA特征作为分类特征,通过改进拉曼光谱数据分类方法得到识别结果;
其中,所述改进拉曼光谱数据分类方法具体包含如下步骤:
Step1:确定每个类别的PCA特征空间的中心点,计算每个样本距离类内中心点mp之间的相似度,计算每个样本距离类间中心点mk之间的相似度;
Step2:计算类内散度相似度矩阵Sp与类间散度相似度矩阵Sn;其中Sp和Sn通过如下公式计算得到:
其中wic为相似度权值,/>0<σ<1可变参数;mp为类内中心点;
其中wic为相似度权值,0<σ<1可变参数,mp为类内中心点,mk为类间中心点;
Step3:求解(Sp)-1Sn前k个最大特征值对应的d个特征向量p1,...,pk,设P=[p1,...,pk],则每一个拉曼光谱样本x在d维特征空间中的表示为y=PTx;
Step4:根据样本x在k维特征空间中的表示y,可采用多分类器对y进行分类;
Step5:输出分类结果为干燥综合征、干燥综合征合并间质性肺病、健康三种结果之一。
2.根据权利要求1所述的血清拉曼光谱干燥综合征和间质性肺病识别方法,其特征在于:所述N=150、M=150、L=150,检测中激光波长为532nm。
3.根据权利要求1所述的血清拉曼光谱干燥综合征和间质性肺病识别方法,其特征在于:所述基线校正采用airPLS方法,平滑滤波采用SG方法。
4.根据权利要求1所述的血清拉曼光谱干燥综合征和间质性肺病识别方法,其特征在于:剔除异常值方法选用t-SNE;对预处理后的拉曼光谱进行归一化处理,对特征值进行缩放,以降低数据复杂度。
5.根据权利要求1所述的血清拉曼光谱干燥综合征和间质性肺病识别方法,其特征在于:所述步骤3中提取PCA特征前100维光谱数据作为后续分类模型的输入。
6.根据权利要求1所述的血清拉曼光谱干燥综合征和间质性肺病识别方法,其特征在于:所述Step4中采用KNN、SVM和RF任意一种作为多分类器的基分类器。
7.根据权利要求1所述的血清拉曼光谱干燥综合征和间质性肺病识别方法,其特征在于:所述步骤3中训练集和测试集分别为100组和50组。
8.一种计算机设备,其特征在于,包括处理器和存储器,所述存储器存储有能够被所述处理器执行的计算机可执行指令,所述处理器执行所述计算机可执行指令以实现权利要求1至4任一项所述的方法。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机可执行指令,所述计算机可执行指令在被处理器调用和执行时,计算机可执行指令促使处理器实现权利要求1至4任一项所述的方法。
CN202210829567.4A 2022-07-15 2022-07-15 一种基于血清拉曼光谱干燥综合征和间质性肺病识别方法 Active CN115184336B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210829567.4A CN115184336B (zh) 2022-07-15 2022-07-15 一种基于血清拉曼光谱干燥综合征和间质性肺病识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210829567.4A CN115184336B (zh) 2022-07-15 2022-07-15 一种基于血清拉曼光谱干燥综合征和间质性肺病识别方法

Publications (2)

Publication Number Publication Date
CN115184336A CN115184336A (zh) 2022-10-14
CN115184336B true CN115184336B (zh) 2024-03-15

Family

ID=83518552

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210829567.4A Active CN115184336B (zh) 2022-07-15 2022-07-15 一种基于血清拉曼光谱干燥综合征和间质性肺病识别方法

Country Status (1)

Country Link
CN (1) CN115184336B (zh)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108088834A (zh) * 2017-09-13 2018-05-29 新疆大学 基于优化反向传播神经网络的包虫病血清拉曼光谱诊断仪
CN112712108A (zh) * 2020-12-16 2021-04-27 西北大学 一种拉曼光谱多元数据分析方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8218880B2 (en) * 2008-05-29 2012-07-10 Microsoft Corporation Linear laplacian discrimination for feature extraction
GB2466442A (en) * 2008-12-18 2010-06-23 Dublin Inst Of Technology A system to analyze a sample on a slide using Raman spectroscopy on an identified area of interest
US20120083678A1 (en) * 2010-09-30 2012-04-05 Chemimage Corporation System and method for raman chemical analysis of lung cancer with digital staining

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108088834A (zh) * 2017-09-13 2018-05-29 新疆大学 基于优化反向传播神经网络的包虫病血清拉曼光谱诊断仪
CN112712108A (zh) * 2020-12-16 2021-04-27 西北大学 一种拉曼光谱多元数据分析方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
基于拉曼光谱的药片快速鉴别方法;熊智新;杨浩;莫卫林;柳艳;陆峰;;分析科学学报;20181220;第34卷(第06期);772-776 *
基于血清拉曼光谱的丙型肝炎病毒诊断和1b亚型的鉴定;潘琨琨;张朝霞;秦洁;吕小毅;;新疆医科大学学报;20190515;第42卷(第05期);656-662 *

Also Published As

Publication number Publication date
CN115184336A (zh) 2022-10-14

Similar Documents

Publication Publication Date Title
Hao et al. Fusing multiple deep models for in vivo human brain hyperspectral image classification to identify glioblastoma tumor
US6421553B1 (en) Spectral data classification of samples
AU2015331579A1 (en) Methods and systems for classifying biological samples, including optimization of analyses and use of correlation
TWI810498B (zh) 肝腫瘤智慧分析裝置
JP2001505113A (ja) 動径基底関数ネットワークを用いた子宮前癌の分光検出
Cao et al. A deep learning approach for detecting colorectal cancer via Raman spectra
CN112651927A (zh) 一种基于卷积神经网络与支持向量机的拉曼光谱智能识别方法
Fan et al. Rapid noninvasive screening of cerebral ischemia and cerebral infarction based on tear Raman spectroscopy combined with multiple machine learning algorithms
Seedat et al. Automated and interpretable m-health discrimination of vocal cord pathology enabled by machine learning
Sadi et al. Lmfloss: a hybrid loss for imbalanced medical image classification
CN115184336B (zh) 一种基于血清拉曼光谱干燥综合征和间质性肺病识别方法
CN113702349A (zh) 一种基于拉曼光谱的涎腺肿瘤的诊断模型构建方法
Wu et al. Raman spectroscopy combined with machine learning algorithms for rapid detection Primary Sjögren's syndrome associated with interstitial lung disease
CN107463964A (zh) 一种基于超声图像特征相关性的乳腺肿瘤分类方法、装置
CN116416471A (zh) 乳腺上皮纤维肿瘤样本分类模型构建方法及其构建系统
CN113960130B (zh) 一种采用开放式离子源诊断甲状腺癌的机器学习方法
Zhao et al. Auxiliary diagnosis of papillary thyroid carcinoma based on spectral phenotype
Xiong et al. Deep Ensemble Learning Network for Kidney Lesion Detection
Jabbar et al. Liver fibrosis processing, multiclassification, and diagnosis based on hybrid machine learning approaches
Prasad et al. Comprehensive CNN model for brain tumour identification and classification using MRI images
Senthil et al. Predicting lung cancer using datamining techniques with the AID of SVM classifier
Mirkov et al. Tumor detection using brain MRI and low-dimension co-occurrence feature approach
Yan et al. Automated detection of laryngeal carcinoma in laryngoscopic images from a multicenter database using a convolutional neural network
Yang et al. Feature-based discrimination of thyroid cancer on ultrasound images
Sanghavi et al. Machine learning based classification system using depth-dependent variation encoding for classifying cervical two-photon excited fluorescence image stacks

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant