CN116030032A - 基于拉曼光谱数据的乳腺癌分析设备、系统及存储介质 - Google Patents
基于拉曼光谱数据的乳腺癌分析设备、系统及存储介质 Download PDFInfo
- Publication number
- CN116030032A CN116030032A CN202310120122.3A CN202310120122A CN116030032A CN 116030032 A CN116030032 A CN 116030032A CN 202310120122 A CN202310120122 A CN 202310120122A CN 116030032 A CN116030032 A CN 116030032A
- Authority
- CN
- China
- Prior art keywords
- raman spectrum
- breast cancer
- sample data
- data
- spectrum
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Investigating, Analyzing Materials By Fluorescence Or Luminescence (AREA)
Abstract
本发明涉及基于拉曼光谱数据的乳腺癌分析设备、系统及存储介质。包括:获取基于拉曼光谱检测的血清的拉曼光谱样本数据;对拉曼光谱样本数据进行特征选择,得到光谱特征峰,所述光谱特征峰基于拉曼光谱样本数据中正常乳腺组、良性乳腺组与乳腺癌组筛选得到光谱特征差异信息;基于光谱特征峰进行分类,得到乳腺癌分类预测结果。本发明方法旨在基于拉曼光谱结合机器学习分类模型进行乳腺癌的分类预测,旨在发掘拉曼光谱在乳腺癌早期筛查的特异性分析能力和潜在应用价值。
Description
技术领域
本发明涉及计算机视觉和医学图像分析领域,更具体地,涉及基于拉曼光谱数据的乳腺癌分析设备、系统、计算机可读存储介质及其应用。
背景技术
乳腺癌的早期筛查可以有效降低乳腺癌的致死率。目前,乳腺癌的诊断主要依靠影像学及病理学检查等,其中用于乳腺癌筛查的影像检查主要包括超声、钼靶X线检查以及MR成像。超声成像对操作者依赖性大,操作流程非标准化,重复性欠佳,缺乏二次评估,对微小钙化灶不敏感,对微钙化、导管原位癌及体积较小的浸润性癌的敏感度差等。乳腺X线检查作为乳腺癌筛查方法,对致密型腺体的灵敏度较低,尤其当病灶靠近胸壁或与致密型腺体重叠时,易导致漏诊,假阴性较高,同时引起放射损害、过度诊断等问题,多次进行X线检查的受检者,会积累辐射量,并对受检者机体产生影响。MR成像的缺点在于特异性中等、假阳性率高、对微小钙化性病变显示不满意,检查时间长、费用昂贵。其中,影像检查中有恶性可疑的肿块必须进行穿刺活检和组织病理学检查,约70%~90%的患者在活检中确诊为良性,导致患者承受了不必要的创伤、巨大的精神压力和高额的医疗费用。因此,临床迫切需要一种客观、快速、方便、灵敏的乳腺癌早期筛查方法。
拉曼光谱具有无创性、无需样品制备、对样品无接触、不破坏样品结构、分析快速且操作简便和分辨率高等特点,其良好的敏感度和特异度对不同分子产生独特的谱图。因此,基于拉曼光谱进行乳腺癌早期筛查成为一种解决方法。
发明内容
本申请的目的在于,本申请实施例提供基于拉曼光谱数据的乳腺癌分析设备、系统、计算机可读存储介质及其应用,其旨在为有效解决乳腺癌早期大规模人群的筛查问题,探索将普通拉曼光谱应用于乳腺癌筛查的可行性,提供一种客观、快速、方便、灵敏的乳腺癌筛查的机器学习模型,以节省数据处理的人力和时间成本,提高实验数据的获取速度和分割统计准确度。将拉曼光谱与机器学习相结合应用数学方法分析结果,使拉曼光谱的物质识别问题转换成机器学习的分类问题,能够更加准确预测结果,提高分割效果及分割速度。拉曼光谱检测在肿瘤诊断及发生机制研究方面显示出突出优势,可以广泛应用于疾病的预测、诊断及疗效判断,是生物医学研究的强大工具。
根据本申请的第一方面,本申请一实施例提供了基于拉曼光谱数据的乳腺癌分析设备,所述设备包括:存储器和处理器;所述存储器用于存储程序指令;所述处理器用于调用程序指令,当程序指令被执行时,用于执行实现基于拉曼光谱数据的乳腺癌分析方法,具体步骤包括:
获取基于拉曼光谱检测的血清的拉曼光谱样本数据;
对所述拉曼光谱样本数据进行特征选择,得到光谱特征峰,所述光谱特征峰基于拉曼光谱样本数据中正常乳腺组、良性乳腺组与乳腺癌组筛选得到的光谱特征差异信息;
基于所述光谱特征峰进行分类,得到乳腺癌分类结果。
进一步,所述拉曼光谱样本数据是按照拉曼光谱仪操作步骤对每组每个血清样本进行有限次采集,然后对采集得到的样本数据进行均值化处理得到。
再进一步,所述获取基于拉曼光谱检测的血清的拉曼光谱样本数据,还包括对获取的拉曼光谱样本数据进行预处理。其中,所述预处理包括通过光谱曲线平滑与归一化、基线矫正以及光谱特征选择的方法,完成所述拉曼光谱样本数据的预处理,得到预处理后的拉曼光谱样本数据;
可选的,所述预处理步骤包括:
(1)光谱曲线平滑与归一化:使用拉曼光谱样本数据中的邻接点的平均值进行平滑拉曼光谱样本数据,将每个拉曼光谱样本数据归一化为0~1;
(2)基线修正:基于经光谱曲线平滑与归一化后的拉曼光谱样本数据的各特征峰对拉曼光谱样本数据进行标准化处理,重建得到基于峰值信息和相对强度构建的基线;
(3)光谱特征选择:基于构建的基线对拉曼光谱样本数据进行主成分分析,选取保留关键性显著信息的成分作为显著性差异特征选择结果。
更进一步,所述标准化处理是基于拉曼光谱样本数据的各特征峰,根据拉曼光谱样本数据噪声的标准偏差的分布通过多项式拟合法去除荧光背景,再通过滑动窗口的方法对光谱点进行分类和纠正,重建得到基于峰值信息和相对强度构建的拉曼光谱样本数据的基线。
进一步,所述分类通过机器学习分类模型对所述光谱特征峰所对应的具有显著性差异的乳腺癌拉曼光谱特征信息进行分类,得到乳腺癌分类结果,其中,所述机器学习分类模型通过下列方法中的任意一种或几种实现:逻辑回归、支持向量机、k最近邻、决策树、朴素贝叶斯、随机森林、主成分分析、梯度提升;可选的,所述机器学习分类模型通过多元统计方法将所述具有显著性差异的乳腺癌拉曼光谱特征信息变换到高维空间,得到乳腺癌拉曼光谱高维度信息,再对乳腺癌拉曼光谱高维度信息进行分析,得到乳腺癌分类结果。
再进一步,所述机器学习分类模型的构建过程包括,通过随机欠采样、SMOTE过采样对训练数据集进行数据处理,得到分类均衡的训练数据集。
根据本申请的第二方面,本申请一实施例提供了基于拉曼光谱数据的乳腺癌分析系统,所述系统在执行时实现上述基于拉曼光谱数据的乳腺癌分析设备中所涉及到的基于拉曼光谱数据的乳腺癌分析方法。
进一步,该系统的模块化结构包括:
获取模块,用于获取基于拉曼光谱检测的血清的拉曼光谱样本数据;
特征选择模块,用于对所述拉曼光谱样本数据进行特征选择,得到光谱特征峰,所述光谱特征峰基于拉曼光谱样本数据中正常乳腺组、良性乳腺组与乳腺癌组筛选得到的光谱特征差异信息;
分类模块,基于所述光谱特征峰进行分类,得到乳腺癌分类结果。
再进一步,所述获取模块还包括对获取的拉曼光谱样本数据进行标准化处理,所述标准化处理是基于拉曼光谱样本数据的各光谱特征峰,根据拉曼光谱样本数据噪声的标准偏差的分布通过多项式拟合法去除荧光背景,再通过滑动窗口的方法对光谱点进行分类和纠正,重建得到基于峰值信息和相对强度构建的拉曼光谱样本数据的基线;可选的,所述光谱特征峰包括下列位置中的任意一种或几种:784 cm-1、835 cm-1、925cm-1、986cm-1、989cm-1、1002cm-1、1020cm-1、1056cm-1、1114cm-1、1127cm-1、1139cm-1、1285cm-1、1295cm-1、1346cm-1、1367cm-1、1437cm-1、1531cm-1、1650cm-1。
根据本申请的第三方面,本申请一实施例提供了一种计算机可读存储介质,其上存储有基于拉曼光谱数据进行乳腺癌分类分析的计算机程序,当所述计算机程序被处理器执行时,实现上述基于拉曼光谱数据的乳腺癌分析设备中所涉及的基于拉曼光谱数据的乳腺癌分析方法。
根据本申请的第四方面,本申请一实施例提供了其相关应用,主要包括:
上述的设备或系统在进行乳腺癌目标分类任务中的应用;可选的,所述目标分类任务包括对正常、良性肿瘤、恶性肿瘤的分类预测。
上述的设备或系统在基于拉曼光谱特征进行智能预测与图像分析的应用;可选的,所述预测或分析包括对患者进行癌症、良性肿瘤和正常的预测与分析;
上述的设备或系统在辅助疾病诊断及癌症筛查中的应用;可选的,所述疾病诊断包括对乳腺癌的初级筛查和预测分析,通过自动确定最基本的诊断特征,以提高血清分析和分化效率,所述癌症筛查包括有利于实现更多更大规模人群的乳腺癌 症筛查,特别是有利于在基层大规模开展乳腺癌患者的早期筛查。
本发明利用拉曼光谱检测乳腺癌患者、良性病例和健康受试者的血清,通过采集各组血清光谱数据,采用多变量统计分析整个光谱特征,基于机器学习分类模型自动确定最基本的显著性特征,以提高血清分析和分化效率,得到预测结果,大大减少患者承受的创伤、巨大的精神压力和高额的医疗费用,克服了特异性中等、假阳性率高、对微小钙化性病变显示不满意、检查时间长、费用昂贵的问题,实现了对乳腺癌的智能化预测,具有很强的创新性。
本申请的优点:
1.本申请创新性的公开一种利用拉曼光谱检测乳腺癌患者、良性病例和健康受试者的血清,通过获取的拉曼光谱样本数据,建立有效的乳腺癌筛查模型,作为一种初筛手段,客观地提高了数据分析的精度和深度;
2.本申请创新性的探索将普通拉曼光谱应用于乳腺癌早期筛查的可行性,提供了一种客观、快速、方便、灵敏的辅助乳腺癌筛查的机器学习分类模型,实现乳腺癌分类预测结果的智能学习与自动分析,时效明显;
3.本申请创造性的公开了基于拉曼光谱检测患者血清的图像数据,根据拉曼光谱特征峰信息建立相应模型,更有效地实现了一种更安全、快速、实时、无创、无标记、灵敏度高、精准方便的辅助乳腺癌筛查的分类预测,效能更好,以在乳腺癌早期筛查方案选择及分类分析中提供更充分的支持和潜在应用价值。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获取其他的附图。
图1是本发明实施例提供的基于拉曼光谱数据进行乳腺癌分析的使用场景示意图;
图2是本发明实施例提供的基于拉曼光谱数据进行图像分析方法流程图;
图3是本发明实施例提供的一种乳腺癌早期筛查的模型构建方法示意图;
图4是本发明实施例提供的各组归一化光谱图和各组之间光谱的差异图;
图5是本发明实施例提供的基于拉曼光谱数据的模型的分类结果示意图;
图6是本发明实施例提供的基于拉曼光谱数据的乳腺癌分析设备示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。
在本发明的说明书和权利要求书及上述附图中的描述的一些流程中,包含了按照特定顺序出现的多个操作,但是应该清楚了解,这些操作可以不按照其在本文中出现的顺序来执行或并行执行,操作的序号如S101、S102等,仅仅是用于区分开各个不同的操作,序号本身不代表任何的执行顺序。另外,这些流程可以包括更多或更少的操作,并且这些操作可以按顺序执行或并行执行。
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有做出创造性劳动前提下所获取的所有其他实施例,都属于本发明保护的范围。
本申请实施例提供了基于拉曼光谱数据的乳腺癌分析设备、系统和计算机可读存储介质以及其应用。其中,基于拉曼光谱数据中的光谱特征峰进行构建的机器学习分类模型训练装置可以集成在计算机设备中,该计算机设备可以为终端或者服务器等设备。终端可以为智能手机、平板电脑、笔记本电脑、个人计算机等。服务器可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容发布网络(Content Delivery Network,简称CDN)、以及大数据和人工智能平台等基础云计算服务的云服务器。终端以及服务器可以通过有线或无线通信方式进行直接或间接连接,本申请在此不做限制。
请参阅图1,图1是本发明实施例提供的基于拉曼光谱数据进行乳腺癌分析的使用场景示意图,具体地,如图1所示的计算机设备为终端设备,该终端设备可以获取基于拉曼光谱检测的血清的拉曼光谱样本数据,拉曼光谱样本数据进行特征选择,得到光谱特征峰;基于光谱特征峰进行分类,得到乳腺癌分类结果。其中,光谱特征峰基于拉曼光谱样本数据中正常乳腺组、良性乳腺组与乳腺癌组筛选得到的光谱特征差异信息。
图2是本发明实施例提供的基于拉曼光谱数据的乳腺癌分析设备所涉及的方法流程图。具体地,进行乳腺癌图像分析方法包括如下步骤:
S101:获取基于拉曼光谱检测的血清的拉曼光谱样本数据。
在一个实施例中,拉曼光谱样本数据是按照拉曼光谱仪操作步骤对每组每个血清样本进行有限次采集,然后对采集得到的拉曼光谱样本数据进行均值化处理得到。
在一个实施例中,步骤S101还包括对获取的拉曼光谱样本数据进行预处理。进一步,预处理包括通过光谱曲线平滑与归一化、基线矫正以及光谱特征选择的方法,完成所述拉曼光谱样本数据的预处理,得到预处理后的拉曼光谱样本数据。具体地,预处理步骤包括:
(1)光谱曲线平滑与归一化:使用拉曼光谱样本数据中的邻接点的平均值进行平滑拉曼光谱样本数据,然后将每个拉曼光谱样本数据归一化为0~1;
(2)基线修正:基于经光谱曲线平滑与归一化后的拉曼光谱样本数据的各特征峰对拉曼光谱样本数据进行标准化处理,重建得到基于峰值信息和相对强度构建的基线;
(3)光谱特征选择:基于构建的基线对拉曼光谱样本数据进行主成分分析,选取保留关键性显著信息的成分作为显著性差异特征选择结果。其中,显著性差异特征,基于拉曼光谱样本数据中正常乳腺组、良性乳腺组与乳腺癌组的光谱特征差异信息,通过提取相应组织中能够识别乳腺癌的分子带和官能团的生物标志物的对应峰值位置的光谱信息差异特征得到。
进一步,标准化处理是基于拉曼光谱样本数据的各特征峰,根据拉曼光谱样本数据噪声的标准偏差的分布通过多项式拟合法去除荧光背景,再通过滑动窗口的方法对光谱点进行分类和纠正,重建得到基于峰值信息和相对强度构建的拉曼光谱样本数据的基线。
再进一步,基线修正主要是为了消除包括仪器不稳定性、强自由感应衰变等造成的噪声,因此,消除基线以减少代谢组学研究中化学计量分析中的错误。
具体的,通过滑动窗口的方法对光谱点进行分类和纠正,包括根据拉曼光谱样本数据噪声的标准偏差的分布,重建得到一个新的基于峰值信息和相对强度构建的拉曼光谱样本数据的基线。其进行确定的噪音数据点是通过一个合适的样条插值函数对数据进行电镜插值,进而评估基线强度。其进行分类和纠正的主要算法:先计算在拉曼光谱样本数据上滑动的窗口内光谱点的标准偏差;然后对噪声的标准偏差分布进行建模;根据得到的分布模型将每个滑动窗口分类为信号窗口或噪声窗口;再根据窗口类型对每个窗口中的光谱点进行分类;进而构建得到基线。其中,基线包括根据来自低场光谱的波动阈值(6-10 ppm)对高场光谱(0-6 ppm)的光谱点进行重新分类,通过重建和纠正基线得到新的分类和构建好的基线。
在一个具体实施例中,各组血清的拉曼光谱样本数据的采集和处理步骤包括:每组每个血清样本各采集10次拉曼光谱,将所获得的光谱先进行光谱曲线平滑与归一化、基线修正、光谱特征选择等预处理以得到识别分子带和官能团的显著性差异特征。
在一个更为具体的实施例中,对各组血清的拉曼光谱样本数据进行预处理:
(1)平滑预处理时,选取的移动平均值为3,然后使用邻接点的平均值进行平滑处理,再将每个光谱数据的最大值和最小值归一化为1(最大)~0(最小);
(2)基线修正:对拉曼光谱进行标准处理,基于多项式拟合法去除荧光背景,保留主要峰信息和相对强度;
(3)均值化处理:对采集10次拉曼光谱样本数据,取其平均值,以保持其更稳定更基本的拉曼光谱样本数据特征;
(4)光谱特征选择:基于构建的基线对均值化处理的拉曼光谱样本数据进行主成分分析,选取保留关键性显著信息的成分作为显著性差异特征选择结果。
S102:对拉曼光谱样本数据进行特征选择,得到光谱特征峰,所述光谱特征峰基于拉曼光谱样本数据中正常乳腺组、良性乳腺组与乳腺癌组筛选得到的光谱特征差异信息。
在一个实施例中,通过特征选择得到的光谱特征峰,包括下列位置中的任意一种或几种:784 cm-1、835 cm-1、925cm-1、986cm-1、989cm-1、1002cm-1、1020cm-1、1056cm-1、1114cm-1、1127cm-1、1139cm-1、1285cm-1、1295cm-1、1346cm-1、1367cm-1、1437cm-1、1531cm-1、1650cm-1。
进一步,784 cm-1这一光谱特征峰所包含的光谱特征差异信息可以通过对应的生物标志物来体现,具体的生物标志物包括:胞嘧啶、L-组氨酸、柠檬酸;
进一步,835 cm-1这一光谱特征峰所包含的光谱特征差异信息可以通过酪氨酸这一生物标志物来体现;
进一步,925cm-1这一光谱特征峰所包含的光谱特征差异信息可以通过对应的生物标志物来体现,具体的生物标志物包括:D-甘露糖、L-谷氨酸、D-(-)-果糖;
进一步,986cm-1这一光谱特征峰所包含的光谱特征差异信息可以通过对应的生物标志物来体现,具体的生物标志物包括:肉豆蔻酸、脯氨酸;
进一步,989cm-1这一光谱特征峰所包含的光谱特征差异信息可以通过对应的色氨酸这一生物标志物来体现;
进一步,1002cm-1这一光谱特征峰所包含的光谱特征差异信息可以通过对应的生物标志物来体现,具体的生物标志物包括:苯丙氨酸、β-D-葡萄糖、N-乙酰葡萄糖胺;
进一步,1020cm-1这一光谱特征峰所包含的光谱特征差异信息可以通过对应的生物标志物来体现,具体的生物标志物包括:色氨酸、N-乙酰基葡萄糖、D-葡萄糖、葡萄糖醛酸、乳糖、D-(+)-半乳糖胺;
进一步,1056cm-1这一光谱特征峰所包含的光谱特征差异信息可以通过L-谷氨酸这一生物标志物来体现;
进一步,1114cm-1这一光谱特征峰所包含的光谱特征差异信息可以通过乳脂这一生物标志物来体现;
进一步,1127cm-1这一光谱特征峰所包含的光谱特征差异信息可以通过对应的生物标志物来体现,具体的生物标志物包括:氨基酸、脂肪酸、糖类、D-果糖-6-磷酸;
进一步,1139cm-1这一光谱特征峰所包含的光谱特征差异信息可以通过对应的生物标志物来体现,具体的生物标志物包括:D-甘露糖、酰胺III ;
进一步,1285cm-1这一光谱特征峰所包含的光谱特征差异信息可以通过对应的生物标志物来体现,具体的生物标志物包括:酰胺III、磷脂;
进一步,1295cm-1这一光谱特征峰所包含的光谱特征差异信息可以通过反式脂肪酸这一生物标志物来体现;
进一步,1346cm-1这一光谱特征峰所包含的光谱特征差异信息可以通过对应的生物标志物来体现,具体的生物标志物包括:甘氨酸、α-D-葡萄糖;
进一步,1367cm-1这一光谱特征峰所包含的光谱特征差异信息可以通过对应的色氨酸这一生物标志物来体现;
进一步,1437cm-1这一光谱特征峰所包含的光谱特征差异信息可以通过对应的精氨酸这一生物标志物来体现;
进一步,1537cm-1这一光谱特征峰所包含的光谱特征差异信息可以通过β胡萝卜素这一生物标志物来体现;
进一步,1650cm-1这一光谱特征峰所包含的光谱特征差异信息可以通过对应的蛋白质酰胺I这一生物标志物来体现。
再进一步,光谱特征峰所包含的光谱特征差异信息还可以通过分析正常、良性、乳腺癌等不同性质组织生化成分来实现。
具体地,784 cm-1这一光谱特征峰所包含的光谱特征差异信息可以通过分析DNA的磷酸骨架、 δ(C3CO)形变这两个生化成分来获得;
835 cm-1这一光谱特征峰所包含的光谱特征差异信息可以通过分析对位取代苯环这一生化成分来获得;
925 cm-1这一光谱特征峰所包含的光谱特征差异信息可以通过分析C(6)-OH这一生化成分来获得;
1002cm-1这一光谱特征峰所包含的光谱特征差异信息可以通过分析三角环呼吸的苯环、 延伸ν(C–O) 这两个生化成分来获得;
1020cm-1这一光谱特征峰所包含的光谱特征差异信息可以通过分析吲哚环、延伸ν(C-O)和ν(C-C)这两个生化成分来获得;
1114cm-1这一光谱特征峰所包含的光谱特征差异信息可以通过分析C-C拉伸这一个生化成分来获得;
1139cm-1这一光谱特征峰所包含的光谱特征差异信息可以通过分析C-C骨拉伸、伸缩振动ν(C-N)这两个生化成分来获得;
1285cm-1这一光谱特征峰所包含的光谱特征差异信息可以通过分析α-螺旋这一个生化成分来获得;
1295cm-1这一光谱特征峰所包含的光谱特征差异信息可以通过分析δ(CH2)扭转振动这一个生化成分来获得;
1367cm-1这一光谱特征峰所包含的光谱特征差异信息可以通过分析CH3吲哚环这一个生化成分来获得;
1437cm-1这一光谱特征峰所包含的光谱特征差异信息可以通过分析CH2剪式移动这一个生化成分来获得;
1531cm-1这一光谱特征峰所包含的光谱特征差异信息可以通过分析ν(C = C)伸展这一个生化成分来获得;
1650cm-1这一光谱特征峰所包含的光谱特征差异信息可以通过分析α-螺旋、ν(C =C)伸展振动这两个生化成分来获得。
一般来说,“生物标志物”,指可以标记系统、器官、组织、细胞及亚细胞结构或功能的改变或可能发生改变的生化指标,可用于疾病诊断、判断疾病分期或评价新药新疗法在目标人群中的安全性和有效性。在本发明中,“生物标志物”指来自于临床保乳手术中切除的组织、组织病理活检所采集的组织、乳腺组织冰冻病理切片等各类样品所含氨基酸、色氨酸、苯丙氨酸、脂肪酸、甘氨酸、蛋白质、胡萝卜素、血红蛋白和核酸等生物标志物,因为本发明中使用拉曼光谱检测装置,快速检测临床和乳腺相关的等各类样品所含脂肪酸、蛋白质、胡萝卜素、血红蛋白和核酸等生物标志物光谱特征信息,然后基于各光谱特征峰,即基于拉曼光谱样本数据中正常乳腺组、良性乳腺组与乳腺癌组筛选得到的光谱特征差异信息进行分类预测。
S103:基于光谱特征峰进行分类,得到乳腺癌分类结果。
在一个实施例中,分类通过机器学习分类模型对光谱特征峰所对应的具有显著性差异的乳腺癌拉曼光谱特征信息(即基于拉曼光谱样本数据中正常乳腺组、良性乳腺组与乳腺癌组筛选得到的光谱特征差异信息)进行分类预测,得到乳腺癌分类结果。其中,机器学习分类模型通过下列方法中的任意一种或几种实现:逻辑回归、支持向量机、k最近邻、决策树、朴素贝叶斯、随机森林、主成分分析、梯度提升。
逻辑回归是一种用于解决分类问题的机器学习方法,用于估计某种事物的可能性。比如某用户购买某商品的可能性,某病人患有某种疾病的可能性,以及某广告被用户点击的可能性等。
支持向量机是一种分类算法,通过寻求结构化风险最小来提高学习机泛化能力,实现经验风险和置信范围的最小化,从而达到在统计样本量较少的情况下,亦能获得良好统计规律的目的。
k最近邻是数据挖掘分类技术中最简单的方法之一,主要靠周围有限的邻近的样本来确定所属类别的,因此对于类域的交叉或重叠较多的待分样本集,k最近邻较其他方法更为适合。
决策树是根据一些特征将数据划分为不同的类别,然后新数据进来后根据之前的划分准则,判断新数据属于哪个分类,进而实现数据分类。
朴素贝叶斯是贝叶斯分类中最简单,也是常见的一种分类方法,其核心思想是通过考虑特征概率来预测分类,即对于给出的待分类样本,求解在此样本出现的条件下各个类别出现的概率,概率最大的即待分类样本属于的类别。
随机森林是一组决策树,用于分类和回归的一种主流集成学习方法。随机森林应用于数据科学的群体智慧,是几乎人人都熟悉的解决问题的比喻。
主成分分析是一种常用的数据分析方法,通过线性变换将原始数据变换为一组各维度线性无关的表示,用于提取数据的主要特征分量和高维数据的降维。
梯度提升,一种通过添加弱学习器以最小化损失函数的加法模型,用于解决回归和分类问题,每一步产生一个弱预测模型,并加权累加到总模型中,同时结合粗略和中等不准确的经验法则来产生非常准确的预测规则的一般问题。
在一个具体实施例中,机器学习分类模型通过多元统计方法将具有显著性差异的乳腺癌拉曼光谱特征信息变换到高维空间,得到乳腺癌拉曼光谱高维度信息,再对乳腺癌拉曼光谱高维度信息进行分析预测,得到乳腺癌分类结果。
具体地,在机器学习分类模型的构建过程中,在拟合到训练数据集上时,通过随机欠采样、SMOTE过采样对训练数据集进行数据处理,得到分类均衡的训练数据集,进而解决了分类任务中的不平衡分类问题。
在一个具体的实施例中,机器学习分类模型的构建的关键步骤包括:
(1)获取普通拉曼光谱检测的血清的拉曼光谱样本数据。
其中,获取血清的拉曼光谱样本数据是根据乳腺癌诊断的金标准,即组织病理学检查的结果对纳入研究的样本进行分类和标记。按照标准,纳入恶性肿瘤和良性患者。将按照纳入和排除标准收集的乳腺恶性肿瘤组、乳腺良性肿瘤组和健康对照组的样本进行处理,血清采集的过程为:受试者禁食8小时后,于次日6-7点采集空腹静脉血2毫升,不加抗凝剂,以4000R/min离心10分钟后,取上层血清作为样本,保存于-80℃冰箱以待后续测试。每个血清样品从解冻到测试所用的时间保持一致,待血清解冻后将其加入事先备好的比色皿中,再按照拉曼光谱仪的操作步骤分别采集各组血清样本的拉曼光谱。
进一步,拉曼光谱样本数据被随机分为有限个组,用于进行训练和测试,其中,训练集与测试集的划分比率根据拉曼光谱样本数据的基本特征进行调整。
在本发明则利用拉曼光谱检测乳腺癌患者、良性病例和健康受试者的血清,采集各组血清光谱数据。采用多变量统计分析来结合整个光谱,并自动确定最基本的诊断特征,以提高血清分析和分化效率。所有的原始拉曼光谱样本数据先进行去除荧光背景等预处理,成为用于训练的标准化数据。
(2)基于主成分分析结合支持向量机建立预测模型。
在建立预测模型时,如图3所示的用于进行乳腺癌早期筛查的模型构建流程,对拉曼光谱样本数据中的训练组数据进行主成分分析(Principal Component Analysis,PCA)提取光谱特征,选取99%的成分保留关键性显著信息作为显著性差异特征选择结果,以便基于它们的拉曼光谱特征对单个光谱进行分类。然后结合支持向量机(Support VectorMachine,SVM)对正常、良性和癌症样本组进行分类以建立预测模型,即本发明提到的机器学习分类模型。
(3)交叉验证预测模型性能。
在进行模型的性能评估及预测分析时,可以通过五折交叉验证进行检测模型性能。通过预测结果,进一步优化和确定模型。
在一些实施例中,进行模型构建过程如图3所示的拉曼光谱样本数据的训练集占拉曼光谱样本数据总量的80%,测试集占拉曼光谱样本数据总量的20%。
进一步,在一些实施例中,进行乳腺癌早筛的机器学习分类模型构建时,拉曼光谱样本数据被随机分为有限个组,用于进行训练和测试,其中,训练集与测试集的划分比率根据拉曼光谱样本数据的基本特征进行调整。
进一步,在一些具体的实施例中,使用构建的预测模型基于光谱特征峰进行分类时,可以通过对正常乳腺组、良性乳腺组与乳腺癌组相应生物标志物的检测进行分类。具体的,生物标志物包括下列标志物的任意一种或几种组合:胞嘧啶、磷脂、色氨酸、苯丙氨酸、β胡萝卜素、蛋白质、酰胺I 、酰胺III 、甘露糖、乳脂、L-谷氨酸、L-组氨酸、D-(-)-果糖、D-(+)-半乳糖胺、β-D-葡萄糖、N-乙酰葡萄糖胺。
拉曼光谱技术具有良好的敏感度和特异度,不同的分子可以产生独特的谱图。同时,对于一般技术人员可以很容易地用于光谱信息的收集,不需要特殊的样本准备,使实时、客观筛查成为可能。因此,本发明则利用拉曼光谱检测乳腺癌患者、良性病例和健康受试者的血清,采集各组血清光谱数据。采用多变量统计分析来结合整个光谱,并自动确定最基本的诊断特征,以提高血清分析和分化效率。所有的原始拉曼光谱样本数据先进行去除荧光背景等预处理,成为用于训练的标准化数据。再对训练样本应用主成分分析提取光谱特征,以便基于它们的拉曼光谱特征数据对单个光谱进行分类。再结合支持向量机对正常、良性和癌症样本组进行分类,并采用交叉验证的方法对模型进行评估。与本发明相关的数据结果图如图4所示,根据图4的光谱结果可以看出正常组与肿瘤/良性组血清平均拉曼谱有显著性差异。
图4中的A是本发明实施例提供的在600cm-1-1800cm-1光谱区间正常组、癌症组、良性组各组归一化后的具有显著性差异的光谱图,即通过多次采集均衡化处理后的正常组、癌症组、良性组血清的拉曼光谱样本数据;图4中的B是本发明实施例提供的在600cm-1-1800cm-1光谱区间,正常组、癌症组、良性组各组之间光谱的差异图,即经数据处理后的拉曼光谱样本数据作为标准数据的正常组与癌症组、良性组之间的显著性差异对比图,基于正常组、癌症组、良性组各组的显著性差异峰值可以得到相应的差异性特征信息。
图5是本发明实施例提供的基于拉曼光谱数据的模型的分类结果示意图,图5显示的是本发明所提出模型的分类结果,总体准确率可达98%。具体地,癌症组、良性组和正常组的AUC(ROC曲下面积)分别为0.990、0.987和0.987。具体的,每个类别的敏感性、特异性分别为:癌症组、良性组和正常组的敏感性分别为0.932、0.901、0.931;癌症组、良性组和正常组的特异性分别为0.951、0.971、0.960。这些结果表明,基于拉曼光谱构建的机器学习分类模型对乳腺癌有很高的区分能力。由此可以看出提出的机器学习模型进行乳腺癌早期筛查的分类可以具体区分癌症、良性和正常这三组,同时分类器的显著优势是它对基于拉曼光谱样本数据的区分具有高准确率。
本发明的机器学习分类模型是通过血清的拉曼谱筛查乳腺癌,快速、有效、方便,且只需要2-3 mL的血液,其样本的获取简单,对人体无害,更无影像学辐射风险,同时拉曼光谱检测血清拉曼光谱检测血清操作简单不需要特殊专业技术人员,有利于在基础医疗机构开展,实施大规模人群的乳腺癌的早期初筛。并且本发明使用了正常、良性、恶性三组变量进行统计分析,可以更精确的对患者类别进行分类,该模型有助于更早的发现乳腺癌患者,减少过度医疗。本发明的模型对恶性肿瘤、良性样本、正常组的预测准确率可达98%,其灵敏度 和特异性也较高,可以与目前乳腺癌临床诊断技术相比拟,为乳腺癌的早筛提供辅助诊断信息,并且作为其他恶性肿瘤的参考方法。因此基于拉曼光谱的早期筛查的模型是一种低成本、易于实施的更为方便的筛查技术。
将上述基于拉曼光谱数据的乳腺癌分析设备涉及到的方法用于辅助乳腺癌的早期筛查和初步分类预测是可行性的,表明基于拉曼光谱检测技术构建进行乳腺癌分类预测的机器学习分类模型,可以更快的得到分类预测结果,并为评估提供更准确的特异性光谱特征信息,模型预测的性能可以更好地反映具体的分类预测效能,更为快速、有效、方便,而且对人体无害更无辐射,使得本申请在应用于与乳腺癌血清样本数据有关的无损预测的方面更有利。
本发明实施例提供的基于拉曼光谱数据的乳腺癌分析系统,其包括:
获取模块,用于获取基于拉曼光谱检测的血清的拉曼光谱样本数据;
特征选择模块,用于对拉曼光谱样本数据进行特征选择,得到光谱特征峰,其中,光谱特征峰基于拉曼光谱样本数据中正常乳腺组、良性乳腺组与乳腺癌组筛选得到的光谱特征差异信息;
分类模块,基于光谱特征峰进行分类,得到乳腺癌分类结果。
图6是本发明实施例提供的一种基于拉曼光谱数据的乳腺癌分析设备,包括:存储器和处理器;该设备还可以包括:输入装置和输出装置。
存储器、处理器、输入装置和输出装置可以通过总线或者其他方式连接,图6所示的以总线连接方式为例;其中,存储器用于存储程序指令;处理器用于调用程序指令,当程序指令被执行时,用于执行或实现上述的基于拉曼光谱数据的乳腺癌分析方法。
本发明提供的一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时,实现上述基于拉曼光谱数据的乳腺癌分析方法。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
本发明将拉曼光谱和机器学习相结合建立乳腺癌的早期筛查模型,并不是代替金标准,而是作为一种初筛手段,以病理诊断为金标准,本发明有利于实现更多更大规模人群的癌症筛查、有利于在基层大规模开展、有利于乳腺癌患者的早期筛查。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的;又例如,模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式;再例如,多个模块或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口、装置或模块的间接耦合或通信连接,可以是电性、机械或其它形式。
作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理模块,即可以位于一个地方,或者也可以分布到多个网络模块上。具体的,可以根据实际需要选择其中的部分或者全部模块来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能模块可以集成在一个处理模块中,也可以是各个模块单独物理存在,也可以两个或两个以上模块集成在一个模块中。上述集成模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:只读存储器(ROM,Read Only Memory)、随机存取存储器(RAM,RandomAccess Memory)、磁盘或光盘等。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分步骤是可以通过程序来完成相关硬件的指令,程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器、磁盘或光盘等。
以上对本发明所提供的一种计算机设备进行了详细介绍,对于本领域的一般技术人员,依据本发明实施例的思想,在具体实施方式及应用范围上均会有改变之处。综上,本说明书内容不应理解为对本发明的限制。
Claims (10)
1.基于拉曼光谱数据的乳腺癌分析设备,其特征在于,所述设备包括:存储器和处理器;所述存储器用于存储程序指令;所述处理器用于调用程序指令,当程序指令被执行时,用于执行实现基于拉曼光谱数据的乳腺癌分析方法,具体步骤包括:
获取基于拉曼光谱检测的血清的拉曼光谱样本数据;
对所述拉曼光谱样本数据进行特征选择,得到光谱特征峰,所述光谱特征峰基于拉曼光谱样本数据中正常乳腺组、良性乳腺组与乳腺癌组筛选得到的光谱特征差异信息;
基于所述光谱特征峰进行分类,得到乳腺癌分类结果。
2.根据权利要求1所述的基于拉曼光谱数据的乳腺癌分析设备,其特征在于,所述光谱特征峰包括下列位置中的任意一种或几种:784 cm-1、835 cm-1、925cm-1、986cm-1、989cm-1、1002cm-1、1020cm-1、1056cm-1、1114cm-1、1127cm-1、1139cm-1、1285cm-1、1295cm-1、1346cm-1、1367cm-1、1437cm-1、1531cm-1、1650cm-1。
3.根据权利要求1所述的基于拉曼光谱数据的乳腺癌分析设备,其特征在于,所述拉曼光谱样本数据是按照拉曼光谱仪操作步骤对每组每个血清样本进行有限次采集,然后对采集得到的样本数据进行均值化处理得到。
4.根据权利要求1所述的基于拉曼光谱数据的乳腺癌分析设备,其特征在于,所述获取基于拉曼光谱检测的血清的拉曼光谱样本数据,还包括对获取的拉曼光谱样本数据进行预处理,其中,所述预处理包括通过光谱曲线平滑与归一化、基线矫正以及光谱特征选择的方法,完成所述拉曼光谱样本数据的预处理,得到预处理后的拉曼光谱样本数据;可选的,所述预处理步骤包括:
(1)光谱曲线平滑与归一化:使用拉曼光谱样本数据中的邻接点的平均值进行平滑拉曼光谱样本数据,将每个拉曼光谱样本数据归一化为0~1;
(2)基线修正:基于经光谱曲线平滑与归一化后的拉曼光谱样本数据的各光谱特征峰对拉曼光谱样本数据进行标准化处理,重建得到基于峰值信息和相对强度构建的基线;
(3)光谱特征选择:基于构建的基线对拉曼光谱样本数据进行主成分分析,选取保留关键性显著信息的成分作为显著性差异特征选择结果。
5.根据权利要求4所述的基于拉曼光谱数据的乳腺癌分析设备,其特征在于,所述标准化处理是基于拉曼光谱样本数据的各光谱特征峰,根据拉曼光谱样本数据噪声的标准偏差的分布通过多项式拟合法去除荧光背景,再通过滑动窗口的方法对光谱点进行分类和纠正,重建得到基于峰值信息和相对强度构建的拉曼光谱样本数据的基线。
6.根据权利要求1所述的基于拉曼光谱数据的乳腺癌分析设备,其特征在于,所述分类通过机器学习分类模型对所述光谱特征峰所对应的具有显著性差异的乳腺癌拉曼光谱特征信息进行分类,得到乳腺癌分类结果,其中,所述机器学习分类模型通过下列方法中的任意一种或几种实现:逻辑回归、支持向量机、k最近邻、决策树、朴素贝叶斯、随机森林、主成分分析、梯度提升;可选的,所述机器学习分类模型通过多元统计方法将所述具有显著性差异的乳腺癌拉曼光谱特征信息变换到高维空间,得到乳腺癌拉曼光谱高维度信息,再对乳腺癌拉曼光谱高维度信息进行分析,得到乳腺癌分类结果。
7.根据权利要求6所述的基于拉曼光谱数据的乳腺癌分析设备,其特征在于,所述机器学习分类模型的构建过程包括,通过随机欠采样、SMOTE过采样对训练数据集进行数据处理,得到分类均衡的训练数据集。
8.基于拉曼光谱数据的乳腺癌分析系统,其特征在于,所述系统包括:
获取模块,用于获取基于拉曼光谱检测的血清的拉曼光谱样本数据;
特征选择模块,用于对所述拉曼光谱样本数据进行特征选择,得到光谱特征峰,所述光谱特征峰基于拉曼光谱样本数据中正常乳腺组、良性乳腺组与乳腺癌组筛选得到的光谱特征差异信息;
分类模块,基于所述光谱特征峰进行分类,得到乳腺癌分类结果。
9.根据权利要求8所述的基于拉曼光谱数据的乳腺癌分析系统,其特征在于,所述获取模块,还包括对获取的拉曼光谱样本数据进行标准化处理,所述标准化处理是基于拉曼光谱样本数据的各光谱特征峰,根据拉曼光谱样本数据噪声的标准偏差的分布通过多项式拟合法去除荧光背景,再通过滑动窗口的方法对光谱点进行分类和纠正,重建得到基于峰值信息和相对强度构建的拉曼光谱样本数据的基线;可选的,所述光谱特征峰包括下列位置中的任意一种或几种:784 cm-1、835 cm-1、925cm-1、986cm-1、989cm-1、1002cm-1、1020cm-1、1056cm-1、1114cm-1、1127cm-1、1139cm-1、1285cm-1、1295cm-1、1346cm-1、1367cm-1、1437cm-1、1531cm-1、1650cm-1。
10.一种计算机可读存储介质,其特征在于,其上存储有基于拉曼光谱数据进行乳腺癌分类分析的计算机程序,当所述计算机程序被处理器执行时,实现权利要求1-7任意一项所述的基于拉曼光谱数据的乳腺癌分析设备中所涉及的基于拉曼光谱数据的乳腺癌分析方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310120122.3A CN116030032A (zh) | 2023-02-16 | 2023-02-16 | 基于拉曼光谱数据的乳腺癌分析设备、系统及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310120122.3A CN116030032A (zh) | 2023-02-16 | 2023-02-16 | 基于拉曼光谱数据的乳腺癌分析设备、系统及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116030032A true CN116030032A (zh) | 2023-04-28 |
Family
ID=86073919
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310120122.3A Pending CN116030032A (zh) | 2023-02-16 | 2023-02-16 | 基于拉曼光谱数据的乳腺癌分析设备、系统及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116030032A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117789972A (zh) * | 2024-02-23 | 2024-03-29 | 北京大学人民医院 | 一种乳腺癌复发预测模型的构建方法及其预测系统 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103217411A (zh) * | 2013-04-15 | 2013-07-24 | 浙江大学 | 基于拉曼光谱的食用植物油中油酸、亚油酸和饱和脂肪酸含量检测方法 |
CN105389480A (zh) * | 2015-12-14 | 2016-03-09 | 深圳大学 | 多类不平衡基因组学数据迭代集成特征选择方法及系统 |
CN108918499A (zh) * | 2018-06-28 | 2018-11-30 | 华南师范大学 | 拉曼图谱中去除拉曼基线漂移的方法 |
CN114184599A (zh) * | 2021-12-30 | 2022-03-15 | 广州医科大学 | 单细胞拉曼光谱采集数目估计方法、数据处理方法及装置 |
CN114878543A (zh) * | 2022-05-27 | 2022-08-09 | 中国人民解放军32181部队 | 一种痕量物质的拉曼光谱探测识别方法及系统 |
CN114923893A (zh) * | 2022-06-02 | 2022-08-19 | 西北大学 | 一种无损免标记快速乳腺癌拉曼光谱病理分级分期方法 |
CN115015211A (zh) * | 2021-03-05 | 2022-09-06 | 希森美康株式会社 | 受试物质的分析方法、分析装置、训练方法、分析系统、及分析程序 |
CN115372334A (zh) * | 2022-08-29 | 2022-11-22 | 北京邮电大学 | 一种基于血清rna表面增强拉曼光谱的宫颈癌筛查方法 |
CN115524321A (zh) * | 2022-10-11 | 2022-12-27 | 新疆医科大学第三附属医院 | 一种AgNPs/PSB复合SERS基底及制备方法、乳腺癌的分类模型及建立方法 |
-
2023
- 2023-02-16 CN CN202310120122.3A patent/CN116030032A/zh active Pending
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103217411A (zh) * | 2013-04-15 | 2013-07-24 | 浙江大学 | 基于拉曼光谱的食用植物油中油酸、亚油酸和饱和脂肪酸含量检测方法 |
CN105389480A (zh) * | 2015-12-14 | 2016-03-09 | 深圳大学 | 多类不平衡基因组学数据迭代集成特征选择方法及系统 |
CN108918499A (zh) * | 2018-06-28 | 2018-11-30 | 华南师范大学 | 拉曼图谱中去除拉曼基线漂移的方法 |
CN115015211A (zh) * | 2021-03-05 | 2022-09-06 | 希森美康株式会社 | 受试物质的分析方法、分析装置、训练方法、分析系统、及分析程序 |
CN114184599A (zh) * | 2021-12-30 | 2022-03-15 | 广州医科大学 | 单细胞拉曼光谱采集数目估计方法、数据处理方法及装置 |
CN114878543A (zh) * | 2022-05-27 | 2022-08-09 | 中国人民解放军32181部队 | 一种痕量物质的拉曼光谱探测识别方法及系统 |
CN114923893A (zh) * | 2022-06-02 | 2022-08-19 | 西北大学 | 一种无损免标记快速乳腺癌拉曼光谱病理分级分期方法 |
CN115372334A (zh) * | 2022-08-29 | 2022-11-22 | 北京邮电大学 | 一种基于血清rna表面增强拉曼光谱的宫颈癌筛查方法 |
CN115524321A (zh) * | 2022-10-11 | 2022-12-27 | 新疆医科大学第三附属医院 | 一种AgNPs/PSB复合SERS基底及制备方法、乳腺癌的分类模型及建立方法 |
Non-Patent Citations (2)
Title |
---|
GANG YIN等: "An efficient primary screening of COVID-19 by serum Raman spectroscopy", 《J RAMAN SPECTROSC》, vol. 52, no. 5, pages 949 - 958 * |
郑超: "基于拉曼光谱的乳腺癌微钙化的分子学特征及形成机制研究", 《中国博士学位论文全文数据库_医药卫生科技辑》, pages 072 - 205 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117789972A (zh) * | 2024-02-23 | 2024-03-29 | 北京大学人民医院 | 一种乳腺癌复发预测模型的构建方法及其预测系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Chandran et al. | Diagnosis of cervical cancer based on ensemble deep learning network using colposcopy images | |
CN109670510B (zh) | 一种基于深度学习的胃镜活检病理数据筛查系统 | |
Kanter et al. | Application of Raman spectroscopy for cervical dysplasia diagnosis | |
Elakkiya et al. | Imaging based cervical cancer diagnostics using small object detection-generative adversarial networks | |
CN110991536B (zh) | 原发性肝癌的早期预警模型的训练方法 | |
Liu et al. | Detection of heterogeneity on multi-spectral transmission image based on multiple types of pseudo-color maps | |
Qi et al. | High-precision intelligent cancer diagnosis method: 2D Raman figures combined with deep learning | |
CN116030032A (zh) | 基于拉曼光谱数据的乳腺癌分析设备、系统及存储介质 | |
CN112651927A (zh) | 一种基于卷积神经网络与支持向量机的拉曼光谱智能识别方法 | |
Nagadeepa et al. | Artificial Intelligence based Cervical Cancer Risk Prediction Using M1 Algorithms | |
Chen | Models of artificial intelligence-assisted diagnosis of lung cancer pathology based on deep learning algorithms | |
Tong et al. | Locating abnormal heartbeats in ECG segments based on deep weakly supervised learning | |
Samanta et al. | Optimized tree strategy with principal component analysis using feature selection-based classification for newborn infant’s Jaundice symptoms | |
Ukwuoma et al. | Detection of Oral Cavity Squamous Cell Carcinoma from Normal Epithelium of the Oral Cavity using Microscopic Images | |
CN113702349A (zh) | 一种基于拉曼光谱的涎腺肿瘤的诊断模型构建方法 | |
CN115953781B (zh) | 基于热层析影像的乳腺人工智能分析系统及方法 | |
Zhang et al. | An intelligent decision-making support system for the detection and staging of prostate cancer in developing countries | |
Wang et al. | Deep margin cosine autoencoder based medical hyperspectral image classification for tumor diagnosis | |
Shetty et al. | Duck pack optimization with deep transfer learning-enabled Oral squamous cell carcinoma classification on histopathological images | |
Chandrasekar et al. | Performance and evaluation of data mining techniques in cancer diagnosis | |
CN113393938B (zh) | 一种融合影像和临床特征信息的乳腺癌风险预测系统 | |
Rossi et al. | COVID-19 detection using a model of photoplethysmography (PPG) signals | |
Kusuma et al. | A Hybrid Model for Skin Disease Classification using Transfer Learning | |
CN114445374A (zh) | 一种基于扩散峰度成像mk图的图像特征处理方法及系统 | |
Zhao et al. | Auxiliary diagnosis of papillary thyroid carcinoma based on spectral phenotype |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |