CN111812078A - 基于表面增强拉曼光谱的人工智能辅助前列腺肿瘤早期诊断方法 - Google Patents

基于表面增强拉曼光谱的人工智能辅助前列腺肿瘤早期诊断方法 Download PDF

Info

Publication number
CN111812078A
CN111812078A CN202010875002.0A CN202010875002A CN111812078A CN 111812078 A CN111812078 A CN 111812078A CN 202010875002 A CN202010875002 A CN 202010875002A CN 111812078 A CN111812078 A CN 111812078A
Authority
CN
China
Prior art keywords
data
layer
cnn
raman
training
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010875002.0A
Other languages
English (en)
Inventor
潘家骅
薛蔚
王�琦
朱寅杰
忻志祥
钱宏阳
马泽华
王岩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Renji Hospital Shanghai Jiaotong University School of Medicine
Original Assignee
Renji Hospital Shanghai Jiaotong University School of Medicine
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Renji Hospital Shanghai Jiaotong University School of Medicine filed Critical Renji Hospital Shanghai Jiaotong University School of Medicine
Priority to CN202010875002.0A priority Critical patent/CN111812078A/zh
Publication of CN111812078A publication Critical patent/CN111812078A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/62Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light
    • G01N21/63Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light optically excited
    • G01N21/65Raman scattering
    • G01N21/658Raman scattering enhancement Raman, e.g. surface plasmons
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2413Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
    • G06F18/24133Distances to prototypes
    • G06F18/24137Distances to cluster centroïds
    • G06F18/2414Smoothing the distance, e.g. radial basis function networks [RBFN]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • G06T7/0012Biomedical image inspection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30004Biomedical image processing
    • G06T2207/30081Prostate
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30004Biomedical image processing
    • G06T2207/30096Tumor; Lesion

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Software Systems (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Medical Informatics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Radiology & Medical Imaging (AREA)
  • Quality & Reliability (AREA)
  • Chemical & Material Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Biochemistry (AREA)
  • Immunology (AREA)
  • Pathology (AREA)
  • Investigating, Analyzing Materials By Fluorescence Or Luminescence (AREA)

Abstract

一种基于表面增强拉曼光谱的人工智能辅助前列腺肿瘤早期诊断方法,包括一个收集血清样本的步骤;一个采用拉曼光谱仪进行检测的步骤;一个对采集的拉曼光谱信号进行图形分析和数据处理的步骤;选取生物组织拉曼光谱集中范围400‑1800 cm‑1进行分析,利用OriginPro 8软件对光谱仪采集得到的原始光谱进行预处理,包括减背景和光谱面积均一化,并绘制血清平均拉曼光谱,然后比较相关拉曼特征峰的变化和差异,最后得出前列腺肿瘤早期诊断的诊断结果。本发明的敏感性更高、特异性更强,减少了现有筛查诊断方法所造成的不必要的穿刺活检与漏诊。

Description

基于表面增强拉曼光谱的人工智能辅助前列腺肿瘤早期诊断 方法
技术领域
本发明涉及医学领域,尤其涉及检测技术,具体来说是一种基于表面增强拉曼光谱的人工智能辅助前列腺肿瘤早期诊断方法。
背景技术
前列腺癌是欧美国家男性中最常见的恶性肿瘤,也是男性肿瘤相关死因中的第二大死亡原因。随着我国人口老龄化的发展及生活方式的改变,前列腺癌的发病率在我国逐年上升,位列我国男性新发恶性肿瘤第六位。与欧美国家不同,我国由于前列腺癌筛查工作尚未普及,大部分前列腺癌患者确诊时已属中晚期,总体预后远差于欧美国家。目前临床上最常用的筛查工具是基于前列腺特异抗原(PSA)的检查,由于PSA是一个组织特异性而非肿瘤特异性的标志物,导致PSA检测对前列腺癌的特异性与敏感性都较低。基于PSA的前列腺癌筛查会导致对恶性疾病的诊断不足和对良性疾病的过度治疗,这极大降低了患者的生活质量并增加了经济负担。因此,临床上需要一种更加便捷、精准的诊断系统来对前列腺肿瘤患者进行早期诊断和病理分级,从而显著改善前列腺肿瘤患者的预后。
拉曼光谱(Raman Spectrum,RS)作为一种无创、非侵入性和特异性高的物质分子检测手段,可以在分子尺度上可以得到分子振动、旋转、晶体结构和相变等详细信息,从而敏感地检测出肿瘤细胞和组织内与肿瘤代谢相关的蛋白质、核酸、脂类和糖类等生物分子组成的变化。随着近年来纳米技术和等离子体研究的高速发展,表面增强拉曼光谱(Surface-Enhanced Raman spectroscopy,SERS)开始在生物医药研究中崭露头角,它很好地解决了普通拉曼信号微弱而难以检测的局限,通过纳米粒子与生物分子的相互作用极大地增强了拉曼光谱信号。
SERS技术具有信噪比高、信号强的优势,而探针材料本身无明显的拉曼信号,不会对样本信号造成干扰,SERS技术检测血清、唾液、前列腺液等生物样本,通过分析拉曼光谱的组成、位移、强度等变化,已经在包括前列腺癌在内的多种肿瘤生物液体样本中有了极为丰富的应用,显示了广阔的临床应用前景。申请人的先期研究发现,基于病理明确的前列腺癌(PCa)与前列腺良性增生患者(BPH)的前列腺液(EPS)和血清的SERS差异分析,得到在1662cm-1与1560cm-1峰出存在显著差异,所建立的PCA-LDA诊断模型,对前列腺癌诊断的敏感性分别为75%和60%,特异性分别为75%和76.5%,准确率分别为75%和68%,提示EPS和血清SERS分析可能成为前列腺癌检测的潜在工具。
申请人的另一项研究也发现,利用SERS对PSA水平为4-10ng/mL的PCa和BPH患者的血清进行分析,可以以98.3%的精确度区分出BPH患者,从而减少了PSA处于“灰区”的患者进行不必要的活检,极大程度提高“灰区”前列腺癌患者的诊断效能。
目前,前列腺癌早期诊断通常是通过测量单个指标来进行的,而在前列腺发展的过程中,复杂的肿瘤发生机制全面深刻地改变着肿瘤微环境和生物代谢组学,在多种生物分子层面上均有所影响,这显然说明测量单个标志物,不足以准确的早期诊断前列腺癌,而SERS技术很好地解决了这一问题。前列腺癌患者的相关代谢组学信息释放入血后可以通过SERS血清学检测得以收集,而血清作为临床上易得的生物样品,具有其它检查方法不可比拟的诸多优势。因此,利用SERS整体分析前列腺癌患者的血清分子组成改变,将会是早期诊断前列腺肿瘤的新方向。
SERS诊断技术至今仍未真正得到临床验证和应用推广,其中重要的原因就是生物液体样本的SERS光谱生物峰复杂,目前还没有比较权威的方法保证提取特征峰的有效性和通用性,也未能形成真正可实际应用的拉曼光谱诊断模型,并通过临床标本和数据的验证。
深度学习是近年来快速发展的多层神经网络算法,具有非线性映射的深层网络结构,可以通过学习多层次的表示和抽象,从图像、声音、文本等数据中学习并掌握规律,并对新的样本作出识别和预测。广泛应用于计算机视觉研究领域的卷积神经网络(Convolutional Neural Network,CNN)是一种常用的深度学习算法,该模型能够将原始数据信息通过多个卷积层和池化层的处理,抽象出人脑易于理解的高级特征,比传统的神经网络模型效率和预测准确率更高。CNN通常在卷积层共享过滤器和池化层压缩数据,大大减少了参数个数,有效减少了传统多层神经网络的过拟合问题;通过逐层学习获得特征的非线性表达,自动学习数据的本质特征,避免了复杂的特征提取和数据重建过程,增强了模型的拟合能力。在拉曼光谱中,散射光强度随着拉曼偏移而发生变化,形成一系列形状相似但大小不一的谱峰,可以看成为一维图像或者时间序列,其数据形式符合深度学习的算法的规则,近年来也有研究表明,振动光谱可以构建CNN,而且分类性能良好。申请人此前利用深度学习以及卷积神经网络方法结合表面增强拉曼光谱用于血清检测,诊断前列腺癌骨转移,并取得满意效果,在人工智能分析系统构建方面积累了经验。
目前相似产品现状:
PSA是一种单链糖蛋白,在前列腺上皮细胞中产生并分泌,在前列腺组织中以高浓度的形式起到液化精液的作用,具有很高的组织特异性。PSA是第一个被美国食品药品管理局(FDA)批准的用于早期诊断肿瘤的标志物,目前已广泛用于前列腺癌的筛查、早期诊断及肿瘤监测。在欧洲前列腺癌筛查随机研究(ERSPC)中,发现PSA筛查可以降低大约20%的55-69岁男性前列腺癌特异性死亡率,但研究同时发现筛查后的活组织检查其阳性率较低,PSA的截断值为3ng/mL时,大约75%接受活检的男性没有发现癌症,而穿刺阳性患者大部分属于无临床意义的前列腺癌。显然,这种筛查方式会导致大量患者面临不必要的重复穿刺,增加了患者对于癌症的恐惧和活检带来的负面影响。另一方面,PSA 4ng/mL是多年来人们公认的正常和异常的临界值,而在欧美国家大量的临床病例中发现,大约1/5的前列腺癌患者PSA<4ng/mL,基于PSA的筛查又将会漏诊相当一部分前列腺癌患者。因此,目前的多种研究结果都说明单纯的应用PSA作为前列腺肿瘤的早期诊断指标显然不能够满足临床上的需要。
由于在前列腺癌、良性前列腺增生、前列腺炎、前列腺活检、尿路感染时,PSA均会出现升高,PSA常常结合PSAD(PSA密度)、PSAV(PSA变化速率)、fPSA/tPSA(游离PSA与总PSA的比值)一起为前列腺癌的早期诊断提供参考,这种策略提高了PSA筛查对于前列腺癌诊断的敏感性与特异性。正常前列腺组织每增加1g,可增加PSA 0.13ng/mL,而肿瘤组织每增加1g,可增加PSA 315ng/mL,而前列腺癌患者的PSA变化速率也显著快于良性前列腺疾病患者,因此计算PSAD和PSAV有助于鉴别前列腺癌和良性前列腺增生性疾病。
中国泌尿外科疾病诊断治疗指南2014版指出,当PSAD>0.15或PSAV>0.75ng/(mL·年)时,应怀疑前列腺癌的可能。此外,当PSA处于“灰区”(4~10ng/mL)时,fPSA/tPSA对于前列腺癌的早期诊断、指导前列腺穿刺活检也具有重要意义,可大大提高前列腺癌诊断的特异性。研究表明如患者PSA处于“灰区”时,fPSA/tPSA%<0.1,则该患者发生前列腺癌的可能性高达56%;相反,fPSA/tPSA>0.25,发生前列腺癌的可能性只有8%;fPSA/tPSA>0.16时前列腺穿刺阳性率为1.6%;如果fPSA/tPSA<0.16时前列腺穿刺阳性率为17.4%。因此国内推荐fPSA/tPSA>0.16为正常参考值(或临界值)。fPSA/tPSA被认为是PSA“灰区”预测前列腺癌的一个很好的指标,但其在PSA>10ng/mL的PSA范围中,诊断前列腺的效能明显下降。
前列腺健康指数(PHI)是贝克曼库尔特公司设计的一个新的指标,纳入了p2PSA的因素,p2PSA是fPSA中最稳定的亚型,在外周前列腺组织中显著升高,且对前列腺癌患者,血清p2PSA也会出现特异性升高。PHI的计算公式如下:
PHI=(p2PSA/fPSA)×tPSA0.5
PHI已被FDA批准用于前列腺癌的早期诊断及危险程度的分级,一项多中心的前瞻性筛查试验共入选了892名患者,结果发现当tPSA介于2~10ng/mL时,tPSA诊断前列腺癌的AUC为0.53,fPSA的AUC为0.65,而PHI的AUC为0.70;且PHI升高的患者患前列腺癌的风险是PHI正常患者的4.7倍。
4Kscore是由美国冷泉港实验室研发出的一项新的以PSA为基础的检测指标,它涉及到4种激肽释放酶蛋白:fPSA、iPSA(intact PSA,是fPSA的亚型之一)、tPSA和人激肽释放酶2(hK2),该指标还将患者的年龄、直肠指诊结果等信息考虑在内。Vedder等人发现PSA介于3~10ng/mL时,4Kscore诊断前列腺癌的敏感性高于尿PCA3评分,二者的AUC分别为0.78和0.62[10];另一项研究也提示4Kscore与PHI在预测前列腺癌有相似的AUC,分别为0.69和0.70。此外,4Kscore对于预测穿刺时Gleason评分≥7的前列腺癌,也有较高的特异性。现有技术的缺点:
可以看出,虽然基于PSA的前列腺癌早期诊断的应用在一定程度上降低了前列腺癌相关死亡率,但由于其特异性低,也造成了大量的过度诊断、过度治疗。虽然一些PSA相关诊断模型(PHI、4Kscore)已被证实可提高前列腺癌早期诊断的敏感性与特异性,但仍达不到精准诊断和个性化治疗的临床要求。因此,一种特异度、敏感度、准确度都更高的前列腺癌早期诊断工具在当下前列腺肿瘤筛查策略中就显得极为重要。
发明内容
本发明的目的在于提供一种基于表面增强拉曼光谱的人工智能辅助前列腺肿瘤早期诊断方法,所述的这种基于表面增强拉曼光谱的人工智能辅助前列腺肿瘤早期诊断方法要解决现有技术中前列腺肿瘤早期诊断效果不理想的问题,同时要解决由于采用的基于PSA的前列腺肿瘤早期诊断存在较低的特异性与敏感性,造成对恶性疾病的诊断不足和对良性疾病的过度筛查的技术问题。
本发明的一种基于表面增强拉曼光谱的人工智能辅助前列腺肿瘤早期诊断方法,包括如下步骤:
1)一个收集血清样本的步骤;收集前列腺穿刺或手术患者的血清样本,空腹采集静脉血液5ml,4℃静置3小时后3000rpm离心20分钟,取上清液,血清标本于-80℃低温冰箱保存;
2)一个采用拉曼光谱仪进行检测的步骤;将患者经过预处理的血清标本解冻后,移取20ul血清与40ul的银纳米颗粒溶胶混合,室温中放置10分钟,移取10ul混合液于硅片上,置于与拉曼谱仪连接的倒置显微镜的自动平台上,采集检测标本的拉曼光谱信号;同时采用WiRE 3.2软件收集拉曼光谱数据;
3)一个对采集的拉曼光谱信号进行图形分析和数据处理的步骤;选取生物组织拉曼光谱集中范围400-1800cm-1进行分析,利用OriginPro 8软件对光谱仪采集得到的原始光谱进行预处理,包括减背景和光谱面积均一化,并绘制血清平均拉曼光谱,然后比较相关拉曼特征峰的变化和差异,最后得出前列腺肿瘤早期诊断的诊断结果。
进一步的,所述的对采集的拉曼光谱信号进行图形分析和数据处理的步骤包括如下过程:
1)基于SERS数据构建并训练CNN网络,构建分类器;
(1)利用Python脚本调用Keras框架API完成CNN构建、训练和测试,该框架采用TensorFlow作为底层驱动,CNN结构包含6个层:卷积层1-池化层1-卷积层2-池化层2-全连接层1-全连接层2;
a)输入层输入数据为预处理好的一维SERS光谱数据;
b)第一层卷积层包括60个卷积核,每个卷积核大小为1×12,边界填充,激活函数设置为“relu”,对输入数据进行卷积运算,提取数据特征;
c)第二层池化层,采用最大池化规则,滑动窗口大小1×2,移动步长1×2,边界填充;
d)第三层卷积层,包含120个卷积核,大小为1×12,边界填充,激活函数设置为“relu”;
e)第四层池化层,依然采用最大池化规则,滑动窗口大小1×2,移动步长1×2,边界填充;
f)第五层全连接层,包含1024个神经元节点,激活函数为“relu”;
g)第六层依然为全连接层,也是输出层,包含2个神经元节点,用于判断分类,激活函数为“softmax”;
h)采用梯度下降法优化损失函数,学习速率设置为1×10-4,分批训练,每批次100个数据;
(2)训练CNN网络模型,构建分类器,测试集数据测试分类器;
对数据进行预处理后,通过寻求损失函数最小化调整CNN网络参数,利用反向传播算法使全部滤波器中的权值;
a)对拉曼光谱数据进行预处理;使用pandas从excel中加载已预处理的数据集,存储为data和对应label的形式;按随机挑选的原则划分数据集为训练集,测试集,比例为6:4;
b)随机化CNN模型中的权值,采用分批训练的方法,从训练集中随机抽取一批数据,每批100个数据,输送到CNN模型中;
c)数据进入CNN模型后,向前传送,得到CNN输出结果;
d)计算CNN模型损失函数,调整参数,重返训练;
e)CNN完成训练后,将测试集数据集输入到CNN分类器中测试;
f)采用随机网络搜索交叉验证框架,确定CNN模型的最佳参数配置;反复训练和测试CNN模型。
CNN模型训练和测试的目的在于,确定本次模型中的相关参数,包括卷积核数量,卷积核大小,卷积操作步长,基础学习率等,以得到最佳的预测效果。
本发明以目前基于PSA的前列腺肿瘤早期诊断方法效果不理想的临床问题为切入点,以建立可实际应用的血清SERS前列腺肿瘤早期诊断系统为目标。在申请人的先期研究中,已经初步说明血清SERS的光谱差异具有一定的区分前列腺癌与良性前列腺增生的价值,同时申请人此前也通过结合SERS与人工智能深度学习成功地构建出了高准确度的前列腺癌骨转移人工智能诊断模型。本发明的申请人基于本单位庞大的前列腺肿瘤患者人群和血清样本,利用SERS检测技术检测患者血清标本,标准化检测过程和参数,建立前列腺肿瘤血清SERS数据库;并基于血清SERS数据与病理结果构建和训练CNN网络,以建立前列腺肿瘤早期诊断模型的分类器;采用C#语言编写用户图形界面(GUI)和Python语言调用底层Tensorflow框架,实现诊断模型软件化;最后设计前瞻性临床试验,单盲验证基于血清SERS数据的前列腺肿瘤诊断软件的效能,推动拉曼光谱技术的临床转化应用。
本发明的敏感性更高、特异性更强,减少了现有筛查诊断方法所造成的不必要的穿刺活检与漏诊。在非穿刺活检的前提下,为患者提供更精准的前列腺肿瘤早期诊断及病理分级、更便捷实惠的随访策略。本发明利用人工智能开发诊断系统,形成可视化,易操作的前列腺肿瘤早期诊断软件,临床转化价值极高。随着样本量的不断扩大,基于卷积神经网络的人工智能诊断系统将继续训练,从而进一步提高诊断效能。
本发明和已有技术相比,其技术效果是积极和明显的。
(1)本研究首次利用拉曼光谱检测前列腺肿瘤病人血清,通过病理结果将患者分为良性组与恶性组,通过分析血清SERS数据反映出血液中分子组成改变,从而证明基于SERS的血清检验具有早期诊断前列腺肿瘤的价值。
(2)通过对病理结果恶性的患者进行进一步病理分层,利用人工智能学习不同病理分层前列腺癌患者的血清SERS光谱数据,得出血清SERS的不同波峰与前列腺癌恶性程度的相关关系,实现无创性预测前列腺癌患者的病理结果。
(3)本项目采用SERS检测患者血清,不仅样本在临床获取便捷,而且SERS检测快速、特异度高、样品预处理简单,具有着其他预测诊断方法难以比拟的优势。
(4)创新性的将深度学习中重要的卷积网络(CNN)应用于SERS光谱数据分析和建立分离器,具有以下优势:训练集和验证集数据分离,建立的分类器更贴近实际应用;同时,通过训练CNN得到的诊断模型,可以利用Python编程语言,形成可视化的诊断软件,实现临床应用。
(5)利用Python编程语言调用算法底层,形成可视化,易操作的前列腺肿瘤早期诊断软件,使研究课题具有很强的临床转化价值。
(6)形成诊断软件后,基于本医疗中心的合作医疗单位,开展前瞻性、单盲临床试验,验证诊断软件的效能,证据等级高。
(7)国际上尚未有构建SERS前列腺癌早期诊断人工智能系统的相关报道,本发明交叉了医学、光谱学、信息学和计算机科学等多学科跨领域的思想和技术,有助于推动拉曼光谱技术真正实现临床转化,具有重要的临床意义。
附图说明
图1显示了基于表面增强拉曼光谱的人工智能辅助前列腺肿瘤早期诊断方法的构建过程。
图2显示了本发明的数据计算过程。
具体实施方式
实施例1
如图1-2所示,前列腺肿瘤患者血清SERS光谱数据库的建立
(1)纳入标准:
1)在医院已行前列腺穿刺或前列腺手术的病理明确的患者;
2)通过对患者体力(ECOG 0-2)、血常规、肝肾功能、心功能以及肿瘤负荷的评估;
3)被充分告知本研究试验目的和可能的风险后,患者同意参加试验并签署“临床样本使用知情同意书”。
(2)排除标准:
1)既往有其他肿瘤病史的;
2)既往接受过异体造血干细胞移植或实体器官移植;
3)具有精神类药物滥用史且无法戒除者或有精神障碍史者;
4)无法配合或拒绝参加本临床实验;
(3)分组标准
病理结果为良性前列腺增生的,进入良性组;
病理结果为恶性的(包括但不限于腺癌、移行细胞癌、鳞状细胞癌、未分化癌),进入恶性组;
根据ISUP评分,将恶性组分层:
ISUP1(Gleason评分2-6)
ISUP2(Gleason评分3+4=7)
ISUP3(Gleason评分4+3=7)
ISUP4(Gleason评分8)
ISUP5(Gleason评分9-10)
(4)血清样本收集:
收集前列腺穿刺或手术患者的血清样本。空腹采集静脉血液5ml。4℃静置3小时后3000rpm离心20分钟,取上清液,血清标本于-80℃低温冰箱保存。
(5)拉曼光谱仪检测:
将患者经过预处理的血清标本解冻后,移取20ul血清与40ul的银纳米颗粒溶胶混合,室温中放置10分钟。移取10ul混合液于硅片上,置于与拉曼谱仪连接的倒置显微镜的自动平台上,准备检测标本的拉曼光谱信号。本研究采用633nm的He-Ne激光器,激光功率约为3.5mW,Renishaw显微拉曼光谱仪检测,信号采集用Leica DM2500显微镜头,每次采集时间为10s,每个样本在3个不同位置采集拉曼光谱信号。扫描范围:100-3200cm-1
(6)拉曼光谱图形分析和数据处理
Renishaw显微拉曼光谱仪检测拉曼信号,WiRE 3.2软件收集拉曼光谱数据,选取生物组织拉曼光谱集中范围400-1800cm-1进行分析。利用OriginPro 8软件对光谱仪采集得到的原始光谱进行预处理,包括减背景和光谱面积均一化,并绘制(1)病理结果为良性的血清平均拉曼光谱;(2)病理结果为恶性的血清平均拉曼光谱,然后比较(1)和(2)之间相关拉曼特征峰的变化和差异;(3)ISUP1-5分的各组的血清评价拉曼光谱。为分析各组间光谱数据差异所代表的物质差异,本研究参考相关拉曼谱库和既往文献报道,揭示差异拉曼光谱所代表的物质差异。利用SPSS 19软件对拉曼光谱数据进行统计学分析,采用主成分分析和直线辨别分析相结合的统计学方法(PCA-LDA),建立预测模型。最后利用受试者工作曲线(ROC curve)和留一交叉验证法(LOOCV)比较和验证诊断模型的效能。
实施例2
如图1-2所示,前列腺肿瘤的早期人工智能诊断系统的构建
1.2.1基于SERS数据构建并训练CNN网络,构建分类器
(1)利用Python脚本调用Keras框架API完成CNN构建、训练和测试。该框架采用TensorFlow作为底层驱动。本项目设计的CNN结构包含6个层:卷积层1-池化层1-卷积层2-池化层2-全连接层1-全连接层2(输出层)。
1)输入层输入数据为预处理好的一维SERS光谱数据。
2)第一层卷积层包括60个卷积核,每个卷积核大小为1×12,边界填充,激活函数设置为“relu”,对输入数据进行卷积运算,提取数据特征。
3)第二层池化层,采用最大池化规则,滑动窗口大小1×2,移动步长1×2,边界填充。
4)第三层卷积层,包含120个卷积核,大小为1×12,边界填充,激活函数设置为“relu”。
5)第四层池化层,依然采用最大池化规则,滑动窗口大小1×2,移动步长1×2,边界填充。
6)第五层全连接层,包含1024个神经元节点,激活函数为“relu”。
7)第六层依然为全连接层,也是输出层,包含2个神经元节点,用于判断分类,激活函数为“softmax”。
8)采用梯度下降法优化损失函数,学习速率设置为1×10-4,分批训练,每批次100个数据。
(2)训练CNN网络模型,构建分类器,测试集数据测试分类器。
对数据进行预处理后,通过寻求损失函数最小化调整CNN网络参数,利用反向传播算法使全部滤波器中的权值。
1)对拉曼光谱数据进行预处理;使用pandas从excel中加载已预处理的数据集,存储为data和对应label的形式。按随机挑选的原则划分数据集为训练集,测试集,比例为6:4。
2)随机化CNN模型中的权值,采用分批训练的方法,从训练集中随机抽取一批数据,每批100个数据,输送到CNN模型中。
3)数据进入CNN模型后,向前传送,得到CNN输出结果。
4)计算CNN模型损失函数,调整参数,重返训练。
5)CNN完成训练后,将测试集数据集输入到CNN分类器中测试。
6)采用随机网络搜索交叉验证框架,确定CNN模型的最佳参数配置。反复训练和测试CNN模型。CNN模型训练和测试的目的在于,确定本次模型中的相关参数,包括卷积核数量,卷积核大小,卷积操作步长,基础学习率等,以得到最佳的预测效果。
(3)开发基于SERS光谱CNN分类器的前列腺肿瘤SERS诊断软件。
1)软件功能设计。分为功能需求和非功能需求。功能需求包括a、数据输入功能;b、原始光谱数据的预处理功能,包括去噪、基线校正和标准化;c、光谱可视化,显示各个样本的拉曼光谱图形;d、前列腺肿瘤诊断功能,软件输入为一维光谱数据,输出结果为前列腺肿瘤良恶性的判断结果,并显示结果可靠的概率;e、结果报告生成功能,输出诊断结果和对应光谱图形。非功能需求:a、性能需求,数据分析、识别诊断耗时要短;b、代码运行稳定,崩溃概率小;c、具有可拓展性,后续可继续开发和维护;d、操作界面友好简单。
2)软件开发。采用C#语言编写GUI界面,Python语言调用算法底层。C#语言是一种安全、稳定、简洁的面向对象的编程语言,是一种主流的软件开发语言,广泛应用于桌面应用程序开发。Python是一种代码简单但功能强大的脚本语言,兼容多种第三方API库和算法框架,主要用于各种算法研究和科学计算。开发功能项目包括:a、数据输入端口开发;b、光谱数据一键化预处理功能开发;c、光谱可视化绘图功能开发;d、CNN模型的构建开发;e、SERS数据分析结果生成功能开发。
3)软件运行和测试。对诊断软件进行初步测试,以确定:a、系统能否实现前列腺肿瘤良恶性的有效判别,与病理结果相对比。b、观察软件运行的稳定性和工作效率,进一步开发维护。
4)诊断模型的效能检验
实验人员单盲验证诊断软件的诊断效能。负责验证的实验人员不知晓病人具体临床资料,只负责诊断软件输出结果的整理和保存。其他实验人员负责对比评估诊断软件的敏感性,特异性和准确性。

Claims (2)

1.一种基于表面增强拉曼光谱的人工智能辅助前列腺肿瘤早期诊断方法,其特征在于:包括如下步骤:
1)一个收集血清样本的步骤;收集前列腺穿刺或手术患者的血清样本,空腹采集静脉血液5ml,4℃静置3小时后3000rpm离心20分钟,取上清液,血清标本于-80℃低温冰箱保存;
2)一个采用拉曼光谱仪进行检测的步骤;将患者经过预处理的血清标本解冻后,移取20ul血清与40ul的银纳米颗粒溶胶混合,室温中放置10分钟,移取10ul混合液于硅片上,置于与拉曼谱仪连接的倒置显微镜的自动平台上,采集检测标本的拉曼光谱信号;同时采用WiRE 3.2软件收集拉曼光谱数据;
3)一个对采集的拉曼光谱信号进行图形分析和数据处理的步骤;选取生物组织拉曼光谱集中范围400-1800cm-1进行分析,利用OriginPro 8软件对光谱仪采集得到的原始光谱进行预处理,包括减背景和光谱面积均一化,并绘制血清平均拉曼光谱,然后比较相关拉曼特征峰的变化和差异,最后得出前列腺肿瘤早期诊断的诊断结果。
2.如权利要求1所述的基于表面增强拉曼光谱的人工智能辅助前列腺肿瘤早期诊断方法,其特征在于:所述的对采集的拉曼光谱信号进行图形分析和数据处理的步骤,包括如下过程:
1)基于SERS数据构建并训练CNN网络,构建分类器;
(1)利用Python脚本调用Keras框架API完成CNN构建、训练和测试,该框架采用TensorFlow作为底层驱动,CNN结构包含6个层:卷积层1-池化层1-卷积层2-池化层2-全连接层1-全连接层2;
a)输入层输入数据为预处理好的一维SERS光谱数据;
b)第一层卷积层包括60个卷积核,每个卷积核大小为1×12,边界填充,激活函数设置为“relu”,对输入数据进行卷积运算,提取数据特征;
c)第二层池化层,采用最大池化规则,滑动窗口大小1×2,移动步长1×2,边界填充;
d)第三层卷积层,包含120个卷积核,大小为1×12,边界填充,激活函数设置为“relu”;
e)第四层池化层,依然采用最大池化规则,滑动窗口大小1×2,移动步长1×2,边界填充;
f)第五层全连接层,包含1024个神经元节点,激活函数为“relu”;
g)第六层依然为全连接层,也是输出层,包含2个神经元节点,用于判断分类,激活函数为“softmax”;
h)采用梯度下降法优化损失函数,学习速率设置为1×10-4,分批训练,每批次100个数据;
(2)训练CNN网络模型,构建分类器,测试集数据测试分类器;
对数据进行预处理后,通过寻求损失函数最小化调整CNN网络参数,利用反向传播算法使全部滤波器中的权值;
a)对拉曼光谱数据进行预处理;使用pandas从excel中加载已预处理的数据集,存储为data和对应label的形式;按随机挑选的原则划分数据集为训练集,测试集,比例为6:4;
b)随机化CNN模型中的权值,采用分批训练的方法,从训练集中随机抽取一批数据,每批100个数据,输送到CNN模型中;
c)数据进入CNN模型后,向前传送,得到CNN输出结果;
d)计算CNN模型损失函数,调整参数,重返训练;
e)CNN完成训练后,将测试集数据集输入到CNN分类器中测试;
f)采用随机网络搜索交叉验证框架,确定CNN模型的最佳参数配置;反复训练和测试CNN模型。
CN202010875002.0A 2020-08-27 2020-08-27 基于表面增强拉曼光谱的人工智能辅助前列腺肿瘤早期诊断方法 Pending CN111812078A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010875002.0A CN111812078A (zh) 2020-08-27 2020-08-27 基于表面增强拉曼光谱的人工智能辅助前列腺肿瘤早期诊断方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010875002.0A CN111812078A (zh) 2020-08-27 2020-08-27 基于表面增强拉曼光谱的人工智能辅助前列腺肿瘤早期诊断方法

Publications (1)

Publication Number Publication Date
CN111812078A true CN111812078A (zh) 2020-10-23

Family

ID=72859626

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010875002.0A Pending CN111812078A (zh) 2020-08-27 2020-08-27 基于表面增强拉曼光谱的人工智能辅助前列腺肿瘤早期诊断方法

Country Status (1)

Country Link
CN (1) CN111812078A (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113035292A (zh) * 2021-04-21 2021-06-25 复旦大学 一种脑胶质瘤浸润区域pH值测定方法及系统
CN113509561A (zh) * 2021-05-19 2021-10-19 杭州憶盛医疗科技有限公司 一种干细胞移植后体内功能建立与调控方法
CN113706539A (zh) * 2021-10-29 2021-11-26 南京裕隆生物医学发展有限公司 一种用于识别肿瘤的人工智能辅助系统
CN114216851A (zh) * 2020-11-27 2022-03-22 四川大学华西医院 一种基于表面增强拉曼光谱技术的急性胰腺炎评估装置
CN114384057A (zh) * 2021-12-28 2022-04-22 四川大学 一种基于拉曼光谱的肿瘤早期诊断系统
CN114496242A (zh) * 2021-12-23 2022-05-13 上海市第十人民医院 一种心肌梗死预测方法、系统、设备及介质

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114216851A (zh) * 2020-11-27 2022-03-22 四川大学华西医院 一种基于表面增强拉曼光谱技术的急性胰腺炎评估装置
CN113035292A (zh) * 2021-04-21 2021-06-25 复旦大学 一种脑胶质瘤浸润区域pH值测定方法及系统
CN113509561A (zh) * 2021-05-19 2021-10-19 杭州憶盛医疗科技有限公司 一种干细胞移植后体内功能建立与调控方法
CN113706539A (zh) * 2021-10-29 2021-11-26 南京裕隆生物医学发展有限公司 一种用于识别肿瘤的人工智能辅助系统
CN114496242A (zh) * 2021-12-23 2022-05-13 上海市第十人民医院 一种心肌梗死预测方法、系统、设备及介质
CN114384057A (zh) * 2021-12-28 2022-04-22 四川大学 一种基于拉曼光谱的肿瘤早期诊断系统
CN114384057B (zh) * 2021-12-28 2023-09-19 四川大学 一种基于拉曼光谱的肿瘤早期诊断系统

Similar Documents

Publication Publication Date Title
CN111812078A (zh) 基于表面增强拉曼光谱的人工智能辅助前列腺肿瘤早期诊断方法
Nargis et al. Comparison of surface enhanced Raman spectroscopy and Raman spectroscopy for the detection of breast cancer based on serum samples
Khanmohammadi et al. Infrared spectroscopy provides a green analytical chemistry tool for direct diagnosis of cancer
KR102291105B1 (ko) 엑소좀에 의한 인공지능 기반의 액체생검을 이용한 암 진단 정보 제공 방법 및 시스템
Shao et al. Deep convolutional neural networks combine Raman spectral signature of serum for prostate cancer bone metastases screening
Qi et al. Recent application of Raman spectroscopy in tumor diagnosis: from conventional methods to artificial intelligence fusion
CN106053429B (zh) 基于表面增强共振拉曼光谱的尿液修饰核苷检测分析方法
CN115078331B (zh) 一种光谱学和人工智能交互的血清分析方法及其应用
JP2021522503A (ja) マイクロフローサイトメトリーを使用して疾患を診断する方法
Dawuti et al. Urine surface-enhanced Raman spectroscopy combined with SVM algorithm for rapid diagnosis of liver cirrhosis and hepatocellular carcinoma
Cameron et al. Clinical spectroscopy: lost in translation?
CN107435062A (zh) 甄别肺部微小结节良恶性的外周血基因标志物及其用途
CN109253998A (zh) 基于拉曼增强的金属-包裹物-抗体复合纳米粒子定量检测肿瘤标记物的方法
Zhan et al. Revolutionary approaches for cancer diagnosis by terahertz-based spectroscopy and imaging
Kang et al. H-CNN combined with tissue Raman spectroscopy for cervical cancer detection
Du et al. Diagnoses in multiple types of cancer based on serum Raman spectroscopy combined with a convolutional neural network: Gastric cancer, colon cancer, rectal cancer, lung cancer
CN113702349A (zh) 一种基于拉曼光谱的涎腺肿瘤的诊断模型构建方法
Wen et al. Detection and classification of multi-type cells by using confocal Raman spectroscopy
CN113049552A (zh) 基于外泌体检测和单分子荧光漂白技术的muc1蛋白定量检测方法
CN107847145B (zh) 光子结构和化学计量学病理系统
Yu et al. Deep multi-feature fusion residual network for oral squamous cell carcinoma classification and its intelligent system using Raman spectroscopy
Wills et al. Diagnosis of Wilms' tumor using near-infrared Raman spectroscopy
CN110993092B (zh) Ngfp诊断指标的获取方法和高危hcc预测模型的构建方法
CN117789972B (zh) 一种乳腺癌复发预测模型的构建方法及其预测系统
US20240210324A1 (en) Interaction of spectroscopy and artificial intelligence for serological analysis and its applications

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20201023

WD01 Invention patent application deemed withdrawn after publication