CN115272211A - 基于胶原纤维多元融合分析的乳腺癌检查工具 - Google Patents

基于胶原纤维多元融合分析的乳腺癌检查工具 Download PDF

Info

Publication number
CN115272211A
CN115272211A CN202210852065.3A CN202210852065A CN115272211A CN 115272211 A CN115272211 A CN 115272211A CN 202210852065 A CN202210852065 A CN 202210852065A CN 115272211 A CN115272211 A CN 115272211A
Authority
CN
China
Prior art keywords
fiber
collagen
cancer
level
collagen fiber
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210852065.3A
Other languages
English (en)
Inventor
刘智毅
蒋慎益
钱书豪
孟佳
丁志华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University ZJU
Jiaxing Research Institute of Zhejiang University
Original Assignee
Zhejiang University ZJU
Jiaxing Research Institute of Zhejiang University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University ZJU, Jiaxing Research Institute of Zhejiang University filed Critical Zhejiang University ZJU
Priority to CN202210852065.3A priority Critical patent/CN115272211A/zh
Publication of CN115272211A publication Critical patent/CN115272211A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • G06T7/0012Biomedical image inspection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/764Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/774Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H70/00ICT specially adapted for the handling or processing of medical references
    • G16H70/60ICT specially adapted for the handling or processing of medical references relating to pathologies
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10056Microscopic image
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30004Biomedical image processing
    • G06T2207/30068Mammography; Breast
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30004Biomedical image processing
    • G06T2207/30096Tumor; Lesion

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Theoretical Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Public Health (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Biomedical Technology (AREA)
  • Computing Systems (AREA)
  • Multimedia (AREA)
  • Epidemiology (AREA)
  • Primary Health Care (AREA)
  • Artificial Intelligence (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Pathology (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Radiology & Medical Imaging (AREA)
  • Quality & Reliability (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

本发明公开了基于胶原纤维多元融合分析的乳腺癌检查工具,用于乳腺组织胶原纤维结构特征的量化分析与乳腺组织癌症水平的检查。本发明能多维度、全方位地提取胶原纤维的结构信息,通过多结构参量的多元融合分析,本发明提高了乳腺组织形态学特征分析的信息互补性;本发明利用像素级别分辨率的量化方法,结合伪彩色编码技术,实现了胶原纤维结构特征的可视化,增强了信息的直观性;本发明对三种代表不同乳腺癌水平的潜在生物标志物进行分类分析,提供了高精度、自动化、快速进行乳腺癌水平检查的方法,相比传统的乳腺癌检查方法具有更大的应用潜力。

Description

基于胶原纤维多元融合分析的乳腺癌检查工具
技术领域
本发明属于生物组织的图像分析与疾病检查技术领域,具体涉及一种基于胶原纤维多元融合分析的乳腺癌检查工具。
背景技术
乳腺癌是最常见的女性恶性肿瘤,对女性的健康和生存构成了重大的威胁。“早诊断,早治疗”是降低乳腺癌死亡率、提高患者生活质量的最有效的手段。目前乳腺癌的主要检查方法是组织病理学方法,需要经过取材、固定、石蜡包埋、切片、脱腊、染色等一系列过程,该方法主要存在以下几个缺点:第一,检查过程操作复杂且耗时长,需要消耗极大的人力和物力;第二,检查过程引入对组织有损伤的染色剂,会破坏组织结构影响检查结果的准确性;第三,检查结果依靠医生的阅历经验,结果的可靠性不可避免地受到主观因素的影响。
细胞外基质是由多种大分子所组成的复杂网络,具有独特的生物力学与化学机制,在许多生命过程中发挥着关键的作用。胶原蛋白是动物各种结缔组织的主要蛋白质,以细长的原纤维形式存在。坚韧的胶原纤维束是细胞外基质的主要组成部分,为大多数组织中的细胞提供支持。多项研究表明,胶原纤维的机械与生化状态的改变与肿瘤演化有关,此外,胶原纤维空间结构为检测病变组织、评估治疗反应、定位损伤或检测工程组织发育提供了潜在的生物标志物。
在对乳腺组织中胶原纤维的研究工作中,有学者定义了在乳腺中三种肿瘤相关的胶原信号(TACS1-3),可以帮助识别癌症水平。TACS1由围绕在肿瘤周围弯曲的胶原纤维所定义的,是定位小肿瘤的标志。TACS2由拉伸的胶原纤维定义,这是由于肿瘤生长导致胶原纤维的排列平行于肿瘤边界。TACS3由垂直于肿瘤边界不规则排列的胶原纤维定义,该状态的胶原纤维会促进肿瘤的迁移。TACS与胶原基质的重塑及肿瘤的发生和侵袭密切相关,是预测乳腺组织癌症水平的潜在生物标志物,对TACS的定量表征和分类对于了解乳腺组织的结构-功能关系和癌症水平具有重要意义。
目前对于胶原纤维空间结构的量化方法和相关的乳腺癌检查工具十分匮乏,并且存在一定的局限性。第一,这些工具只能对胶原纤维的单一结构特征进行量化,缺少对胶原纤维的多种结构特征进行融合分析的技术,单一结构特征的分析技术与相应的疾病检查工具对于疾病的检查能力优先,准确率较低;第二,这些工具所能提供的胶原纤维的形态学信息不够全面,从更多的角度去量化胶原纤维的结构特征能为乳腺组织的癌症水平分析提供有效的信息;第三,缺少分析方法将胶原纤维的结构特征变化与乳腺组织癌症水平进行精细化关联,进而精确地分析组织所处的癌症水平;第四,这些工具主要对整张组织图像进行分析,无法反映组织局部的癌症特征。综上所述,目前亟需一种对于胶原纤维进行多维度量化的分析工具,来对乳腺组织的细胞外基质图像进行像素级分辨率的多元融合分析,并结合三种肿瘤相关的胶原信号信息对癌症水平进行分析,从而实现乳腺癌微小病灶的早期检查。
发明内容
鉴于上述,本发明提出了一种基于胶原纤维多元融合分析的乳腺癌检查工具。该系统与方法可以对乳腺组织胶原纤维图像进行多元融合分析,得到纤维取向、纤维方向方差、纤维密度、细胞-纤维相对角度等多元结构参量,根据这些参量建立乳腺癌水平判别模型辅助乳腺癌的检查。该方法可以对多种光学显微技术所得到的胶原纤维图像进行处理与分析,具有快速、简洁、精确、适用性强等优点。
本发明采用以下技术方案实现:
本发明公开了一种基于胶原纤维多元融合分析的乳腺癌检查工具,融合分析乳腺组织多元结构特征,建立乳腺癌水平判别模型辅助乳腺癌的检查,所述检查工具包含以下使用方法:
1)通过双光子荧光和二次谐波成像技术对待检查乳腺组织内细胞外基质中的胶原纤维进行成像,获取微米级分辨率光学图像;
2)提取乳腺组织胶原纤维光学图像的多元结构特征,得到包括纤维取向、纤维方向方差、细胞-纤维相对角度、纤维密度的量化结果;
3)对乳腺组织进行苏木精-伊红染色用于癌症病理学检查,根据检查结果标记步骤1)中所得的双光子荧光/二次谐波图像所处的癌症水平;
4)基于步骤2)计算出的多元结构特征量化结果和步骤3)得到的图像癌症水平标记建立支持向量机模型;
5)在支持向量机模型中,样本根据其多元结构特征量化结果被定义为向量
Figure BDA0003755025780000031
所述多元结构特征量化结果包括纤维方向方差、细胞-纤维相对角度和纤维密度,分别由vi,ri,ci表示,所述样本向量
Figure BDA0003755025780000032
在模型中,在样本空间寻找一个分割超平面将两个不同癌症水平类别的乳腺组织样本分开,分割超平面方程为:
Figure BDA0003755025780000033
其中
Figure BDA0003755025780000034
为分割超平面的法向量,b为分割超平面的位移,通过以下判别式判断乳腺组织所属于的癌症水平类型:
Figure BDA0003755025780000035
其中yi是步骤2)中得到的癌症病灶标记信息,yi=1表示图像属于类型1,yi=2表示图像属于类型2;
(6)通过图像癌症水平标记和多元结构特征量化结果数据集训练模型,寻找最佳的分割超平面,求解如下方程,得到ω和b值:
Figure BDA0003755025780000036
其中s.t.表示条件需要同时满足,m是样本总数;
7)根据所得的ω和b值构建最佳的分割超平面用于区分处于两个不同癌症水平的胶原纤维样本,建立乳腺癌水平二分类器;
8)实际的胶原纤维样本癌症水平类型被分为三类,基于步骤5)-7)的训练方法构建三个乳腺癌水平二分类器,每个分类器用于将某一类与其他所有类区分开,在测试未知癌症水平的胶原纤维样本时,将其输入每个分类函数,得到函数值最大的那类被判定为未知胶原纤维样本所处的癌症水平类型,进而得到一个基于胶原纤维多元融合分析的乳腺癌检查工具。
作为进一步地改进,本发明所述的步骤3)中的纤维取向通过计算每个胶原纤维像素与其周围胶原纤维的空间取向的差值得到,所得纤维取向量化结果的分辨率为像素级别;所述纤维方向方差通过计算每个胶原纤维像素与其周围胶原纤维像素的空间取向的方差得到,所得纤维方向方差量化结果的分辨率为像素级别;所述细胞-纤维相对角度通过计算每个胶原纤维像素与其最邻近细胞边界像素的空间取向的差值得到,所得细胞-纤维相对角度量化结果的分辨率为像素级别;所述纤维密度通过计算胶原纤维像素在领域内的占比得到,所得纤维密度量化结果的分辨率为像素级别。
作为进一步地改进,本发明所述纤维取向用于量化胶原纤维在空间中的排列方向,取值范围为0—180°;所述纤维方向方差用于描述胶原纤维排列的有序程度,取值范围为0—1,取值越接近0表示胶原纤维排列越平行有序,取值越接近1表示胶原纤维排列越散乱无序;所述细胞-纤维相对角度用于量化胶原纤维与中心细胞边界之间的角度差值,取值范围为0—90°,取值为0°表示胶原纤维与细胞边界完全平行,取值为90°表示胶原纤维与细胞边界垂直;所述纤维密度用于量化胶原纤维的空间分布情况,取值范围为0—1,取值越接近0表示胶原纤维含量越少,取值越接近1表示胶原纤维含量越高。
作为进一步地改进,本发明所述的步骤5)—8)中训练获得的三个乳腺癌水平二分类器的分割超平面法向量
Figure BDA0003755025780000041
分别为[0.37589792,1.01374887,-0.34803396],[-1.33374423,-0.64543886,2.45260154],[0.91955191,-0.5849421,-1.98512522],分割超平面的位移b分别为0.30250453,0.36193904,0.16197132。
本发明与现有技术方案相比,具有如下优点:
1.相比于传统的组织病理学方法,本发明不需要复杂的切片准备工作,节约了人力和物力,并且不需要引入外来染色剂,能对组织进行无损、实时的监测和评估。
2.相比于传统的组织病理学方法,本发明可以得到有具体数值的检查结果对乳腺组织的癌症水平进行客观的评价,增强了检查结果的可靠性。
3.相比于传统的胶原纤维分析工具只能对胶原纤维的单一结构特征进行量化,本发明可以对胶原纤维进行多元的结构特征量化,提供了多维度、相互补充的胶原纤维形态学信息,基于多元结构特征训练支持向量机模型用于对乳腺癌水平进行检查,更完整地分析了乳腺组织的结构信息,提高了乳腺癌检查的准确率。
4.相比于传统的胶原纤维分析工具所提供的胶原纤维的形态学信息不够全面,本发明提出并实现了一种全新的算法用于提取乳腺组织图像的细胞-纤维相对角度,该结构参量用于量化乳腺组织中胶原纤维与中心细胞边界之间的角度差值,该结构特征在不同癌症水平的乳腺组织中有明显差异,是乳腺癌水平判定的重要参考依据,为乳腺组织的癌症水平分析提供了有效的信息。
5.相比于传统的组织病理学方法,本发明将胶原纤维的多元结构特征与乳腺组织癌症水平进行精细化关联,并通过建立数学模型的方式进行癌症检查,拥有更高的精度、敏感性与特异性,不同癌症水平的乳腺组织的检查精度高达95%。
6.相比于传统的胶原纤维分析工具无法反映组织局部的癌症特征,本发明所使用的纤维取向、纤维方向方差、细胞-纤维相对角度、纤维密度参量的分辨率为像素级别,可以反映组织的局部癌症特征,检测微小病灶的产生和发展。
附图说明
图1为本发明构建基于胶原纤维多元融合分析的乳腺癌检查工具的流程图;
图2为本发明对乳腺组织的光学成像结果和多元结构特征提取结果示意图:图2(a)为乳腺组织胶原纤维的多光子显微图像;图2(b)为计算得到的纤维取向信息经过伪彩色编码技术可视化后的图像;图2(c)-(e)为纤维密度、纤维方向方差、细胞-纤维相对角度经过伪彩色编码技术可视化后的图像,主要关注细胞边界周围的局域特征,伪彩色编码区域为细胞边界周围35微米范围内;图2(f)-(h)为本发明对纤维密度、纤维方向方差、细胞-纤维相对角度进行量化的结果柱状图;
图3为本发明对乳腺组织中三种肿瘤相关的胶原信号(TACS1-3)进行分析的结果:图3(a)是三种肿瘤相关的胶原信号的结构示意图;图3(b)是三种肿瘤相关的胶原信号的多光子显微图像;图3(c)-(e)是三种肿瘤相关的胶原信号的纤维方向方差、纤维密度、细胞-纤维相对角度经过伪彩色编码技术可视化后的图像;
图4为本发明对乳腺癌水平判别的结果示意图:图4(a)为乳腺组织中三种肿瘤相关的胶原信号(TACS1-3)的纤维方向方差、纤维密度与细胞-纤维相对角度多元参量的对比箱型图;图4(b)为利用纤维方向方差、纤维密度与细胞-纤维相对角度三种参量为坐标轴构建的不同肿瘤相关的胶原信号的三维散点图,以及原始验证和交叉验证的判别结果,判别精度分别为95%和90%;图4(c)为利用上述参量构建的乳腺癌水平判别模型的详细判别结果。
具体实施方式
为了更为具体地描述本发明,下面结合附图及具体实施方式对本发明的技术方案进行详细说明。
本发明为一种基于胶原纤维多元融合分析的乳腺癌检查工具,其特征在于融合分析乳腺组织多元结构特征,建立乳腺癌水平判别模型辅助乳腺癌的检查,图1是本发明的整体流程图,包含以下步骤:
对乳腺组织内细胞外基质中的胶原纤维进行光学成像,主要的使用双光子荧光和二次谐波成像技术。
对胶原纤维进行多元结构特征提取,计算获取纤维取向、纤维方向方差、细胞-纤维相对角度、纤维密度等量化结果。纤维取向通过计算每个胶原纤维像素与其周围胶原纤维的空间取向的差值得到,用于量化胶原纤维在空间中像素级别分辨率的排列方向,取值范围为0—180°;纤维方向方差通过计算每个胶原纤维像素与其周围胶原纤维像素的空间取向的方差得到,用于描述胶原纤维像素级别分辨率的排列有序程度,取值范围为0—1,取值越接近0表示胶原纤维排列越平行有序,取值越接近1表示胶原纤维排列越散乱无序;细胞-纤维相对角度通过计算每个胶原纤维像素与其最邻近细胞边界像素的空间取向的差值得到,用于量化胶原纤维与中心细胞边界之间像素级别分辨率的角度差值,取值范围为0—90°,取值为0°表示胶原纤维与细胞边界完全平行,取值为90°表示胶原纤维与细胞边界垂直;纤维密度通过计算胶原纤维像素在领域内的占比得到,用于量化胶原纤维像素级别分辨率的空间分布情况,取值范围为0—1,取值越接近0表示胶原纤维含量越少,取值越接近1表示胶原纤维含量越高。得到多元结构特征像素级别分辨率的量化结果后,利用伪彩色编码技术对这些参量提供的胶原纤维形态学信息进行可视化,进而更直观清晰地展示胶原纤维的结构特征。
对乳腺组织中进行双光子荧光/二次谐波成像的区域进行标记,并对组织进行苏木精-伊红染色用于癌症病理学检查,根据检查的结果标记成像区域所处的癌症水平。
基于计算得到的胶原纤维多元结构特征量化结果和癌症水平标记信息,建立支持向量机模型;该模型通过纤维取向、纤维方向方差、细胞-纤维相对角度和纤维密度这四个胶原纤维多元结构特征计算得到乳腺组织所处的癌症水平。多元结构特征提供了多维度、相互补充的胶原纤维形态学信息,保证了模型的准确性,实现对乳腺组织癌症水平高准确度的分析检查。
在支持向量机模型中,每个样本根据其多元结构特征量化结果被定义为向量
Figure BDA0003755025780000071
所述多元结构特征量化结果包括纤维方向方差、细胞-纤维相对角度和纤维密度,分别由vi,ri,ci表示,所述样本向量由
Figure BDA0003755025780000072
表示。
由于乳腺组织的癌症水平被分为三类,因此需要建立三类分类的支持向量机模型,但是标准的支持向量机模型只能进行二类分类,因此需要对其进行拓展。采用的三类分类思路是将三类分类问题拆分为一系列二类分类问题,再重新组合这些二类分类器以获得三类分类的结果。二类分类的支持向量机模型的构建步骤如下:
根据多元结构特征量化结果定义样本为向量
Figure BDA0003755025780000073
Figure BDA0003755025780000074
其中vi,ri,ci分别表示纤维方向方差、细胞-纤维相对角度和纤维密度,为了区分两个不同癌症水平类型的乳腺组织样本,从样本空间寻找一个具有以下形式的分割超平面:
Figure BDA0003755025780000075
其中
Figure BDA0003755025780000076
为分割超平面的法向量,b为分割超平面的位移,通过以下判别式判断乳腺组织所属于的癌症水平类型:
Figure BDA0003755025780000077
其中yi是标记信息,yi=1表示图像属于类型1,yi=2表示图像属于类型2。为了获得ω和b的值,需要利用大量具有类型标记的样本数据进行模型训练,寻找最佳的分割超平面,具体为求解如下的条件最值方程:
Figure BDA0003755025780000081
其中s.t.表示条件需要同时满足,m是样本总数。根据所得的ω和b值构建最佳的分割超平面用于区分处于两个不同癌症水平的胶原纤维样本,建立乳腺癌水平二分类器。
需要指出的是在多元结构特征参量包括纤维取向、纤维方向方差、细胞-纤维相对角度和纤维密度,其中纤维取向的数值与选取的参考系有关,所以在建立支持向量机模型时没有使用该参量;纤维方向方差、细胞-纤维相对角度两个参量的计算都基于纤维取向,这两个参量也包含了纤维取向所提供的结构信息。
另外,为了更全面地提供的胶原纤维的形态学信息,提出并实现了一种全新的算法用于提取乳腺组织图像的细胞-纤维相对角度,该结构参量用于量化乳腺组织中胶原纤维与中心细胞边界之间的角度差值,该结构特征在不同癌症水平的乳腺组织中有明显差异,是乳腺癌水平判定的重要参考依据,为乳腺组织的癌症水平分析提供了有效的信息。
通过以上步骤对三类癌症水平样本数据进行两两训练建模,获取三个癌症水平二类分类器,其分割超平面法向量
Figure BDA0003755025780000082
分别为:[0.37589792,1.01374887,-0.34803396],[-1.33374423,-0.64543886,2.45260154],[0.91955191,-0.5849421,-1.98512522],分割超平面的位移b分别为0.30250453,0.36193904,0.16197132。每一个分类器用于将某一癌症水平类型与其他所类型区分开。
对于一个需要进行乳腺癌水平检查的乳腺组织,首先对组织的胶原纤维进行光学成像,然后计算获取其多元结构特征参量结果,将数值输入每个二类分类器的分类函数
Figure BDA0003755025780000083
得到y值最大的那类被判定为未知胶原纤维样本所处的癌症水平类型,进而得到一个基于胶原纤维多元融合分析的乳腺癌检查工具。
下面结合说明书附图和具体的实施案例来说明本发明的具体实施方式,但本发明的应用不止于此。
本发明为一种基于胶原纤维多元融合分析的乳腺癌检查工具,具体步骤如下:
(1)对乳腺组织进行光学成像,获取乳腺组织内细胞外基质中的胶原纤维图像,光学成像主要使用双光子荧光和二次谐波成像技术,流程如图1所示。
(2)然后对所得乳腺组织的胶原纤维进行多元结构特征提取,计算获取纤维取向、纤维方向方差、细胞-纤维相对角度、纤维密度等量化结果,流程如图1所示。纤维取向通过计算每个胶原纤维像素与其周围胶原纤维的空间取向的差值得到,用于量化胶原纤维在空间中像素级别分辨率的排列方向,取值范围为0—180°;纤维方向方差通过计算每个胶原纤维像素与其周围胶原纤维像素的空间取向的方差得到,用于描述胶原纤维像素级别分辨率的排列有序程度,取值范围为0—1,取值越接近0表示胶原纤维排列越平行有序,取值越接近1表示胶原纤维排列越散乱无序;细胞-纤维相对角度通过计算每个胶原纤维像素与其最邻近细胞边界像素的空间取向的差值得到,用于量化胶原纤维与中心细胞边界之间像素级别分辨率的角度差值,取值范围为0—90°,取值为0°表示胶原纤维与细胞边界完全平行,取值为90°表示胶原纤维与细胞边界垂直;纤维密度通过计算胶原纤维像素在领域内的占比得到,用于量化胶原纤维像素级别分辨率的空间分布情况,取值范围为0—1,取值越接近0表示胶原纤维含量越少,取值越接近1表示胶原纤维含量越高。得到多元结构特征像素级别分辨率的量化结果后,利用伪彩色编码技术对这些参量提供的胶原纤维形态学信息进行可视化,进而更直观清晰地展示胶原纤维的结构特征。计算和伪彩色编码的结果示意图如图2所示,图2(a)为乳腺组织胶原纤维的多光子显微图像;图2(b)为计算得到的纤维取向信息经过伪彩色编码技术可视化后的图像;图2(c)-(e)为纤维密度、纤维方向方差、细胞-纤维相对角度经过伪彩色编码技术可视化后的图像,主要关注细胞边界周围的局域特征,伪彩色编码区域为细胞边界周围35微米范围内;图2(f)-(h)为本发明对纤维密度、纤维方向方差、细胞-纤维相对角度进行量化的结果柱状图。
(3)对乳腺组织进行苏木精-伊红染色用于癌症病理学检查,根据检查的结果标记多光子成像区域所处的癌症水平。乳腺中三种肿瘤相关的胶原信号(TACS1-3)可以帮助识别癌症水平。TACS1由围绕在肿瘤周围弯曲的胶原纤维所定义的,是定位小肿瘤的标志。TACS2由拉伸的胶原纤维定义,这是由于肿瘤生长导致胶原纤维的排列平行于肿瘤边界。TACS3由垂直于肿瘤边界不规则排列的胶原纤维定义,该状态的胶原纤维会促进肿瘤的迁移。TACS与胶原基质的重塑及肿瘤的发生和侵袭密切相关,是预测乳腺组织癌症水平的潜在生物标志物,对TACS的定量表征和分类对于了解乳腺组织的结构-功能关系和癌症水平具有重要意义。图3是对乳腺组织中三种肿瘤相关的胶原信号(TACS1-3)进行分析的结果示意图。图3(a)是三种肿瘤相关的胶原信号的结构示意图;图3(b)是三种肿瘤相关的胶原信号的多光子显微图像;图3(c)-(e)是三种肿瘤相关的胶原信号的纤维方向方差、纤维密度、细胞-纤维相对角度经过伪彩色编码可视化后的图像。本发明能够以像素级别分辨率分析胶原纤维,配合伪彩色编码技术能清晰直观地展示不同癌症水平乳腺组织胶原纤维的结构特征信息,辅助使用者把握不同癌症水平乳腺组织之间的结构差异性。
(4)基于计算得到的胶原纤维多元结构特征量化结果和癌症水平标记信息,根据多元结构特征量化结果建立样本向量
Figure BDA0003755025780000101
其中vi,ri,ci分别表示纤维方向方差、细胞-纤维相对角度和纤维密度,为了区分两个不同癌症水平类型的乳腺组织样本,通过以下判别式判断乳腺组织所属于的癌症水平类型:
Figure BDA0003755025780000102
其中yi是标记信息,yi=1表示图像属于类型1,yi=2表示图像属于类型2。
由于乳腺组织的癌症水平被分为三类,采用的三类分类思路建立三类分类的支持向量机模型,对三类癌症水平样本数据进行两两训练建模,获取三个癌症水平二类分类器,其分割超平面法向量
Figure BDA0003755025780000103
分别为:[0.37589792,1.01374887,-0.34803396],[-1.33374423,-0.64543886,2.45260154],[0.91955191,-0.5849421,-1.98512522],分割超平面的位移b分别为0.30250453,0.36193904,0.16197132。每一个分类器用于将某一癌症水平类型与其他所类型区分开。对于一个需要进行乳腺癌水平检查的乳腺组织,首先对组织的胶原纤维进行光学成像,然后计算获取其多元结构特征参量结果,将数值输入每个二类分类器的分类函数
Figure BDA0003755025780000104
得到y值最大的那类被判定为未知胶原纤维样本所处的癌症水平类型。当输入多个样本的多元结构特征参数,该模型可以输出癌症水平的判别结果和不同参量对应的散点图,散点图用于更直观地分析乳腺组织样本的癌症发展水平。对乳腺癌水平判别的结果示意图和散点图如图4所示。图4(a)展示了乳腺组织中三种不同癌症水平样本的纤维方向方差、纤维密度与细胞-纤维相对角度多元参量的对比散点图,可以从图中看出处于不同癌症水平的样本的三种结构参量都有明显的区分度,显示了本发明对于乳腺癌水平检查的可靠性;图4(b)展示了利用纤维方向方差、纤维密度与细胞-纤维相对角度三种参量为坐标轴构建的三种癌症水平样本的三维散点图,图中相同癌症水平类型的样本分布集中,而不同癌症水平的样本分布彼此独立分散,显示了本发明对不同乳腺癌水平检查的潜力。该模型对三种癌症水平样本的区分结果如图4(b)、(c)所示,原始验证和交叉验证的判别精度分别为95%和90%,显示了本发明所提出的乳腺癌检查工具的高精度、高特异性与敏感性。
上述对实施例的描述是为便于本技术领域的普通技术人员能理解和应用本发明。熟悉本领域技术的人员显然可以容易地对上述实施例做出各种修改,并把在此说明的一般原理应用到其他实施例中而不必经过创造性的劳动。因此,本发明不限于上述实施例,本领域技术人员根据本发明的揭示,对于本发明做出的改进和修改都应该在本发明的保护范围之内。

Claims (4)

1.一种基于胶原纤维多元融合分析的乳腺癌检查工具,其特征在于融合分析乳腺组织多元结构特征,建立乳腺癌水平判别模型辅助乳腺癌的检查,所述检查工具包含以下使用方法:
1)通过双光子荧光和二次谐波成像技术对待检查乳腺组织内细胞外基质中的胶原纤维进行成像,获取微米级分辨率光学图像;
2)提取乳腺组织胶原纤维光学图像的多元结构特征,得到包括纤维取向、纤维方向方差、细胞-纤维相对角度、纤维密度的量化结果;
3)对乳腺组织进行苏木精-伊红染色用于癌症病理学检查,根据检查结果标记步骤1)中所得的双光子荧光/二次谐波图像所处的癌症水平;
4)基于步骤2)计算出的多元结构特征量化结果和步骤3)得到的图像癌症水平标记建立支持向量机模型;
5)在支持向量机模型中,样本根据其多元结构特征量化结果被定义为向量
Figure FDA0003755025770000011
所述多元结构特征量化结果包括纤维方向方差、细胞-纤维相对角度和纤维密度,分别由vi,ri,ci表示,所述样本向量
Figure FDA0003755025770000012
在模型中,在样本空间寻找一个分割超平面将两个不同癌症水平类别的乳腺组织样本分开,分割超平面方程为:
Figure FDA0003755025770000013
其中
Figure FDA0003755025770000014
为分割超平面的法向量,b为分割超平面的位移,通过以下判别式判断乳腺组织所属于的癌症水平类型:
Figure FDA0003755025770000015
其中yi是步骤2)中得到的癌症病灶标记信息,yi=1表示图像属于类型1,yi=2表示图像属于类型2;
(6)通过图像癌症水平标记和多元结构特征量化结果数据集训练模型,寻找最佳的分割超平面,求解如下方程,得到ω和b值:
Figure FDA0003755025770000016
其中s.t.表示条件需要同时满足,m是样本总数;
7)根据所得的ω和b值构建最佳的分割超平面用于区分处于两个不同癌症水平的胶原纤维样本,建立乳腺癌水平二分类器;
8)实际的胶原纤维样本癌症水平类型被分为三类,基于步骤5)-7)的训练方法构建三个乳腺癌水平二分类器,每个分类器用于将某一类与其他所有类区分开,在测试未知癌症水平的胶原纤维样本时,将其输入每个分类函数,得到函数值最大的那类被判定为未知胶原纤维样本所处的癌症水平类型,进而得到一个基于胶原纤维多元融合分析的乳腺癌检查工具。
2.根据权利要求1所述的基于胶原纤维多元融合分析的乳腺癌检查工具,其特征在于,所述的步骤3)中的纤维取向通过计算每个胶原纤维像素与其周围胶原纤维的空间取向的差值得到,所得纤维取向量化结果的分辨率为像素级别;所述纤维方向方差通过计算每个胶原纤维像素与其周围胶原纤维像素的空间取向的方差得到,所得纤维方向方差量化结果的分辨率为像素级别;所述细胞-纤维相对角度通过计算每个胶原纤维像素与其最邻近细胞边界像素的空间取向的差值得到,所得细胞-纤维相对角度量化结果的分辨率为像素级别;所述纤维密度通过计算胶原纤维像素在领域内的占比得到,所得纤维密度量化结果的分辨率为像素级别。
3.根据权利要求2所述的基于胶原纤维多元融合分析的乳腺癌检查工具,其特征在于,所述纤维取向用于量化胶原纤维在空间中的排列方向,取值范围为0—180°;所述纤维方向方差用于描述胶原纤维排列的有序程度,取值范围为0—1,取值越接近0表示胶原纤维排列越平行有序,取值越接近1表示胶原纤维排列越散乱无序;所述细胞-纤维相对角度用于量化胶原纤维与中心细胞边界之间的角度差值,取值范围为0—90°,取值为0°表示胶原纤维与细胞边界完全平行,取值为90°表示胶原纤维与细胞边界垂直;所述纤维密度用于量化胶原纤维的空间分布情况,取值范围为0—1,取值越接近0表示胶原纤维含量越少,取值越接近1表示胶原纤维含量越高。
4.根据权利要求1或2或3所述的基于胶原纤维多元融合分析的乳腺癌检查工具,其特征在于,所述的步骤5)—8)中训练获得的三个乳腺癌水平二分类器的分割超平面法向量
Figure FDA0003755025770000021
分别为[0.37589792,1.01374887,-0.34803396],[-1.33374423,-0.64543886,2.45260154],[0.91955191,-0.5849421,-1.98512522],分割超平面的位移b分别为0.30250453,0.36193904,0.16197132。
CN202210852065.3A 2022-07-20 2022-07-20 基于胶原纤维多元融合分析的乳腺癌检查工具 Pending CN115272211A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210852065.3A CN115272211A (zh) 2022-07-20 2022-07-20 基于胶原纤维多元融合分析的乳腺癌检查工具

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210852065.3A CN115272211A (zh) 2022-07-20 2022-07-20 基于胶原纤维多元融合分析的乳腺癌检查工具

Publications (1)

Publication Number Publication Date
CN115272211A true CN115272211A (zh) 2022-11-01

Family

ID=83768241

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210852065.3A Pending CN115272211A (zh) 2022-07-20 2022-07-20 基于胶原纤维多元融合分析的乳腺癌检查工具

Country Status (1)

Country Link
CN (1) CN115272211A (zh)

Similar Documents

Publication Publication Date Title
JP6503382B2 (ja) 血液学用デジタルホログラフィ顕微鏡検査データ分析
US9488639B2 (en) Cell-based tissue analysis
JP5602717B2 (ja) 高密度細胞集団の自動セグメンテーション方法およびシステム
Di Cataldo et al. Computer-aided techniques for chromogenic immunohistochemistry: status and directions
Ghiasi-Freez et al. Semi-automated porosity identification from thin section images using image analysis and intelligent discriminant classifiers
Loukas et al. A survey on histological image analysis-based assessment of three major biological factors influencing radiotherapy: proliferation, hypoxia and vasculature
US9784665B1 (en) Methods for quantitative assessment of muscle fibers in muscular dystrophy
AU2021349226B2 (en) Critical component detection using deep learning and attention
US9785752B1 (en) Method for stratifying and selecting candidates for receiving a specific therapeutic approach
WO2022066725A1 (en) Training end-to-end weakly supervised networks in a multi-task fashion at the specimen (supra-image) level
Simhal et al. Probabilistic fluorescence-based synapse detection
US20230360208A1 (en) Training end-to-end weakly supervised networks at the specimen (supra-image) level
US20180040120A1 (en) Methods for quantitative assessment of mononuclear cells in muscle tissue sections
JP2019537102A (ja) 最適候補化合物を検出するためのコンピュータ装置およびその方法
WO2019074489A1 (en) METHODS FOR QUANTITATIVE EVALUATION OF MUSCLE FIBERS IN MUSCLE DYSTROPHY
CN115272211A (zh) 基于胶原纤维多元融合分析的乳腺癌检查工具
Han et al. eDetect: a fast error detection and correction tool for live cell imaging data analysis
Ahmad et al. Colorectal cancer image classification using image pre-processing and multilayer Perceptron
Lau et al. Advances in imaging modalities, artificial intelligence, and single cell biomarker analysis, and their applications in cytopathology
Pozzi et al. Artificial intelligence in imaging flow cytometry
Thirumal et al. Automated Cell Phenotyping for Imaging Mass Cytometry
US11908130B2 (en) Apparatuses and methods for digital pathology
Tonks et al. Evaluating virtual staining for high-throughput screening
Sabata Digital pathology imaging-The next frontier in medical imaging
Shvetsov et al. Fast TILs estimation in lung cancer WSIs based on semi-stochastic patch sampling

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination