CN116386803A

CN116386803A - 一种基于图的细胞病理报告生成方法

Info

Publication number: CN116386803A
Application number: CN202310247097.5A
Authority: CN
Inventors: 李武军; 周洋帆
Original assignee: Nanjing University
Current assignee: Nanjing University
Priority date: 2023-03-15
Filing date: 2023-03-15
Publication date: 2023-07-04

Abstract

本发明公开了一种基于图的细胞病理报告生成方法，包括以下两个内容：基于图的细胞病理报告生成模型，以及对生成的模型进行训练。本发明通过构建细胞图的方式对细胞空间结构进行显式建模，并有效融合细胞空间结构特征和细胞形态特征，能够自动生成高质量的细胞病理报告。本发明相比于已有方法，能够显著提升细胞病理报告生成的质量，在临床场景中可以辅助医生完成繁琐的细胞病理报告编写工作、提升病理诊断的效率，同时报告中所给出的结论也能辅助确认诊断的准确性。

Description

一种基于图的细胞病理报告生成方法

技术领域

本发明涉及病理诊断，特别是一种基于图的细胞病理报告生成方法。

背景技术

病理诊断是目前最可靠的肿瘤诊断方法，被喻为“金标准”，为病情判断和临床治疗提供关键依据。在诊断流程中，病理医生需要在完整的病理切片中挑选一些典型区域并撰写细胞病理报告，这些报告需详细描述区域中细胞的形态以及组织是否发生炎症、癌变等异常，以构成诊断结论的重要依据。然而手动编写细胞病理报告是一项繁琐、重复性高的工作，为诊断过程带来大量额外负担，因此开发深度学习模型辅助医生对选定的组织病理图像块进行细胞病理报告生成，能够有效提升病理诊断的效率，同时报告中所给出的诊断结论也能辅助医生进一步确认诊断的准确性。

目前关于细胞病理报告生成的研究工作较少，已有工作主要根据医学报告的特点，对报告生成模块进行改进，而在视觉特征提取方面大多沿用对自然图像提取特征的思路，忽略了病理图像与自然图像在结构上的不同，因此没有为一个重要特征——细胞空间结构信息——进行显式建模，导致所生成的细胞病理报告质量存在不足。自然图像通常由不同的对象和背景构成，主要描述重点对象的特征和行为；病理图像则通常由大量特征相似的细胞构成，描述的重点在于细胞整体的状态和细胞间关系，例如细胞拥挤程度、细胞排列、异常细胞出现的频率等，此类信息需由细胞形态特征以及细胞空间结构特征共同得出。因此，需要一种方法对细胞空间结构特征进行显式建模、并与细胞形态特征进行有效融合，以自动生成高质量的细胞病理报告、在临床诊断中辅助病理医生的工作。

发明内容

发明目的：本发明的目的是提供一种基于图的细胞病理报告生成方法，从而通过构建细胞图的方式对细胞空间结构进行显式建模，有效融合细胞空间结构特征和细胞形态特征，显著提升细胞病理报告的生成质量。

技术方案：本发明所述的一种基于图的细胞病理报告生成方法，包括以下步骤：

(1)基于图的细胞病理报告生成模型：对输入图像构建细胞图；使用卷积神经网络对细胞图进行节点特征提取和全局特征提取；使用图神经网络对细胞图进行邻节点特征聚合和节点特征更新；将细胞节点特征和图像全局特征输入编码器-解码器结构的Transformer网络，输出细胞病理报告；

(2)对步骤(1)生成的模型进行训练：输入训练数据集、验证数据集和待训练模型，对数据集中所有图像建立细胞图并存储；将训练集数据分批次输入模型；使用模型处理输入图像，在单词生成阶段，基于标记文本和掩码注意力一次性生成所有位置单词的可能性预测；计算交叉熵损失，并对模型参数进行梯度下降更新；基于模型在验证数据集的表现，选择最优模型并输出。

步骤(1)中所述的模型包含建图模块、提取细胞节点特征的ResNet网络、提取图像全局特征的ResNet网络、GIN图神经网络，以及编码器-解码器结构的Transformer网络。

所述步骤(1)具体为：

(1.1)输入待处理的图像I；

(1.2)统一图像I的尺度，并对I进行强度归一化；

(1.3)将图像I输入建图模块，使用HoverNet网络对I中所有细胞进行分割，并在每个细胞处截取大小的图像块，共产生n个细胞图像块；

(1.4)使用一个冻结的ResNet网络产生各细胞图像块的视觉特征向量集合

将图像块中心坐标添加至/>

中对应向量的尾部，得到所有图像块的特征向量集合/>

(1.5)使用k近邻算法，根据G中向量之间的欧式距离确定细胞间连线，得到构建完成的细胞图

其中/>

代表细胞节点集，ε代表边集；

(1.6)使用可训练的ResNet网络对细胞节点对应的图像块进行细胞形态特征提取，得到节点特征向量集

(1.7)使用另一可训练的ResNet网络提取图像全局特征，获取向量e；

(1.8)使用GIN图神经网络聚合细胞图中各节点邻居特征并更新节点向量，GIN包含若干层，每层均产生节点向量集

(1.9)计算并输出GIN各层所产生的节点向量的加权和

(1.10)将e与

集合中的向量构成序列，输入至Transformer编码器，产生编码向量序列T；

(1.11)T输入Transformer解码器，解码器通过z步推断自回归的生成单词序列w＝[w¹,w²,…,w^z]；

(1.12)将单词序列w组合为文本并输出。

所述步骤(2)具体为：

(2.1)输入训练数据集

和验证数据集/>

其中/>

指图像集，/>

指图像对应的标记文本集合；输入待训练的细胞病理报告生成模型N；

(2.2)对数据集中所有图像建立细胞图并存储；

(2.3)将训练细胞图以及对应的原图分批次输入N；

(2.4)N使用ResNet和GIN图神经网络对输入的细胞图提取细胞节点特征、图像整体特征，输入Transformer编码器，输出编码向量序列T；

(2.5)将T和图像对应的标记文本y＝[y¹,y²,…,y^z]输入Transformer解码器，采用掩码注意力的方式，在生成单词w_t时，隐藏[y^t,…,y^z]，由此一次性生成位置1～z单词的可能性预测P＝[p¹,p²,…p^z]；

(2.6)根据y与P计算交叉熵损失；

(2.7)对N所包含的ResNet网络、GIN图神经网络和Transformer网络进行梯度下降；

(2.8)使用

的全部图像训练一轮后，令经过训练的N在/>

上生成细胞病理报告，并计算与/>

的BLEU-4分数；

(2.9)训练若干轮后，输出在

上获得最佳BLEU-4分数的模型N。

一种计算机存储介质，其上存储有计算机程序，该计算机程序被处理器执行时实现上述的一种基于图的细胞病理报告生成方法。

一种计算机设备，包括储存器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现上述的一种基于图的细胞病理报告生成方法。

有益效果：与现有技术相比，本发明具有如下优点：本发明所提供的方法首次在报告生成模型中显式地对病理图像中的关键信息(即细胞空间结构)进行建模，并有效地融合了细胞形态特征、细胞空间结构特征和背景特征用以生成报告。相比于已有方法，本发明能够显著提升细胞病理报告的生成质量，在临床病理诊断场景中能够自动生成细胞病理报告、并提供诊断结果参考，提高病理诊断工作的效率。

附图说明

图1为本发明所述方法的工作流程图。

图2为本发明所述方法的结构示意图。

具体实施方式

下面结合附图对本发明的技术方案作进一步说明。

一种基于图的细胞病理报告生成方法，包括以下步骤：

(1)基于图的细胞病理报告生成模型，所述的模型包含建图模块、提取细胞节点特征的ResNet网络、提取图像全局特征的ResNet网络、GIN图神经网络，以及编码器-解码器结构的Transformer网络，其工作流程如图1所示，模型结构如图2所示。对输入图像构建细胞图；使用卷积神经网络对细胞图进行节点特征提取和全局特征提取；使用图神经网络对细胞图进行邻节点特征聚合和节点特征更新；将细胞节点特征和图像全局特征输入编码器-解码器结构的Transformer网络，输出细胞病理报告；

(1.1)输入待处理的图像I；

(1.2)将图像I的尺度缩放至500×500，并对I进行强度归一化，将像素值放缩至0-255之间；

(1.3)将图像I输入建图模块，使用HoverNet网络对I中所有细胞进行分割，并在每个细胞处截取36×36大小的图像块，共产生n个细胞图像块；

将图像块中心坐标添加至/>

中对应向量的尾部，得到所有图像块的特征向量集合/>

其中/>

代表细胞节点集，ε代表边集；

(1.8)使用GIN图神经网络聚合细胞图中各节点邻居特征并更新节点向量，GIN共4层，每层均产生节点向量集

(1.9)计算并输出GIN各层所产生的节点向量的加权和

(1.10)将e与

(1.12)将单词序列W组合为文本并输出。

(2.1)输入训练数据集

和验证数据集/>

其中/>

指图像集，

(2.2)对数据集中所有图像建立细胞图并存储；

(2.3)将训练细胞图以及对应的原图分批次输入N，其中一个批次包含16张细胞图；

(2.6)根据y与P计算交叉熵损失；

(2.8)使用

的全部图像训练一轮后，令经过训练的N在/>

上生成细胞病理报告，并计算与/>

的BLEU-4分数；

(2.9)训练20轮后，输出在

上获得最佳BLEU-4分数的模型N。

本发明所提出的方法在实际病理图像数据集上进行了实验。在实验结果中，本发明在图像描述生成任务指标CIDE-r和SPICE上相对于已有方法中最好的结果分别提升了13.4％和10.2％，在诊断结论准确性方面，相对于已有方法的最好结果提升了5.5％，证明了本发明能够显著提升细胞病理报告的生成质量，在临床诊断中具有更高的应用价值。