CN114519705A

CN114519705A - 一种用于医学选拔与鉴定的超声标准数据处理方法及系统

Info

Publication number: CN114519705A
Application number: CN202210142434.XA
Authority: CN
Inventors: 刘淑萍; 李利; 赵国政; 孙斌; 林榕; 李迪; 徐娟; 龚凤玲; 安云恒
Original assignee: Air Force Specialty Medical Center of PLA
Current assignee: Air Force Specialty Medical Center of PLA
Priority date: 2022-02-16
Filing date: 2022-02-16
Publication date: 2022-05-20

Abstract

本发明公开了一种用于医学选拔与鉴定的超声标准数据处理方法及系统，属于医疗数据平台领域，该方法包括以下步骤：S1：获取医学选拔对象的超声影像，并将影像数据标注为统一的数据格式；S2：采用深度卷积经网络从医学选拔对象的超声影像中分割出目标区域；S3：提取目标区域中影像学特征；S4：对影像学特征进行选择和降维；S5：根据所分析数据的类型，选择预测模型，分析目标区的异质性。本方法能够实现远程医学的技术基础及实现计算机辅助诊断参与，进而能够提高招飞医学选拔和飞行人员评估鉴定中超声相关技术的科学性、规范性及可操作性。

Description

一种用于医学选拔与鉴定的超声标准数据处理方法及系统

技术领域

本发明是医疗数据平台领域，特别是关于一种用于医学选拔与鉴定的超声标准数据处理方法及系统。

背景技术

精准医学选拔与鉴定超声标准数据平台系统(以下简称“招飞系统”)聚合了医疗影像、远程诊断、远程医疗、智能影像设备和AI诊断等多种方式，提供更高质量、更有效、可负担的医疗服务。庞大的影像数据存储、传输和调阅需求给医疗系统带来了巨大的运维压力。

招飞系统在物理结构上采用各种网络将不同类型的设备连接起来，包括医学成像设备、图像采集卡、计算机、包括数据库和服务器以及图像显示工作站。影像科室的超声仪器等设备与外置高清音视频采集卡相连，采集卡将影像输出的视频信号数据输入电脑，并转换成电脑可辨别的数字数据，传输并存储至服务器及数据库中进行集中存储管理。图像及病人的相关信息从图像采集工作站录入并采集、送往系统服务器。它是本系统的核心，包括数据库服务器和存储管理系统两大部分。显示工作站利用招飞系统的网络资源和处理能力。显示工作站包括通信、数据库、显示、资源管理和处理软件。

现有的招飞系统的影像记录采集任务主要由视频采集卡完成，由于采集卡、PC硬件配置和软件使用等多方因素的共同作用下，在使用过程中时而会出现不稳定因素。其中丢帧现象是比较常见的一种，视频丢帧会造成影音不同步、画面质量差、视频影像不连续等异常情况发生，最终或导致医疗影像的质量不佳影响后续的调用和科研价值。

此外，现有的招飞系统中，还存在以下问题：

招飞医学选拔和飞行人员评估鉴定过程中，同一名被检人员可能经过两名或更多超声医生检查，不同医生经验不同，人工扫查读图以及对标准执行、把握主观性差异大，出现结论不一致的情况，导致误诊、漏诊，效能低下。

检查过程中的大量数据(包括：超声图像、术语描述、诊断鉴定意见、随访观察等)缺少统一的存储、分析、远程会诊、鉴定、循证的平台，不利于标准的制定和动态修订；缺乏超声检查过程中的图像采集、测量和病种识别的规范，和统一的超声检查和治疗中干预的流程。

仍有部分重要、实际的超声标准亟待制定，如：肾下垂、结构性心脏病、先天性椎动脉发育异常、甲状腺结节在医学选拔中的标准把握，部分先心病术后、肝肿瘤消融术后、甲状腺切除术后飞行鉴定标准把握等。

公开于该背景技术部分的信息仅仅旨在增加对本发明的总体背景的理解，而不应当被视为承认或以任何形式暗示该信息构成已为本领域一般技术人员所公知的现有技术。

发明内容

本发明的目的在于提供一种用于医学选拔与鉴定的超声标准数据处理方法及系统，其作为实现医疗中心数字化、信息化管理的重要手段，实现远程医学的技术基础及实现计算机辅助诊断(AI)参与，进而能够提高招飞医学选拔和飞行人员评估鉴定中超声相关技术的科学性、规范性及可操作性。

为实现上述目的，本发明提供了一种用于医学选拔与鉴定的超声标准数据处理方法，包括以下步骤：

S1：获取医学选拔对象的超声影像，并将影像数据标注为统一的数据格式；

S2：采用深度卷积经网络从医学选拔对象的超声影像中分割出目标区域；

S3：提取目标区域中影像学特征；

S4：对影像学特征进行选择和降维；

S5：根据所分析数据的类型，选择预测模型，分析目标区的异质性。

在本发明的一实施方式中，所述步骤S1中，所述将影像数据标注为统一的数据格式包括：将影像数据的所有信息进行数据分类、编码、顺序排列，形成超声标准数据串，以二维码或条形码形式进行传输。

在本发明的一实施方式中，所述步骤S2中，建立基于卷积神经网络的深度学习计算机辅助诊断超声图像人工智能模型，在标准化超声图像数据库的基础上构建正常超声图像标准模型，并根据CNN特性设计多层级数据构建算法，结合数据库资源经深度学习提取超声图像特征。

在本发明的一实施方式中，所述步骤S3中，所述影像学特征包括：使用数学公式定量计算的目标区特征，以及使用神经网络提取的图像的深度特征。

在本发明的一实施方式中，所述步骤S4中，采用的降维方法包括：方差分析、相关性度量、组合决策树方法、主成分分析法和/或特征一致性度量。

本发明还提供了一种用于医学选拔与鉴定的超声标准数据处理系统，包括标注模块，分割模块，提取模块，特征处理模块和训练模块；

所述标注模块用于获取医学选拔对象的超声影像，并将影像数据标注为统一的数据格式；

所述分割模块用于采用深度卷积经网络从医学选拔对象的超声影像中分割出目标区域；

所述提取模块用于提取目标区域中影像学特征；

所述特征处理模块用于对影像学特征进行选择和降维；

所述训练模块用于根据所分析数据的类型，选择预测模型，分析目标区的异质性。

在本发明的一实施方式中，所述标注模块中，将影像数据的所有信息进行数据分类、编码、顺序排列，形成超声标准数据串，以二维码或条形码形式进行传输。

在本发明的一实施方式中，所述分割模块中，建立基于卷积神经网络的深度学习计算机辅助诊断超声图像人工智能模型，在标准化超声图像数据库的基础上构建正常超声图像标准模型，并根据CNN特性设计多层级数据构建算法，结合数据库资源经深度学习提取超声图像特征。

在本发明的一实施方式中，所述提取模块中，所述影像学特征包括：使用数学公式定量计算的目标区特征，以及使用神经网络提取的图像的深度特征。

在本发明的一实施方式中，所述特征处理模块中，采用的降维方法包括：方差分析、相关性度量、组合决策树方法、主成分分析法和/或特征一致性度量。

与现有技术相比，根据本发明的一种用于医学选拔与鉴定的超声标准数据处理方法及系统，能够同时将影像组学特征提取、选择和模型训练等方法有效地整合到数据平台中，一体化地实现影像组学的应用。

附图说明

图1是根据本发明一实施方式的一种用于医学选拔与鉴定的超声标准数据处理方法的流程图；

图2是根据本发明一实施方式的一种用于医学选拔与鉴定的超声标准数据处理方法对肺部的超声影像进行处理后的示意图；

图3是根据本发明一实施方式的一种用于医学选拔与鉴定的超声标准数据处理方法对心脏的超声影像进行处理后的示意图；

图4是根据本发明一实施方式的一种用于医学选拔与鉴定的超声标准数据处理方法对甲状腺的超声影像进行处理后的示意图；

图5是根据本发明一实施方式的一种用于医学选拔与鉴定的超声标准数据处理系统的示意图。

具体实施方式

下面结合附图，对本发明的具体实施方式进行详细描述，但应当理解本发明的保护范围并不受具体实施方式的限制。

除非另有其它明确表示，否则在整个说明书和权利要求书中，术语“包括”或其变换如“包含”或“包括有”等等将被理解为包括所陈述的元件或组成部分，而并未排除其它元件或其它组成部分。

如图1至图4所示，根据本发明优选实施方式的一种用于医学选拔与鉴定的超声标准数据处理方法，其利用超声影像，在深度学习框架下搭建CNN神经网络模型进行训练，将训练好的模型参数导出，并用患者的超声影像作为测试输入进行测试，将测试的结果输入至系统进行推断获得诊断结果。相比于传统人工诊断方法，该系统具有自动、快速、高效、精确的特点。使用CNN网络进行病患分类，可以获得患病概率的量化信息。U-net网络分割超声影像，可以辅助医生判断病灶区域，避免肉眼判别带来的误差。

本方法包括以下步骤：

S1：获取医学选拔对象的超声影像，并将影像数据标注为统一的数据格式。

影像数据包括：1、对象的一般信息，如姓名、性别、年龄、身份ID号，数据库唯一标识ID号；2、一般生物学信息，如身高、体重、体表面积、臂展、双眼裸眼视力、听力等；3、超声标准数据信息，如：脏器或病变名称、部位、大小或范围、性质、合格是或否；4、超声标准图像信息，如：受检部位的标准深度、灰阶、焦点水平、脏器标准切面、标准内涵物、标准动态时限、时相等。

将影像数据标注为统一的数据格式的具体操作如下：将影像数据的所有信息进行数据分类、编码、顺序排列，形成“超声标准数据串”，以二维码或条形码形式进行传输，根据选拔流程进行加密或不加密处理。

医学选拔对象的超声影像中的影像数据要求病人数据临床问题明确、格式规范、信息完整，而目前常规临床使用的影像，由于采集时的成像参数、病人体位、重建算法以及扫描仪器的不同，具有很大的差异性，因此不利于识别和整理大量具有相似临床参数的图像数据示例(如疾病分期)。

因此，在本步骤中，采用统一的数据规范将影像数据标注为统一的数据格式，便于后续步骤对医学选拔对象的超声影像进行处理。

S2：采用深度卷积经网络从医学选拔对象的超声影像中分割出目标区域。

将目标区域(如肿瘤等)在医学选拔对象的超声影像上分割出来是实现后续特征提取和信息分析的基础。传统应用于医学影像的自动和半自动分割方法(如阈值分割法、边缘检测法、区域生长法、水平集法、模糊集法、活动轮廓模型法、图谱引导法)在实际中分割的精度和速度很难满足要求。

本步骤中建立基于卷积神经网络(CNN)的深度学习计算机辅助诊断超声图像人工智能模型，在标准化超声图像数据库的基础上构建正常超声图像标准模型，并根据CNN特性设计多层级数据构建算法，结合数据库资源经深度学习提取超声图像特征。模型构建完成后可自动识别新增超声图像，并利用CNN对一定变量输入数据相对不敏感的特性，仅识别和提取有异常结构的图像，而对有生理变异的图像不做提取，实现人工智能异常结构的自动识别。

深度卷积经网络具体使用SegNet neural network，这个是一种基于深度编码器和解码器的架构，也称为语义像素分割。它包括对输入图像进行低维编码，然后在解码器中利用方向不变性能力恢复图像。然后在解码器端生成一个分割图像。

S3：提取目标区域中影像学特征。

针对步骤S2中确定的目标区域，对其提取高通量的影像学特征。影像学特征可以分为两大类：一类是使用数学公式定量计算的目标区特征，包括形状特征、灰度特征和纹理特征以及小波变换、高斯变换后的特征；另一类是使用神经网络提取的图像的深度特征。

第一类使用数学公式定量计算的目标区特征中，涉及到的数学公式有：形状特征，矩形度：R＝A₀/A_MER，其中，A是该物体的面积，A_ME是其外接矩形的面积；灰度特征：Gray＝R*0.3+G*0.59+B*0.11；纹理特征：使用Canny算子；小波变换、高斯变换：sift特征。

第二类使用神经网络提取的图像的深度特征，具体是使用resnet18、vgg等作为backbone提取特征。

S4：对影像学特征进行选择和降维。

选择和降维是目的是去掉无用的数据，步骤S3后能够提取出数千个影像学特征，通过该步骤S4能够仅保留其中的一部分，比如一千个影像学特征。其目的是为了实际运行的时候效率更高。

步骤S3中提取的影像学特征一般是数以千计甚至万计的数据。为了选出可重复性好、信息量大、无冗余的特征用于最终模型的建立，一般需要对高通量的影像学特征进行降维处理。

本步骤中，采用的降维方法如下：

1、方差分析：将数据列变化小(即列包含的信息量少)的特征直接滤除。

其中，数据列的变化具体参考特征的量及具体的值，滤除太多的特征可能剩下的特征不够用，滤除太少的特征也就失去了对数据进行旋转和降维的意义。

具体地，采用皮尔逊相关系数r进行计算，其计算过程如下：

同时由于每一项特征的值的大小可能差多个数量级，所以阈值通常设定在0.01至0.001之间。

2、相关性度量：数值列之间的相似性通过计算相关系数来表示，名词类列的相关系数通过计算皮尔逊卡方值来表示，相关系数大于某个阈值的两列只保留一列。

3、组合决策树方法：对目标属性产生许多的大的决策树，然后根据对每个属性的统计结果找到信息量最大的特征子集。

此处的大的决策树是比较于后边说的特征子集说的，对目标属性直接做的决策树产生的结果会比较大，之后对得到的这些结果整理之后得到一个小的决策树，这个小的决策树的输入就是特征子集。

4、主成分分析法：将原始的n维数据集通过正交变换转换成不相关的被称作主成分的数据集，变换后方差最大的特征即第一个主成分，其后的成分在与前述主成分正交条件限制下具有最大方差，保存前m(m＜n)个主成分就能保存最大的信息量。

5、特征一致性度量：由手动分割结果计算得来的特征值，需要对其进行再测信度(test-retest)检验，计算一致性相关系数，将一致性相关系数小于某个值的顽健性低的特征滤除等。

其中，一致性相关系数结合了均方误差和皮尔森相关系数的特点，提供了一种可以同时度量相关性和绝对插值的指标，具体定义如下：

其中，ρ表示相关系数。绝对差值越小，一致性相关系数的值越大，相关性越强，一致性相关系数的值也越大，因此该值越接近1，则算法的表现越好。

上述步骤的目的是要确定留下的特征对影像学特征是有意义的，不用具体到是对哪个影像学特征有意义。

具体地，对于选择的预测模型，还需要进行训练和性能评估。由于不同数据可能在不同模型上达到最好的结果，所以具体使用哪个模型需要通过性能评估来确定，评估使用AUC及mAP进行评估，对于训练的话，不同模型的训练过程也不一样，具体的训练过程采用的是现有的模型训练方式(例如：一次性训练、批量训练和实时训练/在线训练等)，在这里不进行详细描述。

具体地，在该步骤S5中，采用的预测模型如下：

依据分析的类型(即有无预测标签)可以将分析方法分为监督学习和无监督学习。其中，预测标签是指针对有问题的数据所建立的标签，便于后续处理，比如有的影像资料没有说有没有问题，或者说没具体说哪个位置有问题，对于这些数据就算作没有预测标签，但是这部分数据也是有价值的，需要使用无监督学习。

无监督学习所采用的方法是聚类，分层聚类是最常用的聚类算法。监督学习常用的方法有感知机、K最近邻法、决策树、线性回归、支持向量机、随机森林、神经网络和深度学习等。

影像组学分析的最终目的是使建立的模型不仅对现有的数据有很好的预测能力，而且对未知的数据也有很好的预测能力，这就要求选择适当的模型使测试误差最小。常用的模型选择方法有正则化和交叉验证。

依据分析目的(即预测标签的类型)，也可以将监督学习分为分类预测和回归预测。

相应的模型性能评价指标一般采用的是分类准确率和损失函数。影像组学的核心是将低维视觉特征、高维复杂特征和临床经验特征结合，全面分析目标区异质性，寻找影像组学特征与目标区的表观特征、分子标志物之间的联系。这就需要在影像组学研究中收集病人的临床信息、基因分子表达信息等。并且为了使最终建立的模型可以推广应用，就必须要考虑模型的泛化能力，最好的解决方法就是进行多中心验证。

实现这些过程需要建立可以规范化管理和高效利用的数据平台，以用于影像、临床信息和基因表达状态等数据的存储、检索和分析，同时将影像组学特征提取、选择和模型训练等方法有效地整合到数据平台中，一体化地实现影像组学的应用。

通过本发明优选实施方式的一种用于医学选拔与鉴定的超声标准数据处理方法，能够对医学选拔对象的超声影像进行预处理，识别疾病病灶并进行量化。

该方法基于海量超声影像和图像资源，结合深度学习人工神经网络，聚类分析、多分辨率、模糊逻辑算法和边界识别进行病理状态下细胞区域图像分割、图像特征提取，并使用多级分类处理，准确识别疾病病灶并量化，可有效节省人力资源，缩短诊断时间，提高诊断准确率。

深度学习无需人工提取特征，通过大数据的训练，卷积神经网络自动学习，无需人工干预，极大程度上提高了准确率和降低误报率。

如图2所示，是应用本发明的一种用于医学选拔与鉴定的超声标准数据处理方法对肺部的超声影像进行处理后的示意图。肺部的较淡和隐蔽的早期肺癌小病灶，在X胸片上不易显出，可能会被医生忽视，本发明可精准定位肺部小病灶、结节并对肺结节性病变进行良恶性鉴别定性分析。通过本发明标识疑似区，提示医生重点关注并辅助医生诊断，减少漏诊和误诊。

如图3所示，是应用本发明的一种用于医学选拔与鉴定的超声标准数据处理方法为对心脏的超声影像进行处理后的示意图。基于海量的医疗影像大数据、人工智能深度学习、数据挖掘技术和图像处理技术，对隐藏于胸片的特征进行量化，分析并管理个人心肺健康指数和等级。本发明为心血管疾病的早期诊断、指导临床治疗、提供疾病危险程度及预后判断发挥了重要作用。左心室的精确分割对生成可靠的左心室功能参数(如射血分数)至关重要。

如图4所示，是应用本发明的一种用于医学选拔与鉴定的超声标准数据处理方法为对甲状腺的超声影像进行处理后的示意图。随着环境污染的漫延，极大提高了甲状腺癌的发病率。本发明运用3D数据对甲状腺定量分析，计算出病灶点的体积和质量，对诊断疾病有着判断依据和价值的临床意义。

如图5所示，根据本发明优选实施方式的一种用于医学选拔与鉴定的超声标准数据处理系统，其包括标注模块1，分割模块2，提取模块3，特征处理模块4和训练模块5。

标注模块1用于获取医学选拔对象的超声影像，并将影像数据标注为统一的数据格式。

因此，在标注模块1中，采用统一的数据规范将影像数据标注为统一的数据格式，便于后续对医学选拔对象的超声影像进行处理。

分割模块2用于采用深度卷积经网络从医学选拔对象的超声影像中分割出目标区域。

分割模块2中建立基于卷积神经网络(CNN)的深度学习计算机辅助诊断超声图像人工智能模型，在标准化超声图像数据库的基础上构建正常超声图像标准模型，并根据CNN特性设计多层级数据构建算法，结合数据库资源经深度学习提取超声图像特征。模型构建完成后可自动识别新增超声图像，并利用CNN对一定变量输入数据相对不敏感的特性，仅识别和提取有异常结构的图像，而对有生理变异的图像不做提取，实现人工智能异常结构的自动识别。

提取模块3用于提取目标区域中影像学特征。

针对分割模块2中确定的目标区域，对其提取高通量的影像学特征。影像学特征可以分为两大类：一类是使用数学公式定量计算的目标区特征，包括形状特征、灰度特征和纹理特征以及小波变换、高斯变换后的特征；另一类是使用神经网络提取的图像的深度特征。

第一类使用数学公式定量计算的目标区特征中，涉及到的数学公式有：形状特征，矩形度：R＝A0/AMER，其中，A是该物体的面积，AME是其外接矩形的面积；灰度特征：Gray＝R*0.3+G*0.59+B*0.11；纹理特征：使用Canny算子；小波变换、高斯变换：sift特征。

特征处理模块4用于对影像学特征进行选择和降维。

选择和降维是目的是去掉无用的数据，提取模块3能够提取出数千个影像学特征，通过特征处理模块4能够仅保留其中的一部分，比如一千个影像学特征。其目的是为了实际运行的时候效率更高。

提取模块3中提取的影像学特征一般是数以千计甚至万计的数据。为了选出可重复性好、信息量大、无冗余的特征用于最终模型的建立，一般需要对高通量的影像学特征进行降维处理。

特征处理模块4采用的降维方法如下：

具体地，采用皮尔逊相关系数r进行计算，其计算过程如下：

上述的目的是要确定留下的特征对影像学特征是有意义的，不用具体到是对哪个影像学特征有意义。

训练模块5用于预测模型的训练和性能评估。

具体地，在训练模块5中，采用的预测模型如下：

前述对本发明的具体示例性实施方案的描述是为了说明和例证的目的。这些描述并非想将本发明限定为所公开的精确形式，并且很显然，根据上述教导，可以进行很多改变和变化。对示例性实施例进行选择和描述的目的在于解释本发明的特定原理及其实际应用，从而使得本领域的技术人员能够实现并利用本发明的各种不同的示例性实施方案以及各种不同的选择和改变。本发明的范围意在由权利要求书及其等同形式所限定。

Claims

1.一种用于医学选拔与鉴定的超声标准数据处理方法，其特征在于，包括以下步骤：

S3：提取目标区域中影像学特征；

S4：对影像学特征进行选择和降维；

2.如权利要求1所述的用于医学选拔与鉴定的超声标准数据处理方法，其特征在于，所述步骤S1中，所述将影像数据标注为统一的数据格式包括：将影像数据的所有信息进行数据分类、编码、顺序排列，形成超声标准数据串，以二维码或条形码形式进行传输。

3.如权利要求1所述的用于医学选拔与鉴定的超声标准数据处理方法，其特征在于，所述步骤S2中，建立基于卷积神经网络的深度学习计算机辅助诊断超声图像人工智能模型，在标准化超声图像数据库的基础上构建正常超声图像标准模型，并根据CNN特性设计多层级数据构建算法，结合数据库资源经深度学习提取超声图像特征。

4.如权利要求1所述的用于医学选拔与鉴定的超声标准数据处理方法，其特征在于，所述步骤S3中，所述影像学特征包括：使用数学公式定量计算的目标区特征，以及使用神经网络提取的图像的深度特征。

5.如权利要求1所述的用于医学选拔与鉴定的超声标准数据处理方法，其特征在于，所述步骤S4中，采用的降维方法包括：方差分析、相关性度量、组合决策树方法、主成分分析法和/或特征一致性度量。

6.一种用于医学选拔与鉴定的超声标准数据处理系统，其特征在于，包括标注模块，分割模块，提取模块，特征处理模块和训练模块；

所述提取模块用于提取目标区域中影像学特征；

所述特征处理模块用于对影像学特征进行选择和降维；

7.如权利要求6所述的用于医学选拔与鉴定的超声标准数据处理系统，其特征在于，所述标注模块中，将影像数据的所有信息进行数据分类、编码、顺序排列，形成超声标准数据串，以二维码或条形码形式进行传输。

8.如权利要求6所述的用于医学选拔与鉴定的超声标准数据处理系统，其特征在于，所述分割模块中，建立基于卷积神经网络的深度学习计算机辅助诊断超声图像人工智能模型，在标准化超声图像数据库的基础上构建正常超声图像标准模型，并根据CNN特性设计多层级数据构建算法，结合数据库资源经深度学习提取超声图像特征。

9.如权利要求6所述的用于医学选拔与鉴定的超声标准数据处理系统，其特征在于，所述提取模块中，所述影像学特征包括：使用数学公式定量计算的目标区特征，以及使用神经网络提取的图像的深度特征。

10.如权利要求6所述的用于医学选拔与鉴定的超声标准数据处理系统，其特征在于，所述特征处理模块中，采用的降维方法包括：方差分析、相关性度量、组合决策树方法、主成分分析法和/或特征一致性度量。