具体实施方式
以下将参考附图详细说明本公开的各种示例性实施例、特征和方面。附图中相同的附图标记表示功能相同或相似的元件。尽管在附图中示出了实施例的各种方面,但是除非特别指出,不必按比例绘制附图。
在这里专用的词“示例性”意为“用作例子、实施例或说明性”。这里作为“示例性”所说明的任何实施例不必解释为优于或好于其它实施例。
本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,存在A和B,单独存在B这三种情况。另外,本文中术语“至少一种”表示多种中的任意一种或多种中的至少两种的任意组合,例如,包括A、B、C中的至少一种,可以表示包括从A、B和C构成的集合中选择的任意一个或多个元素。
另外,为了更好的说明本公开,在下文的具体实施方式中给出了众多的具体细节。本领域技术人员应当理解,没有某些具体细节,本公开同样可以实施。在一些实例中,对于本领域技术人员熟知的方法、手段、元件和电路未作详细描述,以便于凸显本公开的主旨。
图1示出根据本公开一实施例的超声造影影像分类方法的流程图。该方法可以应用于超声造影影像分类装置,超声造影影像分类装置可以为终端设备、服务器或者其他处理设备等。其中,终端设备可以为用户设备(User Equipment,UE)、移动设备、用户终端、终端、蜂窝电话、无绳电话、个人数字处理(Personal Digital Assistant,PDA)、手持设备、计算设备、车载设备、可穿戴设备等。
在一些可能的实现方式中,该超声造影影像分类方法可以通过处理器调用存储器中存储的计算机可读指令的方式来实现。
如图1所示,该超声造影影像分类方法可以包括:
步骤S11,获取包含分类对象的超声造影影像和分类场景,所述分类场景用于指示对分类的速度和/或精度的要求。
步骤S12,根据所述分类场景,对所述超声造影影像进行分类对象的状态分类,确定所述分类对象的至少一个状态分类结果,所述状态分类结果包括:正常状态或非正常状态。
步骤S13,根据所述至少一个状态分类结果,确定所述分类对象的状态。
其中,分类对象可以是任何具有状态确定需求的对象,分类对象是位于超声造影影像中的影像。具体地,在一种可能的实现方式中,本公开实施例中提出的超声造影影像分类方法,可以用于对心脏右心室的状态进行确定,在一个示例中,分类对象也可以是心脏中其他具有状态确定需求的部分,根据实际情况灵活选择即可。在一种可能的实现方式中,本公开实施例中提出的方法也可以应用于对其他器官或组织进行状态确定,相应的,在一些可能的实现方式中,分类对象可以是具有状态确定需求的器官或组织。后续各公开实施例均以目标对象为心脏右心室为例进行说明,在分类对象为其他形式的情况下,其处理方法可以根据本公开实施例提出的方法进行灵活扩展,不再举例说明。
在分类对象为心脏右心室的情况下,分类对象的状态分类结果可以为:卵圆孔未闭(PFO)、房间隔缺损、完全性肺静脉畸形引流、永存左上腔静脉、肺动静脉瘘、动脉导管未闭、复杂心血管畸形或是其他等非正常状态以及正常状态。随着分类对象分类精度的不同,分类对象的状态分类结果也可以根据实际情况灵活决定。在一种可能的实现方式中,分类对象的状态分类结果可以对分类对象的某种分类结果的等级进行划分。具体的,分类对象的状态分类结果可以包括卵圆孔未闭的轻重程度的级别划分,也可以包括房间隔缺损的半定量分级。本公开对分类对象的状态分类结果不做具体限定。
超声造影影像可以是从超声成像设备处获取的,例如可以通过数据传输的方式,来获取超声造影影像,超声成像设备的使用场景比较广泛。既有布局在机房的固定式超声成像设备,也有俗称为“床旁机”的移动式超声成像设备。在不同的使用场景下,设备的存储空间,算力和计算速度差异很大。在一种可能的实现方式中,在步骤S11中,获取包含分类对象的超声造影影像和分类场景。具体的,可以通过网络等其他间接方式获取超声造影影像。本公开对包含分类对象的超声造影影像的获取方式不作限制。所述分类场景可以根据具体情况进行划分和选择,在一种可能的实现方式中,所述分类场景可以用于指示对分类的速度和/或精度的要求,所述分类的速度可以用于表示确定分类对象的状态的时间的长短,所述分类的精度可以用于表示预测分类对象的状态的精度,例如,“床旁机”的移动式超声成像设备这一使用场景对分类速度要求较高,而布局在机房的固定式超声成像设备这一使用场景则对分类精度要求较高。本公开对分类场景的个数和划分标准不作限制。
应当理解的是,本公开中的超声造影影像的分类结果仅反映患者服用超声造影剂后血管中产生的微小气泡的特征的分类,有些患者的超声造影影像具有心脏某一方面疾病的超声造影影像的特征而实际正常,例如患者的超声造影影像显示为具有房间隔缺损的气泡的特征,而实际该患者的房间隔并无问题,还需要使用其他手段如多普勒图像去综合判断。即超声造影影像的分类结果对于心脏病的诊断并非特异。该方法的直接目的是获得中间结果而非诊断结果。
通过上述任意公开实施例得到超声造影影像和分类场景后,可以通过步骤S12,根据所述分类场景,对所述超声造影影像进行分类对象的状态分类,确定所述分类对象的至少一个状态分类结果。本公开对步骤S12的实现方式不受限定,例如,可使用机器学习的方法来确定所述分类对象的至少一个状态分类结果。
在一种可能的实现方式中,在步骤S13中,根据所述至少一个状态分类结果,确定所述分类对象的状态。例如参照投票机制,根据各个状态分类结果的取值及权重,综合判定分类对象的状态。在状态分类结果为正常的总体权重更高时,判定分类处于正常状态;反之,判定分类对象处于非正常状态。本公开对S13的实现方法不做具体限定。
根据本公开实施例的超声造影影像分类方法,根据不同的分类场景,对超声造影影像进行分类对象的状态分类,能够动态地改变具体的分类方法,来适应不同计算平台和不同模型部署条件的要求,实用性强、一致性高,解决了超声造影分析对使用场景要求高、适应性差的问题,在进行状态分类时,通过至少一个状态分类结果来确定分类对象的状态,提高了对分类对象的状态识别的准确度
在一种可能的实现方式中,所述根据所述分类场景,对所述超声造影影像进行分类对象的状态分类,确定所述分类对象的至少一个状态分类结果,包括:
将所述超声造影影像输入与所述分类场景对应的神经网络;
根据所述神经网络的输出,确定所述分类对象的至少一个状态分类结果;
其中,所述神经网络通过包含所述分类对象的训练影像进行训练,所述训练影像中的分类对象通过至少一个状态分类结果进行标注。
神经网络的具体实现形式以及训练方式在本公开实施例中均不作限制,可以根据实际情况灵活选择,神经网络的初始模型可以根据实际情况任意选择,在一个示例中,可以将ResNeXt作为神经网络的实现形式。也可以使用诸如VGG系列、DenseNet系列、Inception系列、MobileNet系列、ShuffleNet系列、ResNet系列、EfficientNet系列等各种网络结构。训练采取的损失函数也可以根据实际情况灵活选择,在一个示例中,可以将MSE作为损失函数,对神经网络进行训练。
训练影像的获取形式可以参考上述超声造影影像的获取形式,在此不再赘述。对训练影像的分类对象进行标注的方式在本公开实施例中不做限制,可以根据神经网络实现的功能灵活决定,本发明的发明思想并不对分类标签的个数进行限制。在一种可能的实现方式中,可以对训练影像中分类对象中的每个状态分类结果分别进行标注。具体选择哪种标注方式,可以根据实际情况灵活选择,在本公开实施例中不做限制。
由于原始影像中会包含医生拍摄和分析过程中的停顿和倒放等片段,这些片段会对神经网络模型的学习过程产生干扰。在一种可能的实现方式中,在给训练影像标注时,需要对原始影像进行剪辑。由于画面中的心腔气泡产生和消失时刻也决定着该影像的最终分类结果,在一种可能的实现方式中,剪辑后的影像可以包含8-10个心动周期。
在一种可能的实现方式中,当得到上述剪辑好的带有标签的影像后,需要对这些影像进行预处理,来满足模型训练的要求。
在一种可能的实现方式中,所述预处理过程可以包括自适应帧采样,获得每个影像的帧率信息,然后进行自适应的帧采样,使得具有相长的影像,抽帧得到的图片数量保持一致。在一种可能的实现方式中,可以将所有影像的帧率调整为20fps。
在一种可能的实现方式中,所述预处理过程可以包括数据分组,对帧率调整后的影像,按照其类别和各自数量,进行分层分组,例如,将其分成训练集,验证集和测试集。在一种可能的实现方式中,训练集,验证集和测试集的影像比例分别为64:16:20。
由于不同类别的影像数量各不相同,对于数量较少的类别,直接拿来训练,神经网络模型难以学习到它们的特征信息,在一种可能的实现方式中,所述预处理过程可以包括数据扩充模块,对训练集中少数类别数据进行数据扩增,使得所有类别的影像数量大致保持相同。在一种可能的实现方式中,对影像数据进行数据扩增的方法是颜色通道的随机组合。
通过以分类对象的状态分类结果进行标注的训练影像,对神经网络训练,从而利用训练好的神经网络实现对包含分类对象的超声造影影像的分类,确定分类对象的状态。通过上述过程,可以有效地利用神经网络对包含分类对象的超声造影影像进行分类,较为便捷、准确地确定分类对象的状态,从而有效地降低了超声造影影像分类的难度,提升了超声造影影像分类的实用性和泛化能力。
在一种可能的实现方式中,在所述分类场景为速度优先的分类场景的情况下,可减少状态分类结果的数量,以提高确定状态分类结果的速度。
图2示出根据本公开一实施例的超声造影影像分类方法的流程图。在一种可能的实现方式中,如图2所示,所述将所述超声造影影像输入与所述分类场景对应的神经网络,包括:
对所述超声造影影像进行造影图像抽取;
将所述造影图像输入第一图像分支神经网络,提取所述超声造影影像的时序特征;
所述根据所述神经网络的输出,确定所述分类对象的至少一个状态分类结果,包括:
根据所述时序特征,确定所述分类对象的第一状态分类结果;
所述根据所述至少一个状态分类结果,确定所述分类对象的状态,包括:
根据所述第一状态分类结果,确定所述分类对象的状态。
超声造影的影像质量会受到各种因素的影响,例如不同厂家生产的不同型号的超声成像设备成像质量差异较大,超声造影影像独有的伪影现象也会影响影像的成像质量,另外,医生拍摄的右心声学造影切面角度是否符合要求也是一个重要的影响因素。
在一种可能的实现方式中,需要对获取的超声造影影像进行数据预处理,以解决超声造影影像质量差异较大、标准化程度较低的问题。
在一种可能的实现方式中,所述数据预处理包括自适应帧采样,即从超声造影影像抽取造影图像。在一种可能的实现方式中,对所述超声造影影像进行造影图像抽取时,采用时序稀疏采样,即将超声造影影像均分为T段,每段中随机采样一帧,一共得到T帧造影图像。关于T的设置,当T越大,采样的图片数目越多,神经网络模型能得到的信息越多,但会消耗更多的计算资源。在一种可能的实现方式中,可以设置采样帧数目T=10,以得到预测精度较高且预测速度较快的神经网络模型。
在一种可能的实现方式中,本公开采用的第一图像分支神经网络为ResneXt,如图所示,经上述公开实施例获得的T帧造影图像,经过ResneXt前3个卷积下采样模块,得到T个特征向量。每个特征向量的维度是D×H×W,其中,D为通道数,H和W分别为原始图片经过8倍下采样后的图像尺寸。将这T个特征向量进行拼接后,得到合并后的特征向量X。它的维度是D×T×H×W。接着,利用3D卷积对包含有T帧造影图像信息的特征向量X进行特征融合操作。得到维度为512的影像级特征y2。最后对y2进行Softmax操作得到类别预测结果。
这里Softmax操作的表达式参见公式(1):
其中,z为输入向量,m为输入向量的维度,e为自然常数,i和j为正整数。
根据本公开实施例的超声造影影像分类方法,通过神经网络对超声造影影像中时序特征的提取,并通过该时序特征进行状态分类,最大化地精简了模型结构,结果准确、实用性强,对计算设备的算力和内存要求极低。当使用场景需要模型具备特别快的响应速度时,或者提供的计算资源极为有限的情况下,可以采取此种快速部署模式。在一种可能的实现方式中,超声造影影像分类方法可以与“床旁机”等移动设备进行集成,并实时地输出影像的预测结果,较为适合医生每日查房等使用场景。
在一种可能的实现方式中,在所述分类场景为速度和精度均衡的分类场景的情况下,可在上述仅使用一种神经网络来确定分类对象的状态的方法的基础上,增加神经网络个数,以获取不少于一个的状态分类结果,来确定分类对象的状态,进一步的提高分类的精度。
图3示出根据本公开一实施例的超声造影影像分类方法的流程图。在一种可能的实现方式中,如图3所示,所述将所述超声造影影像输入与所述分类场景对应的神经网络,包括:
对所述超声造影影像进行造影图像抽取;
将所述造影图像输入第一图像分支神经网络,提取所述超声造影影像的时序特征;
将所述造影图像输入第二图像分支神经网络,提取所述超声造影影像的静态特征;
所述根据所述神经网络的输出,确定所述分类对象的至少一个状态分类结果,包括:
根据所述时序特征,确定所述分类对象的第一状态分类结果;
根据所述静态特征,确定所述分类对象的第二状态分类结果;
所述根据所述至少一个状态分类结果,确定所述分类对象的状态,包括:
根据所述第一状态分类结果和所述第二状态分类结果,确定所述分类对象的状态分类结果。
本公开中对所述超声造影影像进行造影图像抽取、以及通过第一图像分支神经网络,提取所述超声造影影像的时序特征的具体实现过程等可以与前述实施例相同,在此不作详细说明。
在一种可能的实现方式中,如图所示,经上述公开实施例获得的T帧造影图像,送入第二图像分支神经网络,在一种可能的实现方式中,如图所示,所述第二图像分支神经网络为ResNeXt,取出ResNeXt中GAP(全局最大池化层)的输出结果。该输出包含T个1024维特征向量。对这T个向量进行平均汇合,得到维度为1024的影像级特征y1。最后对y1进行Softmax操作,得到第二状态分类结果。通过本公开的第二图像分支神经网络,平均汇合影像的静态特征,得到了得到第二状态分类结果。
根据本公开实施例的超声造影影像分类方法,使用了两种神经网络,提取了超声造影影像的时序、静态特征,并根据时序、静态特征确定了第一状态分类结果和第二状态分类结果,然后根据第一状态分类结果和第二状态分类结果共同确定分类对象的状态,提高了分类的精度,实现了分类速度和精度的均衡。当使用场景的计算设备算力不足,且内存紧张的情况下,为了达到尽可能高的预测精度,可以采用超声造影影像分类方法。在一种可能的实现方式中,本公开的超声造影影像分类方法可用于超声检查室等场景,这种场景下,可以就地部署塔式服务器等计算资源,医生可以在完成超声造影等检查后,快速查看模型输出结果。
近年来,利用人工智能技术处理超声造影影像是研究热点,但是更多的是采用决策树、聚类、贝叶斯分类、支持向量机、EM等传统的机器学习算法,这些算法未利用右心声学造影的动态影像,仅通过随机抽取的图像进行分类,丢失了心脏的运动信息。如果忽视运动信息容易造成分类不够准确,实际应用效果不尽人意。
图4示出根据本公开一实施例的超声造影影像分类方法的流程图。在一种可能的实现方式中,在所述分类场景为精度优先的分类场景的情况下,如图4所示,所述将所述超声造影影像输入与所述分类场景对应的神经网络,包括:
对所述超声造影影像进行造影图像抽取;
将所述造影图像输入第一图像分支神经网络,提取所述超声造影影像的时序特征;
将所述造影图像输入第二图像分支神经网络,提取所述超声造影影像的静态特征;
对所述超声造影影像进行光流图像抽取,将所述光流图像输入光流分支神经网络,提取所述超声造影影像的运动特征;
所述根据所述神经网络的输出,确定所述分类对象的至少一个状态分类结果,包括:
根据所述时序特征,确定所述分类对象的第一状态分类结果;
根据所述静态特征,确定所述分类对象的第二状态分类结果;
根据所述运动特征,确定所述分类对象的第三状态分类结果;
所述根据所述至少一个状态分类结果,确定所述分类对象的状态,包括:
根据所述第一状态分类结果、所述第二状态分类结果和所述第三状态分类结果,确定所述分类对象的状态分类结果。
本公开中对所述超声造影影像进行造影图像抽取、以及通过第一、二图像分支神经网络,提取所述超声造影影像的时序特征、静态特征的具体实现过程等可以与前述实施例相同,在此不作详细说明。
本公开中,由于需要抽取超声造影影像的运动信息,前述的数据预处理可以包括光流图像提取,即采用光流算法来抽取超声造影影像中的光流图像,将所述光流图像输入光流分支神经网络,提取所述超声造影影像的运动特征,例如微泡的形态、数量特征等。依据运动特征得到第三状态分类结果,并将得到的第三状态分类结果与根据时序特征确定的第一状态分类结果、根据静态特征确定的第二状态分类结果相结合,共同确定分类对象的状态分类结果,实现了对超声造影影像的高精度分类。本公开对光流算法不作具体限定。
当模型进行离线推理(对模型的推理速度要求不高),且对预测结果的精度要求很高时,可以采用以上模型推理结构。此时的模型预测结果是同时结合3条预测支路给出的。模型具备较高的预测精度。在一种可能的实现方式中,本公开可以用于拥有大量计算资源的机房部署场景,例如可以应用于专家会诊和影像病例复查等使用场景。
在一种可能的实现方式中,所述对所述超声造影影像进行光流图像抽取,将所述光流图像输入光流分支神经网络,提取所述超声造影影像的运动特征,包括:
从所述超声造影影像中抽取光流序列;
在所述光流序列中的对应位置抽取光流图像,所述对应位置为光流序列中与超声造影影像中抽取的造影图像相同的位置;
在所述光流序列中抽取所述光流图像的前N帧光流图像和后M帧光流图像,得到多帧光流图像;
将所述多帧光流图像输入到残差网络中,得到残差网络的全局最大池化层输出的多个特征向量;
将所述多个特征向量进行拼接,得到拼接特征;
将所述拼接特征输入到卷积网络中进行特征融合操作,得到融合特征,作为运动特征。
在一种可能的实现方式中,从所述超声造影影像中抽取光流序列,并从光流序列中抽取光流图像,由于从上述超声造影影像抽取的图片为T帧,则也要抽取光流序列中对应位置的光流图片。为刻画分类对象的运动特征,对于每张光流图像,还需要额外提取该光流图像的前N帧光流图像和后M帧光流图像。在一种可能的实现方式中,可以额外提取该光流图像的前两帧光流图片和后两帧光流图片。所以一共需要提取5T张光流图像。将这5T帧光流图像送入第三神经网络,在一种可能的实现方式中,第三神经网络为ResNeXt,取出其中ResNeXt中GAP(全局最大池化层)的输出结果。将这5T个特征向量进行拼接后,得到合并后的特征向量X。它的维度是D×5T×H×W。接着,利用3D卷积对包含有5T帧运动信息的特征向量X进行特征融合操作。得到维度为1024的影像级特征y3。最后对y3进行Softmax操作,得到第三状态分类结果。
根据本公开实施例的超声造影影像分类方法,通过抽取到的超声造影影像中的运动特征得到第三状态分类结果,更加适用于超声造影影像的特征提取和分类,使超声造影影像的分类结果更加准确、精度更高。
在一种可能的实现方式中,所述从所述超声造影影像中抽取光流序列,包括:
使用Farneback算法从所述超声造影影像中抽取光流序列。
本公开中的超声造影影像可以是观察右心室和右心房中产生的气泡的影像,由于超声造影影像质量不高、伪影严重,一般的光流算法很难精细地刻画出这些气泡的数量和位置变化,即大部分光流算法都难以提取影像的光流信息、有效刻画影像运动信息,例如气泡的数量和位置变化等。理论上来讲,Farneback算法在计算运动点的Manitude(模值)和Orientation(方向)上更为准确和鲁棒,这使得它在“检测异常”方面极为敏感。由于心内分流的有无即可以看做是对心腔环境的异常检测,在一种可能的实现方式中,本公开使用Farneback算法从所述超声造影影像中抽取光流序列,计算光流在水平和竖直方向的运动信息。在本公开中,使用Farneback算法从所述超声造影影像中抽取光流序列,一方面,由于Farneback算法的稳定性和鲁棒性好,可以很明显的看到左心室的位置,对于原本不明显的气泡运动,Farneback算法还可以放大这些气泡的运动细节;另一方面,Farneback算法的时间复杂度较低,可以快速完成光流计算。
应用场景示例
目前公认的右心声学造影诊断依据为:观察静息状态以及瓦氏动作停止后3-6个心动周期内左心内有无微泡显影并记录显影微泡的量。通常,医生会肉眼观察左心腔出现微泡的时刻和微泡的最大数量来确定患者是否存在右向左分流。这就容易受到速度量程和医生主观经验的影响,从而高估或低估实际疾病的严重程度,甚至造成误诊。由于经胸右心声学造影在图像采集、测量、分析、判断等方面存在明显的个体差异,受到医务工作者的经验和能力影响比较大,使得检验准确性和一致性难以保证;另外,国际上对于右心声学造影影像的疾病分级,也尚未形成明确的共识,这些因素常常给临床识别带来极大困难。
本公开实施例提出了一种经胸右心声学造影影像分类方法,这一处理方法可以通过经胸右心声学造影影像的至少一个状态分类结果来确定右心室的状态,该超声造影影像分类的过程可以为:
该经胸右心声学造影的分类过程可以大致分为四个步骤。
第一步,获取包括右心室的超声造影影像和分类场景,所述分类场景用于指示对分类的速度和/或精度的要求,所述经胸右心声学造影影像分类方法的分类场景分为三类:速度优先、速度和精度均衡以及精度优先。
第二步,对获取的经胸右心声学造影影像进行数据预处理,所述数据预处理包括自适应帧采样提取造影图像,当分类场景为精度优先时,所述数据预处理还包括光流图像提取。
第三步,将提取的造影图像和/或光流图像输入训练好的神经网络,该神经网络有3个子网络:第一、二和三子神经网络,分别用于提取造影影像的时序特征、静态特征和运动特征。当分类场景为速度优先时,将提取的造影图像输入第一子神经网络,得到与时序特征对应的第一状态分类结果;当分类场景为速度和精度均衡时,将提取的造影图像输入第一、二子神经网络,得到与时序特征、静态特征分别对应的第一状态分类结果、第二状态分类结果;当分类场景为精度优先时,提取的造影图像输入第一、二子神经网络和将提取的光流图像输入第三子神经网络,得到与时序特征、静态特征、运动特征分别对应的第一状态分类结果、第二状态分类、第三状态分类结果;第一状态分类结果、第二状态分类、第三状态分类结果为卵圆孔未闭(PFO)、房间隔缺损、完全性肺静脉畸形引流、永存左上腔静脉、肺动静脉瘘、动脉导管未闭、复杂心血管畸形和正常等8种状态中的一种;
第四步,根据所述至少一个状态分类结果,确定右心室的状态。具体为:在当分类场景为速度优先时,根据第一状态分类结果确定右心室的状态;当分类场景为速度和精度均衡时,根据第一状态分类结果、第二状态分类结果确定右心室的状态;当分类场景为精度优先时,根据第一状态分类结果、第二状态分类、第三状态分类结果确定右心室的状态。
进一步地,第三步中用于确定右心室的至少一个状态分类结果的神经网络,其训练过程可以为:
首先准备训练影像,训练影像可以与经胸右心声学造影影像的形式相同,将训练影像进行标注,标签为:卵圆孔未闭(PFO)、房间隔缺损、完全性肺静脉畸形引流、永存左上腔静脉、肺动静脉瘘、动脉导管未闭、复杂心血管畸形和正常等8种状态类别。
然后,将训练影像进行数据预处理,包括:
自适应帧采样:将所有影像的帧率调整为20fps,提取经胸右心声学造影影像的造影图像;
数据分组:将帧率调整后的影像,分成训练集、验证集和测试集。比例为64:16:20;
数据扩增:对训练集中少数类别数据进行数据扩增,使得所有类别的影像数量大致保持相同。扩增方法为颜色通道的随机组合;
光流提取:采用Farneback算法提取经胸右心声学造影影像的光流图像,该光流图像为从上述超声造影影像抽取的图片在光流序列中对应位置的光流图片,以及每个对应位置的前2帧光流图像和后2帧光流图像。
最后,将预处理完成后得到的含有标签的造影图像和光流图像数据输入神经网络中进行训练,则可以得到训练好的神经网络。在一个示例中,神经网络可以将ResNeXt神经网络作为基础模型,通过MSE作为损失函数进行多标签训练,从而得到最终的训练结果。模型训练过程中计算损失函数,需要同时计算这三部分的损失函数。最终的损失函数为这三部分损失函数的代数和。
通过上述过程,根据不同的分类场景,对经胸右心声学影像进行右心室的状态分类,实用性强、一致性高,解决了超声造影分析对使用场景要求高、适应性差的问题,在进行状态分类时,通过至少一个状态分类结果来确定分类对象的状态,提高了对分类对象的状态识别的准确度,满足了医疗系统的临床需求,减轻了医务人员的工作负担。
需要说明的是,本公开实施例的超声造影影像分类方法不限于应用在上述经胸右心声学影像的分类中,可以应用于任意的超声造影影像分类,本公开对此不作限定。
可以理解,本公开提及的上述各个方法实施例,在不违背原理逻辑的情况下,均可以彼此相互结合形成结合后的实施例,限于篇幅,本公开不再赘述。本领域技术人员可以理解,在具体实施方式的上述方法中,各步骤的具体执行顺序应当以其功能和可能的内在逻辑确定。
此外,本公开还提供了超声造影影像分类装置、电子设备、计算机可读存储介质、程序,上述均可用来实现本公开提供的任一种超声造影影像分类方法,相应技术方案和描述可参见方法部分的相应记载,不再赘述。
图5示出根据本公开实施例的超声造影影像分类装置的框图。该超声造影影像分类装置可以为终端设备、服务器或者其他处理设备等。其中,终端设备可以为用户设备(User Equipment,UE)、移动设备、用户终端、终端、蜂窝电话、无绳电话、个人数字处理(Personal Digital Assistant,PDA)、手持设备、计算设备、车载设备、可穿戴设备等。
在一些可能的实现方式中,该超声造影影像分类装置可以通过处理器调用存储器中存储的计算机可读指令的方式来实现。
如图5所示,所述超声造影影像分类装置50可以包括:
数据获取模块51,用于获取包含分类对象的超声造影影像和分类场景,所述分类场景用于指示对分类的速度和/或精度的要求;
状态分类模块52,用于根据所述分类场景,对所述超声造影影像进行分类对象的状态分类,确定所述分类对象的至少一个状态分类结果,所述状态分类结果包括:正常状态或非正常状态;
状态确定模块53,用于根据所述至少一个状态分类结果,确定所述分类对象的状态。
在一种可能的实现方式中,所述状态分类模块,包括:影像输入子模块,用于将所述超声造影影像输入与所述分类场景对应的神经网络;状态分类子模块,用于根据所述神经网络的输出,确定所述分类对象的至少一个状态分类结果;其中,所述神经网络通过包含所述分类对象的训练影像进行训练,所述训练影像中的分类对象通过至少一个状态分类结果进行标注。
在一种可能的实现方式中,在所述分类场景为速度优先的分类场景的情况下,所述影像输入子模块,用于对所述超声造影影像进行造影图像抽取,将所述造影图像输入第一图像分支神经网络,提取所述超声造影影像的时序特征;所述状态分类子模块,用于根据所述时序特征,确定所述分类对象的第一状态分类结果;所述状态确定模块,用于根据所述第一状态分类结果,确定所述分类对象的状态。
在一种可能的实现方式中,在所述分类场景为速度和精度均衡的分类场景的情况下,所述影像输入子模块,用于对所述超声造影影像进行造影图像抽取,将所述造影图像输入第一图像分支神经网络,提取所述超声造影影像的时序特征,将所述造影图像输入第二图像分支神经网络,提取所述超声造影影像的静态特征;所述状态分类子模块,用于根据所述时序特征,确定所述分类对象的第一状态分类结果,根据所述静态特征,确定所述分类对象的第二状态分类结果;所述状态确定模块,用于根据所述第一状态分类结果和所述第二状态分类结果,确定所述分类对象的状态分类结果。
在一种可能的实现方式中,在所述分类场景为精度优先的分类场景的情况下,所述影像输入子模块,用于对所述超声造影影像进行造影图像抽取,将所述造影图像输入第一图像分支神经网络,提取所述超声造影影像的时序特征,将所述造影图像输入第二图像分支神经网络,提取所述超声造影影像的静态特征,对所述超声造影影像进行光流图像抽取,将所述光流图像输入光流分支神经网络,提取所述超声造影影像的运动特征;所述状态分类子模块,用于根据所述时序特征,确定所述分类对象的第一状态分类结果,根据所述静态特征,确定所述分类对象的第二状态分类结果,根据所述运动特征,确定所述分类对象的第三状态分类结果;所述状态确定模块,用于根据所述第一状态分类结果、所述第二状态分类结果和所述第三状态分类结果,确定所述分类对象的状态分类结果。
在一种可能的实现方式中,所述对所述超声造影影像进行光流图像抽取,将所述光流图像输入光流分支神经网络,提取所述超声造影影像的运动特征,包括:从所述超声造影影像中抽取光流序列;在所述光流序列中的对应位置抽取光流图像,所述对应位置为光流序列中与超声造影影像中抽取的造影图像相同的位置;在所述光流序列中抽取所述光流图像的前N帧光流图像和后M帧光流图像,得到多帧光流图像;将所述多帧光流图像输入到残差网络中,得到残差网络的全局最大池化层输出的多个特征向量;将所述多个特征向量进行拼接,得到拼接特征;将所述拼接特征输入到卷积网络中进行特征融合操作,得到融合特征,作为运动特征。
在一种可能的实现方式中,所述从所述超声造影影像中抽取光流序列,包括:使用Farneback算法从所述超声造影影像中抽取光流序列。
在一些实施例中,本公开实施例提供的装置具有的功能或包含的模块可以用于执行上文方法实施例描述的方法,其具体实现可以参照上文方法实施例的描述,为了简洁,这里不再赘述。
本公开实施例还提出一种计算机可读存储介质,其上存储有计算机程序指令,所述计算机程序指令被处理器执行时实现上述方法。计算机可读存储介质可以是易失性或非易失性计算机可读存储介质。
本公开实施例还提出一种电子设备,包括:处理器;用于存储处理器可执行指令的存储器;其中,所述处理器被配置为在执行所述存储器存储的指令时,实现上述方法。
本公开实施例还提供了一种计算机程序产品,包括计算机可读代码,或者承载有计算机可读代码的非易失性计算机可读存储介质,当所述计算机可读代码在电子设备的处理器中运行时,所述电子设备中的处理器执行上述方法。
图6是根据一示例性实施例示出的一种用于超声造影影像分类的装置800的框图。例如,装置800可以是移动电话,计算机,数字广播终端,消息收发设备,游戏控制台,平板设备,医疗设备,健身设备,个人数字助理等。
参照图6,装置800可以包括以下一个或多个组件:处理组件802,存储器804,电源组件806,多媒体组件808,音频组件810,输入/输出(I/O)接口812,传感器组件814,以及通信组件816。
处理组件802通常控制装置800的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理组件802可以包括一个或多个处理器820来执行指令,以完成上述的方法的全部或部分步骤。此外,处理组件802可以包括一个或多个模块,便于处理组件802和其他组件之间的交互。例如,处理组件802可以包括多媒体模块,以方便多媒体组件808和处理组件802之间的交互。
存储器804被配置为存储各种类型的数据以支持在装置800的操作。这些数据的示例包括用于在装置800上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图像,影像等。存储器804可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。
电源组件806为装置800的各种组件提供电力。电源组件806可以包括电源管理系统,一个或多个电源,及其他与为装置800生成、管理和分配电力相关联的组件。
多媒体组件808包括在所述装置800和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件808包括一个前置摄像头和/或后置摄像头。当装置800处于操作模式,如拍摄模式或影像模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。
音频组件810被配置为输出和/或输入音频信号。例如,音频组件810包括一个麦克风(MIC),当装置800处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器804或经由通信组件816发送。在一些实施例中,音频组件810还包括一个扬声器,用于输出音频信号。
I/O接口812为处理组件802和外围接口模块之间提供接口,上述外围接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。
传感器组件814包括一个或多个传感器,用于为装置800提供各个方面的状态评估。例如,传感器组件814可以检测到装置800的打开/关闭状态,组件的相对定位,例如所述组件为装置800的显示器和小键盘,传感器组件814还可以检测装置800或装置800一个组件的位置改变,用户与装置800接触的存在或不存在,装置800方位或加速/减速和装置800的温度变化。传感器组件814可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件814还可以包括光传感器,如CMOS或CCD图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件814还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。
通信组件816被配置为便于装置800和其他设备之间有线或无线方式的通信。装置800可以接入基于通信标准的无线网络,如WiFi,2G或3G,或它们的组合。在一个示例性实施例中,通信组件816经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,所述通信组件816还包括近场通信(NFC)模块,以促进短程通信。例如,在NFC模块可基于射频识别(RFID)技术,红外数据协会(IrDA)技术,超宽带(UWB)技术,蓝牙(BT)技术和其他技术来实现。
在示例性实施例中,装置800可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述方法。
在示例性实施例中,还提供了一种非易失性计算机可读存储介质,例如包括计算机程序指令的存储器804,上述计算机程序指令可由装置800的处理器820执行以完成上述方法。
图7是根据一示例性实施例示出的一种用于超声造影影像分类的装置1900的框图。例如,装置1900可以被提供为一服务器或终端设备。参照图7,装置1900包括处理组件1922,其进一步包括一个或多个处理器,以及由存储器1932所代表的存储器资源,用于存储可由处理组件1922的执行的指令,例如应用程序。存储器1932中存储的应用程序可以包括一个或一个以上的每一个对应于一组指令的模块。此外,处理组件1922被配置为执行指令,以执行上述方法。
装置1900还可以包括一个电源组件1926被配置为执行装置1900的电源管理,一个有线或无线网络接口1950被配置为将装置1900连接到网络,和一个输入输出(I/O)接口1958。装置1900可以操作基于存储在存储器1932的操作系统,例如Windows ServerTM,MacOS XTM,UnixTM,LinuxTM,FreeBSDTM或类似。
在示例性实施例中,还提供了一种非易失性计算机可读存储介质,例如包括计算机程序指令的存储器1932,上述计算机程序指令可由装置1900的处理组件1922执行以完成上述方法。
本公开可以是系统、方法和/或计算机程序产品。计算机程序产品可以包括计算机可读存储介质,其上载有用于使处理器实现本公开的各个方面的计算机可读程序指令。
计算机可读存储介质可以是可以保持和存储由指令执行设备使用的指令的有形设备。计算机可读存储介质例如可以是――但不限于――电存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备或者上述的任意合适的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、静态随机存取存储器(SRAM)、便携式压缩盘只读存储器(CD-ROM)、数字多功能盘(DVD)、记忆棒、软盘、机械编码设备、例如其上存储有指令的打孔卡或凹槽内凸起结构、以及上述的任意合适的组合。这里所使用的计算机可读存储介质不被解释为瞬时信号本身,诸如无线电波或者其他自由传播的电磁波、通过波导或其他传输媒介传播的电磁波(例如,通过光纤电缆的光脉冲)、或者通过电线传输的电信号。
这里所描述的计算机可读程序指令可以从计算机可读存储介质下载到各个计算/处理设备,或者通过网络、例如因特网、局域网、广域网和/或无线网下载到外部计算机或外部存储设备。网络可以包括铜传输电缆、光纤传输、无线传输、路由器、防火墙、交换机、网关计算机和/或边缘服务器。每个计算/处理设备中的网络适配卡或者网络接口从网络接收计算机可读程序指令,并转发该计算机可读程序指令,以供存储在各个计算/处理设备中的计算机可读存储介质中。
用于执行本公开操作的计算机程序指令可以是汇编指令、指令集架构(ISA)指令、机器指令、机器相关指令、微代码、固件指令、状态设置数据、或者以一种或多种编程语言的任意组合编写的源代码或目标代码,所述编程语言包括面向对象的编程语言—诸如Smalltalk、C++等,以及常规的过程式编程语言—诸如“C”语言或类似的编程语言。计算机可读程序指令可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络—包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。在一些实施例中,通过利用计算机可读程序指令的状态信息来个性化定制电子电路,例如可编程逻辑电路、现场可编程门阵列(FPGA)或可编程逻辑阵列(PLA),该电子电路可以执行计算机可读程序指令,从而实现本公开的各个方面。
这里参照根据本公开实施例的方法、装置(系统)和计算机程序产品的流程图和/或框图描述了本公开的各个方面。应当理解,流程图和/或框图的每个方框以及流程图和/或框图中各方框的组合,都可以由计算机可读程序指令实现。
这些计算机可读程序指令可以提供给通用计算机、专用计算机或其它可编程数据处理装置的处理器,从而生产出一种机器,使得这些指令在通过计算机或其它可编程数据处理装置的处理器执行时,产生了实现流程图和/或框图中的一个或多个方框中规定的功能/动作的装置。也可以把这些计算机可读程序指令存储在计算机可读存储介质中,这些指令使得计算机、可编程数据处理装置和/或其他设备以特定方式工作,从而,存储有指令的计算机可读介质则包括一个制造品,其包括实现流程图和/或框图中的一个或多个方框中规定的功能/动作的各个方面的指令。
也可以把计算机可读程序指令加载到计算机、其它可编程数据处理装置、或其它设备上,使得在计算机、其它可编程数据处理装置或其它设备上执行一系列操作步骤,以产生计算机实现的过程,从而使得在计算机、其它可编程数据处理装置、或其它设备上执行的指令实现流程图和/或框图中的一个或多个方框中规定的功能/动作。
附图中的流程图和框图显示了根据本公开的多个实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或指令的一部分,所述模块、程序段或指令的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
以上已经描述了本公开的各实施例,上述说明是示例性的,并非穷尽性的,并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择,旨在最好地解释各实施例的原理、实际应用或对市场中的技术改进,或者使本技术领域的其它普通技术人员能理解本文披露的各实施例。