发明内容
有鉴于此,本发明实施例提供了一种图像识别及模型训练的方法、真臼位置识别的方法及装置,以解决现有技术中无法精确识别图像中的关键位置的问题。
根据第一方面,本发明实施例提供了一种图像识别模型的训练方法,包括:获取图像数据集,所述图像数据集中包括已标记的正样本图像及未标记的负样本图像,所述正样本图像中含有用于表征目标区域的标记;将所述图像数据集输入至第一神经网络模型,进行图像分割,得到第一输出结果;基于所述第一输出结果及图像数据集,对所述第一神经网络模型进行训练,更新所述第一神经网络模型,确定图像分割模型;基于所述第一输出结果生成特征图像;将所述特征图像输入至第二神经网络模型,进行多级图像缩放处理,得到第二输出结果;基于所述第二输出结果及所述特征图像,对所述第二神经网络模型进行训练,更新所述第二神经网络模型,确定关键点识别模型;基于所述图像分割模型及关键点识别模型构建图像识别模型。
结合第一方面,在第一方面第一实施方式中,将所述图像数据集输入至第一神经网络模型,进行图像分割,得到第一输出结果,包括:将所述图像数据集输入至所述第一神经网络模型的第一图像处理子模型,对所述图像数据集中的图像数据进行图像采样处理,提取所述图像数据的图像特征;将提取图像特征后的图像数据输入至所述第一神经网络模型的第二图像处理子模型,对所述图像特征进行图像分割,识别所述图像特征的所属类别。
结合第一方面第一实施方式,在第一方面第二实施方式中,对所述图像数据集中的图像数据进行图像采样处理,提取所述图像数据的图像特征,包括:对所述图像数据进行下采样,识别所述图像数据的深层特征;对进行下采样后的图像数据进行上采样,将所述深层特征存储到所述图像数据中。
结合第一方面第一实施方式,在第一方面第三实施方式中,对所述图像特征进行图像分割,识别所述图像特征的所属类别,包括:从所述图像特征中筛选预设置信度的特征点数据,对所述特征点数据进行双线性插值计算;基于计算后的特征点数据识别图像特征的所属类别。
结合第一方面,在第一方面第四实施方式中,将所述特征图像输入至第二神经网络模型,进行多级图像缩放处理,得到第二输出结果,包括:对所述特征图像进行多级下采样,得到符合预设分辨率的第一特征图像;分别对各级下采样的第一特征图像进行上采样,得到第二特征图像;基于各级下采样的第一特征图像及各级上采样的第二特征图像生成合成特征图像;基于所述合成特征图像确定所述特征图像中关键点处于所述合成特征图像中的概率,作为所述第二输出结果。
结合第一方面或第一方面任一实施方式,在第一方面第五实施方式中,基于所述第一输出结果及图像数据集,对所述第一神经网络模型进行训练,更新所述第一神经网络模型,确定图像分割模型,包括:基于所述第一输出结果及图像数据集计算第一损失函数;基于所述第一损失函数更新所述第一神经网络模型的参数,确定所述图像分割模型。
结合第一方面或第一方面任一实施方式,在第一方面第六实施方式中,基于所述第二输出结果及所述特征图像,对所述第二神经网络模型进行训练,更新所述第二神经网络模型,确定关键点识别模型,包括:基于所述第二输出结果及所述第一输出结果计算第二损失函数;基于所述第二损失函数更新所述第二神经网络模型的参数,确定所述关键点识别模型。
根据第二方面,本发明实施例提供了一种图像识别方法,包括:获取待识别图像;对所述待识别图像进行图像分割,得到图像分割结果;对所述图像分割结果进行多级缩放处理,得到图像缩放结果;基于所述图像缩放结果识别所述待识别图像中的目标对象。
结合第二方面,在第二方面第一实施方式中,对所述待识别图像进行图像分割,得到图像分割结果,包括:将所述待识别图像输入至预设的图像分割模型,对所述待识别图像进行图像分割,得到图像分割结果;所述预设的图像分割模型是基于图像数据集训练得到的,所述图像数据集中包括已标记的正样本图像及未标记的负样本图像,所述正样本图像中含有用于表征目标区域的标记。
结合第二方面第一实施方式,在第二方面第二实施方式中,所述图像分割模型包括第一图像处理子模型及第二图像处理子模型,将所述待识别图像输入至预设的图像分割模型,对所述待识别图像进行图像分割,得到图像分割结果,包括:将所述待识别图像输入至所述图像分割模型的第一图像处理子模型,对所述待识别图像中的图像数据进行图像采样处理,提取所述图像数据的图像特征;将提取图像特征后的图像数据输入至所述图像分割模型的第二图像处理子模型,对所述图像特征进行图像分割,识别所述图像特征的所属类别。
结合第二方面第二实施方式,在第二方面第三实施方式中,对所述待识别图像中的图像数据进行图像采样处理,提取所述图像数据的图像特征,包括:对所述图像数据进行下采样,识别所述图像数据的深层特征;对进行下采样后的图像数据进行上采样,将所述深层特征存储到所述图像数据中。
结合第二方面第二实施方式,在第二方面第四实施方式中,对所述图像特征进行图像分割,识别所述图像特征的所属类别,包括:从所述图像特征中筛选预设置信度的特征点数据,对所述特征点数据进行双线性插值计算;基于计算后的特征点数据识别所属类别。
结合第二方面第一实施方式,在第二方面第五实施方式中,对所述图像分割结果进行多级缩放处理,得到图像缩放结果,包括:基于所述图像分割结果生成特征图像;将所述特征图像输入至预设的关键点识别模型,进行多级图像缩放处理,得到图像缩放结果;所述预设的关键点识别模型是基于所述图像数据集训练得到的,所述图像数据集中包括已标记的正样本图像及未标记的负样本图像,所述正样本图像中含有用于表征目标区域的标记。
结合第二方面第五实施方式,在第二方面第六实施方式中,将所述特征图像输入至预设的关键点识别模型,进行多级图像缩放处理,得到图像缩放结果,包括:对所述特征图像进行多级下采样,得到符合预设分辨率的第一特征图像;分别对各级下采样的特征图像进行上采样,得到第二特征图像;基于各级下采样的第一特征图像及各级上采样的第二特征图像生成合成特征图像;基于所述合成特征图像确定所述特征图像中关键点处于所述合成特征图像中的概率,作为所述图像缩放结果。
根据第三方面,本发明实施例提供了一种髋关节关键位置识别方法,包括:获取医学图像数据;对所述医学图像数据进行图像分割,得到包含股骨及骨盆区域的图像分割结果;对所述图像分割结果进行多级缩放处理,得到包含髋关节关键位置的图像缩放结果;基于所述图像缩放结果识别所述医学图像数据中的髋关节关键位置。
结合第三方面,在第三方面第一实施方式中,对所述医学图像数据进行图像分割,得到包含股骨及骨盆区域的图像分割结果,包括:将所述医学图像数据输入至预设的图像分割模型,对所述医学图像数据进行图像分割,得到包含股骨及骨盆区域的图像分割结果;所述预设的图像分割模型是基于医学图像数据集训练得到的,所述医学图像数据集中包括已标记的正样本图像及未标记的负样本图像,所述正样本图像中含有用于表征股骨及骨盆区域的标记。
结合第三方面第一实施方式,在第三方面第二实施方式中,对所述图像分割结果进行多级缩放处理,得到包含髋关节关键位置的图像缩放结果,包括:基于所述图像分割结果生成特征图像;将所述特征图像输入至预设的关键点识别模型,进行多级图像缩放处理,得到图像缩放结果;所述预设的关键点识别模型是基于所述图像数据集训练得到的,所述图像数据集中包括已标记的正样本图像及未标记的负样本图像,所述正样本图像中含有用于表征目标区域的标记。
根据第四方面,本发明实施例提供了一种真臼位置确定方法,包括:获取医学图像数据;对所述医学图像数据进行图像分割,基于图像分割结果确定股骨及骨盆区域;对所述图像分割结果进行多级缩放处理,基于图像缩放结果确定健侧的股骨头中心点和泪滴下缘位置;基于所述健侧的股骨头中心点和泪滴下缘位置确定真臼位置。
结合第四方面,在第四方面第一实施方式中,基于所述健侧的股骨头中心点和泪滴下缘位置确定真臼位置,包括:将所述健侧的股骨头中心点和泪滴下缘位置镜像翻转至目标区域,得到患侧的股骨头中心点镜像位置和泪滴下缘镜像位置;基于所述患侧的泪滴下缘镜像位置确定核心点位置,并计算骨盆高度;基于所述核心点位置及骨盆高度确定包含所述真臼位置的区域。
根据第五方面,本发明实施例提供了一种图像识别模型的训练装置,包括:图像获取模块,用于获取图像数据集,所述图像数据集中包括已标记的正样本图像及未标记的负样本图像,所述正样本图像中含有用于表征目标区域的标记;第一输出模块,用于将所述图像数据集输入至第一神经网络模型,进行图像分割,得到第一输出结果;图像分割模型确定模块,用于基于所述第一输出结果及图像数据集,对所述第一神经网络模型进行训练,更新所述第一神经网络模型,确定图像分割模型;特征图像生成模块,用于基于所述第一输出结果生成特征图像;第二输出模块,用于将所述特征图像输入至第二神经网络模型,进行多级图像缩放处理,得到第二输出结果;关键点识别模型确定模块,用于基于所述第二输出结果及所述特征图像,对所述第二神经网络模型进行训练,更新所述第二神经网络模型,确定关键点识别模型;图像识别模型构建模块,用于基于所述图像分割模型及关键点识别模型构建图像识别模型。
根据第六方面,本发明实施例提供了一种图像识别装置,包括:图像获取模块,用于获取待识别图像;图像分割结果生成模块,用于对所述待识别图像进行图像分割,得到图像分割结果;图像缩放结果生成模块,用于对所述图像分割结果进行多级缩放处理,得到图像缩放结果;目标对象识别模块,用于基于所述图像缩放结果识别所述待识别图像中的目标对象。
根据第七方面,本发明实施例提供了一种髋关节关键位置识别装置,包括:医学图像数据获取模块,用于获取医学图像数据;图像分割结果生成模块,用于对所述医学图像数据进行图像分割,得到包含股骨及骨盆区域的图像分割结果;图像缩放结果生成模块,用于对所述图像分割结果进行多级缩放处理,得到包含髋关节关键位置的图像缩放结果;髋关节关键位置识别模块,用于基于所述图像缩放结果识别所述医学图像数据中的髋关节关键位置。
根据第八方面,本发明实施例提供了一种真臼位置确定装置,包括:医学图像数据获取模块,用于获取医学图像数据;股骨及骨盆区域确定模块,用于对所述医学图像数据进行图像分割,基于图像分割结果确定股骨及骨盆区域;髋关节关键位置识别模块,用于对所述图像分割结果进行多级缩放处理,基于图像缩放结果确定健侧的股骨头中心点和泪滴下缘位置;真臼位置确定模块,用于基于所述健侧的股骨头中心点和泪滴下缘位置确定真臼位置。
根据第九方面,本发明实施例提供了一种计算机设备包括:存储器和处理器,所述存储器和所述处理器之间互相通信连接,所述存储器中存储有计算机指令,所述处理器通过执行所述计算机指令,从而执行第一方面或者第一方面的任意一种实施方式中所述的图像识别模型的训练方法,或,执行第二方面或者第二方面的任意一种实施方式中所述的图像识别方法,或,执行第三方面或者第三方面的任意一种实施方式中所述的髋关节关键位置识别方法,或,执行第四方面或者第四方面的任意一种实施方式中所述的真臼位置确定方法。
根据第四方面,本发明实施例提供了一种计算机可读存储介质,所述计算机可读存储介质存储计算机指令,所述计算机指令用于使所述计算机执行第一方面或者第一方面的任意一种实施方式中所述的图像识别模型的训练方法,或,执行第二方面或者第二方面的任意一种实施方式中所述的图像识别方法,或,执行第三方面或者第三方面的任意一种实施方式中所述的髋关节关键位置识别方法,或,执行第四方面或者第四方面的任意一种实施方式中所述的真臼位置确定方法。
本发明实施例的有益效果在于:通过本实施例的图像识别及模型训练的方法、真臼位置识别的方法及装置,通过获取医学图像数据;对所述医学图像数据进行图像分割,基于图像分割结果确定股骨及骨盆区域;对所述图像分割结果进行多级缩放处理,基于图像缩放结果确定健侧的股骨头中心点和泪滴下缘位置;基于所述健侧的股骨头中心点和泪滴下缘位置确定真臼位置。本申请可以快速排除DDH发育性髋关节脱位的假臼干扰,快速识别真臼位置,方便术者将髋臼杯假体安放在真臼位置,提高术前规划效率。
针对待识别图像进行图像分割,从而提取该待识别图像的图像特征,从而能够更加准确地识别该图像中的目标区域;然后,基于图像分割的结果及目标区域,对图像做多级缩放处理,通过将图像分割结果缩放至预设分别率,从而基于目标区域识别该图像中的目标对象。通过上述过程,对于待识别图像的分割以及缩放,能够更加快速、准确地从中提取目标区域及目标对象的特征,从而得到更加准确的图像识别结果。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
发育性髋关节脱位(Developmental Dysplasia of the Hip,DDH),是由于遗传、臀位产等因素造成股骨头与髋臼对位不良的一种疾病,在医学上以往称为“先天性髋关节发育不良。对于DDH患者,行人工全髋关节置换技术要求高,尤其是CROWE分型III、IV型高位脱位患者,因其骨盆及髋臼畸形、软组织挛缩、肌肉发育不良、骨量储备异常,对此类患者行人工全髋关节置换术时需将髋臼杯植入真臼内,以纠正患者骨骼形态异常的问题,从而进一步增加了手术困难,影响髋臼杯假体远期生存率。因此,如何能够准确地对手术过程中各个位置进行识别、确认是亟待解决的问题。而针对该问题,确定手术过程的位置,也是针对关节位置的图像进行识别而获取的,也就是说,在本实施例中,为了解决上述问题,主要是如何能够实现更加快速、精准地从图像中识别目标位置、目标对象。从而实现可以快速排除DDH发育性髋关节发育异常的假臼干扰,快速识别真臼位置,方便术者将髋臼杯假体安放在真臼位置,提高术前规划效率。
为此,本实施例提供了一种图像识别方法,可用于电子设备,如电脑、手机、平板电脑等,如图1所示,该图像识别方法主要包括:
步骤S11:获取待识别图像。在本实施例中,所针对的识别对象一般是图像数据,该图像数据可以是通过一般的图像采集设备所获取的,例如是摄像机、照相机、手机、平板电脑等,此外,针对不同领域,也可以是较为专业的图像采集设备,例如是X射线投影设备、CT投影设备等,本发明并不以此为限。
步骤S12:对待识别图像进行图像分割,得到图像分割结果。在本实施例中,针对待识别图像进行的识别过程,是为了实现能够更加快速、精确地识别图像中的目标区域或目标位置,因此,在本实施例中,提出了对图像进行两个主要的处理过程,从而提高识别效果。首先,则是对待识别图像进行图像分割,从而得到图像分割结果,通过该图像分割过程,能够对待识别图像中的目标区域进行准确地识别。
在本实施例中,该目标区域可以是在识别之前,提前设定好的区域,也可以是结合大量的图像数据,通过标记要识别的区域,通过反复学习、训练等过程,以特征的形式所表征的要识别的区域,本发明并不以此为限。
步骤S13:对图像分割结果进行多级缩放处理,得到图像缩放结果。在通过图像分割处理识别到图像中的目标区域后,对图像分割结果做进一步的缩放处理,并且是逐次、逐级地进行缩放处理,直到缩放到预设的分辨率的图像,从而能够实现在目标区域中识别出目标对象。
步骤S14:基于图像缩放结果识别待识别图像中的目标对象。在本实施例中,该目标对象可以是指待识别图像中的人、物,或者是待识别图像中具有某些特定特征的部分等,本发明并不以此为限。通过上述步骤,在识别了待识别图像中的目标区域后,基于该目标区域,通过缩放处理,突出待识别图像中的目标对象的位置,从而实现准确地识别目标对象。
通过本实施例的图像识别方法,针对待识别图像进行图像分割,从而提取该待识别图像的图像特征,从而能够更加准确地识别该图像中的目标区域;然后,基于图像分割的结果及目标区域,对图像做多级缩放处理,通过将图像分割结果缩放至预设分别率,从而基于目标区域识别该图像中的目标对象。通过上述过程,对于待识别图像的分割以及缩放,能够更加快速、准确地从中提取目标区域及目标对象的特征,从而得到更加准确的图像识别结果。
本实施例提供了一种图像识别方法,可用于电子设备,如电脑、手机、平板电脑等。在本实施例中,以图像识别模型对待识别图像进行处理为例进行说明,如图2所示,该图像识别方法主要包括:
步骤S21:获取待识别图像。
详细内容请参见图1所示实施例的S11的描述,在此不再赘述。
步骤S22:对待识别图像进行图像分割,得到图像分割结果。
具体地,该步骤S22可以包括:
将待识别图像输入至预设的图像分割模型,对待识别图像进行图像分割,得到图像分割结果。
其中,该预设的图像分割模型可以是基于图像数据集训练得到的,图像数据集中包括已标记的正样本图像及未标记的负样本图像,正样本图像中含有用于表征目标区域的标记。
相应地,在图像分割模型的训练过程中,利用图像数据集作为图像分割模型的输入进行。其中,关于图像分割模型的具体训练过程将在下文的图像分割模型的训练方法实施例中做详细描述。
步骤S23:对图像分割结果进行多级缩放处理,得到图像缩放结果。
详细内容请参见图1所示实施例的S13的描述,在此不再赘述。
步骤S24:基于图像缩放结果识别待识别图像中的目标对象。
详细内容请参见图1所示实施例的S14的描述,在此不再赘述。
本实施例的图像识别方法,利用深度学习的方法进行待识别图像的处理,由于基于深度学习的图像分割模型具有自学习的能力,通过该图像分割模型学习到的图像中的目标区域、目标对象对待识别图像进行识别处理,能够进一步提高识别的准确度。
在本实施例的一些可选实施方式中,该图像分割模型包括第一图像处理子模型及第二图像处理子模型,将图像数据集输入至预设的图像分割模型,对待识别图像进行图像分割,得到图像分割结果,包括:
步骤S221:将待识别图像输入至图像分割模型的第一图像处理子模型,对待识别图像中的图像数据进行图像采样处理,提取图像数据的图像特征;
步骤S222:将提取图像特征后的图像数据输入至图像分割模型的第二图像处理子模型,对图像特征进行图像分割,识别图像特征的所属类别。
在本实施例的一些可选实施方式中,该第一图像处理子模型是用以对待识别图像进行粗分割的神经网络模型,例如unet网络等,本发明不以此为限。
相应地,步骤S221中,基于该第一图像处理子模型对待识别图像进行采样处理,提取图像数据的图像特征的过程,包括:
对图像数据进行下采样,识别图像数据的深层特征;
对进行下采样后的图像数据进行上采样,将深层特征存储到图像数据中。
在本实施例的一些可选实施方式中,该第二图像处理子模型是用以对待识别图像进行细分割的神经网络模型,例如pointrend网络等,本发明并不以此为限。
相应地,步骤S222中,基于该第二图像处理子模型对待识别图像的图像特征进行图像分割,识别图像特征的所属类别的过程,包括:
从图像特征中筛选预设置信度的特征点数据,对特征点数据进行双线性插值计算;
基于计算后的特征点数据识别所属类别。
在本实施例中,通过设定的两个图像处理子模型,分别对待识别图像进行粗分割以及细分割处理,分成两个不同的分割处理过程的原因在于,通过粗分割过程,提取该待识别图像的图像特征,通过细分割过程,从图像特征中进行响度点多额是被,从而根据像素点的特征来对图像中的内容进行类别的识别,从而能够依据整体过程提高对待识别图像的分割的精确度。
本实施例提供了一种图像识别方法,可用于电子设备,如电脑、手机、平板电脑等。在本实施例中,以图像识别模型对待识别图像进行处理为例进行说明,如图3所示,该图像识别方法主要包括:
步骤S31:获取待识别图像。
详细内容请参见图1所示实施例的S11的描述,在此不再赘述。
步骤S32:对待识别图像进行图像分割,得到图像分割结果。
详细内容请参见图1所示实施例的S12,或参见图2所示的实施例的S22的描述,在此不再赘述。
步骤S33:对图像分割结果进行多级缩放处理,得到图像缩放结果。
具体地,该步骤S33可以包括:
基于图像分割结果生成特征图像;
将待识别图像输入至预设的关键点识别模型,进行多级图像缩放处理,得到图像缩放结果。
其中,该预设的关键点识别模型可以是基于图像数据集训练得到的,图像数据集中包括已标记的正样本图像及未标记的负样本图像,正样本图像中含有用于表征目标区域的标记。
相应地,在关键点识别模型的训练过程中,利用图像数据集作为关键点识别模型的输入进行。其中,关于关键点识别模型的具体训练过程将在下文的关键点识别模型的训练方法实施例中做详细描述。
步骤S34:基于图像缩放结果识别待识别图像中的目标对象。
详细内容请参见图1所示实施例的S14的描述,在此不再赘述。
本实施例的图像识别方法,利用深度学习的方法进行待识别图像的处理,由于基于深度学习的关键点识别模型具有自学习的能力,通过该关键点识别模型学习到的图像中的目标对象对待识别图像进行识别处理,能够进一步提高识别的准确度。
在本实施例的一些可选实施方式中,该关键点识别模型是用以对待识别图像进行关键点识别的神经网络模型,例如hourglass网络等,本发明并不以此为限。
相应地,上述步骤S33中,将特征图像输入至预设的关键点识别模型,进行多级图像缩放处理,得到图像缩放结果的过程,主要包括:
步骤S331:对特征图像进行多级下采样,得到符合预设分辨率的第一特征图像;在本实施例中,该预设分别率可以是根据实际应用场景的需要所设置的最低分辨率;
步骤S332:分别对各级下采样的特征图像进行上采样,得到第二特征图像;
步骤S333:基于各级下采样的第一特征图像及各级上采样的第二特征图像生成合成特征图像;在进行各级下采样及上采样的过程中,对于各级采样得到的不同尺度的特征,进行结合,从而得到该特征图像;
步骤S334:基于合成特征图像确定特征图像中关键点处于合成特征图像中的概率,作为图像缩放结果。
在本实施例中,所采用的关键点识别模型,在对图像进行多级采样处理的过程中,针对各级采样时提取的图像特征,进行整合处理,由于考虑了各个尺度的图像特征,所以整体的图像处理的过程运行速度更快,使得针对该关键点识别模型的训练过程更快,能够更加迅速的完成针对该图像的关键点的识别过程。
本实施例提供了一种髋关节关键位置识别方法,可应用于电子设备,如电脑、手机、平板电脑等,也可应用在具体的领域,例如是医学领域等。在本实施例中,以图像识别模型对待识别图像进行处理为例进行说明,如图4所示,该髋关节关键位置识别方法主要包括:
步骤S41:获取医学图像数据;在本实施例中,该医学图像数据可以例如是通过X射线投影设备、CT投影设备等采集的图像数据,本发明并不以此为限。此步骤获取医学图像数据的具体过程请参见图1所示实施例的S11的描述,在此不再赘述。
步骤S42:对医学图像数据进行图像分割,得到包含股骨及骨盆区域的图像分割结果;在本实施例中,所针对的目标区域为髋关节关节位置,具体地,可以是股骨及骨盆区域。以股骨及骨盆区域为例,该步骤的详细内容请参见图1所示实施例的S12的描述或图2所示实施例的S22的描述或图3所示实施例的步骤S32的描述,在此不再赘述。
步骤S43:对图像分割结果进行多级缩放处理,得到包含髋关节关键位置的图像缩放结果;
详细内容请参见图1所示实施例的S13的描述或图2所示实施例的S23的描述或图3所示实施例的步骤S33的描述,在此不再赘述。
步骤S44:基于图像缩放结果识别医学图像数据中的髋关节关键位置。
详细内容请参见图1所示实施例的S14的描述或图2所示实施例的S24的描述或图3所示实施例的步骤S34的描述,在此不再赘述。
通过本实施例的髋关节关键位置识别方法,针对医学图像数据进行图像分割,从而提取该医学图像数据的图像特征,从而能够更加准确地识别该图像中的股骨及骨盆区域;然后,基于图像分割的结果及股骨及骨盆区域,对图像做多级缩放处理,通过将图像分割结果缩放至预设分别率,从而基于目标区域(例如,股骨及骨盆区域)识别该图像中的目标对象(在本实施例中,是指股骨头中心点和泪滴下缘位置)。通过上述过程,对于医学图像数据的分割以及缩放,能够更加快速、准确地从中提取目标区域及目标对象的特征,从而得到更加准确的图像识别结果。
在本实施例的一些可选实施方式中,上述步骤S42中,对医学图像数据进行图像分割,得到包含股骨及骨盆区域的图像分割结果的过程,可以是通过图像分割模型进行处理实现的,主要包括:
将医学图像数据输入至预设的图像分割模型,对医学图像数据进行图像分割,得到包含股骨及骨盆区域的图像分割结果;预设的图像分割模型是基于医学图像数据集训练得到的,医学图像数据集中包括已标记的正样本图像及未标记的负样本图像,正样本图像中含有用于表征股骨及骨盆区域的标记。
详细内容请参见图2所示实施例的S22的描述,在此不再赘述。
在本实施例中,通过设定的两个图像处理子模型,分别对待识别图像进行粗分割以及细分割处理,分成两个不同的分割处理过程的原因在于,通过粗分割过程,提取该待识别图像的图像特征,通过细分割过程,从图像特征中进行响度点多额是被,从而根据像素点的特征来对图像中的内容进行类别的识别,从而能够依据整体过程提高对待识别图像的分割的精确度。
在本实施例的一些可选实施方式中,上述步骤S43中,对图像分割结果进行多级缩放处理,得到包含髋关节关键位置的图像缩放结果的过程,可以是通过关键点识别模型进行处理实现的,主要包括:
基于图像分割结果生成特征图像;
将特征图像输入至预设的关键点识别模型,进行多级图像缩放处理,得到图像缩放结果;预设的关键点识别模型是基于图像数据集训练得到的,图像数据集中包括已标记的正样本图像及未标记的负样本图像,正样本图像中含有用于表征目标区域的标记。
详细内容请参见图3所示实施例的S33的描述,在此不再赘述。
在本实施例中,所采用的关键点识别模型,在对图像进行多级采样处理的过程中,针对各级采样时提取的图像特征,进行整合处理,由于考虑了各个尺度的图像特征,所以整体的图像处理的过程运行速度更快,使得针对该关键点识别模型的训练过程更快,能够更加迅速的完成针对该图像的关键点的识别过程。
本实施例提供了一种真臼位置识别方法,可应用于电子设备,如电脑、手机、平板电脑等,也可应用在具体的领域,例如是医学领域等。如图5A所示,该真臼位置识别方法包括:
步骤S51:获取医学图像数据;
详细内容请参见图4所示实施例的S41的描述,在此不再赘述。
步骤S52:对医学图像数据进行图像分割,基于图像分割结果确定股骨及骨盆区域;
请参见图4所示实施例的S42的描述,在此不再赘述。
步骤S53:对图像分割结果进行多级缩放处理,基于图像缩放结果确定健侧的股骨头中心点和泪滴下缘位置;在本实施例中,所针对的目标对象为健侧的股骨头中心点和泪滴下缘位置。以股骨头中心点和泪滴下缘位置为例,该步骤的详细内容请参见图4所示实施例的S43的描述,在此不再赘述。
步骤S54:基于健侧的股骨头中心点和泪滴下缘位置确定真臼位置。
在本实施例中,通过步骤S51-S53确定了髋关节的关键位置(例如是股骨头中心点和泪滴下缘位置)的具体位置后,则可依据该具体位置来确定真臼位置。
在本实施例的一些可选实施方式中,该真臼位置识别方法是具体应用于髋关节手术的术前规划场景中。髋关节手术主要是针对患者的病患侧的髋臼位置进行手术,而在实际应用中,由于病患侧的髋臼位置受到长期磨损等影响,无法准确确定患者的实际髋臼位置(也就是真臼位置)。因此,在本实施例中,是针对此种情况,先根据患者健康侧的髋臼位置来确定患者的病患侧的真臼位置。
因此,在本实施例中,基于健侧的股骨头中心点和泪滴下缘位置确定真臼位置的过程,主要包括:
首先,将健侧的股骨头中心点和泪滴下缘位置镜像翻转至目标区域,得到患侧的股骨头中心点镜像位置和泪滴下缘镜像位置;在本实施例中,由于是基于健康侧的髋臼位置来确定病患侧的髋臼位置,因此,通过上述方法所识别的股骨头中心点和泪滴下缘位置实际是健康侧的股骨头中心点和泪滴下缘位置,因此,首先将股骨头中心点和泪滴下缘位置镜像翻转至目标区域,此处的目标区域则是指患者的骨盆区域的病患侧。
如图5B所示,基于患侧的泪滴下缘镜像位置确定核心点位置,并计算骨盆高度;以泪滴下缘镜像位置做一条水平线,距离泪滴最低点往骨盆外的方向一定距离(例如是5mm)的设置一个核心点M,并计算整个骨盆的高度H:在图像中确定骨盆开始的层面b和骨盆结束的层面f,则对应地,计算出骨盆的高度H,H=f-b;
基于核心点位置及骨盆高度确定包含真臼位置的区域。从M点开始向上(朝向骨盆中泪滴位置的方向)做一条垂线L1,这条线的长度可以为骨盆高度H的20%,然后继续向骨盆外(远离泪滴位置的方向)做一条水平线L2,L2的长度也可以为骨盆高度H的20%,则此时可确定,病患侧的真臼位置就在L1和L2所包围的区域内。
本实施例的真臼位置识别方法,在前述实施例的图像识别方法、髋关节关键位置识别方法的基础上,首先确定髋关节健康侧的髋臼位置,然后基于健康侧的髋臼位置,镜像确定病患侧的真臼位置,整个识别过程中,可采用深度学习为基础,基于医学图像数据进行识别,既提高了识别效率,也提高了识别精度,为后续进行髋关节相关手术提供了更加精确的技术支持。
根据本发明实施例,提供了一种图像识别模型的训练方法实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
本实施例提供了一种图像识别模型的训练方法,可用于电子设备,如电脑、手机、平板电脑等,如图6A所示,该训练方法主要包括:
步骤S61:获取图像数据集,图像数据集中包括已标记的正样本图像及未标记的负样本图像,正样本图像中含有用于表征目标区域的标记;在本实施例中,该图像数据集可以是通过一般的图像采集设备所采集的,例如是摄像机、手机、平板电脑等;或者,也可以是通过相对专业的图像采集设备所采集的,例如是医学领域常用的X射线投影设备、CT投影设备等,本发明不以此为限。
在实际应用中,该图像数据集可以使CT医学图像数据集,在正样本图像中,则是标注股骨及骨盆区域,从而作为训练神经网络模型的数据库。并且可将该数据库中的图像数据集按照一定比例(例如是7:3)划分为训练集、测试集。将采集的二维横断面DICOM数据转换为JPG格式的图片,将标注文件转换成png格式的图片,保存后作为神经网络模型的输入。
步骤S62:将图像数据集输入至第一神经网络模型,进行图像分割,得到第一输出结果;
在本实施例的一些可选实施方式中,该第一神经网络模型是用以对图像进行分割的神经网络模型,其可以是由第一图像处理子模型及第二图像处理子模型组成。
相应地,将图像数据集输入至第一神经网络模型,进行图像分割,得到第一输出结果的过程,包括:
步骤S621:将图像数据集输入至图像分割模型的第一图像处理子模型,对图像数据集中的图像数据进行图像采样处理,提取图像数据的图像特征;
步骤S622:将提取图像特征后的图像数据输入至图像分割模型的第二图像处理子模型,对图像特征进行图像分割,识别图像特征的所属类别。
在本实施例的一些可选实施方式中,该第一图像处理子模型是用以对待识别图像进行粗分割的神经网络模型,例如unet网络等,本发明不以此为限。
相应地,步骤S621中,基于该第一图像处理子模型对待识别图像进行采样处理,提取图像数据的图像特征的过程,包括:
对图像数据进行下采样,识别图像数据的深层特征;
对进行下采样后的图像数据进行上采样,将深层特征存储到图像数据中。
实际应用中,以第一图像处理子模型为unet网络为例进行说明。
如图6B所示,首先利用unet网络作为主干网络,对图像数据集中的图像数据进行粗分割,第一阶段使用4次下采样,学习图像的深层特征,然后进行4次上采样以将特征图重新存储到图像中。其中,每个下采样层中包括2个卷积层和1个池化层,卷积核大小为3*3,池化层中的卷积核大小为2*2,每个卷积层中的卷积核的个数为128,256,512;每个上采样层中包括1个上采样层和2个卷积层,其中卷积层的卷积核大小为3*2,上采样层中的卷积核大小为2*2,每个上采样层中的卷积核个数为512,256,128。最后一次上采样结束后设有dropout层,droupout率设置为0.7,通过该dropout层减少中间特征的数量,从而避免不必要的冗余。所有的卷积层后面都设有激活函数为relu函数,从而增加神经网络各层之间的非线性关系,从而能够更加准确地表示每次采样提取的图像特征之间的关联关系。
在本实施例的一些可选实施方式中,该第二图像处理子模型是用以对待识别图像进行细分割的神经网络模型,例如pointrend网络等,本发明并不以此为限。
相应地,步骤S622中,基于该第二图像处理子模型对待识别图像的图像特征进行图像分割,识别图像特征的所属类别的过程,包括:
从图像特征中筛选预设置信度的特征点数据,对特征点数据进行双线性插值计算;
基于计算后的特征点数据识别所属类别。
实际应用中,以第二图像处理子模型为pointrend网络为例进行说明。
如图6B所示,在通过unet网络对图像数据进行粗分割处理后,使用pointrend精确分割结果,选择一组预设置信度(例如可以为0.5)的特征点,提取被选择出来的点的特征,这些点的特征通过双线性插值Bilinear计算,使用分类器去判断这个点属于哪个类别。这个过程可以等价于用一个1*1的卷积来预测,但是对于置信度接近于1或者0的点并不计算。通过这样的过程,能够提高分割的精准度。
步骤S63:基于第一输出结果及图像数据集,对第一神经网络模型进行训练,更新第一神经网络模型,确定图像分割模型。
在上述的模型训练过程中,可设置参数为:数据标签的背景像素值可设置为0,股骨为1,骨盆为2,训练的batch_size为6,学习率设置为1e-4,优化器使用Adam优化器,使用的损失函数为DICE loss,将训练集输入第一神经网络进行训练,根据训练过程中损失函数的变化,调整训练批次的大小,最终得到各个部分的粗分割结果。进入pointrend网络后,先使用双线性插值上采样前一步分割预测结果,然后在这个更密集的特征图中选择N个最不确定的点,比如概率接近0.5的点。然后计算这N个点的特征表示,并且预测它们的labels。对于每个选定点的逐点特征表示,使用简单的多层感知器进行逐点预测,在本实施例中,也可以使用Unet粗分割任务中的损失函数来训练。
步骤S64:基于第一输出结果生成特征图像。本实施例中,通过第一神经网络模型输出的第一输出结果,将其重建为正投影图像作为其对应的特征图像。
步骤S65:将特征图像输入至第二神经网络模型,进行多级图像缩放处理,得到第二输出结果。
在本实施例的一些可选实施方式中,该关键点识别模型是用以对待识别图像进行关键点识别的神经网络模型,例如hourglass网络等,本发明并不以此为限。
相应地,上述步骤S65中,将特征图像输入至预设的关键点识别模型,进行多级图像缩放处理,得到图像缩放结果的过程,主要包括:
步骤S651:对特征图像进行多级下采样,得到符合预设分辨率的第一特征图像;在本实施例中,该预设分别率可以是根据实际应用场景的需要所设置的最低分辨率;
步骤S652:分别对各级下采样的特征图像进行上采样,得到第二特征图像;
步骤S653:基于各级下采样的第一特征图像及各级上采样的第二特征图像生成合成特征图像;在进行各级下采样及上采样的过程中,对于各级采样得到的不同尺度的特征,进行结合,从而得到该特征图像;
步骤S654:基于合成特征图像确定特征图像中关键点处于合成特征图像中的概率,作为图像缩放结果。
实际应用中,以第二神经网络模型为hourglass网络为例进行说明。
如图6B所示,首先,hourglass网络的Conv层和Max Pooling层用于将特征图像缩放到预设标准的分辨率,每一个下采样处,hourglass网络同时保存原始尺寸的特征图像,并对原来的pre-pooled分辨率的特征进行卷积,得到最低分辨率特征后,网络开始进行upsampling(上采样),并逐渐结合不同尺度的特征信息。本实施例中,对较低分辨率的特征图像的上采样采用的是最近邻上采样(nearest neighbor upsampling)方式,将两个不同的特征集进行逐元素相加。
由于整个hourglass网络结构是对称的,获取低分辨率特征过程中每有一个网络层,则在上采样的过程中相应的就会有一个对应网络层,得到hourglass网络模块的输出后,再采用两个连续的1*1Conv层进行处理,得到最终的网络输出,并输出为heatmaps的集合,每一个heatmap则表征了关键点在每个像素点存在的概率。
具体地,Hourglass网络在每次降采样之前,分出上半路保留原尺度信息;每次上采样之后,和上一个尺度的数据相加;两次降采样之间,可使用三个residual模块提取特征;两次相加之间,使用一个residual模块提取特征。由于考虑了各个尺度的特征,所以运行速度更快,网络训练时间更快。
步骤S66:基于第二输出结果及特征图像,对第二神经网络模型进行训练,更新第二神经网络模型,确定关键点识别模型;
在对该第二神经网络模型的训练过程中,可设置参数为:输入像素值为0-255的正投影图像和label.txt,可以通过每张图片的名称找到互相对应的点的坐标;在本实施例中,可以使将这些点生成高斯图,用heatmap去监督,即网络的输出是一个与输入大小相同尺寸的特征图,在检测点的位置为1,其他位置为0。对应于多个点的检测,可输出多个通道的特征图。网络使用Adam优化,学习率为1e-5,batch_size为4,损失函数使用L2正则化,根据训练过程中损失函数的变化,调整训练批次的大小,最终得到目标对象的坐标位置。
步骤S67:基于图像分割模型及关键点识别模型构建图像识别模型。
通过上述过程,则可训练得到针对目标对象的图像识别模型。通过本实施例的图像识别模型的训练方法所训练得到的图像识别模型,在进行实际图像识别过程中,可针对待识别图像进行图像分割,从而提取该待识别图像的图像特征,从而能够更加准确地识别该图像中的目标区域;然后,基于图像分割的结果及目标区域,对图像做多级缩放处理,通过将图像分割结果缩放至预设分别率,从而基于目标区域识别该图像中的目标对象。通过上述过程,对于待识别图像的分割以及缩放,能够更加快速、准确地从中提取目标区域及目标对象的特征,从而得到更加准确的图像识别结果。
本实施例还提供一种图像识别模型的训练装置,如图7所示,包括:
图像获取模块101,用于获取图像数据集,所述图像数据集中包括已标记的正样本图像及未标记的负样本图像,所述正样本图像中含有用于表征目标区域的标记;详细内容请参见上述方法实施例的S61的描述,在此不再赘述。
第一输出模块102,用于将所述图像数据集输入至第一神经网络模型,进行图像分割,得到第一输出结果;详细内容请参见上述方法实施例的S62的描述,在此不再赘述。
图像分割模型确定模块103,用于基于所述第一输出结果及图像数据集,对所述第一神经网络模型进行训练,更新所述第一神经网络模型,确定图像分割模型;详细内容请参见上述方法实施例的S63的描述,在此不再赘述。
特征图像生成模块104,用于基于所述第一输出结果生成特征图像;详细内容请参见上述方法实施例的S64的描述,在此不再赘述。
第二输出模块105,用于将所述特征图像输入至第二神经网络模型,进行多级图像缩放处理,得到第二输出结果;详细内容请参见上述方法实施例的S65的描述,在此不再赘述。
关键点识别模型确定模块106,用于基于所述第二输出结果及所述特征图像,对所述第二神经网络模型进行训练,更新所述第二神经网络模型,确定关键点识别模型;详细内容请参见上述方法实施例的S66的描述,在此不再赘述。
图像识别模型构建模块107,用于基于所述图像分割模型及关键点识别模型构建图像识别模型。详细内容请参见上述方法实施例的S67的描述,在此不再赘述。
通过本实施例的图像识别模型的训练装置所训练得到的图像识别模型,在进行实际图像识别过程中,可针对待识别图像进行图像分割,从而提取该待识别图像的图像特征,从而能够更加准确地识别该图像中的目标区域;然后,基于图像分割的结果及目标区域,对图像做多级缩放处理,通过将图像分割结果缩放至预设分别率,从而基于目标区域识别该图像中的目标对象。通过上述过程,对于待识别图像的分割以及缩放,能够更加快速、准确地从中提取目标区域及目标对象的特征,从而得到更加准确的图像识别结果。
本实施例还提供一种图像识别装置,如图8所示,包括:
图像获取模块201,用于获取待识别图像;详细内容请参见上述方法实施例的S11的描述,在此不再赘述。
图像分割结果生成模块202,用于对所述待识别图像进行图像分割,得到图像分割结果;详细内容请参见上述方法实施例的S12的描述,在此不再赘述。
图像缩放结果生成模块203,用于对所述图像分割结果进行多级缩放处理,得到图像缩放结果;详细内容请参见上述方法实施例的S13的描述,在此不再赘述。
目标对象识别模块204,用于基于所述图像缩放结果识别所述待识别图像中的目标对象。详细内容请参见上述方法实施例的S14的描述,在此不再赘述。
通过本实施例的图像识别装置,针对待识别图像进行图像分割,从而提取该待识别图像的图像特征,从而能够更加准确地识别该图像中的目标区域;然后,基于图像分割的结果及目标区域,对图像做多级缩放处理,通过将图像分割结果缩放至预设分别率,从而基于目标区域识别该图像中的目标对象。通过上述过程,对于待识别图像的分割以及缩放,能够更加快速、准确地从中提取目标区域及目标对象的特征,从而得到更加准确的图像识别结果。
本实施例还提供一种髋关节关键位置识别装置,如图9所示,包括:
医学图像数据获取模块301,用于获取医学图像数据;详细内容请参见上述方法实施例的S41的描述,在此不再赘述。
图像分割结果生成模块302,用于对所述医学图像数据进行图像分割,得到包含股骨及骨盆区域的图像分割结果;详细内容请参见上述方法实施例的S42的描述,在此不再赘述。
图像缩放结果生成模块303,用于对所述图像分割结果进行多级缩放处理,得到包含髋关节关键位置的图像缩放结果;详细内容请参见上述方法实施例的S43的描述,在此不再赘述。
髋关节关键位置识别模块304,用于基于所述图像缩放结果识别所述医学图像数据中的髋关节关键位置。详细内容请参见上述方法实施例的S44的描述,在此不再赘述。
通过本实施例的髋关节关键位置识别方法,针对医学图像数据进行图像分割,从而提取该医学图像数据的图像特征,从而能够更加准确地识别该图像中的股骨及骨盆区域;然后,基于图像分割的结果及股骨及骨盆区域,对图像做多级缩放处理,通过将图像分割结果缩放至预设分别率,从而基于目标区域识别该图像中的目标对象(在本实施例中,是指股骨头中心点和泪滴下缘位置)。通过上述过程,对于医学图像数据的分割以及缩放,能够更加快速、准确地从中提取目标区域及目标对象的特征,从而得到更加准确的图像识别结果。
本实施例还提供一种真臼位置识别装置,如图10所示,包括:
医学图像数据获取模块401,用于获取医学图像数据;详细内容请参见上述方法实施例的S51的描述,在此不再赘述。
股骨及骨盆区域确定模块402,用于对所述医学图像数据进行图像分割,基于图像分割结果确定股骨及骨盆区域;详细内容请参见上述方法实施例的S52的描述,在此不再赘述。
髋关节关键位置识别模块403,用于对所述图像分割结果进行多级缩放处理,基于图像缩放结果确定健侧的股骨头中心点和泪滴下缘位置;详细内容请参见上述方法实施例的S53的描述,在此不再赘述。
真臼位置确定模块404,用于基于所述健侧的股骨头中心点和泪滴下缘位置确定真臼位置。详细内容请参见上述方法实施例的S54的描述,在此不再赘述。
本实施例的真臼位置识别装置,在前述实施例的图像识别方法、髋关节关键位置识别方法的基础上,首先确定髋关节健康侧的髋臼位置,然后基于健康侧的髋臼位置,镜像确定病患侧的真臼位置,整个识别过程中,可采用深度学习为基础,基于医学图像数据进行识别,既提高了识别效率,也提高了识别精度,为后续进行髋关节相关手术提供了更加精确的技术支持。
本发明实施例还提供了一种计算机设备,如图11所示,该计算机设备可以包括处理器111和存储器112,其中处理器111和存储器112可以通过总线或者其他方式连接,图11中以通过总线连接为例。
处理器111可以为中央处理器(Central Processing Unit,CPU)。处理器111还可以为其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等芯片,或者上述各类芯片的组合。
存储器112作为一种非暂态计算机可读存储介质,可用于存储非暂态软件程序、非暂态计算机可执行程序以及模块,如本发明实施例中的图像识别方法,或髋关节关键位置识别方法,或真臼识别方法,或图像识别模型的训练方法对应的程序指令/模块。处理器111通过运行存储在存储器112中的非暂态软件程序、指令以及模块,从而执行处理器的各种功能应用以及数据处理,即实现上述方法实施例中的图像识别方法,或髋关节关键位置识别方法,或真臼识别方法,或图像识别模型的训练方法。
存储器112可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储处理器111所创建的数据等。此外,存储器112可以包括高速随机存取存储器,还可以包括非暂态存储器,例如至少一个磁盘存储器件、闪存器件、或其他非暂态固态存储器件。在一些实施例中,存储器112可选包括相对于处理器111远程设置的存储器,这些远程存储器可以通过网络连接至处理器111。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
所述一个或者多个模块存储在所述存储器112中,当被所述处理器111执行时,执行如图1-图6B所示实施例中的图像识别方法,或髋关节关键位置识别方法,或真臼识别方法,或图像识别模型的训练方法。
上述计算机设备具体细节可以对应参阅图1至图6B所示的实施例中对应的相关描述和效果进行理解,此处不再赘述。
本领域技术人员可以理解,实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)、随机存储记忆体(RandomAccessMemory,RAM)、快闪存储器(Flash Memory)、硬盘(Hard Disk Drive,缩写:HDD)或固态硬盘(Solid-State Drive,SSD)等;所述存储介质还可以包括上述种类的存储器的组合。
虽然结合附图描述了本发明的实施例,但是本领域技术人员可以在不脱离本发明的精神和范围的情况下作出各种修改和变型,这样的修改和变型均落入由所附权利要求所限定的范围之内。