CN108427951A - 图像处理方法、装置、存储介质和计算机设备 - Google Patents

图像处理方法、装置、存储介质和计算机设备 Download PDF

Info

Publication number
CN108427951A
CN108427951A CN201810130459.1A CN201810130459A CN108427951A CN 108427951 A CN108427951 A CN 108427951A CN 201810130459 A CN201810130459 A CN 201810130459A CN 108427951 A CN108427951 A CN 108427951A
Authority
CN
China
Prior art keywords
image
pixel
classification
semantic segmentation
pending image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810130459.1A
Other languages
English (en)
Other versions
CN108427951B (zh
Inventor
王睿
孙星
郭晓威
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201810130459.1A priority Critical patent/CN108427951B/zh
Publication of CN108427951A publication Critical patent/CN108427951A/zh
Application granted granted Critical
Publication of CN108427951B publication Critical patent/CN108427951B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/25Determination of region of interest [ROI] or a volume of interest [VOI]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/42Global feature extraction by analysis of the whole pattern, e.g. using frequency domain transformations or autocorrelation
    • G06V10/422Global feature extraction by analysis of the whole pattern, e.g. using frequency domain transformations or autocorrelation for representing the structure of the pattern or shape of an object therefor
    • G06V10/424Syntactic representation, e.g. by using alphabets or grammars
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computational Linguistics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Multimedia (AREA)
  • Mathematical Physics (AREA)
  • Computing Systems (AREA)
  • Biomedical Technology (AREA)
  • Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Biophysics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Image Analysis (AREA)

Abstract

本发明涉及一种图像处理方法、装置、存储介质和计算机设备,图像处理方法包括:获取待处理图像;确定所述待处理图像所属的模态类别;通过所述模态类别相应的机器学习模型,将所述待处理图像编码为语义分割特征矩阵;解码所述语义分割特征矩阵得到语义分割图像;所述语义分割图像中的像素点,具有表示所属分类类别的像素值,且与所述待处理图像中的像素点对应;根据属于目标分类类别的像素点确定目标图像区域。本申请提供的方案提高了图像处理准确率。

Description

图像处理方法、装置、存储介质和计算机设备
技术领域
本发明涉及计算机技术领域,特别是涉及一种图像处理方法、装置、存储介质和计算机设备。
背景技术
随着计算机技术的发展,人们越来越多地通过图像来传递信息,而图像中承载的内容也越来越丰富多样。目前,人们已不止于对图像本身进行分类,而更多的是对图像中的内容进行语义分割,找出对图像中感兴趣的区域。
然而,目前对于图像进行语义分割找出图像中的感兴趣区域时,一般是人们根据经验人为的从图像中查找出感兴趣区域,这种人为查找具有很强的主观性,从而导致图像处理的准确性比较低。
发明内容
基于此,有必要针对目前图像处理的准确性比较低的问题,提供一种图像处理方法、装置、存储介质和计算机设备。
一种图像处理方法,包括:
获取待处理图像;
确定所述待处理图像所属的模态类别;
通过所述模态类别相应的机器学习模型,将所述待处理图像编码为语义分割特征矩阵;
解码所述语义分割特征矩阵得到语义分割图像;所述语义分割图像中的像素点,具有表示所属分类类别的像素值,且与所述待处理图像中的像素点对应;
根据属于目标分类类别的像素点确定目标图像区域。
一种图像处理装置,包括:
获取模块,用于获取待处理图像;
确定模块,用于确定所述待处理图像所属的模态类别;
编码模块,用于通过所述模态类别相应的机器学习模型,将所述待处理图像编码为语义分割特征矩阵;
解码模块,用于解码所述语义分割特征矩阵得到语义分割图像;所述语义分割图像中的像素点,具有表示所属分类类别的像素值,且与所述待处理图像中的像素点对应;
分割模块,用于根据属于目标分类类别的像素点确定目标图像区域。
一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行以下步骤:
获取待处理图像;
确定所述待处理图像所属的模态类别;
通过所述模态类别相应的机器学习模型,将所述待处理图像编码为语义分割特征矩阵;
解码所述语义分割特征矩阵得到语义分割图像;所述语义分割图像中的像素点,具有表示所属分类类别的像素值,且与所述待处理图像中的像素点对应;
根据属于目标分类类别的像素点确定目标图像区域。
一种计算机设备,包括存储器和处理器,所述存储器中储存有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行以下步骤:
获取待处理图像;
确定所述待处理图像所属的模态类别;
通过所述模态类别相应的机器学习模型,将所述待处理图像编码为语义分割特征矩阵;
解码所述语义分割特征矩阵得到语义分割图像;所述语义分割图像中的像素点,具有表示所属分类类别的像素值,且与所述待处理图像中的像素点对应;
根据属于目标分类类别的像素点确定目标图像区域。
上述图像处理方法、装置、存储介质和计算机设备,在获取到待处理图像后,即自动确定待处理图像所属的模态类别,继而通过该模态类别相应的机器学习模型,将待处理图像编码为语义分割特征矩阵,再解码该语义分割特征矩阵即可得到语义分割图像。其中,语义分割图像中的像素点,具有表示所属分类类别的像素值,且与待处理图像中的像素点对应。这样即可自动根据属于目标分类类别的像素点来确定目标图像区域,相较于人为确定目标图像区域更加准确。
附图说明
图1为一个实施例中图像处理方法的流程示意图;
图2为一个实施例中语义分割图像与待处理图像的像素点的对应关系图;
图3为一个实施例中对称卷积神经网络的架构图;
图4为一个实施例中目标图像区域的示意图;
图5为一个实施例中图像处理方法的原理示意图;
图6为一个实施例中模型训练步骤的流程示意图;
图7为另一个实施例中图像处理方法的流程示意图;
图8为一个实施例中图像处理装置的模块结构图;
图9为另一个实施例中图像处理装置的模块结构图;
图10为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
图1为一个实施例中图像处理方法的流程示意图。本实施例主要以该方法应用于计算机设备来举例说明。参照图1,该图像处理方法具体包括如下步骤:
S102,获取待处理图像。
其中,待处理图像是待进行图像语义分割的图像。图像语义分割是将图像分割为若干个互不重叠的、具有一定语义的区域,同时对这些区域进行语义标注。本质上,图像语义分割实现的是图像像素级的分类,通过对每个像素点进行分类,实现整幅图像的语义标注。待处理图像比如地图图像、风景图像或者人物图像等。
具体地,计算机设备可获取在本机上生成的图像,将该图像作为待处理图像。计算机设备也可从网络上爬取图像,将该图像作为待处理图像。计算机设备还可以获取其他计算机设备传递的图像,将该图像作为待处理图像。
在一个实施例中,待处理图像具体可以是医学图像。其中,医学图像可包括利用超声声束扫描人体,通过对反射信号的接收和处理获得的超声图象、通过电子计算机断层扫描(Computed Tomography,CT)得到的CT图像或者通过磁共振(Magnetic Resonance,MR)成像得到的MR图像。
具体地,计算机设备可获取通过医学图像成像设备生成的、且传递至本机的医学图像。可以理解,在医学图像成像的过程中,不可避免的会受到外部因素或者学图像成像设备本身运行中产生的噪声的影响,这样生成的医学图像中可能含有噪声,而包含噪声的医学图像会降低对图像处理的准确度。在本实施例中,计算机设备还可以对医学图像成像设备生成的医学图像进行去噪处理。
在一个实施例中,待处理图像可以是具有视觉形态的图像文件。比如JPEG格式的图像文件。待处理图像也可以是不具有视觉形态的图像数据。比如用数值表示的各像素(pixel)的像素值的集合。
S104,确定待处理图像所属的模态类别。
其中,模态类别用于反映图像成像所通过的成像方式。成像方式比如伽马射线成像、紫外波段成像、微波波段成像或者无线电波段成像等。通过伽马射线成像的图像比如人体辐射图,通过微波波段成像的图像比如雷达图像等。可以理解,由于不同成像方式的成像原理和成像特点不同,因此在对图像进行处理时,需先确定图像的成像方式,也就是图像所述的模态类别,再根据确定的模态类别进行后续处理。
在一个实施例中,S104包括:获取待处理图像所对应的图像成像信息;根据图像成像信息,确定待处理图像所对应的模态;将模态所属的模态类别作为待处理图像所属的模态类别。
其中,图像成像信息是记载了图像成像相关内容的数据。图像成像信息可包括成像参数。模态用于反映图像成像所通过的成像方式的成像参数。一种模态类别可包括多个模态。可以理解,对应不同模态但属于相同模态类别的图像的成像方式相同,但具体的成像参数不同。比如,磁共振T1图像和磁共振T2图像,这两种图像都是通过磁共振成像得到,但具体的成像参数不一样。
图像成像信息可以直接封装于图像中。比如,将图像成像信息写入图像文件的头部。举例说明,医学图像在生成后可直接存储为DCM文件,并将图像成像信息写入DCM文件头部,这样计算机设备在获取到DCM格式的待处理图像后,即可直接从待处理图像的头部提取图像成像信息。其中,DCM文件是遵循DICOM(Digital Imaging and Communications inMedicine,医疗数位影像传输协定)标准的一种文件。
图像成像信息也可以独立于图像,与图像对应存储。这样计算机在获取到待处理图像后,即可查找与该待处理图像对应存储的图像成像信息。
具体地,计算机设备可在获取待处理图像后,获取该待处理图像所对应的图像成像信息,对该图像成像信息进行语义分析,提取该图像成像信息中的关键字,根据提取的关键字,确定待处理图像所对应的模态,再将确定的模态所属的模态类别作为待处理图像所属的模态类别。
在本实施例中,提供了鉴别图像所属模态类别的具体方式,根据与待处理图像所对应的图像成像信息分析得到图像的模态,直接将该模态所属的模态类别作为待处理图像的模态类别。这种确定图像所属模态类别即快捷又准确。
S106,通过模态类别相应的机器学习模型,将待处理图像编码为语义分割特征矩阵。
其中,机器学习英文全称为Machine Learning,简称ML。机器学习模型可通过样本学习具备特定的能力。机器学习模型可采用神经网络模型、支持向量机或者逻辑回归模型等。神经网络模型比如卷积神经网络等。在本实施例中,机器学习模型是事先训练得到的具备分类能力的模型。
语义分割特征矩阵是对待处理图像中图像内容的语义特征的低维表达,涵盖了该整个待处理图像的语义特征信息。语义分割特征矩阵的矩阵大小,小于待处理图像对应的像素值矩阵的矩阵大小。比如,语义分割特征矩阵为4*4的矩阵,待处理图像对应的像素值矩阵为大于4*4的矩阵,如8*8或者16*16等。
具体地,计算机设备可事先通过属于各模态类别的图像样本,训练得到各模态类别相应的机器学习模型。这样,计算机设备在确定待处理图像所属的模态类别后,获取与确定的该模态类别对应的机器学习模型,将待处理图像作为机器学习模型的输入,通过获取的机器学习模型的编码结构,将待处理图像编码为语义分割特征矩阵。
在一个实施例中,各模态类别相应的机器学习模型具有相同的模型结构,仅模型参数不同。这样可提高机器学习模型的通用性,对于不同属于模态类别的图像均能进行处理,只需要相应更换模型参数即可。
在一个实施例中,计算机设备可事先设置机器学习模型统一的模型结构,得到初始机器学习模型,再通过属于各模态类别的图像样本,训练得到各模态类别相应的机器学习模型的模型参数。这样,计算机设备在确定待处理图像所属的模态类别后,获取与确定的该模态类别对应的模型参数,将该模型参数导入初始机器学习模型,得到与确定的该模态类别对应的机器学习模型,再通过该机器学习模型,将待处理图像编码为语义分割特征矩阵。
在一个实施例中,计算机设备还还可以将待处理图像转化为灰度图像,再将灰度图像作为机器学习模型的输入。计算机设备还可以在将待处理图像转化为灰度图像后,对灰度图像中各像素点的灰度值进行归一化处理,再将归一化后的灰度图像作为机器学习模型的输入。其中,对灰度图像各像素点的灰度值进行归一化处理,具体可以是将像素点的像灰度值调整至[-1,1]之间。
在一个实施例中,待处理图像可以是二维图像,也可以是三维图像。二维图像比如拍摄实物得到的二维照片等,三维图像比如CT图像和MR图像等。
S108,解码语义分割特征矩阵得到语义分割图像;语义分割图像中的像素点,具有表示所属分类类别的像素值,且与待处理图像中的像素点对应。
其中,语义分割图像是分割为若干个互不重叠的、具有一定语义的区域的图像。语义分割图像中像素点的像素值用于反映相应像素点所属的分类类别。像素点的分类可以是二分类,也可以是多分类。像素点二分类,比如地图图像中对应道路的像素点和其他像素点。像素点多分类,比如风景地图中对应天空的像素点、对应大地的像素点以及对应人物的像素点等。
语义分割图像中的像素点与待处理图像中的像素点的对应关系可以是一一对应的关系,也可以是一对多的关系。也就是说,语义分割图像中的一个像素点可以对应待处理图像中的一个像素点,也可以对应待处理图像中的多个像素点。其中,当语义分割图像中的像素点与待处理图像中的像素点的对应关系为一一对应的关系时,具体可以是按像素位置一一对应的关系。当语义分割图像中的像素点与待处理图像中的像素点的对应关系为一对多的关系时,具体可以是按像素点在图像中相对位置对应的关系。
在语义分割图像中的像素点与待处理图像中的像素点的对应关系是一一对应的关系时,即可以理解为对输入图像进行了逐像素点分类,根据语义分割图像中的像素点的像素值,即可得到待处理图像中的每个像素点的类别隶属。
举例说明,图2示出了一个实施例中语义分割图像与待处理图像的像素点的对应关系图。参考图2上图,可以看出,待处理图像的图像尺寸为8*8,语义分割图像的图像尺寸为8*8。语义分割图像中的像素点与待处理图像中的像素点的对应关系为一一对应的关系,且按像素位置一一对应。参考图2下图,可以看出,待处理图像的图像尺寸为8*8,语义分割图像的图像尺寸为4*4。语义分割图像中的像素点与待处理图像中的像素点的对应关系为一对多的关系时,按像素点在图像中相对位置进行对应的关系。可以理解,本实施例既可以对二维的图像进行处理,也可以对三维的图像进行处理,但是为了方便查看,附图中采用二维的图像进行实例说明。
具体地,计算机设备可继续通过待处理图像所属的模态类别相应的机器学习模型,解码语义分割特征矩阵得到语义分割图像。可以理解的是,语义分割图像中的像素点的像素值表示相应像素点的分类类别。其中,相应像素点可以是语义分割图像中相应的像素点,也可以是待处理图像中相应的像素点。
在一个实施例中,机器学习模型具体可以是对称卷积神经网络模型。对称卷积神经网络模型包括编码器部分和解码器部分。可以理解,这里的对称可以仅是指编码器与解码器形成对称,但编码器与解码器的具体结构不对称;也可以是指编码器与解码器的具体结构对称。
图3示出了一个实施例中对称卷积神经网络的架构图。参考图3,可以看出对称卷积神经网络包括编码器部分和解码器部分。编码器与解码器的具体结构可以是残差(Residual)结构。可以理解,残差(Residual)结构可以增卷积神经网络的特征表达能力和信息复原能力。编码器包括卷积层、池化层和激活函数层,解码器包括反卷积层、池化层和激活函数层。激活函数具体可以是ReLU函数。
卷积层用于对待处理图像进行卷积处理得到特征图(Feature Map)。池化(Pooling)层也叫做采样层,通常有均值子采样(Mean Pooling)和最大值子采样(MaxPooling)两种形式。采样包括上采样和下采样。激活函数层用于加入非线性因素,使得卷积神经网络可以更好地解决较为复杂的非线性问题。
在一个实施例中,对称卷积神经网络还具有可扩展性。计算机设备可在解码器部分后增加特征识别结构,用于识别对图像所包括的图像特征;或者增加其他功能结构。
S110,根据属于目标分类类别的像素点确定目标图像区域。
其中,目标分类类别用于反映意图分割出的图像区域的语义类别。比如,计算机设备意图从地图图像中分割出对应道路的图像区域,那么道路所对应的分类类别,即为目标分类类别。
具体地,计算机设备可在语义分割图像中将属于目标分类类别的像素点所在的区域,确定为目标图像区域。计算机设备也可以在待处理图像中将属于目标分类类别的像素点所在的区域,确定为目标图像区域。
图4示出一个实施例中目标图像区域的示意图。计算机设备意图从人物图像中确定人物所在区域。参考图4右图,该图为语义分割图像,该语义分割图像中包括目标图像区域410。参考图4左图,该图为待处理图像,该待处理中包括目标图像区域420。可以理解,目标图像区域410与目标图像区域420对应。
在一个实施例中,当待处理图像为医学图像时,目标图像区域可以是病灶区域。例如,在甲状腺超声图像中,甲状腺结节所在的区域。再例如,在脑部CT图像中,脑部肿瘤所在的区域。
上述图像处理方法,在获取到待处理图像后,即自动确定待处理图像所属的模态类别,继而通过该模态类别相应的机器学习模型,将待处理图像编码为语义分割特征矩阵,再解码该语义分割特征矩阵即可得到语义分割图像。其中,语义分割图像中的像素点,具有表示所属分类类别的像素值,且与待处理图像中的像素点对应。这样即可自动根据属于目标分类类别的像素点来确定目标图像区域,相较于人为确定目标图像区域更加准确。
在一个实施例中,待处理图像的数量多于一个;各待处理图像根据同一成像目标成像得到。S106包括:将属于相同模态类别的待处理图像的图像尺寸调整至统一的图像尺寸;分别通过各模态类别相应的机器学习模型,将属于相应模态类别、且经过图像尺寸调整的待处理图像,共同编码为语义分割特征矩阵;其中,各语义分割特征矩阵解码后得到的语义分割图像,具有表示所属分类类别的像素值,且与编码自的各待处理图像中的像素点按像素位置对应。
其中,成像目标是成像的对象,也就是图像中的图像内容。根据同一成像目标成像得到的多个待处理图像,比如,针对同一个苹果拍摄得到的多张照片,或者针对某患者脑部采集的多张CT图像。
在一个实施例中,待处理图像可以为单幅的医学图像,也可以为医学图像序列中的一幅或多幅医学图像。例如,脑部CT图像中的一幅或多幅等。
具体地,计算机设备可遍历获取的各待处理图像,获取遍历至的待处理图像所对应的图像成像信息,根据图像成像信息,确定遍历至的待处理图像所对应的模态,将该模态所属的模态类别作为待处理图像所属的模态类别。这样,计算机设备即完成了按模态类别对待处理图像进行划分。其中,对应不同模态的不同待处理图像的图像尺寸可以相同也可以不同。对应相同模态的不同待处理图像的图像尺寸可以相同也可以不同。
进一步地,对于每个模态类别下的待处理图像,当这些待处理图像的图像尺寸相同时,计算机设备可直接将这些待处理图像作为所属模态类别相应的机器学习模型的输入。当这些待处理图像的图像尺寸不同时,计算机设备可将这些待处理图像的图像尺寸调整至统一的图像尺寸后,再将经过图像尺寸调整的待处理图像作为所属模态类别相应的机器学习模型的输入。
其中,机器学习模型的输入的数据格式具体可以是四维矩阵格式。四维矩阵可以通俗的理解为书架,书架中包括多本书(三维矩阵),每本书包括多页纸(二维矩阵)。
对于多个三维图像而言,三维图像的三维像素值矩阵可以类比于上述举例中的书,那么由多个三维像素值矩阵构成的四维矩阵中的第四维的数据,可以理解为三维像素值矩阵的排序位置。而对于二维图像而言,二维图像的二维像素值矩阵可以类比于上述举例中的纸,那么由多个二维像素值矩阵构成的四维矩阵中的第三维的数据可理解为空,第四维的数据可以理解为二维像素值矩阵的排序位置。这样即可通过四维矩阵中的矩阵元素唯一确定多个三维图像或者多个二维图像中的每一个像素点。
图像尺寸以像素为单位。统一的图像尺寸可以是预先设置的图像尺寸,也可以是这些待处理图像中其中一个待处理图像的图像尺寸。可以理解,待处理图像的图像尺寸调整是为了将多个待处理图像尺寸统一后便于机器学习模型处理,对具体统一至怎样的图像尺寸不作限定。
输入机器学习模型的图像尺寸调整后的各图像中,均存在由该机器学习模型输出的语义分割图像中各像素点对应的像素点。在一个实施例中,输入机器学习模型的图像,与机器学习模型输出的图像的图像尺寸相同,且输入的图像中的像素点,与输出的图像中的像素点按照像素位置一一对应。
上述实施例中,在待处理图像的数量为多个时,将待处理图像按照各自所属的模态类别分别通过不同的机器学习模型处理,而且在将多个待处理图像共同输入机器学习模型时,将这些待处理图像调整为统一的图像尺寸,使得图像的像素点分类更快速准确。
在一个实施例中,将属于相同模态类别的待处理图像的图像尺寸调整至统一的图像尺寸,包括:查询各模态类别相应的机器学习模型各自关联的参考图像尺寸;对各待处理图像进行像素点采样,以将各待处理图像的图像尺寸调整至所属模态类别相应的机器学习模型所关联的参考图像尺寸。
其中,计算机设备在事先训练机器学习模型时,可设置输入机器学习模型的训练图像的图像尺寸(即四维矩阵的大小)。这样,根据统一图像尺寸的训练图像(固定大小的输入)来训练机器学习模型,可大大简化机器学习模型的复杂度,减少机器学习模型的参数。
可以理解,对于此处统一了训练机器学习模型的训练图像的图像尺寸的设置,并不是对训练图像的图像尺寸的限定。训练机器学习模型的训练图像的图像尺寸也可以不是统一的图像尺寸。
具体地,计算机设备可查询各模态类别相应的机器学习模型各自关联的参考图像尺寸,以确定各模态类别对应的参考图像尺寸,进而将各待处理图像的图像尺寸与所属模态类别对应的参考图像尺寸比较。当待处理图像的图像尺寸比所属模态类别对应的参考图像尺寸小时,通过上采样操作,将待处理图像的图像尺寸扩大至所属模态类别对应的参考图像尺寸;当待处理图像的图像尺寸比所属模态类别对应的参考图像尺寸大时,通过下采样操作,将待处理图像的图像尺寸缩小至所属模态类别对应的参考图像尺寸。这样,计算机设备即将各模态类别下的待处理图像统一至对应的参考图像尺寸。
举例说明,假设待处理图像中属于模态类别A的待处理图像包括图像1、图像2和图像3,其中,图像1的图像尺寸为512*512,图像2的图像尺寸为1024*1024,图像3的图像尺寸为128*128,模态类别A相应的机器学习模型关联的参考图像尺寸为512*512。那么,图像1的图像尺寸与参考图像尺寸相同,不需作图像尺寸调整;图像2的图像尺寸大于参考图像尺寸,需作下采样缩小图像尺寸;图像3的图像尺寸小于参考图像尺寸,需作上采样扩大图像尺寸;这样使得图像1、图像2和图像3均为512*512。
在本实施例中,将多个待作为机器学习模型输入的图像的图像尺寸,统一调整至该机器学习模型所关联的图像尺寸,提高了机器学习模型的处理效率,进而提高了图像的处理效率。
在一个实施例中,根据属于目标分类类别的像素点确定目标图像区域,包括:根据各语义分割图像中属于目标分类类别的像素点,相应确定各语义分割图像中的目标图像区域;或者根据各语义分割图像中像素点与编码自的各待处理图像中的像素点的对应关系,确定各待处理图像中的各像素点各自对应的分类类别;根据各待处理图像中属于目标分类类别的像素点,相应确定各语义分割图像中的目标图像区域。
具体地,计算机设备可对于每个语义分割图像,将该语义分割图像中属于目标分类类别的像素点所在的区域,确定为目标图像区域。
计算机设备还可根据各语义分割图像中像素点与作为机器学习模型输入的各待处理图像中的像素点的对应关系,确定各待处理图像中的各像素点各自对应的分类类别,将各待处理图像中属于目标分类类别的像素点所在的区域,确定为目标图像区域。
在本实施例中,机器学习模型输出的语义分割图像中的像素点的像素值即表示相应像素点的类别隶属,这样即可直接根据像素点的像素值对语义分割图像以及待处理图像进行区域分割。
在一个实施例中,计算机模型在语义分割图像或者待处理图像中确定目标图像区域后,可计算该目标图像区域的属性参数,如目标图像区域的像素面积(二维图像)、像素体积(三维图像)以及像素密度等。
举例说明,通常处理的CT数据层厚为1.25-3mm,层间距为0.75-3mm,每层CT图像的高(y)和宽(x)为512×512个像素,单个病例CT图像的层数(z)为100~500,(z,y,x)方向像素大小为0.5-1.5mm。这样即可根据属于目标分类类别的像素点的数量来计算目标图像区域的像素体积。比如,在脑部CT图像中,脑部肿瘤所在的区域为目标图像区域,这样目标图像区域的像素体积则可以反映出病灶区域大小。
图5为一个实施例中图像处理方法的原理示意图。参考图5,计算机设备获取到的待处理图像的数量为5:图像1、图像2、图像3、图像4和图像5。其中,图像1的图像尺寸为4*4、模态为A1,图像2的图像尺寸为8*8、模态为A2,图像3的图像尺寸为2*2、模态为A3,图像4的图像尺寸为2*2、模态为B1,图像5的图像尺寸为2*2、模态为B1。模态A1、模态A2以及模态A3均属于模态类别A,模态B1属于模态类别B。模态类别A相应的机器学习模型关联的参考图像尺寸均为4*4,模态类别A相应的机器学习模型关联的参考图像尺寸均为2*2。
计算机设备可对图像2进行下采样得到图像2’,对图像3上采样得到图像3’,图像2’和图像3’的像素尺寸均为4*4,再将图像1、图像2’和图像3’中的像素点的灰度值归一化后构成四维矩阵输入模态类别A相应的机器学习模型,输出语义分割图像A,且图像尺寸为4*4。其中,机器学习模型对输入图像的像素点进行二分类,语义分割图像A中的像素点具有表示所属分类类别的像素值(0或1),且与图像1、图像2’和图像3’中的像素点按照像素位置对应。将语义分割图像A按照下采样图像2的采样参数上采样后得到图像A’,像素尺寸为8*8,这样图像A’即与图像2像素点按照像素位置对应。将语义分割图像A按照上采样图像3的采样参数下采样后得到图像A”,像素尺寸为2*2,这样图像A”即与图像3像素点按照像素位置对应。
计算机设备将图像4和图像5的像素点的灰度值归一化后构成四维矩阵输入模态类别B相应的机器学习模型,输出语义分割图像B,图像尺寸为2*2。其中,语义分割图像B中的像素点具有表示所属分类类别的像素值,且与图像4和图像5中的像素点按照像素位置对应。
如图6所示,在一个实施例中,各模态类别相应的机器学习模型的生成步骤具体包括:
S602,收集属于各模态类别的图像样本。
具体地,计算机设备可收集各个模态类别下的图像来用作训练样本,从而得到属于各模态类别的图像样本。
S604,为各模态类别相应的机器学习模型关联参考图像尺寸。
具体地,计算机设备可设置机器学习模型的结构,得到初始的机器学习模型,并为各模态类别相应的机器学习模型关联参考图像尺寸。其中,各模态类别相应的机器学习模型关联参考图像尺寸可以相同也可以不同。
S606,分别将属于各模态类别的图像样本的图像尺寸,调整至所属模态类别相应的机器学习模型所关联的参考图像尺寸。
S608,确定各图像样本中各像素点所对应的分类类别。
具体地,计算机设备可确定各图像样本中各像素点所对应的分类类别,并将相应渠道的分类类别作为像素点的训练标签。训练标签用于表示已知的分类结果。标签的取值范围可以是两个或多于两个的离散值。一个训练标签是对像素点所属的分类类别的标记。比如,对像素点的分类为二分类,那么可将其中一种分类类别标记为0,将另一种分类类别标记为1。
S610,根据各图像样本和各图像样本中各像素点所对应的分类类别,训练所属模态类别相应的机器学习模型。
具体地,计算机设备可采用各模态类别的图像样本有监督地训练各模态类别对应的机器学习模型,根据机器学习模型输出的分类结果与分类标签的差异,调整机器学习模型的模型参数并继续训练,直至满足训练停止条件时结束训练。
其中,训练停止条件是结束模型训练的条件。训练停止条件可以是达到预设的迭代次数,或者是调整模型参数后的机器学习模型的分类性能指标达到预设指标。
在一个实施例中,计算机设备可分别训练出各模态类别对应的机器学习模型并存储,在需要使用机器学习模型时即可直接获取并使用。计算机设备也可仅存储各模态类别对应的模型参数,在需要使用机器学习模型时,获取模型参数导入初始的机器学习模型后,得到模态类别对应的机器学习模型后使用。
上述实施例中,根据样本和对样本添加的训练标签,有监督地训练得到各模态类别对应的机器学习模型,相较于无监督训练模式,提高了机器学习模型的分类准确性,相较于传统的有监督训练模式,避免了需要人工实现设置特征,提高了机器学习模型的训练效率。
如图7所示,在一个具体的实施例中,图像处理方法具体包括以下步骤:
S702,获取根据同一成像目标成像得到的多个医学图像。
具体地,各医学图像成像设备在生成医学图像后,可将生成的医学图像上传至云端服务器。计算机设备从而可从云端服务器上拉取多个医学图像来进行语义分割处理。
S704,获取各医学图像所对应的图像成像信息;根据图像成像信息,相应确定医学图像所对应的模态;将相应确定的模态所属的模态类别作为相应医学图像所属的模态类别。
S706,查询各模态类别相应的对称卷积神经网络模型各自关联的参考图像尺寸。
S708,对各医学图像进行像素点采样,以将各医学图像的图像尺寸调整至所属模态类别相应的机器学习模型所关联的参考图像尺寸。
S710,分别通过各模态类别相应的对称卷积神经网络模型,将属于相应模态类别、且经过图像尺寸调整的医学图像,共同编码为语义分割特征矩阵。
S712,分别通过各模态类别相应的对称卷积神经网络模型,解码相应编码得到的语义分割特征矩阵得到语义分割图像;语义分割图像中的像素点,具有表示所属分类类别的像素值,且与编码自的医学图像中的像素点按像素位置对应。
S714,根据各语义分割图像中属于目标分类类别的像素点,相应确定各语义分割图像中的目标图像区域。
S716,根据各语义分割图像中像素点与编码自的各待处理图像中的像素点的对应关系,确定各待处理图像中的各像素点各自对应的分类类别;根据各待处理图像中属于目标分类类别的像素点,相应确定各语义分割图像中的目标图像区域。
S718,收集属于各模态类别的图像样本;为各模态类别相应的机器学习模型关联参考图像尺寸;别将属于各模态类别的图像样本的图像尺寸,调整至所属模态类别相应的机器学习模型所关联的参考图像尺寸;确定各图像样本中各像素点所对应的分类类别;根据各图像样本和各图像样本中各像素点所对应的分类类别,训练所属模态类别相应的机器学习模型。
上述实施例中,在获取到待处理图像后,即自动确定待处理图像所属的模态类别,继而通过该模态类别相应的机器学习模型,将待处理图像编码为语义分割特征矩阵,再解码该语义分割特征矩阵即可得到语义分割图像。其中,语义分割图像中的像素点,具有表示所属分类类别的像素值,且与待处理图像中的像素点对应。这样即可自动根据属于目标分类类别的像素点来确定目标图像区域,相较于人为确定目标图像区域更加准确。
应该理解的是,虽然上述各实施例的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,上述各实施例中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
如图8所示,在一个实施例中,提供了一种图像处理装置800。参照图8,该图像处理装置800包括:获取模块801、确定模块802、编码模块803、解码模块804和分割模块805。
获取模块801,用于获取待处理图像。
确定模块802,用于确定待处理图像所属的模态类别。
编码模块803,用于通过模态类别相应的机器学习模型,将待处理图像编码为语义分割特征矩阵。
解码模块804,用于解码语义分割特征矩阵得到语义分割图像;语义分割图像中的像素点,具有表示所属分类类别的像素值,且与待处理图像中的像素点对应。
分割模块805,用于根据属于目标分类类别的像素点确定目标图像区域。
上述图像处理装置800,在获取到待处理图像后,即自动确定待处理图像所属的模态类别,继而通过该模态类别相应的机器学习模型,将待处理图像编码为语义分割特征矩阵,再解码该语义分割特征矩阵即可得到语义分割图像。其中,语义分割图像中的像素点,具有表示所属分类类别的像素值,且与待处理图像中的像素点对应。这样即可自动根据属于目标分类类别的像素点来确定目标图像区域,相较于人为确定目标图像区域更加准确。
在一个实施例中,确定模块802还用于获取待处理图像所对应的图像成像信息;根据图像成像信息,确定待处理图像所对应的模态;将模态所属的模态类别作为待处理图像所属的模态类别。
在一个实施例中,待处理图像的数量多于一个;各待处理图像根据同一成像目标成像得到。编码模块803还用于将属于相同模态类别的待处理图像的图像尺寸调整至统一的图像尺寸;分别通过各模态类别相应的机器学习模型,将属于相应模态类别、且经过图像尺寸调整的待处理图像,共同编码为语义分割特征矩阵;其中,各语义分割特征矩阵解码后得到的语义分割图像,具有表示所属分类类别的像素值,且与编码自的各待处理图像中的像素点按像素位置对应。
在一个实施例中,编码模块803还用于查询各模态类别相应的机器学习模型各自关联的参考图像尺寸;对各待处理图像进行像素点采样,以将各待处理图像的图像尺寸调整至所属模态类别相应的机器学习模型所关联的参考图像尺寸。
在一个实施例中,分割模块805还用于根据各语义分割图像中属于目标分类类别的像素点,相应确定各语义分割图像中的目标图像区域;或者根据各语义分割图像中像素点与编码自的各待处理图像中的像素点的对应关系,确定各待处理图像中的各像素点各自对应的分类类别;根据各待处理图像中属于目标分类类别的像素点,相应确定各语义分割图像中的目标图像区域。
如图9所示,在一个实施例中,图像处理装置800还包括:训练模块806,用于收集属于各模态类别的图像样本;为各模态类别相应的机器学习模型关联参考图像尺寸;分别将属于各模态类别的图像样本的图像尺寸,调整至所属模态类别相应的机器学习模型所关联的参考图像尺寸;确定各图像样本中各像素点所对应的分类类别;根据各图像样本和各图像样本中各像素点所对应的分类类别,训练所属模态类别相应的机器学习模型。
在一个实施例中,待处理图像为医学图像;机器学习模型为对称卷积神经网络模型。
图10示出了一个实施例中计算机设备的内部结构图。该计算机设备具体可以是终端或者服务器。其中,终端可以是固定终端或者移动终端,移动终端具体可以是手机或者平板电脑等。服务器可以是独立的服务器,也可以是服务器集群。如图10所示,该计算机设备包括通过系统总线连接的处理器、存储器和网络接口。其中,存储器包括非易失性存储介质和内存储器。该计算机设备的非易失性存储介质存储有操作系统,还可存储有计算机程序,该计算机程序被处理器执行时,可使得处理器实现图像处理方法。该内存储器中也可储存有计算机程序,该计算机程序被处理器执行时,可使得处理器执行图像处理方法。本领域技术人员可以理解,图10中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,本申请提供的图像处理装置可以实现为一种计算机程序的形式,计算机程序可在如图10所示的计算机设备上运行,计算机设备的非易失性存储介质可存储组成该图像处理装置的各个程序模块,比如,图8所示的获取模块801、确定模块802、编码模块803、解码模块804和分割模块805等。各个程序模块组成的计算机程序使得处理器执行本说明书中描述的本申请各个实施例的图像处理方法中的步骤。
例如,图10所示的计算机设备可以通过如图8所示的图像处理装置800中的获取模块801获取待处理图像。通过确定模块802确定待处理图像所属的模态类别。通过编码模块803通过模态类别相应的机器学习模型,将待处理图像编码为语义分割特征矩阵。通过解码模块804解码语义分割特征矩阵得到语义分割图像;语义分割图像中的像素点,具有表示所属分类类别的像素值,且与待处理图像中的像素点对应。通过分割模块805根据属于目标分类类别的像素点确定目标图像区域。
在一个实施例中,提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时,使得处理器执行以下步骤:获取待处理图像;确定待处理图像所属的模态类别;通过模态类别相应的机器学习模型,将待处理图像编码为语义分割特征矩阵;解码语义分割特征矩阵得到语义分割图像;语义分割图像中的像素点,具有表示所属分类类别的像素值,且与待处理图像中的像素点对应;根据属于目标分类类别的像素点确定目标图像区域。
在一个实施例中,确定待处理图像所属的模态类别,包括:获取待处理图像所对应的图像成像信息;根据图像成像信息,确定待处理图像所对应的模态;将模态所属的模态类别作为待处理图像所属的模态类别。
在一个实施例中,待处理图像的数量多于一个;各待处理图像根据同一成像目标成像得到。通过模态类别相应的机器学习模型,将待处理图像编码为语义分割特征矩阵,包括:将属于相同模态类别的待处理图像的图像尺寸调整至统一的图像尺寸;分别通过各模态类别相应的机器学习模型,将属于相应模态类别、且经过图像尺寸调整的待处理图像,共同编码为语义分割特征矩阵;其中,各语义分割特征矩阵解码后得到的语义分割图像,具有表示所属分类类别的像素值,且与编码自的各待处理图像中的像素点按像素位置对应。
在一个实施例中,将属于相同模态类别的待处理图像的图像尺寸调整至统一的图像尺寸,包括:查询各模态类别相应的机器学习模型各自关联的参考图像尺寸;对各待处理图像进行像素点采样,以将各待处理图像的图像尺寸调整至所属模态类别相应的机器学习模型所关联的参考图像尺寸。
在一个实施例中,根据属于目标分类类别的像素点确定目标图像区域,包括:根据各语义分割图像中属于目标分类类别的像素点,相应确定各语义分割图像中的目标图像区域;或者根据各语义分割图像中像素点与编码自的各待处理图像中的像素点的对应关系,确定各待处理图像中的各像素点各自对应的分类类别;根据各待处理图像中属于目标分类类别的像素点,相应确定各语义分割图像中的目标图像区域。
在一个实施例中,各模态类别相应的机器学习模型的生成步骤包括:收集属于各模态类别的图像样本;为各模态类别相应的机器学习模型关联参考图像尺寸;分别将属于各模态类别的图像样本的图像尺寸,调整至所属模态类别相应的机器学习模型所关联的参考图像尺寸;确定各图像样本中各像素点所对应的分类类别;根据各图像样本和各图像样本中各像素点所对应的分类类别,训练所属模态类别相应的机器学习模型。
在一个实施例中,待处理图像为医学图像;机器学习模型为对称卷积神经网络模型。
上述存储介质,在获取到待处理图像后,即自动确定待处理图像所属的模态类别,继而通过该模态类别相应的机器学习模型,将待处理图像编码为语义分割特征矩阵,再解码该语义分割特征矩阵即可得到语义分割图像。其中,语义分割图像中的像素点,具有表示所属分类类别的像素值,且与待处理图像中的像素点对应。这样即可自动根据属于目标分类类别的像素点来确定目标图像区域,相较于人为确定目标图像区域更加准确。
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器中储存有计算机程序,计算机程序被处理器执行时,使得处理器执行以下步骤:获取待处理图像;确定待处理图像所属的模态类别;通过模态类别相应的机器学习模型,将待处理图像编码为语义分割特征矩阵;解码语义分割特征矩阵得到语义分割图像;语义分割图像中的像素点,具有表示所属分类类别的像素值,且与待处理图像中的像素点对应;根据属于目标分类类别的像素点确定目标图像区域。
在一个实施例中,确定待处理图像所属的模态类别,包括:获取待处理图像所对应的图像成像信息;根据图像成像信息,确定待处理图像所对应的模态;将模态所属的模态类别作为待处理图像所属的模态类别。
在一个实施例中,待处理图像的数量多于一个;各待处理图像根据同一成像目标成像得到。通过模态类别相应的机器学习模型,将待处理图像编码为语义分割特征矩阵,包括:将属于相同模态类别的待处理图像的图像尺寸调整至统一的图像尺寸;分别通过各模态类别相应的机器学习模型,将属于相应模态类别、且经过图像尺寸调整的待处理图像,共同编码为语义分割特征矩阵;其中,各语义分割特征矩阵解码后得到的语义分割图像,具有表示所属分类类别的像素值,且与编码自的各待处理图像中的像素点按像素位置对应。
在一个实施例中,将属于相同模态类别的待处理图像的图像尺寸调整至统一的图像尺寸,包括:查询各模态类别相应的机器学习模型各自关联的参考图像尺寸;对各待处理图像进行像素点采样,以将各待处理图像的图像尺寸调整至所属模态类别相应的机器学习模型所关联的参考图像尺寸。
在一个实施例中,根据属于目标分类类别的像素点确定目标图像区域,包括:根据各语义分割图像中属于目标分类类别的像素点,相应确定各语义分割图像中的目标图像区域;或者根据各语义分割图像中像素点与编码自的各待处理图像中的像素点的对应关系,确定各待处理图像中的各像素点各自对应的分类类别;根据各待处理图像中属于目标分类类别的像素点,相应确定各语义分割图像中的目标图像区域。
在一个实施例中,各模态类别相应的机器学习模型的生成步骤包括:收集属于各模态类别的图像样本;为各模态类别相应的机器学习模型关联参考图像尺寸;分别将属于各模态类别的图像样本的图像尺寸,调整至所属模态类别相应的机器学习模型所关联的参考图像尺寸;确定各图像样本中各像素点所对应的分类类别;根据各图像样本和各图像样本中各像素点所对应的分类类别,训练所属模态类别相应的机器学习模型。
在一个实施例中,待处理图像为医学图像;机器学习模型为对称卷积神经网络模型。
上述计算机设备,在获取到待处理图像后,即自动确定待处理图像所属的模态类别,继而通过该模态类别相应的机器学习模型,将待处理图像编码为语义分割特征矩阵,再解码该语义分割特征矩阵即可得到语义分割图像。其中,语义分割图像中的像素点,具有表示所属分类类别的像素值,且与待处理图像中的像素点对应。这样即可自动根据属于目标分类类别的像素点来确定目标图像区域,相较于人为确定目标图像区域更加准确。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一非易失性计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。

Claims (15)

1.一种图像处理方法,包括:
获取待处理图像;
确定所述待处理图像所属的模态类别;
通过所述模态类别相应的机器学习模型,将所述待处理图像编码为语义分割特征矩阵;
解码所述语义分割特征矩阵得到语义分割图像;所述语义分割图像中的像素点,具有表示所属分类类别的像素值,且与所述待处理图像中的像素点对应;
根据属于目标分类类别的像素点确定目标图像区域。
2.根据权利要求1所述的方法,其特征在于,所述确定所述待处理图像所属的模态类别,包括:
获取所述待处理图像所对应的图像成像信息;
根据所述图像成像信息,确定所述待处理图像所对应的模态;
将所述模态所属的模态类别作为所述待处理图像所属的模态类别。
3.根据权利要求1所述的方法,其特征在于,所述待处理图像的数量多于一个;各所述待处理图像根据同一成像目标成像得到;
所述通过所述模态类别相应的机器学习模型,将所述待处理图像编码为语义分割特征矩阵,包括:
将属于相同模态类别的待处理图像的图像尺寸调整至统一的图像尺寸;
分别通过各模态类别相应的机器学习模型,将属于相应模态类别、且经过图像尺寸调整的待处理图像,共同编码为语义分割特征矩阵;
其中,各所述语义分割特征矩阵解码后得到的语义分割图像,具有表示所属分类类别的像素值,且与编码自的各待处理图像中的像素点按像素位置对应。
4.根据权利要求3所述的方法,其特征在于,所述将属于相同模态类别的待处理图像的图像尺寸调整至统一的图像尺寸,包括:
查询各模态类别相应的机器学习模型各自关联的参考图像尺寸;
对各所述待处理图像进行像素点采样,以将各待处理图像的图像尺寸调整至所属模态类别相应的机器学习模型所关联的参考图像尺寸。
5.根据权利要求3所述的方法,其特征在于,所述根据属于目标分类类别的像素点确定目标图像区域,包括:
根据各所述语义分割图像中属于目标分类类别的像素点,相应确定各所述语义分割图像中的目标图像区域;或者
根据各所述语义分割图像中像素点与编码自的各待处理图像中的像素点的对应关系,确定各待处理图像中的各像素点各自对应的分类类别;
根据各所述待处理图像中属于目标分类类别的像素点,相应确定各所述语义分割图像中的目标图像区域。
6.根据权利要求3所述的方法,其特征在于,所述各模态类别相应的机器学习模型的生成步骤包括:
收集属于各模态类别的图像样本;
为各模态类别相应的机器学习模型关联参考图像尺寸;
分别将属于各模态类别的图像样本的图像尺寸,调整至所属模态类别相应的机器学习模型所关联的参考图像尺寸;
确定各所述图像样本中各像素点所对应的分类类别;
根据各所述图像样本和各所述图像样本中各像素点所对应的分类类别,训练所属模态类别相应的机器学习模型。
7.根据权利要求1至6中任一项所述的方法,其特征在于,所述待处理图像为医学图像;所述机器学习模型为对称卷积神经网络模型。
8.一种图像处理装置,包括:
获取模块,用于获取待处理图像;
确定模块,用于确定所述待处理图像所属的模态类别;
编码模块,用于通过所述模态类别相应的机器学习模型,将所述待处理图像编码为语义分割特征矩阵;
解码模块,用于解码所述语义分割特征矩阵得到语义分割图像;所述语义分割图像中的像素点,具有表示所属分类类别的像素值,且与所述待处理图像中的像素点对应;
分割模块,用于根据属于目标分类类别的像素点确定目标图像区域。
9.根据权利要求8所述的装置,其特征在于,所述确定模块还用于获取所述待处理图像所对应的图像成像信息;根据所述图像成像信息,确定所述待处理图像所对应的模态;将所述模态所属的模态类别作为所述待处理图像所属的模态类别。
10.根据权利要求8所述的装置,其特征在于,所述待处理图像的数量多于一个;各所述待处理图像根据同一成像目标成像得到;所述编码模块还用于将属于相同模态类别的待处理图像的图像尺寸调整至统一的图像尺寸;分别通过各模态类别相应的机器学习模型,将属于相应模态类别、且经过图像尺寸调整的待处理图像,共同编码为语义分割特征矩阵;其中,各所述语义分割特征矩阵解码后得到的语义分割图像,具有表示所属分类类别的像素值,且与编码自的各待处理图像中的像素点按像素位置对应。
11.根据权利要求10所述的装置,其特征在于,所述编码模块还用于查询各模态类别相应的机器学习模型各自关联的参考图像尺寸;对各所述待处理图像进行像素点采样,以将各待处理图像的图像尺寸调整至所属模态类别相应的机器学习模型所关联的参考图像尺寸。
12.根据权利要求10所述的装置,其特征在于,所述分割模块还用于根据各所述语义分割图像中属于目标分类类别的像素点,相应确定各所述语义分割图像中的目标图像区域;或者根据各所述语义分割图像中像素点与编码自的各待处理图像中的像素点的对应关系,确定各待处理图像中的各像素点各自对应的分类类别;根据各所述待处理图像中属于目标分类类别的像素点,相应确定各所述语义分割图像中的目标图像区域。
13.根据权利要求10所述的装置,其特征在于,所述图像处理装置还包括:
训练模块,用于收集属于各模态类别的图像样本;为各模态类别相应的机器学习模型关联参考图像尺寸;分别将属于各模态类别的图像样本的图像尺寸,调整至所属模态类别相应的机器学习模型所关联的参考图像尺寸;确定各所述图像样本中各像素点所对应的分类类别;根据各所述图像样本和各所述图像样本中各像素点所对应的分类类别,训练所属模态类别相应的机器学习模型。
14.一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行如权利要求1至7中任一项所述的方法的步骤。
15.一种计算机设备,包括存储器和处理器,所述存储器中储存有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行如权利要求1至7中任一项所述的方法的步骤。
CN201810130459.1A 2018-02-08 2018-02-08 图像处理方法、装置、存储介质和计算机设备 Active CN108427951B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810130459.1A CN108427951B (zh) 2018-02-08 2018-02-08 图像处理方法、装置、存储介质和计算机设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810130459.1A CN108427951B (zh) 2018-02-08 2018-02-08 图像处理方法、装置、存储介质和计算机设备

Publications (2)

Publication Number Publication Date
CN108427951A true CN108427951A (zh) 2018-08-21
CN108427951B CN108427951B (zh) 2023-08-04

Family

ID=63156633

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810130459.1A Active CN108427951B (zh) 2018-02-08 2018-02-08 图像处理方法、装置、存储介质和计算机设备

Country Status (1)

Country Link
CN (1) CN108427951B (zh)

Cited By (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109034136A (zh) * 2018-09-06 2018-12-18 湖北亿咖通科技有限公司 图像处理方法、装置、摄像设备及存储介质
CN109377498A (zh) * 2018-08-31 2019-02-22 大连理工大学 基于循环神经网络的交互式抠图方法
CN109461495A (zh) * 2018-11-01 2019-03-12 腾讯科技(深圳)有限公司 一种医学图像的识别方法、模型训练的方法及服务器
CN109584257A (zh) * 2018-11-28 2019-04-05 中国科学院深圳先进技术研究院 一种图像处理方法及相关设备
CN109598727A (zh) * 2018-11-28 2019-04-09 北京工业大学 一种基于深度神经网络的ct图像肺实质三维语义分割方法
CN109657715A (zh) * 2018-12-12 2019-04-19 广东工业大学 一种语义分割方法、装置、设备及介质
CN109682381A (zh) * 2019-02-22 2019-04-26 山东大学 基于全向视觉的大视场场景感知方法、系统、介质及设备
CN109740553A (zh) * 2019-01-09 2019-05-10 贵州宽凳智云科技有限公司 一种基于识别的图像语义分割数据筛选方法及系统
CN109740664A (zh) * 2018-12-28 2019-05-10 东莞中国科学院云计算产业技术创新与育成中心 柔性物体分类方法、装置、计算机设备和存储介质
CN109872357A (zh) * 2019-01-16 2019-06-11 创新奇智(广州)科技有限公司 一种物品排列面占比计算方法、系统及电子设备
CN109886272A (zh) * 2019-02-25 2019-06-14 腾讯科技(深圳)有限公司 点云分割方法、装置、计算机可读存储介质和计算机设备
CN109886301A (zh) * 2019-01-16 2019-06-14 深圳创新奇智科技有限公司 一种图像特征排布判断方法及其系统、终端设备
CN109977924A (zh) * 2019-04-15 2019-07-05 北京麦飞科技有限公司 针对农作物的无人机机上实时图像处理方法及系统
CN110276344A (zh) * 2019-06-04 2019-09-24 腾讯科技(深圳)有限公司 一种图像分割的方法、图像识别的方法以及相关装置
CN110298236A (zh) * 2019-05-20 2019-10-01 中国科学院计算技术研究所 一种基于深度学习的盲文图像自动识别方法和系统
CN110335277A (zh) * 2019-05-07 2019-10-15 腾讯科技(深圳)有限公司 图像处理方法、装置、计算机可读存储介质和计算机设备
CN110491480A (zh) * 2019-05-22 2019-11-22 腾讯科技(深圳)有限公司 一种医疗图像处理方法、装置、电子医疗设备和存储介质
CN110569698A (zh) * 2018-08-31 2019-12-13 阿里巴巴集团控股有限公司 一种图像目标检测及语义分割方法和装置
CN110708559A (zh) * 2019-09-03 2020-01-17 北京达佳互联信息技术有限公司 图像处理方法、装置及存储介质
CN110765935A (zh) * 2019-10-22 2020-02-07 上海眼控科技股份有限公司 图像处理方法、装置、计算机设备及可读存储介质
CN110781899A (zh) * 2019-10-23 2020-02-11 维沃移动通信有限公司 图像处理方法及电子设备
CN111199541A (zh) * 2019-12-27 2020-05-26 Oppo广东移动通信有限公司 图像质量评价方法、装置、电子设备及存储介质
WO2020108366A1 (zh) * 2018-11-27 2020-06-04 腾讯科技(深圳)有限公司 图像分割方法、装置、计算机设备及存储介质
CN111382759A (zh) * 2018-12-28 2020-07-07 广州市百果园信息技术有限公司 一种像素级分类方法、装置、设备及存储介质
CN111539961A (zh) * 2019-12-13 2020-08-14 山东浪潮人工智能研究院有限公司 一种目标分割方法、装置以及设备
CN111899848A (zh) * 2020-08-05 2020-11-06 中国联合网络通信集团有限公司 图像识别方法及设备
CN112634282A (zh) * 2020-12-18 2021-04-09 北京百度网讯科技有限公司 图像处理方法、装置以及电子设备
CN112699948A (zh) * 2020-12-31 2021-04-23 无锡祥生医疗科技股份有限公司 超声乳腺病灶的分类方法、装置及存储介质
CN112861885A (zh) * 2021-03-25 2021-05-28 北京百度网讯科技有限公司 图像识别方法、装置、电子设备及存储介质
AU2020203026B2 (en) * 2019-05-08 2021-06-24 Raytheon Company Calculating the precision of image annotations
CN113035306A (zh) * 2021-03-17 2021-06-25 广州华端科技有限公司 一种远程浏览影像的方法、系统、设备及介质
CN114494251A (zh) * 2022-04-06 2022-05-13 南昌睿度医疗科技有限公司 Spect图像处理方法以及相关设备

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1134985A1 (en) * 2000-03-15 2001-09-19 THOMSON multimedia Coding of objects in video images
CN104199933A (zh) * 2014-09-04 2014-12-10 华中科技大学 一种多模态信息融合的足球视频事件检测与语义标注方法
US20150287211A1 (en) * 2014-04-04 2015-10-08 Hrl Laboratories Llc Method for classification and segmentation and forming 3d models from images
CN106296699A (zh) * 2016-08-16 2017-01-04 电子科技大学 基于深度神经网络和多模态mri图像的脑肿瘤分割方法
CN106709924A (zh) * 2016-11-18 2017-05-24 中国人民解放军信息工程大学 基于深度卷积神经网络和超像素的图像语义分割方法
WO2017092182A1 (zh) * 2015-12-03 2017-06-08 中山大学 一种在超声影像中自动识别肝脏肿瘤类型的方法
CN106886801A (zh) * 2017-04-14 2017-06-23 北京图森未来科技有限公司 一种图像语义分割方法及装置
CN107220980A (zh) * 2017-05-25 2017-09-29 重庆理工大学 一种基于全卷积网络的mri图像脑肿瘤自动分割方法
CN107341763A (zh) * 2017-06-30 2017-11-10 北京金山安全软件有限公司 一种图像处理方法、装置、电子设备及存储介质
CN107644426A (zh) * 2017-10-12 2018-01-30 中国科学技术大学 基于金字塔池化编解码结构的图像语义分割方法

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1134985A1 (en) * 2000-03-15 2001-09-19 THOMSON multimedia Coding of objects in video images
US20150287211A1 (en) * 2014-04-04 2015-10-08 Hrl Laboratories Llc Method for classification and segmentation and forming 3d models from images
CN104199933A (zh) * 2014-09-04 2014-12-10 华中科技大学 一种多模态信息融合的足球视频事件检测与语义标注方法
WO2017092182A1 (zh) * 2015-12-03 2017-06-08 中山大学 一种在超声影像中自动识别肝脏肿瘤类型的方法
CN106296699A (zh) * 2016-08-16 2017-01-04 电子科技大学 基于深度神经网络和多模态mri图像的脑肿瘤分割方法
CN106709924A (zh) * 2016-11-18 2017-05-24 中国人民解放军信息工程大学 基于深度卷积神经网络和超像素的图像语义分割方法
CN106886801A (zh) * 2017-04-14 2017-06-23 北京图森未来科技有限公司 一种图像语义分割方法及装置
CN107220980A (zh) * 2017-05-25 2017-09-29 重庆理工大学 一种基于全卷积网络的mri图像脑肿瘤自动分割方法
CN107341763A (zh) * 2017-06-30 2017-11-10 北京金山安全软件有限公司 一种图像处理方法、装置、电子设备及存储介质
CN107644426A (zh) * 2017-10-12 2018-01-30 中国科学技术大学 基于金字塔池化编解码结构的图像语义分割方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
WANG X ET AL: "Semantic Event Mining Based on Hierarchical Structure for Soccer Video", 《INFORMATION TECHNOLOGY JOURNAL》 *
金雨菲等: "一种基于语义模型的医学图像配准方法", 《生物医学工程学杂志》, vol. 33, no. 02 *

Cited By (56)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109377498B (zh) * 2018-08-31 2021-08-20 大连理工大学 基于循环神经网络的交互式抠图方法
CN109377498A (zh) * 2018-08-31 2019-02-22 大连理工大学 基于循环神经网络的交互式抠图方法
CN110569698A (zh) * 2018-08-31 2019-12-13 阿里巴巴集团控股有限公司 一种图像目标检测及语义分割方法和装置
CN110569698B (zh) * 2018-08-31 2023-05-12 创新先进技术有限公司 一种图像目标检测及语义分割方法和装置
CN109034136A (zh) * 2018-09-06 2018-12-18 湖北亿咖通科技有限公司 图像处理方法、装置、摄像设备及存储介质
CN109461495A (zh) * 2018-11-01 2019-03-12 腾讯科技(深圳)有限公司 一种医学图像的识别方法、模型训练的方法及服务器
WO2020108366A1 (zh) * 2018-11-27 2020-06-04 腾讯科技(深圳)有限公司 图像分割方法、装置、计算机设备及存储介质
US11734826B2 (en) 2018-11-27 2023-08-22 Tencent Technologv (Chenzhen) Company Limited Image segmentation method and apparatus, computer device, and storage medium
CN109598727B (zh) * 2018-11-28 2021-09-14 北京工业大学 一种基于深度神经网络的ct图像肺实质三维语义分割方法
CN109584257B (zh) * 2018-11-28 2022-12-09 中国科学院深圳先进技术研究院 一种图像处理方法及相关设备
CN109598727A (zh) * 2018-11-28 2019-04-09 北京工业大学 一种基于深度神经网络的ct图像肺实质三维语义分割方法
CN109584257A (zh) * 2018-11-28 2019-04-05 中国科学院深圳先进技术研究院 一种图像处理方法及相关设备
CN109657715A (zh) * 2018-12-12 2019-04-19 广东工业大学 一种语义分割方法、装置、设备及介质
CN109657715B (zh) * 2018-12-12 2024-02-06 广东省机场集团物流有限公司 一种语义分割方法、装置、设备及介质
CN109740664B (zh) * 2018-12-28 2023-01-10 东莞中国科学院云计算产业技术创新与育成中心 柔性物体分类方法、装置、计算机设备和存储介质
CN111382759B (zh) * 2018-12-28 2023-04-21 广州市百果园信息技术有限公司 一种像素级分类方法、装置、设备及存储介质
CN109740664A (zh) * 2018-12-28 2019-05-10 东莞中国科学院云计算产业技术创新与育成中心 柔性物体分类方法、装置、计算机设备和存储介质
CN111382759A (zh) * 2018-12-28 2020-07-07 广州市百果园信息技术有限公司 一种像素级分类方法、装置、设备及存储介质
CN109740553A (zh) * 2019-01-09 2019-05-10 贵州宽凳智云科技有限公司 一种基于识别的图像语义分割数据筛选方法及系统
CN109886301A (zh) * 2019-01-16 2019-06-14 深圳创新奇智科技有限公司 一种图像特征排布判断方法及其系统、终端设备
CN109872357A (zh) * 2019-01-16 2019-06-11 创新奇智(广州)科技有限公司 一种物品排列面占比计算方法、系统及电子设备
CN109682381A (zh) * 2019-02-22 2019-04-26 山东大学 基于全向视觉的大视场场景感知方法、系统、介质及设备
CN109886272A (zh) * 2019-02-25 2019-06-14 腾讯科技(深圳)有限公司 点云分割方法、装置、计算机可读存储介质和计算机设备
US11810377B2 (en) 2019-02-25 2023-11-07 Tencent Technology (Shenzhen) Company Limited Point cloud segmentation method, computer-readable storage medium, and computer device
CN109886272B (zh) * 2019-02-25 2020-10-30 腾讯科技(深圳)有限公司 点云分割方法、装置、计算机可读存储介质和计算机设备
CN109977924A (zh) * 2019-04-15 2019-07-05 北京麦飞科技有限公司 针对农作物的无人机机上实时图像处理方法及系统
CN110335277A (zh) * 2019-05-07 2019-10-15 腾讯科技(深圳)有限公司 图像处理方法、装置、计算机可读存储介质和计算机设备
WO2020224424A1 (zh) * 2019-05-07 2020-11-12 腾讯科技(深圳)有限公司 图像处理方法、装置、计算机可读存储介质和计算机设备
US20210366127A1 (en) * 2019-05-07 2021-11-25 Tencent Technology (Shenzhen) Company Limited Image processing method and apparatus, computer-readable storage medium
US11869194B2 (en) 2019-05-07 2024-01-09 Tencent Technology (Shenzhen) Company Limited Image processing method and apparatus, computer-readable storage medium
AU2020203026B2 (en) * 2019-05-08 2021-06-24 Raytheon Company Calculating the precision of image annotations
US11315352B2 (en) 2019-05-08 2022-04-26 Raytheon Company Calculating the precision of image annotations
CN110298236A (zh) * 2019-05-20 2019-10-01 中国科学院计算技术研究所 一种基于深度学习的盲文图像自动识别方法和系统
CN110298236B (zh) * 2019-05-20 2021-11-30 中国科学院计算技术研究所 一种基于深度学习的盲文图像自动识别方法和系统
US11984225B2 (en) 2019-05-22 2024-05-14 Tencent Technology (Shenzhen) Company Limited Medical image processing method and apparatus, electronic medical device, and storage medium
CN110491480B (zh) * 2019-05-22 2021-04-30 腾讯科技(深圳)有限公司 一种医疗图像处理方法、装置、电子医疗设备和存储介质
CN110491480A (zh) * 2019-05-22 2019-11-22 腾讯科技(深圳)有限公司 一种医疗图像处理方法、装置、电子医疗设备和存储介质
CN110276344A (zh) * 2019-06-04 2019-09-24 腾讯科技(深圳)有限公司 一种图像分割的方法、图像识别的方法以及相关装置
CN110276344B (zh) * 2019-06-04 2023-11-24 腾讯科技(深圳)有限公司 一种图像分割的方法、图像识别的方法以及相关装置
CN110708559B (zh) * 2019-09-03 2022-03-25 北京达佳互联信息技术有限公司 图像处理方法、装置及存储介质
CN110708559A (zh) * 2019-09-03 2020-01-17 北京达佳互联信息技术有限公司 图像处理方法、装置及存储介质
CN110765935A (zh) * 2019-10-22 2020-02-07 上海眼控科技股份有限公司 图像处理方法、装置、计算机设备及可读存储介质
CN110781899A (zh) * 2019-10-23 2020-02-11 维沃移动通信有限公司 图像处理方法及电子设备
CN110781899B (zh) * 2019-10-23 2022-11-25 维沃移动通信有限公司 图像处理方法及电子设备
CN111539961A (zh) * 2019-12-13 2020-08-14 山东浪潮人工智能研究院有限公司 一种目标分割方法、装置以及设备
CN111199541A (zh) * 2019-12-27 2020-05-26 Oppo广东移动通信有限公司 图像质量评价方法、装置、电子设备及存储介质
CN111899848B (zh) * 2020-08-05 2023-07-07 中国联合网络通信集团有限公司 图像识别方法及设备
CN111899848A (zh) * 2020-08-05 2020-11-06 中国联合网络通信集团有限公司 图像识别方法及设备
CN112634282A (zh) * 2020-12-18 2021-04-09 北京百度网讯科技有限公司 图像处理方法、装置以及电子设备
CN112634282B (zh) * 2020-12-18 2024-02-13 北京百度网讯科技有限公司 图像处理方法、装置以及电子设备
CN112699948A (zh) * 2020-12-31 2021-04-23 无锡祥生医疗科技股份有限公司 超声乳腺病灶的分类方法、装置及存储介质
CN113035306A (zh) * 2021-03-17 2021-06-25 广州华端科技有限公司 一种远程浏览影像的方法、系统、设备及介质
CN113035306B (zh) * 2021-03-17 2024-03-29 广州开云影像科技有限公司 一种远程浏览影像的方法、系统、设备及介质
CN112861885B (zh) * 2021-03-25 2023-09-22 北京百度网讯科技有限公司 图像识别方法、装置、电子设备及存储介质
CN112861885A (zh) * 2021-03-25 2021-05-28 北京百度网讯科技有限公司 图像识别方法、装置、电子设备及存储介质
CN114494251A (zh) * 2022-04-06 2022-05-13 南昌睿度医疗科技有限公司 Spect图像处理方法以及相关设备

Also Published As

Publication number Publication date
CN108427951B (zh) 2023-08-04

Similar Documents

Publication Publication Date Title
CN108427951A (zh) 图像处理方法、装置、存储介质和计算机设备
CN109872364B (zh) 图像区域定位方法、装置、存储介质和医学影像处理设备
Bahrami et al. Convolutional neural network for reconstruction of 7T-like images from 3T MRI using appearance and anatomical features
CN107492071A (zh) 医学图像处理方法及设备
CN110689547B (zh) 一种基于三维ct影像的肺结节分割方法
CN109636769A (zh) 基于双路密集残差网络的高光谱和多光谱图像融合方法
CN112150428A (zh) 一种基于深度学习的医学图像分割方法
Li et al. Deep learning methods in real-time image super-resolution: a survey
CN110136809A (zh) 一种医疗图像处理方法、装置、电子医疗设备和存储介质
CN109389584A (zh) 基于cnn的多尺度鼻咽肿瘤分割方法
CN111291825A (zh) 病灶分类模型训练方法、装置、计算机设备和存储介质
Xia et al. Md-net: multi-scale dilated convolution network for CT images segmentation
CN112288041B (zh) 一种多模态深度神经网络的特征融合方法
Pashaei et al. Deep learning-based single image super-resolution: an investigation for dense scene reconstruction with UAS photogrammetry
KR20190042429A (ko) 이미지 처리 방법
Molahasani Majdabadi et al. Capsule GAN for prostate MRI super-resolution
Tavse et al. A systematic literature review on applications of GAN-synthesized images for brain MRI
Qin et al. Deep ResNet based remote sensing image super-resolution reconstruction in discrete wavelet domain
Jiang et al. Deep cross‐modality (MR‐CT) educed distillation learning for cone beam CT lung tumor segmentation
CN117115359B (zh) 一种基于深度图融合的多视图电网三维空间数据重建方法
CN116630828B (zh) 基于地形环境适配的无人机遥感信息采集系统及方法
KR102222366B1 (ko) 딥러닝 기반 고자기장 자기공명영상 합성 방법 및 장치
CN116664590A (zh) 基于动态对比增强磁共振图像的自动分割方法及装置
CN112329867A (zh) 一种基于任务驱动的层次注意力网络的mri图像分类方法
KR102604217B1 (ko) 잔차 컨볼루션 기반 딥러닝 네트워크를 이용한 영상 분할 방법 및 장치

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant