CN107729948A - 图像处理方法及装置、计算机产品和存储介质 - Google Patents

图像处理方法及装置、计算机产品和存储介质 Download PDF

Info

Publication number
CN107729948A
CN107729948A CN201711052903.4A CN201711052903A CN107729948A CN 107729948 A CN107729948 A CN 107729948A CN 201711052903 A CN201711052903 A CN 201711052903A CN 107729948 A CN107729948 A CN 107729948A
Authority
CN
China
Prior art keywords
image
machine learning
learning module
module
feature extraction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201711052903.4A
Other languages
English (en)
Inventor
李莹莹
李正龙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
BOE Technology Group Co Ltd
Original Assignee
BOE Technology Group Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by BOE Technology Group Co Ltd filed Critical BOE Technology Group Co Ltd
Priority to CN201711052903.4A priority Critical patent/CN107729948A/zh
Publication of CN107729948A publication Critical patent/CN107729948A/zh
Priority to US15/974,926 priority patent/US11138738B2/en
Priority to US17/463,898 priority patent/US20210398287A1/en
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2413Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/11Region-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/764Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/08Feature extraction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/10Machine learning using kernel methods, e.g. support vector machines [SVM]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20076Probabilistic image processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
    • G06V10/443Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components by matching or filtering
    • G06V10/449Biologically inspired filters, e.g. difference of Gaussians [DoG] or Gabor filters
    • G06V10/451Biologically inspired filters, e.g. difference of Gaussians [DoG] or Gabor filters with interaction between the filter responses, e.g. cortical complex cells
    • G06V10/454Integrating the filters into a hierarchical structure, e.g. convolutional neural networks [CNN]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/03Recognition of patterns in medical or anatomical images

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Computational Linguistics (AREA)
  • Molecular Biology (AREA)
  • Mathematical Physics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Databases & Information Systems (AREA)
  • Medical Informatics (AREA)
  • Quality & Reliability (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)

Abstract

本申请实施例公开了一种图像处理方法及装置、计算机产品和存储介质。该图像处理方法,包括:将第一图像进行变换,得到多张第二图像;从包括至少一个第一机器学习模块的组中选择第一机器学习模块,对所述第二图像进行特征提取,得到对应每个第二图像的特征图;以及将所述对应每个第二图像的特征图输入第二机器学习模块,得到所述第一图像的处理结果。根据本申请实施例的技术方案,有效提高了图像处理的精度和鲁棒性。

Description

图像处理方法及装置、计算机产品和存储介质
技术领域
本申请一般涉及计算机技术领域,具体涉及一种图像处理方法及装置、计算机产品和存储介质。
背景技术
图像处理技术在地测图像、遥感及医学图像等许多领域具有广泛的应用。因而,如何快速准确地完成图像数据的处理,一直以来是计算机领域的热点之一。
随着机器学习技术的发展,越来越多的机器学习模型和算法被引入图像处理技术中。目前,常用的图像处理模型多为单一模型,且结构简单,因而存在图像识别处理精度不高和鲁棒性较差的问题。
发明内容
第一方面,本申请实施例提供了一种图像处理方法,包括:
将第一图像进行变换,得到多张第二图像;
从包括至少一个第一机器学习模块的组中选择第一机器学习模块,对所述第二图像进行特征提取,得到对应每个第二图像的特征图;以及
将所述对应每个第二图像的特征图输入第二机器学习模块,得到所述第一图像的处理结果。
第二方面,本申请实施例还提供了一种图像处理装置,包括:
图像变换模块,被配置为对第一图像进行变换,得到多个第二图像;
特征提取模块,包括至少一个第一机器学习模块,被配置为通过第一机器学习模块对所述第二图像进行特征提取,得到对应每个第二图像的特征图;以及
图像处理模块,包括第二机器学习模块,被配置为对对应每个第二图像的特征图进行处理,得到所述第一图像的处理结果。
第三方面,本申请实施例还提供了一种计算机产品,包括:
一个或多个处理器;
所述一个或多个处理器被配置为运行计算机指令时执行根据本申请各实施例提供的图像处理方法。
第四方面,本申请实施例还提供了一种计算机可读存储介质,存储有由处理器运行的计算机指令,所述计算机指令被处理器运行时可以执行根据本申请各实施例提供的图像处理方法。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:
图1示出了根据本申请实施例的图像处理方法的示例性流程图;
图2示出了本申请一实施例的图像处理方法中对第二图像进行特征提取过程的示例性流程图;
图3示出了根据本申请一实施例的图像处理方法中第二机器学习模块进行图像处理过程的示例性流程图;
图4示出了本申请一实施例提供的图像处理装置的结构示意图;以及
图5示出了本申请一实施例用来实现本申请实施例方法的计算机产品的结构示意图。
具体实施方式
下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关发明,而非对该发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与发明相关的部分。
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
除非另外定义,本公开使用的技术术语或者科学术语应当为本发明所属领域内具有一般技能的人士所理解的通常意义。本公开中使用的“第一”、“第二”以及类似的词语并不表示任何顺序、数量或者重要性,而只是用来区分不同的组成部分。同样,“包括”或者“包含”等类似的词语意指出现该词前面的元件或者物件涵盖出现在该词后面列举的元件或者物件及其等同,而不排除其他元件或者物件。“连接”或者“相连”等类似的词语并非限定于物理的或者机械的连接,而是可以包括电性连接或信号连接,不管是直接的还是间接的。
在下述实施例中,通讯连接包括通过无线网络、有线网络、和/或无线网络和有线网络的任意组合进行连接。网络可以包括局域网、互联网、电信网、基于互联网和/或电信网的物联网、和/或以上网络的任意组合等。有线网络例如可以采用金属走线、双绞线、同轴电缆或光纤传输等方式进行信息传输,无线网络例如可以采用WWAN移动通信网络、蓝牙、Zigbee或者Wi-Fi等通信方式。
在下述实施例中,处理器是具有执行逻辑运算的处理器件,例如中央处理器(CPU)、现场可编程逻辑阵列(FPGA)、数字信号处理器(DSP)、单片机(MCU)、专用逻辑电路(ASIC)、图像处理器(GPU)等具有数据处理能力和/或程序执行能力的器件。容易理解,处理器通常通讯连接存储器,在存储器上存储一个或多个计算机程序产品的任意组合,存储器可以包括各种形式的计算机可读存储介质,例如易失性存储器和/或非易失性存储器。易失性存储器例如可以包括随机存取存储器(RAM)和/或高速缓冲存储器(cache)等。非易失性存储器例如可以包括只读存储器(ROM)、硬盘、可擦除可编程只读存储器(EPROM)、USB存储器、闪存等。在存储器上可以存储一个或多个计算机指令,处理器可以运行所述计算机指令,以实现相关的分析功能。在计算机可读存储介质中还可以存储各种应用程序和各种数据,例如应用程序使用和/或产生的各种数据等。
在下述实施例中,各模块都可以通过处理器执行相关计算机指令实现,例如图像变换模块可以通过处理器执行图像变换算法的指令实现、机器学习模块可以通过处理器执行机器学习算法的指令实现、神经网络可以通过处理器执行神经网络算法的指令实现。
在下述实施例中,各模块可以运行在同一个处理器上,也可以运行在多个处理器上;各模块可以运行在同一架构的处理器上,例如均在X86体系的处理器上运行,也可以运行在不同架构的处理器上,例如图像变换模块运行在X86体系的CPU,第一和第二机器学习模块运行在GPU。各模块可以封装在一个计算机产品中,例如各模块封装在一个计算机软件并运行在一台计算机(服务器),也可以各自或部分封装在不同的计算机产品,例如图像变换模块封装在一个计算机软件中并运行在一台计算机(服务器),第一和第二机器学习模块分别封装在单独的计算机软件中并运行在另一台或多台计算机(服务器);各模块执行时的计算平台可以是本地计算,也可以是云计算,还可以是本地计算与云计算构成的混合计算。
在下述实施例中,机器学习(例如神经网络)的实现可以采用现有的预置了参数的机器学习(例如神经网络)框架,也可以采用现有的机器学习(例如神经网络)框架通过本申请实施例的相关图像样本进行训练得到所需参数的机器学习(例如神经网络)框架,还可以是根据本申请实施例发明实质精神,建立机器学习(例如神经网络)框架并进行训练。
图1示出了根据本申请实施例的图像处理方法的示例性流程图。
如图1所示,本申请实施例提供的图像处理方法包括:
步骤S10:将第一图像进行变换,得到多张第二图像。
在本申请实施例中,第一图像通过变换可以得到多张第二图像。该变换处理可以根据第一图像所包含的信息不同,采用不同的变换方法,也可以根据所需提取的特征不同,采用不同的变换方法。
可选地,步骤S10包括:
将第一图像按照变换规则进行变换,得到多张第二图像。
在本申请实施例中,变换规则可以是根据第一图像的特征不同而不同,也可以是根据所需提取特征的不同而不同。对于第一图像,可以按照一种或多种变换规则进行处理。
可选地,变换规则包括空域变换、值域变换或时域变换中的至少一种,也可以基于上述变换规则选择根据与该第一图像相关的专业领域所建议的变换。
其中,空域变换,如对图像旋转、翻转、平移、拉伸、扭曲、变形、缩放等;值域变换,如图像滤波、图像分割、图像遮挡、图像压缩、色度映射、彩色化、灰度化等;时域变换,如自相关函数变换、互相关函数变换等。
可选地,当第一图像为具有特定应用或性质的图像时,为了不影响第一图像中包含的深层本质特征,所进行的变换采用与该第一图像相关的专业领域所建议的变换。
例如,第一图像为医学图像,所进行的变换是不改变医学图像病理性质的变换,包括通常在医学图像变换中采用的空域变换,例如对图像旋转、翻转、平移、拉伸、扭曲、变形、缩放等;和色彩变换,例如对图像灰度化、二值化等。
可选地,对第一图像进行变换,可以基于单一的变换规则获得多个第二图像,也可以基于多种变换规则获得多个第二图像。
例如,以黑色素瘤的皮肤镜图像为例,可以将1张图像进行不同程度的旋转变换得到5张第二图像;也可以将1张图像旋转变换为3张,基于色彩恒常理论进行处理为2张,得到5张第二图像;还可以将1张图像既旋转又基于色彩恒常理论进行处理,变换得到5张第二图像。
例如,以黑色素瘤的皮肤镜图像为例,在医生等医学图像领域专业人员的指导下,可以通过对其进行旋转、翻转、灰度化等变换,将1张原始的皮肤镜图像变换为5张第二图像。
上述实施例中,通过对第一图像变换处理,在不影响图像有效信息的基础上,增加了图像数据量,有助于提高图像处理和识别的精度。
步骤S20:从包括至少一个第一机器学习模块的组中选择第一机器学习模块,对第二图像进行特征提取,得到多张与每个第二图像对应的特征图(feature map)。
在本申请实施例中,第一机器学习模块可以采用机器学习领域任意可用的特征提取算法实现,例如,主分量分析、Fisher线性鉴别、投影追踪、神经网络、遗传算法等。所需提取的特征可以是图像包含的各种特征,例如,包括但不限于颜色、灰度、纹理、轮廓、区域、特殊的点、线以及这些特征的任意组合等。
上述实施例中,根据需求选择合适的第一机器学习模块进行特征提取,可以有效去除第一图像中的无用特征及噪音干扰,防止不同的第二图像一同进行特征提取时的相互干扰,从而保留每个第二图像中所具有的第一图像的本质特征,提高了图像处理过程的精度和适应性。
可选地,第一机器学习模块包括第一神经网络。
在本申请的一些实施例中,包括至少一个第一机器学习模块的组中,每个第一神经网络是相同的,可以预先按照一般神经网络的训练过程进行相关训练以获得不同的参数,并选取表现效果最好的第一神经网络作为特征提取使用。
在本申请的一些实施例中,包括至少一个第一机器学习模块的组中,至少部分第一机器学习模块的第一神经网络是不同的,例如架构相同但参数不同,例如架构不同,可以预先按照一般神经网络的训练过程进行相关训练,并选取表现效果最好的一个或几个第一神经网络作为特征提取使用。使用的时候,每个第二图像进行特征提取时均从表现效果最好的一个或几个第一神经网络中随机选择一个用于提取特征。
在本申请的一些实施例中,包括至少一个第一机器学习模块的组中,至少部分第一机器学习模块的第一神经网络是本领域技术人员针对所变换出的第二图像的类型从本领域已有的神经网络中选择的至少适合部分第二图像进行特征提取的,将这些第一神经网络一一对应的用于所针对的第二图像的特征提取;或者,可选地,对多个不同架构的第一神经网络进行训练,选择部分训练形成的第一神经网络与至少部分第二图像一一对应进行特征提取;或者,可选地,对多个相同架构的第一神经网络进行训练,选择部分训练形成的不同参数的第一神经网络与至少部分第二图像一一对应进行特征提取。
其中,第一神经网络可以采用卷积神经网络CNN、深度神经网络DNN、循环神经网络RNN、自编码神经网络AENN、稀疏自编码机SAE等各种常见的神经网络架构,或采用基于常见神经网络架构实现的神经网络产品,例如AlexNet、VGGNet、Google Inception Net、ResNet等,也可以根据神经网络的原理设计神经网络结构。
步骤S30:将多张对应每一第二图像的特征图输入第二机器学习模块,得到第一图像的处理结果。
在本申请实施例中,将步骤S20中得到的所有与第二图像对应的特征图输入第二机器学习模块进行处理,该处理可以为一种或多种图像处理过程,如图像分析、分割、识别、分类、聚类、超分辨率提升、检索等。
在本申请的一些实施例中,图像处理方法是对第一图像进行分类或聚类。
在本申请实施例中,第二机器学习模块可以是进行特征图处理的任意算法,例如支持向量机、简单融合、协同训练融合、神经网络等。
在本申请的一些实施例中,第二机器学习模块包括第二神经网络,第二神经网络可以采用卷积神经网络CNN、深度神经网络DNN、循环神经网络RNN、自编码神经网络AENN、稀疏自编码机SAE等各种常见的神经网络架构,或采用基于常见神经网络架构实现的神经网络产品,例如AlexNet、VGGNet、Google Inception Net、ResNet等,也可以根据神经网络的原理设计神经网络结构。
本领域技术人员容易理解,适应于图像处理目的的需要,第二神经网络具有其对应的结构,例如当所述图像处理是对图像进行分类/聚类时,在第二神经网络的输出层设有分类器;当所述图像处理是对图像进行分辨率提升时时,在第二神经网络中设有反卷积层。
上述实施例中,通过将变换后的每个第二图像输入第一机器学习模块中进行特征图提取,并将特征图输入第二机器学习模块中处理,大大提高了图像处理的精度和鲁棒性。
图2示出了根据本申请一实施例的图像处理方法中第二图像进行特征提取过程的示例性流程图。
如图2所示,在一实施例中,步骤S20包括:
步骤S21:包括至少一个第一机器学习模块的组包括多个第一机器学习模块。
在本申请的一些实施例中,每个第一机器学习模块预先按照一般机器学习的训练过程进行相关训练,并选取表现效果较好的多个机器学习模块作为特征提取需要使用的候选。该表现效果可以根据机器学习模块在测试集上的表现衡量。
步骤S22:从多个第一机器学习模块中选择一个第一机器学习模块,例如随机选择,例如结合本领域技术人员的经验选择,对第二图像中的一张进行特征提取,重复该过程,直至完成所有第二图像的特征提取。
对于多个第二图像中的每个图像,可以从上述所选择的第一机器学习模块行特征提取。第二图像中的每一张图像可以采用同一个第一机器学习模块进行特征提取,也可以采用不同的第一机器学习模块进行特征提取。
此处所称的不同的第一机器学习模块,可以是架构相同,但设计参数不同;也可以是架构不同。
也就是说,可以选择出一个经过训练且有效的第一机器学习模块对每一张第二图像进行特征提取,也可以针对部分第二图像,分别选取适合其的第一机器学习模块进行特征提取,还可以针对每个第二图像,分别选取一种相对应的第一机器学习模块进行特征提取。
在本申请的一些实施例中,针对第一图像变换出的每个第二图像,均选择适合于相应变换规则的第一机器学习模块提取对应的第二图像的特征,以改善处理精度。例如,对于基于灰度化变换产生的第二图像,采用基于卷积神经网络CNN的第一机器学习模块进行特征提取;对于基于拉伸、扭曲等变换产生的第二图像,采用基于深度神经网络DNN的第一机器学习模块进行特征提取;对于随机添加图像噪音等变换产生的第二图像,采用基于去噪自编码DAE的第一机器学习模块进行特征提取。
在本申请的一些实施例中,还包括步骤S23:所选择的第一机器学习模块对所述第二图像进行特征提取,输出分辨率相同的对应每个第二图像的特征图。例如,以第一机器学习模块采用第一神经网络实现为例,通过所选择的第一机器学习模块的第一神经网络的至少一个中间层输出分辨率相同的对应每个第二图像的特征图。
通过这样的方法,有效减少了第二机器学习模块进行图像处理时的压力。
例如,对于皮肤镜图像,根据其图像特征,可以选择Inception v3神经网络,将皮肤镜图像变换后得到的5张第二图像均通过Inception v3神经网络进行特征提取。将每张第二图像输入到Inception v3模型中,由于该模型中间层能提取出768个17*17的特征图,也能提取出1280个8*8的特征图,根据所需要提取的皮肤镜图像的特征,选择特征图,例如选择提取1280个8*8分辨率的特征图,共提取5*1280个特征图。
例如,对于皮肤镜图像,将皮肤镜图像变换后得到的5张第二图像,其中灰度化和二值化的第二图像通过Inception v3神经网络进行特征提取,旋转、拉伸、翻转的第二图像通过Inception-ResNet-v2神经网络进行特征提取。分别选择两个神经网络的不同中间层,使其均输出768个17*17的特征图,共提取5*768个特征图。
本领域技术人员可以理解,基于深度学习神经网络的快速发展和硬件计算能力的迅速增长,也可以选择输出不同分辨率的部分第二图像的特征图,例如部分特征图的分辨率为8*8,部分特征图的分辨率为16*16,部分特征图的分辨率为32*32。
上述实施例中,通过第一机器学习模块,例如第一神经网络进行特征图提取,大大提高了图像处理过程的鲁棒性和容错能力;同时,根据需求选择合适的第一机器学习模块筛选提取特征图,有效地优化了图像处理速度、精度及稳定性。
图3示出了根据本申请一实施例的图像处理方法中第二机器学习模块进行图像处理过程的示例性流程图。
如图3所示,在本申请的一些实施例中,步骤S30包括:
步骤S31:获得第二机器学习模块。
例如,可以通过选择现有的神经网络或通过训练生成新的神经网络作为第二机器学习模块。
在本申请的一些实施例中,第二机器学习模块可以与包括至少一个第一机器学习模块的组的某个第一机器学习模块相同,也可以不同,具体网络结构可以根据具体需求预先构建并训练得到。
例如,以使用第二神经网络作为第二机器学习模块为例,该第二神经网络结构可以设计为卷积层-全连接层-LR分类器,以第一图像进行分类,也可以设计为卷积层-池化层-全连接层-SVM分类器以对第一图像进行分类,还可以设计为卷积层-池化层-K均值聚类,以对第一图像进行聚类,还可以设计为卷积层-全连接层-反卷积层,以对第一图像进行分辨率提升,诸如此类,具体可根据图像处理目的的需要进行设计。
步骤S32:将分别对应每个第二图像的多张特征图输入到第二机器学习模块。
第二机器学习模块处理的对象为步骤S20所得到的全部的特征图,该特征图的像素、尺寸或数量,可以相同也可以不同。
步骤S33:第二机器学习模块输出第一图像的处理结果。
第二机器学习模块可以通过将所有特征图融合在一起,对其进行处理,得到最终处理结果并输出。
上述实施例中,通过将多张特征图全部输入第二机器学习模块进行处理,提升了图像处理的精度和鲁棒性。
图4出了本申请一实施例提供的图像处理装置的结构示意图。
如图4所示,该图像处理装置包括:
图像变换模块10:被配置为对第一图像进行变换,得到多个第二图像。
在本申请实施例中,每张第一图像通过图像变换模块10变换可以得到多张第二图像。该变换处理可以根据第一图像所包含的信息不同,采用不同的变换技术,也可以根据所需提取的特征不同,采用不同的变换技术。
在本申请的一些实施例中,图像变换单元10,被配置为:将第一图像按照变换规则进行处理,得到多张第二图像。
在本申请的一些实施例中,图像变换模块10的变换规则可以是根据第一图像的特征不同而不同,也可以是根据所需提取特征的不同而不同。对于每张第一图像,可以按照一种或多种变换规则进行处理。
例如,对于黑色素瘤的皮肤镜图像,可以将1张图像只进行旋转变换得到5张第二图像;也可以将1张图像旋转变换为3张,基于色彩恒常理论进行处理为2张,得到5张第二图像;还可以将1张图像既旋转又基于色彩恒常理论进行处理,变换得到5张第二图像。
可选地,变换规则包括空域变换、值域变换或时域变换,也可以基于上述变换规则选择根据与该第一图像相关的专业领域所建议的变换。
其中,空域变换,如对图像旋转、翻转、平移、拉伸、扭曲、变形、缩放等;值域变换,如图像滤波、图像分割、图像遮挡、图像压缩、色度映射、彩色化、灰度化等;时域变换,如自相关函数变换、互相关函数变换等。
可选地,当第一图像为具有特定应用或性质的图像时,为了不影响第一图像中包含的深层本质特征,所进行的变换采用与该第一图像相关的专业领域所建议的变换。
例如,第一图像为医学图像,所进行的变换是不改变医学图像病理性质的变换,包括通常在医学图像变换中采用的空域变换,例如对图像旋转、翻转、平移、拉伸、扭曲、变形、缩放等;和色彩变换,例如对图像灰度化、二值化等。
例如,对于黑色素瘤的皮肤镜图像,在医生的指导下,图像变换模块10可以通过对其进行旋转、翻转变换,将1张原始的皮肤镜图像变换为5张第二图像。
上述实施例中,通过图像变换模块对第一图像变换,在不影响图像有效信息的基础上,增加了图像数据量,有助于后续处理提高图像处理和识别的精度。
特征提取模块20:包括至少一个第一机器学习模块,被配置为选择第一机器学习模块,对第二图像进行特征提取,得到与每个第二图像对应的特征图。
在本申请实施例中,第一机器学习模块可以采用机器学习领域任意可用的特征提取算法实现,例如,包括但不限于主分量分析、Fisher线性鉴别、投影追踪、神经网络、遗传算法等。所需提取的特征可以是图像包含的各种特征,例如,包括但不限于颜色、灰度、纹理、轮廓、区域、特殊的点、线以及这些特征的任意组合等。
上述实施例中,根据需求选择合适的第一机器学习模块进行特征提取,可以有效去除第一图像中的无用特征及噪音干扰,防止不同的第二图像一同进行特征提取时的相互干扰,从而保留每个第二图像中所具有的第一图像的本质特征,从而提高了图像处理过程的精度和适应性。
可选地,第一机器学习模块包括第一神经网络。
在本申请的一些实施例中,每个第一神经网络是相同的,可以预先按照一般神经网络的训练过程进行相关训练以获得不同的参数,并选取表现效果最好的第一神经网络作为特征提取使用。
在本申请的一些实施例中,至少部分第一神经网络是不同的,例如可以是架构相同但参数不同,例如可以是架构不同,可以预先按照一般神经网络的训练过程进行相关训练,并选取表现效果最好的一个或几个第一神经网络进行特征提取。使用的时候,每个第二图像进行特征提取时均从表现效果最好的一个或几个第一神经网络中随机选择一个用于提取特征。
在本申请的一些实施例中,至少部分第一神经网络是本领域技术人员针对所变换出的第二图像的类型从本领域已有的神经网络中选择的至少适合部分第二图像进行特征提取的,将这些第一神经网络一一对应的用于所针对的第二图像的特征提取;或者,可选地,对多个不同架构的第一神经网络进行训练,选择部分训练形成的第一神经网络与至少部分第二图像一一对应进行特征提取;或者,可选地,对多个相同架构的第一神经网络进行训练,选择部分训练形成的不同参数的第一神经网络与至少部分第二图像一一对应进行特征提取。
其中,第一神经网络可以采用卷积神经网络CNN、深度神经网络DNN、循环神经网络RNN、自编码神经网络AENN、稀疏自编码机SAE等各种常见的神经网络架构,或采用基于常见神经网络架构实现的神经网络产品,例如AlexNet、VGGNet、Google Inception Net、ResNet等,也可以根据神经网络的原理设计神经网络结构。
可选地,特征提取模块20,被配置为:
选择一个第一机器学习模块,对多张第二图像中的一张进行特征提取,重复该过程直到完成所有第二图像的特征提取。
在本申请的一些实施例中,特征提取模块20,包括多个第一机器学习模块,被具体配置为
首先,每个第一机器学习模块预先进行训练,并选取表现效果较好的第一机器学习模块作为特征提取需要使用的候选。该表现效果可以根据其在测试集上的表现衡量,评估指标根据具体需求而定。
然后,对于多张第二图像中的每张图像,可以从上述候选第一机器学习模块,随机选择一个进行特征提取。第二张图像中的每一张图像可以采用同一个第一机器学习模块进行特征提取,也可以采用不同的第一机器学习模块进行特征提取。
在本申请的一些实施例中特征提取过程中,特征提取模块20被配置为,第一机器学习模块对第二图像进行特征提取,输出分辨率相同的对应每个第二图像的特征图。例如,以第一机器学习模块采用第一神经网络实现为例,通过所选择的第一机器学习模块的第一神经网络的至少一个中间层输出分辨率相同的对应每个第二图像的特征图。。
例如,对于皮肤镜图像,根据其图像特征,选择Inception v3神经网络,将皮肤镜图像变换后得到的5张第二图像均通过Inception v3神经网络进行特征提取。将每张第二图像输入到Inception v3模型中,由于该模型中间层能提取出768个17*17的特征图,也能提取出1280个8*8的特征图,根据所需要提取的皮肤镜图像的特征,选择特征图,例如选择提取1280个8*8分辨率的特征图,共提取5*1280个特征图。
例如,对于皮肤镜图像,将皮肤镜图像变换后得到的5张第二图像,其中灰度化和二值化的第二图像通过Inception v3神经网络进行特征提取,旋转、拉伸、翻转的第二图像通过Inception-ResNet-v2神经网络进行特征提取。分别选择两个神经网络的不同中间层,使其均输出768个17*17的特征图,共提取5*768个特征图。
本领域技术人员可以理解,基于深度学习神经网络的快速发展和硬件计算能力的迅速增长,特征提取模块20也可以被配置为输出不同分辨率的部分第二图像的特征图,例如部分特征图的分辨率为8*8,部分特征图的分辨率为16*16,部分特征图的分辨率为32*32。
上述实施例中,通过第一机器学习模块进行适应于第一图像变换得到的第二图像特征图提取,提高了图像处理过程的鲁棒性和容错能力;同时,根据需求选择合适的第一机器学习模块及其输出的特征图的分辨率,有效地优化了图像处理速度、精度及稳定性。
图像处理模块30,包括第二机器学习模块:被配置为将多张对应每一第二图像的特征图全部输入第二机器学习模块,得到第一图像的处理结果。
在本申请实施例中,图像处理模块30用于将特征提取模块20中得到的所有特征图输入第二机器学习模块进行处理,该处理可以为一种或多种的图像处理过程,如图像分析、分割、识别、分类、聚类或检索等。该第二机器学习模块可以是进行特征图融合的任意算法或模型,例如支持向量机、简单融合、协同训练融合、神经网络等。
在本申请的一些实施例中,图像处理模块30中,第二机器学习模块处理的对象为所得到的全部的特征图,该特征图的像素、尺寸或数量,可以相同也可以不同。第二机器学习模块可以通过将所有特征图融合在一起,对其进行分析处理,得到最终处理结果并输出。
在本申请的一些实施例中,第二机器学习模块包括第二神经网络,例如相关技术中已知的神经网络或将已知的神经网络进行训练生成具有新的参数的神经网络或形成新的架构的神经网络。
在本申请的一些实施例中,第二机器学习模块可以采用第一机器学习模块中的一个,也可以根据要完成的图像处理的需要设计、构建并训练得到新的结构。
例如,在本公开的一些实施例中,以使用第二神经网络作为第二机器学习模块为例,该第二神经网络结构可以设计为卷积层-全连接层-LR分类器,以第一图像进行分类,也可以设计为卷积层-池化层-全连接层-SVM分类器以对第一图像进行分类,还可以设计为卷积层-池化层-K均值聚类,以对第一图像进行聚类,还可以设计为卷积层-全连接层-反卷积层,以对第一图像进行分辨率提升,诸如此类,具体可根据图像处理目的的需要进行设计。
在上述实施例中,图像处理模块30中的第二机器学习模块对特征提取模块输出的多张特征图进行处理,提升了图像处理的精度和鲁棒性。
需要注意的是,尽管上述没有对图像变换模块、特征提取模块、图像处理模块之间的连接关系做具体描述,本领域技术人员基于上述实施例所描述的技术方案能够理解图像变换模块与特征提取模块是通讯连接的、特征提取模块与图像处理模块是通讯连接的。
在本申请的一些实施例中,还提供了一种计算机产品,包括:一个或多个处理器;一个或多个处理器被被配置为运行计算机程序时执行根据上述各实施例提供的图像处理方法。
在本申请的一些实施例中,如图5所示,提供了计算机产品在结构上的一个实现。计算机产品500包括中央处理单元(CPU)501,其可以根据存储在只读存储器(ROM)502中的程序或者从存储部分508加载到随机访问存储器(RAM)503中的程序而执行各种适当的动作和处理。在RAM 503中,还存储有设备500操作所需的各种程序和数据。CPU 501、ROM 502以及RAM 503通过总线504彼此相连。输入/输出(I/O)接口505也连接至总线504。
以下部件连接至I/O接口505:包括键盘、鼠标等的输入部分506;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分507;包括硬盘等的存储部分508;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分509。通信部分509经由诸如因特网的网络执行通信处理。驱动器510也根据需要连接至I/O接口505。可拆卸介质511,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器510上,以便于从其上读出的计算机程序根据需要被安装入存储部分508。
特别地,根据本公开的实施例,上文参考图1描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括有形地包含在机器可读介质上的计算机程序,该计算机程序包含用于执行图1的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分509从网络上被下载和安装,和/或从可拆卸介质511被安装。
附图中的流程图和框图,图示了按照本发明各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,所述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本申请实施例中所涉及到的单元或模块可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的单元或模块也可以设置在处理器中。这些单元或模块的名称在某种情况下并不构成对该单元或模块本身的限定。
在一些实施例中,还提供了一种计算机可读存储介质,该计算机可读存储介质可以是上述实施例中所述计算机产品中所包含的计算机可读存储介质;也可以是单独存在,未装配入计算机产品中的计算机可读存储介质。所提供的计算机可读存储介质存储有由处理器运行的计算机指令,所述计算机指令被处理器运行时可以执行根据本申请各实施例提供的图像处理方法。
以上描述仅为本申请的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本申请中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离所述发明构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本申请中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。

Claims (17)

1.一种图像处理方法,其特征在于,所述方法包括:
将第一图像进行变换,得到多张第二图像;
从包括至少一个第一机器学习模块的组中选择第一机器学习模块,对所述第二图像进行特征提取,得到对应每个第二图像的特征图;以及
将所述对应每个第二图像的特征图输入第二机器学习模块,得到所述第一图像的处理结果。
2.根据权利要求1所述的方法,其特征在于,所述从包括至少一个第一机器学习模块的组中选择第一机器学习模块,对所述第二图像进行特征提取,得到对应每个第二图像的特征图,包括:
从包括至少一个第一机器学习模块的组中选择一个第一机器学习模块,对所述第二图像中的一张进行特征提取;
重复上述步骤,直到完成所有第二图像的特征提取。
3.根据权利要求1所述的方法,其特征在于,所述从包括至少一个第一机器学习模块的组中选择第一机器学习模块,对所述第二图像进行特征提取,得到对应每个第二图像的特征图,包括:
至少部分所述第二图像,从包括至少一个第一机器学习模块的组中分别选择一一对应的第一机器学习模块进行特征提取。
4.根据权利要求2或3所述的方法,其特征在于,所选择的第一机器学习模块对所述第二图像进行特征提取,输出分辨率相同的对应每个第二图像的特征图。
5.根据权利要求4所述的方法,其特征在于,所述第一机器学习模块包括第一神经网络,通过所选择的第一机器学习模块的第一神经网络的至少一个中间层输出分辨率相同的对应每个第二图像的特征图。
6.根据权利要求1所述的方法,其特征在于,所述第二机器学习模块包括第二神经网络。
7.根据权利要求1所述的方法,其特征在于,所述将第一图像进行变换,得到多张第二图像,包括:
将所述第一图像按照变换规则进行处理,得到多张第二图像;所述变换规则包括空域变换、值域变换或时域变换中的至少一种。
8.根据权利要求7所述的方法,其特征在于,所述第一图像包括医学图像,所述将第一图像进行变换是不改变医学图像病理性质的变换。
9.根据权利要求1所述的方法,其特征在于,所述第一图像的处理结果包括对第一图像进行分类或聚类。
10.一种图像处理装置,其特征在于,包括:
图像变换模块,被配置为对第一图像进行变换,得到多个第二图像;
特征提取模块,包括至少一个第一机器学习模块,被配置为通过第一机器学习模块对所述第二图像进行特征提取,得到对应每个第二图像的特征图;以及
图像处理模块,包括第二机器学习模块,被配置为对对应每个第二图像的特征图进行处理,得到所述第一图像的处理结果。
11.根据权利要求10所述的图像处理装置,其特征在于,所述特征提取模块,被配置为选择一个第一机器学习模块对每个第二图像进行特征图提取。
12.根据权利要求10所述的图像处理装置,其特征在于,所述特征提取模块,被配置为选择多个第一机器学习模块与至少部分第二图像一一对应进行特征提取。
13.根据权利要求10所述的图像处理装置,其特征在于,所述特征提取模块,被配置为对每个所述第二图像进行特征提取,得到分辨率相同的对应每个第二图像的特征图。
14.根据权利要求10所述的图像处理装置,其特征在于,所述第一机器学习模块包括第一神经网络。
15.根据权利要求10所述的图像处理装置,其特征在于,所述第二机器学习模块包括第二神经网络。
16.一种计算机产品,其特征在于,包括:
一个或多个处理器;
所述一个或多个处理器被配置为运行计算机指令时执行如权利要求1-9中任一所述的方法。
17.一种计算机可读存储介质,存储有由处理器运行的计算机指令,所述计算机指令被处理器运行时可以执行根据权利要求如权利要求1-9中任一所述的方法。
CN201711052903.4A 2017-10-31 2017-10-31 图像处理方法及装置、计算机产品和存储介质 Pending CN107729948A (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN201711052903.4A CN107729948A (zh) 2017-10-31 2017-10-31 图像处理方法及装置、计算机产品和存储介质
US15/974,926 US11138738B2 (en) 2017-10-31 2018-05-09 Image processing method and image processing device
US17/463,898 US20210398287A1 (en) 2017-10-31 2021-09-01 Image processing method and image processing device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711052903.4A CN107729948A (zh) 2017-10-31 2017-10-31 图像处理方法及装置、计算机产品和存储介质

Publications (1)

Publication Number Publication Date
CN107729948A true CN107729948A (zh) 2018-02-23

Family

ID=61203009

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711052903.4A Pending CN107729948A (zh) 2017-10-31 2017-10-31 图像处理方法及装置、计算机产品和存储介质

Country Status (2)

Country Link
US (2) US11138738B2 (zh)
CN (1) CN107729948A (zh)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108665509A (zh) * 2018-05-10 2018-10-16 广东工业大学 一种超分辨率重构方法、装置、设备及可读存储介质
CN108846323A (zh) * 2018-05-28 2018-11-20 哈尔滨工程大学 一种面向水下目标识别的卷积神经网络优化方法
CN108985302A (zh) * 2018-07-13 2018-12-11 东软集团股份有限公司 一种皮肤镜图像处理方法、装置及设备
CN110232719A (zh) * 2019-06-21 2019-09-13 腾讯科技(深圳)有限公司 一种医学图像的分类方法、模型训练方法和服务器
CN110728188A (zh) * 2019-09-11 2020-01-24 北京迈格威科技有限公司 图像处理方法、装置、系统和存储介质
CN110751283A (zh) * 2018-07-05 2020-02-04 第四范式(北京)技术有限公司 模型解释方法、装置、设备及存储介质
CN111127325A (zh) * 2019-12-31 2020-05-08 珠海大横琴科技发展有限公司 基于循环神经网络的卫星视频超分辨率重建方法及系统
CN111699499A (zh) * 2018-03-14 2020-09-22 欧姆龙株式会社 检查系统、图像识别系统、识别系统、识别器生成系统及学习数据生成装置
CN113222985A (zh) * 2021-06-04 2021-08-06 中国人民解放军总医院 一种图像处理方法、装置、计算机设备和介质
CN113810676A (zh) * 2020-06-16 2021-12-17 佳能株式会社 图像处理设备、方法、系统、介质和学习模型的制造方法

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101977174B1 (ko) 2017-09-13 2019-05-10 이재준 영상 분석 방법, 장치 및 컴퓨터 프로그램
KR102143928B1 (ko) * 2018-02-05 2020-08-13 고려대학교 산학협력단 인공 신경망 장치 및 그 동작 방법
CN111382596A (zh) * 2018-12-27 2020-07-07 鸿富锦精密工业(武汉)有限公司 人脸识别方法、装置及计算机存储介质
CN111666960B (zh) * 2019-03-06 2024-01-19 南京地平线机器人技术有限公司 图像识别方法、装置、电子设备及可读存储介质
CN110598709B (zh) * 2019-08-12 2022-03-22 北京智芯原动科技有限公司 一种卷积神经网络训练方法以及车牌识别方法及装置
CN111667410B (zh) * 2020-06-10 2021-09-14 腾讯科技(深圳)有限公司 图像分辨率提升方法、装置及电子设备
CN112364704A (zh) * 2020-10-16 2021-02-12 康威通信技术股份有限公司 一种基于时钟同步局部放电的聚类方法及系统
CN112488232A (zh) * 2020-12-09 2021-03-12 山西三友和智慧信息技术股份有限公司 一种基于cnn+svm的egc图像分类方法
CN114821194B (zh) * 2022-05-30 2023-07-25 深圳市科荣软件股份有限公司 一种设备运行状态识别方法及装置

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103034872A (zh) * 2012-12-26 2013-04-10 四川农业大学 基于颜色和模糊聚类算法的农田害虫识别方法
CN104112113A (zh) * 2013-04-19 2014-10-22 无锡南理工科技发展有限公司 一种基于改进型特征卷积神经网络图像识别方法
CN104182770A (zh) * 2013-05-24 2014-12-03 塔塔咨询服务有限公司 用于一个或多个图像处理算法的自动选择的方法和系统
CN105488534A (zh) * 2015-12-04 2016-04-13 中国科学院深圳先进技术研究院 交通场景深度解析方法、装置及系统
CN105488515A (zh) * 2014-09-17 2016-04-13 富士通株式会社 训练卷积神经网路分类器的方法和图像处理装置
CN105825235A (zh) * 2016-03-16 2016-08-03 博康智能网络科技股份有限公司 一种基于多特征图深度学习的图像识别方法
CN106097335A (zh) * 2016-06-08 2016-11-09 安翰光电技术(武汉)有限公司 消化道病灶图像识别系统及识别方法
CN106155327A (zh) * 2016-08-01 2016-11-23 乐视控股(北京)有限公司 手势识别方法和系统

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102372214B1 (ko) * 2015-01-19 2022-03-14 삼성전자주식회사 영상 처리 장치, 의료영상 장치 및 영상 처리 방법
CN106650806B (zh) * 2016-12-16 2019-07-26 北京大学深圳研究生院 一种用于行人检测的协同式深度网络模型方法
US20180295375A1 (en) * 2017-04-05 2018-10-11 Lyrical Labs Video Compression Technology, LLC Video processing and encoding
CN110537369B (zh) * 2017-04-21 2021-07-13 株式会社半导体能源研究所 图像处理方法及图像接收装置
US10628961B2 (en) * 2017-10-13 2020-04-21 Qualcomm Incorporated Object tracking for neural network systems

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103034872A (zh) * 2012-12-26 2013-04-10 四川农业大学 基于颜色和模糊聚类算法的农田害虫识别方法
CN104112113A (zh) * 2013-04-19 2014-10-22 无锡南理工科技发展有限公司 一种基于改进型特征卷积神经网络图像识别方法
CN104182770A (zh) * 2013-05-24 2014-12-03 塔塔咨询服务有限公司 用于一个或多个图像处理算法的自动选择的方法和系统
CN105488515A (zh) * 2014-09-17 2016-04-13 富士通株式会社 训练卷积神经网路分类器的方法和图像处理装置
CN105488534A (zh) * 2015-12-04 2016-04-13 中国科学院深圳先进技术研究院 交通场景深度解析方法、装置及系统
CN105825235A (zh) * 2016-03-16 2016-08-03 博康智能网络科技股份有限公司 一种基于多特征图深度学习的图像识别方法
CN106097335A (zh) * 2016-06-08 2016-11-09 安翰光电技术(武汉)有限公司 消化道病灶图像识别系统及识别方法
CN106155327A (zh) * 2016-08-01 2016-11-23 乐视控股(北京)有限公司 手势识别方法和系统

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111699499A (zh) * 2018-03-14 2020-09-22 欧姆龙株式会社 检查系统、图像识别系统、识别系统、识别器生成系统及学习数据生成装置
CN111699499B (zh) * 2018-03-14 2023-09-29 欧姆龙株式会社 检查、图像识别、识别器生成系统及学习数据生成装置
US11715190B2 (en) 2018-03-14 2023-08-01 Omron Corporation Inspection system, image discrimination system, discrimination system, discriminator generation system, and learning data generation device
CN108665509A (zh) * 2018-05-10 2018-10-16 广东工业大学 一种超分辨率重构方法、装置、设备及可读存储介质
CN108846323A (zh) * 2018-05-28 2018-11-20 哈尔滨工程大学 一种面向水下目标识别的卷积神经网络优化方法
CN110751283A (zh) * 2018-07-05 2020-02-04 第四范式(北京)技术有限公司 模型解释方法、装置、设备及存储介质
CN108985302A (zh) * 2018-07-13 2018-12-11 东软集团股份有限公司 一种皮肤镜图像处理方法、装置及设备
CN110232719A (zh) * 2019-06-21 2019-09-13 腾讯科技(深圳)有限公司 一种医学图像的分类方法、模型训练方法和服务器
US11954852B2 (en) 2019-06-21 2024-04-09 Tencent Technology (Shenzhen) Company Limited Medical image classification method, model training method, computing device, and storage medium
CN110728188B (zh) * 2019-09-11 2022-12-02 北京迈格威科技有限公司 图像处理方法、装置、系统和存储介质
CN110728188A (zh) * 2019-09-11 2020-01-24 北京迈格威科技有限公司 图像处理方法、装置、系统和存储介质
CN111127325A (zh) * 2019-12-31 2020-05-08 珠海大横琴科技发展有限公司 基于循环神经网络的卫星视频超分辨率重建方法及系统
CN113810676A (zh) * 2020-06-16 2021-12-17 佳能株式会社 图像处理设备、方法、系统、介质和学习模型的制造方法
CN113222985B (zh) * 2021-06-04 2022-01-21 中国人民解放军总医院 一种图像处理方法、装置、计算机设备和介质
CN113222985A (zh) * 2021-06-04 2021-08-06 中国人民解放军总医院 一种图像处理方法、装置、计算机设备和介质

Also Published As

Publication number Publication date
US11138738B2 (en) 2021-10-05
US20190130574A1 (en) 2019-05-02
US20210398287A1 (en) 2021-12-23

Similar Documents

Publication Publication Date Title
CN107729948A (zh) 图像处理方法及装置、计算机产品和存储介质
Kobler et al. Variational networks: connecting variational methods and deep learning
WO2020200030A1 (zh) 神经网络的训练方法、图像处理方法、图像处理装置和存储介质
Pollastri et al. Augmenting data with GANs to segment melanoma skin lesions
CN111402143B (zh) 图像处理方法、装置、设备及计算机可读存储介质
Brock et al. Neural photo editing with introspective adversarial networks
CN111160533B (zh) 一种基于跨分辨率知识蒸馏的神经网络加速方法
JP6728487B2 (ja) 電子装置及びその制御方法
JP2023545565A (ja) 画像検出方法、モデルトレーニング方法、画像検出装置、トレーニング装置、機器及びプログラム
CN110717851A (zh) 图像处理方法及装置、神经网络的训练方法、存储介质
CN107679466B (zh) 信息输出方法和装置
CN111199531A (zh) 基于泊松图像融合及图像风格化的交互式数据扩展方法
CN107392189A (zh) 用于确定无人车的驾驶行为的方法和装置
Li et al. Deep hybrid 2-D–3-D CNN based on dual second-order attention with camera spectral sensitivity prior for spectral super-resolution
CN108229300A (zh) 视频分类方法、装置、计算机可读存储介质和电子设备
WO2022156621A1 (zh) 基于人工智能的图像上色方法、装置、电子设备、计算机可读存储介质及计算机程序产品
Bhowmik et al. Training-free, single-image super-resolution using a dynamic convolutional network
CN107886165A (zh) 一种基于计算机模式识别的并行卷积神经网络方法
Wei et al. A-ESRGAN: Training real-world blind super-resolution with attention U-Net Discriminators
CN113808277A (zh) 一种图像处理方法及相关装置
CN111401209B (zh) 一种基于深度学习的动作识别方法
Luo et al. Piecewise linear regression-based single image super-resolution via Hadamard transform
CN112686830A (zh) 基于图像分解的单一深度图的超分辨率方法
CN108241861A (zh) 一种数据可视化方法及设备
Li et al. Video super-resolution using motion compensation and residual bidirectional recurrent convolutional network

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination