CN116091758B - 基于细节提取的图像处理方法、装置、设备及存储介质 - Google Patents

基于细节提取的图像处理方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN116091758B
CN116091758B CN202211103063.0A CN202211103063A CN116091758B CN 116091758 B CN116091758 B CN 116091758B CN 202211103063 A CN202211103063 A CN 202211103063A CN 116091758 B CN116091758 B CN 116091758B
Authority
CN
China
Prior art keywords
data
image
dimensional
vector
image processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202211103063.0A
Other languages
English (en)
Other versions
CN116091758A (zh
Inventor
何良雨
王戬鑫
刘彤
张文刚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fengrui Lingchuang Zhuhai Technology Co ltd
Original Assignee
Fengrui Lingchuang Zhuhai Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fengrui Lingchuang Zhuhai Technology Co ltd filed Critical Fengrui Lingchuang Zhuhai Technology Co ltd
Priority to CN202211103063.0A priority Critical patent/CN116091758B/zh
Publication of CN116091758A publication Critical patent/CN116091758A/zh
Application granted granted Critical
Publication of CN116091758B publication Critical patent/CN116091758B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/25Determination of region of interest [ROI] or a volume of interest [VOI]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computing Systems (AREA)
  • Software Systems (AREA)
  • Biomedical Technology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Molecular Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Medical Informatics (AREA)
  • Databases & Information Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Image Analysis (AREA)

Abstract

本发明涉及人工智能领域,尤其涉及机器视觉领域,具体是一种基于细节提取的图像处理方法、装置、设备及存储介质,通过按照待处理图像的宽度方向,从待处理图像中抽样N列数据,对抽样N列数据中的每个通道数据进行J层离散有限能变换,确定每列数据中的每个通道数据的J个细节信号,得到抽样变换域二维矩阵向量,将抽样变换域二维矩阵向量输入至预设的图像处理神经网络模型中,确定对应的目标区域,通过抽样待处理图像中的列数据,对抽样的列数据进行数据处理,将对应列数据中的图像处理结果映射到待处理图像中的目标区域中,得到待处理图像的目标区域,减小了数据处理过程中的数据量,可以快速得到对应的目标区域,提高了获取目标区域的效率。

Description

基于细节提取的图像处理方法、装置、设备及存储介质
技术领域
本发明涉及人工智能领域,尤其涉及机器视觉领域,具体是一种基于细节提取的图像处理方法、装置、设备及存储介质。
背景技术
随着高速高效的智能制造需求不断提高,经常使用工业线扫相机对流水线上的产品进行拍摄,用于后续统计、质检等任务。由于工业流水线上的工业线扫相机输出的图像分辨率大,而且背景占比大,直接处理原始图像耗时久。如果能在原始输出图像中快速定位产品的位置,将产品区域的图像用于后续任务,将减少在处理大量背景区域的耗时。
现有技术中,通常是在图像上进行一系列卷积操作后输出处理信息,由于图像分别率较大,使用卷积操作对目标区域进行处理时,对目标区域的处理效率较低,因此,如何提高大分辨率图像的图像处理效率成为亟待解决的问题。
发明内容
为了解决上述常规空间域处理复杂的图像处理任务的问题,本发明将图像数据转换到变换域处理,减少图像数据的相关性,获取图像的整体特点,用较少的数据表示原始图像,从而提高图像处理效率。
本发明将多头自注意力模块作为图像处理神经网络模型的编码模块,处理变换域的图像信息。本发明使用自然语言处理网络中的多头自注意力模块,而非常规神经网络中的卷积操作,使神经网络关注全局信息与局部信息的内部联系,充分提取输入数据中的信息,从而实现对输入数据更全面的表征。
基于此,有必要针对上述技术问题,提供基于细节提取的图像处理方法、装置、设备及存储介质,以解决图像处理效率较低的问题。
本申请实施例的第一方面提供了一种基于细节提取的图像处理方法,所述图像处理方法包括:
按照待处理图像的宽度方向,从待处理图像中抽样N列数据,得到抽样N列数据;其中,每列数据均包括M个通道数据,N,M为大于1的整数;
对所述抽样N列数据中的每个通道数据进行J层离散有限能变换,确定每列数据中的每个通道数据的J个细节信号;其中J为大于1的整数;
将所述抽样N列数据中的所述每列数据中的每个通道数据的J个细节信号拼接为一维向量,得到M*N个一维向量,并将所述M*N个一维向量拼接为抽样变换域二维矩阵向量;其中各个所述一维向量的长度为所述J个细节信号的信号长度之和;
将所述抽样变换域二维矩阵向量输入至预设的图像处理神经网络模型中,输出目标区域的特征向量,确定图像处理结果;
根据所述图像处理结果,在所述待处理图像中确定所述图像处理结果对应的目标区域。
本申请实施例的第二方面提供了一种基于细节提取的图像处理装置,所述装置包括:
抽样模块,用于按照待处理图像的宽度方向,从待处理图像中抽样N列数据,得到抽样N列数据;其中,每列数据均包括M个通道数据,N,M为大于1的整数;
细节信号获取模块,用于对所述抽样N列数据中的每个通道数据进行J层离散有限能变换,确定每列数据中的每个通道数据的J个细节信号;其中J为大于1的整数;
拼接模块,用于将所述抽样N列数据中的所述每列数据中的每个通道数据的J个细节信号拼接为一维向量,得到M*N个一维向量,并将所述M*N个一维向量拼接为抽样变换域二维矩阵向量;其中各个所述一维向量的长度为所述J个细节信号的信号长度之和;
处理结果确定模块,用于将所述抽样变换域二维矩阵向量输入至预设的图像处理神经网络模型中,神经网络模型处理输入的变换域数据后,输出目标区域的特征向量,确定图像处理结果;
目标区域确定模块,用于根据所述图像处理结果,在所述待处理图像中确定所述图像处理结果对应的目标区域。
第三方面,本发明实施例提供一种计算机设备,所述计算机设备包括处理器、存储器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如第一方面所述的基于细节提取的图像处理方法。
第四方面,本发明实施例提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如第一方面所述的基于细节提取的图像处理方法。
本发明与现有技术相比存在的有益效果是:
按照待处理图像的宽度方向,从待处理图像中抽样N列数据,得到抽样N列数据,其中,每列数据均包括M个通道数据,N,M为大于1的整数,对抽样N列数据中的每个通道数据进行J层离散有限能变换,确定每列数据中的每个通道数据的J个细节信号,其中J为大于1的整数,将抽样N列数据中的每列数据中的每个通道数据的J个细节信号拼接为一维向量,得到M*N个一维向量,并将M*N个一维向量拼接为抽样变换域二维矩阵向量,其中各个一维向量的长度为J个细节信号的信号长度之和,将抽样变换域二维矩阵向量输入至预设的图像处理神经网络模型中,输出目标区域的特征向量,确定图像处理结果,根据图像处理结果,在待处理图像中确定图像处理结果对应的目标区域。本发明通过抽样待处理图像中的部分列数据,减少原始数据量,对每列数据中每个通道数据进行J层离散有限能变换,将J层离散有限能变换得到的频域信息与时域信息进行融合,得到融合有时域信息与频域信息的细节信号,时域信息与频域信息的融合可以相互补充与约束,增加待处理区域的处理效率,将细节信号作为输入数据,输入至图像处理神经网络,由于图像处理神经网络中的自注意力模块中,已经学习到输入数据中每一列变换域信号之间的关系,因此,通过该图像处理神经网络可以更准确地输出图片列方向上的一维预测信息。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明一实施例提供的一种基于细节提取的图像处理方法的一应用环境示意图;
图2是本发明一实施例提供的一种基于细节提取的图像处理方法的流程示意图;
图3是本发明一实施例提供的一种基于细节提取的图像处理方法的流程示意图;
图4是本发明一实施例提供的一种基于细节提取的图像处理方法的流程示意图;
图5是本发明一实施例提供的一种基于细节提取的图像处理装置的结构示意图;
图6是本发明一实施例提供的一种计算机设备的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
应当理解,当在本发明说明书和所附权利要求书中使用时,术语“包括”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
还应当理解,在本发明说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
如在本发明说明书和所附权利要求书中所使用的那样,术语“如果”可以依据上下文被解释为“当...时”或“一旦”或“响应于确定”或“响应于检测到”。类似地,短语“如果确定”或“如果检测到[所描述条件或事件]”可以依据上下文被解释为意指“一旦确定”或“响应于确定”或“一旦检测到[所描述条件或事件]”或“响应于检测到[所描述条件或事件]”。
另外,在本发明说明书和所附权利要求书的描述中,术语“第一”、“第二”、“第三”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
在本发明说明书中描述的参考“一个实施例”或“一些实施例”等意味着在本发明的一个或多个实施例中包括结合该实施例描述的特定特征、结构或特点。由此,在本说明书中的不同之处出现的语句“在一个实施例中”、“在一些实施例中”、“在其他一些实施例中”、“在另外一些实施例中”等不是必然都参考相同的实施例,而是意味着“一个或多个但不是所有的实施例”,除非是以其他方式另外特别强调。术语“包括”、“包含”、“具有”及它们的变形都意味着“包括但不限于”,除非是以其他方式另外特别强调。
本发明实施例可以基于人工智能技术对相关的数据进行获取和处理。其中,人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。
人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、机器人技术、生物识别技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
应理解,以下实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
为了说明本发明的技术方案,下面通过具体实施例来进行说明。
本发明一实施例提供的一种基于细节提取的图像处理方法,可应用在如图1的应用环境中,其中,客户端与服务端进行通信。其中,客户端包括但不限于掌上电脑、桌上型计算机、笔记本电脑、超级移动个人计算机(ultra-mobile personal computer,UMPC)、上网本、个人数字助理(personal digital assistant,PDA)等计算机设备。服务端可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
参见图2,是本发明一实施例提供的一种基于细节提取的图像处理方法的流程示意图,上述基于细节提取的图像处理方法可以应用于图1中的服务端,上述服务端连接相应的客户端,为客户端提供模型训练服务。如图2所示,该基于细节提取的图像处理方法可以包括以下步骤。
S201:按照待处理图像的宽度方向,从待处理图像中抽样N列数据,得到抽样N列数据。
在步骤S201中,每列数据均包括M个通道数据,待处理图像的宽度为w,N小于w,N,M为大于1的整数,抽样的N列数据根据对应的待处理图像中目标区域在列方向中的位置而定,得到抽样N列数据。
本实施例中,待处理图像为通过线扫相机获取到的图像,线扫相机获取待处理图像时,线扫相机与被拍照物体进行相对匀速运动,获取到的将待处理图像宽度较小,高度较大,其中高度方向为被拍照物体的运动方向。
采集待处理图像中的N列数据时,按照待处理图像的宽度方向进行采集,采集时根据预先得到的待检测的物体的位置信息,首先选择待处理图像中的一列数据作为中心列数据,本实施例中以待处理图像中的宽度的中心位置的列数据为中心列数据,待处理图像的宽度为w,以一定的间隔阈值,向中心列数据的两端,在待处理图像中抽样对应的列数据,直到采集到的最后两列数据为第一列和第w列,或者是与第一列或第w列的间隔宽度小于间隔阈值时,停止采集,采集到N列数据,N的取值视具体情况而定,N小于w,采集到的每列数据中包括M个通道数据,本实施例中,每列数据为3个通道数据。
需要说明的是,当选取的中心列数据不是待处理图像的中心位置时,在随机抽样列数据时,当采集到的其中一列数据为第一列数据或第w列数据,者是与第一列或第w列的间隔宽度小于间隔阈值时,停止采集。例如,当待处理图像的宽度为w时,选取的中心列数据为处的列数据,以/>间隔阈值分别项两侧抽样,则以/>处的列数据为中心列数据向前抽样列数据,抽样的列数据分别为/>向后抽样列数据,抽样的列数据分别为/> 向后抽样的列数据没有抽样到最后一列,抽样停止,得到7列抽样数据。
S202:对抽样N列数据中的每个通道数据进行J层离散有限能变换,确定每列数据中的每个通道数据的J个细节信号。
在步骤S202中,使用J层离散有限能变换对抽样N列数据中每列数据进行处理,得到J个细节信号。
本实施例中,J层离散有限能变换变换可以对每一列数据中每个通道数据进行有限能变换处理,得到包含时域信息和频域信息的细节信号和粗略信息。通过有限能变换可以获取到对应的细节信号,对每列数据中的每个通道数据每一次进行离散有限能变换,都可以得到一个细节信号,J层离散有限能变换进行J次离散有限能变变换,得到J个细节信号。J个细节信号的计算过程如下:离散有限能变变换的原生函数ψ(x)公式如下:
离散有限能变变换的辅函数φ(x)公式如下:
输入信号f(x),为输入离散信号的第K项,2J为取样速率,则输入信号的近似表示为:
fj()的分解递推公式如下:
为粗略系数,/>为细节系数,J依次递减直到0,如J-1,J-2,...,0。由分解得到的细节系数构成细节信号。
可选地,将对所述抽样N列数据中的每个通道数据进行J层离散有限能变换,确定每列数据中的每个通道数据的J个细节信号,包括:
获取所述抽样N列数据中的每列数据中的每个通道数据;
将每个通道数据输入至预设J层离散有限能变换模型,输出每一层对应的细节信号;
根据每一层对应的细节信号,确定所述抽样N列数据中的每列数据中的每个通道数据的J个细节信号。
本实施例中,对待处理图像进行压缩处理,以减小计算量,将待处理图像为2040*10240的图像压缩为204*1024大小的图像,获取每列数据中的每个通道数据,本实施例中,每列数据包含3个通道数据,所以获取到的数据为抽样到列数据的3倍,使用初始有限能函数对待处理图像进行3层离散有限能变换,则每列数据中的每个通道数据中可以得到3个细节信号,每列数据中的每个通道数据的长度为1024长度的一维数据,将每列数据中的每个通道数据中的一维数据进行第一层离散有限能变换,得到长度为512长度的一维细节信号,进行第二层离散有限能变换是时,得到长度为256长度的一维细节信号,进行第三层离散有限能变换时,得到长度为128长度的一维细节信号。每列数据中每个通道在对应层离散有限能变换时,可以得到对应长度的细节信号。
S203:将所述抽样N列数据中的每列数据中的每个通道数据的J个细节信号拼接为一维向量,得到M*N个一维向量,并将M*N个一维向量拼接为抽样变换域二维矩阵向量。
在步骤S204中,抽样N列数据中的每一列中数据中都包括M个通道,将每列数据按照依次按照相同的通道顺序进行排列,得到M*N个一维向量,每一个向量的长度为每个通道中J个细节信号相加得到的长度,将M*N个一维向量拼接为抽样变换域二维矩阵向量,其中抽样变换域二维矩阵向量包括M*N行数,每个通道中J个细节信号相加得到的长度为二维矩阵的列数。
本实施例中,当待处理图像的大小为204*1024时,从待处理图像中抽样10列数据时,每列数据包括3个通道,对每列数据中每个通道进行3层离散有限能变换,将得到30个一维向量,对每个通道进行3层离散有限能变换时,分别得到3个细节信号,每个细节信号的长度分别为512,256,128,将3个细节信号相加,得到长度为896的一维向量,将30个一维向量拼接为二维矩阵,将得到大小为30*896的二维矩阵。
需要说明的是,在将每个通道中的细节信号进行相加时,得到一维向量的长度,对应的一维数据为3个细节信号拼接的结果,在拼接的过程中,可以将3个细节信号进行随机组合,例如,将长度为512的细节信号与长度与256的差细节信号进行拼接,拼接结果在于长度为128的细节信号进行拼接,也可以是长度为512的细节信号与长度为128的细节信号进行拼接,拼接结果再与长度为256的细节信号进行拼接。
S204:将抽样变换域二维矩阵向量输入至预设的图像处理神经网络模型中,输出目标区域的特征向量,确定图像处理结果。
在步骤S204中,将二维矩阵作为待处理图像的特征数据输入至预设的图像处理神经网络模型中,输出目标区域的特征向量,根据目标区域的特征向量确定出图像处理结果。
本实施例中,预设的图像处理神经网络模型对于输入的二维矩阵,首先将输入进行投影,分别得到query、key和value,然后将query和key分别进行变换并执行矩阵相乘操作生成注意力映射矩阵,接着将value与生成的注意力映射矩阵进行相乘并变换得到带有注意力的特征映射矩阵,最后将特征映射矩阵映射为原始的二维矩阵输入的大小,对输出的带有注意力的特征映射矩阵进行特征处理,将二维矩阵映射为一维向量,输出目标区域的特征向量根据目标区域的特征向量,得到对应抽样到的N列数据的图像处理结果。
可选地,图像处理神经网络模型包括:至少一个编码器,求和模块,激活函数模块和全连接层,各个编码器的输入端和输出端依次串联,第一个编码器的输入端用于输入抽样变换域二维矩阵向量,最后一个编码器用于输出与抽样变换域二维矩阵向量大小相等的编码后的抽样变换域二维矩阵向量;
求和模块用于对编码后的抽样变换域二维矩阵向量中的每一列进行求和,得到与编码后的抽样变换域二维矩阵向量列数相等的求和一维向量;
激活函数模块用于对求和一维向量进行归一化处理,得到归一化的一维向量;
全连接层用于对归一化的一维向量进行线性变换处理,输出目标区域的特征向量。
本实施例中,将抽样变换域二维矩阵向量输入至编码器中,通过多个编码器模块,输出编码后的抽样变换域二维矩阵向量,其中编码后的二维矩阵大小与输入的二维矩阵的大小相等,对编码后的抽样变换域二维矩阵向量进行求和处理,得到对应求和一维向量,通过求和函数,将编码后的抽样变换域二维矩阵向量中每一列中的特征都映射到对应列的第一行数据中,映射的过程为将每一行列中的特征数据进行相加,将每一列特征数据相加的和作为对应列的特征,得到一个求和一维向量,求和一维向量的长度与抽样变换域二维矩阵向量中的列数相等。
通过激活函数,对求和一维向量进行归一化处理,得到归一化的一维向量,本实施例中使用Sigmoid激活函数对求和一维向量进行归一化处理,将归一化的一维向量输入至全连接层,输出目标区域的特征向量,确定图像处理结果,目标区域的特征向量的大小为一个一维向量,一维向量的长度与待处理图像中每一列的长度相等,若待处理图像的大小为204*1024,则通过全连接层输出的一维向量为1*1024,根据目标区域的特征向量确定出抽样到的N列数据的图像处理结果,将目标区域的特征向量进行转置,得到1024*1的向量,从1024行特征向量中确定出待处理区域的处理结果。
可选地,各个编码器包括多头自注意力模块、第一残差模块、全连接层和第二残差模块,其中,多头自注意力模块用于输入抽样变换域二维矩阵向量,第一残差模块用于求取多头自注意力模块中输入和多头自注意力模块中输出之间残差并进行归一化处理;全连接层用于对归一化处理的结果进行线性变换,输出与归一化处理的结果大小相等的抽样变换域二维矩阵向量,第二残差模块用于求取全连接层输入和全连接层输出之间残差并进行归一化处理,输出与抽样变换域二维矩阵向量大小相等的编码后的抽样变换域二维矩阵向量。
本实施例中,预设的图像处理神经网络由编码器,激活函数,全连接层构成。编码器由N多个相同的编码块构成,前一层编码块的输出作为后一层编码块的输入,其中每层由两个子层组成,分别是一个多头自注意力模块和一个全连接前馈网络模块构成,不同模块之间添加残差结构和归一化层避免梯度消失,加快训练速度。多头自注意力层建模特征的内在联系,全连接前馈神经网络层则进行线性变换。为了能更好的加深网络的深度,引入残差连接,将多头自注意力层的输入与输出相加,最后进行层归一化操作,对数据进行标准化处理,将标准化的处理的结果输入到两层的全连接前馈神经网络进行线性变换运算,得到其结果后将进行同样的残差连接和层归一化处理。
S205:根据图像处理结果,在待处理图像中确定图像处理结果对应的目标区域。
在步骤S205中,根据图像处理结果,确定目标区域,其中,图像处理结果为抽样的N列数据映射到一维向量中对应的图像处理结果,将图像处理结果映射到待处理图像中,确定目标区域。
本实施例中,根据处理结果,确定一维向量的处理区域,将一维向量的处理区域进行按行扩展,使每一行的列数等于待处理图像中的宽度,在处理区域范围之内的行,都将作为目标区域。
需要说明的是,根据图像处理结果,获取图像处理结果对应每个目标区域的起始行与终止行,例如,当图像处理结果为第10行到第30行中包含处理特征,将处理结果映射到待处理图像中,则认为在待处理图像中的第10行到第30行中也包含对应的及处理特征,因此根据图像处理结果,可以获取到图像处理结果对应每个目标区域的起始行与终止行。
根据每个标目标区域的起始行与终止行,确定待处理图像中的目标区域,将每个目标区域的起始行与终止行作为待处理图像中每个目标区域在列方向上的定位预测,从而可以快速确定待处理图像中的目标区域。
按照待处理图像的宽度方向,从待处理图像中抽样N列数据,得到抽样N列数据;其中,每列数据均包括M个通道数据,待处理图像的宽度为w,N小于w,N,M为大于1的整数,对抽样N列数据中的每个通道数据进行J层离散有限能变换,确定每列数据中的每个通道数据的J个细节信号;其中J为大于1的整数,将抽样N列数据中的每列数据中的每个通道数据的J个细节信号拼接为一维向量,得到M*N个一维向量,并将M*N个一维向量拼接为抽样变换域二维矩阵向量,其中各个一维向量的长度为J个细节信号的信号长度之和,将抽样变换域二维矩阵向量输入至预设的图像处理神经网络模型中,输出目标区域的特征向量,确定图像处理结果,根据图像处理结果,在待处理图像中确定图像处理结果对应的目标区域,本发明通过抽样待处理图像中的部分列数据,减少原始数据量,对每列数据中每个通道数据进行J层离散有限能变换,将J层离散有限能变换得到的频域信息与时域信息进行融合,得到对应的细节信号,时域信息与频域信息的融合可以相互补充与约束,增加待处理区域的处理效率,将细节信号作为输入数据,输入至图像处理神经网络,在图像处理神经网络中的自注意力模块中,可以学习到输入数据中每一列变换域信号之间的关系,从而可以更准确地输出图片列方向上的一维预测信息。
参见图3,是本发明一实施例提供的一种基于细节提取的图像处理方法的流程示意图,如图3,该基于基于细节提取的图像处理方法可以包括以下步骤:
S301:获取待处理初始图像;
S302:将待处理初始图像输入至预设颜色转换模型中,输出待处理初始图像颜色转换后的图像,将颜色转换后的图像作为待处理图像。
本实施例中,获取待处理初始图像,待处理初始图像为通过线扫相机得到的原始图像,对待处理初始图像进行颜色转换,待处理初始图像为RGB图像,将待处理初始图像从RGB颜色空间转换到YCbCr颜色空间,在YCbCr颜色空间中,Y分量表示亮度,它表示图像的亮度信息,Cb和Cr分量表示色差,它们表示彩色图像转换为灰度图像时的额外彩色信息。其中,Cb是RGB输入信号的B分量与其Y分量之差,而Cr是RGB输入信号的R分量与其Y分量之差。Y分量数据的存储可以采用原来画面的分辨率,而Cb和Cr分量的存储可以使用较低的分辨率。该颜色空间表示可以占用较少的数据量并且在图像质量上没有明显的下降。除此之外该颜色空间将RGB颜色空间分离成亮度和色度信息,在图像去噪等数字图像处理中能够平滑噪声并更好地保护颜色信息。
S303:按照待处理图像的宽度方向,从待处理图像中抽样N列数据,得到抽样N列数据;其中,每列数据均包括M个通道数据,待处理图像的宽度为w,N小于w,N,M为大于1的整数;
S304:对所述抽样N列数据中的每个通道数据进行J层离散有限能变换,确定每列数据中的每个通道数据的J个细节信号;其中J为大于1的整数;
S305:将所述抽样N列数据中的每列数据中的每个通道数据的J个细节信号拼接为一维向量,得到M*N个一维向量,并将M*N个一维向量拼接为抽样变换域二维矩阵向量;其中各个一维向量的长度为J个细节信号的信号长度之和;
S306:将抽样变换域二维矩阵向量输入至预设的图像处理神经网络模型中,输出目标区域的特征向量,确定图像处理结果;
S307:根据图像处理结果,在待处理图像中确定图像处理结果对应的目标区域。
其中,上述步骤S303至步骤S307与上述步骤S201至步骤S205的内容相同,可参考上述步骤S201至步骤S205的描述,在此不再赘述。
参见图4,是本发明一实施例提供的一种基于细节提取的图像处理方法的流程示意图,如图4,该基于细节提取的图像处理方法可以包括以下步骤:
S401:按照待处理图像的宽度方向,从待处理图像中抽样N列数据,得到抽样N列数据;
S402:对所述抽样N列数据中的每个通道数据进行J层离散有限能变换,确定每列数据中的每个通道数据的J个细节信号;
S403:将所述抽样N列数据中的每列数据中的每个通道数据的J个细节信号拼接为一维向量,得到M*N个一维向量,并将M*N个一维向量拼接为抽样变换域二维矩阵向量。
其中,上述步骤S401至步骤S403与上述步骤S201至步骤S203的内容相同,可参考上述步骤S201至步骤S203的描述,在此不再赘述。
S404:获取样本图像对应的一维标签数据。
本实施例中,对预先构建的神经网络模型进行训练时,首先获取带有标签的样本数据,其中,带有标签的样本数据为与预先构建的神经网络模型的输出对应,例如,预先构建的神经网络模型输出的为一维向量,则需要获取样本图像对应的一维标签数据。
可选地,获取样本图像对应的一维标签数据,包括
根据样本图像中每一列的长度,确定一维列向量的长度,使样本图像中的每一行与一维列向量中的每一行一一对应;
根据获取到的样本图像中的每一个目标区域的起始行位置与终止行位置,在一维列向量中确定与每一个目标区域的起始行位置与终止行位置对应的向量目标区域;
根据一维列向量中的每一个向量目标区域填充的标注信息,获取样本图像对应的一维标签数据。
本实施例中,在获取样本图像对应的一维标签数据时,将样本图形中的特征都映射到图像第一列中,根据样本图像中每一列的长度,确定一维列向量的长度,使样本图像中的每一行与一维列向量中的每一行一一对应,对列向量进行标注,标注时,可以进行人工标注,当列向量中每一行对应的样本图像所在行中存在待处理的目标区域,则对列向量标注为1,其余标注为0,得到对应向量目标区域,即根据获取到的样本图像中的每一个目标区域的起始行位置与终止行位置,在一维列向量中确定与每一个目标区域的起始行位置与终止行位置对应的向量目标区域,将标注完成的一维列向量作为一维标签数据。
另一实施例中,当对样本图像对应的一维列向量进行标注时,还可以通过标准高斯密度函数进行标注,首先从样本图像中获取到每个目标区域中的高度,即在一维列向量中找到对应的起始行位置与终止行位置,根据起始行位值与终止行位置之间的高度,从标准高斯密度函数中随机选取与高度值个数相同的高斯密度函数值填充到起始行位值与终止行位置之间的一维列向量中,将随机得到的高斯密度函数值,作为起始行位值与终止行位置之间的标签值,将随机得到的高斯密度函数值。例如,若待处理样本图像中的一个目标检处理区域对应的起始行为第5行,对应的终止行为第10行,该目标区域的高度为6,则在标准高斯密度函数中随机选取6个标准高斯密度函数值,将选取到的6个标准高斯密度函数值填充到对应一维列向量中的第5行至第10行中,将填充到对应行的标准高斯密度函数值作为一维列向量中的标签值,标签值的取值范围0-1。
另一实施例中,当对样本图像对应的一维列向量进行标注时,还可以通过折中反转后的标准高斯密度函数进行标注,标注方法与通过标准高斯密度函数的标注方法相同,在此不再赘述。
S405:将一维标签数据作为预先构建的神经网络模型的训练过程中的先验数据,训练预先构建的神经网络模型,得到训练完成的神经网络模型,将训练完成的神经网络模型作为预设的图像处理神经网络模型。
本实施例中,将标注完成的一维标签数据作为预先构建的神经网络模型的训练过程中的先验数据,将样本图像数据抽样到的N列数据通过预先构建的神经网络模型输出的一维预测向量与一维标签数据对应的向量,通过损失函数计算损失,利用损失进行梯度反向传播,更新预先构建的神经网络模型,当对应的损失函数收敛时,得到训练完成的神经网络模型,将训练完成的神经网络模型作为预设的图像处理神经网络模型。
需要说明的是,预先构建的神经网络模型由编码器,激活函数,全连接层组成,编码器中编码模块的个数为多个,前一层编码块的输出作为后一层编码块的输入,其中每层由两个子层组成,分别是一个多头自注意力模块和一个全连接前馈网络模块构成,不同模块之间添加残差结构和归一化层避免梯度消失,加快训练速度。多头自注意力层建模特征的内在联系,全连接前馈神经网络层则进行线性变换。为了能更好的加深网络的深度,引入残差连接,将多头自注意力层的输入与输出相加,最后进行层归一化操作,对数据进行标准化处理,将标准化的处理的结果输入到两层的全连接前馈神经网络进行线性变换运算,得到其结果后将进行同样的残差连接和层归一化处理。在编码器与激活函数中间增加一个求和处理,以便使模型输出对应的一维向量。
S406:将抽样变换域二维矩阵向量输入至预设的图像处理神经网络模型中,输出目标区域的特征向量,确定图像处理结果;
S407:根据图像处理结果,在待处理图像中确定图像处理结果对应的目标区域。
其中,上述步骤S406至步骤S407与上述步骤S204至步骤S205的内容相同,可参考上述步骤S204至步骤S205的描述,在此不再赘述。
本发明考虑到流水线上的产品成像特点,即由于流水线上的产品尺寸一致,在使用线扫相机拍摄的图片中,产品在图像宽度方向上的位置存在小幅波动,在图像高度方向上呈间隔排布。因此,不同流水线的产品可根据具体情况手工设定宽度方向的感兴趣区域,仅需预测产品在高度方向上的位置即可确定目标在图片中的位置。
根据上述成像特点,本发明将线扫相机的二维图像进行列抽样,利用J层离散有限能变换对抽样的列数据进行分解,将分解后的信号进行拼接,送入多头自注意力神经网络,完成对目标区域在高度方向上的预测。实现对线扫相机拍摄的图片中的目标进行快速定位。
请参阅图5,图5是本发明实施例提供的一种基于细节提取的图像处理装置的结构示意图。本实施例中该终端包括的各单元用于执行图2至图3对应的实施例中的各步骤。具体请参阅图2至图3以及图2至图3所对应的实施例中的相关描述。为了便于说明,仅示出了与本实施例相关的部分。参见图5,图像处理装置50包括:抽样模块51,细节信号获取模块52,拼接模块53,处理结果确定模块54,目标区域确定模块55。
抽样模块51,用于按照待处理图像的宽度方向,从待处理图像中抽样N列数据;其中,每列数据均包括M个通道数据,待处理图像的宽度为w,N小于w,N,M为大于1的整数
细节信号获取模块52,用于对抽样到的每列数据中的每个通道数据进行J层离散有限能变换,确定每列数据中的每个通道数据的J个细节信号;其中J为大于1的整数;
拼接模块53,用于将每列数据中的每个通道数据的J个细节信号拼接为一维向量,得到M*N个一维向量,并将M*N个一维向量拼接为抽样变换域二维矩阵向量;其中各个一维向量的长度为J个细节信号的信号长度之和;
处理结果确定模块54,用于将抽样变换域二维矩阵向量输入至预设的图像处理神经网络模型中,神经网络模型处理输入的变换域数据后,输出目标区域的特征向量,确定图像处理结果;
目标区域确定模块55,用于根据图像处理结果,在待处理图像中确定图像处理结果对应的目标区域。
可选地,上述细节信号获取模块52包括:
通道数据获取单元,用于获取每列数据中的每个通道数据;
每一层对应的细节信号获取单元,用于将每个通道数据通道数据输入至预设J层离散有限能变换模型,输出每一层对应的细节信号;
J个细节信号获取单元,用于根据每一层对应的细节信号,确定每列数据中的每个通道数据的J个细节信号。
可选地,上述处理结果确定模块54包括:
图像处理神经网络模型包括:至少一个编码器,求和模块,激活函数模块和全连接层,各个编码器的输入端和输出端依次串联,第一个编码器的输入端用于输入抽样变换域二维矩阵向量,最后一个编码器用于输出与抽样变换域二维矩阵向量大小相等的编码后的抽样变换域二维矩阵向量;
求和模块用于对编码后的抽样变换域二维矩阵向量中的每一列进行求和,得到与编码后的抽样变换域二维矩阵向量列数相等的求和一维向量;
激活函数模块用于对求和一维向量进行归一化处理,得到归一化的一维向量;
全连接层用于对归一化的一维向量进行线性变换处理,输出目标区域的特征向量,输出与归一化处理的结果大小相等的抽样变换域二维矩阵向量,第二残差模块用于求取全连接层输入和全连接层输出之间残差并进行归一化处理,输出与抽样变换域二维矩阵向量大小相等的编码后的抽样变换域二维矩阵向量。
各个编码器包括多头自注意力模块、第一残差模块、全连接层和第二残差模块,其中,多头自注意力模块用于输入抽样变换域二维矩阵向量,第一残差模块用于求取多头自注意力模块中输入和多头自注意力模块中输出之间残差并进行归一化处理;全连接层用于对归一化处理的结果进行线性变换。可选地,上述处理装置还包括:
待处理初始图像获取模块,用于获取待处理初始图像;
颜色转换模块,用于将待处理初始图像输入至预设颜色转换模型中,输出待处理初始图像颜色转换后的图像,将颜色转换后的图像作为待处理图像。
可选地,上述处理装置还包括:
标签数据获取模块,用于获取样本图像对应的一维标签数据;
训练模块,用于将一维标签数据作为预先构建的神经网络模型的训练过程中的先验数据,训练预先构建的神经网络模型,得到训练完成的神经网络模型,将训练完成的神经网络模型作为预设的图像处理神经网络模型。
可选地,上述标签数据获取模块包括:
一维列向量确定单元,用于根据样本图像中每一列的长度,确定一维列向量的长度,使样本图像中的每一行与一维列向量中的每一行一一对应;
向量目标区域确定单元,用于根据获取到的样本图像中的每一个目标区域的起始行位置与终止行位置,在一维列向量中确定与每一个目标区域的起始行位置与终止行位置对应的向量目标区域;
填充单元,用于根据一维列向量中的每一个向量目标区域填充的标注信息,获取样本图像对应的一维标签数据。
需要说明的是,上述单元之间的信息交互、执行过程等内容,由于与本发明方法实施例基于同一构思,其具体功能及带来的技术效果,具体可参见方法实施例部分,此处不再赘述。
图6是本发明实施例提供的一种计算机设备的结构示意图。如图6所示,该实施例的计算机设备包括:至少一个处理器(图6中仅示出一个)、存储器以及存储在存储器中并可在至少一个处理器上运行的计算机程序,处理器执行计算机程序时实现上述任意各个基于细节提取的图像处理方法实施例中的步骤。
该计算机设备可包括,但不仅限于,处理器、存储器。本领域技术人员可以理解,图6仅仅是计算机设备的举例,并不构成对计算机设备的限定,计算机设备可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如还可以包括网络接口、显示屏和输入装置等。
所称处理器可以是CPU,该处理器还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific IntegratedCircuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
存储器包括可读存储介质、内存储器等,其中,内存储器可以是计算机设备的内存,内存储器为可读存储介质中的操作系统和计算机可读指令的运行提供环境。可读存储介质可以是计算机设备的硬盘,在另一些实施例中也可以是计算机设备的外部存储设备,例如,计算机设备上配备的插接式硬盘、智能存储卡(Smart Media Card,SMC)、安全数字(Secure Digital,SD)卡、闪存卡(Flash Card)等。进一步地,存储器还可以既包括计算机设备的内部存储单元也包括外部存储设备。存储器用于存储操作系统、应用程序、引导装载程序(BootLoader)、数据以及其他程序等,该其他程序如计算机程序的程序代码等。存储器还可以用于暂时地存储已经输出或者将要输出的数据。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本发明的保护范围。上述装置中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,可以通过计算机程序来指令相关的硬件来完成,计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述方法实施例的步骤。其中,计算机程序包括计算机程序代码,计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。计算机可读介质至少可以包括:能够携带计算机程序代码的任何实体或装置、记录介质、计算机存储器、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、电载波信号、电信信号以及软件分发介质。例如U盘、移动硬盘、磁碟或者光盘等。在某些司法管辖区,根据立法和专利实践,计算机可读介质不可以是电载波信号和电信信号。
本发明实现上述实施例方法中的全部或部分流程,也可以通过一种计算机程序产品来完成,当计算机程序产品在计算机设备上运行时,使得计算机设备执行时实现可实现上述方法实施例中的步骤。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
在本发明所提供的实施例中,应该理解到,所揭露的装置/计算机设备和方法,可以通过其它的方式实现。例如,以上所描述的装置/计算机设备实施例仅仅是示意性的,例如,模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接,可以是电性,机械或其它的形式。
作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围,均应包含在本发明的保护范围之内。

Claims (10)

1.一种基于细节提取的图像处理方法,其特征在于,所述图像处理方法包括:
按照待处理图像的宽度方向,从待处理图像中抽样N列数据,得到抽样N列数据;其中,每列数据均包括M个通道数据, N,M为大于1的整数;
对所述抽样N列数据中的每个通道数据进行J层离散有限能变换,确定每列数据中的每个通道数据的J个细节信号;其中J为大于1 的整数,其中J层离散有限能变换的计算公式如下:
离散有限能变变换的原生函数公式如下:
离散有限能变变换的辅函数公式如下:
输入信号,/>为输入离散信号的第K项,/> 为取样速率,则输入信号表示为:
的分解递推公式如下:
为粗略系数,/>为细节系数,J依次递减直到0,x为N列数据中的每个通道数据,由分解得到的细节系数构成细节信号;
将所述抽样N列数据中的所述每列数据中的每个通道数据的J个细节信号拼接为一维向量,得到M*N个一维向量,并将所述M*N个一维向量拼接为抽样变换域二维矩阵向量;其中各个所述一维向量的长度为所述J个细节信号的信号长度之和;
将所述抽样变换域二维矩阵向量输入至预设的图像处理神经网络模型中,输出目标区域的特征向量,确定图像处理结果;
根据所述图像处理结果,在所述待处理图像中确定所述图像处理结果对应的目标区域。
2.如权利要求1所述的基于细节提取的图像处理方法,其特征在于,所述按照待处理图像的宽度方向,从待处理图像中抽样N列数据之前,得到抽样N列数据,还包括:
获取待处理初始图像;
将所述待处理初始图像输入至预设颜色转换模型中,输出所述待处理初始图像颜色转换后的图像,将所述颜色转换后的图像作为待处理图像。
3.如权利要求1所述的基于细节提取的图像处理方法,其特征在于,所述将所述抽样N列数据中的对抽样到的每列数据中的每个通道数据进行J层离散有限能变换,确定每列数据中的每个通道数据的J个细节信号,包括:
获取所述抽样N列数据中的每列数据中的每个通道数据;
将每个通道数据输入至预设J层离散有限能变换模型,输出每一层对应的细节信号;
根据每一层对应的细节信号,确定所述抽样N列数据中的每列数据中的每个通道数据的J个细节信号。
4.如权利要求1所述的基于细节提取的图像处理方法,其特征在于,所述将所述抽样变换域二维矩阵向量输入至预设的图像处理神经网络模型中,输出目标区域的特征向量,确定所述图像处理结果之前,还包括:
获取样本图像对应的一维标签数据;
将所述一维标签数据作为预先构建的神经网络模型的训练过程中的先验数据,训练预先构建的神经网络模型,得到训练完成的神经网络模型,将所述训练完成的神经网络模型作为预设的图像处理神经网络模型。
5.如权利要求4所述的基于细节提取的图像处理方法,其特征在于,所述获取样本图像对应的一维标签数据,包括:
根据样本图像中每一列的长度,确定一维列向量的长度,使所述样本图像中的每一行与所述一维列向量中的每一行一一对应;
根据获取到的所述样本图像中的每一个目标区域的起始行位置与终止行位置,在所述一维列向量中确定与每一个目标区域的起始行位置与终止行位置对应的向量目标区域;
根据所述一维列向量中的每一个向量目标区域填充的标注信息,获取所述样本图像对应的一维标签数据。
6.如权利要求1所述的基于细节提取的图像处理方法,其特征在于,所述图像处理神经网络模型包括:至少一个编码器,求和模块,激活函数模块和全连接层,各个所述编码器的输入端和输出端依次串联,第一个所述编码器的输入端用于输入所述抽样变换域二维矩阵向量,最后一个所述编码器用于输出与所述抽样变换域二维矩阵向量大小相等的编码后的抽样变换域二维矩阵向量;
所述求和模块用于对所述编码后的抽样变换域二维矩阵向量中的每一列进行求和,得到与所述编码后的抽样变换域二维矩阵向量列数相等的求和一维向量;
所述激活函数模块用于对所述求和一维向量进行归一化处理,得到归一化的一维向量;
所述全连接层用于对所述归一化的一维向量进行线性变换处理,输出目标区域的特征向量。
7.如权利要求6所述的基于细节提取的图像处理方法,其特征在于,各个所述编码器包括多头自注意力模块、第一残差模块、全连接层和第二残差模块,其中,所述多头自注意力模块用于输入所述抽样变换域二维矩阵向量,所述第一残差模块用于求取所述多头自注意力模块中输入和所述多头自注意力模块中输出之间残差并进行归一化处理;所述全连接层用于对所述归一化处理的结果进行线性变换,输出与所述归一化处理的结果大小相等的抽样变换域二维矩阵向量,所述第二残差模块用于求取所述全连接层输入和所述全连接层输出之间残差并进行归一化处理,输出与所述抽样变换域二维矩阵向量大小相等的编码后的抽样变换域二维矩阵向量。
8.一种基于细节提取的图像处理装置,其特征在于,所述装置包括:
抽样模块,用于按照待处理图像的宽度方向,从待处理图像中抽样N列数据,得到抽样N列数据;其中,每列数据均包括M个通道数据, N,M为大于1的整数;
细节信号获取模块,用于对所述得到抽样N列数据中的每个通道数据进行J层离散有限能变换,确定每列数据中的每个通道数据的J个细节信号;其中J为大于1 的整数,其中J层离散有限能变换的计算公式如下:
离散有限能变变换的原生函数公式如下:
离散有限能变变换的辅函数公式如下:
输入信号,/>为输入离散信号的第K项,/> 为取样速率,则输入信号表示为:
的分解递推公式如下:
为粗略系数,/>为细节系数,J依次递减直到0,x为N列数据中的每个通道数据,由分解得到的细节系数构成细节信号;
拼接模块,用于将所述抽样N列数据中的每列数据中的每个通道数据的J个细节信号拼接为一维向量,得到M*N个一维向量,并将所述M*N个一维向量拼接为抽样变换域二维矩阵向量;其中各个所述一维向量的长度为所述J个细节信号的信号长度之和;
处理结果确定模块,用于将所述抽样变换域二维矩阵向量输入至预设的图像处理神经网络模型中,神经网络模型处理输入的变换域数据后,输出目标区域的特征向量,确定图像处理结果;
目标区域确定模块,用于根据所述图像处理结果,在所述待处理图像中确定所述图像处理结果对应的目标区域。
9.一种计算机设备,其特征在于,所述计算机设备包括处理器、存储器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如权利要求1至7任一项所述的基于细节提取的图像处理方法。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述的基于细节提取的图像处理方法。
CN202211103063.0A 2022-09-09 2022-09-09 基于细节提取的图像处理方法、装置、设备及存储介质 Active CN116091758B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211103063.0A CN116091758B (zh) 2022-09-09 2022-09-09 基于细节提取的图像处理方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211103063.0A CN116091758B (zh) 2022-09-09 2022-09-09 基于细节提取的图像处理方法、装置、设备及存储介质

Publications (2)

Publication Number Publication Date
CN116091758A CN116091758A (zh) 2023-05-09
CN116091758B true CN116091758B (zh) 2023-08-25

Family

ID=86201281

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211103063.0A Active CN116091758B (zh) 2022-09-09 2022-09-09 基于细节提取的图像处理方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN116091758B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108846800A (zh) * 2018-05-30 2018-11-20 武汉大学 一种图像超分辨率重建的无参考图像质量评价方法
CN108961177A (zh) * 2018-06-15 2018-12-07 杭州富扬科技有限公司 一种oct图像散点噪声的抑制方法
WO2021008275A1 (zh) * 2019-07-15 2021-01-21 华为技术有限公司 基于小波变换的图像编解码方法及装置
CN114010180A (zh) * 2021-11-05 2022-02-08 清华大学 一种基于卷积神经网络的磁共振快速成像方法及装置
CN114998708A (zh) * 2022-06-10 2022-09-02 安徽农业大学 一种基于图谱信号的茶叶种类识别方法和装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108846800A (zh) * 2018-05-30 2018-11-20 武汉大学 一种图像超分辨率重建的无参考图像质量评价方法
CN108961177A (zh) * 2018-06-15 2018-12-07 杭州富扬科技有限公司 一种oct图像散点噪声的抑制方法
WO2021008275A1 (zh) * 2019-07-15 2021-01-21 华为技术有限公司 基于小波变换的图像编解码方法及装置
CN114010180A (zh) * 2021-11-05 2022-02-08 清华大学 一种基于卷积神经网络的磁共振快速成像方法及装置
CN114998708A (zh) * 2022-06-10 2022-09-02 安徽农业大学 一种基于图谱信号的茶叶种类识别方法和装置

Also Published As

Publication number Publication date
CN116091758A (zh) 2023-05-09

Similar Documents

Publication Publication Date Title
CN112801280B (zh) 视觉深度自适应神经网络的一维卷积位置编码方法
CN115147598B (zh) 目标检测分割方法、装置、智能终端及存储介质
CN113792741B (zh) 文字识别方法、装置、设备及存储介质
CN115885289A (zh) 利用全局自注意力神经网络对依赖性建模
US20200057921A1 (en) Image classification and conversion method and device, image processor and training method therefor, and medium
CN106503112B (zh) 视频检索方法和装置
CN111935487B (zh) 一种基于视频流检测的图像压缩方法及系统
CN111179270A (zh) 基于注意力机制的图像共分割方法和装置
CN114419408A (zh) 目标重识别方法、终端设备及计算机可读存储介质
CN113015022A (zh) 行为识别方法、装置、终端设备及计算机可读存储介质
CN116071300A (zh) 一种基于上下文特征融合的细胞核分割方法及相关设备
Xia et al. Highly accurate real-time image steganalysis based on GPU
CN114781499A (zh) 一种构建基于ViT模型的密集预测任务适配器的方法
CN110717405A (zh) 人脸特征点定位方法、装置、介质及电子设备
RU2408076C1 (ru) Способ сжатия изображения
CN116091758B (zh) 基于细节提取的图像处理方法、装置、设备及存储介质
CN116403090A (zh) 一种基于动态锚框和Transformer的小尺寸目标检测方法
CN116796287A (zh) 图文理解模型的预训练方法、装置、设备及存储介质
CN113344784A (zh) 通过潜在空间正则化对监督式生成对抗网络进行优化
CN116524357A (zh) 高压线路鸟巢检测方法、模型训练方法、装置及设备
CN116168394A (zh) 图像文本识别方法和装置
CN114693919A (zh) 一种目标检测方法、终端设备及存储介质
CN110134813B (zh) 图像检索方法、图像检索装置及终端设备
CN115988260A (zh) 一种图像处理方法、装置及电子设备
CN113139617A (zh) 一种输电线路自主定位方法、装置及终端设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant