CN112541911A - 图像处理方法及装置 - Google Patents

图像处理方法及装置 Download PDF

Info

Publication number
CN112541911A
CN112541911A CN202011540268.6A CN202011540268A CN112541911A CN 112541911 A CN112541911 A CN 112541911A CN 202011540268 A CN202011540268 A CN 202011540268A CN 112541911 A CN112541911 A CN 112541911A
Authority
CN
China
Prior art keywords
image
sub
determining
length
images
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011540268.6A
Other languages
English (en)
Inventor
崔程
魏凯
杨敏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN202011540268.6A priority Critical patent/CN112541911A/zh
Publication of CN112541911A publication Critical patent/CN112541911A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformations in the plane of the image
    • G06T3/04Context-preserving transformations, e.g. by using an importance map
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/136Segmentation; Edge detection involving thresholding
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10004Still image; Photographic image

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Quality & Reliability (AREA)
  • Image Analysis (AREA)

Abstract

本申请公开了一种图像处理方法及装置,涉及人工智能领域的计算机视觉和深度学习方面。具体实现方案为:将待处理的第一图像划分为至少两个子图像,第一图像中包括第一对象,子图像为第一对象中的一部分,子图像的长度与宽度的比值在预设范围内;根据每个子图像的像素信息,确定每个子图像的图像特征。根据每个子图像的图像特征,确定第一对象的标识。通过将第一图像划分为多个子图像,并且每个子图像的长度与宽度的比值在预设范围内,之后基于划分的子图像,确定第一图像中的第一对象的标识,从而无需对第一图像进行缩放,避免了因为图像缩放所导致的图像失真,有效提升了对图像中对象标识的识别准确率。

Description

图像处理方法及装置
技术领域
本申请涉及人工智能领域的计算机视觉和深度学习方面,尤其涉及一种图像处理方法及装置。
背景技术
在图像处理中,对图像中的对象进行识别是一个很重要的部分,例如可以识别对象的标识、类型等。
目前,在对图像中的对象进行识别时,首先需要将图像缩放至预设的长宽比,其中预设的长宽比是图像识别的标准化要求,之后基于缩放后的图像进行识别处理,以确定对象的标识、类型等。
然而,缩放之后会导致图像失真,基于失真的图像进行处理,会导致对象标识的识别成功率较低。
发明内容
本申请提供了一种用于图像处理的方法、装置、设备以及存储介质。
根据本申请的第一方面,提供了一种图像处理方法,其中,包括:
将待处理的第一图像划分为至少两个子图像,所述第一图像中包括第一对象,所述子图像为所述第一对象中的一部分,所述子图像的长度与宽度的比值在预设范围内;
根据每个子图像的像素信息,确定每个子图像的图像特征;
根据每个子图像的图像特征,确定所述第一对象的标识。
根据本申请的第二方面,提供了一种图像处理装置,其中,包括:
划分模块,用于将待处理的第一图像划分为至少两个子图像,所述第一图像中包括第一对象,所述子图像为所述第一对象中的一部分,所述子图像的长度与宽度的比值在预设范围内;
确定模块,用于根据每个子图像的像素信息,确定每个子图像的图像特征;
所述确定模块,还用于根据每个子图像的图像特征,确定所述第一对象的标识。
根据本申请的第三方面,提供了一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行第一方面所述的方法。
根据本申请的第四方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行第一方面所述的方法。
根据本申请的第五方面,提供了一种计算机程序产品,所述程序产品包括:计算机程序,所述计算机程序存储在可读存储介质中,电子设备的至少一个处理器可以从所述可读存储介质读取所述计算机程序,所述至少一个处理器执行所述计算机程序使得电子设备执行第一方面所述的方法。
根据本申请的技术有效提升了对图像中对象标识的识别准确率。
应当理解,本部分所描述的内容并非旨在标识本申请的实施例的关键或重要特征,也不用于限制本申请的范围。本申请的其它特征将通过以下的说明书而变得容易理解。
附图说明
附图用于更好地理解本方案,不构成对本申请的限定。其中:
图1为本申请实施例提供的图像缩放示意图;
图2为本申请实施例提供的图像处理方法的流程图;
图3为本申请实施例提供的图像处理方法的流程图二;
图4为本申请实施例提供的第一图像的示意图一;
图5为本申请实施例提供的第一图像的示意图二;
图6为本申请实施例提供的对第一图像进行切分的实现示意图;
图7为本申请实施例提供的预设模型的网络结构示意图;
图8为本申请实施例的图像处理装置的结构示意图;
图9是用来实现本申请实施例的图像处理方法的电子设备的框图。
具体实施方式
以下结合附图对本申请的示范性实施例做出说明,其中包括本申请实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本申请的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
为了更好的理解本申请的技术方案,首先对本申请所涉及的背景技术进行进一步的详细介绍:
在图像处理中,通常会有针对图像中的对象进行识别的任务,在大多数的图片识别任务中,无论在训练阶段还是测试阶段,图片始终被缩放到一个固定的方形尺寸,其中,固定的方形尺寸是图像处理的标准化要求。
对于自然图像的识别场景中,该方案是合理的,因为大部分自然图像被缩放到一个方形的尺寸后不太失真。
但是在长宽比太大或者长宽比太小的图像的识别场景中,如果将其缩放到一个方形的尺寸后,会导致图像严重失真。此处进行举例说明,例如针对徽标(logo)进行识别时,由于很多logo图片的长宽比比较大,缩放会导致logo图像失真,例如可以参照图1进行理解,图1为本申请实施例提供的图像缩放示意图。
如图1所示,当前存在一个长方形的logo图像101,其中图像101的长宽比是比较大的,在将图像101缩放至固定的方形尺寸之后,即可以得到如102所示的图像,从图中可以看出,图像102已经发生了严重的失真,若基于图像102进行logo识别,则会导致识别的准确率较低。
下面对logo识别的一种可能的实现方式进行说明,在Logo识别的处理过程中,通常可以分为检测模块与识别模块。
首先在图片中通过训练好的检测器将其中疑似logo的地方标记出来(检测模块),其次,将标记后的logo图片送入识别模型中,识别模型给出该logo的类别、置信度等信息(识别模块),完成一次logo识别。
在logo识别中,最重要的是识别模块,其对识别的结果影响非常大,所以提升该模块的准确率至关重要。
基于上述介绍可以确定的是,传统logo的识别方案与其他垂类识别的方案类似,将logo图片缩放到固定的方形尺寸再去识别,此方案会导致很多logo图片失真,从而导致识别的准确率降低。
值得说明的是,上述介绍的是针对logo图像的缩放,会导致图像失真,实际上无论是长宽比过大的图像,或者长宽比过小的图像,将其缩放至固定的方形尺寸,均会导致图像的失真,进而导致识别的准确率较差。
针对现有技术中的问题,本申请提出了如下技术构思:针对长宽比过大或者长宽比过小的图像,可以将其切分为至少两个子图像,切分的子图像的长宽比是比较小的,之后基于切分的子图像进行图像识别处理,从而无需对原始图像进行缩放,有效避免了缩放导致的图像失真,从而可以有效提升识别的成功率。
下面结合具体的实施例对本申请提供的图像处理方法进行详细介绍,值得说明的是,本申请中各实施例的执行主体可以为处理器、服务器、微处理器等,本实施例对此不做限制,凡是可以用于图像处理的设备,均可以作为本申请中各实施例的执行主体。
图2为本申请实施例提供的图像处理方法的流程图,如图2所示,该方法包括:
S201、将待处理的第一图像划分为至少两个子图像,第一图像中包括第一对象,子图像为第一对象中的一部分,子图像的长度与宽度的比值在预设范围内。
在本实施例中,待处理的第一图像例如可以为长宽比较大的图像,或者,待处理的第一图像还可以是长宽比比较小的图像,本实施例对此不做限定。
在第一图像中包括第一对象,其中,第一对象例如可以为上述介绍的logo,或者第一对象还可以为图像中任意的对象,例如字符、标志、动物、人等等,本实施例对第一图像的具体实现方式不做特别限制,只要第一图像是长宽比较大的图像,至于第一图像中所包括的第一对象具体是什么,可以根据实际的第一图像的实现进行确定。
本实施例中可以将待处理的第一图像进行划分,得到至少两个子图像,其中,子图像的长度与宽度的比值在预设范围内,本实施例中的预设范围用于显示子图像的长宽比不能太大,例如预设范围的设置可以保证子图像的缩放不会导致失真,在实际实现过程中,具体的预设范围的实现,可以根据实际需求进行选择。
在一种可能的实现方式中,可以直接划分得到方形的子图像,进而保证在后续的处理过程中就无需进行缩放。
或者,还可以划分得到近似方形的子图像,只要子图像的长度和宽度的比值在预设范围内即可,也可以理解为只要保证子图像的长宽比不是非常大即可,本实施例对划分的子图像具体长宽比不做特别限制,其可以根据实际需求进行选择。
本实施例中通过限定子图像的长度与宽度的比值在预设范围内,进而可以保证后续在根据子图像进行处理是,即使对子图像进行缩放,也不会导致图像的失真。
在划分第一图像的一种可能的实现方式中,例如可以直接将第一图像划分成多个等份,从而得到至少两个子图像;或者,还可根据第一图像的宽度,在第一图像的长度方向上按照宽度进行划分,从而得到多个方形的子图像,或者还可以将第一图像划分为多个长度宽度不相等的子图像,本实施例对划分的具体实现方式不做特别限制,其可以根据实际需求进行选择,只要能够实现将第一图像划分为至少两个子图像,并且子图像的长度与宽度的比值在预设范围内即可。
以及本实施例中的第一图像中包括第一对象,因此在对第一图像划分得到的子图像中,就可以包括第一图像中的一部分。
S202、根据每个子图像的像素信息,确定每个子图像的图像特征。
其中,子图像的像素信息例如可以包括如下中的至少一种:像素值、RGB值,或者任意的像素相关的信息,均可以作为本实施例中的像素信息。
在本实施例中,基于子图像的像素信息,可以确定每个子图像的图像特征,在一种可能的实现方式中,例如可以根据预设模型对子图像的像素信息进行处理,从而输出在子图像的图像特征;或者,还可以根据相关的算法对子图像的像素信息进行分析,从而确定子图像的图像特征,本实施例对确定图像特征的具体实现方式不做特别限制,只要图像特征是根据像素信息确定的即可。
在一种可能的实现方式中,图像特征例如可以包括颜色特征、轮廓特征等。
S203、根据每个子图像的图像特征,确定第一对象的标识。
在本实施例中,第一对象的标识可以用于指示第一对象具体是什么内容,例如第一对象是logo时,第一对象的标识例如可以指示第一对象是什么logo;再例如第一对象是动物时,第一对象的标志例如可以指示第一对象是什么动物,本实施例对第一对象的标识的具体实现方式不做限定,其可以根据实际需求进行选择。
其中,第一对象的标识可以是根据每个子图像的图像特征确定的,在一种可能的实现方式中,例如可以根据各个子图像的图像特征求取平均特征,将该平均特征作为第一图像的图像特征,之后根据第一图像的图像特征和数据库中的各个预设图像的图像特征进行比较,从而确定和第一图像最为相似的预设图像,其中预设图像的标识是已知的,因此可以将该预设图像的标识确定为第一对象的标识。
或者,还可以根据每个子图像的图像特征,直接和数据库中的预设图像的图像特征进行比较,从而获取匹配成功的预设图像,并将该预设图像的标识确定为第一对象的标识。
或者,还可以通过预设的算法直接对子图像的图像特征进行处理,从而直接输出第一对象的标识,本实施例对根据子图像的图像特征确定第一对象的标识的具体实现方式不做特别限制,其可以根据实际需求进行选择。
综上所述,本申请实施例通过将第一图像划分为至少两个子图像,并且保证子图像的长宽比在预设范围内,后续根据子图像的图像特征,对第一图像中的第一对象进行识别,从而可以保证无需对第一图像进行缩放,即可以实现对第一图像的对象识别,有效保证了识别的准确性。
本申请实施例提供的图像处理方法,包括:将待处理的第一图像划分为至少两个子图像,第一图像中包括第一对象,子图像为第一对象中的一部分,子图像的长度与宽度的比值在预设范围内;根据每个子图像的像素信息,确定每个子图像的图像特征。根据每个子图像的图像特征,确定第一对象的标识。通过将第一图像划分为多个子图像,并且每个子图像的长度与宽度的比值在预设范围内,之后基于划分的子图像,确定第一图像中的第一对象的标识,从而可以实现无需对第一图像进行缩放,就可以有效实现对象识别,避免了因为图像缩放所导致的图像失真,有效提升了对图像中对象标识的识别准确率。
在上述实施例的基础上,下面结合图3至图7对本申请提供的图像处理方法进行进一步的详细介绍,图3为本申请实施例提供的图像处理方法的流程图二,图4为本申请实施例提供的第一图像的示意图一,图5为本申请实施例提供的第一图像的示意图二,图6为本申请实施例提供的对第一图像进行切分的实现示意图,图7为本申请实施例提供的预设模型的网络结构示意图。
如图3所示,该方法包括:
S301、获取第一图像的长宽比,长宽比为第一图像的长度和宽度的比值。
在本实施例中,针对长宽比过大的图像,或者长宽比过小的图像,可以进行图像的切分处理,因此可以首先获取第一图像的长宽比,以确定是否需要对第一图像进行切分,其中,长宽比是指第一图像的长度和宽度的比值。
S302、在长宽比大于或等于第一阈值,或者长宽比小于或等于第二阈值,根据长宽比,确定分割方向,分割方向为横向分割或者纵向分割。
其中,长宽比可能大于等于第一阈值,当前情况下第一图像呈现出横向较长,例如可以参照图4进行理解,在图4中,第一图像的长度为a,第一图像的宽度为b,第一图像的长宽比也就是a和b的比值,则例如图4中的第一图像的长宽比就可以大于第一阈值。
或者,长宽比可能小于等于第二阈值,当前情况下第一图像呈现出纵向较长,例如可以参照图5进行理解,在图5中,第一图像的长度为c,第一图像的宽度为d,第一图像的长宽比也就是c和d的比值,则例如图5中的第一图像的长宽比就可以小于第二阈值。
其中,第一阈值为用于指示长宽比太大的阈值,第二阈值为用于指示长宽比太小的阈值,第一阈值和第二阈值的具体实现方式可以根据实际需求进行设置,本实施例对此不做特别限制。
在本实施例中,可以根据长宽比确定分割方向,其中,分割方向可以为横向分割或者纵向分割。
在一种可能的实现方式中,在长宽比大于或等于第一阈值时,分割方向为纵向分割。
具体的,当第一图像的长宽比大于等于第一阈值时,表明第一图像是横向较长,为了保证切分之后的子图像的长宽比较小,可以在纵向上对图像进行分割。
在另一种可能的实现方式中,在长宽比小于或等于第二阈值时,分割方向为横向分割。
具体的,当第一图像的长宽比小于等于第二阈值时,表明第一图像是纵向较长,为了保证切分之后的子图像的长宽比较小,可以在横向上对图像进行分割。
以及在可选的实施例中,若长宽比小于第一阈值,或者长宽比大于第二阈值,则表明当前图像的长宽比是合适的,即使进行了缩放也不影响识别,因此对于这部分图像,可以无需进行切分,直接进行后续的识别处理即可。
S303、根据第一图像的长度和宽度,确定至少两个子图像的数量N,N为大于或等于2的整数。
本实施例中,可以确定具体将第一图像切分成多少个子图像,在一种可能的实现方式中,可以根据第一图像的长度和宽度,确定需要切分的子图像的数量N。
比如可以首先根据第一图像的长度和宽度,确定短边长度X和长边长度Y,之后根据短边长度和长边长度,确定数量N为
Figure BDA0002854369960000081
[]为取整符号。
其中,短边长度为长度和宽度中的最小值,长边长度为长度和宽度中的最大值。
在一种可能的实现方式中,假设第一图像是图4所示的长宽比较大的图像,也就是说第一图像是横向较长的图像,此时要进行横向的切割,则此时短边长度X就是图4中的b(也就是宽度方向),长边长度Y就是图4中所示的a(也就是长度方向)。
当前状况下,例如切分的子图像的数量N例如可以满足如下公式一:
Figure BDA0002854369960000091
其中,length为第一图像的长度、width为第一图像的宽度、int()为取整函数。
在另一种可能的实现方式中,假设第一图像是图5所示的长宽比较小的图像,也就是说第一图像是纵向较长的图像,此时要进行纵向的切割,则此时短边长度X就是图5中的c(也就是长度方向),长边长度Y就是图5中所示的d(也就是宽度方向)。
当前状况下,例如切分的子图像的数量N例如可以满足如下公式二:
Figure BDA0002854369960000092
其中,width为第一图像的宽度、length为第一图像的长度、int()为取整函数。
在实际实现过程中,具体如何确定切分图像的数量N,可以取决于第一图像的实现,本实施例对此不做限制,以及除了上述介绍的实现方式之外,还可以通过其余的可能的实现方式确定切分图像的数量,例如可以为上述公式的恒等变形,或者是在上述公式中添加相关系数,或者还可以是与上述公式完全不同的确定方式等,本实施例对此不做特别限定,只要切分的子图像的数量是根据第一图像的长度和宽度确定的即可。
S304、根据数量N和短边长度,确定重合长度。
本实施例中可以限定切分得到的子图像为方形,从而可以使得后续根据切分的子图像就可以直接进行处理,无需再进行缩放,以提升图像处理的效率。
然而,第一图像未必会刚好能切分为多个方形,因此本实施例中每两个相邻的子图像中具有重合部分,重合部分的长度为重合长度。在本实施例中,可以根据切分的数量N和短边长度,确定每两个子图像之间的重合长度。
在一种可能的实现方式中,重合长度例如可以满足如下的公式三:
Figure BDA0002854369960000101
其中,m为重合长度,N为子图像的数量,X为短边长度,int()为取整函数。
在其余可能的实现方式中,根据数量N和短边长度确定重合长度的实现方式还可以根据实际需求进行扩展和选择,例如可以为上述公式三的恒等变形,或者是在上述公式三中添加相关系数,或者还可以是与上述公式三完全不同的确定方式等,本实施例对此不做特别限定。
S305、根据短边长度、分割方向和重合长度,确定每个子图像对应的切分起始位置和切分终止位置。
在本实施例中,切分的子图像是正方形,正方形的长和宽是相等的,为了实现将第一图像切分为多个正方形的子图像,因此在本实施例中各个子图像的长度必然是保持和短边长度一致的。以及本实施例中,每两个相邻的子图像之间还存在重合部分,本实施例中还需要考虑分割方向,因此本实施例中可以根据短边长度、分割方向和重合长度,确定每个子图像对应的切分起始位置和切分终止位置。
在一种可能的实现方式中,若分割方向为纵向分割,则需要在第一图像的长度方向上确定切分位置;在另一种可能的实现方式中,若分割方向为横向分割,则需要在第一图像的宽度方向上确定切分位置。
具体在确定切分位置时,切分起始位置例如可以满足如下公式四:
k`=k+X-m 公式四
其中,X为短边长度,m为重合长度,k为切分起始位置,k`为切分终止位置。
可以理解的是,上一个子图像的切分终止位置就是下一个子图像的切分起始位置,在第一次进行切分时,起始位置k为0,进而可以根据上述公式三确定第一次切分的终止位置;从第二次切分开始,起始位置k就是上一次切分的终止位置,依次类推,就可以得到各个子图像的切分起始位置和切分终止位置。
S306、根据每个子图像对应的切分起始位置和切分终止位置,将第一图像划分为至少两个子图像,每个子图像的长度和宽度相同。
在确定每个子图像对应的切分起始位置和切分终止位置之后,就可以根据各个切分起始位置和切分终止位置,对第一图像进行划分了,本实施例中的每个子图像是正方形的,因此每个子图像的长度和宽度相同。
例如可以结合图6对切分的子图像进行理解,例如当前对于长宽比大于第一阈值的第一图像进行切分,得到4个子图像,如图6所示,每个子图像的长度和宽度都相同,并且每两个子图像之间存在重合部分。
针对长宽比小于第二阈值的第一图像的切分实现方式类似,此处不再赘述。
S307、针对任意一个子图像,获取子图像中各像素点的像素信息,像素信息包括如下至少一种:像素值或者红绿蓝RGB值。
在本实施例中,针对切分得到的多个子图像,每个子图像中都包括多个像素点,因此可以获取各个子图像中各像素点的像素信息,在一种可能的实现方式中,像素信息可以包括如下中的至少一种:像素值或者红绿蓝RGB值。
S308、根据子图像中各像素点的像素信息,确定子图像中包括的子对象的颜色特征和轮廓特征。
S309、根据颜色特征和轮廓特征,确定子图像的图像特征。
下面对S308和S309一起进行介绍:
本实施例中,子图像为第一对象中的一部分,因此在子图像中可以包括子对象,本实施例中基于各个子图像的各像素点的像素信息,例如可以通过算法分析,从而确定子对象的颜色特征和轮廓特征,其中,颜色特征用于指示子对象包括什么颜色,轮廓特征用于指示子对象的轮廓,之后可以将颜色特征和轮廓特征确定为子图像的图像特征,以便后续进行识别。
在本实施例中,上述介绍了可以根据相关的算法确定颜色特征和轮廓特征,进而确定子图像的图像特征。
在另一种可能的实现方式中,还可以通过预设模型分别对每个子图像的像素信息进行处理,得到每个子图像的图像特征;其中,预设模型为对多组样本进行学习得到的,每组样本包括样本图像和样本图像的样本图像特征。
因此本实施例中的预设模型可以输出每个子图像的图像特征,例如可以参照图7进行理解,如图7所示:
假设当前对第一图像进行切分之后,得到4个子图像,分别是子图像701、子图像702、子图像703、子图像704,之后可以将多个切分后的子图像输入到已经训练好的用于提取特征的预设模型中,其中预设模型例如可以为图7所示的骨干网络。
在一种可能的实现方式中,例如可以采用批处理(batch)的方式,将多个子图像输入至图7的骨干网络中。
在骨干网络处理之后,可以得到特征层,在特征层中包括4个子图像各自的图像特征,其中,705例如可以为子图像701的图像特征,706例如可以为子图像702的图像特征,707例如可以为子图像703的图像特征,708例如可以为子图像704的图像特征。
在实际实现过程中,具体是选择算法进行处理,以得到各个子图像的图像特征,还是根据预设模型进行处理,以得到各个子图像的图像特征,可以根据实际需求进行选择,本实施例对此不做特别限制。
S310、将每个子图像的图像特征进行相加处理、以及取平均值处理,得到第一图像的图像特征。
在得到各个子图像的图像特征之后,可以将各个子图像的图像特征做平均处理,从而可以得到第一图像的图像特征。
例如可以参见图7,将N个embedding层(特征层)做平均处理,也就是相加后除以N,处理后的特征即为输入的第一图像的最终特征。
S311、获取第一图像的图像特征与预设图像特征库中各图像特征之间的相似度。
在本实施例中,设置有预设图像特征库,在预设图像特征库中包括多个预设图像,以及各个预设图像对饮与各自的图像特征和对象标识,因此本实施例中可以将第一图像的图像特征和预设图像特征库中的各图像特征进行比较,以获取第一图像的图像特征和预设图像特征库各图像特征之间的相似度。
S312、根据第一图像的图像特征与预设图像特征库中各图像特征之间的相似度,在预设图像特征库中确定目标图像特征。
在一种可能的实现方式中,相似度例如可以通过特征之间的距离来表示,则本实施例中根据图像特征的相似度,确定目标图像特征时,例如可以是计算图像特征之间的距离,之后对距离进行排序,将距离最近的图像特征确定为目标图像特征。
S313、将目标图像特征对应的标识确定为第一对象的标识。
在确定目标图像特征之后,可以获取目标图像特征所对应的标识,将该标识确定为第一对象的标识,以及本实施例中还可以输出置信度,其中,置信度例如可为根据上述的相似度确定的,用于指示当前识别的第一对象的标识的准确率。
至此,就完成了对第一图像中的第一对象的标识的识别,在上述实现过程中,无需对第一图像进行缩放,就实现了图像识别,因此可以有效保证识别的准确率。
本申请实施例提供的图像处理方法,通过设置子图像的长度和宽度相等,也就是说将确定划分的子图像为正方形,从而可以保证在图像处理的过程中,可以直接根据子图像进行处理,无需再进行缩放,从而可以有效提升图像处理的效率。并且根据第一图像的长度和宽度,具体确定了各个子图像的划分数量、重合长度、划分位置等,从而可以简单有效的实现将第一图像划分为多个正方形的子图像,保证处理过程的稳定性,后续根据切分的多个子图像进行特征提取,根据提取的图像特征和预设图像特征库中的图像特征进行比较,以确定目标图像特征,根据目标图像特征对应的标识,就可以快速有效的确定第一图像的标识,并且上述过程中,无需对第一图像进行缩放,从而可以保证第一图像不发生失真,从而有效提升了图像识别的成功率。
本申请提供一种图像处理方法及装置,应用于人工智能领域的计算机视觉和深度学习方面,以达到提升了对图像中对象标识的识别准确率的目的。
图8为本申请实施例的图像处理装置的结构示意图。如图8所示,本实施例的图像处理装置800可以包括:划分模块801、确定模块802。
划分模块801,用于将待处理的第一图像划分为至少两个子图像,所述第一图像中包括第一对象,所述子图像为所述第一对象中的一部分,所述子图像的长度与宽度的比值在预设范围内;
确定模块802,用于根据每个子图像的像素信息,确定每个子图像的图像特征;
所述确定模块802,还用于根据每个子图像的图像特征,确定所述第一对象的标识。
一种可能的实现方式中,所述确定模块802,包括:
第一获取单元,用于针对任意一个子图像,获取所述子图像中各像素点的像素信息,所述像素信息包括如下至少一种:像素值或者红绿蓝RGB值;
第一确定单元,用于根据所述子图像中各像素点的像素信息,确定所述子图像的图像特征。
一种可能的实现方式中,所述第一确定单元还用于:
根据所述子图像中各像素点的像素信息,确定所述子图像中包括的子对象的颜色特征和轮廓特征;
根据所述颜色特征和所述轮廓特征,确定所述子图像的图像特征。
一种可能的实现方式中,所述确定模块802,包括:
处理单元,用于通过预设模型分别对每个子图像的像素信息进行处理,得到每个子图像的图像特征;其中,所述预设模型为对多组样本进行学习得到的,每组样本包括样本图像和所述样本图像的样本图像特征。
一种可能的实现方式中,所述划分模块801,包括:
第二获取单元,用于获取所述第一图像的长宽比,所述长宽比为所述第一图像的长度和宽度的比值;
划分单元,用于在所述长宽比大于或等于第一阈值,或者所述长宽比小于或等于第二阈值,将所述第一图像划分为所述至少两个子图像。
一种可能的实现方式中,所述划分单元,包括:
确定子单元,用于根据所述长宽比,确定分割方向,所述分割方向为横向分割或者纵向分割;
所述确定子单元,还用于根据所述第一图像的长度和宽度,确定所述至少两个子图像的数量N,所述N为大于或等于2的整数;
划分子单元,用于根据所述分割方向和所述数量N,将所述第一图像划分为所述至少两个子图像。
一种可能的实现方式中,所述确定子单元,具体用于:
在所述长宽比大于或等于所述第一阈值时,所述分割方向为纵向分割;
在所述长宽比小于或等于所述第二阈值时,所述分割方向为横向分割。
一种可能的实现方式中,所述确定子单元,具体用于:
根据所述第一图像的长度和宽度,确定短边长度X和长边长度Y,所述短边长度为所述长度和所述宽度中的最小值,所述长边长度为所述长度和所述宽度中的最大值;
确定所述数量N为
Figure BDA0002854369960000151
[]为取整符号。
一种可能的实现方式中,所述划分子单元,具体用于:
根据所述数量N和所述短边长度,确定重合长度;
根据所述短边长度、所述分割方向和所述重合长度,确定每个子图像对应的切分起始位置和切分终止位置;
根据每个子图像对应的切分起始位置和切分终止位置,将所述第一图像划分为所述至少两个子图像,每个子图像的长度和宽度相同。
一种可能的实现方式中,每两个相邻的子图像中具有重合部分,所述重合部分的长度为所述重合长度。
一种可能的实现方式中,所述确定模块802,包括:
第二确定单元,用于根据每个子图像的图像特征,确定所述第一图像的图像特征;
所述第二确定单元,还用于根据所述第一图像的图像特征,确定所述第一对象的标识。
一种可能的实现方式中,所述第二确定单元,具体用于:
将每个子图像的图像特征进行相加处理、以及取平均值处理,得到所述第一图像的图像特征。
一种可能的实现方式中,所述第二确定单元,具体用于:
获取所述第一图像的图像特征与预设图像特征库中各图像特征之间的相似度;
根据所述第一图像的图像特征与预设图像特征库中各图像特征之间的相似度,在所述预设图像特征库中确定目标图像特征;
将所述目标图像特征对应的标识确定为所述第一对象的标识。
根据本申请的实施例,本申请还提供了一种电子设备和一种可读存储介质。
根据本申请的实施例,本申请还提供了一种计算机程序产品,程序产品包括:计算机程序,计算机程序存储在可读存储介质中,电子设备的至少一个处理器可以从可读存储介质读取计算机程序,至少一个处理器执行计算机程序使得电子设备执行上述任一实施例提供的方案。
图9示出了可以用来实施本申请的实施例的示例电子设备900的示意性框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本公开的实现。
如图9所示,电子设备900包括计算单元901,其可以根据存储在只读存储器(ROM)902中的计算机程序或者从存储单元908加载到随机访问存储器(RAM)903中的计算机程序,来执行各种适当的动作和处理。在RAM 903中,还可存储设备900操作所需的各种程序和数据。计算单元901、ROM 902以及RAM 903通过总线904彼此相连。输入/输出(I/O)接口905也连接至总线904。
设备900中的多个部件连接至I/O接口905,包括:输入单元906,例如键盘、鼠标等;输出单元907,例如各种类型的显示器、扬声器等;存储单元908,例如磁盘、光盘等;以及通信单元909,例如网卡、调制解调器、无线通信收发机等。通信单元909允许设备900通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
计算单元901可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元901的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元901执行上文所描述的各个方法和处理,例如图像处理方法。例如,在一些实施例中,图像处理方法可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元908。在一些实施例中,计算机程序的部分或者全部可以经由ROM 902和/或通信单元909而被载入和/或安装到设备900上。当计算机程序加载到RAM 903并由计算单元901执行时,可以执行上文描述的图像处理方法的一个或多个步骤。备选地,在其他实施例中,计算单元901可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行图像处理方法。
本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、负载可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)和互联网。
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,又称为云计算服务器或云主机,是云计算服务体系中的一项主机产品,以解决了传统物理主机与VPS服务("Virtual Private Server",或简称"VPS")中,存在的管理难度大,业务扩展性弱的缺陷。服务器也可以为分布式系统的服务器,或者是结合了区块链的服务器。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发申请中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本申请公开的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本申请保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本申请的精神和原则之内所作的修改、等同替换和改进等,均应包含在本申请保护范围之内。

Claims (29)

1.一种图像处理方法,其中,包括:
将待处理的第一图像划分为至少两个子图像,所述第一图像中包括第一对象,所述子图像为所述第一对象中的一部分,所述子图像的长度与宽度的比值在预设范围内;
根据每个子图像的像素信息,确定每个子图像的图像特征;
根据每个子图像的图像特征,确定所述第一对象的标识。
2.根据权利要求1所述的方法,其中,所述根据每个子图像的像素信息,确定每个子图像的图像特征,包括:
针对任意一个子图像,获取所述子图像中各像素点的像素信息,所述像素信息包括如下至少一种:像素值或者红绿蓝RGB值;
根据所述子图像中各像素点的像素信息,确定所述子图像的图像特征。
3.根据权利要求2所述的方法,其中,所述根据所述子图像中各像素点的像素信息,确定所述子图像的图像特征,包括:
根据所述子图像中各像素点的像素信息,确定所述子图像中包括的子对象的颜色特征和轮廓特征;
根据所述颜色特征和所述轮廓特征,确定所述子图像的图像特征。
4.根据权利要求1-3任一项所述的方法,其中,所述根据每个子图像的像素信息,确定每个子图像的图像特征,包括:
通过预设模型分别对每个子图像的像素信息进行处理,得到每个子图像的图像特征;其中,所述预设模型为对多组样本进行学习得到的,每组样本包括样本图像和所述样本图像的样本图像特征。
5.根据权利要求1-4任一项所述的方法,其中,所述将待处理的第一图像划分为至少两个子图像,包括:
获取所述第一图像的长宽比,所述长宽比为所述第一图像的长度和宽度的比值;
在所述长宽比大于或等于第一阈值,或者所述长宽比小于或等于第二阈值,将所述第一图像划分为所述至少两个子图像。
6.根据权利要求5所述的方法,其中,所述将所述第一图像划分为所述至少两个子图像,包括:
根据所述长宽比,确定分割方向,所述分割方向为横向分割或者纵向分割;
根据所述第一图像的长度和宽度,确定所述至少两个子图像的数量N,所述N为大于或等于2的整数;
根据所述分割方向和所述数量N,将所述第一图像划分为所述至少两个子图像。
7.根据权利要求6所述的方法,其中,所述根据所述长宽比,确定分割方向,包括:
在所述长宽比大于或等于所述第一阈值时,所述分割方向为纵向分割;
在所述长宽比小于或等于所述第二阈值时,所述分割方向为横向分割。
8.根据权利要求6或7所述的方法,其中,所述根据所述第一图像的长度和宽度,确定所述至少两个子图像的数量N,包括:
根据所述第一图像的长度和宽度,确定短边长度X和长边长度Y,所述短边长度为所述长度和所述宽度中的最小值,所述长边长度为所述长度和所述宽度中的最大值;
确定所述数量N为
Figure FDA0002854369950000021
[]为取整符号。
9.根据权利要求6-8任一项所述的方法,其中,所述根据所述分割方向和所述数量N,将所述第一图像划分为所述至少两个子图像,包括:
根据所述数量N和所述短边长度,确定重合长度;
根据所述短边长度、所述分割方向和所述重合长度,确定每个子图像对应的切分起始位置和切分终止位置;
根据每个子图像对应的切分起始位置和切分终止位置,将所述第一图像划分为所述至少两个子图像,每个子图像的长度和宽度相同。
10.根据权利要求9所述的方法,其中,每两个相邻的子图像中具有重合部分,所述重合部分的长度为所述重合长度。
11.根据权利要求1-10任一项所述的方法,其中,所述根据每个子图像的图像特征,确定所述第一对象的标识,包括:
根据每个子图像的图像特征,确定所述第一图像的图像特征;
根据所述第一图像的图像特征,确定所述第一对象的标识。
12.根据权利要求11所述的方法,其中,所述根据每个子图像的图像特征,确定所述第一图像的图像特征,包括:
将每个子图像的图像特征进行相加处理、以及取平均值处理,得到所述第一图像的图像特征。
13.根据权利要求11或12所述的方法,其中,所述根据所述第一图像的图像特征,确定所述第一对象的标识,包括:
获取所述第一图像的图像特征与预设图像特征库中各图像特征之间的相似度;
根据所述第一图像的图像特征与预设图像特征库中各图像特征之间的相似度,在所述预设图像特征库中确定目标图像特征;
将所述目标图像特征对应的标识确定为所述第一对象的标识。
14.一种图像处理装置,其中,包括:
划分模块,用于将待处理的第一图像划分为至少两个子图像,所述第一图像中包括第一对象,所述子图像为所述第一对象中的一部分,所述子图像的长度与宽度的比值在预设范围内;
确定模块,用于根据每个子图像的像素信息,确定每个子图像的图像特征;
所述确定模块,还用于根据每个子图像的图像特征,确定所述第一对象的标识。
15.根据权利要求14所述的装置,其中,所述确定模块,包括:
第一获取单元,用于针对任意一个子图像,获取所述子图像中各像素点的像素信息,所述像素信息包括如下至少一种:像素值或者红绿蓝RGB值;
第一确定单元,用于根据所述子图像中各像素点的像素信息,确定所述子图像的图像特征。
16.根据权利要求15所述的装置,其中,所述第一确定单元还用于:
根据所述子图像中各像素点的像素信息,确定所述子图像中包括的子对象的颜色特征和轮廓特征;
根据所述颜色特征和所述轮廓特征,确定所述子图像的图像特征。
17.根据权利要求14-16任一项所述的装置,其中,所述确定模块,包括:
处理单元,用于通过预设模型分别对每个子图像的像素信息进行处理,得到每个子图像的图像特征;其中,所述预设模型为对多组样本进行学习得到的,每组样本包括样本图像和所述样本图像的样本图像特征。
18.根据权利要求14-17任一项所述的装置,其中,所述划分模块,包括:
第二获取单元,用于获取所述第一图像的长宽比,所述长宽比为所述第一图像的长度和宽度的比值;
划分单元,用于在所述长宽比大于或等于第一阈值,或者所述长宽比小于或等于第二阈值,将所述第一图像划分为所述至少两个子图像。
19.根据权利要求18所述的装置,其中,所述划分单元,包括:
确定子单元,用于根据所述长宽比,确定分割方向,所述分割方向为横向分割或者纵向分割;
所述确定子单元,还用于根据所述第一图像的长度和宽度,确定所述至少两个子图像的数量N,所述N为大于或等于2的整数;
划分子单元,用于根据所述分割方向和所述数量N,将所述第一图像划分为所述至少两个子图像。
20.根据权利要求19所述的装置,其中,所述确定子单元,具体用于:
在所述长宽比大于或等于所述第一阈值时,所述分割方向为纵向分割;
在所述长宽比小于或等于所述第二阈值时,所述分割方向为横向分割。
21.根据权利要求19或20所述的装置,其中,所述确定子单元,具体用于:
根据所述第一图像的长度和宽度,确定短边长度X和长边长度Y,所述短边长度为所述长度和所述宽度中的最小值,所述长边长度为所述长度和所述宽度中的最大值;
确定所述数量N为
Figure FDA0002854369950000041
[]为取整符号。
22.根据权利要求19-21任一项所述的装置,其中,所述划分子单元,具体用于:
根据所述数量N和所述短边长度,确定重合长度;
根据所述短边长度、所述分割方向和所述重合长度,确定每个子图像对应的切分起始位置和切分终止位置;
根据每个子图像对应的切分起始位置和切分终止位置,将所述第一图像划分为所述至少两个子图像,每个子图像的长度和宽度相同。
23.根据权利要求22所述的装置,其中,每两个相邻的子图像中具有重合部分,所述重合部分的长度为所述重合长度。
24.根据权利要求14-23任一项所述的装置,其中,所述确定模块,包括:
第二确定单元,用于根据每个子图像的图像特征,确定所述第一图像的图像特征;
所述第二确定单元,还用于根据所述第一图像的图像特征,确定所述第一对象的标识。
25.根据权利要求24所述的装置,其中,所述第二确定单元,具体用于:
将每个子图像的图像特征进行相加处理、以及取平均值处理,得到所述第一图像的图像特征。
26.根据权利要求24或25所述的装置,其中,所述第二确定单元,具体用于:
获取所述第一图像的图像特征与预设图像特征库中各图像特征之间的相似度;
根据所述第一图像的图像特征与预设图像特征库中各图像特征之间的相似度,在所述预设图像特征库中确定目标图像特征;
将所述目标图像特征对应的标识确定为所述第一对象的标识。
27.一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-13中任一项所述的方法。
28.一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行权利要求1-13中任一项所述的方法。
29.一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现根据权利要求1-13中任一项所述的方法。
CN202011540268.6A 2020-12-23 2020-12-23 图像处理方法及装置 Pending CN112541911A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011540268.6A CN112541911A (zh) 2020-12-23 2020-12-23 图像处理方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011540268.6A CN112541911A (zh) 2020-12-23 2020-12-23 图像处理方法及装置

Publications (1)

Publication Number Publication Date
CN112541911A true CN112541911A (zh) 2021-03-23

Family

ID=75017727

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011540268.6A Pending CN112541911A (zh) 2020-12-23 2020-12-23 图像处理方法及装置

Country Status (1)

Country Link
CN (1) CN112541911A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114581672A (zh) * 2022-03-10 2022-06-03 北京百度网讯科技有限公司 一种图像识别方法、装置及电子设备
CN114663418A (zh) * 2022-04-06 2022-06-24 京东安联财产保险有限公司 图像处理的方法及装置、存储介质及电子设备

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102542303A (zh) * 2010-12-24 2012-07-04 富士通株式会社 生成用于检测图像中的特定对象的分类器的装置和方法
US20170131718A1 (en) * 2014-07-16 2017-05-11 Ricoh Company, Ltd. System, machine, and control method
CN106803090A (zh) * 2016-12-05 2017-06-06 中国银联股份有限公司 一种图像识别方法和装置
CN108009563A (zh) * 2017-10-25 2018-05-08 北京达佳互联信息技术有限公司 图像处理方法、装置及终端
CN111598779A (zh) * 2020-05-14 2020-08-28 Oppo广东移动通信有限公司 图像超分辨率处理方法和装置、电子设备及存储介质
CN112102164A (zh) * 2020-08-11 2020-12-18 深圳云天励飞技术股份有限公司 一种图像处理方法、装置、终端及存储介质

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102542303A (zh) * 2010-12-24 2012-07-04 富士通株式会社 生成用于检测图像中的特定对象的分类器的装置和方法
US20170131718A1 (en) * 2014-07-16 2017-05-11 Ricoh Company, Ltd. System, machine, and control method
CN106803090A (zh) * 2016-12-05 2017-06-06 中国银联股份有限公司 一种图像识别方法和装置
CN108009563A (zh) * 2017-10-25 2018-05-08 北京达佳互联信息技术有限公司 图像处理方法、装置及终端
CN111598779A (zh) * 2020-05-14 2020-08-28 Oppo广东移动通信有限公司 图像超分辨率处理方法和装置、电子设备及存储介质
CN112102164A (zh) * 2020-08-11 2020-12-18 深圳云天励飞技术股份有限公司 一种图像处理方法、装置、终端及存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
武尧;刘振宇;谷亚宁;: "基于机器视觉的多目标sar图像阈值分割仿真", 计算机仿真, no. 10, 15 October 2020 (2020-10-15) *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114581672A (zh) * 2022-03-10 2022-06-03 北京百度网讯科技有限公司 一种图像识别方法、装置及电子设备
CN114663418A (zh) * 2022-04-06 2022-06-24 京东安联财产保险有限公司 图像处理的方法及装置、存储介质及电子设备

Similar Documents

Publication Publication Date Title
US11810319B2 (en) Image detection method, device, storage medium and computer program product
CN112560862B (zh) 文本识别方法、装置及电子设备
CN113971751A (zh) 训练特征提取模型、检测相似图像的方法和装置
CN113205041B (zh) 结构化信息提取方法、装置、设备和存储介质
CN112528858A (zh) 人体姿态估计模型的训练方法、装置、设备、介质及产品
CN112802037A (zh) 人像提取方法、装置、电子设备及存储介质
CN112989995B (zh) 文本检测方法、装置及电子设备
CN112541911A (zh) 图像处理方法及装置
CN113642584A (zh) 文字识别方法、装置、设备、存储介质和智能词典笔
CN113378958A (zh) 自动标注方法、装置、设备、存储介质及计算机程序产品
CN114429637A (zh) 一种文档分类方法、装置、设备及存储介质
CN114782956A (zh) 文本识别方法、装置、电子设备及存储介质
CN113326766B (zh) 文本检测模型的训练方法及装置、文本检测方法及装置
CN113780297A (zh) 图像处理方法、装置、设备以及存储介质
CN114549904A (zh) 视觉处理及模型训练方法、设备、存储介质及程序产品
CN113989300A (zh) 车道线分割的方法、装置、电子设备和存储介质
CN117911891A (zh) 一种设备识别方法、装置、电子设备及存储介质
CN113379592A (zh) 图片中敏感区域的处理方法、装置和电子设备
CN113254712A (zh) 视频匹配方法、视频处理方法、装置、电子设备及介质
CN110503627B (zh) 建筑物裂缝检测方法、装置、存储介质及计算机设备
CN113011345A (zh) 图像质量检测方法、装置、电子设备、可读存储介质
CN114677566B (zh) 深度学习模型的训练方法、对象识别方法和装置
CN114166238B (zh) 车道线的识别方法、装置及电子设备
CN114511862B (zh) 表格识别方法、装置及电子设备
CN115564976A (zh) 图像处理方法、装置、介质及设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination