CN112861979B - 商标识别方法、装置、计算设备及计算机存储介质 - Google Patents

商标识别方法、装置、计算设备及计算机存储介质 Download PDF

Info

Publication number
CN112861979B
CN112861979B CN202110193159.XA CN202110193159A CN112861979B CN 112861979 B CN112861979 B CN 112861979B CN 202110193159 A CN202110193159 A CN 202110193159A CN 112861979 B CN112861979 B CN 112861979B
Authority
CN
China
Prior art keywords
trademark
sub
unit
network
recognition model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110193159.XA
Other languages
English (en)
Other versions
CN112861979A (zh
Inventor
马景祥
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shumao Technology Beijing Co ltd
Original Assignee
Shumao Technology Beijing Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shumao Technology Beijing Co ltd filed Critical Shumao Technology Beijing Co ltd
Priority to CN202110193159.XA priority Critical patent/CN112861979B/zh
Publication of CN112861979A publication Critical patent/CN112861979A/zh
Application granted granted Critical
Publication of CN112861979B publication Critical patent/CN112861979B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/09Recognition of logos

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种商标识别方法、装置、计算设备及计算机存储介质。其中,方法包括:获取商标图像;将商标图像输入至预先训练好的商标识别模型中的第一子识别模型,并获取第一子识别模型输出的第一商标分类结果;将第一子识别模型中的中间处理数据输入至商标识别模型中的第二子识别模型中,并获取第二子识别模型输出的第二商标分类结果;根据第一商标分类结果及第二商标分类结果生成商标图像对应的商标分类结果。采用本方案能够识别出商标图像中商标的分类,并且识别精度及识别效率高,并能够适用于商标图像的批量识别。

Description

商标识别方法、装置、计算设备及计算机存储介质
技术领域
本发明涉及信息识别技术领域,具体涉及一种商标识别方法、装置、计算设备及计算机存储介质。
背景技术
商标(又称品牌或服务logo)是用来区别一个经营者的品牌或服务和其他经营者的商品或服务的标记。准确地识别商标对商标侵权鉴定及商标检索等具有重要意义。
目前的商标识别方式通常为基于相似度距离的识别方式,如申请公布号为CN103258037A的中国发明专利申请,其提供了一种通过计算商标图片间相似度距离的方式来识别商标,然而采用该种方式需将待识别商标图片与大量已知商标图片进行比对,比对过程较为繁琐,商标识别效率低下,并且商标的识别精度差。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的商标识别方法、装置、计算设备及计算机存储介质。
根据本发明的一个方面,提供了一种商标识别方法,包括:
获取商标图像;
将所述商标图像输入至预先训练好的商标识别模型中的第一子识别模型,并获取所述第一子识别模型输出的第一商标分类结果;
将所述第一子识别模型中的中间处理数据输入至所述商标识别模型中的第二子识别模型中,并获取所述第二子识别模型输出的第二商标分类结果;
根据所述第一商标分类结果及所述第二商标分类结果生成所述商标图像对应的商标分类结果。
一种可选的实施方式中,所述根据所述第一商标分类结果及所述第二商标分类结果生成所述商标图像对应的商标分类进一步包括:根据所述第一商标分类结果、所述第二商标分类结果、所述第一子识别模型对应的第一权重、以及所述第二子识别模型对应的第二权重,生成所述商标图像对应的商标分类;其中,所述第一权重小于所述第二权重。
一种可选的实施方式中,所述方法还包括:获取所述第一子识别模型输出的商标位置预测信息,并根据所述商标位置预测信息生成商标位置识别结果;其中,所述商标位置预测信息包括:商标坐标信息和/或坐标预测概率信息。
一种可选的实施方式中,所述第一子识别模型包括:基础子网络、分类子网络、坐标预测子网络、和/或坐标概率预测子网络;
其中,所述基础子网络的输入数据为所述商标图像,所述分类子网络的输出结果为第一商标分类结果,所述坐标预测子网络的输出结果为商标坐标信息,和/或所述坐标概率预测子网络的输出结果为坐标预测概率信息。
一种可选的实施方式中,所述基础子网络的输出结果分别输入至所述分类子网络、所述坐标预测子网络、所述坐标概率预测子网络、和/或所述第二子识别模型;
和/或,所述基础子网络的中间处理结果输入至所述分类子网络;
和/或,所述分类子网络的中间处理结果分别输入至所述坐标预测子网络和/或所述坐标概率预测子网络;
和/或,所述坐标概率预测子网络的中间处理结果输入至所述第二子识别模型。
一种可选的实施方式中,所述商标识别模型包括:CBL单元、Focus单元、SPP单元、CSP1_X、和/或CSP2_X单元。
一种可选的实施方式中,所述商标分类结果包括商标的真伪分类结果,和/或商标名称识别结果。
根据本发明的另一方面,提供了一种商标识别装置,包括:
获取模块,用于获取商标图像;
输入模块,用于将所述商标图像输入至预先训练好的商标识别模型;
模型预测模块,用于将所述商标图像输入至预先训练好的商标识别模型中的第一子识别模型,并获取所述第一子识别模型输出的第一商标分类结果;将所述第一子识别模型中的中间处理数据输入至所述商标识别模型中的第二子识别模型中,并获取所述第二子识别模型输出的第二商标分类结果;根据所述第一商标分类结果及所述第二商标分类结果生成所述商标图像对应的商标分类结果。
可选的,所述模型预测模块进一步用于:根据所述第一商标分类结果、所述第二商标分类结果、所述第一子识别模型对应的第一权重、以及所述第二子识别模型对应的第二权重,生成所述商标图像对应的商标分类;其中,所述第一权重小于所述第二权重。
可选的,所述模型预测模块进一步用于:获取所述第一子识别模型输出的商标位置预测信息,并根据所述商标位置预测信息生成商标位置识别结果;其中,所述商标位置预测信息包括:商标坐标信息和/或坐标预测概率信息。
可选的,所述第一子识别模型包括:基础子网络、分类子网络、坐标预测子网络、和/或坐标概率预测子网络;
其中,所述基础子网络的输入数据为所述商标图像,所述分类子网络的输出结果为第一商标分类结果,所述坐标预测子网络的输出结果为商标坐标信息,和/或所述坐标概率预测子网络的输出结果为坐标预测概率信息。
可选的,所述基础子网络的输出结果分别输入至所述分类子网络、所述坐标预测子网络、所述坐标概率预测子网络、和/或所述第二子识别模型;
和/或,所述基础子网络的中间处理结果输入至所述分类子网络;
和/或,所述分类子网络的中间处理结果分别输入至所述坐标预测子网络和/或所述坐标概率预测子网络;
和/或,所述坐标概率预测子网络的中间处理结果输入至所述第二子识别模型。
可选的,所述商标识别模型包括:CBL单元、Focus单元、SPP单元、CSP1_X、和/或CSP2_X单元。
可选的,所述商标分类结果包括商标的真伪分类结果,和/或商标名称识别结果。
根据本发明的又一方面,提供了一种计算设备,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;
所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行上述商标识别方法对应的操作。
根据本发明的再一方面,提供了一种计算机存储介质,所述存储介质中存储有至少一可执行指令,所述可执行指令使处理器执行如上述商标识别方法对应的操作。
本发明公开了一种商标识别方法、装置、计算设备及计算机存储介质。其中,方法包括:获取商标图像;将商标图像输入至预先训练好的商标识别模型中的第一子识别模型,并获取第一子识别模型输出的第一商标分类结果;将第一子识别模型中的中间处理数据输入至商标识别模型中的第二子识别模型中,并获取第二子识别模型输出的第二商标分类结果;根据第一商标分类结果及第二商标分类结果生成商标图像对应的商标分类结果。采用本方案能够识别出商标图像中商标的分类,并且识别精度及识别效率高,并能够适用于商标图像的批量识别。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1示出了根据本发明实施例一提供的一种商标识别方法的流程示意图;
图2示出了应用于本发明实施例一中的一种商标识别模型的结构示意图;
图3示出了根据本发明实施例二提供的一种商标识别方法的流程示意图;
图4示出了应用于本发明实施例二中的一种商标识别模型的结构示意图;
图5a示出了应用于本发明实施例二中的一种CBL单元的结构示意图;
图5b示出了应用于本发明实施例二中的一种Focus单元的结构示意图;
图5c示出了应用于本发明实施例二中的一种SPP单元的结构示意图;
图5d示出了应用于本发明实施例二中的一种CSP1_X单元的结构示意图;
图5e示出了应用于本发明实施例二中的一种Resunit组件的结构示意图;
图5f示出了应用于本发明实施例二中的一种CSP2_X单元的结构示意图;
图6示出了应用于本发明实施例二中的又一种商标识别模型的结构示意图;
图7示出了根据本发明实施例三提供的一种商标识别模型训练方法的流程示意图;
图8示出了根据本发明实施例四提供的一种商标识别装置的功能结构示意图;
图9示出了根据本发明实施例六提供的一种计算装置的结构示意图。
具体实施方式
下面将参照附图更详细地描述本发明的示例性实施例。虽然附图中显示了本发明的示例性实施例,然而应当理解,可以以各种形式实现本发明而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本发明,并且能够将本发明的范围完整的传达给本领域的技术人员。
实施例一
图1示出了根据本发明实施例一提供的一种商标识别方法的流程示意图。其中,本实施例所提供的商标识别方法能够应用于商标检索和/或商标侵权鉴定等包含商标识别的场景中。
如图1所示,该方法包括:
步骤S110:获取商标图像。
其中,该商标图像具体为后续进行识别的图像,该图像中包含有品牌或服务的商标信息。本实施例对该商标图像的具体来源不作限定,例如该商标图像可以为图像采集设备采集到的图像,也可以为通过截图软件等方式获得的商标图像;此外,本实施例对获取的商标图像的类别、格式、及尺寸等也不作限定。
步骤S120:将商标图像输入至预先训练好的商标识别模型中的第一子识别模型,并获取第一子识别模型输出的第一商标分类结果。
本实施例中预先基于机器学习算法构建商标识别模型,并通过对构建的商标识别模型的模型训练获得训练好的商标识别模型。利用该训练好的商标识别模型能够实时地对线上获取的商标图像进行识别。
具体地,如图2所示,该商标识别模型200包括第一子识别模型210及第二子识别模型220。第一子识别模型210与第二子识别模型220的结构不同。第一子识别模型210接收输入的商标图像,并对该商标图像进行学习处理后输出第一商标分类结果。
步骤S130:将第一子识别模型中的中间处理数据输入至商标识别模型中的第二子识别模型中,并获取第二子识别模型输出的第二商标分类结果。
第二子识别模型与第一子识别模型并非是完全独立的模型,第二子识别模型与第一子识别模型之间存在数据交互。具体地,第一子识别模型中的部分中间处理数据可传输至第二子识别模型,第二子识别模型利用该中间处理数据继续分析,并输出第二商标分类结果。
步骤S140:根据第一商标分类结果及第二商标分类结果生成商标图像对应的商标分类结果。
本实施例由两个结构不同的子识别模型输出的分类结果综合地确定商标图像最终的商标分类结果,从而提升了商标分类结果的准确度;再者本实施例中第二子识别模型是以第一子识别模型的部分中间处理数据为基础进行进一步地预测,在提升预测效率的基础上,能够进一步地推理及分析商标图像的特征,从而提升商标分类结果的准确度。
一种可选的实施方式中,第一子识别模型及第二子识别模型具有相应的权重,从而可根据第一商标分类结果、第二商标分类结果、第一子识别模型对应的第一权重、以及第二子识别模型对应的第二权重,生成商标图像对应的商标分类。进一步可选的,第一子识别模型的商标识别精度低于第二子识别模型的商标识别精度,从而第一权重小于第二权重,第一权重与第二权重的和等于1。
又一种可选的实施方式中,本实施例中获得的商标分类结果包括商标的真伪分类结果,即确定出商标图像中包含的商标的真伪。进一步可选的,若确定出商标图像中包含的商标为真,则商标分类结果中还包含有商标图像中包含的商标的名称。
由此可见,本实施例利用预先训练好的商标识别模型对商标图像进行识别,从而能够提升商标图像的识别精度及识别效率;并且本实施例将获取的商标图像输入至商标识别模型中的第一子识别模型,并获取第一子识别模型输出的第一商标分类结果,以及将第一子识别模型中的中间处理数据输入至商标识别模型中的第二子识别模型并获取第二子识别模型输出的第二商标分类结果,最终根据第一商标分类结果及第二商标分类结果生成商标图像对应的商标分类结果,采用该种方式能够进一步地提升商标识别精度,并能够适用于商标图像的批量识别。
实施例二
图3示出了根据本发明实施例二提供的一种商标识别方法的流程示意图。其中,本实施例提供的商标识别方法是对实施例一中商标识别方法的进一步优化。
如图3所示,该方法包括:
步骤S310:获取商标图像。
步骤S320:将商标图像输入至预先训练好的商标识别模型中的第一子识别模型,并获取第一子识别模型输出的第一商标分类结果及商标位置预测信息。
为便于确定商标图像中商标的位置,本实施例中的第一子识别模型除了可以输出第一商标分类结果之外,还进一步输出有商标位置预测信息。其中,商标位置预测信息可以包括商标坐标信息,该商标坐标信息具体为商标在商标图像中的坐标;此外,为提升商标图像中商标位置的确定精度,商标位置预测信息还可以包括坐标预测概率信息,具体地,输出的每个商标坐标对应于一个坐标预测概率,该坐标预测概率标识了商标坐标对应的预测精度。
步骤S330:根据商标位置预测信息生成商标位置识别结果。
具体地,可以仅根据商标坐标信息生成商标位置识别结果,从而简化商标位置识别结果的生成逻辑,提升商标位置识别结果的生成效率;或者,根据商标坐标信息以及坐标预测概率信息来生成商标位置识别结果,从而提升商标位置识别结果的生成精度。
可选的,为进一步提升商标位置识别结果的精度,本实施例可基于商标位置预测信息,采用NMS算法(Non-Maximum Suppression,非极大值抑制)来生成商标位置识别结果。其中,本实施例对NMS算法的具体类型不作限定,本领域技术人员可根据实际情况采用标准NMS算法、Soft-NMS算法、Adaptive-NMS算法等等。
步骤S340:将第一子识别模型中的中间处理数据输入至商标识别模型中的第二子识别模型中,并获取第二子识别模型输出的第二商标分类结果。
步骤S350:根据第一商标分类结果及第二商标分类结果生成商标图像对应的商标分类结果。
以下结合商标识别模型的具体结构来详细阐明本实施例的具体实施过程:
如图4所示,商标识别模型200的第一子识别模型210进一步包括基础子网络211、分类子网络212、坐标预测子网络213、以及坐标概率预测子网络214。
其中,基础子网络211的输入数据为步骤S310获得的商标图像,基础子网络211对商标图像进行初步的处理,并输出相应的处理结果。基础子网络211的输出结果分别输入至分类子网络212、坐标预测子网络213、坐标概率预测子网络214、以及第二子识别模型220中,从而由分类子网络212、坐标预测子网络213、坐标概率预测子网络214、以及第二子识别模型220复用基础子网络211的输出数据,一方面精简模型结构,另一方面由后续其他子网络进行各自的分析处理,有利于提升商标分类及商标位置的识别精度。
基础子网络211的部分中间处理结果还可以输入至分类子网络212中,分类子网络212利用基础子网络211的输出结果及中间处理结果进行进一步地处理,以对商标分类进行粗略地预测,从而输出第一商标分类结果。
分类子网络212的中间处理结果可以分别输入至坐标预测子网络213和/或坐标概率预测子网络214中,由坐标预测子网络213利用分类子网络212的中间处理结果及基础子网络211的输出结果进行坐标分析,从而输出商标坐标信息;和/或由坐标概率预测子网络214利用分类子网络212的中间处理结果及基础子网络211的输出结果进行坐标概率分析,并输出坐标预测概率信息。
而坐标概率预测子网络214的中间处理结果可进一步输入至第二子识别模型220。具体地,可将坐标概率预测子网络214中输出层上一层的输出结果输入至第二子识别模型220。第二子识别模型220利用坐标概率预测子网络214的中间处理结果以及基础子网络211的输出结果进行商标分类的细粒度分析,从而输出第二商标分类结果。
在一种可选的实施方式中,为了进一步提升模型的预测精度,商标识别模型包括:CBL单元、Focus单元、SPP单元、CSP1_X单元、和/或CSP2_X单元。
如图5a所示,CBL单元为Conv+BN+Leaky_relu结构,其中Conv为卷积层,BN为归一化层,Leaky_relu为Leaky_relu激活函数。采用该种结构能够增强模型的特征提取效果,从而有利于提升模型的预测精度。
图5b示出了Focus单元的结构示意图,从图中可看出,Focus单元可以将输入进行切片(Slice)操作,从而实现通道分离。例如将原始n*n*3的输入图像进行切片处理后,生成n/2*n/2*12的特征图,从而增大特征提取,进一步提升模型的预测精度。Focus单元在将输入图像进行切片处理之后,进一步通过concat进行张量拼接,从而扩充张量维度,并最终经由Focus单元中的CBL输出数据。
图5c示出了SPP单元的结构示意图,SPP单元中包含多个Maxpool(最大池化层),例如SPP单元可采用1*1,3*3,5*5,7*7,9*9,11*11,13*13的最大池化方式,在特征提取后进行多尺度的融合,从而增强网络的鲁棒性和准确性,降低模型中的参数量,提升模型的预测速度。
图5d示出了CSP1_X单元的结构示意图,CSP1_X单元能够对特征图进行下采样,从而增大感受野并增强对小目标样本的特征提取。在CSP1_X单元中包含X个Resunit组件,Resunit组件具体结构图如图5e所示,其中,ADD为张量加运算。Resunit组件借鉴残差结构,使模型网络层次加深,增强特征提取效果,并在模型训练过程中可以抑制过拟合。进一步地,通过CSP1_X单元中的Concat进行多尺度多维度地特征融合,从而丰富特征的多样性,进一步提升模型的预测精度。
图5f示出了CSP2_X单元的结构示意图,CSP2_X单元能够对特征图进行下采样,从而增大感受野。并且,CSP2_X单元与CSP1_X单元不同的是,CSP2_X单元将CSP1_X单元的X个Resunit组件替换为2X个CBL单元,通过CBL单元来增强特征提取效果,并通过Concat进行多尺度多维度地特征融合,从而丰富特征的多样性,进一步提升模型的预测精度。
进一步可选的,包含CBL单元、Focus单元、SPP单元、CSP1_X单元、以及CSP2_X单元的商标识别模型200的具体结构可以如图6所示。从图中可看出,基础子网络211通过Input(输入层)接收商标图像,并依次通过Focus单元、CBL单元、Focus单元、CSP1_1单元(即CSP1_X单元中X=1)、CBL单元、CSP1_3单元(即CSP1_X单元中X=3)、CBL单元、SPP单元、CSP2_1单元(即CSP2_X单元中X=1)、以及CBL单元,并将该CBL单元输出结果分别输入至分类子网络212、坐标预测子网络213、坐标概率预测子网络214及第二子识别模型220中;并且基础子网络211的部分中间处理结果(如两个CSP1_3单元的处理结果)输入至分类子网络212中。
基础子网络211的输出结果经Upsample(上采样)进行分类子网络212中进行处理,并且基础子网络211中第二个CSP1_3单元的输出结果与基础子网络211的输出结果经上采样后的数据通过Concat融合后依次通过CSP2_1单元、CBL单元、以及CSP2_1单元,并进一步通过Upsample(上采样)后与基础子网络211中第一个CSP1_3单元的输出结果通过Concat融合,融合后的数据依次通过CSP2_1单元、Conv(卷积层)、以及Output1(第一输出层)后输出第一商标分类结果。
分类子网络212中第三个CSP2_1单元的输出结果(即分类子网络212的中间处理结果)通过坐标预测子网络213中的CBL单元进行处理,处理结果与基础子网络211的输出结果通过Concat融合,融合后的数据依次经过CSP2_1单元、CBL单元、Conv、以及Output2(第二输出层)后输出商标坐标信息。
分类子网络212中第三个CSP2_1单元的输出结果(即分类子网络212的中间处理结果)通过坐标概率预测子网络214中的CBL单元进行处理,处理结果与基础子网络211的输出结果通过Concat融合,融合后的数据依次经过CSP2_1单元、CBL单元、Conv、以及Output3(第三输出层)后输出坐标预测概率信息。
坐标概率预测子网络214中Conv层的输出结果(即坐标概率预测子网络214的中间处理结果)与基础子网络211的输出结果通过Concat融合后进入第二子识别模型220,并通过CBL单元及CSP2_1单元等单元的处理后最终通过Output4(第四输出层)输出第二商标分类结果。
此外,本实施例所提供的方法可通过封装API或SDK的方式部署于云端服务器,并向外提供接口调用服务,从而外部客户端或服务器可通过调用实现对商标图像的识别。
由此可见,本实施例能够根据第一商标分类结果及第二商标分类结果综合准确地识别商标图像中的商标类别,并且可进一步根据商标位置预测信息生成商标位置识别结果;并且,本实施例中的商标识别模型模型不仅能够输出第一商标分类结果、第二商标分类结果、商标坐标信息及坐标预测概率信息等多种不同信息,而且商标识别模型中各子网络数据相互复用,精简模型结构,提升预测效率。并且有利于对商标图像特征的深度学习,从而提升模型的预测精度。
实施例三
图7示出了应用于本发明实施例三提供的一种商标识别模型的训练方法的流程示意图。其中,本实施例所提供的商标识别模型的训练方法能够应用于上述实施例一和/或实施例二所述的商标识别方法中。
如图7所示,该方法包括:
步骤S710:获取样本数据。
本实施例获取大量业务数据(如获取十万量级数据),并依据该业务数据生成样本数据。其中,样本数据中包含不同背景的商标图像,该背景可以为生活场景背景、样例背景、以及纯色背景(如纯白背景)等等。在一种可选的实施方式中,可直接获取不同背景的商标图像并生成样本数据,在又一种可选的实施方式中,当直接获取的商标图像背景较为单一时,可基于获取的商标图像生成与该商标图像对应的其他背景的图像。
此外,为提升模型的泛化能力,可对商标图像进行旋转、翻转、亮度调整、饱和度调整等图像处理操作,并将图像处理后的商标图像与原商标图像共同作为样本数据。
步骤S720:构建商标识别模型;该商标识别模型包括第一子识别模型及第二子识别模型。
其中,本步骤的具体实施过程可参照实施例一和/或实施例二中相应部分的描述,本实施例在此不做赘述。并且,本实施例对步骤S710及步骤S720的执行顺序不作限定。
步骤S730:冻结第二子识别模型的模型参数,利用样本数据训练第一子识别模型,并获得训练好的第一子识别模型。
在模型训练过程中,采用分阶段训练的方式,即先冻结第二子识别模型的模型参数,对第一子识别模型进行训练。具体地,使用Adam激活函数,初始learning rate 0.0001训练第一子识别模型中的参数。当第一子识别模型的损失函数处于拟合状态时,终止对第一子识别模型的训练。
步骤S740:冻结第一子识别模型的模型参数,利用样本数据训练第二子识别模型,并获得训练好的第二子识别模型。
在第一子识别模型终止训练后,冻结第一子识别模型的模型参数并对第二子识别模型进行训练。具体地,初始learning rate 0.0001,对第二子识别模型进行训练,当第二子识别模型的损失函数处于拟合状态时,终止第二子识别模型的训练。最终根据训练好的第一子识别模型及第二子识别模型输出商标识别模型的模型参数。
此外,进一步对训练好的商标识别模型进行精度验证,从而获得商标识别模型的精准率、召回率、准确率、和/或F1参数等等。通过对商标识别模型的精度验证,本实施例训练好的商标识别模型精准率及准确率较高,满足业务需求。
由此可见,本实施例利用大量样本数据对商标识别模型进行训练,从而有利于提升商标识别模型的预测精度;并且本实施例在训练过程中采用分阶段的训练方式,先训练第一子识别模型,待第一子识别模型终止训练后再训练第二子识别模型,从而有利于提升商标识别模型的训练效率。
实施例四
图8示出了根据本发明实施例四提供的一种商标识别装置的功能结构示意图。如图8所示,该装置800包括:获取模块810、输入模块820、以及模型预测模块830。
获取模块810,用于获取商标图像;
输入模块820,用于将所述商标图像输入至预先训练好的商标识别模型;
模型预测模块830,用于将所述商标图像输入至预先训练好的商标识别模型中的第一子识别模型,并获取所述第一子识别模型输出的第一商标分类结果;将所述第一子识别模型中的中间处理数据输入至所述商标识别模型中的第二子识别模型中,并获取所述第二子识别模型输出的第二商标分类结果;根据所述第一商标分类结果及所述第二商标分类结果生成所述商标图像对应的商标分类结果。
可选的,所述模型预测模块进一步用于:
根据所述第一商标分类结果、所述第二商标分类结果、所述第一子识别模型对应的第一权重、以及所述第二子识别模型对应的第二权重,生成所述商标图像对应的商标分类;
其中,所述第一权重小于所述第二权重。
可选的,所述模型预测模块进一步用于:
获取所述第一子识别模型输出的商标位置预测信息,并根据所述商标位置预测信息生成商标位置识别结果;
其中,所述商标位置预测信息包括:商标坐标信息和/或坐标预测概率信息。
可选的,所述第一子识别模型包括:基础子网络、分类子网络、坐标预测子网络、和/或坐标概率预测子网络;
其中,所述基础子网络的输入数据为所述商标图像,所述分类子网络的输出结果为第一商标分类结果,所述坐标预测子网络的输出结果为商标坐标信息,和/或所述坐标概率预测子网络的输出结果为坐标预测概率信息。
可选的,所述基础子网络的输出结果分别输入至所述分类子网络、所述坐标预测子网络、所述坐标概率预测子网络、和/或所述第二子识别模型;
和/或,所述基础子网络的中间处理结果输入至所述分类子网络;
和/或,所述分类子网络的中间处理结果分别输入至所述坐标预测子网络和/或所述坐标概率预测子网络;
和/或,所述坐标概率预测子网络的中间处理结果输入至所述第二子识别模型。
可选的,所述商标识别模型包括:CBL单元、Focus单元、SPP单元、CSP1_X、和/或CSP2_X单元。
可选的,所述商标分类结果包括商标的真伪分类结果,和/或商标名称识别结果。
其中,本装置中各模型的具体实施过程可参照实施例一和/或实施例二中相应部分的描述,本实施例在此不做赘述。
由此可见,本实施例利用预先训练好的商标识别模型对商标图像进行识别,从而能够提升商标图像的识别精度及识别效率;并且本实施例将获取的商标图像输入至商标识别模型中的第一子识别模型,并获取第一子识别模型输出的第一商标分类结果,以及将第一子识别模型中的中间处理数据输入至商标识别模型中的第二子识别模型并获取第二子识别模型输出的第二商标分类结果,最终根据第一商标分类结果及第二商标分类结果生成商标图像对应的商标分类结果,采用该种方式能够进一步地提升商标识别精度。
实施例五
根据本发明实施例五提供了一种非易失性计算机存储介质,所述计算机存储介质存储有至少一可执行指令,该计算机可执行指令可执行上述任意方法实施例中的方法。
可执行指令具体可以用于使得处理器执行以下操作:
获取商标图像;
将所述商标图像输入至预先训练好的商标识别模型中的第一子识别模型,并获取所述第一子识别模型输出的第一商标分类结果;
将所述第一子识别模型中的中间处理数据输入至所述商标识别模型中的第二子识别模型中,并获取所述第二子识别模型输出的第二商标分类结果;
根据所述第一商标分类结果及所述第二商标分类结果生成所述商标图像对应的商标分类结果。
在一种可选的实施方式中,执行指令具体可以用于使得处理器执行以下操作:
根据所述第一商标分类结果、所述第二商标分类结果、所述第一子识别模型对应的第一权重、以及所述第二子识别模型对应的第二权重,生成所述商标图像对应的商标分类;
其中,所述第一权重小于所述第二权重。
在一种可选的实施方式中,执行指令具体可以用于使得处理器执行以下操作:
获取所述第一子识别模型输出的商标位置预测信息,并根据所述商标位置预测信息生成商标位置识别结果;
其中,所述商标位置预测信息包括:商标坐标信息和/或坐标预测概率信息。
在一种可选的实施方式中,所述第一子识别模型包括:基础子网络、分类子网络、坐标预测子网络、和/或坐标概率预测子网络;
其中,所述基础子网络的输入数据为所述商标图像,所述分类子网络的输出结果为第一商标分类结果,所述坐标预测子网络的输出结果为商标坐标信息,和/或所述坐标概率预测子网络的输出结果为坐标预测概率信息。
在一种可选的实施方式中,所述基础子网络的输出结果分别输入至所述分类子网络、所述坐标预测子网络、所述坐标概率预测子网络、和/或所述第二子识别模型;
和/或,所述基础子网络的中间处理结果输入至所述分类子网络;
和/或,所述分类子网络的中间处理结果分别输入至所述坐标预测子网络和/或所述坐标概率预测子网络;
和/或,所述坐标概率预测子网络的中间处理结果输入至所述第二子识别模型。
在一种可选的实施方式中,所述商标识别模型包括:CBL单元、Focus单元、SPP单元、CSP1_X、和/或CSP2_X单元。
在一种可选的实施方式中,所述商标分类结果包括商标的真伪分类结果,和/或商标名称识别结果。
由此可见,本实施例利用预先训练好的商标识别模型对商标图像进行识别,从而能够提升商标图像的识别精度及识别效率;并且本实施例将获取的商标图像输入至商标识别模型中的第一子识别模型,并获取第一子识别模型输出的第一商标分类结果,以及将第一子识别模型中的中间处理数据输入至商标识别模型中的第二子识别模型并获取第二子识别模型输出的第二商标分类结果,最终根据第一商标分类结果及第二商标分类结果生成商标图像对应的商标分类结果,采用该种方式能够进一步地提升商标识别精度。
实施例六
图9示出了根据本发明实施例六提供的一种计算设备的结构示意图,本发明具体实施例并不对计算设备的具体实现做限定。
如图9所示,该计算设备可以包括:处理器(processor)902、通信接口(Communications Interface)904、存储器(memory)906、以及通信总线908。
其中:处理器902、通信接口904、以及存储器906通过通信总线908完成相互间的通信。通信接口904,用于与其它设备比如客户端或其它服务器等的网元通信。处理器902,用于执行程序910,具体可以执行上述任一方法实施例中的相关步骤。
具体地,程序910可以包括程序代码,该程序代码包括计算机操作指令。
处理器902可能是中央处理器CPU,或者是特定集成电路ASIC(ApplicationSpecific Integrated Circuit),或者是被配置成实施本发明实施例的一个或多个集成电路。计算设备包括的一个或多个处理器,可以是同一类型的处理器,如一个或多个CPU;也可以是不同类型的处理器,如一个或多个CPU以及一个或多个ASIC。
存储器906,用于存放程序910。存储器906可能包含高速RAM存储器,也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。
程序910具体可以用于使得处理器902执行以下操作:
获取商标图像;
将所述商标图像输入至预先训练好的商标识别模型中的第一子识别模型,并获取所述第一子识别模型输出的第一商标分类结果;
将所述第一子识别模型中的中间处理数据输入至所述商标识别模型中的第二子识别模型中,并获取所述第二子识别模型输出的第二商标分类结果;
根据所述第一商标分类结果及所述第二商标分类结果生成所述商标图像对应的商标分类结果。
在一种可选的实施方式中,执行指令具体可以用于使得处理器执行以下操作:
根据所述第一商标分类结果、所述第二商标分类结果、所述第一子识别模型对应的第一权重、以及所述第二子识别模型对应的第二权重,生成所述商标图像对应的商标分类;
其中,所述第一权重小于所述第二权重。
在一种可选的实施方式中,执行指令具体可以用于使得处理器执行以下操作:
获取所述第一子识别模型输出的商标位置预测信息,并根据所述商标位置预测信息生成商标位置识别结果;
其中,所述商标位置预测信息包括:商标坐标信息和/或坐标预测概率信息。
在一种可选的实施方式中,所述第一子识别模型包括:基础子网络、分类子网络、坐标预测子网络、和/或坐标概率预测子网络;
其中,所述基础子网络的输入数据为所述商标图像,所述分类子网络的输出结果为第一商标分类结果,所述坐标预测子网络的输出结果为商标坐标信息,和/或所述坐标概率预测子网络的输出结果为坐标预测概率信息。
在一种可选的实施方式中,所述基础子网络的输出结果分别输入至所述分类子网络、所述坐标预测子网络、所述坐标概率预测子网络、和/或所述第二子识别模型;
和/或,所述基础子网络的中间处理结果输入至所述分类子网络;
和/或,所述分类子网络的中间处理结果分别输入至所述坐标预测子网络和/或所述坐标概率预测子网络;
和/或,所述坐标概率预测子网络的中间处理结果输入至所述第二子识别模型。
在一种可选的实施方式中,所述商标识别模型包括:CBL单元、Focus单元、SPP单元、CSP1_X、和/或CSP2_X单元。
在一种可选的实施方式中,所述商标分类结果包括商标的真伪分类结果,和/或商标名称识别结果。
由此可见,本实施例利用预先训练好的商标识别模型对商标图像进行识别,从而能够提升商标图像的识别精度及识别效率;并且本实施例将获取的商标图像输入至商标识别模型中的第一子识别模型,并获取第一子识别模型输出的第一商标分类结果,以及将第一子识别模型中的中间处理数据输入至商标识别模型中的第二子识别模型并获取第二子识别模型输出的第二商标分类结果,最终根据第一商标分类结果及第二商标分类结果生成商标图像对应的商标分类结果,采用该种方式能够进一步地提升商标识别精度。
在此提供的算法或显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述,构造这类系统所要求的结构是显而易见的。此外,本发明实施例也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本发明并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明实施例的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。上述实施例中的步骤,除有特殊说明外,不应理解为对执行顺序的限定。

Claims (7)

1.一种商标识别方法,其特征在于,包括:
获取商标图像;
将所述商标图像输入至预先训练好的商标识别模型中的第一子识别模型,并获取所述第一子识别模型输出的第一商标分类结果;所述第一子识别模型包括:基础子网络、分类子网络、坐标预测子网络、坐标概率预测子网络;
将所述第一子识别模型中的中间处理数据输入至所述商标识别模型中的第二子识别模型中,并获取所述第二子识别模型输出的第二商标分类结果;
根据所述第一商标分类结果及所述第二商标分类结果生成所述商标图像对应的商标分类结果;
其中,基础子网络通过输入层接收商标图像,依次通过Focus单元、CBL单元、Focus单元、CSP1_1单元、CBL单元、CSP1_3单元、CBL单元、CSP1_3单元、CBL单元、SPP单元、CSP2_1单元及CBL单元,将第五个CBL单元输出结果分别输入至分类子网络、坐标预测子网络、坐标概率预测子网络及第二子识别模型中;
基础子网络第五个CBL单元的输出结果经上采样进入分类子网络,基础子网络中第二个CSP1_3单元的输出结果与基础子网络的输出结果经上采样后的数据融合后依次通过CSP2_1单元、CBL单元及CSP2_1单元,通过上采样后与基础子网络中第一个CSP1_3单元的输出结果融合,融合后的数据依次通过CSP2_1单元、Conv、以及第一输出层后输出第一商标分类结果;
分类子网络中第三个CSP2_1单元的输出结果通过坐标预测子网络中的CBL单元进行处理,处理结果与基础子网络第五个CBL单元的输出结果融合,融合后的数据依次经过CSP2_1单元、CBL单元、Conv、以及第二输出层后输出商标坐标信息;
分类子网络中第三个CSP2_1单元的输出结果通过坐标概率预测子网络中的CBL单元进行处理,处理结果与基础子网络第五个CBL单元的输出结果融合,融合后的数据依次经过CSP2_1单元、CBL单元、Conv、以及第三输出层后输出坐标预测概率信息;
坐标概率预测子网络中Conv层的输出结果与基础子网络第五个CBL单元的输出结果通过融合后进入第二子识别模型,并通过CBL单元及CSP2_1单元的处理后通过第四输出层输出第二商标分类结果。
2.根据权利要求1所述的方法,其特征在于,所述根据所述第一商标分类结果及所述第二商标分类结果生成所述商标图像对应的商标分类进一步包括:
根据所述第一商标分类结果、所述第二商标分类结果、所述第一子识别模型对应的第一权重、以及所述第二子识别模型对应的第二权重,生成所述商标图像对应的商标分类;
其中,所述第一权重小于所述第二权重。
3.根据权利要求1或2所述的方法,其特征在于,所述方法还包括:
获取所述第一子识别模型输出的商标位置预测信息,并根据所述商标位置预测信息生成商标位置识别结果;
其中,所述商标位置预测信息包括:商标坐标信息和/或坐标预测概率信息。
4.根据权利要求1或2所述的方法,其特征在于,所述商标分类结果包括商标的真伪分类结果,和/或商标名称识别结果。
5.一种商标识别装置,其特征在于,包括:
获取模块,用于获取商标图像;
输入模块,用于将所述商标图像输入至预先训练好的商标识别模型;
模型预测模块,用于将所述商标图像输入至预先训练好的商标识别模型中的第一子识别模型,并获取所述第一子识别模型输出的第一商标分类结果;将所述第一子识别模型中的中间处理数据输入至所述商标识别模型中的第二子识别模型中,并获取所述第二子识别模型输出的第二商标分类结果;根据所述第一商标分类结果及所述第二商标分类结果生成所述商标图像对应的商标分类结果;所述第一子识别模型包括:基础子网络、分类子网络、坐标预测子网络、坐标概率预测子网络;
其中,基础子网络通过输入层接收商标图像,依次通过Focus单元、CBL单元、Focus单元、CSP1_1单元、CBL单元、CSP1_3单元、CBL单元、CSP1_3单元、CBL单元、SPP单元、CSP2_1单元及CBL单元,将第五个CBL单元输出结果分别输入至分类子网络、坐标预测子网络、坐标概率预测子网络及第二子识别模型中;
基础子网络第五个CBL单元的输出结果经上采样进入分类子网络,基础子网络中第二个CSP1_3单元的输出结果与基础子网络的输出结果经上采样后的数据融合后依次通过CSP2_1单元、CBL单元及CSP2_1单元,通过上采样后与基础子网络中第一个CSP1_3单元的输出结果融合,融合后的数据依次通过CSP2_1单元、Conv、以及第一输出层后输出第一商标分类结果;
分类子网络中第三个CSP2_1单元的输出结果通过坐标预测子网络中的CBL单元进行处理,处理结果与基础子网络第五个CBL单元的输出结果融合,融合后的数据依次经过CSP2_1单元、CBL单元、Conv、以及第二输出层后输出商标坐标信息;
分类子网络中第三个CSP2_1单元的输出结果通过坐标概率预测子网络中的CBL单元进行处理,处理结果与基础子网络第五个CBL单元的输出结果融合,融合后的数据依次经过CSP2_1单元、CBL单元、Conv、以及第三输出层后输出坐标预测概率信息;
坐标概率预测子网络中Conv层的输出结果与基础子网络第五个CBL单元的输出结果通过融合后进入第二子识别模型,并通过CBL单元及CSP2_1单元的处理后通过第四输出层输出第二商标分类结果。
6.一种计算设备,其特征在于,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;
所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行如权利要求1-4中任一项所述的商标识别方法对应的操作。
7.一种计算机存储介质,其特征在于,所述存储介质中存储有至少一可执行指令,所述可执行指令使处理器执行如权利要求1-4中任一项所述的商标识别方法对应的操作。
CN202110193159.XA 2021-02-20 2021-02-20 商标识别方法、装置、计算设备及计算机存储介质 Active CN112861979B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110193159.XA CN112861979B (zh) 2021-02-20 2021-02-20 商标识别方法、装置、计算设备及计算机存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110193159.XA CN112861979B (zh) 2021-02-20 2021-02-20 商标识别方法、装置、计算设备及计算机存储介质

Publications (2)

Publication Number Publication Date
CN112861979A CN112861979A (zh) 2021-05-28
CN112861979B true CN112861979B (zh) 2024-01-30

Family

ID=75988350

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110193159.XA Active CN112861979B (zh) 2021-02-20 2021-02-20 商标识别方法、装置、计算设备及计算机存储介质

Country Status (1)

Country Link
CN (1) CN112861979B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115588115A (zh) * 2022-09-27 2023-01-10 北京羽乐创新科技有限公司 一种识别商标图片的方法及装置

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109086796A (zh) * 2018-06-27 2018-12-25 Oppo(重庆)智能科技有限公司 图像识别方法、装置、移动终端以及存储介质
CN109784194A (zh) * 2018-12-20 2019-05-21 上海图森未来人工智能科技有限公司 目标检测网络构建方法和训练方法、目标检测方法
CN110059554A (zh) * 2019-03-13 2019-07-26 重庆邮电大学 一种基于交通场景的多支路目标检测方法
CN111178158A (zh) * 2019-12-10 2020-05-19 山东大学 一种骑车人检测方法及系统
CN111461155A (zh) * 2019-01-18 2020-07-28 富士通株式会社 训练分类模型的装置和方法
CN111582359A (zh) * 2020-04-28 2020-08-25 新疆维吾尔自治区烟草公司 一种图像识别方法、装置、电子设备及介质
CN111709371A (zh) * 2020-06-17 2020-09-25 腾讯科技(深圳)有限公司 基于人工智能的分类方法、装置、服务器和存储介质
CN111814750A (zh) * 2020-08-14 2020-10-23 深延科技(北京)有限公司 基于深度学习目标检测和图像识别的智能垃圾分类方法及系统

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6804965B2 (ja) * 2016-12-15 2020-12-23 株式会社日立製作所 画像処理装置、画像処理システム、および画像処理方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109086796A (zh) * 2018-06-27 2018-12-25 Oppo(重庆)智能科技有限公司 图像识别方法、装置、移动终端以及存储介质
CN109784194A (zh) * 2018-12-20 2019-05-21 上海图森未来人工智能科技有限公司 目标检测网络构建方法和训练方法、目标检测方法
CN111461155A (zh) * 2019-01-18 2020-07-28 富士通株式会社 训练分类模型的装置和方法
CN110059554A (zh) * 2019-03-13 2019-07-26 重庆邮电大学 一种基于交通场景的多支路目标检测方法
CN111178158A (zh) * 2019-12-10 2020-05-19 山东大学 一种骑车人检测方法及系统
CN111582359A (zh) * 2020-04-28 2020-08-25 新疆维吾尔自治区烟草公司 一种图像识别方法、装置、电子设备及介质
CN111709371A (zh) * 2020-06-17 2020-09-25 腾讯科技(深圳)有限公司 基于人工智能的分类方法、装置、服务器和存储介质
CN111814750A (zh) * 2020-08-14 2020-10-23 深延科技(北京)有限公司 基于深度学习目标检测和图像识别的智能垃圾分类方法及系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
You Only Look Once:Unified, Real-Time Object Detection;Joseph Redmon et al;《arXiv:1506.02640v5》;第1-10页 *

Also Published As

Publication number Publication date
CN112861979A (zh) 2021-05-28

Similar Documents

Publication Publication Date Title
CN110249304B (zh) 电子设备的视觉智能管理
WO2018166438A1 (zh) 图像处理方法、装置及电子设备
CN112329888B (zh) 图像处理方法、装置、电子设备以及存储介质
CN106651877B (zh) 实例分割方法及装置
CN113255685B (zh) 一种图像处理方法、装置、计算机设备以及存储介质
CN113792623B (zh) 安检ct目标物识别方法和装置
CN110414335A (zh) 视频识别方法、装置及计算机可读存储介质
CN113837257A (zh) 一种目标检测方法及装置
US8538171B2 (en) Method and system for object detection in images utilizing adaptive scanning
CN112861979B (zh) 商标识别方法、装置、计算设备及计算机存储介质
CN114972016A (zh) 图像处理方法、装置、计算机设备、存储介质及程序产品
CN110969641A (zh) 图像处理方法和装置
CN117011616A (zh) 一种图像内容审核方法、装置、存储介质和电子设备
CN116266259A (zh) 图像文字结构化输出方法、装置、电子设备和存储介质
WO2021214540A1 (en) Robust camera localization based on a single color component image and multi-modal learning
CN113408528B (zh) 商品图像的质量识别方法、装置、计算设备及存储介质
CN115713621A (zh) 一种利用文本信息的跨模态图像目标检测方法和装置
CN116883770A (zh) 深度估计模型的训练方法、装置、电子设备及存储介质
CN114745516A (zh) 全景视频的生成方法、装置、存储介质及电子设备
CN116883820A (zh) 一种融合模型的训练方法、图像识别方法和系统
CN108875770B (zh) 行人检测误报数据的标注方法、装置、系统和存储介质
CN113840169A (zh) 一种视频处理方法、装置、计算设备和存储介质
CN116993996B (zh) 对图像中的对象进行检测的方法及装置
CN116775938B (zh) 解说视频检索方法、装置、电子设备及存储介质
CN113887638B (zh) 图像数据扩增方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant