CN107609057A

CN107609057A - 一种获取商标图像的文字数据的方法与装置

Info

Publication number: CN107609057A
Application number: CN201710743642.4A
Authority: CN
Inventors: 谢术富; 杜宇宁; 李广; 刘珊珊; 李晨霞
Original assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Current assignee: Baidu Online Network Technology Beijing Co Ltd; Beijing Baidu Netcom Science and Technology Co Ltd
Priority date: 2017-08-25
Filing date: 2017-08-25
Publication date: 2018-01-19
Anticipated expiration: 2037-08-25
Also published as: US20190065841A1; CN107609057B; US10762345B2

Abstract

本发明的目的是提供一种用于获取商标图像的文字数据的方法与装置。本发明通过根据商标数据库中的映射关系，若待处理图像所对应的商标特征信息所对应的商标说明信息包含在所述待处理图像所对应的图像说明信息中，则将所述商标特征信息所对应的商标文字信息作为所述待处理图像所对应的商标图像的文字数据。与现有技术相比，本发明实现了自动获取商标图像的文字数据的方法，能够从商品图片中准确地提取到商标中的文字，能够在短期内为深度学习模型快速获取大量的训练数据，从而有效地提高模型的识别效率以及识别效果。

Description

一种获取商标图像的文字数据的方法与装置

技术领域

本发明涉及图像处理技术领域，尤其涉及一种获取商标图像的文字数据的技术。

背景技术

基于深度学习的方法在很多领域，例如人脸识别、OCR(Optical CharacterRecognition，光学字符识别)、视频分类等，均取得了远超过传统方法的效果，因而在工业界和学术界受到了广泛的关注。对于深度学习方法而言，训练数据起到了非常重要的作用。

在现有技术中，通常采用以下集中方式获取训练数据：

(1)利用人工标注的方法来获取训练数据。即，利用人工方式，在待标注的图片集合上，逐张图片标注目标区域及对应的文本信息。这种方法的耗时长、标准效率低，同时耗费了大量的人力。

(2)借助OCR来获取训练数据的半自动化方案。例如，在待标注图片集上利用OCR获取文字检测识别的结果，然后对识别结果进行人工修订。这种方法的缺点在于，其依赖于OCR的识别效果，如果目标区域并未包含在OCR结果中，还需要对目标区域进行重新标注；另外，其仍然需要在已有的结果上进行人工检查，无法实现训练数据的全自动获取。在极端情形下，其效率甚至要低于第一类方案。

此外，一些大型的互联网公司由于其产品的广泛应用，用户会上传到大量的图片数据到服务器上。以商品的拍照搜索功能为例，根据用户拍摄的图片自动查找到对应的商品并将该商品相关信息推送给用户对用户来讲非常便捷。而在商品的商标上，通常包含了文字及图案设计，如图5和图6所示。为了提高商品拍照搜索的效果，一些文字特征可以用来帮助提高商品检索的精度(如益达口香糖中的“益达”)。然而，商标中文字通常是许多非常规的字体设计，基于传统数据训练的深度学习模型难以在商标文字上取得很好的识别效果。因此，如何有效地利用技术手段来自动获取这些数据的标注信息，是非常有价值的一个课题。

发明内容

本发明的目的是提供一种用于获取商标图像的文字数据的方法与装置。

根据本发明的一个方面，提供了一种获取商标图像的文字数据的方法，其中，该方法包括以下步骤：

x建立商标数据库，其中，所述商标数据库中包括一条或多条商标特征信息以及其所对应的商标说明信息和商标文字信息的映射；

其中，该方法还包括：

a获取一个或多个待处理图像，其中，所述待处理图像包括图像说明信息；

b确定所述待处理图像所对应的商标特征信息；

c根据所述商标数据库中的映射关系，若所述商标特征信息所对应的商标说明信息包含在所述待处理图像所对应的图像说明信息中，则将所述商标特征信息所对应的商标文字信息作为所述待处理图像所对应的商标图像的文字数据。

可选地，所述步骤a包括：

-从一个或多个页面中，获取一个或多个待处理图像；

-根据所述待处理图像所对应的页面信息，确定所述待处理图像的图像说明信息。

可选地，所述步骤a包括：

-获取一个或多个待处理图像；

-根据所述待处理图像，确定与所述待处理图像相对应的一个或多个相似图像；

-根据所述相似图像所对应的图像说明信息，确定所述待处理图像的图像说明信息。

可选地，所述步骤b包括：

-对所述待处理图像进行目标检测，以确定所述待处理图像中的商标位置；

-确定所述商标位置所对应的商标特征信息。

可选地，所述步骤c包括：

-根据所述商标数据库中的映射关系，若所述商标特征信息所对应的商标说明信息包含在所述待处理图像所对应的图像说明信息中，则将所述商标特征信息所对应的商标文字信息作为所述待处理图像中商标位置所对应的商标图像的文字数据。

可选地，该方法还包括：

r将所述待处理图像所对应的商标图像以及该商标图像所对应的文字数据作为训练数据。

可选地，所述步骤r包括：

-仅当所述待处理图像所对应的商标图像的文字数据为非空集时，将所述待处理图像所对应的商标图像以及该商标图像所对应的文字数据作为训练数据。

根据本发明的另一方面，还提供了一种获取商标图像的文字数据的处理装置，其中，所述处理装置包括：

建立装置，用于建立商标数据库，其中，所述商标数据库中包括一条或多条商标特征信息以及其所对应的商标说明信息和商标文字信息的映射；

其中，所述处理装置还包括：

第一装置，用于获取一个或多个待处理图像，其中，所述待处理图像包括图像说明信息；

第二装置，用于确定所述待处理图像所对应的商标特征信息；

第三装置，用于根据所述商标数据库中的映射关系，若所述商标特征信息所对应的商标说明信息包含在所述待处理图像所对应的图像说明信息中，则将所述商标特征信息所对应的商标文字信息作为所述待处理图像所对应的商标图像的文字数据。

可选地，所述第一装置用于：

-从一个或多个页面中，获取一个或多个待处理图像；

可选地，所述第一装置用于：

-获取一个或多个待处理图像；

可选地，所述第二装置用于：

-确定所述商标位置所对应的商标特征信息。

可选地，所述第三装置用于：

可选地，所述处理装置还包括：

第四装置，用于将所述待处理图像所对应的商标图像以及该商标图像所对应的文字数据作为训练数据。

可选地，所述第四装置用于：

根据本发明的另一方面，还提供了一种计算机可读存储介质，所述计算机可读存储介质存储有计算机代码，当所述计算机代码被执行时，如上述所述的方法被执行。

根据本发明的另一方面，还提供了一种计算机程序产品，当所述计算机程序产品被计算机设备执行时，如上述所述的方法被执行。

根据本发明的另一方面，还提供了一种计算机设备，所述计算机设备包括：

一个或多个处理器；

存储器，用于存储一个或多个计算机程序；

当所述一个或多个计算机程序被所述一个或多个处理器执行时，使得所述一个或多个处理器实现如上述所述的方法。

与现有技术相比，本发明通过根据商标数据库中的映射关系，若待处理图像所对应的商标特征信息所对应的商标说明信息包含在所述待处理图像所对应的图像说明信息中，则将所述商标特征信息所对应的商标文字信息作为所述待处理图像所对应的商标图像的文字数据；从而实现了自动获取商标图像的文字数据的方法，能够从商品图片中准确地提取到商标中的文字，能够在短期内为深度学习模型快速获取大量的训练数据，从而有效地提高模型的识别效率以及识别效果。

而且，本发明可以从待处理图像的页面中确定所述待处理图像的图像说明信息或是根据所述待处理图像的相似图像，来确定所述待处理图像的图像说明信息；从而提出了多种获取图像说明信息的方式，有效且准确的获取图像说明信息，实现了对待处理图像的文字数据的全自动获取。

而且，本发明还可以将所述待处理图像所对应的商标图像以及该商标图像所对应的文字数据作为训练数据；进一步地，还可以仅当所述待处理图像所对应的商标图像的文字数据为非空集时，将所述待处理图像所对应的商标图像以及该商标图像所对应的文字数据作为训练数据；从而可以自动挖掘高质量的训练数据，实现了对训练数据的严格过滤，有效地提高了模型的识别效率以及识别效果。

附图说明

通过阅读参照以下附图所作的对非限制性实施例所作的详细描述，本发明的其它特征、目的和优点将会变得更明显：

图1示出根据本发明一个方面的一种获取商标图像的文字数据的处理装置示意图；

图2示出根据本发明的一个优选实施例的一种获取商标图像的文字数据的处理装置示意图；

图3示出根据本发明另一个方面的一种获取商标图像的文字数据的方法流程图；

图4示出根据本发明的一个优选实施例的一种获取商标图像的文字数据的方法流程图；

图5与图6示出根据本发明的一个优选实施例的包含文字的商标图像示例图；

图7与图8示出根据本发明的一个优选实施例的不包含文字的商标图像示意图；

图9示出根据本发明的另一个优选实施例的包含文字的商标图像以及其对应的文本说明示例图；

图10示出根据本发明的一个优选实施例的一种商标数据库内的存储关系示意图；

图11示出本发明的另一个优选实施例的对图10进行识别后，获取该商标图像所对应的文字数据的示例图。

附图中相同或相似的附图标记代表相同或相似的部件。

具体实施方式

在更加详细地讨论示例性实施例之前应当提到的是，一些示例性实施例被描述成作为流程图描绘的处理或方法。虽然流程图将各项操作描述成顺序的处理，但是其中的许多操作可以被并行地、并发地或者同时实施。此外，各项操作的顺序可以被重新安排。当其操作完成时所述处理可以被终止，但是还可以具有未包括在附图中的附加步骤。所述处理可以对应于方法、函数、规程、子例程、子程序等等。

在上下文中所称“处理装置”即为“计算机设备”，也称为“电脑”，是指可以通过运行预定程序或指令来执行数值计算和/或逻辑计算等预定处理过程的智能电子设备，其可以包括处理器与存储器，由处理器执行在存储器中预存的存续指令来执行预定处理过程，或是由ASIC、FPGA、DSP等硬件执行预定处理过程，或是由上述二者组合来实现。

所述计算机设备包括用户设备和/或网络设备。其中，所述用户设备包括但不限于电脑、智能手机、PDA等；所述网络设备包括但不限于单个网络服务器、多个网络服务器组成的服务器组或基于云计算(Cloud Computing)的由大量计算机或网络服务器构成的云，其中，云计算是分布式计算的一种，由一群松散耦合的计算机集组成的一个超级虚拟计算机。其中，所述计算机设备可单独运行来实现本发明，也可接入网络并通过与网络中的其他计算机设备的交互操作来实现本发明。其中，所述计算机设备所处的网络包括但不限于互联网、广域网、城域网、局域网、VPN网络等。

本领域技术人员应能理解，一般情况下，本发明中所述的“处理装置”可以仅是网络设备，即由网络设备来执行相应的操作；在特殊情况下，也可以是由用户设备与网络设备或服务器相集成来组成，即由用户设备与网络设备相配合来执行相应的操作，例如，由用户设备向网络设备发送指令，以指示网络设备开始执行“自动获取用于图像文字识别的训练数据”的相应操作。

需要说明的是，所述用户设备、网络设备和网络等仅为举例，其他现有的或今后可能出现的计算机设备或网络如可适用于本发明，也应包含在本发明保护范围以内，并以引用方式包含于此。

这里所公开的具体结构和功能细节仅仅是代表性的，并且是用于描述本发明的示例性实施例的目的。但是本发明可以通过许多替换形式来具体实现，并且不应当被解释成仅仅受限于这里所阐述的实施例。

应当理解的是，虽然在这里可能使用了术语“第一”、“第二”等等来描述各个单元，但是这些单元不应当受这些术语限制。使用这些术语仅仅是为了将一个单元与另一个单元进行区分。举例来说，在不背离示例性实施例的范围的情况下，第一单元可以被称为第二单元，并且类似地第二单元可以被称为第一单元。这里所使用的术语“和/或”包括其中一个或更多所列出的相关联项目的任意和所有组合。

这里所使用的术语仅仅是为了描述具体实施例而不意图限制示例性实施例。除非上下文明确地另有所指，否则这里所使用的单数形式“一个”、“一项”还意图包括复数。还应当理解的是，这里所使用的术语“包括”和/或“包含”规定所陈述的特征、整数、步骤、操作、单元和/或组件的存在，而不排除存在或添加一个或更多其他特征、整数、步骤、操作、单元、组件和/或其组合。

还应当提到的是，在一些替换实现方式中，所提到的功能/动作可以按照不同于附图中标示的顺序发生。举例来说，取决于所涉及的功能/动作，相继示出的两幅图实际上可以基本上同时执行或者有时可以按照相反的顺序来执行。

下面结合附图对本发明作进一步详细描述。

图1示出根据本发明一个方面的一种获取商标图像的文字数据的处理装置示意图；其中，所述处理装置包括建立装置5、第一装置1、第二装置2以及第三装置3。

具体地，所述建立装置5建立商标数据库，其中，所述商标数据库中包括一条或多条商标特征信息以及其所对应的商标说明信息和商标文字信息的映射；所述第一装置1获取一个或多个待处理图像，其中，所述待处理图像包括图像说明信息；所述第二装置2确定所述待处理图像所对应的商标特征信息；所述第三装置3根据所述商标数据库中的映射关系，若所述商标特征信息所对应的商标说明信息包含在所述待处理图像所对应的图像说明信息中，则将所述商标特征信息所对应的商标文字信息作为所述待处理图像所对应的商标图像的文字数据。

所述建立装置5建立商标数据库，其中，所述商标数据库中包括一条或多条商标特征信息以及其所对应的商标说明信息和商标文字信息的映射。

具体地，所述建立装置5通过直接获取或是与其他第三方数据库交互的方式，获取预先设定的一个或多个商标图片，并获取上述商标图片所对应的商标说明信息和商标文字信息；然后，所述建立装置5通过对所述商标图片进行图像特征分析，以获取该商标图片所对应的商标特征信息。

其中，所述商标特征信息可以是直接对应于一组图像特征数据，如图像向量等，则所述商标数据库中的映射关系即为“商标特征信息(图像特征数据)、商标说明信息、商标文字信息”；所述商标特征信息也可以是一组图像特征数据与图像特征ID(或叫做商标类别)的对应关系，则在后续可将图像特征ID存储在商标数据库中，即所述商标数据库中的映射关系即为“商标特征信息(图像特征ID，对应于图像特征数据)、商标说明信息、商标文字信息”，以便于后续查找。

其中，所述图像特征信息包括但不限于图像的颜色特征、纹理特征、形状特征和空间关系特征等。

所述商标说明信息即为对该商标的说明，包括但不限于商标名称、商标公司、商标对应的商品等；所述商标文字信息即为该商标图片上的文字。

图6示出了一个商标图像，参考图10中的数据可知，该商标图像的商标特征信息所对应的商标类别为8532(即图像特征ID)，其所对应的商标名称为“乐高”，对应的商标文字信息为“LEGO”。

类似地，图7示出了一个商标图像，参考图10中的数据可知，该商标图像的商标特征信息所对应的商标类别为123(即图像特征ID)，其所对应的商标名称为“虎牌”，对应的商标文字信息为“NULL”。其中，“NULL”表示该商标图像不包含商标文字信息。

例如，所述建立装置5通过爬取国家商标局的网站，以获取所注册的商标图片，并对该图片进行图像特征分析，以获取该商标图片所对应的商标特征信息；然后，将该商标图片所对应的商标名称作为该商标特征信息所对应的商标说明信息，然后将该商标图片上的文字作为所述商标文字信息。所述商标文字信息可以手动添加，也可以根据图像识别后，经过校对确认添加。从而，所述建立装置5建立起所述商标数据库。

所述第一装置1获取一个或多个待处理图像，其中，所述待处理图像包括图像说明信息。

具体地，所述第一装置1通过直接与用户设备相交互，以获取所述用户设备所上传的多个图像，并将其作为待处理图像；或者，所述第一装置1与已有的图像数据库相交互，以获取所述图像数据库中的多个图像，并将其作为待处理图像；或者，所述第一装置1通过爬取互联网上的各个网页，以获取各个网页上的图像，并将其作为待处理图像等。

在此，本领域技术人员应能理解，上述获取待处理图像的方法仅为示例，并非对本发明的限制。任何能够获取“图像”的方式均可适用于本发明，以将所获取的图像作为本发明中所述的“待处理图像”。

在此，图11示出根据本发明的一个优选实施例的一张待处理图像的示例图。该图像可以是用户上传的、也可以是从数据库中取得的、也可以是从网络中所爬取的。

其中，所述待处理图像可以在图像信息中包含图像说明信息，也可以通过人工方式添加所述待处理图像的图像说明信息；或者，还可以通过对所述待处理图像的所在页面或相似图像进行分析的方式获取所述待处理图像的图像说明信息。

优选地，所述第一装置1可以从一个或多个页面中，获取一个或多个待处理图像；根据所述待处理图像所对应的页面信息，确定所述待处理图像的图像说明信息。

具体地，所述第一装置1通过爬取或抓取一个或多个页面，以获取所述页面上的各种图像并作为待处理图像；其中，所述页面包括网页或其他文档等非网页页面。

更优选地，所述第一装置1可以根据用户或系统所指定的爬取范围，对互联网上的相应网页进行爬取，并获取所爬取网页上的图像，以将其作为待处理图像。其中，所述爬取范围可以根据以下至少任一项爬取参数进行确定：爬取时间、爬取主题、爬取深度、爬取广度等。

然后，所述第一装置1根据所述待处理图像所对应的页面信息，将所述页面信息中的文字内容部分作为所述待处理图像的图像说明信息；或者，所述第一装置1通过对所述待处理图像在所述页面上的位置进行判断，将所述待处理图像位置附近的文字内容信息作为所述待处理图像的图像说明信息；或者，所述第一装置1根据所述待处理图像所在页面的页面标签信息，通过根据标签说明，如“图片描述”、“description”等，获取该图像所对应的标签下的文字信息以作为所述待处理图像的图像说明信息等。

其中，所述页面信息包括但不限于格式标签(如HTML格式标签)、说明文字、页面内容等。

例如，以京东网站上的“蓝月亮深层洁净洗衣液1kg薰衣草香”(图9所示)的图片为例，通过爬取获取到该图片后，则将该网页上的“商品介绍”中的内容作为所述图像说明信息，即：

“品牌：蓝月亮

商品名称：蓝月亮洁净洗衣液

商品编号：231406

商品毛重：1.1kg

商品产地：广州

衣物材质：棉质，麻质，纤维，丝绸，毛料，羽绒

功效：去污/去渍

类型：机洗

净含量：1L-1.49L

分类：洗衣液

适用衣物：贴身内衣，母婴衣物，普通衣物

包装单位：瓶装”

优选地，所述第一装置1可以获取一个或多个待处理图像；根据所述待处理图像，确定与所述待处理图像相对应的一个或多个相似图像；根据所述相似图像所对应的图像说明信息，确定所述待处理图像的图像说明信息。

然后，所述第一装置1通过对于所述待处理图像进行分析，以确定所述待处理图像的图像特征；并根据所述图像特征，与一个或多个其他待处理图像或其他图像(如其他数据库的图像、其他网页图像等)的图像特征信息进行比对，以获取与所述待处理图像相对应的一个或多个相似图像。

然后，所述第一装置1根据所述相似图像所对应的图像说明信息，将一个或多个相似图像的图像说明信息作为所述待处理图像的图像说明信息；或者，若所述待处理图像对应于多张相似图像，则所述第一装置1将所述多张相似图像中相同的图像说明信息或超过一定次数的相同的图像说明信息作为述待处理图像的图像说明信息。其中，所述相似图像所对应的图像说明信息的获取方式，与前述第一装置1的优选实施例中“确定所述待处理图像的图像说明信息”相同或相似，故在此不再赘述。

所述第二装置2确定所述待处理图像所对应的商标特征信息。

具体地，所述第二装置2通过对所述待处理图像所对应的图像特征进行分析，以确定所述待处理图像所对应的图像特征，并将所述图像特征与所述商标数据库中的商标特征信息进行比对。例如，通过计算所述待处理图像的图像特征以及商标特征信息所包含的图像特征信息的向量距离，以将距离最小的商标特征信息作为所述待处理图像所对应的商标特征信息。

优选地，所述第二装置2可以所述待处理图像进行目标检测，以确定所述待处理图像中的商标位置；确定所述商标位置所对应的商标特征信息。

具体地，所述第二装置2通过基于例如通用物体检测算法fast rcnn训练模型等方法，对于所述待处理图像进行目标检测，以确定所述待处理图像中的商标位置。以图9为例，所述商标位置即为图像中间的“蓝月亮”。

然后，所述第二装置2基于前述的确定商标特征信息的方法，对所述商标位置所对应的图像进行分析处理，以确定所述商标位置所对应的商标特征信息。从而，所述第二装置2可以仅对商标位置处的图像进行分析，减少了所处理的图像数据。

所述第三装置3根据所述商标数据库中的映射关系，若所述商标特征信息所对应的商标说明信息包含在所述待处理图像所对应的图像说明信息中，则将所述商标特征信息所对应的商标文字信息作为所述待处理图像所对应的商标图像的文字数据。

具体地，所述第三装置3根据所述商标数据库中所存储的映射关系，在所述待处理图像所对应的图像说明信息中检索所述商标特征信息所对应的商标说明信息，若检索到，则说明对于该待处理图像的识别是准确的，从而直接将所述商标特征信息所对应的商标文字信息作为所述待处理图像所对应的商标图像的文字数据。

以图6为例，所述第一装置1获取该图像以及该图像所对应的图像说明信息：“商品名称：乐高10698”；所述第二装置2确定该图像的商标特征信息，并确定该商标特征信息对应于图10的“商标类别8532”的商标特征信息；然后，所述第三装置3将图10中的商标说明信息“商标名称：乐高”的“乐高”在所述图像的图像说明信息中进行搜索，确认在所述图像说明信息中包含“乐高”，从而，所述第三装置3将所述图10中的“商标文本内容：LEGO”作为图6所对应的商标图像的文字数据。

在此，如所述待处理图像所对应的商标特征信息所对应的商标文字信息为空，则说明该待处理图像属于无商标文字的商标，因此，其所对应的文字数据即为空。

如附图7与附图8示出了无商标文字的商标的示意图。根据图10可知，这类商标的“商标文本内容”为“NULL”。也就是说该待处理图像所对应的文字数据为无/空。

优选地，所述第三装置3可以根据所述商标数据库中的映射关系，若所述商标特征信息所对应的商标说明信息包含在所述待处理图像所对应的图像说明信息中，则将所述商标特征信息所对应的商标文字信息作为所述待处理图像中商标位置所对应的商标图像的文字数据。

具体地，所述第三装置3在确定所述文字数据时，将该文字数据作为所述待处理图像的商标位置所对应的商标图像的位置数据。换言之，所述文字数据对应于所述待处理图像中的特定位置。

如图11所示，所确定的文字数据“蓝月亮”对应于位于该图像中央的商标位置处。进一步地，所述第三装置3还可以将“蓝月亮”三个字输出在所述待处理图像的特定位置上。

图2示出根据本发明的一个优选实施例的一种获取商标图像的文字数据的处理装置示意图；其中，所述处理装置包括建立装置5、第一装置1、第二装置2、第三装置3以及第四装置4。

具体地，所述建立装置5建立商标数据库，其中，所述商标数据库中包括一条或多条商标特征信息以及其所对应的商标说明信息和商标文字信息的映射；所述第一装置1获取一个或多个待处理图像，其中，所述待处理图像包括图像说明信息；所述第二装置2确定所述待处理图像所对应的商标特征信息；所述第三装置3根据所述商标数据库中的映射关系，若所述商标特征信息所对应的商标说明信息包含在所述待处理图像所对应的图像说明信息中，则将所述商标特征信息所对应的商标文字信息作为所述待处理图像所对应的商标图像的文字数据；所述第四装置4将所述待处理图像所对应的商标图像以及该商标图像所对应的文字数据作为训练数据。

其中，所述第一装置1、所述第二装置2、所述第三装置3以及所述建立装置5与图1所述的对应装置相同或相似，故在此不再赘述，并以引用的方式包含于此。

所述第四装置4将所述待处理图像所对应的商标图像以及该商标图像所对应的文字数据作为训练数据。

具体地，所述第四装置4将所述待处理图像所对应的商标图像从所述待处理图像中进行截取，并将该商标图像与所述文字数据进行映射；然后，将所述文字数据以及所述商标图像作为训练数据。

优选地，所述第四装置4可以将所述商标图像进行扰动，以获得一个或多个变形图像；将所述文字数据以及所述商标图像和变形图像进行映射，并作为训练数据。

在此，所述扰动包括但不限于旋转、模糊、反色、伸缩、加噪声等。

本领域技术人员应能理解，上述扰动方式可以单独实施，也可以将多种扰动方式组合实施，例如，将原图进行旋转并伸缩，以获得变形图像。

优选地，仅当所述待处理图像所对应的商标图像的文字数据为非空集时，所述第四装置4将所述待处理图像所对应的商标图像以及该商标图像所对应的文字数据作为训练数据。

具体地，若所述待处理图像所对应的商标图像的文字数据为空集，如图7或图8所示的商标图像，或是如图10中的“虎牌、象印、奥迪”所对应的“商标文本内容”为空，则表示该商标图像不包含文字数据。因此，将其从训练数据中进行滤除。

仅当所述待处理图像所对应的商标图像的文字数据为非空集时，如图5或图6所示的商标图像，所述第四装置4将所述待处理图像所对应的商标图像以及该商标图像所对应的文字数据作为训练数据。

在此，所述第四装置4获取训练数据的方法如前所述，故在此不再赘述。

图3示出根据本发明另一个方面的一种获取商标图像的文字数据的方法流程图。

具体地，在步骤S5中，所述处理装置建立商标数据库，其中，所述商标数据库中包括一条或多条商标特征信息以及其所对应的商标说明信息和商标文字信息的映射；在步骤S1中，所述处理装置获取一个或多个待处理图像，其中，所述待处理图像包括图像说明信息；在步骤S2中，所述处理装置确定所述待处理图像所对应的商标特征信息；在步骤S3中，所述处理装置根据所述商标数据库中的映射关系，若所述商标特征信息所对应的商标说明信息包含在所述待处理图像所对应的图像说明信息中，则将所述商标特征信息所对应的商标文字信息作为所述待处理图像所对应的商标图像的文字数据。

在步骤S5中，所述处理装置建立商标数据库，其中，所述商标数据库中包括一条或多条商标特征信息以及其所对应的商标说明信息和商标文字信息的映射。

具体地，在步骤S5中，所述处理装置通过直接获取或是与其他第三方数据库交互的方式，获取预先设定的一个或多个商标图片，并获取上述商标图片所对应的商标说明信息和商标文字信息；然后，所述处理装置通过对所述商标图片进行图像特征分析，以获取该商标图片所对应的商标特征信息。

例如，在步骤S5中，所述处理装置通过爬取国家商标局的网站，以获取所注册的商标图片，并对该图片进行图像特征分析，以获取该商标图片所对应的商标特征信息；然后，将该商标图片所对应的商标名称作为该商标特征信息所对应的商标说明信息，然后将该商标图片上的文字作为所述商标文字信息。所述商标文字信息可以手动添加，也可以根据图像识别后，经过校对确认添加。从而，所述处理装置建立起所述商标数据库。

在步骤S1中，所述处理装置获取一个或多个待处理图像，其中，所述待处理图像包括图像说明信息。

具体地，在步骤S1中，所述处理装置通过直接与用户设备相交互，以获取所述用户设备所上传的多个图像，并将其作为待处理图像；或者，在步骤S1中，所述处理装置与已有的图像数据库相交互，以获取所述图像数据库中的多个图像，并将其作为待处理图像；或者，在步骤S1中，所述处理装置通过爬取互联网上的各个网页，以获取各个网页上的图像，并将其作为待处理图像等。

优选地，在步骤S1中，所述处理装置可以从一个或多个页面中，获取一个或多个待处理图像；根据所述待处理图像所对应的页面信息，确定所述待处理图像的图像说明信息。

具体地，在步骤S1中，所述处理装置通过爬取或抓取一个或多个页面，以获取所述页面上的各种图像并作为待处理图像；其中，所述页面包括网页或其他文档等非网页页面。

更优选地，在步骤S1中，所述处理装置可以根据用户或系统所指定的爬取范围，对互联网上的相应网页进行爬取，并获取所爬取网页上的图像，以将其作为待处理图像。其中，所述爬取范围可以根据以下至少任一项爬取参数进行确定：爬取时间、爬取主题、爬取深度、爬取广度等。

然后，所述处理装置根据所述待处理图像所对应的页面信息，将所述页面信息中的文字内容部分作为所述待处理图像的图像说明信息；或者，所述处理装置通过对所述待处理图像在所述页面上的位置进行判断，将所述待处理图像位置附近的文字内容信息作为所述待处理图像的图像说明信息；或者，所述处理装置根据所述待处理图像所在页面的页面标签信息，通过根据标签说明，如“图片描述”、“description”等，获取该图像所对应的标签下的文字信息以作为所述待处理图像的图像说明信息等。

“品牌：蓝月亮

商品名称：蓝月亮洁净洗衣液

商品编号：231406

商品毛重：1.1kg

商品产地：广州

衣物材质：棉质，麻质，纤维，丝绸，毛料，羽绒

功效：去污/去渍

类型：机洗

净含量：1L-1.49L

分类：洗衣液

适用衣物：贴身内衣，母婴衣物，普通衣物

包装单位：瓶装”

优选地，在步骤S1中，所述处理装置可以获取一个或多个待处理图像；根据所述待处理图像，确定与所述待处理图像相对应的一个或多个相似图像；根据所述相似图像所对应的图像说明信息，确定所述待处理图像的图像说明信息。

然后，在步骤S1中，所述处理装置通过对于所述待处理图像进行分析，以确定所述待处理图像的图像特征；并根据所述图像特征，与一个或多个其他待处理图像或其他图像(如其他数据库的图像、其他网页图像等)的图像特征信息进行比对，以获取与所述待处理图像相对应的一个或多个相似图像。

然后，所述处理装置根据所述相似图像所对应的图像说明信息，将一个或多个相似图像的图像说明信息作为所述待处理图像的图像说明信息；或者，若所述待处理图像对应于多张相似图像，则所述处理装置将所述多张相似图像中相同的图像说明信息或超过一定次数的相同的图像说明信息作为述待处理图像的图像说明信息。其中，所述相似图像所对应的图像说明信息的获取方式，与前述优选实施例中“确定所述待处理图像的图像说明信息”的方式相同或相似，故在此不再赘述。

在步骤S2中，所述处理装置确定所述待处理图像所对应的商标特征信息。

具体地，在步骤S2中，所述处理装置通过对所述待处理图像所对应的图像特征进行分析，以确定所述待处理图像所对应的图像特征，并将所述图像特征与所述商标数据库中的商标特征信息进行比对。例如，通过计算所述待处理图像的图像特征以及商标特征信息所包含的图像特征信息的向量距离，以将距离最小的商标特征信息作为所述待处理图像所对应的商标特征信息。

优选地，在步骤S2中，所述处理装置可以所述待处理图像进行目标检测，以确定所述待处理图像中的商标位置；确定所述商标位置所对应的商标特征信息。

具体地，在步骤S2中，所述处理装置通过基于例如通用物体检测算法fast rcnn训练模型等方法，对于所述待处理图像进行目标检测，以确定所述待处理图像中的商标位置。以图9为例，所述商标位置即为图像中间的“蓝月亮”。

然后，所述处理装置基于前述的确定商标特征信息的方法，对所述商标位置所对应的图像进行分析处理，以确定所述商标位置所对应的商标特征信息。从而，所述处理装置可以仅对商标位置处的图像进行分析，减少了所处理的图像数据。

在步骤S3中，所述处理装置根据所述商标数据库中的映射关系，若所述商标特征信息所对应的商标说明信息包含在所述待处理图像所对应的图像说明信息中，则将所述商标特征信息所对应的商标文字信息作为所述待处理图像所对应的商标图像的文字数据。

具体地，在步骤S3中，所述处理装置根据所述商标数据库中所存储的映射关系，在所述待处理图像所对应的图像说明信息中检索所述商标特征信息所对应的商标说明信息，若检索到，则说明对于该待处理图像的识别是准确的，从而直接将所述商标特征信息所对应的商标文字信息作为所述待处理图像所对应的商标图像的文字数据。

以图6为例，在步骤S1中，所述处理装置获取该图像以及该图像所对应的图像说明信息：“商品名称：乐高10698”；在步骤S2中，所述处理装置确定该图像的商标特征信息，并确定该商标特征信息对应于图10的“商标类别8532”的商标特征信息；然后，在步骤S3中，所述处理装置将图10中的商标说明信息“商标名称：乐高”的“乐高”在所述图像的图像说明信息中进行搜索，确认在所述图像说明信息中包含“乐高”，从而，所述处理装置将所述图10中的“商标文本内容：LEGO”作为图6所对应的商标图像的文字数据。

优选地，在步骤S3中，所述处理装置可以根据所述商标数据库中的映射关系，若所述商标特征信息所对应的商标说明信息包含在所述待处理图像所对应的图像说明信息中，则将所述商标特征信息所对应的商标文字信息作为所述待处理图像中商标位置所对应的商标图像的文字数据。

具体地，在步骤S3中，所述处理装置在确定所述文字数据时，将该文字数据作为所述待处理图像的商标位置所对应的商标图像的位置数据。换言之，所述文字数据对应于所述待处理图像中的特定位置。

如图11所示，所确定的文字数据“蓝月亮”对应于位于该图像中央的商标位置处。进一步地，所述处理装置还可以将“蓝月亮”三个字输出在所述待处理图像的特定位置上。

图4示出根据本发明的一个优选实施例的一种获取商标图像的文字数据的方法流程图。

具体地，在步骤S5中，所述处理装置建立商标数据库，其中，所述商标数据库中包括一条或多条商标特征信息以及其所对应的商标说明信息和商标文字信息的映射；在步骤S1中，所述处理装置获取一个或多个待处理图像，其中，所述待处理图像包括图像说明信息；在步骤S2中，所述处理装置确定所述待处理图像所对应的商标特征信息；在步骤S3中，所述处理装置根据所述商标数据库中的映射关系，若所述商标特征信息所对应的商标说明信息包含在所述待处理图像所对应的图像说明信息中，则将所述商标特征信息所对应的商标文字信息作为所述待处理图像所对应的商标图像的文字数据在步骤S4中，所述处理装置将所述待处理图像所对应的商标图像以及该商标图像所对应的文字数据作为训练数据。

其中，所述步骤S1、所述步骤S2、所述步骤S3以及所述步骤S5与图3所述的对应步骤相同或相似，故在此不再赘述，并以引用的方式包含于此。

在步骤S4中，所述处理装置将所述待处理图像所对应的商标图像以及该商标图像所对应的文字数据作为训练数据。

具体地，在步骤S4中，所述处理装置将所述待处理图像所对应的商标图像从所述待处理图像中进行截取，并将该商标图像与所述文字数据进行映射；然后，将所述文字数据以及所述商标图像作为训练数据。

优选地，在步骤S4中，所述处理装置可以将所述商标图像进行扰动，以获得一个或多个变形图像；将所述文字数据以及所述商标图像和变形图像进行映射，并作为训练数据。

优选地，仅当所述待处理图像所对应的商标图像的文字数据为非空集时，在步骤S4中，所述处理装置将所述待处理图像所对应的商标图像以及该商标图像所对应的文字数据作为训练数据。

仅当所述待处理图像所对应的商标图像的文字数据为非空集时，如图5或图6所示的商标图像，所述处理装置将所述待处理图像所对应的商标图像以及该商标图像所对应的文字数据作为训练数据。

在此，所述处理装置获取训练数据的方法如前所述，故在此不再赘述。

本发明还提供了一种计算机可读存储介质，所述计算机可读存储介质存储有计算机代码，当所述计算机代码被执行时，如前任一项所述的方法被执行。

本发明还提供了一种计算机程序产品，当所述计算机程序产品被计算机设备执行时，如前任一项所述的方法被执行。

本发明还提供了一种计算机设备，所述计算机设备包括：

一个或多个处理器；

存储器，用于存储一个或多个计算机程序；

当所述一个或多个计算机程序被所述一个或多个处理器执行时，使得所述一个或多个处理器实现如前任一项所述的方法。

需要注意的是，本发明可在软件和/或软件与硬件的组合体中被实施，例如，可采用专用集成电路(ASIC)、通用目的计算机或任何其他类似硬件设备来实现。在一个实施例中，本发明的软件程序可以通过处理器执行以实现上文所述步骤或功能。同样地，本发明的软件程序(包括相关的数据结构)可以被存储到计算机可读记录介质中，例如，RAM存储器，磁或光驱动器或软磁盘及类似设备。另外，本发明的一些步骤或功能可采用硬件来实现，例如，作为与处理器配合从而执行各个步骤或功能的电路。

另外，本发明的一部分可被应用为计算机程序产品，例如计算机程序指令，当其被计算机执行时，通过该计算机的操作，可以调用或提供根据本发明的方法和/或技术方案。而调用本发明的方法的程序指令，可能被存储在固定的或可移动的记录介质中，和/或通过广播或其他信号承载媒体中的数据流而被传输，和/或被存储在根据所述程序指令运行的计算机设备的工作存储器中。在此，根据本发明的一个实施例包括一个装置，该装置包括用于存储计算机程序指令的存储器和用于执行程序指令的处理器，其中，当该计算机程序指令被该处理器执行时，触发该装置运行基于前述根据本发明的多个实施例的方法和/或技术方案。

对于本领域技术人员而言，显然本发明不限于上述示范性实施例的细节，而且在不背离本发明的精神或基本特征的情况下，能够以其他的具体形式实现本发明。因此，无论从哪一点来看，均应将实施例看作是示范性的，而且是非限制性的，本发明的范围由所附权利要求而不是上述说明限定，因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此外，显然“包括”一词不排除其他单元或步骤，单数不排除复数。装置权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第一，第二等词语用来表示名称，而并不表示任何特定的顺序。

Claims

1.一种获取商标图像的文字数据的方法，其中，该方法包括以下步骤：

其中，该方法还包括：

b确定所述待处理图像所对应的商标特征信息；

2.根据权利要求1所述的方法，其中，所述步骤a包括：

-从一个或多个页面中，获取一个或多个待处理图像；

3.根据权利要求1所述的方法，其中，所述步骤a包括：

-获取一个或多个待处理图像；

4.根据权利要求1至3中任一项所述的方法，其中，所述步骤b包括：

-确定所述商标位置所对应的商标特征信息。

5.根据权利要求4所述的方法，其中，所述步骤c包括：

6.根据权利要求1至5中任一项所述的方法，其中，该方法还包括：

7.根据权利要求6所述的方法，其中，所述步骤r包括：

8.一种获取商标图像的文字数据的处理装置，其中，所述处理装置包括：

其中，所述处理装置还包括：

9.根据权利要求8所述的处理装置，其中，所述第一装置用于：

-从一个或多个页面中，获取一个或多个待处理图像；

10.根据权利要求8所述的处理装置，其中，所述第一装置用于：

-获取一个或多个待处理图像；

11.根据权利要求8至10中任一项所述的处理装置，其中，所述第二装置用于：

-确定所述商标位置所对应的商标特征信息。

12.根据权利要求11所述的处理装置，其中，所述第三装置用于：

13.根据权利要求8至12中任一项所述的处理装置，其中，所述处理装置还包括：

14.根据权利要求13所述的处理装置，其中，所述第四装置用于：

15.一种计算机可读存储介质，所述计算机可读存储介质存储有计算机代码，当所述计算机代码被执行时，如权利要求1至7中任一项所述的方法被执行。

16.一种计算机程序产品，当所述计算机程序产品被计算机设备执行时，如权利要求1至7中任一项所述的方法被执行。

17.一种计算机设备，所述计算机设备包括：

一个或多个处理器；

存储器，用于存储一个或多个计算机程序；

当所述一个或多个计算机程序被所述一个或多个处理器执行时，使得所述一个或多个处理器实现如权利要求1至7中任一项所述的方法。