CN108984576A - 一种基于卷积神经网络的专利文献获取方法及系统 - Google Patents
一种基于卷积神经网络的专利文献获取方法及系统 Download PDFInfo
- Publication number
- CN108984576A CN108984576A CN201810123760.XA CN201810123760A CN108984576A CN 108984576 A CN108984576 A CN 108984576A CN 201810123760 A CN201810123760 A CN 201810123760A CN 108984576 A CN108984576 A CN 108984576A
- Authority
- CN
- China
- Prior art keywords
- image
- patent document
- target image
- neural networks
- convolutional neural
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000013527 convolutional neural network Methods 0.000 title claims abstract description 74
- 238000000034 method Methods 0.000 title claims abstract description 45
- 238000012545 processing Methods 0.000 claims abstract description 56
- 230000008569 process Effects 0.000 claims description 10
- 238000000605 extraction Methods 0.000 claims description 9
- 238000013507 mapping Methods 0.000 claims description 9
- 238000003708 edge detection Methods 0.000 claims description 5
- 238000012549 training Methods 0.000 claims description 4
- 238000005259 measurement Methods 0.000 claims description 3
- 238000001514 detection method Methods 0.000 abstract description 3
- 238000004378 air conditioning Methods 0.000 description 5
- 238000013528 artificial neural network Methods 0.000 description 5
- 241000894007 species Species 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 230000008878 coupling Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 241001657948 Midea Species 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 210000004556 brain Anatomy 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000005611 electricity Effects 0.000 description 1
- 230000005284 excitation Effects 0.000 description 1
- 230000007717 exclusion Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 230000001537 neural effect Effects 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 238000004321 preservation Methods 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/22—Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Image Analysis (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种基于卷积神经网络的专利文献获取方法及系统,通过采用卷积层改进后的卷积神经网络对目标图像进行图像识别获得图像中的目标的种类名称;然后将该种类名称作为检索的关键词在专利数据库中检索对应的专利文献,并将该图像与检索获得的专利文献中的附图进行近似度匹配,将附图与该图像相近的专利文献筛选出来并呈现给用户,使得用户可以仅通过图像便获取到与该图像图文相关的专利文献,有利于专利的普及推广,并且由于采用了改进后的增加了宽度的卷积神经网络对图像进行识别,使得卷积神经网络可以从多个尺度对目标图像进行数据运算处理,能够准确识别获得目标图像中的主体目标,提高了检索的准确率,降低了误检的几率。
Description
技术领域
本发明涉及深度学习技术领域,尤其涉及一种基于卷积神经网络的专利文献获取方法及系统。
背景技术
知识产权的客体是人的智力成果,是一种无形财产,保护知识产权体现了对人的智力成果的尊重。通过对智力成果的保护有利于激发社会进行创新和技术革命的热情,推动社会的进步。
随着我国专利法的建立,以及国家为了鼓励创新创造而进行的对知识产权保护的大力扶持,知识产权保护在企业中已经得到了较好的普及,已经有越来越多的企业认识到了知识产权保护的重要性,并且相应的进行专利的申请来保护企业的知识产权。
然而,对于广大群众人民而言,知识产权保护还是一个较为陌生的概念。而专利作为知识产权保护的一种方式,更加不为群众人民所知。由于当前的专利存在一定的专业门槛,使得人民难以了解甚至接触到专利,不利于专利在广大人民群众中的普及推广以及广大人民群众的知识产权意识的提高。
发明内容
本发明提供了一种基于卷积神经网络的专利文献获取方法及系统,解决了当前的专利存在一定的专业门槛,使得人民难以了解甚至接触到专利,不利于专利在广大人民群众中的普及推广的技术问题。
本发明提供的一种基于卷积神经网络的专利文献获取方法,包括:
获取预置图像数据库,并将所述预置图像数据库中的图像输入预设的卷积神经网络进行训练,获得训练好的卷积神经网络模型;
所述预设的卷积神经网络由一个线性映射和一个包含了多个卷积层的非线性映射构成,所述多个卷积层中的每个卷积层包含有多个卷积核,所述多个卷积核包含有1*1卷积核、3*3卷积核以及5*5卷积核;
获取目标图像,通过所述训练好的卷积神经网络模型对所述目标图像进行图像识别,并获得所述目标图像中的主体目标的名称;
将所述主体目标的名称作为关键词,在预置的专利数据库中检索与所述关键词对应的第一专利文献;
将所述目标图像进行灰度化处理后与所述第一专利文献中的附图进行图像匹配,获得与进行灰度化处理后的目标图像匹配的第一目标附图;
获取所述第一目标附图对应的第二专利文献,并将所述第二专利文献进行显示。
可选地,所述通过所述训练好的卷积神经网络模型对所述目标图像进行图像识别具体包括:
通过训练好的卷积神经网络模型对所述目标图像进行特征提取,并计算出经过所述多个卷积层进行传递之后获得的残差;
对所述多个卷积层之间的特征残差进行降维处理后融合,获得融合后的特征表达;
利用分类器对所述特征表达进行图像分类。
可选地,进行图像匹配的过程具体包括:
对进行灰度化处理后的目标图像进行像素点的灰度值求和,并计算所述灰度化处理后的目标图像在不同位置下覆盖所述第一专利文献中的附图的每个像素点的灰度值之和是否位于预设值以及所述灰度化处理后的目标图像的像素点的求和值之间;
若是,则对当前位置下的目标图像以及附图的像素点的灰度值进行逻辑运算,并对运算结果进行卷积求和;
对卷积求和获得的结果进行归一化处理得到互相关度量。
可选地,所述将所述目标图像进行灰度化处理后与所述第一专利文献中的附图进行图像匹配之前还包括:
将所述目标图像进行边缘检测,识别并分离出所述目标图像的前景和背景,并将所述目标图像的背景替换为白色背景;
所述目标图像的前景包括有所述主体目标。
可选地,所述将所述目标图像的背景替换为白色背景之后还包括:
对进行背景替换后的目标图像进行字符识别,获得识别文字;
将所述识别文字作为申请人关键词在所述第一专利文献中筛选出与所述申请人关键词对应的专利文献,获得新的第一专利文献;
所述将所述目标图像进行灰度化处理后与所述第一专利文献中的附图进行图像匹配具体为将所述进行背景替换后的目标图像与所述新的第一专利文献中的附图进行图像匹配。
可选地,所述将所述目标图像的背景替换为白色背景之后还包括:
对进行背景替换后的目标图像进行轮廓线条提取,获得由轮廓线条构成的二值化图像;
将所述二值化图像与所述第一专利文献中的附图进行图像匹配,获得与所述二值化图像匹配的第二目标附图;
获取所述第二目标附图对应的第三专利文献,并将所述第三专利文献进行显示。
可选地,所述将所述目标图像进行灰度化处理后与所述第一专利文献中的附图进行图像匹配之前还包括:
获取用户输入的区域选取指令,并在所述目标图像上选取与所述区域选取指令对应的区域图像;
将所述区域图像替换为第一图像;
所述第一图像的大小和形状与所述区域图像一致,且所述第一图像的颜色与所述区域图像邻接的区域一致。
可选地,将所述区域图像替换为第一图像之前还包括:
根据所述区域图像的大小和形状生成空白的第一图像;
获取所述区域图像的边缘所邻接的图像的所有像素点,并计算所述所有像素点的色彩数值,获得色彩数值所占比例最高的第一像素点;
将所述第一像素点填充满所述空白的第一图像,获得第一图像,以使得所述第一图像的颜色与所述区域图像邻接的区域一致。
可选地,所述将所述主体目标的名称作为关键词,在预置的专利数据库中检索与所述关键词对应的第一专利文献还包括:
根据所述主体目标的名称确定所述主体目标的所属领域,并获取对应的分类号;
将所述主体目标的名称作为关键词,在预置的专利数据库中检索与所述关键词以及所述分类号对应的第一专利文献。
本发明提供的一种基于卷积神经网络的专利文献获取系统,包括:
训练模块,用于获取预置图像数据库,并将所述预置图像数据库中的图像输入预设的卷积神经网络进行训练,获得训练好的卷积神经网络模型;
所述预设的卷积神经网络由一个线性映射和一个包含了多个卷积层的非线性映射构成,所述多个卷积层中的每个卷积层包含有多个卷积核,所述多个卷积核包含有1*1卷积核、3*3卷积核以及5*5卷积核;
识别模块,用于获取目标图像,通过所述训练好的卷积神经网络模型对所述目标图像进行图像识别,并获得所述目标图像中的主体目标的名称;
检索模块,用于将所述主体目标的名称作为关键词,在预置的专利数据库中检索与所述关键词对应的第一专利文献;
图像匹配模块,用于将所述目标图像进行灰度化处理后与所述第一专利文献中的附图进行图像匹配,获得与进行灰度化处理后的目标图像匹配的第一目标附图;
显示模块,用于获取所述第一目标附图对应的第二专利文献,并将所述第二专利文献进行显示。
从以上技术方案可以看出,本发明具有以下优点:
本发明中通过获取用户拍照或上传的图像,并采用卷积层改进后的卷积神经网络对目标图像进行图像识别获得图像中的目标的种类名称;然后将该种类名称作为检索的关键词在专利数据库中检索对应的专利文献,并将该图像与检索获得的专利文献中的附图进行近似度匹配,将附图与该图像相近的专利文献筛选出来并呈现给用户,使得用户可以仅通过图像便获取到与该图像图文相关的专利文献,有利于专利的普及推广,并且由于采用了改进后的增加了宽度的卷积神经网络对图像进行识别,使得卷积神经网络可以从多个尺度对目标图像进行数据运算处理,能够准确识别获得目标图像中的主体目标,提高了检索的准确率,降低了误检的几率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其它的附图。
图1为本发明实施例提供的一种基于卷积神经网络的专利文献获取方法的流程示意图;
图2为本发明实施例提供的一种基于卷积神经网络的专利文献获取方法的另一个实施例的流程示意图;
图3为本发明实施例提供的一种基于卷积神经网络的专利文献获取系统的结构示意图。
具体实施方式
为使得本发明的发明目的、特征、优点能够更加的明显和易懂,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,下面所描述的实施例仅仅是本发明一部分实施例,而非全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
经本申请发明人研究发现,随着国家对于知识产权保护的大力鼓励,虽然越来越多的企业已经认识到了知识产权保护的重要性并相应地积极进行专利的申请以获取知识产权保护,但是对于广大的普通人民群众而言,专利还是一个很陌生的存在,大部分的普通人民群众都不知道专利是何物,更别谈懂得如何获取到一些专利文献,以一睹专利的真容。鉴于此,本发明实施例提供一种简单便捷且具有一定趣味性的基于卷积神经网络的专利文献获取方法,使得普通人民群众可以无需具备任何和专利相关的专利知识,仅通过提供包含有待识别目标的图像,即可获取到与图像中的待识别目标相关的专利文献,打破了专利与普通人民群众之间的鸿沟,有利于专利在普通人民群众间的普及推广。
请参阅图1,图1为本发明实施例提供的一种基于卷积神经网络的专利文献获取方法的流程示意图。
本发明实施例提供的一种基于卷积神经网络的专利文献获取方法,包括:
S101、获取预置图像数据库,并将预置图像数据库中的图像输入预设的卷积神经网络进行训练,获得训练好的卷积神经网络模型。
其中,预设的卷积神经网络由一个线性映射和一个包含了多个卷积层的非线性映射构成,多个卷积层中的每个卷积层包含有多个卷积核,多个卷积核包含有1*1卷积核、3*3卷积核以及5*5卷积核。
在原来的传统神经网络中,只着重于增加网络的深度,而经过申请人试验发现,当神经网络的深度过深时,会出现以下问题:在进行正向传播时,浅层的卷积层传播过来的有用的特征有可能会被过滤掉,导致深层的卷积层很难辨别有用的梯度方向。因此,本实施例中摒弃了传统的只采用单一的3*3卷积核的神经网络,增加了神经网络的宽度,即使用了多个1*1卷积核、3*3卷积核以及5*5卷积核,让卷积层从不同的尺度对输入数据进行运算,能够帮助不同的卷积核收敛到不同的值,有效避免神经网络的协同工作。
S102、获取目标图像,通过训练好的卷积神经网络模型对目标图像进行图像识别,并获得目标图像中的主体目标的名称。
目标图像可以为用户通过移动终端进行实时拍摄所获取的照片图像,也可以为用户从本地进行上传的图像。需要说明的是,目标图像中包含有用户想要搜寻专利所对应的主体目标。其中主体目标可以为空调、手机、电脑、水杯或鞋子等物品,也可以为精密器件、大型设备或工业用品等具有实体结构的物品,此处不做具体限定。可以理解的是,可以预先建立包括有各种物品结构图像的数据库,并在数据库中建立物品结构图像与物品种类名称之间的对应关系,使得获取到目标图像之后,可以根据数据库对目标图像进行识别,并直接获取到目标图像中的主体目标的种类名称。例如,用户在日常生活中可以通过手机、平板电脑等移动终端直接拍摄家里的家用电器或身边的具有实体结构的物品等,或者用户可以在上网购物时通过截图或保存图片等方法将商品图片保存于本地并进行上传,从而获取到包含有主体目标的目标图像。
其中,进行图像识别的具体过程为:通过训练好的卷积神经网络模型对目标图像进行特征提取,并计算出经过多个卷积层进行传递之后获得的残差;对多个卷积层之间的特征残差进行降维处理后融合,获得融合后的特征表达;利用支持向量机分类器对特征表达进行图像分类。
S103、将主体目标的名称作为关键词,在预置的专利数据库中检索与关键词对应的第一专利文献。
可以理解的是,通过图像识别进行获取得到的主体目标的名称为该主体目标所属的技术领域内对该主体目标所赋予的专业术语名称,而并非是人民群众对该主体目标的俗称。预置的专利数据库可以为预先设置的专利文献的数据库,其中专利文献包括发明专利、实用新型专利和外观专利等,专利数据库中的专利文献与上述的包括有各种物品结构图像的数据库相对应,即专利数据库中包含有与物品结构图像的数据库中所有的名称相关的专利文献,以保证进行图像识别后能够获得对应主体目标名称的目标图像均有相应的专利文献匹配。其中,利用关键词进行专利文献的检索可以是利用关键词在专利数据库的专利文献的全文中进行检索,也可以是在专利文献的标题或摘要或权利要求中进行检索,可以视该关键词所对应的专利文献的数量而定,此处不做具体限定。
可选地,将主体目标的名称作为关键词,在预置的专利数据库中检索与关键词对应的第一专利文献还包括:
根据主体目标的名称确定主体目标的所属领域,并获取对应的分类号;将主体目标的名称作为关键词,在预置的专利数据库中检索与关键词以及分类号对应的第一专利文献。可以理解的是,为了提高对专利文献进行检索的准确率,尽可能的排除与目标图像中的主体目标关联性不大的专利文献,可以在获得了主体目标的名称之后确定主体目标所属的技术领域,并结合对应的分类号进行组合检索,以获得更为精准的检索结果。
S104、将目标图像进行灰度化处理后与第一专利文献中的附图进行图像匹配,获得与进行灰度化处理后的目标图像匹配的第一目标附图。
可以理解的是,为了获得较好的匹配效果,在进行图像匹配前,可以先将第一专利文献中的所有附图的大小转换为与目标图像一致,然后将目标图像和附图均进行灰度化处理后进行图像匹配,并且获得第一专利文献中与进行灰度化处理后的目标图像匹配的第一目标附图。其中,图像匹配是通过对图像的内容、特征、结构、关系、纹理或灰度等的对应关系,进行图像的相似性和一致性的分析,以寻求相似的图像目标。本发明实施例中,进行图像匹配的方法可以采用基于灰度特征匹配的方法,具体的匹配过程如下:对进行灰度化处理后的目标图像进行像素点的灰度值求和,并计算灰度化处理后的目标图像在不同位置下覆盖第一专利文献中的附图的每个像素点的灰度值之和是否位于预设值以及灰度化处理后的目标图像的像素点的求和值之间;若是,则对当前位置下的目标图像以及附图的像素点的灰度值进行逻辑运算,并对运算结果进行卷积求和;对卷积求和获得的结果进行归一化处理得到互相关度量。可以理解的是,事先可以随机将进行灰度化处理后的目标图像覆盖在附图的不同的位置上,在计算得所覆盖的附图的灰度值之和不在预设值以及求和值之间时,变换目标图像覆盖的位置,并重新进行运算,直到所覆盖的附图的灰度值之和在预设值以及求和值之间。
S105、获取第一目标附图对应的第二专利文献,并将第二专利文献进行显示。
获取得到与目标图像匹配对应的第一目标附图之后,可以直接获取第一目标附图对应的第二专利文献。可以理解的是,将第二专利文献进行显示之前可以预先将第二专利文献根据目标附图与进行灰度化处理后的目标图像之间的匹配度大小进行排序,并将第二专利文献根据排序后的顺序进行显示。即可以将第二专利文献按附图与目标图像的匹配度的大小由大到小进行排序显示,使得与目标图像匹配较高的第二专利文献能够优先显示,便于用户的浏览查看。
本发明实施例中通过获取用户拍照或上传的图像,并采用卷积层改进后的卷积神经网络对目标图像进行图像识别获得图像中的目标的种类名称;然后将该种类名称作为检索的关键词在专利数据库中检索对应的专利文献,并将该图像与检索获得的专利文献中的附图进行近似度匹配,将附图与该图像相近的专利文献筛选出来并呈现给用户,使得用户可以仅通过图像便获取到与该图像图文相关的专利文献,有利于专利的普及推广,并且由于采用了改进后的增加了宽度的卷积神经网络对图像进行识别,使得卷积神经网络可以从多个尺度对目标图像进行数据运算处理,能够准确识别获得目标图像中的主体目标,提高了检索的准确率,降低了误检的几率。并且,由于用户可以通过拍摄照片或者上传本地图像直接进行相关专利的获取,简化了用户的操作,可以使得用户具有更为有趣的体验,促进了用户对了解专利的兴趣,有利于专利在广大人民群众中的普及推广。此外,通过图像识别还可以使得用户无需具备任何检索专利的知识,甚至可以不了解用户自身提供的目标图像中所包含的主体目标,便可以直接获取得到相关的专利文献,大大地降低了专利普及的门槛。可以理解的是,专利文献作为具有法律效应的用于保护申请人权益的文件,文献中涉及到所申请保护的产品的用语名称通常为该领域的专业术语,而该专业术语往往不为人民群众所知,或者人民群众对于该产品具有其他的常用俗称。因此,通过本发明实施例所提供的方法来获取专利文献,还可以使得用户在不知晓目标图像中的目标产品的专业术语的情况下,获取得与目标产品相关的专利文献。
以上为对本发明实施例提供的一种基于卷积神经网络的专利文献获取方法的一个实施例的详细描述,以下将对本发明实施例提供的一种基于卷积神经网络的专利文献获取方法的另一个实施例进行详细描述。
请参阅图2,图2为本发明实施例提供的一种基于卷积神经网络的专利文献获取方法的另一个实施例的流程示意图。
本发明实施例提供的一种基于卷积神经网络的专利文献获取方法包括:
S201、获取预置图像数据库,并将预置图像数据库中的图像输入预设的卷积神经网络进行训练,获得训练好的卷积神经网络模型。
S202、获取目标图像,通过训练好的卷积神经网络模型对目标图像进行图像识别,并获得目标图像中的主体目标的名称。
S203、将主体目标的名称作为关键词,在预置的专利数据库中检索与关键词对应的第一专利文献。
S204、将目标图像进行边缘检测,识别并分离出目标图像的前景和背景,并将目标图像的背景替换为白色背景;目标图像的前景包括有主体目标。
可以理解的是,用户拍照获得的照片图像或者是从网上获取得到的照片图像除了用户想要识别的主体目标之外,往往还不可避免的夹带有其他的背景,例如用户拍摄家里的空调时,不可避免地将空调背后的墙壁,或者是窗帘等背景拍摄进来。为了在图像匹配时,能够将主体目标之外的背景色进行排除掉,以免背景对图像匹配进行干扰而获得影响图像匹配的结果,可以对目标图像进行边缘检测,识别并分离出目标图像的前景和背景,并将目标图像的背景替换为白色背景。可以理解的是,由于专利文献的附图具有一定的要求,因此,为了尽可能地提高与专利文献的附图的匹配度,可以将目标图像的背景替换为灰度值为255的白色背景,以便于后续的基于灰度匹配方法的图像匹配。
S205、对进行背景替换后的目标图像进行字符识别,获得识别文字。
S206、将识别文字作为申请人关键词在第一专利文献中筛选出与申请人关键词对应的专利文献,获得新的第一专利文献。
可以理解的是,当用户所想要识别的主体目标为一些知名商品时,主体目标上往往会有商家贴覆的用于宣传的品牌标识,而该品牌标识一般为该商家的简称,例如空调、冰箱、微波炉等电器的面板上,鼠标、电脑、手机等的外壳上,一般地都会印制有商家的标识,且标识中通常用中文或英文或韩文等语言标有商家的简称,如商家的全称为“XX市YY电器股份有限公司”,则对应的商品的标识上为“YY”,此时,则可以通过字符识别方法识别标识上的“YY”,并将“YY”作为申请人关键词在在第一专利文献中筛选出与申请人关键词对应的专利文献,获得新的第一专利文献。
需要说明的是,在一些情况下,通过字符识别获得的识别文字不一定是商家的简称,有可能是商家名称的拼音的缩写或者是商家名称的翻译文或者是商家独有的名称组合,如“HUAWEI”、“GREE”或“Midea”等标识。此时,可以通过预先建立具有商家的标识符与对应的申请人关键词的对应关系的数据库,即在识别出标识中的字符文字之后,可以通过该数据库直接获取得到对应的申请人关键词,并根据该申请人关键词筛选出与申请人关键词对应的专利文献,获得新的第一专利文献。
通过对目标图像进行字符识别,并获得相应的申请人的信息来进行专利文献的筛选,可以更精准地缩小专利文献的检索范围,提高后续的图像匹配效率,降低处理器负荷;还可以使得用户可以直接获取得与该主体目标对应的商家的相关专利文献,有利于促进用户对该主体目标对应的商家的了解。
S207、将进行背景替换后的目标图像与新的第一专利文献中的附图进行图像匹配,获得与进行灰度化处理后的目标图像匹配的第一目标附图。
S208、获取第一目标附图对应的第二专利文献,并将第二专利文献进行显示。
以上为对本发明实施例提供的一种基于卷积神经网络的专利文献获取方法的另一个实施例的详细描述,以下将对本发明实施例提供的其他的一些可选的实施方式进行详细的描述。
可选地,在将目标图像的背景替换为白色背景之后还可以包括:对进行背景替换后的目标图像进行轮廓线条提取,获得由轮廓线条构成的二值化图像;将二值化图像与第一专利文献中的附图进行图像匹配,获得与二值化图像匹配的第二目标附图;获取第二目标附图对应的第三专利文献,并将第三专利文献进行显示。可以理解的是,在大部分的实用新型专利或发明专利中,专利文献的附图通常采用黑线条进行轮廓的描绘,因此,为了提高图像的匹配度,可以将进行背景替换后的目标图像进行轮廓线条提取,获得由轮廓线条构成的二值化图像;然后再将二值化图像与第一专利文献中的附图进行图像匹配。需要说明的是,将二值化图像与第一专利文献中的附图进行图像匹配的过程可以与将进行背景替换后的目标图像与第一专利文献中的附图进行图像匹配的过程一并进行,即后续获得的第二目标附图和第一目标附图可以同时用于获取对应的专利文献,此时,可以获取得到对应的第二专利文献和第一专利文献,例如获得附图为灰度或彩色图片的外观专利文献和附图为轮廓线条图的发明专利文献。
可选地,将目标图像进行灰度化处理后与第一专利文献中的附图进行图像匹配之前还可以包括:
获取用户输入的区域选取指令,并在目标图像上选取与区域选取指令对应的区域图像;将区域图像替换为第一图像;第一图像的大小和形状与区域图像一致,且第一图像的颜色与区域图像邻接的区域一致。可以理解的是,当目标图像中的主体目标上贴覆有标签或商品标识等可能遮挡住主体目标的物品时,由于标签或商品标识的颜色通常与主体目标有较大区别,为了尽可能地避免标签或商品标识对后续的图像匹配产生影响,提高图像匹配的准确率,可以获取到用户输入的区域选取指令,并根据该指令将所选取的区域替换为主体目标一致的颜色
具体的,将区域图像替换为第一图像之前可以包括:
根据区域图像的大小和形状生成空白的第一图像;获取区域图像的边缘所邻接的图像的所有像素点,并计算所有像素点的色彩数值,获得色彩数值所占比例最高的第一像素点;将第一像素点填充满空白的第一图像,获得第一图像,以使得第一图像的颜色与区域图像邻接的区域一致。可以理解的是,用户可以在拍照获得的图像或从本地上传的图像上通过触屏或鼠标控制等操作,选取一定的区域(区域内包含了有可能影响图像匹配的标签或商品标识)以形成区域图像(即图像中用户所选中的区域块),然后后台处理端可以根据区域图像的大小和形状生成空白的第一图像。为了将用户选中的贴覆有标签或商品标识的区域替换为主体目标未贴覆标签或商品标识前的样子,可以认为区域图像的边缘所邻接的部分为主体目标的未贴覆标签或商品标识前的部分(如空调外壳面板的标识周围即为空调正常的外壳面板的样子),因此,此时可以获取区域图像的边缘所邻接的图像的所有像素点,并计算每个像素点的色彩数值(即计算像素点所对应的RGB数值),获得色彩数值所占比例最高的一种像素点作为第一像素点,即将标签或商品标识边缘周围占比最高的一种颜色的像素点作为该区域未贴覆标签或商品标识前的主体目标的颜色。最后,将第一像素点填充满空白的第一图像,获得第一图像,以使得第一图像的颜色与区域图像邻接的区域一致。
请参阅图3,图3为本发明实施例提供的一种基于卷积神经网络的专利文献获取系统的结构示意图。
本发明实施例提供的一种基于卷积神经网络的专利文献获取系统,包括:
训练模块301,用于获取预置图像数据库,并将预置图像数据库中的图像输入预设的卷积神经网络进行训练,获得训练好的卷积神经网络模型;预设的卷积神经网络由一个线性映射和一个包含了多个卷积层的非线性映射构成,多个卷积层中的每个卷积层包含有多个卷积核,多个卷积核包含有1*1卷积核、3*3卷积核以及5*5卷积核。
识别模块302,用于获取目标图像,通过训练好的卷积神经网络模型对目标图像进行图像识别,并获得目标图像中的主体目标的名称。
检索模块303,用于将主体目标的名称作为关键词,在预置的专利数据库中检索与关键词对应的第一专利文献。
图像匹配模块304,用于将目标图像进行灰度化处理后与第一专利文献中的附图进行图像匹配,获得与进行灰度化处理后的目标图像匹配的第一目标附图。可选地,将目标图像进行灰度化处理后与第一专利文献中的附图进行图像匹配之前还可以包括:将第一专利文献中的附图的大小转换为与目标图像一致。
显示模块305,用于获取第一目标附图对应的第二专利文献,并将第二专利文献进行显示。可选地,还可以根据目标附图与进行灰度化处理后的目标图像之间的匹配度大小进行排序,并将第二专利文献根据排序后的顺序进行显示。
进一步地,基于卷积神经网络的专利文献获取系统还可以包括有:
背景替换模块,用于将目标图像进行边缘检测,识别并分离出目标图像的前景和背景,并将目标图像的背景替换为白色背景;其中,目标图像的前景包括有主体目标。
进一步地,基于卷积神经网络的专利文献获取系统还可以包括有:
字符识别模块,用于对进行背景替换后的目标图像进行字符识别,获得识别文字;将识别文字作为申请人关键词在第一专利文献中筛选出与申请人关键词对应的专利文献,获得新的第一专利文献;将目标图像进行灰度化处理后与第一专利文献中的附图进行图像匹配具体为将进行背景替换后的目标图像与新的第一专利文献中的附图进行图像匹配。
进一步地,基于卷积神经网络的专利文献获取系统还可以包括有:
线条提取模块,用于对进行背景替换后的目标图像进行轮廓线条提取,获得由轮廓线条构成的二值化图像;将二值化图像与第一专利文献中的附图进行图像匹配,获得与二值化图像匹配的第二目标附图;获取第二目标附图对应的第三专利文献,并将第三专利文献进行显示。
进一步地,基于卷积神经网络的专利文献获取系统还可以包括有:
区域选取模块,用于获取用户输入的区域选取指令,并在目标图像上选取与区域选取指令对应的区域图像;将区域图像替换为第一图像;第一图像的大小和形状与区域图像一致,且第一图像的颜色与区域图像邻接的区域一致。
进一步地,基于卷积神经网络的专利文献获取系统还可以包括有:
根据区域图像的大小和形状生成空白的第一图像;获取区域图像的边缘所邻接的图像的所有像素点,并计算所有像素点的色彩数值,获得色彩数值所占比例最高的第一像素点;将第一像素点填充满空白的第一图像,获得第一图像,以使得第一图像的颜色与区域图像邻接的区域一致。
进一步地,检索模块还可以用于:
根据主体目标的名称确定主体目标的所属领域,并获取对应的分类号;将主体目标的名称作为关键词,在预置的专利数据库中检索与关键词以及分类号对应的第一专利文献。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (10)
1.一种基于卷积神经网络的专利文献获取方法,其特征在于,包括:
获取预置图像数据库,并将所述预置图像数据库中的图像输入预设的卷积神经网络进行训练,获得训练好的卷积神经网络模型;
所述预设的卷积神经网络由一个线性映射和一个包含了多个卷积层的非线性映射构成,所述多个卷积层中的每个卷积层包含有多个卷积核,所述多个卷积核包含有1*1卷积核、3*3卷积核以及5*5卷积核;
获取目标图像,通过所述训练好的卷积神经网络模型对所述目标图像进行图像识别,并获得所述目标图像中的主体目标的名称;
将所述主体目标的名称作为关键词,在预置的专利数据库中检索与所述关键词对应的第一专利文献;
将所述目标图像进行灰度化处理后与所述第一专利文献中的附图进行图像匹配,获得与进行灰度化处理后的目标图像匹配的第一目标附图;
获取所述第一目标附图对应的第二专利文献,并将所述第二专利文献进行显示。
2.根据权利要求1所述的基于卷积神经网络的专利文献获取方法,其特征在于,所述通过所述训练好的卷积神经网络模型对所述目标图像进行图像识别具体包括:
通过训练好的卷积神经网络模型对所述目标图像进行特征提取,并计算出经过所述多个卷积层进行传递之后获得的残差;
对所述多个卷积层之间的特征残差进行降维处理后融合,获得融合后的特征表达;
利用分类器对所述特征表达进行图像分类。
3.根据权利要求1所述的基于卷积神经网络的专利文献获取方法,其特征在于,进行图像匹配的过程具体包括:
对进行灰度化处理后的目标图像进行像素点的灰度值求和,并计算所述灰度化处理后的目标图像在不同位置下覆盖所述第一专利文献中的附图的每个像素点的灰度值之和是否位于预设值以及所述灰度化处理后的目标图像的像素点的求和值之间;
若是,则对当前位置下的目标图像以及附图的像素点的灰度值进行逻辑运算,并对运算结果进行卷积求和;
对卷积求和获得的结果进行归一化处理得到互相关度量。
4.根据权利要求1所述的基于卷积神经网络的专利文献获取方法,其特征在于,所述将所述目标图像进行灰度化处理后与所述第一专利文献中的附图进行图像匹配之前还包括:
将所述目标图像进行边缘检测,识别并分离出所述目标图像的前景和背景,并将所述目标图像的背景替换为白色背景;
所述目标图像的前景包括有所述主体目标。
5.根据权利要求4所述的基于卷积神经网络的专利文献获取方法,其特征在于,所述将所述目标图像的背景替换为白色背景之后还包括:
对进行背景替换后的目标图像进行字符识别,获得识别文字;
将所述识别文字作为申请人关键词在所述第一专利文献中筛选出与所述申请人关键词对应的专利文献,获得新的第一专利文献;
所述将所述目标图像进行灰度化处理后与所述第一专利文献中的附图进行图像匹配具体为将所述进行背景替换后的目标图像与所述新的第一专利文献中的附图进行图像匹配。
6.根据权利要求4所述的基于卷积神经网络的专利文献获取方法,其特征在于,所述将所述目标图像的背景替换为白色背景之后还包括:
对进行背景替换后的目标图像进行轮廓线条提取,获得由轮廓线条构成的二值化图像;
将所述二值化图像与所述第一专利文献中的附图进行图像匹配,获得与所述二值化图像匹配的第二目标附图;
获取所述第二目标附图对应的第三专利文献,并将所述第三专利文献进行显示。
7.根据权利要求6所述的基于卷积神经网络的专利文献获取方法,其特征在于,所述将所述目标图像进行灰度化处理后与所述第一专利文献中的附图进行图像匹配之前还包括:
获取用户输入的区域选取指令,并在所述目标图像上选取与所述区域选取指令对应的区域图像;
将所述区域图像替换为第一图像;
所述第一图像的大小和形状与所述区域图像一致,且所述第一图像的颜色与所述区域图像邻接的区域一致。
8.根据权利要求7所述的基于卷积神经网络的专利文献获取方法,其特征在于,将所述区域图像替换为第一图像之前还包括:
根据所述区域图像的大小和形状生成空白的第一图像;
获取所述区域图像的边缘所邻接的图像的所有像素点,并计算所述所有像素点的色彩数值,获得色彩数值所占比例最高的第一像素点;
将所述第一像素点填充满所述空白的第一图像,获得第一图像,以使得所述第一图像的颜色与所述区域图像邻接的区域一致。
9.根据权利要求1所述的基于卷积神经网络的专利文献获取方法,其特征在于,所述将所述主体目标的名称作为关键词,在预置的专利数据库中检索与所述关键词对应的第一专利文献还包括:
根据所述主体目标的名称确定所述主体目标的所属领域,并获取对应的分类号;
将所述主体目标的名称作为关键词,在预置的专利数据库中检索与所述关键词以及所述分类号对应的第一专利文献。
10.一种基于卷积神经网络的专利文献获取系统,其特征在于,包括:
训练模块,用于获取预置图像数据库,并将所述预置图像数据库中的图像输入预设的卷积神经网络进行训练,获得训练好的卷积神经网络模型;
所述预设的卷积神经网络由一个线性映射和一个包含了多个卷积层的非线性映射构成,所述多个卷积层中的每个卷积层包含有多个卷积核,所述多个卷积核包含有1*1卷积核、3*3卷积核以及5*5卷积核;
识别模块,用于获取目标图像,通过所述训练好的卷积神经网络模型对所述目标图像进行图像识别,并获得所述目标图像中的主体目标的名称;
检索模块,用于将所述主体目标的名称作为关键词,在预置的专利数据库中检索与所述关键词对应的第一专利文献;
图像匹配模块,用于将所述目标图像进行灰度化处理后与所述第一专利文献中的附图进行图像匹配,获得与进行灰度化处理后的目标图像匹配的第一目标附图;
显示模块,用于获取所述第一目标附图对应的第二专利文献,并将所述第二专利文献进行显示。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810123760.XA CN108984576A (zh) | 2018-02-07 | 2018-02-07 | 一种基于卷积神经网络的专利文献获取方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810123760.XA CN108984576A (zh) | 2018-02-07 | 2018-02-07 | 一种基于卷积神经网络的专利文献获取方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN108984576A true CN108984576A (zh) | 2018-12-11 |
Family
ID=64541705
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810123760.XA Pending CN108984576A (zh) | 2018-02-07 | 2018-02-07 | 一种基于卷积神经网络的专利文献获取方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108984576A (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109885715A (zh) * | 2019-01-25 | 2019-06-14 | 杭州凡闻科技有限公司 | 信息处理方法和系统 |
CN110321868A (zh) * | 2019-07-10 | 2019-10-11 | 杭州睿琪软件有限公司 | 对象识别及显示的方法及系统 |
CN110442759A (zh) * | 2019-07-25 | 2019-11-12 | 深圳供电局有限公司 | 一种知识检索方法及其系统、计算机设备和可读存储介质 |
CN115129825A (zh) * | 2022-08-25 | 2022-09-30 | 广东知得失网络科技有限公司 | 一种专利信息推送方法及系统 |
CN118035533A (zh) * | 2022-11-11 | 2024-05-14 | 重庆博腾药业有限公司 | 文献数据库构建方法、装置及计算机可读存储介质 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103617625A (zh) * | 2013-12-13 | 2014-03-05 | 中国气象局北京城市气象研究所 | 一种图像匹配方法及图像匹配装置 |
CN106528826A (zh) * | 2016-11-18 | 2017-03-22 | 广东技术师范学院 | 一种基于深度学习的多视图外观专利图像检索方法 |
WO2017067456A1 (zh) * | 2015-10-20 | 2017-04-27 | 华中科技大学 | 一种识别图像中的字符串的方法和装置 |
CN106650781A (zh) * | 2016-10-21 | 2017-05-10 | 广东工业大学 | 一种卷积神经网络图像识别方法及装置 |
CN107239780A (zh) * | 2017-04-29 | 2017-10-10 | 安徽慧视金瞳科技有限公司 | 一种多特征融合的图像匹配方法 |
CN107330127A (zh) * | 2017-07-21 | 2017-11-07 | 湘潭大学 | 一种基于文本图片检索的相似文本检测方法 |
-
2018
- 2018-02-07 CN CN201810123760.XA patent/CN108984576A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103617625A (zh) * | 2013-12-13 | 2014-03-05 | 中国气象局北京城市气象研究所 | 一种图像匹配方法及图像匹配装置 |
WO2017067456A1 (zh) * | 2015-10-20 | 2017-04-27 | 华中科技大学 | 一种识别图像中的字符串的方法和装置 |
CN106650781A (zh) * | 2016-10-21 | 2017-05-10 | 广东工业大学 | 一种卷积神经网络图像识别方法及装置 |
CN106528826A (zh) * | 2016-11-18 | 2017-03-22 | 广东技术师范学院 | 一种基于深度学习的多视图外观专利图像检索方法 |
CN107239780A (zh) * | 2017-04-29 | 2017-10-10 | 安徽慧视金瞳科技有限公司 | 一种多特征融合的图像匹配方法 |
CN107330127A (zh) * | 2017-07-21 | 2017-11-07 | 湘潭大学 | 一种基于文本图片检索的相似文本检测方法 |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109885715A (zh) * | 2019-01-25 | 2019-06-14 | 杭州凡闻科技有限公司 | 信息处理方法和系统 |
CN110321868A (zh) * | 2019-07-10 | 2019-10-11 | 杭州睿琪软件有限公司 | 对象识别及显示的方法及系统 |
WO2021004319A1 (zh) * | 2019-07-10 | 2021-01-14 | 杭州睿琪软件有限公司 | 对象识别及显示的方法及系统 |
US11853368B2 (en) | 2019-07-10 | 2023-12-26 | Hangzhou Glority Software Limited | Method and system for identifying and displaying an object |
CN110321868B (zh) * | 2019-07-10 | 2024-09-24 | 杭州睿琪软件有限公司 | 对象识别及显示的方法及系统 |
CN110442759A (zh) * | 2019-07-25 | 2019-11-12 | 深圳供电局有限公司 | 一种知识检索方法及其系统、计算机设备和可读存储介质 |
CN110442759B (zh) * | 2019-07-25 | 2022-05-13 | 深圳供电局有限公司 | 一种知识检索方法及其系统、计算机设备和可读存储介质 |
CN115129825A (zh) * | 2022-08-25 | 2022-09-30 | 广东知得失网络科技有限公司 | 一种专利信息推送方法及系统 |
CN118035533A (zh) * | 2022-11-11 | 2024-05-14 | 重庆博腾药业有限公司 | 文献数据库构建方法、装置及计算机可读存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108984576A (zh) | 一种基于卷积神经网络的专利文献获取方法及系统 | |
Cetinic et al. | A deep learning perspective on beauty, sentiment, and remembrance of art | |
CN107993191B (zh) | 一种图像处理方法和装置 | |
Gao et al. | The deep features and attention mechanism-based method to dish healthcare under social IoT systems: An empirical study with a hand-deep local–global net | |
KR102102161B1 (ko) | 이미지 내 객체의 대표 특성을 추출하는 방법, 장치 및 컴퓨터 프로그램 | |
CN104346370B (zh) | 图像搜索、获取图像文本信息的方法及装置 | |
CN106599925A (zh) | 一种基于深度学习的植物叶片识别系统与方法 | |
CN112348117B (zh) | 场景识别方法、装置、计算机设备和存储介质 | |
CN102831200A (zh) | 一种基于图像文字识别的商品推送方法和装置 | |
CN102750385B (zh) | 基于标签检索的相关性—质量排序图像检索方法 | |
CN106096542B (zh) | 基于距离预测信息的图像视频场景识别方法 | |
CN103988202A (zh) | 基于索引和搜索的图像吸引力 | |
CN101706780A (zh) | 一种基于视觉注意力模型的图像语义检索方法 | |
CN106875203A (zh) | 一种确定商品图片的款式信息的方法及装置 | |
CN112651333B (zh) | 静默活体检测方法、装置、终端设备和存储介质 | |
CN110413816A (zh) | 彩色草图图像搜索 | |
CN108492160A (zh) | 信息推荐方法和装置 | |
CN105303418A (zh) | 一种选址方法和装置 | |
CN110008912B (zh) | 一种基于植物识别的社交平台匹配方法和系统 | |
CN103793717A (zh) | 判断图像主体显著性及训练其分类器的方法和系统 | |
CN108985285A (zh) | 一种基于机器识别的商品专利获取方法及系统 | |
CN111488940A (zh) | 一种基于深度卷积神经网络的航标图像智能分类方法 | |
CN107977948A (zh) | 一种面向社群图像的显著图融合方法 | |
CN109948702A (zh) | 一种基于卷积神经网络的服装分类和推荐模型 | |
Song et al. | Depth-aware saliency detection using discriminative saliency fusion |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20181211 |
|
RJ01 | Rejection of invention patent application after publication |