CN111598105A - 一种专利地图构建方法及装置 - Google Patents

一种专利地图构建方法及装置 Download PDF

Info

Publication number
CN111598105A
CN111598105A CN202010253625.4A CN202010253625A CN111598105A CN 111598105 A CN111598105 A CN 111598105A CN 202010253625 A CN202010253625 A CN 202010253625A CN 111598105 A CN111598105 A CN 111598105A
Authority
CN
China
Prior art keywords
image information
information
training model
output
training
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN202010253625.4A
Other languages
English (en)
Inventor
黄�良
吴建蓉
申彧
徐梅梅
高正浩
李冶
詹乐贵
蒋友权
刘昌宏
杨涛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guizhou Power Grid Co Ltd
Original Assignee
Guizhou Power Grid Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guizhou Power Grid Co Ltd filed Critical Guizhou Power Grid Co Ltd
Priority to CN202010253625.4A priority Critical patent/CN111598105A/zh
Publication of CN111598105A publication Critical patent/CN111598105A/zh
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/46Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
    • G06V10/462Salient features, e.g. scale invariant feature transforms [SIFT]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种专利地图构建方法及装置,所述方法包括:获得初始图像信息,所述初始图像信息为专利说明书扉页的图像信息;将所述初始图像信息输入训练模型,其中,所述训练模型通过多组训练数据训练获得,所述多组中的训练数据中的每一组训练数据均包括:所述初始图像信息、训练模型预定规则条件;获得所述训练模型的输出信息,其中,所述输出信息包括输出图像信息,其中所述输出图像信息包含符合所述训练模型预定规则条件的图像信息;根据所述输出图像信息,构建专利地图信息。达到了能够快速、准确的直接通过机器学习将专利说明书扉页的图像信息进行分类,从而构建专利地图,其过程具有准确度高且速度快的技术效果。

Description

一种专利地图构建方法及装置
技术领域
本申请涉及信息处理技术领域,尤其涉及一种专利地图构建方法及装置。
背景技术
知识产权目前成为企业发展的重中之重,其中,专利地图为企业指明技术发展方向,总结并分析技术分布态势,特别可以用于对竞争对手专利技术分布情况进行监视,将使企业做到知己知彼。企业不仅将专利地图用于进行知识产权管理,而且还应用于营销管理与技术创新管理。很多企业制作行业的专利地图作为指引自己研发和竞争方向的依据和研究对手的工具。
但本申请发明人在实现本申请实施例中技术方案的过程中,发现上述现有技术至少存在如下技术问题:
现有技术中无法快速、准确的制作专利地图的技术问题。
申请内容
本申请实施例通过提供一种专利地图构建方法及装置,用以解决现有技术中无法快速、准确的制作专利地图的技术问题。
为了解决上述问题,第一方面,本申请实施例提供了一种专利地图构建方法,所述方法包括:获得初始图像信息,所述初始图像信息为专利说明书扉页的图像信息;对所述初始图像信息进行特征提取,获得第一识别区域,所述第一识别区域包含专利有效信息;将所述第一识别区域输入训练模型,其中,所述训练模型通过多组训练数据训练获得,所述多组中的训练数据中的每一组训练数据均包括:所述第一识别区域、训练模型预定规则条件;获得所述训练模型的输出信息,其中,所述输出信息包括输出图像信息,其中所述输出图像信息包含符合所述训练模型预定规则条件的图像信息;根据所述输出图像信息,构建专利地图信息。
优选的,所述方法包括:获得构建专利地图的类别信息;根据所述类别信息,获得训练模型预定规则条件,其中,所述训练模型预定规则条件包括第一预定规则条件、第二预定规则条件、第三预定规则条件中的一种或多种;将所述练模型预定规则条件作为监督数据,输入所述每一组训练数据中。
优选的,所述根据所述输出图像信息,构建专利地图信息,包括:所述输出图像信息包括第一图像信息、第二图像信息和第三图像信息,其中,所述第一图像信息为包含符合第一预定规则条件的图像信息,所述第二图像信息为包含符合第二预定规则条件的图像信息,所述第三图像信息为包含符合第三预定规则条件的图像信息;根据所述第一图像信息、所述第二图像信息和所述第三图像信息,构建专利地图信息。
优选的,在所述根据所述输出图像信息,构建专利地图信息之前,包括:对所述输出图像信息进行有效性验证;判断所述输出图像信息是否通过所述有效性验证,获得验证结果;根据所述验证结果,对所述输出图像信息进行过滤。
优选的,所述判断所述输出图像信息是否通过所述有效性验证之后,包括:如果所述验证结果为所述输出图像信息未通过所述有效性验证,删除所述输出图像信息。
优选的,所述根据所述验证结果,对所述输出图像信息进行过滤,包括:如果所述验证结果为所述输出图像信息通过所述有效性验证,根据所述输出图像信息,构建专利地图信息。
优选的,所述获得初始图像信息,包括:通过所述特征提取层,对所述初始图像信息进行特征提取,获得所述第一识别区域,所述第一识别区域包含专利有效信息。
第二方面,本申请实施例还提供了一种专利地图构建装置,其特征在于,所述装置包括:
第一获得单元,所述第一获得单元用于获得初始图像信息,所述初始图像信息为专利说明书扉页的图像信息;
第一提取单元,所述第一提取单元用于对所述初始图像信息进行特征提取,获得第一识别区域,所述第一识别区域包含专利有效信息;
第一训练单元,所述第一训练单元用于将所述第一识别区域输入训练模型,其中,所述训练模型通过多组训练数据训练获得,所述多组中的训练数据中的每一组训练数据均包括:所述第一识别区域、训练模型预定规则条件;
第二获得单元,所述第二获得单元用于获得所述训练模型的输出信息,其中,所述输出信息包括输出图像信息,其中所述输出图像信息包含符合所述训练模型预定规则条件的图像信息;
第一构建单元,所述第一构建单元用于根据所述输出图像信息,构建专利地图信息。
优选的,所述装置还包括:
第三获得单元,所述第三获得单元用于获得构建专利地图的类别信息;
第四获得单元,所述第四获得单元用于根据所述类别信息,获得训练模型预定规则条件,其中,所述训练模型预定规则条件包括第一预定规则条件、第二预定规则条件、第三预定规则条件中的一种或多种;
第一输入单元,所述第一输入单元用于将所述练模型预定规则条件作为监督数据,输入所述每一组训练数据中。
优选的,所述装置还包括:
第一输出单元,所述第一输出单元用于所述输出图像信息包括第一图像信息、第二图像信息和第三图像信息,其中,所述第一图像信息为包含符合第一预定规则条件的图像信息,所述第二图像信息为包含符合第二预定规则条件的图像信息,所述第三图像信息为包含符合第三预定规则条件的图像信息;
第二构建单元,所述第二构建单元用于根据所述第一图像信息、所述第二图像信息和所述第三图像信息,构建专利地图信息。
优选的,所述装置还包括:
第一验证单元,所述第一验证单元用于对所述输出图像信息进行有效性验证;
第一判断单元,所述第一判断单元用于判断所述输出图像信息是否通过所述有效性验证,获得验证结果;
第一过滤单元,所述第一过滤单元用于根据所述验证结果,对所述输出图像信息进行过滤。
优选的,所述装置还包括:
第一删除单元,所述第一删除单元用于如果所述验证结果为所述输出图像信息未通过所述有效性验证,删除所述输出图像信息。
优选的,所述装置还包括:
第二构建单元,所述第二构建单元用于如果所述验证结果为所述输出图像信息通过所述有效性验证,根据所述输出图像信息,构建专利地图信息。
优选的,所述装置还包括:
第五获得单元,所述第五获得单元用于通过所述特征提取层,对所述初始图像信息进行特征提取,获得所述第一识别区域,所述第一识别区域包含专利有效信息。
第三方面,本申请实施例还提供了一种专利地图构建装置,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现以下步骤:获得初始图像信息,所述初始图像信息为专利说明书扉页的图像信息;对所述初始图像信息进行特征提取,获得第一识别区域,所述第一识别区域包含专利有效信息;将所述第一识别区域输入训练模型,其中,所述训练模型通过多组训练数据训练获得,所述多组中的训练数据中的每一组训练数据均包括:所述第一识别区域、训练模型预定规则条件;获得所述训练模型的输出信息,其中,所述输出信息包括输出图像信息,其中所述输出图像信息包含符合所述训练模型预定规则条件的图像信息;根据所述输出图像信息,构建专利地图信息。
第四方面,本申请实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现以下步骤:获得初始图像信息,所述初始图像信息为专利说明书扉页的图像信息;对所述初始图像信息进行特征提取,获得第一识别区域,所述第一识别区域包含专利有效信息;将所述第一识别区域输入训练模型,其中,所述训练模型通过多组训练数据训练获得,所述多组中的训练数据中的每一组训练数据均包括:所述第一识别区域、训练模型预定规则条件;获得所述训练模型的输出信息,其中,所述输出信息包括输出图像信息,其中所述输出图像信息包含符合所述训练模型预定规则条件的图像信息;根据所述输出图像信息,构建专利地图信息。
本申请实施例中的上述一个或多个技术方案,至少具有如下一种或多种技术效果:
本申请实施例通过提供一种专利地图构建方法及装置,所述方法包括:获得初始图像信息,所述初始图像信息为专利说明书扉页的图像信息;对所述初始图像信息进行特征提取,获得第一识别区域,所述第一识别区域包含专利有效信息;将所述第一识别区域输入训练模型,其中,所述训练模型通过多组训练数据训练获得,所述多组中的训练数据中的每一组训练数据均包括:所述第一识别区域、训练模型预定规则条件;获得所述训练模型的输出信息,其中,所述输出信息包括输出图像信息,其中所述输出图像信息包含符合所述训练模型预定规则条件的图像信息;根据所述输出图像信息,构建专利地图信息。解决了现有技术中无法快速、准确的制作专利地图的技术问题。达到了能够快速、准确的直接通过机器学习将专利说明书扉页的图像信息进行分类,从而构建专利地图,其过程具有准确度高且速度快的技术效果。
上述说明仅是本申请技术方案的概述,为了能够更清楚了解本申请的技术手段,而可依照说明书的内容予以实施,并且为了让本申请的上述和其它目的、特征和优点能够更明显易懂,以下特举本申请的具体实施方式。
附图说明
图1为本发明实施例中一种专利地图构建方法的流程示意图;
图2为本发明实施例中一种专利地图构建装置的结构示意图;
图3为本发明实施例中另一种专利地图构建装置的结构示意图。
附图标记说明:第一获得单元11,第一提取单元12,第一训练单元13,第二获得单元14,第一构建单元15,总线300,接收器301,处理器302,发送器303,存储器304,总线接口306。
具体实施方式
本申请实施例提供了一种专利地图构建方法及装置,解决了现有技术中无法快速、准确的制作专利地图的技术问题。
为了解决上述技术问题,本申请提供的技术方案总体思路如下:通过获得初始图像信息,所述初始图像信息为专利说明书扉页的图像信息;对所述初始图像信息进行特征提取,获得第一识别区域,所述第一识别区域包含专利有效信息;将所述第一识别区域输入训练模型,其中,所述训练模型通过多组训练数据训练获得,所述多组中的训练数据中的每一组训练数据均包括:所述第一识别区域、训练模型预定规则条件;获得所述训练模型的输出信息,其中,所述输出信息包括输出图像信息,其中所述输出图像信息包含符合所述训练模型预定规则条件的图像信息;根据所述输出图像信息,构建专利地图信息。达到了能够快速、准确的直接通过机器学习将专利说明书扉页的图像信息进行分类,从而构建专利地图,其过程具有准确度高且速度快的技术效果。
下面通过附图以及具体实施例对本申请技术方案做详细的说明,应当理解本申请实施例以及实施例中的具体特征是对本申请技术方案的详细的说明,而不是对本申请技术方案的限定,在不冲突的情况下,本申请实施例以及实施例中的技术特征可以相互组合。
实施例一
图1为本发明实施例中一种专利地图构建方法的流程示意图,所述方法包括:
步骤110:获得初始图像信息,所述初始图像信息为专利说明书扉页的图像信息;
具体而言,专利说明书中的扉页是揭示每件专利的基本信息的文件部分。扉页揭示的基本专利信息包括:专利申请的时间、申请的号码、申请人或专利权人、发明人、发明创造名称、发明创造简要介绍及主图(机械图、电路图、化学结构式等——如果有的话)、发明所属技术领域分类号、公布或授权的时间、文献号、出版专利文件的国家机构等。所述初始图像信息即采集专利说明书的扉页图像信息。
步骤120:对所述初始图像信息进行特征提取,获得第一识别区域,所述第一识别区域包含专利有效信息;
进一步的,通过所述特征提取层,对所述初始图像信息进行特征提取,获得所述第一识别区域,所述第一识别区域包含专利有效信息。
具体而言,从仿真图像类型来说,可以是拍摄静态图像或者视频帧序列的视频图像,可以是检测装置获得的信号走势图,也可以是合成的图像等。第一识别区域是对获得的初始图像信息进行特征提取所获得的,根据实际应用的需要,第一识别区域可以为一个或者多个,从提取获得的第一识别区域中进行信息特征提取,对于本申请实施例而言,第一识别区域可以是包含专利有效信息的区域,通过特征提取的方式将专利有效信息的区域提取出来。针对每个专利有效信息区域中感兴趣区域的特征提取,可以仅对感兴趣区域进行训练,从而达到提高训练效率的效果。
具体而言,对待识别仿真图像进行特征提取和特征向量获取,通过神经网络模型进行实现,神经网络模型可以是任意适当的可实现特征提取或目标对象识别的神经网络,包括但不限于卷积神经网络、增强学习神经网络、对抗神经网络中的生成网络等等。神经网络模型包括特征提取层,也可以根据实际需要进行部分调整,其中特征提取层可为卷积神经网络,待识别仿真图像经过特征提取层获得待识别仿真图像的第一识别区域,从所述第一识别区域中获得专利有效信息。
步骤130:将所述第一识别区域输入训练模型,其中,所述训练模型通过多组训练数据训练获得,所述多组中的训练数据中的每一组训练数据均包括:所述第一识别区域、训练模型预定规则条件;
优选的,所述方法包括:获得构建专利地图的类别信息;根据所述类别信息,获得训练模型预定规则条件,其中,所述训练模型预定规则条件包括第一预定规则条件、第二预定规则条件、第三预定规则条件中的一种或多种;将所述练模型预定规则条件作为监督数据,输入所述每一组训练数据中。
步骤140:获得所述训练模型的输出信息,其中,所述输出信息包括输出图像信息,其中所述输出图像信息包含符合所述训练模型预定规则条件的图像信息;
具体而言,训练模型即机器学习中的神经网络模型,神经网络(Neural Networks,NN)是由大量的、简单的处理单元(称为神经元)广泛地互相连接而形成的复杂网络系统,它反映了人脑功能的许多基本特征,是一个高度复杂的非线性动力学习系统。神经网络具有大规模并行、分布式存储和处理、自组织、自适应和自学能力,特别适合处理需要同时考虑许多因素和条件的、不精确和模糊的信息处理问题。神经网络模型是以神经元的数学模型为基础来描述的。人工神经网络(ArtificialNuearlNewtokr)s,是对人类大脑系统的一阶特性的一种描。简单地讲,它是一个数学模型。神经网络模型由网络拓扑.节点特点和学习规则来表示。本申请实施例中,将具有专利信息的专利说明书扉页的图像信息作为输入信息输入神经网络模型,并通过所述训练模型预定规则条件作为监督数据,对输入数据进行训练,获得符合预定规则条件的输出信息。
其中,所述训练模型预定规则条件可以包括多种,即包括第一预定规则条件、第二预定规则条件、第三预定规则条件中的一种或多种,具体可以根据专利地图绘制所需的信息进行选择,例如专利申请的时间、申请的号码、申请人或专利权人、发明人、发明创造名称等不同的类别。所述输出图像信息为符合预定条件规则的图像信息,例如,预定条件规则为专利申请的时间、申请的号码、申请人,则输出图像信息为分别包含专利申请时间的图像信息、包含申请号的图像信息以及包含申请人的图像信息三类。
步骤150:根据所述输出图像信息,构建专利地图信息。
优选的,所述根据所述输出图像信息,构建专利地图信息,包括:所述输出图像信息包括第一图像信息、第二图像信息和第三图像信息,其中,所述第一图像信息为包含符合第一预定规则条件的图像信息,所述第二图像信息为包含符合第二预定规则条件的图像信息,所述第三图像信息为包含符合第三预定规则条件的图像信息;根据所述第一图像信息、所述第二图像信息和所述第三图像信息,构建专利地图信息。
具体而言,如上所述第一图像信息可以是包含专利申请时间的图像信息,第二图像信息可以是包含专利号的图像信息,第三图像信息可以是包含申请人的图像信息,其中,预定规则条件可以包含第一预定条件规则、第二预定规则条件、第三预定规则条件中的一种或多种,即可以包含若干种预定规则条件,具体情况取决于实际绘制专利地图时所需要的信息种类情况。最后根据从神经网络模型中输出的不同种类信息的图像信息,绘制出专利地图,即将相同类别的图像信息作为输入数据,搭载绘图制表工具,从而得到包含所需专利信息的专利地图。达到了能够快速、准确的直接通过机器学习将专利说明书扉页的图像信息进行分类,从而构建专利地图,其过程具有准确度高且速度快的技术效果。
优选的,在所述根据所述输出图像信息,构建专利地图信息之前,包括:对所述输出图像信息进行有效性验证;判断所述输出图像信息是否通过所述有效性验证,获得验证结果;根据所述验证结果,对所述输出图像信息进行过滤。如果所述验证结果为所述输出图像信息未通过所述有效性验证,删除所述输出图像信息。如果所述验证结果为所述输出图像信息通过所述有效性验证,根据所述输出图像信息,构建专利地图信息。
具体而言,为了他确保训练模型输出数据的准确性,对输出图像是否有效进行验证,验证规则可以包括输出图显示的图像的大小规格以及图像的内容通过文本识别判断其内容是否符合预定规则条件,如果符合验证规则则认为输出图像信息有效,如果不符合验证规则,则认为输出图像信息无效,将无效的输出图像信息删除掉,保证输出图像信息的有效性,从而提高专利地图绘制的准确性。
实施例二
基于与前述实施例中一种专利地图构建方法同样的发明构思,本发明还提供一种专利地图构建装置,如图2所示,所述装置包括:
第一获得单元11,所述第一获得单元11用于获得初始图像信息,所述初始图像信息为专利说明书扉页的图像信息;
第一提取单元12,所述第一提取单元12用于对所述初始图像信息进行特征提取,获得第一识别区域,所述第一识别区域包含专利有效信息;
第一训练单元13,所述第一训练单元13用于将所述第一识别区域输入训练模型,其中,所述训练模型通过多组训练数据训练获得,所述多组中的训练数据中的每一组训练数据均包括:所述第一识别区域、训练模型预定规则条件;
第二获得单元14,所述第二获得单元14用于获得所述训练模型的输出信息,其中,所述输出信息包括输出图像信息,其中所述输出图像信息包含符合所述训练模型预定规则条件的图像信息;
第一构建单元15,所述第一构建单元15用于根据所述输出图像信息,构建专利地图信息。
优选的,所述装置还包括:
第三获得单元,所述第三获得单元用于获得构建专利地图的类别信息;
第四获得单元,所述第四获得单元用于根据所述类别信息,获得训练模型预定规则条件,其中,所述训练模型预定规则条件包括第一预定规则条件、第二预定规则条件、第三预定规则条件中的一种或多种;
第一输入单元,所述第一输入单元用于将所述练模型预定规则条件作为监督数据,输入所述每一组训练数据中。
优选的,所述装置还包括:
第一输出单元,所述第一输出单元用于所述输出图像信息包括第一图像信息、第二图像信息和第三图像信息,其中,所述第一图像信息为包含符合第一预定规则条件的图像信息,所述第二图像信息为包含符合第二预定规则条件的图像信息,所述第三图像信息为包含符合第三预定规则条件的图像信息;
第二构建单元,所述第二构建单元用于根据所述第一图像信息、所述第二图像信息和所述第三图像信息,构建专利地图信息。
优选的,所述装置还包括:
第一验证单元,所述第一验证单元用于对所述输出图像信息进行有效性验证;
第一判断单元,所述第一判断单元用于判断所述输出图像信息是否通过所述有效性验证,获得验证结果;
第一过滤单元,所述第一过滤单元用于根据所述验证结果,对所述输出图像信息进行过滤。
优选的,所述装置还包括:
第一删除单元,所述第一删除单元用于如果所述验证结果为所述输出图像信息未通过所述有效性验证,删除所述输出图像信息。
优选的,所述装置还包括:
第二构建单元,所述第二构建单元用于如果所述验证结果为所述输出图像信息通过所述有效性验证,根据所述输出图像信息,构建专利地图信息。
优选的,所述装置还包括:
第五获得单元,所述第五获得单元用于通过所述特征提取层,对所述初始图像信息进行特征提取,获得所述第一识别区域,所述第一识别区域包含专利有效信息。
前述图1实施例一中的一种专利地图构建方法的各种变化方式和具体实例同样适用于本实施例的一种专利地图构建装置,通过前述对一种专利地图构建方法的详细描述,本领域技术人员可以清楚的知道本实施例中一种专利地图构建装置的实施方法,所以为了说明书的简洁,在此不再详述。
实施例三
基于与前述实施例中一种专利地图构建方法同样的发明构思,本发明还提供一种专利地图构建装置,其上存储有计算机程序,该程序被处理器执行时实现前文所述一种专利地图构建方法的任一方法的步骤。
其中,在图3中,总线架构(用总线300来代表),总线300可以包括任意数量的互联的总线和桥,总线300将包括由处理器302代表的一个或多个处理器和存储器304代表的存储器的各种电路链接在一起。总线300还可以将诸如外围设备、稳压器和功率管理电路等之类的各种其他电路链接在一起,这些都是本领域所公知的,因此,本文不再对其进行进一步描述。总线接口306在总线300和接收器301和发送器303之间提供接口。接收器301和发送器303可以是同一个元件,即收发机,提供用于在传输介质上与各种其他装置通信的单元。
处理器302负责管理总线300和通常的处理,而存储器304可以被用于存储处理器302在执行操作时所使用的数据。
实施例四
基于与前述实施例中一种专利地图构建方法同样的发明构思,本发明还提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现以下步骤:
获得初始图像信息,所述初始图像信息为专利说明书扉页的图像信息;对所述初始图像信息进行特征提取,获得第一识别区域,所述第一识别区域包含专利有效信息;将所述第一识别区域输入训练模型,其中,所述训练模型通过多组训练数据训练获得,所述多组中的训练数据中的每一组训练数据均包括:所述第一识别区域、训练模型预定规则条件;获得所述训练模型的输出信息,其中,所述输出信息包括输出图像信息,其中所述输出图像信息包含符合所述训练模型预定规则条件的图像信息;根据所述输出图像信息,构建专利地图信息。
在具体实施过程中,该程序被处理器执行时,还可以实现实施例一中的任一方法步骤。
本申请实施例中的上述一个或多个技术方案,至少具有如下一种或多种技术效果:
本申请实施例通过提供一种专利地图构建方法及装置,所述方法包括:获得初始图像信息,所述初始图像信息为专利说明书扉页的图像信息;对所述初始图像信息进行特征提取,获得第一识别区域,所述第一识别区域包含专利有效信息;将所述第一识别区域输入训练模型,其中,所述训练模型通过多组训练数据训练获得,所述多组中的训练数据中的每一组训练数据均包括:所述第一识别区域、训练模型预定规则条件;获得所述训练模型的输出信息,其中,所述输出信息包括输出图像信息,其中所述输出图像信息包含符合所述训练模型预定规则条件的图像信息;根据所述输出图像信息,构建专利地图信息。解决了现有技术中无法快速、准确的制作专利地图的技术问题。达到了能够快速、准确的直接通过机器学习将专利说明书扉页的图像信息进行分类,从而构建专利地图,其过程具有准确度高且速度快的技术效果。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (10)

1.一种专利地图构建方法,其特征在于,所述方法包括:
获得初始图像信息,所述初始图像信息为专利说明书扉页的图像信息;
对所述初始图像信息进行特征提取,获得第一识别区域,所述第一识别区域包含专利有效信息;
将所述第一识别区域输入训练模型,其中,所述训练模型通过多组训练数据训练获得,所述多组中的训练数据中的每一组训练数据均包括:所述第一识别区域、训练模型预定规则条件;
获得所述训练模型的输出信息,其中,所述输出信息包括输出图像信息,其中所述输出图像信息包含符合所述训练模型预定规则条件的图像信息;
根据所述输出图像信息,构建专利地图信息。
2.如权利要求1所述的方法,其特征在于,所述方法包括:
获得构建专利地图的类别信息;
根据所述类别信息,获得训练模型预定规则条件,其中,所述训练模型预定规则条件包括第一预定规则条件、第二预定规则条件、第三预定规则条件中的一种或多种;
将所述训练模型预定规则条件作为监督数据,输入所述每一组训练数据中。
3.如权利要求2所述的方法,其特征在于,所述根据所述输出图像信息,构建专利地图信息,包括:
所述输出图像信息包括第一图像信息、第二图像信息和第三图像信息,其中,所述第一图像信息为包含符合第一预定规则条件的图像信息,所述第二图像信息为包含符合第二预定规则条件的图像信息,所述第三图像信息为包含符合第三预定规则条件的图像信息;
根据所述第一图像信息、所述第二图像信息和所述第三图像信息,构建专利地图信息。
4.如权利要求1所述的方法,其特征在于,在所述根据所述输出图像信息,构建专利地图信息之前,包括:
对所述输出图像信息进行有效性验证;
判断所述输出图像信息是否通过所述有效性验证,获得验证结果;
根据所述验证结果,对所述输出图像信息进行过滤。
5.如权利要求4所述的方法,其特征在于,所述判断所述输出图像信息是否通过所述有效性验证之后,包括:
如果所述验证结果为所述输出图像信息未通过所述有效性验证,删除所述输出图像信息。
6.如权利要求4所述的方法,其特征在于,所述根据所述验证结果,对所述输出图像信息进行过滤,包括:
如果所述验证结果为所述输出图像信息通过所述有效性验证,根据所述输出图像信息,构建专利地图信息。
7.如权利要求1所述的方法,其特征在于,所述获得初始图像信息,包括:
通过所述特征提取层,对所述初始图像信息进行特征提取,获得所述第一识别区域,所述第一识别区域包含专利有效信息。
8.一种专利地图构建装置,其特征在于,所述装置包括:
第一获得单元,所述第一获得单元用于获得初始图像信息,所述初始图像信息为专利说明书扉页的图像信息;
第一提取单元,所述第一提取单元用于对所述初始图像信息进行特征提取,获得第一识别区域,所述第一识别区域包含专利有效信息;
第一训练单元,所述第一训练单元用于将所述第一识别区域输入训练模型,其中,所述训练模型通过多组训练数据训练获得,所述多组中的训练数据中的每一组训练数据均包括:所述第一识别区域、训练模型预定规则条件;
第二获得单元,所述第二获得单元用于获得所述训练模型的输出信息,其中,所述输出信息包括输出图像信息,其中所述输出图像信息包含符合所述训练模型预定规则条件的图像信息;
第一构建单元,所述第一构建单元用于根据所述输出图像信息,构建专利地图信息。
9.一种专利地图构建装置,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现以下步骤:
获得初始图像信息,所述初始图像信息为专利说明书扉页的图像信息;
对所述初始图像信息进行特征提取,获得第一识别区域,所述第一识别区域包含专利有效信息;
将所述第一识别区域输入训练模型,其中,所述训练模型通过多组训练数据训练获得,所述多组中的训练数据中的每一组训练数据均包括:所述第一识别区域、训练模型预定规则条件;
获得所述训练模型的输出信息,其中,所述输出信息包括输出图像信息,其中所述输出图像信息包含符合所述训练模型预定规则条件的图像信息;
根据所述输出图像信息,构建专利地图信息。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现以下步骤:
获得初始图像信息,所述初始图像信息为专利说明书扉页的图像信息;
对所述初始图像信息进行特征提取,获得第一识别区域,所述第一识别区域包含专利有效信息;
将所述第一识别区域输入训练模型,其中,所述训练模型通过多组训练数据训练获得,所述多组中的训练数据中的每一组训练数据均包括:所述第一识别区域、训练模型预定规则条件;
获得所述训练模型的输出信息,其中,所述输出信息包括输出图像信息,其中所述输出图像信息包含符合所述训练模型预定规则条件的图像信息;
根据所述输出图像信息,构建专利地图信息。
CN202010253625.4A 2020-04-02 2020-04-02 一种专利地图构建方法及装置 Withdrawn CN111598105A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010253625.4A CN111598105A (zh) 2020-04-02 2020-04-02 一种专利地图构建方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010253625.4A CN111598105A (zh) 2020-04-02 2020-04-02 一种专利地图构建方法及装置

Publications (1)

Publication Number Publication Date
CN111598105A true CN111598105A (zh) 2020-08-28

Family

ID=72188643

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010253625.4A Withdrawn CN111598105A (zh) 2020-04-02 2020-04-02 一种专利地图构建方法及装置

Country Status (1)

Country Link
CN (1) CN111598105A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112487780A (zh) * 2020-11-30 2021-03-12 德安(常州)自动化科技有限公司 一种订单数据排版优化方法及系统

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112487780A (zh) * 2020-11-30 2021-03-12 德安(常州)自动化科技有限公司 一种订单数据排版优化方法及系统

Similar Documents

Publication Publication Date Title
CN110147456B (zh) 一种图像分类方法、装置、可读存储介质及终端设备
CN106790019B (zh) 基于特征自学习的加密流量识别方法及装置
CN109816032B (zh) 基于生成式对抗网络的无偏映射零样本分类方法和装置
CN111275107A (zh) 一种基于迁移学习的多标签场景图像分类方法及装置
CN107562918A (zh) 一种数学题知识点发现与批量标签获取方法
CN107862270A (zh) 人脸分类器训练方法、人脸检测方法及装置、电子设备
CN106326585A (zh) 基于贝叶斯网络推理的预测分析方法以及装置
CN111950408B (zh) 基于规则图的手指静脉图像识别方法、装置及存储介质
CN105469376A (zh) 确定图片相似度的方法和装置
CN112860841A (zh) 一种文本情感分析方法、装置、设备及存储介质
CN106682702A (zh) 深度学习方法和系统
CN110070115A (zh) 一种单像素攻击样本生成方法、装置、设备及存储介质
CN106997373A (zh) 一种基于深度置信网络的链路预测方法
CN110019519A (zh) 数据处理方法、装置、存储介质和电子装置
CN113706151A (zh) 一种数据处理方法、装置、计算机设备及存储介质
CN108470061A (zh) 一种针对视角级文本的情感分类系统
CN112308148A (zh) 缺陷类别识别、孪生神经网络训练方法、装置及存储介质
CN115659966A (zh) 基于动态异构图和多级注意力的谣言检测方法及系统
CN114972771A (zh) 车辆定损理赔方法、装置、电子设备及存储介质
CN111754370B (zh) 一种基于人工智能的在线教育课程管理方法及系统
CN111598105A (zh) 一种专利地图构建方法及装置
CN109117352B (zh) 服务器性能预测方法和装置
CN108564134A (zh) 数据处理方法、装置、计算设备和介质
CN112364737A (zh) 一种用于网络直播课的人脸表情识别方法、装置及设备
CN111859094A (zh) 一种基于云计算的信息分析方法系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication
WW01 Invention patent application withdrawn after publication

Application publication date: 20200828