CN111753536A - 一种专利申请文本的自动撰写方法和装置 - Google Patents

一种专利申请文本的自动撰写方法和装置 Download PDF

Info

Publication number
CN111753536A
CN111753536A CN202010421278.1A CN202010421278A CN111753536A CN 111753536 A CN111753536 A CN 111753536A CN 202010421278 A CN202010421278 A CN 202010421278A CN 111753536 A CN111753536 A CN 111753536A
Authority
CN
China
Prior art keywords
text
technical
title
description
patent application
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010421278.1A
Other languages
English (en)
Inventor
刘恺
张灏
周适
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Xinju Intellectual Property Co ltd
Original Assignee
Beijing Xinju Intellectual Property Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Xinju Intellectual Property Co ltd filed Critical Beijing Xinju Intellectual Property Co ltd
Publication of CN111753536A publication Critical patent/CN111753536A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/258Heading extraction; Automatic titling; Numbering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • G06F40/186Templates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/194Calculation of difference between files
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/216Parsing using statistical methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/18Legal services
    • G06Q50/184Intellectual property management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Business, Economics & Management (AREA)
  • Databases & Information Systems (AREA)
  • Technology Law (AREA)
  • Data Mining & Analysis (AREA)
  • Tourism & Hospitality (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Human Resources & Organizations (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Operations Research (AREA)
  • Probability & Statistics with Applications (AREA)
  • Signal Processing (AREA)
  • Economics (AREA)
  • Mathematical Physics (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Document Processing Apparatus (AREA)
  • Machine Translation (AREA)

Abstract

本发明公开了一种专利申请文本的自动撰写方法和装置。所述方法包括:根据输入信息生成技术交底文本,技术交底文本的技术说明部分包括层级结构的标题体系;针对技术说明部分中的标题,从技术说明部分中抽取该标题及该标题的下一层级标题,将该标题及下一层级标题组合生成与该标题对应的一项第一权利要求文本;根据技术说明部分中标题的层级关系,将第一权利要求文本组合生成专利申请文本的权利要求书;根据技术说明部分或权利要求书生成专利申请文本的说明书。能够根据输入的技术交底信息生成技术交底文本,根据技术交底文本自动撰写专利申请文本,节省了人力,同时提高了专利申请文本的撰写效率和质量。

Description

一种专利申请文本的自动撰写方法和装置
技术领域
本发明涉及信息智能处理技术领域,特别涉及一种专利申请文本的自动撰写方法和装置。
背景技术
随着技术创新的飞速发展,专利申请量也在逐步增加,但目前专利申请文本主要依赖于申请人或专利代理师的人工撰写,专利代理师的数量与市场需求之间的差距较大,导致专利代理师的工作量较大,而专利申请文本的撰写,比较耗时耗精力。
同时,专利申请人自己撰写专利申请文本时,往往不能很好的掌握撰写思路,不能很好的完成专利申请文本的撰写。所以迫切需要能够基于技术交底内容智能生成专利申请文本,来提高专利申请文本的撰写效率和质量。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的一种专利申请文本的自动撰写方法和装置。
第一方面,本发明实施例提供一种专利申请文本的自动撰写方法,包括:
根据输入信息生成技术交底文本,所述技术交底文本的技术说明部分包括层级结构的标题体系;
针对所述技术说明部分中的标题,从所述技术说明部分中抽取所述标题及所述标题的下一层级标题,将所述标题及下一层级标题组合生成与所述标题对应的一项第一权利要求文本;
根据所述技术说明部分中标题的层级关系,将所述第一权利要求文本组合生成专利申请文本的权利要求书;
根据所述技术说明部分或所述权利要求书生成所述专利申请文本的说明书。
在一些可选的实施例中,所述将所述第一权利要求文本组合生成专利申请文本的权利要求书,还包括:
从所述技术说明部分中获取标题的至少一段具有预设特征的描述文本,将所述描述文本输入预先训练的第一文本生成模型,得到第二权利要求文本;
确定所述第二权利要求文本,引用所述描述文本所属的标题的上一层级标题对应的第一权利要求文本,并将所述第二权利要求文本添加到所述权利要求书中的对应位置。
在一些可选的实施例中,所述从所述技术说明部分中获取标题的至少一段具有预设特征的描述文本,具体包括:
将所述技术说明部分中标题的每段描述文本在预设数据库中进行检索,确定所述描述文本与所述数据库的相似度;
根据所述相似度确定至少一段具有预设特征的描述文本。
在一些可选的实施例中,所述第一文本生成模型,是利用获取到的多个数据对,对指针生成网络模型和/或序列到序列Seq2Seq模型训练得到的,所述数据对包括描述文本和与所述该描述文本对应的权利要求文本。
在一些可选的实施例中,所述根据所述技术说明部分或所述权利要求书生成所述专利申请文本的说明书,具体包括:
按预设规则将所述技术说明部分或所述权利要求书分解成至少一个描述单元;
将各所述描述单元输入预先训练的第二文本生成模型,得到所述描述单元对应的实施例文本段;
将所述实施例文本段组合生成所述专利申请文本的说明书的实施例文本。
在一些可选的实施例中,所述第二文本生成模型,是利用获取到的多个数据对,对指针生成网络模型和/或序列到序列Seq2Seq模型训练得到的,所述数据对包括描述单元和与该描述单元对应的实施例文本段。
在一些可选的实施例中,所述根据输入信息生成技术交底文本,具体包括:
根据用户输入技术说明栏中的信息,生成所述技术交底文本的技术说明部分;对应的,根据输入信息生成技术交底文本,还包括执行至少下述一项:
根据用户输入概要栏的标题子栏中的信息,生成所述技术交底文本的摘要部分;
根据用户输入概要栏的技术领域子栏中的信息,生成所述技术交底文本的技术领域部分;
根据用户输入概要栏的背景技术子栏中的信息,生成所述技术交底文本的背景技术部分;
根据用户输入摘要栏中的信息,生成所述技术交底文本的摘要部分;
根据用户输入附图栏中的信息,生成所述技术交底文本的附图部分。
在一些可选的实施例中,所述根据用户输入技术说明栏中的信息,生成所述技术交底文本的技术说明部分,具体包括:
当接收到用户在技术说明栏中勾选方法选项时,向用户展示包括步骤子栏的技术说明栏,所述步骤子栏用于输入包括步骤的标题和每个标题的具体说明,根据输入所述标题子栏的信息生成所述技术交底文本中层级结构的技术说明部分;
当接收到用户在技术说明栏中勾选产品选项时,向用户展示包括部件子栏的技术说明栏,所述部件子栏用于输入部件的名称及每个部件的功能作用和工作原理,根据输入所述部件名称子栏的信息生成层所述技术交底文本中层级结构的技术说明部分。
在一些可选的实施例中,所述方法还包括:
确定所述技术说明部分中的至少一个可能具备创新性的段落文本;
对至少一个所述可能具备创新性的段落文本中包含的语句进行聚类分析,得到至少一个中心语句;
以所述中心语句为检索对象在预先建立的检索数据库中进行检索,确定检索到的相似语句与所述中心语句的相似度值;
将所述相似度值与预设的相似度阈值进行比较,根据比较结果评估所述技术交底文本中的可能具备创新性的段落文本的创新性。
第二方面,本发明实施例提供一种专利申请文本的自动撰写装置,包括:
第一生成模块,用于根据输入信息生成技术交底文本,所述技术交底文本的技术说明部分包括层级结构的标题体系;
第二生成模块,用于针对所述第一生成模块生成的技术说明部分中的标题,从所述技术说明部分中抽取所述标题及所述标题的下一层级标题,将所述标题及下一层级标题组合生成与所述标题对应的一项第一权利要求文本;
第三生成模块,用于根据所述技术说明部分中标题的层级关系,将所述第二生成模块生成的第一权利要求文本组合生成专利申请文本的权利要求书;
第四生成模块,用于根据所述第一生成模块生成的技术说明部分或第三生成模块生成的所述权利要求书生成所述专利申请文本的说明书。
第三方面,本发明实施例提供一种服务器,包括:存储器、处理器及存储于存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述专利申请文本的自动撰写方法。
第四方面,本发明实施例提供一种计算机可读存储介质,其上存储有计算机指令,当该指令被处理器执行时实现上专利申请文本的自动撰写方法。
本发明实施例提供的上述技术方案的有益效果至少包括:
本发明实施例提供的专利申请文本的自动撰写方法,包括:根据输入信息生成技术交底文本,技术交底文本的技术说明部分包括层级结构的标题体系;针对技术说明部分中的标题,从技术说明部分中抽取该标题及该标题的下一层级标题,将该标题及下一层级标题组合生成与该标题对应的一项第一权利要求文本;根据技术说明部分中标题的层级关系,将第一权利要求文本组合生成专利申请文本的权利要求书;根据技术说明部分或权利要求书生成专利申请文本的说明书。能够根据输入的技术交底信息生成技术交底文本,根据技术交底文本自动撰写专利申请文本,节省了人力,提高了专利申请文本的撰写效率和质量,同时避免了专利申请文本的形式问题。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
附图说明
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。在附图中:
图1为本发明实施例一中专利申请文本的自动撰写方法的流程图;
图2为本发明实施例二中专利申请文本的自动撰写方法的具体实现流程图;
图3为本发明实施例三中专利申请文本的权利要求书生成方法的流程图;
图4为本发明实施例四中专利申请文本的权利要求书生成方法的另一流程图;
图5为本发明实施例五中专利申请文本的说明书实施例文本生成方法的流程图;
图6为本发明实施例专利申请文本的自动撰写装置的结构示意图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
为了解决现有技术中存在的申请人或代理人人工撰写专利申请文本费时费力的问题,本发明实施例提供一种专利申请文本的自动撰写方法和装置,能够根据输入的技术交底信息生成技术交底文本,根据技术交底文本自动撰写专利申请文本,节省了人力,同时提高了专利申请文本的撰写效率和质量。
实施例一
本发明实施例一提供一种专利申请文本的自动撰写方法,参照图1所示,包括如下步骤:
步骤S11:根据输入信息生成技术交底文本。
具体的,技术交底文本的技术说明部分包括层级结构的标题体系。
在一个实施例中,可以包括:
1、根据用户输入技术说明栏中的信息,生成技术交底文本的技术说明部分。
具体的,可以是通过导航栏获取输入的结构化的技术交底信息,参照表1 所示,导航栏又可以分为:概要栏、详细说明栏、摘要栏和附图栏。
表1导航栏明细表
Figure BDA0002497049630000061
其中,详细说明栏供用户填写技术交底的详细内容,在一个实施例中,可以包括,当接收到用户在技术说明栏中勾选方法选项时,向用户展示包括步骤子栏的技术说明栏,步骤子栏用于输入包括步骤的标题和每个标题的具体说明,根据输入步骤子栏的信息生成技术交底文本中层级结构的技术说明部分;当接收到用户在技术说明栏中勾选产品选项时,向用户展示包括部件子栏的技术说明栏,部件子栏用于输入部件的名称及每个部件的功能作用和工作原理,根据输入部件子栏的信息生成技术交底文本中层级结构的技术说明部分。
具体的,用户可以在步骤子栏中只输入步骤的标题;可选的,还可以输入步骤标题的基础上输入步骤标题的具体说明,和/或,子步骤的标题及子步骤的具体说明。根据输入步骤子栏的信息生成技术交底文本中层级结构的技术说明部分,技术说明部分中标题(包括步骤和子步骤的标题)的描述文本是根据输入的标题的具体说明生成的。
用户可以在部件子栏中只输入部件的名称;可选的,还可以输入部件名称的基础上输入部件的具体说明,和/或,子部件的名称及子部件的具体说明。根据输入部件子栏的信息生成技术交底文本中层级结构的技术说明部分,技术说明部分中标题(包括部件和子部件的名称)的描述文本是根据输入的部件的具体说明生成的。
2、根据用户输入概要栏的标题子栏中的信息,生成技术交底文本的标题部分。
导航栏中的概要栏包括标题子栏、技术领域子栏和背景技术子栏。其中,标题子栏用于根据发明内容填写一个合适的标题。
3、根据用户输入概要栏的技术领域子栏中的信息,生成技术交底文本的技术领域部分。
技术领域子栏用于根据发明所应用的背景填写所处的技术领域。
4、根据用户输入概要栏的背景技术子栏中的信息,生成技术交底文本的背景技术部分。
背景技术子栏用于填写总结的在本申请之前的技术发明的成果和技术发展情况,即相关技术背景;还可以包括与本发明相关的现有技术和现有技术的缺点(主要指本申请解决了的技术问题),等。
5、根据用户输入摘要栏中的信息,生成技术交底文本的摘要部分。
摘要栏用于填写总结的发明要解决的技术问题,以及解决该技术问题的技术方案等。
6、根据用户输入附图栏中的信息,生成技术交底文本的附图部分。
具体的,上述第1项技术说明栏中的信息,是必须填写的,其他信息视具体情况,可以填写或不填写。
步骤S12:针对技术说明部分中的标题,从技术说明部分中抽取标题及标题的下一层级标题,将标题及下一层级标题组合生成与标题对应的一项第一权利要求文本。
技术交底文本为方法类时,由步骤S11得到的技术交底文本的技术说明部分的标题是根据输入的每一步骤或子步骤的标题生成的,子步骤可以是步骤的子步骤,也可以是任一层级的子步骤的下一层级步骤,为了描述方便,将步骤或子步骤统称为步骤,将得到的层级结构的标题统称为标题;标题的描述文本是根据输入的步骤的具体说明生成的。
技术交底文本为产品类时,由步骤S11得到的技术交底文本的技术说明部分的标题是根据输入的每一部件或子部件的名称生成的,子部件可以是部件的子部件,也可以是任一层级的子部件的下一层级部件,为了描述方便,将部件或子部件统称为部件,将得到的层级结构的标题统称为标题;标题的描述文本是根据输入的部件的功能作用和工作原理生成的。
步骤S13:根据技术说明部分中标题的层级关系,将第一权利要求文本组合生成专利申请文本的权利要求书。
按技术交底文本中标题的层级关系,确定标题对应的第一权利要求文本之间的引用关系;根据第一权利要求文本和引用关系生成专利申请文本的权利要求书。
具体权利要求书的生成方法,后续实施例中详细介绍。
步骤S14:根据技术说明部分或权利要求书生成专利申请文本的说明书。
在一个实施例中,可以包括,按预设规则将技术说明部分或权利要求书分解成至少一个描述单元;将各描述单元输入预先训练的第二文本生成模型,得到描述单元对应的实施例文本段;将实施例文本段组合生成专利申请文本的说明书的实施例文本。
第二文本生成模型,是利用获取到的多个数据对,对指针生成网络模型和 /或序列到序列Seq2Seq模型训练得到的,数据对包括描述单元和与该描述单元对应的实施例文本段。
实施例文本的生成,可以是直接利用技术说明部分生成;也可以是先生成权利要求书,再根据权利要求书生成实施例文本。具体区别在于使用的第二文本生成模型是根据不同的样本数据训练得到的,样本数据的每一数据对包括描述单元和与该描述单元对应的实施例文本段,但前者描述单元是技术语言,后者的描述单元是符合专利审查指南的权利要求语言;可选的,也可以是描述单元既包括技术语言的描述文本段,有包括符合专利审查指南的权利要求语言的描述文本段。
具体说明书的实施例文本的生成方法,后续实施例中详细介绍。
本发明实施例一提供的专利申请文本的自动撰写方法,包括:根据输入信息生成技术交底文本,技术交底文本的技术说明部分包括层级结构的标题体系;针对技术说明部分中的标题,从技术说明部分中抽取该标题及该标题的下一层级标题,将该标题及下一层级标题组合生成与该标题对应的一项第一权利要求文本;根据技术说明部分中标题的层级关系,将第一权利要求文本组合生成专利申请文本的权利要求书;根据技术说明部分或权利要求书生成专利申请文本的说明书。能够根据输入的技术交底信息生成技术交底文本,根据技术交底文本自动撰写专利申请文本,节省了人力,提高了专利申请文本的撰写效率和质量,同时避免了专利申请文本的形式问题。
实施例二
本发明实施例二提供一种专利申请文本的自动撰写方法的具体实现,参照图2所示,包括如下步骤:
步骤S21:通过导航栏获取结构化的技术交底信息。
具体的,可以是通过导航栏获取输入的结构化的技术交底信息,导航栏可以包括概要栏、详细说明栏、摘要栏和附图栏,其中概要栏包括标题子栏、技术领域子栏和背景技术子栏。
详细说明栏的填写首先选择是方法类或产品类,两者从逻辑结构上没有差别,差别在于里面内容的分块上。例如:
1、方法类。
可填写整体方法的具体说明和优势,基本填写单元是步骤或子步骤,填写的内容是“具体说明”,具体说明是对步骤或子步骤内容的具体说明。
可根据发明内容的实际情况,为一级步骤添加同级步骤,同级步骤的数量没有限制。如一级步骤中存在子步骤,可为一级步骤添加子步骤,每按一次添加子步骤就会按顺序排列添加子步骤,或在子步骤中点击“添加同级步骤”同样生成一个顺序的子步骤,两种操作的结果等效。
2、产品类。
可填写产品整体的工作原理和性能优势,基本填写单元是部件或子部件,填写的内容是“功能作用”、“工作原理”和“其它”;“功能作用”主要是描述部件或子部件在整个产品或其父模块中所起的作用;“工作原理”主要是描述部件或子部件如何进行工作,内部运行的机制是什么;不属于“功能作用”或“工作原理”的内容可以填写在“其它”中。
可根据发明内容的实际情况,为一级部件添加同级部件,同级部件的数量没有限制。如一级部件中存在子部件,可为一级部件添加子部件,每按一次添加子部件就会按顺序排列添加子部件,或在子部件中点击“添加同级部件”同样生成一个顺序的子部件,两种操作的结果等效。
填写完一个步骤或子步骤、部件或子部件,按保存按钮保存填写内容,填写的内容自动进行收缩,有利于保持页面清晰的逻辑。如想对已填写的内容继续进行编辑,可点击收放按钮,将内容展开,对填写内容进行编辑。
已保存的步骤或子步骤、部件或子部件能够进行拖动,调整其顺序,调整完顺序后,将自动根据已调整的顺序重新进行编号。
已保存的子步骤、子部件可进行整块内容的删除。
已保存的步骤或部件如存在子步骤、子部件,需要将子步骤、子部件删除后,再进行删除操作。
如在填写的过程中不知道如何撰写,可点击“看看其他人怎么写”按钮,会弹出相应的样例,供用户(申请人)参考。
填写完“产品类”或“方法类”后,还可以继续添加另外一个类,或者直接到下一步。例如:添加完“产品类”后再添加一个“方法类”,或添加完“方法类”后再添加一个“产品类”。
为了能够有效的获取输入的内容,方便生成技术交底文本,用户可以在每次输入完一个完整的意思表达后,按“回车键”进行分段撰写,生成技术交底文本时根据回车键来划分文本单元。
生成的技术交底文本中包括根据详细说明栏中的输入信息生成的技术说明部分。
步骤S22:技术说明部分的查重。
在一个实施例中,可以包括,确定技术说明部分中的至少一个可能具备创新性的段落文本;对至少一个可能具备创新性的段落文本中包含的语句进行聚类分析,得到至少一个中心语句;以中心语句为检索对象在预先建立的检索数据库中进行检索,确定检索到的相似语句与中心语句的相似度值;将相似度值与预设的相似度阈值进行比较,根据比较结果评估技术说明部分中的可能具备创新性的段落文本的创新性。
展示检索数据库中与中心语句的相似度值高于相似度阈值的相似文本,可以提供可能影响本申请创造性的现有技术文本,供申请人参考是否需要修改技术交底信息,或如何修改技术交底信息。
步骤S23:根据技术交底信息生成技术交底文本。
步骤S24:根据技术交底文本生成专利申请文本。
1、根据技术交底文本生成专利申请文本的标题。
当获取到的技术交底信息中包括标题时,可以直接将从根据技术交底信息生成的技术交底文本中抽取的标题作为专利申请文本的标题;也可以是根据从技术交底文本中抽取的标题和技术说明部分生成专利申请文本的标题。
当获取到的技术交底信息中不包括标题时,可以根据技术说明部分生成专利申请文本的标题。
2、根据技术交底文本生成专利申请文本的技术领域。
当获取到的技术交底信息中包括技术领域时,可以直接将从根据技术交底信息生成的技术交底文本中抽取的技术领域作为专利申请文本的技术领域;也可以是根据从技术交底文本中抽取的技术领域和技术说明部分生成专利申请文本的技术领域。
当获取到的技术交底信息中不包括技术领域时,可以根据技术说明部分生成专利申请文本的技术领域。例如,抽取技术说明部分的层级标题,根据层级标题生成文本段,根据文本段在预先建立的数据库中检索,根据检索到的技术领域生成专利申请文本的技术领域。
3、根据技术交底文本生成专利申请文本的背景技术。
当获取到的技术交底信息中包括背景技术时,可以直接将从根据技术交底信息生成的技术交底文本中抽取的背景技术作为专利申请文本的背景技术;也可以是根据从技术交底文本中抽取的背景技术和技术说明部分生成专利申请文本的背景技术。
当获取到的技术交底信息中不包括背景技术时,可以根据技术说明部分生成专利申请文本的背景技术。例如,抽取技术说明部分的层级标题,根据层级标题生成文本段,根据文本段在预先建立的数据库中检索,根据检索到的背景技术生成专利申请文本的背景技术。
4、根据技术交底文本生成专利申请文本的权利要求书。
可以包括,针对技术说明部分中的标题,从技术说明部分中抽取该标题及该标题的下一层级标题,将该标题及下一层级标题组合生成与该标题对应的一项第一权利要求文本;根据技术说明部分中标题的层级关系,将第一权利要求文本组合生成专利申请文本的权利要求书。
在一个实施例中,还可以包括,从技术说明部分中获取标题的至少一段具有预设特征的描述文本,将描述文本输入预先训练的第一文本生成模型,得到第二权利要求文本;确定第二权利要求文本,引用描述文本所属的标题的上一层级标题对应的第一权利要求文本,并将第二权利要求文本添加到权利要求书中的对应位置。
从技术说明部分中获取标题的至少一段具有预设特征的描述文本,可以包括:将技术说明部分中标题的每段描述文本在预设数据库中进行检索,确定描述文本与数据库的相似度;根据相似度确定至少一段具有预设特征的描述文本。
具体的,第一文本生成模型,是利用获取到的多个数据对,对指针生成网络模型和/或序列到序列Seq2Seq模型训练得到的,数据对包括描述文本和与该描述文本对应的权利要求文本。
具体权利要求书的生成方法后续实施例中详细介绍。
5、根据技术交底文本生成专利申请文本的实施例文本。
具体实施例文本的生成方法后续实施例中详细介绍。
6、根据技术交底文本生成专利申请文本的摘要。
当获取到的技术交底信息中包括摘要时,可以直接将从根据技术交底信息生成的技术交底文本中抽取的摘要作为专利申请文本的摘要;也可以是根据从技术交底文本中抽取的摘要和技术说明部分生成专利申请文本的摘要。
当获取到的技术交底信息中不包括摘要时,可以根据技术说明部分生成专利申请文本的摘要。例如,根据技术说明部分,概括出每块内容的概述信息,组成摘要。
7、根据技术交底文本生成专利申请文本的说明书附图。
具体的,附图可以是从技术交底文本中直接获取的;也可以是步骤S22技术说明部分的查重过程中,从相似文档中获取的;也可以是按照预设的模板和实施例文本中的步骤说明生成的,可以是根据实施例文本中每个步骤的标题,调用visio或其他的软件,按照预设的模板生成对应的流程图,例如,根据本实施例二中专利申请文本的自动撰写方法的具体实现的各个步骤,可以自动生成如附图2所示的附图。
后续实施例三到实施例五,分别介绍专利申请文本的权利要求书和说明书实施例文本的生成方法,都是根据技术交底文本的技术说明部分生成的,为了便于描述,将技术说明部分称为技术交底文本。
实施例三
本发明实施例三提供一种专利申请文本的权利要求书生成方法,参照图3 所示,包括如下步骤:
步骤S31:对技术交底文本中的标题,从技术交底文本中抽取标题及标题的下一层级标题。
具体的,针对技术交底文本中的每个标题,确定是否有下一层级的标题,若是,从技术交底文本中抽取标题及标题的下一层级标题。
获取到的技术交底文本包含多层级标题,其最高层级的标题是发明名称或发明名称;可选的,若获取到的技术交底文本的最高层级的标题不是发明名称或发明名称,可以先对技术交底文本进行预处理:抽取所有最高层级的标题,确定能够概括抽取的标题的名称,将概括出的名称作为最高层级添加到技术交底文本中。
具体的,确定能够概括抽取的标题的名称,可以是抽取标题中的关键词,将抽取到的关键词按预设模板组合成名称。
上述技术交底文本的格式可以是非结构化的,每个标题带有标签,用于标明标题间的层级关系,故可以根据标题的标签确定标签的下一层级标签,从技术交底文本中抽取该标题,抽取下一层级标签所属标题作为该标题的下一层级标题。可选的,上述技术交底文本的格式也可以是树形结构的,从树状结构的技术交底文本中抽取标题及该标题的下一层级标题。
步骤S32:将标题及下一层级标题组合生成与标题对应的一项第一权利要求文本。
在一个实施例中,可以包括,根据技术交底文本的类型确定匹配的权利要求生成模板;将标题及下一层级标题,按照模板组合生成与标题对应的一项第一权利要求文本。
技术交底文本的类型可以是发明或发明,发明又可以分为方法类和产品类,不同的类型对应的权利要求文本的生成模板也不同。以发明中的方法类为例,权利要求生成模板可以是“1、一种……方法,其特征在于,包括下述步骤:……”,用于根据最高层级的标题和下一层级的标题,生成最高层级的标题对应的第一权利要求文本(最终生成权利要求书中的独立权利要求文本)。也可以是“x、如权利要求x所述的方法,其特征在于,所述……,具体包括:……” (模板中的“……”是生成权利要求文本时需要补充的内容,“x”是生成权利要求文本时需要替换的内容),用于生成非最高层级的标题对应的第一权利要求文本(最终生成权利要求书中的从属权利要求文本),以非最高层级的标题为标题A为例,模板中的第一个省略号处可以补充为标题A对应的文本,第二个省略号处可以补充为标题A的下一层级标题对应的文本;将模板中的第二个x替换为标题A的上一层级标题对应的权利要求文本的序号;第一个x为生成的权利要求文本的序号,在步骤S34中生成权利要求书时将x进行替换。
步骤S33:按技术交底文本中标题的层级关系,确定标题对应的第一权利要求文本之间的引用关系。
例如标题A的下一层级的标题是标题B、标题C和标题D,标题B的下一层级的标题是标题E和标题F;根据标题A、标题B、标题C和标题D组合生成的第一权利要求文本为标题A对应的第一权利要求文本A;根据标题B、标题E和标题F组合生成的第一权利要求文本为标题B对应的第一权利要求文本B;根据标题A和标题B的层级关系确定第一权利要求文本A和第一权利要求文本B之间的引用关系,因为标题A是标题B的上一层级的标题,所以确定第一权利要求文本A被第一权利要求文本B引用。
步骤S34:根据第一权利要求文本和引用关系生成权利要求书。
根据引用关系确定第一权利要求文本的序号,被引用的第一权利要求文本排在引用他的第一权利要求的前面,将确定的第一权利要求文本的序号替换对应的第一权利要求文本中的第一个x,将第一权利要求文本排列生成权利要求书。
在一个实施例中,从技术交底文本中,确定标题的至少一段具有预设特征的描述文本,将描述文本输入预先训练的文本生成模型,得到第二权利要求文本;确定第二权利要求文本,引用描述文本所属的标题的上一层级标题对应的第一权利要求文本,并将第二权利要求文本添加到权利要求书中的对应位置。
技术交底文本包括多层级的标题外,至少一个标题还可以具有至少一段描述文本,用于详细描述该标题。故,以标题A为例,生成一个标题A对应的第一专利申请文本A后,若确定标题A的至少一段描述文本具有预设特征,则针对每段具有预设特征的描述文本,以描述文本B为例,利用描述文本和预先训练的文本生成模型,生成第二权利要求文本B。可选的,也可以在生成所有的第一权利要求文本后,再生成第二权利要求文本。具体第二权利要求文本的生成方法,后续实施例二中详细介绍。
上述确定的具有预设特征的描述文本,可以是技术交底文本中预先标记好的描述文本。也可以是将技术交底文本中标题的每段描述文本在预设数据库中进行检索,确定描述文本与数据库的相似度;根据相似度确定至少一段具有预设特征的描述文本,例如,将相似度低于设定阈值的描述文本确定为具有预设特征的描述文本。
具体的,上述预设特征可以是具有一定的创造性,申请人在输入技术交底的相关内容时将自己认为的具有创造性的描述文本进行勾选,在根据申请人输入的技术交底内容生成技术交底文本的过程中,根据申请人的选择将描述文本进行标记。判断描述文本是否具有预设特征可以直接根据描述文本有无对应的标注来判断。
可选的,获取到的技术交底文本也可以是没有上述标注,判断描述文本是否具有预设特征,可以包括,将描述文本在预设数据库中进行检索,确定描述文本与数据库的相似度;若确定的相似度小于预先设定的阈值,则确定描述文本具有预设特征。
可选的,也可以是先根据是否有标注确定描述文本是否具有预设特征,对于没有标注的描述文本,再根据相似度检索确定是否具有预设特征。
描述文本是否具有预设特征的判断方法,本实施例不做具体限定。
在一个实施例中,还可以包括,利用选定的分词模型将第一权利要求文本进行分词,将得到的每个词与预先建立的知识库匹配,若匹配成功,将该第一权利要求文本中的该词替换为知识库中与该词匹配的上一层级的词,或为该第一权利要求文本中的该词标注所述知识库中与该词匹配的上一层级的词。该步骤可以在生成每一个第一权利要求文本后执行,也可以在生成所有的第一权利要求文本后再执行,也可以在生成所有的第一权利要求文本和第二权利要求文本后执行。和/或,
利用选定的分词模型将第二权利要求文本进行分词,将得到的每个词与预先建立的知识库匹配,若匹配成功,将该第二权利要求文本中的该词替换为知识库中与该词匹配的上一层级的词,或为该第二权利要求文本中的该词标注知识库中与该词匹配的上一层级的词。该步骤可以在生成每一个第二权利要求文本后都执行,也可以在生成所有的第二权利要求文本后再执行。
上述替换使得生成的第一或第二权利要求文本的保护范围变大;若没有替换,只是在对应的词的预设位置进行标注,可以方便专利申请文本的撰写人员根据标注的词来确定选用哪个词更为合理,省去了撰写人员自己查询的麻烦,或避免了撰写人员忘记上位撰写(将对应的词替换为层级更高的词)以争取更大的保护范围。
实施例四
本发明实施例四提供一种专利申请文本的权利要求书生成方法的具体实现,其流程如图4所示,包括如下步骤:
步骤S401:对技术交底文本中的标题,从技术交底文本中抽取标题及标题的下一层级标题。
步骤S402:将标题及下一层级标题组合生成与标题对应的一项第一权利要求文本。
步骤S403:按技术交底文本中标题的层级关系,确定标题对应的第一权利要求文本之间的引用关系。
针对技术交底文本中的每个标题的每段描述文本,执行步骤S404-步骤 S410。
步骤S404:判断描述文本是否标注有具有预设特征。
具体的,上述技术交底文本可以是预先根据用户的选择对描述文本进行了标注,例如用户判断哪段描述文本具有创造性,便会在描述文本对应的是否具有创造性处勾选,故根据用户输入的信息生成技术交底文本的过程中,可以根据用户的选择对描述文本进行是否具有创造性的标注。判断描述文本是否具有预设特征可以直接根据描述文本有无对应的标注来判断。
若判断描述文本标注有具有预设特征,执行步骤S405;否则,执行步骤 S406。
步骤S405:将描述文本在预设数据库中进行检索,得到数据库中与描述文本的相似度满足预设条件的相似文档。
步骤S405后执行步骤S409。
步骤S406:将描述文本在预设数据库中进行检索,确定描述文本与数据库的相似度。
具体的,可以将描述文本与数据库中的文档相似度最高值确定为描述文本与数据库的相似度。
步骤S407:判断确定的相似度是否小于预设的阈值。
若是,则确定描述文本具有预设特征,执行步骤S408;若否,确定描述文本不具有预设特征。
步骤S408:得到数据库中与描述文本的相似度满足预设条件的相似文档。
步骤S409:将描述文本输入预先训练的文本生成模型,得到第二权利要求文本。
在一个实施例中,上述文本生成模型,可以是利用获取到的多个数据对,对指针生成网络模型和/或序列到序列Seq2Seq模型训练得到的,数据对包括描述文本和与该描述文本对应的权利要求文本。
步骤S410:确定第二权利要求文本,引用描述文本所属的标题的上一层级标题对应的第一权利要求文本,得到第二权利要求文本与第一权利要求文本之间的引用关系。
步骤S411:根据第一权利要求文本、第二权利要求文本、相似文档和引用关系,生成权利要求书。
具体的,上述引用关系包括步骤S403中确定的第一权利要求文本之间的引用关系,和步骤S410中确定的第二权利要求文本与第一权利要求文本之间的引用关系。
下述为了表述方便,将第二权利要求文本与第一权利要求文本合称为权利要求文本。
可以是以标记的形式根据权利要求文本在权利要求书中的位置,将权利要求文本对应的相似文档添加到权利要求书中。
步骤S412:利用选定的分词模型将权利要求文本进行分词,将得到的每个词与预先建立的知识库匹配,若匹配成功,将该权利要求文本中的该词替换为知识库中与该词匹配的上一层级的词。
可选的,也可以不是将权利要求文本中的词进行替换,而是为权利要求文本中的词标注知识库中与该词匹配的上一层级的词。标注的词供用户参考是否需要修改。可选的,也可以是不只标注与选定的词匹配的上一层级的词,可以同时标注知识库中与该词匹配的高层级的多个层级的词。
上述流程中的步骤没有严格的顺序关系,上述步骤顺序仅是一种示意,例如,可以生成标题对应的一项第一权利要求文本后,生成标题对应的第二权利要求文本;还可以每生成一项第一或第二权利要求文本后,就将权利要求文本中的词进行知识库匹配后的替换。
实施例五
本发明实施例五提供一种专利申请文本的说明书实施例文本生成方法,参照图5所示,包括如下步骤:
步骤S51:按预设规则将技术数据分解成至少一个描述单元。
具体的,上述技术数据可以是根据获取到的技术交底信息生成的技术交底文本,生成的技术交底文本包括多层级的标题和至少一个标题的至少一段描述文本。按预设规则将技术交底文本分解成至少一个描述单元,可以包括:将从技术交底文本中分解出的每个标题确定为一个描述单元;针对技术交底文本中标题的每段描述文本,按照预设的分隔符分解成至少一个描述单元。
具体的,技术交底文本是根据用户输入的技术交底信息生成的,例如可以预先约定用户在输入描述文本时,每输入完一个完整的意思表达后,按“回车键”进行分段撰写,故生成的技术交底文本中可以包含回车键标识,以回车键标识为分隔符将一段描述文本分解成至少一个描述单元。
可选的,也可以不直接从技术交底文本中分解描述单元,而是先根据技术交底文本自动生成权利要求书,从权利要求书中的每项权利要求文本中分解描述单元。可以是,以分号为分隔符,将权利要求文本的特征部分或附加技术特征部分分解成至少一个描述文本;也可以是,将每项权利要求文本的特征部分或附加技术特征部分整体分解为一个描述文本。
根据技术交底文本自动生成权利要求书,在一个实施例中,可以包括:对技术交底文本中的标题,从技术交底文本中抽取标题及标题的下一层级标题,将标题及下一层级标题组合生成与标题对应的一项第一权利要求文本;按技术交底文本中标题的层级关系,确定标题对应的第一权利要求文本之间的引用关系;根据第一权利要求文本和引用关系生成权利要求书;从技术交底文本中,确定标题的至少一段具有预设特征的描述文本,利用描述文本和预先训练的文本生成模型,生成第二权利要求文本;确定第二权利要求文本,引用描述文本所属的标题的上一层级标题对应的第一权利要求文本,并将第二权利要求文本添加到权利要求书中的对应位置。
根据技术交底文本自动生成权利要求书的具体实现流程后续实施例中详细介绍。
上述描述单元可以为一段描述文本,也可以是至少一张图片,也可以是描述文本和描述图片的组合。
步骤S52:将各描述单元输入预先训练的文本生成模型,得到描述单元对应的实施例文本段。
在一个实施例中,文本生成模型,可以是利用获取到的多个数据对,对指针生成网络模型和/或序列到序列Seq2Seq模型训练得到的,数据对包括描述单元和与该描述单元对应的实施例文本段。
在一个实施例中,数据对中的描述单元为描述文本或至少一张描述图片,或是描述文本和描述图片的组合。其中,描述文本可以是技术交底中的技术描述文本(获取的申请人单从技术角度撰写的描述文本);也可以是将技术描述文本转换成符合专利审查指南要求的权利要求文本;也可以是将技术描述文本输入第二文本生成模型得到的权利要求文本。第二文本生成模型是利用获取到的多个第二数据对,对指针生成网络模型和/或序列到序列Seq2Seq模型训练得到的,第二数据对包括描述文本和与该描述文本对应的权利要求文本。
将一个描述单元输入预先训练的文本生成模型,得到该描述单元对应的实施例文本段。
步骤S53:将实施例文本段组合生成实施例文本。
在一个实施例中,根据技术数据的类型确定匹配的实施例文本生成模板;根据技术数据中描述单元的层级结构,确定描述单元对应的实施例文本段的层级结构;按照生成模板和实施例文本段的层级结构,将实施例文本段组合生成实施例文本。
可选的,将实施例文本段组合生成实施例文本,还可以包括,将实施例文本段对应的描述单元以预设形式与实施例文本段一起添加进实施例文本,可以使得专利申请文本的撰写人员在查阅或者修改自动生成的实施例文本时,清晰的了解到每段实施例文本段是根据哪个描述单元生成的。
在一个实施例中,上述方法还可以包括,将描述单元在预设数据库中进行检索,得到数据库中与描述单元的相似度满足预设条件的相似文档;根据描述单元对应的实施例文本段在实施例文本中的位置,使用标注的方式将相似文档添加进实施例文本中。
可以使得专利申请文本的撰写人员在查阅或者修改自动生成的实施例文本时,参照每段实施例文本段对应的相似文档,将实施例文本段进一步补充完善,或修改实施例文本段及对应的权利要求文本,使得申请保护的权利要求文本与现有技术不同,具有创造性。
基于本发明的发明构思,本发明实施例还提供一种专利申请文本的自动撰写装置,其结构如图6所示,包括:
第一生成模块61,用于根据输入信息生成技术交底文本,所述技术交底文本的技术说明部分包括层级结构的标题体系;
第二生成模块62,用于针对第一生成模块61生成的技术说明部分中的标题,从所述技术说明部分中抽取所述标题及所述标题的下一层级标题,将所述标题及下一层级标题组合生成与所述标题对应的一项第一权利要求文本;
第三生成模块63,用于根据所述技术说明部分中标题的层级关系,将第二生成模块62生成的第一权利要求文本组合生成专利申请文本的权利要求书;
第四生成模块64,用于根据第一生成模块61生成的技术说明部分或第三生成模块63生成的所述权利要求书生成所述专利申请文本的说明书。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
基于本发明的发明构思,本发明实施例还提供一种计算机可读存储介质,其上存储有计算机指令,当该指令被处理器执行时实现上述专利申请文本的自动撰写方法。
基于本发明的发明构思,本发明实施例还提供一种服务器,包括:存储器、处理器及存储于存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述本发明的自动撰写方法。
除非另外具体陈述,术语比如处理、计算、运算、确定、显示等等可以指一个或更多个处理或者计算系统、或类似设备的动作和/或过程,所述动作和/ 或过程将表示为处理系统的寄存器或存储器内的物理(如电子)量的数据操作和转换成为类似地表示为处理系统的存储器、寄存器或者其他此类信息存储、发射或者显示设备内的物理量的其他数据。信息和信号可以使用多种不同的技术和方法中的任何一种来表示。例如,在贯穿上面的描述中提及的数据、指令、命令、信息、信号、比特、符号和码片可以用电压、电流、电磁波、磁场或粒子、光场或粒子或者其任意组合来表示。
应该明白,公开的过程中的步骤的特定顺序或层次是示例性方法的实例。基于设计偏好,应该理解,过程中的步骤的特定顺序或层次可以在不脱离本公开的保护范围的情况下得到重新安排。所附的方法权利要求以示例性的顺序给出了各种步骤的要素,并且不是要限于所述的特定顺序或层次。
在上述的详细描述中,各种特征一起组合在单个的实施方案中,以简化本公开。不应该将这种公开方法解释为反映了这样的意图,即,所要求保护的主题的实施方案需要清楚地在每个权利要求中所陈述的特征更多的特征。相反,如所附的权利要求书所反映的那样,本发明处于比所公开的单个实施方案的全部特征少的状态。因此,所附的权利要求书特此清楚地被并入详细描述中,其中每项权利要求独自作为本发明单独的优选实施方案。
本领域技术人员还应当理解,结合本文的实施例描述的各种说明性的逻辑框、模块、电路和算法步骤均可以实现成电子硬件、计算机软件或其组合。为了清楚地说明硬件和软件之间的可交换性,上面对各种说明性的部件、框、模块、电路和步骤均围绕其功能进行了一般地描述。至于这种功能是实现成硬件还是实现成软件,取决于特定的应用和对整个系统所施加的设计约束条件。熟练的技术人员可以针对每个特定应用,以变通的方式实现所描述的功能,但是,这种实现决策不应解释为背离本公开的保护范围。
结合本文的实施例所描述的方法或者算法的步骤可直接体现为硬件、由处理器执行的软件模块或其组合。软件模块可以位于RAM存储器、闪存、ROM 存储器、EPROM存储器、EEPROM存储器、寄存器、硬盘、移动磁盘、CD-ROM 或者本领域熟知的任何其它形式的存储介质中。一种示例性的存储介质连接至处理器,从而使处理器能够从该存储介质读取信息,且可向该存储介质写入信息。当然,存储介质也可以是处理器的组成部分。处理器和存储介质可以位于 ASIC中。该ASIC可以位于用户终端中。当然,处理器和存储介质也可以作为分立组件存在于用户终端中。
对于软件实现,本申请中描述的技术可用执行本申请所述功能的模块(例如,过程、函数等)来实现。这些软件代码可以存储在存储器单元并由处理器执行。存储器单元可以实现在处理器内,也可以实现在处理器外,在后一种情况下,它经由各种手段以通信方式耦合到处理器,这些都是本领域中所公知的。
上文的描述包括一个或多个实施例的举例。当然,为了描述上述实施例而描述部件或方法的所有可能的结合是不可能的,但是本领域普通技术人员应该认识到,各个实施例可以做进一步的组合和排列。因此,本文中描述的实施例旨在涵盖落入所附权利要求书的保护范围内的所有这样的改变、修改和变型。此外,就说明书或权利要求书中使用的术语“包含”,该词的涵盖方式类似于术语“包括”,就如同“包括,”在权利要求中用作衔接词所解释的那样。此外,使用在权利要求书的说明书中的任何一个术语“或者”是要表示“非排它性的或者”。术语“第一”、“第二”、“第三”仅用于描述目的,而不能理解为指示或暗示相对重要性。

Claims (10)

1.一种专利申请文本的自动撰写方法,其特征在于,包括:
根据输入信息生成技术交底文本,所述技术交底文本的技术说明部分包括层级结构的标题体系;
针对所述技术说明部分中的标题,从所述技术说明部分中抽取所述标题及所述标题的下一层级标题,将所述标题及下一层级标题组合生成与所述标题对应的一项第一权利要求文本;
根据所述技术说明部分中标题的层级关系,将所述第一权利要求文本组合生成专利申请文本的权利要求书;
根据所述技术说明部分或所述权利要求书生成所述专利申请文本的说明书。
2.如权利要求1所述的方法,其特征在于,所述将所述第一权利要求文本组合生成专利申请文本的权利要求书,还包括:
从所述技术说明部分中获取标题的至少一段具有预设特征的描述文本,将所述描述文本输入预先训练的第一文本生成模型,得到第二权利要求文本;
确定所述第二权利要求文本,引用所述描述文本所属的标题的上一层级标题对应的第一权利要求文本,并将所述第二权利要求文本添加到所述权利要求书中的对应位置。
3.如权利要求2所述的方法,其特征在于,所述从所述技术说明部分中获取标题的至少一段具有预设特征的描述文本,具体包括:
将所述技术说明部分中标题的每段描述文本在预设数据库中进行检索,确定所述描述文本与所述数据库的相似度;
根据所述相似度确定至少一段具有预设特征的描述文本。
4.如权利要求2所述的方法,其特征在于,所述第一文本生成模型,是利用获取到的多个数据对,对指针生成网络模型和/或序列到序列Seq2Seq模型训练得到的,所述数据对包括描述文本和与所述该描述文本对应的权利要求文本。
5.如权利要求1所述的方法,其特征在于,所述根据所述技术说明部分或所述权利要求书生成所述专利申请文本的说明书,具体包括:
按预设规则将所述技术说明部分或所述权利要求书分解成至少一个描述单元;
将各所述描述单元输入预先训练的第二文本生成模型,得到所述描述单元对应的实施例文本段;
将所述实施例文本段组合生成所述专利申请文本的说明书的实施例文本。
6.如权利要求5所述的方法,其特征在于,所述第二文本生成模型,是利用获取到的多个数据对,对指针生成网络模型和/或序列到序列Seq2Seq模型训练得到的,所述数据对包括描述单元和与该描述单元对应的实施例文本段。
7.如权利要求1所述的方法,其特征在于,所述根据输入信息生成技术交底文本,具体包括:
根据用户输入技术说明栏中的信息,生成所述技术交底文本的技术说明部分;对应的,根据输入信息生成技术交底文本,还包括执行至少下述一项:
根据用户输入概要栏的标题子栏中的信息,生成所述技术交底文本的摘要部分;
根据用户输入概要栏的技术领域子栏中的信息,生成所述技术交底文本的技术领域部分;
根据用户输入概要栏的背景技术子栏中的信息,生成所述技术交底文本的背景技术部分;
根据用户输入摘要栏中的信息,生成所述技术交底文本的摘要部分;
根据用户输入附图栏中的信息,生成所述技术交底文本的附图部分。
8.如权利要求7所述的方法,其特征在于,所述根据用户输入技术说明栏中的信息,生成所述技术交底文本的技术说明部分,具体包括:
当接收到用户在技术说明栏中勾选方法选项时,向用户展示包括步骤子栏的技术说明栏,所述步骤子栏用于输入包括步骤的标题和每个标题的具体说明,根据输入所述标题子栏的信息生成所述技术交底文本中层级结构的技术说明部分;
当接收到用户在技术说明栏中勾选产品选项时,向用户展示包括部件子栏的技术说明栏,所述部件子栏用于输入部件的名称及每个部件的功能作用和工作原理,根据输入所述部件名称子栏的信息生成层所述技术交底文本中层级结构的技术说明部分。
9.权利要求1所述的方法,其特征在于,所述方法还包括:
确定所述技术说明部分中的至少一个可能具备创新性的段落文本;
对至少一个所述可能具备创新性的段落文本中包含的语句进行聚类分析,得到至少一个中心语句;
以所述中心语句为检索对象在预先建立的检索数据库中进行检索,确定检索到的相似语句与所述中心语句的相似度值;
将所述相似度值与预设的相似度阈值进行比较,根据比较结果评估所述技术交底文本中的可能具备创新性的段落文本的创新性。
10.一种专利申请文本的自动撰写装置,其特征在于,包括:
第一生成模块,用于根据输入信息生成技术交底文本,所述技术交底文本的技术说明部分包括层级结构的标题体系;
第二生成模块,用于针对所述第一生成模块生成的技术说明部分中的标题,从所述技术说明部分中抽取所述标题及所述标题的下一层级标题,将所述标题及下一层级标题组合生成与所述标题对应的一项第一权利要求文本;
第三生成模块,用于根据所述技术说明部分中标题的层级关系,将所述第二生成模块生成的第一权利要求文本组合生成专利申请文本的权利要求书;
第四生成模块,用于根据所述第一生成模块生成的技术说明部分或第三生成模块生成的所述权利要求书生成所述专利申请文本的说明书。
CN202010421278.1A 2020-03-19 2020-05-18 一种专利申请文本的自动撰写方法和装置 Pending CN111753536A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN202010196520X 2020-03-19
CN202010196520 2020-03-19

Publications (1)

Publication Number Publication Date
CN111753536A true CN111753536A (zh) 2020-10-09

Family

ID=72673235

Family Applications (5)

Application Number Title Priority Date Filing Date
CN202010421279.6A Pending CN111753067A (zh) 2020-03-19 2020-05-18 一种技术交底文本创新性评估方法、装置和设备
CN202010421278.1A Pending CN111753536A (zh) 2020-03-19 2020-05-18 一种专利申请文本的自动撰写方法和装置
CN202010420142.9A Pending CN111753066A (zh) 2020-03-19 2020-05-18 一种技术交底文本扩充方法、装置和设备
CN202010420143.3A Pending CN111753535A (zh) 2020-03-19 2020-05-18 一种专利申请文本的生成方法和装置
CN202010420151.8A Active CN111756689B (zh) 2020-03-19 2020-05-18 一种专利申请文件生成系统和方法

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN202010421279.6A Pending CN111753067A (zh) 2020-03-19 2020-05-18 一种技术交底文本创新性评估方法、装置和设备

Family Applications After (3)

Application Number Title Priority Date Filing Date
CN202010420142.9A Pending CN111753066A (zh) 2020-03-19 2020-05-18 一种技术交底文本扩充方法、装置和设备
CN202010420143.3A Pending CN111753535A (zh) 2020-03-19 2020-05-18 一种专利申请文本的生成方法和装置
CN202010420151.8A Active CN111756689B (zh) 2020-03-19 2020-05-18 一种专利申请文件生成系统和方法

Country Status (1)

Country Link
CN (5) CN111753067A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112686639A (zh) * 2021-01-05 2021-04-20 河北冀联人力资源服务集团有限公司 一种基于深度学习的劳动合同确定的方法和系统

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116010603A (zh) * 2023-01-31 2023-04-25 浙江中电远为科技有限公司 一种用于商业文本分类的特征聚类降维方法
CN117763106B (zh) * 2023-12-11 2024-06-18 中国科学院文献情报中心 一种文献查重的方法、装置、存储介质及电子设备

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1547711A (zh) * 2001-08-31 2004-11-17 用于专利撰写及技术评定的自动化系统和方法
CN101488164A (zh) * 2008-10-10 2009-07-22 亿维讯软件(北京)有限公司 一种用于生成关于发明创造的专利申请文件的方法
CN106155989A (zh) * 2015-04-03 2016-11-23 北京中知智慧科技有限公司 专利文件生成方法和装置
US20170098290A1 (en) * 2005-12-14 2017-04-06 Harold W. Milton, Jr. System for preparing a patent application
CN106776519A (zh) * 2016-12-26 2017-05-31 北京文先科技有限公司 一种专利自助撰写方法及系统
CN107133210A (zh) * 2017-04-20 2017-09-05 中国科学院上海高等研究院 方案文本生成方法及系统
CN108763486A (zh) * 2018-05-30 2018-11-06 湖南写邦科技有限公司 基于终端的论文查重方法、终端及存储介质
CN108845991A (zh) * 2018-06-28 2018-11-20 河北国瑞企业管理咨询有限公司 一种公司内部专利查重方法
CN109062937A (zh) * 2018-06-15 2018-12-21 北京百度网讯科技有限公司 训练描述文本生成模型的方法、生成描述文本的方法及装置
CN109062877A (zh) * 2018-04-24 2018-12-21 筑权网(武汉)科技有限公司 一种专利自助撰写方法及系统
CN109635284A (zh) * 2018-11-26 2019-04-16 北京邮电大学 基于深度学习结合累积注意力机制的文本摘要方法及系统
CN110532352A (zh) * 2019-08-20 2019-12-03 腾讯科技(深圳)有限公司 文本查重方法及装置、计算机可读存储介质、电子设备

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7707039B2 (en) * 2004-02-15 2010-04-27 Exbiblio B.V. Automatic modification of web pages
TWI464601B (zh) * 2006-12-22 2014-12-11 Hon Hai Prec Ind Co Ltd 專利申請文件生成系統及方法
CN105956119A (zh) * 2016-05-06 2016-09-21 长沙市麓智信息科技有限公司 专利撰写辅助系统及其方法
CN105956955A (zh) * 2016-05-06 2016-09-21 长沙市麓智信息科技有限公司 案件跟踪互动系统及其方法
CN106528836A (zh) * 2016-11-22 2017-03-22 北京恒冠网络数据处理有限公司 基于大数据撰写专利背景技术的方法及装置
CN106940726B (zh) * 2017-03-22 2020-09-01 山东大学 一种基于知识网络的创意自动生成方法与终端
CN107220295B (zh) * 2017-04-27 2020-02-07 银江股份有限公司 一种人民矛盾调解案例搜索和调解策略推荐方法
CN108416008A (zh) * 2018-02-28 2018-08-17 华南理工大学 一种基于自然语言处理的bim产品数据库语义检索方法
CN108491384A (zh) * 2018-03-15 2018-09-04 周慧祥 一种专利申请文件的辅助撰写系统
CN108932220A (zh) * 2018-06-29 2018-12-04 北京百度网讯科技有限公司 文章生成方法和装置
CN109101538A (zh) * 2018-06-29 2018-12-28 中译语通科技股份有限公司 一种面向中文专利文本的实体抽取方法和系统
CN109522537A (zh) * 2018-11-16 2019-03-26 合肥汇创知识产权代理有限公司 专利编撰与分析应用软件
CN109376350A (zh) * 2018-12-15 2019-02-22 长沙贤正益祥机械科技有限公司 一种结构类产品专利半自动撰写方法、服务器及系统
CN109766429A (zh) * 2019-02-19 2019-05-17 北京奇艺世纪科技有限公司 一种语句检索方法及装置
CN110413986B (zh) * 2019-04-12 2023-08-29 上海晏鼠计算机技术股份有限公司 一种改进词向量模型的文本聚类多文档自动摘要方法及系统
CN110502632A (zh) * 2019-07-19 2019-11-26 平安科技(深圳)有限公司 基于聚类算法的合同条款评审方法、装置、计算机设备及存储介质
CN110457690A (zh) * 2019-07-26 2019-11-15 南京邮电大学 一种专利创造性的判断方法
CN110427884B (zh) * 2019-08-01 2023-05-09 达而观信息科技(上海)有限公司 文档篇章结构识别方法、装置、设备和存储介质
CN111160870A (zh) * 2019-12-31 2020-05-15 洪泰智造(青岛)信息技术有限公司 一种专利文件生成方法、装置、系统和存储介质

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1547711A (zh) * 2001-08-31 2004-11-17 用于专利撰写及技术评定的自动化系统和方法
US20170098290A1 (en) * 2005-12-14 2017-04-06 Harold W. Milton, Jr. System for preparing a patent application
CN101488164A (zh) * 2008-10-10 2009-07-22 亿维讯软件(北京)有限公司 一种用于生成关于发明创造的专利申请文件的方法
CN106155989A (zh) * 2015-04-03 2016-11-23 北京中知智慧科技有限公司 专利文件生成方法和装置
CN106776519A (zh) * 2016-12-26 2017-05-31 北京文先科技有限公司 一种专利自助撰写方法及系统
CN107133210A (zh) * 2017-04-20 2017-09-05 中国科学院上海高等研究院 方案文本生成方法及系统
CN109062877A (zh) * 2018-04-24 2018-12-21 筑权网(武汉)科技有限公司 一种专利自助撰写方法及系统
CN108763486A (zh) * 2018-05-30 2018-11-06 湖南写邦科技有限公司 基于终端的论文查重方法、终端及存储介质
CN109062937A (zh) * 2018-06-15 2018-12-21 北京百度网讯科技有限公司 训练描述文本生成模型的方法、生成描述文本的方法及装置
CN108845991A (zh) * 2018-06-28 2018-11-20 河北国瑞企业管理咨询有限公司 一种公司内部专利查重方法
CN109635284A (zh) * 2018-11-26 2019-04-16 北京邮电大学 基于深度学习结合累积注意力机制的文本摘要方法及系统
CN110532352A (zh) * 2019-08-20 2019-12-03 腾讯科技(深圳)有限公司 文本查重方法及装置、计算机可读存储介质、电子设备

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
丁伟 等: ""浅谈化妆品组合物发明专利申请文件中说明书的撰写"", 《中国化妆品(行业)》, no. 12, 15 December 2006 (2006-12-15), pages 90 - 93 *
阚飙 等: "《精准预防诊断系列 传染性疾病与精准预防》", 1 March 2020, 上海交通大学出版社, pages: 263 - 265 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112686639A (zh) * 2021-01-05 2021-04-20 河北冀联人力资源服务集团有限公司 一种基于深度学习的劳动合同确定的方法和系统

Also Published As

Publication number Publication date
CN111753514A (zh) 2020-10-09
CN111753535A (zh) 2020-10-09
CN111756689A (zh) 2020-10-09
CN111753066A (zh) 2020-10-09
CN111756689B (zh) 2022-11-22
CN111753067A (zh) 2020-10-09

Similar Documents

Publication Publication Date Title
US20210157975A1 (en) Device, system, and method for extracting named entities from sectioned documents
CN107392143B (zh) 一种基于svm文本分类的简历精确解析方法
US11256856B2 (en) Method, device, and system, for identifying data elements in data structures
US9323731B1 (en) Data extraction using templates
CN109145260B (zh) 一种文本信息自动提取方法
CN113254574A (zh) 一种机关公文辅助生成方法、装置以及系统
CN111753536A (zh) 一种专利申请文本的自动撰写方法和装置
CN107798123B (zh) 知识库及其建立、修改、智能问答方法、装置及设备
US10042880B1 (en) Automated identification of start-of-reading location for ebooks
US7853595B2 (en) Method and apparatus for creating a tool for generating an index for a document
WO2021108038A1 (en) Systems and methods for extracting and implementing document text according to predetermined formats
CN111191429A (zh) 数据表格自动填充的系统和方法
CN104484379B (zh) 确定音乐实体关系的方法和装置及查询处理方法和装置
CN114239588A (zh) 文章处理方法、装置、电子设备及介质
CN115422372A (zh) 一种基于软件测试的知识图谱构建方法和系统
CN116090416B (zh) 基于标准知识图谱的标准编写方法、系统、设备及介质
JP2013016036A (ja) 文書部品生成方法及び計算機システム
CN112732743B (zh) 一种基于中文自然语言的数据分析方法及装置
CN114118098A (zh) 基于要素抽取的合同评审方法、设备及存储介质
CN111753514B (zh) 一种专利申请文本的自动生成方法和装置
CN114492419B (zh) 基于标注中新增关键词语的文本标注方法、系统及装置
CN116028620B (zh) 一种基于多任务特征协同的生成专利摘要的方法及系统
JP2005031813A (ja) 抄録作成支援システム、プログラム、抄録作成支援方法及び特許文献検索システム並びにその検索方法
Edvardsen et al. Automatically generating high quality metadata by analyzing the document code of common file types
CN115422078A (zh) 一种生成测试功能操作步骤描述文档的方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination