CN106547927A - 一种专利文件处理方法和装置 - Google Patents

一种专利文件处理方法和装置 Download PDF

Info

Publication number
CN106547927A
CN106547927A CN201611157245.0A CN201611157245A CN106547927A CN 106547927 A CN106547927 A CN 106547927A CN 201611157245 A CN201611157245 A CN 201611157245A CN 106547927 A CN106547927 A CN 106547927A
Authority
CN
China
Prior art keywords
patent document
publication number
race
family
extension
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201611157245.0A
Other languages
English (en)
Inventor
赵大川
钟其同
庄绪霞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Kelong Technology Co Ltd
Original Assignee
Beijing Kelong Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Kelong Technology Co Ltd filed Critical Beijing Kelong Technology Co Ltd
Priority to CN201611157245.0A priority Critical patent/CN106547927A/zh
Publication of CN106547927A publication Critical patent/CN106547927A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/38Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/382Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using citations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/18Legal services
    • G06Q50/184Intellectual property management

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Technology Law (AREA)
  • Tourism & Hospitality (AREA)
  • Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Economics (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Operations Research (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Library & Information Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供了一种专利文件处理方法和装置,其中,该方法包括:获取待存储的专利文件;从待存储的专利文件中获取专利文件中的相关专利文件信息;根据相关专利文件信息,生成所述专利文件的标引信息集合;存储专利文件、专利文件中的相关专利文件信息和标引信息集合。本发明提供的专利文件处理方法和装置,可以提高标引效率。

Description

一种专利文件处理方法和装置
技术领域
本发明涉及数据处理技术领域,具体而言,涉及一种专利文件处理方法和装置。
背景技术
目前,专利权作为对发明创造人或其权利让人对特定的发明创造在一定期限内依法享有的独占实施权,越来越受到企业和个人的重视,企业和个人等用户可以通过专利检索网站对已经申请的专利进行检索查询,获悉当前已经申请的专利的技术方案,并且在查阅某个专利时,用户还希望专利检索网站将与正在查阅的专利相关的专利文件的链接展示出来,以便更全面的了解专利的内容。
相关技术中,专利检索网站为了将用户正在查阅的专利相关的专利信息展示出来,需要人工阅读每件专利,将每件专利的专利信息(如申请人、申请号等)录入专利检索网站,以对每件专利进行标引工作。
在实现本发明过程中,发明人发现现有技术中至少存在如下问题:
进行标引工作时需要人工一件件阅读专利内容,标引效率低下且标引内容容易出现错误。
发明内容
有鉴于此,本发明实施例的目的在于提供一种专利文件处理方法和装置,以提高标引效率。
第一方面,本发明实施例提供了一种专利文件处理方法,包括:
获取待存储的专利文件;
从所述待存储的专利文件中获取所述专利文件中的相关专利文件信息;
根据所述相关专利文件信息,生成所述专利文件的标引信息集合;
存储所述专利文件、所述专利文件中的相关专利文件信息和所述标引信息集合。
结合第一方面,本发明实施例提供了第一方面的第一种可能的实施方式,其中:根据所述相关专利文件信息,生成所述专利文件的标引信息集合,包括:
根据所述相关专利文件信息,生成所述专利文件的专利族识别码,其中,所述相关专利文件信息包括所述专利文件的优先权号、优先权日、引用专利公开号和申请号;
根据所述专利族识别码,生成所述专利文件的基本专利族指针和扩展专利族指针;
通过所述基本专利族指针、所述扩展专利族指针和所述引用专利公开号,生成所述专利文件的基本专利族引用专利公开号和扩展专利族引用专利公开号;
根据所述专利文件的引用专利公开号、所述基本专利族引用专利公开号和所述扩展专利族引用专利公开号,得到所述专利文件的专利被引公开号、基本专利族专利被引公开号和扩展专利族专利被引公开号;
根据所述基本专利族指针、所述扩展专利族指针、所述基本专利族引用专利公开号、所述扩展专利族引用专利公开号、所述专利被引公开号、所述基本专利族专利被引公开号和所述扩展专利族专利被引公开号,生成所述专利文件的标引信息集合中。
结合第一方面,本发明实施例提供了第一方面的第二种可能的实施方式,其中:根据所述相关专利文件信息,生成所述专利文件的专利族识别码,包括:
当确定提取到的所述相关专利文件信息未包括优先权号和优先权日时,将所述专利文件的申请号和申请日分别作为所述专利文件的优先权号和优先权日;
对所述优先权号和所述优先权日中记录的字符信息进行加密处理,生成所述专利文件的专利族识别码。
结合第一方面,本发明实施例提供了第一方面的第三种可能的实施方式,其中:根据所述专利族识别码,生成所述专利文件的基本专利族指针,包括:
生成所述专利文件的所述专利族识别码和所述申请号的关联关系;
当有待存储的所述专利文件的基本专利族指针为空时,根据所述专利族识别码和所述申请号的关联关系,将所述申请号对应的专利族识别码设置为所述专利文件的基本专利族指针。
结合第一方面,本发明实施例提供了第一方面的第四种可能的实施方式,其中:根据所述专利族识别码,生成所述专利文件的扩展专利族指针,包括:
当有待存储的所述专利文件的扩展专利族指针为空时,设置所述专利族识别码为所述申请号的扩展专利族指针;
查找所述专利族识别码关联的所有申请号;
查找所述所有申请号关联的所有专利族识别码;
查找所述所有专利族识别码关联的申请号;
将所述专利族识别码设置为所述所有专利族识别码关联的申请号的扩展专利族指针。
结合第一方面,本发明实施例提供了第一方面的第五种可能的实施方式,其中:通过所述基本专利族指针、所述扩展专利族指针和所述引用专利公开号,得到所述专利文件的基本专利族引用专利公开号和扩展专利族引用专利公开号,包括:
查询与待存储的所述专利文件的基本专利族指针相关联的第一申请号和与所述扩展专利族指针相关联的第二申请号;
分别查询所述第一申请号的第一引用专利公开号和所述第二申请号的第二引用专利公开号;
将查询到的所述第一引用专利公开号设置为所述专利文件的基本专利族引用专利公开号;
将查询到的所述第二引用专利公开号设置为所述专利文件的扩展专利族引用专利公开号。
结合第一方面,本发明实施例提供了第一方面的第六种可能的实施方式,其中:根据所述专利文件的引用专利公开号、所述基本专利族引用专利公开号和所述扩展专利族引用专利公开号,得到所述专利文件的专利被引公开号、基本专利族专利被引公开号和扩展专利族专利被引公开号,包括:
分别查询与所述第一申请号相关的第一公开号以及与所述第二申请号相关的第二公开号;
查询待存储的所述专利文件记录的专利公告号,并将查询到的所述专利公告号设置为所述专利文件的专利被引公开号;
分别查询所述第一公开号和所述第二公开号分别对应的专利文件中记录的第一专利公告号和第二专利公告号,并将查询到的所述第一专利公告号和所述第二专利公告号分别设置为所述专利文件的基本专利族专利被引公开号和扩展专利族专利被引公开号。
第二方面,本发明实施例还提供一种专利文件处理装置,包括:
专利文件获取模块,用于获取待存储的专利文件;
信息获取模块,用于从所述待存储的专利文件中获取所述专利文件中的相关专利文件信息;
标引信息生成模块,用于根据所述相关专利文件信息,生成所述专利文件的标引信息集合;
存储模块,用于存储所述专利文件、所述专利文件中的相关专利文件信息和所述标引信息集合。
结合第二方面,本发明实施例提供了第二方面的第一种可能的实施方式,其中:所述标引信息生成模块,包括:
专利族识别码生成单元,用于根据所述相关专利文件信息,生成所述专利文件的专利族识别码,其中,所述相关专利文件信息包括所述专利文件的优先权号、优先权日、引用专利公开号和申请号;
专利族指针生成单元,用于根据所述专利族识别码,生成所述专利文件的基本专利族指针和扩展专利族指针;
第一信息生成单元,用于通过所述基本专利族指针、所述扩展专利族指针和所述引用专利公开号,生成所述专利文件的基本专利族引用专利公开号和扩展专利族引用专利公开号;
第二信息生成单元,用于根据所述专利文件的引用专利公开号、所述基本专利族引用专利公开号和所述扩展专利族引用专利公开号,得到所述专利文件的专利被引公开号、基本专利族专利被引公开号和扩展专利族专利被引公开号;
第三信息生成单元,用于根据所述基本专利族指针、所述扩展专利族指针、所述基本专利族引用专利公开号、所述扩展专利族引用专利公开号、所述专利被引公开号、所述基本专利族专利被引公开号和所述扩展专利族专利被引公开号,生成所述专利文件的标引信息集合中。
结合第二方面,本发明实施例提供了第二方面的第二种可能的实施方式,其中:所述专利族识别码生成单元,具体用于:
当确定提取到的所述相关专利文件信息未包括优先权号和优先权日时,将所述专利文件的申请号和申请日分别作为所述专利文件的优先权号和优先权日;
对所述优先权号和所述优先权日中记录的字符信息进行加密处理,生成所述专利文件的专利族识别码。
本发明实施例提供的专利文件处理方法和装置,通过从待存储的专利文件中提取专利文件中的相关专利文件信息,进而根据相关专利文件信息生成专利文件的标引信息集合,然后对生成的专利文件的标引信息集合进行存储,与现有技术中需要人工对专利文件的专利信息进行标引的过程相比,无需人工标引,避免了人工标引的过程中容易出现标引错误的缺陷,提高了专利文件的标引效率。
为使本发明的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1示出了本发明实施例1所提供的一种专利文件处理方法的流程图;
图2示出了本发明实施例1所提供的专利文件处理方法中,生成专利文件的标引信息集合的具体流程图;
图3示出了本发明实施例2所提供的一种专利文件处理装置的结构示意图;
图4示出了本发明实施例2所提供的一种专利文件处理装置中,标引信息生成模块的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
目前,专利检索网站为了将用户正在查阅的专利相关的专利文件的链接展示出来,需要人工阅读每件专利,将与每件专利相关的专利文献(如优先权文件、专利文件中引用的文件)的公开号录入专利检索网站,以对每件专利进行标引工作。而进行标引工作时需要人工一件件阅读专利内容,标引效率低下且标引内容容易出现错误。基于此,本申请提供的一种专利文件处理方法和装置。
实施例1
本发明实施例提供了一种专利文件处理方法的执行主体是专利检索网站的后台服务器,该后台服务器从待存储的专利文件中提取专利文件中的相关专利文件信息,进而根据相关专利文件信息生成专利文件的标引信息集合,然后对生成的专利文件的标引信息集合进行存储。
上述后台服务器,可以使用任何可以生成专利文件的标引信息集合的计算设备,这里不再一一赘述。
参见图1,本实施例提供一种专利文件处理方法,包括以下步骤:
步骤100、获取待存储的专利文件。
在上述步骤100中,待存储的专利文件,可以是技术人员手动输入到专利检索网站的后台服务器的专利文件,也可以是后台服务器直接从各国专利局的服务器上获取新申请的专利文件。
步骤102、从上述待存储的专利文件中获取上述专利文件中的相关专利文件信息。
上述步骤102,具体包括以下步骤(1)至步骤(3):
(1)提取待存储的专利文件中的相关专利文件信息;
(2)将待存储的专利文件中的相关专利文件信息存储到预设的SQL数据库中;
(3)从SQL数据库中提取上述专利文件中的相关专利文件信息。
在上述步骤(1)中,通过SQL语言提取待存储的专利文件中的相关专利文件信息。上述相关专利文件信息包括上述专利文件的优先权号、优先权日、引用专利公开号和申请号。
在上述步骤(2)中,SQL数据库,用于缓存专利文件中的相关专利文件信息,为后续的标引工作提供数据上的支持。
待存储的专利文件中的相关专利文件信息,在SQL数据库内的存储形式为:待存储的专利文件的申请号与相关专利文件信息的对应关系。
通过上述步骤102获取到上述专利文件中的相关专利文件信息后,可以继续通过步骤104生成上述专利文件的标引信息集合。
步骤104、根据上述相关专利文件信息,生成上述专利文件的标引信息集合。
相关技术中,专利文件检索网站只能在用户检索专利文件时,向用户展示用户所检索的专利文件以及该专利文件的专利信息,所以向用户展示的专利信息较少,因此,为了增加向用户展示的专利信息,参见图2,上述步骤104包括以下步骤1040至步骤1048:
步骤1040、根据上述相关专利文件信息,生成上述专利文件的专利族识别码;
步骤1042、根据上述专利族识别码,生成上述专利文件的基本专利族指针和扩展专利族指针;
步骤1044、通过上述基本专利族指针、上述扩展专利族指针和上述引用专利公开号,生成上述专利文件的基本专利族引用专利公开号和扩展专利族引用专利公开号;
步骤1046、根据上述专利文件的引用专利公开号、上述基本专利族引用专利公开号和上述扩展专利族引用专利公开号,得到上述专利文件的专利被引公开号、基本专利族专利被引公开号和扩展专利族专利被引公开号;
步骤1048、根据上述基本专利族指针、上述扩展专利族指针、上述基本专利族引用专利公开号、上述扩展专利族引用专利公开号、上述专利被引公开号、上述基本专利族专利被引公开号和上述扩展专利族专利被引公开号,生成上述专利文件的标引信息集合中。
其中,上述基本专利族,是由具有至少一个相同优先权的专利文件组成。
上述扩展专利族,是由与至少一件族内其他专利具有至少一个相同的优先权的专利文件组成。
在一种实施方式中:待存储的专利文件的申请号是P1、P2和P3,其中,P1要求优先权的专利文件的申请号是A1和A2,P2要求优先权的专利文件的申请号是A1和A3,P3要求优先权的专利文件的申请号是A3和A4,那么,P1和P2可以组成一个基本专利族,而P1、P2和P3可以组成一个扩展专利族。
上述基本专利族指针,用于关联属于同一基本专利族的专利文件。
上述扩展专利族指针,用于关联属于同一扩展专利族的专利文件。
上述基本专利族引用专利公开号,就是同一基本专利族内所有专利文件所引用的专利的公开号。
上述扩展专利族引用专利公开号,就是同一扩展专利族内所有专利文件所引用的专利的公开号。
上述专利被引公开号,就是所有引用该待存储的专利文件的专利文件的专利公开号。
上述基本专利族专利被引公开号,就是引用该待存储的专利文件的基本专利族内任一专利文件的所有专利文件的专利公开号。
上述扩展专利族专利被引公开号,就是引用该待存储的专利文件的扩展专利族内任一专利文件的所有专利文件的专利公开号。
通过步骤1040至步骤1048的描述可以看出,通过生成包括基本专利族指针、扩展专利族指针、基本专利族引用专利公开号、扩展专利族引用专利公开号、专利被引公开号、基本专利族专利被引公开号和扩展专利族专利被引公开号的标引信息集合,在不同情形下对专利文件进行全方位的搜索、浏览和分析,大大扩展了专利文件所引用的专利信息的范围,在向用户展示专利文件时,可以提供更全面和准确的专利族信息,同时提供了按照这些专利族信息进行扩展的更加全面的专利引用信息,便于开展专利引用信息的研究。
上述步骤1040包括以下步骤(1)至步骤(2):
(1)当确定提取到的上述相关专利文件信息未包括优先权号和优先权日时,将上述专利文件的申请号和申请日分别作为上述专利文件的优先权号和优先权日;
(2)对上述优先权号和上述优先权日中记录的字符信息进行加密处理,生成上述专利文件的专利族识别码。
在上述步骤(1)中,优先权号就是待存储的专利文件所要求的优先权中记录的专利文件申请号。
上述步骤(2)具体包括以下步骤(21)至步骤(24):
(21)从优先权号中读取字母信息和数字信息;
(22)从优先权日中读取日期信息;
(23)将读取到的字母信息、数字信息和日期信息进行拼接,得到待加密字符串;
(24)通过MD5加密算法对该待加密字符串进行加密,生成上述专利文件的专利族识别码。
在上述步骤(23)中,将字母信息、数字信息和日期信息拼在一起形成字母信息+数字信息+空格+YYYYMMDD(日期信息)的组合。
通过上述步骤104生成上述专利文件的标引信息集合后,可以继续通过步骤106对专利文件和生的标引信息集合进行存储。
步骤106、存储上述专利文件、上述专利文件中的相关专利文件信息和上述标引信息集合。
综上所述,本发明实施例提供的专利文件处理方法,通过从待存储的专利文件中提取专利文件中的相关专利文件信息,进而根据相关专利文件信息生成专利文件的标引信息集合,然后对生成的专利文件的标引信息集合进行存储,与现有技术中需要人工对专利文件进行标引的过程相比,无需人工标引,避免了人工标引的过程中容易出现标引错误的缺陷,提高了专利文件的标引效率。
为了在向用户展示用户查询的专利文件同时向用户展示更多的专利文件标引信息,根据上述专利族识别码,生成上述专利文件的基本专利族指针,包括以下步骤(1)至步骤(2):
(1)生成上述专利文件的上述专利族识别码和上述申请号的关联关系;
(2)当有待存储的上述专利文件的基本专利族指针为空时,根据上述专利族识别码和上述申请号的关联关系,将上述申请号对应的专利族识别码设置为上述专利文件的基本专利族指针。
其中,上述申请号是待存储的专利文件的申请号。
进一步地,在生成上述专利文件的基本专利族指针的基础上,可以根据专利文件的基本专利族指针,所以,根据上述专利族识别码,生成上述专利文件的扩展专利族指针,包括以下步骤(1)至步骤(5):
(1)当有待存储的上述专利文件的扩展专利族指针为空时,设置上述专利族识别码为上述申请号的扩展专利族指针;
(2)查找上述专利族识别码关联的所有申请号;
(3)查找上述所有申请号关联的所有专利族识别码;
(4)查找上述所有专利族识别码关联的申请号;
(5)将上述专利族识别码设置为上述所有专利族识别码关联的申请号的扩展专利族指针。
在生成述基本专利族指针和上述扩展专利族指针后,可以通过继续生成专利文件的基本专利族引用专利公开号和扩展专利族引用专利公开号,因此,通过上述基本专利族指针、上述扩展专利族指针和上述引用专利公开号,得到上述专利文件的基本专利族引用专利公开号和扩展专利族引用专利公开号,包括以下步骤(1)至步骤(4):
(1)查询与待存储的上述专利文件的基本专利族指针相关联的第一申请号和与上述扩展专利族指针相关联的第二申请号;
(2)分别查询上述第一申请号的第一引用专利公开号和上述第二申请号的第二引用专利公开号;
(3)将查询到的上述第一引用专利公开号设置为上述专利文件的基本专利族引用专利公开号;
(4)将查询到的上述第二引用专利公开号设置为上述专利文件的扩展专利族引用专利公开号。
在上述步骤(1)中,第一申请号就是与待存储的专利文件处于同一基本专利族的所有专利文件的申请号;第二申请号就是与待存储的专利文件处于同一扩展专利族的所有专利文件的申请号。
在上述步骤(2)中,第一引用专利公开号,就是第一申请号所对应的专利文件中所引用的专利文件的公开号;第二引用专利公开号,就是第二申请号所对应的专利文件中所引用的专利文件的公开号。
在得到上述基本专利族引用专利公开号和上述扩展专利族引用专利公开号之后,可以通过以下步骤得到上述专利文件的专利被引公开号、基本专利族专利被引公开号和扩展专利族专利被引公开号。根据上述专利文件的引用专利公开号、上述基本专利族引用专利公开号和上述扩展专利族引用专利公开号,得到上述专利文件的专利被引公开号、基本专利族专利被引公开号和扩展专利族专利被引公开号,包括以下步骤(1)至步骤(3):
(1)分别查询与上述第一申请号相关的第一公开号以及与上述第二申请号相关的第二公开号;
(2)查询待存储的上述专利文件记录的专利公告号,并将查询到的上述专利公告号设置为上述专利文件的专利被引公开号;
(3)分别查询上述第一公开号和上述第二公开号分别对应的专利文件中记录的第一专利公告号和第二专利公告号,并将查询到的上述第一专利公告号和上述第二专利公告号分别设置为上述专利文件的基本专利族专利被引公开号和扩展专利族专利被引公开号。
在上述步骤(1)中,第一公开号就是第一申请号所对应的专利文件中记载的专利文件公开号;第二公开号就是第一申请号所对应的专利文件中记载的专利文件公开号。
在执行上述步骤的过程中,上述第一申请号、上述第二申请号、上述第一引用专利公开号、上述第二引用专利公开号、上述第一公开号、上述第二公开号和上述专利公告号均是从相关专利文件的相关专利文件信息中查询到的。
综上所述,通过生成包括基本专利族指针、扩展专利族指针、基本专利族引用专利公开号、扩展专利族引用专利公开号、专利被引公开号、基本专利族专利被引公开号和扩展专利族专利被引公开号的标引信息集合,可以保证待存储的专利文件会生成和之前归属的专利族相同的专利族指针,从而不会被误分到其他专利族,从而准确标识专利文件所归属的专利族。
实施例2
参见图2,本实施例提出一种专利文件处理装置,用于执行上述的专利文件处理方法,包括:
专利文件获取模块200,用于获取待存储的专利文件;
信息获取模块202,用于从上述待存储的专利文件中获取上述专利文件中的相关专利文件信息;
标引信息生成模块204,用于根据上述相关专利文件信息,生成上述专利文件的标引信息集合;
存储模块206,用于存储上述专利文件、上述专利文件中的相关专利文件信息和上述标引信息集合。
综上所述,本发明实施例提供的专利文件处理装置,通过从待存储的专利文件中提取专利文件中的相关专利文件信息,进而根据相关专利文件信息生成专利文件的标引信息集合,然后对生成的专利文件的标引信息集合进行存储,与现有技术中需要人工对专利文件进行标引的过程相比,无需人工标引,避免了人工标引的过程中容易出现标引错误的缺陷,提高了专利文件的标引效率。
相关技术中,专利文件检索网站只能在用户检索专利文件时,向用户展示用户所检索的专利文件以及该专利文件的专利信息,所以向用户展示的专利信息较少,因此,为了增加向用户展示的专利信息,参见图4,上述标引信息生成模块204,包括:
专利族识别码生成单元2040,用于根据上述相关专利文件信息,生成上述专利文件的专利族识别码,其中,上述相关专利文件信息包括上述专利文件的优先权号、优先权日、引用专利公开号和申请号;
专利族指针生成单元2042,用于根据上述专利族识别码,生成上述专利文件的基本专利族指针和扩展专利族指针;
第一信息生成单元2044,用于通过上述基本专利族指针、上述扩展专利族指针和上述引用专利公开号,生成上述专利文件的基本专利族引用专利公开号和扩展专利族引用专利公开号;
第二信息生成单元2046,用于根据上述专利文件的引用专利公开号、上述基本专利族引用专利公开号和上述扩展专利族引用专利公开号,得到上述专利文件的专利被引公开号、基本专利族专利被引公开号和扩展专利族专利被引公开号;
第三信息生成单元2048,用于根据上述基本专利族指针、上述扩展专利族指针、上述基本专利族引用专利公开号、上述扩展专利族引用专利公开号、上述专利被引公开号、上述基本专利族专利被引公开号和上述扩展专利族专利被引公开号,生成上述专利文件的标引信息集合中。
综上所述,通过生成包括基本专利族指针、扩展专利族指针、基本专利族引用专利公开号、扩展专利族引用专利公开号、专利被引公开号、基本专利族专利被引公开号和扩展专利族专利被引公开号的标引信息集合,在不同情形下对专利文件进行全方位的搜索、浏览和分析,大大扩展了专利文件所引用的专利信息的范围,在向用户展示专利文件时,可以提供更全面和准确的专利族信息,同时提供了按照这些专利族信息进行扩展的更加全面的专利引用信息,便于开展专利引用信息的研究。
为了在向用户展示用户查询的专利文件同时向用户展示更多的专利文件标引信息,上述专利族识别码生成单元,具体用于:
当确定提取到的上述相关专利文件信息未包括优先权号和优先权日时,将上述专利文件的申请号和申请日分别作为上述专利文件的优先权号和优先权日;
对上述优先权号和上述优先权日中记录的字符信息进行加密处理,生成上述专利文件的专利族识别码。
本发明实施例所提供的进行专利文件处理方法的计算机程序产品,包括存储了程序代码的计算机可读存储介质,上述程序代码包括的指令可用于执行前面方法实施例中上述的方法,具体实现可参见方法实施例,在此不再赘述。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,上述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
上述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
上述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例上述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上上述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应上述以权利要求的保护范围为准。

Claims (10)

1.一种专利文件处理方法,其特征在于,包括:
获取待存储的专利文件;
从所述待存储的专利文件中获取所述专利文件中的相关专利文件信息;
根据所述相关专利文件信息,生成所述专利文件的标引信息集合;
存储所述专利文件、所述专利文件中的相关专利文件信息和所述标引信息集合。
2.根据权利要求1所述的方法,其特征在于,根据所述相关专利文件信息,生成所述专利文件的标引信息集合,包括:
根据所述相关专利文件信息,生成所述专利文件的专利族识别码,其中,所述相关专利文件信息包括所述专利文件的优先权号、优先权日、引用专利公开号和申请号;
根据所述专利族识别码,生成所述专利文件的基本专利族指针和扩展专利族指针;
通过所述基本专利族指针、所述扩展专利族指针和所述引用专利公开号,生成所述专利文件的基本专利族引用专利公开号和扩展专利族引用专利公开号;
根据所述专利文件的引用专利公开号、所述基本专利族引用专利公开号和所述扩展专利族引用专利公开号,得到所述专利文件的专利被引公开号、基本专利族专利被引公开号和扩展专利族专利被引公开号;
根据所述基本专利族指针、所述扩展专利族指针、所述基本专利族引用专利公开号、所述扩展专利族引用专利公开号、所述专利被引公开号、所述基本专利族专利被引公开号和所述扩展专利族专利被引公开号,生成所述专利文件的标引信息集合中。
3.根据权利要求2所述的方法,其特征在于,根据所述相关专利文件信息,生成所述专利文件的专利族识别码,包括:
当确定提取到的所述相关专利文件信息未包括优先权号和优先权日时,将所述专利文件的申请号和申请日分别作为所述专利文件的优先权号和优先权日;
对所述优先权号和所述优先权日中记录的字符信息进行加密处理,生成所述专利文件的专利族识别码。
4.根据权利要求2所述的方法,其特征在于,根据所述专利族识别码,生成所述专利文件的基本专利族指针,包括:
生成所述专利文件的所述专利族识别码和所述申请号的关联关系;
当有待存储的所述专利文件的基本专利族指针为空时,根据所述专利族识别码和所述申请号的关联关系,将所述申请号对应的专利族识别码设置为所述专利文件的基本专利族指针。
5.根据权利要求4所述的方法,其特征在于,根据所述专利族识别码,生成所述专利文件的扩展专利族指针,包括:
当有待存储的所述专利文件的扩展专利族指针为空时,设置所述专利族识别码为所述申请号的扩展专利族指针;
查找所述专利族识别码关联的所有申请号;
查找所述所有申请号关联的所有专利族识别码;
查找所述所有专利族识别码关联的申请号;
将所述专利族识别码设置为所述所有专利族识别码关联的申请号的扩展专利族指针。
6.根据权利要求2所述的方法,其特征在于,通过所述基本专利族指针、所述扩展专利族指针和所述引用专利公开号,得到所述专利文件的基本专利族引用专利公开号和扩展专利族引用专利公开号,包括:
查询与待存储的所述专利文件的基本专利族指针相关联的第一申请号和与所述扩展专利族指针相关联的第二申请号;
分别查询所述第一申请号的第一引用专利公开号和所述第二申请号的第二引用专利公开号;
将查询到的所述第一引用专利公开号设置为所述专利文件的基本专利族引用专利公开号;
将查询到的所述第二引用专利公开号设置为所述专利文件的扩展专利族引用专利公开号。
7.根据权利要求6所述的方法,其特征在于,根据所述专利文件的引用专利公开号、所述基本专利族引用专利公开号和所述扩展专利族引用专利公开号,得到所述专利文件的专利被引公开号、基本专利族专利被引公开号和扩展专利族专利被引公开号,包括:
分别查询与所述第一申请号相关的第一公开号以及与所述第二申请号相关的第二公开号;
查询待存储的所述专利文件记录的专利公告号,并将查询到的所述专利公告号设置为所述专利文件的专利被引公开号;
分别查询所述第一公开号和所述第二公开号分别对应的专利文件中记录的第一专利公告号和第二专利公告号,并将查询到的所述第一专利公告号和所述第二专利公告号分别设置为所述专利文件的基本专利族专利被引公开号和扩展专利族专利被引公开号。
8.一种专利文件处理装置,其特征在于,包括:
专利文件获取模块,用于获取待存储的专利文件;
信息获取模块,用于从所述待存储的专利文件中获取所述专利文件中的相关专利文件信息;
标引信息生成模块,用于根据所述相关专利文件信息,生成所述专利文件的标引信息集合;
存储模块,用于存储所述专利文件、所述专利文件中的相关专利文件信息和所述标引信息集合。
9.根据权利要求8所述的装置,其特征在于,所述标引信息生成模块,包括:
专利族识别码生成单元,用于根据所述相关专利文件信息,生成所述专利文件的专利族识别码,其中,所述相关专利文件信息包括所述专利文件的优先权号、优先权日、引用专利公开号和申请号;
专利族指针生成单元,用于根据所述专利族识别码,生成所述专利文件的基本专利族指针和扩展专利族指针;
第一信息生成单元,用于通过所述基本专利族指针、所述扩展专利族指针和所述引用专利公开号,生成所述专利文件的基本专利族引用专利公开号和扩展专利族引用专利公开号;
第二信息生成单元,用于根据所述专利文件的引用专利公开号、所述基本专利族引用专利公开号和所述扩展专利族引用专利公开号,得到所述专利文件的专利被引公开号、基本专利族专利被引公开号和扩展专利族专利被引公开号;
第三信息生成单元,用于根据所述基本专利族指针、所述扩展专利族指针、所述基本专利族引用专利公开号、所述扩展专利族引用专利公开号、所述专利被引公开号、所述基本专利族专利被引公开号和所述扩展专利族专利被引公开号,生成所述专利文件的标引信息集合中。
10.根据权利要求9所述的装置,其特征在于,所述专利族识别码生成单元,具体用于:
当确定提取到的所述相关专利文件信息未包括优先权号和优先权日时,将所述专利文件的申请号和申请日分别作为所述专利文件的优先权号和优先权日;
对所述优先权号和所述优先权日中记录的字符信息进行加密处理,生成所述专利文件的专利族识别码。
CN201611157245.0A 2016-12-15 2016-12-15 一种专利文件处理方法和装置 Pending CN106547927A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201611157245.0A CN106547927A (zh) 2016-12-15 2016-12-15 一种专利文件处理方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201611157245.0A CN106547927A (zh) 2016-12-15 2016-12-15 一种专利文件处理方法和装置

Publications (1)

Publication Number Publication Date
CN106547927A true CN106547927A (zh) 2017-03-29

Family

ID=58397278

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201611157245.0A Pending CN106547927A (zh) 2016-12-15 2016-12-15 一种专利文件处理方法和装置

Country Status (1)

Country Link
CN (1) CN106547927A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112667691A (zh) * 2021-03-16 2021-04-16 中汽数据有限公司 基于数据库的专利标引方法、装置、设备和存储介质

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101001254A (zh) * 2006-12-29 2007-07-18 上海汉光知识产权数据科技有限公司 一种专利下载系统及方法
CN101201847A (zh) * 2007-12-26 2008-06-18 北京东方灵盾科技有限公司 一种传统药物专利信息检索系统及检索方法
US20080228752A1 (en) * 2007-03-16 2008-09-18 Sunonwealth Electric Machine Industry Co., Ltd. Technical correlation analysis method for evaluating patents
CN101276345A (zh) * 2007-03-29 2008-10-01 上海汉光知识产权数据科技有限公司 专利数据分析系统
CN101685463A (zh) * 2009-05-31 2010-03-31 上海汉光知识产权数据科技有限公司 专利文献的分类标引方法
CN101692228A (zh) * 2009-05-31 2010-04-07 上海汉光知识产权数据科技有限公司 专利文献的准确快速自动标引方法
CN101697164A (zh) * 2009-10-30 2010-04-21 北京东方灵盾科技有限公司 一种传统药物专利文献的信息提取方法、系统和装置
CN102722495A (zh) * 2011-03-30 2012-10-10 上海铂龙信息科技有限公司 一种专利文献的标引方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101001254A (zh) * 2006-12-29 2007-07-18 上海汉光知识产权数据科技有限公司 一种专利下载系统及方法
US20080228752A1 (en) * 2007-03-16 2008-09-18 Sunonwealth Electric Machine Industry Co., Ltd. Technical correlation analysis method for evaluating patents
CN101276345A (zh) * 2007-03-29 2008-10-01 上海汉光知识产权数据科技有限公司 专利数据分析系统
CN101201847A (zh) * 2007-12-26 2008-06-18 北京东方灵盾科技有限公司 一种传统药物专利信息检索系统及检索方法
CN101685463A (zh) * 2009-05-31 2010-03-31 上海汉光知识产权数据科技有限公司 专利文献的分类标引方法
CN101692228A (zh) * 2009-05-31 2010-04-07 上海汉光知识产权数据科技有限公司 专利文献的准确快速自动标引方法
CN101697164A (zh) * 2009-10-30 2010-04-21 北京东方灵盾科技有限公司 一种传统药物专利文献的信息提取方法、系统和装置
CN102722495A (zh) * 2011-03-30 2012-10-10 上海铂龙信息科技有限公司 一种专利文献的标引方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
任洁: "专利信息在企业创新发展中的作用及其实践", 《世界金属导报》 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112667691A (zh) * 2021-03-16 2021-04-16 中汽数据有限公司 基于数据库的专利标引方法、装置、设备和存储介质

Similar Documents

Publication Publication Date Title
US11663253B2 (en) Leveraging concepts with information retrieval techniques and knowledge bases
CN102930048B (zh) 使用参考和视觉数据的语义自动发现的数据丰富
CN106934069A (zh) 数据检索方法及系统
US11100151B2 (en) Interactive patent visualization systems and methods
CN103678412A (zh) 一种文档检索的方法及装置
CN105701091B (zh) 一种基于语义的pdf文档的处理方法及处理装置
US6694302B2 (en) System, method and article of manufacture for personal catalog and knowledge management
CN106095964A (zh) 一种对数据进行可视化归档与搜索的方法
CN106528877A (zh) word文档的模块化方法及系统
CN108255915A (zh) 一种文件管理方法、装置及机器可读存储介质
Petrovski et al. The WDC gold standards for product feature extraction and product matching
CN106970913A (zh) 一种时间的提取方法及装置
CN103455497A (zh) 一种提供整合的搜索结果的方法以及系统
Luke Writing the visible page: a multimodal approach to graphic devices in literary fiction
CN106776640A (zh) 一种股票资讯信息展示方法和装置
CN107169011A (zh) 基于人工智能的网页原创性识别方法、装置及存储介质
CN107729330A (zh) 获取数据集的方法和装置
CN106547927A (zh) 一种专利文件处理方法和装置
CN102707938A (zh) 表形式软件规格制作支援方法及装置
CN111159984A (zh) 一种具有智能学习笔记功能的辅助阅读系统
US20210240334A1 (en) Interactive patent visualization systems and methods
CN113722472A (zh) 一种技术文献信息提取方法、系统及存储介质
CN107145947A (zh) 一种信息处理方法、装置及电子设备
Kumar et al. Implementation of MVC (Model-View-Controller) design architecture to develop web based Institutional repositories: A tool for Information and knowledge sharing
JP2012155681A (ja) フォントサーバ

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20170329