CN112667691A - 基于数据库的专利标引方法、装置、设备和存储介质 - Google Patents

基于数据库的专利标引方法、装置、设备和存储介质 Download PDF

Info

Publication number
CN112667691A
CN112667691A CN202110278160.2A CN202110278160A CN112667691A CN 112667691 A CN112667691 A CN 112667691A CN 202110278160 A CN202110278160 A CN 202110278160A CN 112667691 A CN112667691 A CN 112667691A
Authority
CN
China
Prior art keywords
indexing
family number
current
historical
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110278160.2A
Other languages
English (en)
Inventor
王军雷
季南
王亮亮
王灿灿
刘兰
辛明华
张娟
张昭昭
王磊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Cnr Tianjin Automobile Information Consulting Co ltd
Sinotruk Data Co ltd
China Automotive Technology and Research Center Co Ltd
Original Assignee
Cnr Tianjin Automobile Information Consulting Co ltd
Sinotruk Data Co ltd
China Automotive Technology and Research Center Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Cnr Tianjin Automobile Information Consulting Co ltd, Sinotruk Data Co ltd, China Automotive Technology and Research Center Co Ltd filed Critical Cnr Tianjin Automobile Information Consulting Co ltd
Priority to CN202110278160.2A priority Critical patent/CN112667691A/zh
Publication of CN112667691A publication Critical patent/CN112667691A/zh
Pending legal-status Critical Current

Links

Images

Abstract

本发明实施例提供一种基于数据库的专利标引方法、装置、设备和存储介质,涉及专利标引技术领域。方法包括:从全文数据库中读取待重新标引的多件目标专利的当前同族号;在关系型数据库中查找与每件目标专利的当前同族号一致的历史同族号;如果未查找到与所述当前同族号一致的历史同族号,根据所述设定的同族号计算规则得到所述目标专利的临时同族号;在所述关系型数据库中查找与所述临时同族号一致的历史同族号,并读取对应的目标历史标引信息;在标引页面上显示所述目标历史标引信息,并响应于所述用户对所述目标历史标引信息的修改操作,得到当前标引信息。本实施例保证成功找到目标历史标引信息并显示在标引页面上,最终实现重新标引。

Description

基于数据库的专利标引方法、装置、设备和存储介质
技术领域
本发明涉及专利标引领域,具体而言,涉及一种基于数据库的专利标引方法、装置、设备和存储介质。
背景技术
同族专利是基于同一优先权文件,在不同国家或地区,以及地区间专利组织多次申请、多次公布或批准的内容相同或基本相同的一组专利文献,为了表明哪些专利是同族,专利数据供应商(如欧专局)一般采用同族号进行标识,即具有同一同族号的多件专利是同族。
优先权的存在,允许申请人在不同时间向不同国家和地区申请同族专利,使得同族专利在不同时间公开。目前,专利数据供应商会收集最新公开的专利。收集到专利A时,不确定其是否有同族,可能还没有同族号。一段时间后收集到同族的专利B,才对专利A和专利B标记上同族号。
为了方便对海量的专利进行有效组织,一般会提取专利的技术领域、技术手段等信息,并对专利进行标引。在对已标引的专利进行重新标引时,如果已标引专利的同族号发生了变化,而又无法感知哪些专利的同族号发生了变化,哪些没有变化,会找不到之前已标引的信息甚至标引错误。
发明内容
本发明实施例的目的在于提供一种基于数据库的专利标引方法、装置、设备和存储介质,以保证成功找到之前已标引的信息,避免标引错误。
为了实现上述目的,本发明采用以下技术方案:
第一方面,本发明提供了一种基于数据库的专利标引方法,包括:
从全文数据库中读取待重新标引的多件目标专利的当前同族号;
响应于用户对所述多件目标专利的开始标引操作,在关系型数据库中查找与每件目标专利的当前同族号一致的历史同族号;其中,所述关系型数据库存储有所述多件目标专利在前次标引时的历史标引信息和历史同族号;如果每件目标专利在前次标引时不存在同族,则使用根据设定的同族号计算规则得到的历史同族号;
如果未查找到与所述当前同族号一致的历史同族号,根据所述设定的同族号计算规则得到所述目标专利的临时同族号;
在所述关系型数据库中查找与所述临时同族号一致的历史同族号,并读取查找到的历史同族号所对应的目标历史标引信息;
在标引页面上显示所述目标历史标引信息,并响应于所述用户对所述目标历史标引信息的修改操作,得到当前标引信息;
在所述关系型数据库中,根据所述当前同族号,将所述当前标引信息替换所述目标历史标引信息;
将所述关系型数据库中的所述当前标引信息更新至所述全文数据库中与所述当前同族号对应的位置。
第二方面,本发明提供了一种基于专利数据库的专利标引装置,包括:
同族号读取模块,用于从全文数据库中读取待重新标引的多件目标专利的当前同族号;
查找模块,用于响应于用户对所述多件目标专利的开始标引操作,在关系型数据库中查找与每件目标专利的当前同族号一致的历史同族号;其中,所述关系型数据库存储有所述多件目标专利在前次标引时的历史标引信息和历史同族号;如果每件目标专利在前次标引时不存在同族,则使用根据设定的同族号计算规则得到的历史同族号;
计算模块,用于如果未查找到与所述当前同族号一致的历史同族号,根据所述设定的同族号计算规则得到所述目标专利的临时同族号;
再次查找模块,用于在所述关系型数据库中查找与所述临时同族号一致的历史同族号,并读取查找到的历史同族号所对应的目标历史标引信息;
显示模块,用于在标引页面上显示所述目标历史标引信息,并响应于所述用户对所述目标历史标引信息的修改操作,得到当前标引信息;
替换模块,用于在所述关系型数据库中,根据所述当前同族号,将所述当前标引信息替换所述目标历史标引信息;
更新模块,用于将所述关系型数据库中的所述当前标引信息更新至所述全文数据库中与所述当前同族号对应的位置。
第三方面,本发明实施例提供了一种电子设备,包括:
一个或多个处理器;
存储器,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现任一实施例所述的基于数据库的专利标引方法。
第四方面,本发明实施例提供了一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现任一实施例所述的基于数据库的专利标引方法。
本实施例中,目标专利在前次标引时不存在同族,则使用根据设定的同族号计算规则得到的历史同族号,从而不论专利是否存在同族,均会有一个同族号,则同一同族号的专利会标注上同样的标引信息,从而不用区分专利是否为同族,可以采用统一的方法、高效率标引。在“使用根据设定的同族号计算规则得到的历史同族号”的基础上,本实施例将前次标引时的历史同族号和历史标引信息均存储在关系型数据库中。在进行重新标引时,查找不到与当前同族号一致的历史同族号时,根据所述设定的同族号计算规则得到所述目标专利的临时同族号,并继续进行查找和读取,保证成功找到目标历史标引信息并显示在标引页面上,最终实现重新标引。本实施例在所述关系型数据库中,根据所述当前同族号,将所述当前标引信息替换所述目标历史标引信息;将所述关系型数据库中的所述当前标引信息更新至所述全文数据库中与所述当前同族号对应的位置,这种整体更新的方式,在保证标引效率的同时有效保证了标引的正确性。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的基于数据库的专利标引方法的流程图;
图2是本发明实施例提供的另一种基于数据库的专利标引方法的流程图;
图3是本发明实施例提供的一种基于数据库的专利标引装置的结构示意图;
图4为本发明实施例提供的一种电子设备的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将对本发明的技术方案进行清楚、完整的描述。显然,所描述的实施例仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所得到的所有其它实施例,都属于本发明所保护的范围。
在本发明的描述中,需要说明的是,术语“中心”、“上”、“下”、“左”、“右”、“竖直”、“水平”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。此外,术语“第一”、“第二”、“第三”仅用于描述目的,而不能理解为指示或暗示相对重要性。
在本发明的描述中,还需要说明的是,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。
图1是本发明实施例提供的基于数据库的专利标引方法的流程图,本实施例适用于在对已标引的专利进行重新标引时,存在同族号变化的情况。本方法可以由基于数据库的专利标引装置执行,该装置由软件和/或硬件沟通,并一般集成在电子设备中。
本实施例提供的方法包括以下操作:
S110、从全文数据库中读取待重新标引的多件目标专利的当前同族号。
全文数据库,如TRS全文数据库,是以结构化及非结构化数据检索为关注视角的数据库。全文数据库包括专利文本、当前同族号、著录项目、专利标引状态和最终标引信息。全文数据库中的内容通过采集现阶段公开的全球范围内专利而得到,而且会根据最新的专利申请情况不定时更新全文数据库,例如增加新公开的专利文本等信息、变更著录项目以及改变当前同族号。
在采集一新公开的专利信息之后,如果不存在该专利的同族专利,则根据设定的同族号计算规则得到该专利的同族号,并写入全文数据库。可选的,同族号计算规则为申请国标识、申请号标识和自定义字符串的组合。一段时间后,如果采集到该专利的同族,则将这两个专利的同族号均更新为一致的同族号(欧专局的专利数据库所提供的同族号),用于标识它们属于同族。在对该专利进行前次标引时,即标注该专利的技术领域、技术效果和技术手段,如果不存在该专利的同族专利,则继续使用根据设定的同族号计算规则得到的同族号。
在前次标引后,会将该专利的同族号(根据设定的同族号计算规则得到)和标引信息写入关系型数据库中,如Oracle数据库。然后,将该专利的标引信息更新至全文数据库中与同族号对应的位置,作为最终标引信息。
由于技术领域、技术手段和技术手段会随着技术发展和业务需求而更新,需要对已标引的专利进行重新标引。为了方便描述和区分,将前次标引过程中的标引信息和同族号称为历史标引信息和历史同族号;将重新标引过程中的标引信息和同族号称为当前标引信息和当前同族号。而且,将待重新标引的专利称为目标专利。在重新标引时,目标专利可能出现了同族,导致当前同族号发生了变更,与历史同族号不再一致;也可能未出现同族,从而当前同族号未发生变更,与历史同族号保持一致。
S120、响应于用户对所述多件目标专利的开始标引操作,在关系型数据库中查找与每件目标专利的当前同族号一致的历史同族号;其中,所述关系型数据库存储有所述多件目标专利在前次标引时的历史标引信息和历史同族号。
可选的,开始标引操作包括开始批量标引操作和开始逐件标引操作。用户需要对多件目标专利进行批量标引时,可以点击页面上的“批量”控件,进而设备在关系型数据库中查找与每件目标专利的当前同族号一致的历史同族号。用户需要对多件目标专利进行逐件标引时,可以点击每件目标专利的题目,进而设备在关系型数据库中查找与对应的目标专利的当前同族号一致的历史同族号。
对于历史同族号的描述详见上述实施例记载,此处不再赘述。
S130、如果未查找到与所述当前同族号一致的历史同族号,根据设定的同族号计算规则得到所述目标专利的临时同族号。
如果查找到与当前同族号一致的历史同族号,说明同族号未发生变更,则直接读取历史同族号对应的目标历史标引信息,并执行S150。如果未查找到与当前同族号一致的历史同族号,说明同族号发生了变更,则根据设定的同族号计算规则得到所述目标专利的临时同族号。
为了方便描述和区分,将在重新标引时对目标专利根据同族号计算规则得到的同族号,称为临时同族号。
可选的,同族号计算规则可能随时间的进行演变有多个版本,不能确定历史同族号根据哪个版本计算得到。基于此,优先根据最新版的同族号计算规则得到临时同族号,并进行查找;找不到时再根据次新版的同族号计算规则得到临时同族号,并进行查找。以此类推,直到找到一致的历史同族号。
S140、在所述关系型数据库中查找与所述临时同族号一致的历史同族号,并读取查找到的历史同族号所对应的目标历史标引信息。
由于关系型数据库中已存储的历史同族号根据同族号计算规则得到,因此,S140处能够查找到与临时同族号一致的历史同族号,进而读取对应的目标历史标引信息。
为了方便描述和区分,将目标专利的历史同族号所对应的历史标引信息称为目标历史标引信息。
S150、在标引页面上显示所述目标历史标引信息,并响应于所述用户对所述目标历史标引信息的修改操作,得到当前标引信息。
本实施例中的重新标引具体为对目标历史标引信息进行修改,可以全部修改,也可以部分修改。可选的,响应于用户对目标历史标引信息的部分修改操作,得到当前部分标引信息。示例性的,标引信息包括技术领域、技术手段和技术效果,当前部分标引信息包括技术领域、技术手段和技术效果中的一种或两种组合。
为了便于用户修改,需要在标引页面上显示出目标历史标引信息,并将目标历史标引信息设置为可编辑状态。用户可以对目标历史标引信息进行删除、写入、选中和粘贴等操作,得到修改后的当前标引信息,从而完成对目标专利的重新标引。
S160、在所述关系型数据库中,根据所述当前同族号,将所述当前标引信息替换所述目标历史标引信息。
具体的,关系型数据库中的历史同族号不变,只将目标历史标引信息替换为当前标引信息。
由于用户可能全部修改,也可能部分修改,为了提高修改效率,本实施例不对用户是否全部修改做区分,而是仅将当前修改的标引信息去替换历史标引信息中的对应部分。
可选的,如果当前标引信息为当前部分标引信息,即本次仅对部分标引信息进行了修改,则在所述关系型数据库中,根据所述当前同族号,将所述当前部分标引信息替换所述目标历史标引信息中的对应部分。示例性的,如果本次仅修改了技术领域,则将修改后的技术领域替换历史技术领域,并保持关系型数据库中的技术手段和技术效果不变。如果本次全部修改了技术领域、技术效果和技术手段,则分别替换关系型数据库中的历史技术领域、历史技术手段和历史技术效果。
在得到当前当前标引信息之后,首先更新关系型数据库,以便下次重新标引时可以读取到最新的标引信息。
S170、将所述关系型数据库中的所述当前标引信息更新至所述全文数据库中与所述当前同族号对应的位置。
全文数据库将作为最终用户使用的专利数据源,所以还需要将关系型数据库中的当前标引信息更新至全文数据库中与所述当前同族号对应的位置。
为了提高重新标引的效率,将关系型数据库中的所有当前标引信息作为整体,更新到全文数据库中与当前同族号对应的位置,而不再关注/识别具体更新哪个标引信息,因此全文数据库中也不需要区分具体的标引信息,可以1个标引字段表示最终标引信息。具体的,1个标引字段包括技术领域、技术手段和技术效果。
可选的,即使仅修改部分标引信息,关系型数据库中依然存储了由当前部分标引信息和另一部分目标历史标引信息构成的完整当前标引信息,则将所述关系型数据库中的所述当前部分标引信息和另一部分目标历史标引信息整体替换所述全文数据库中与所述当前同族号对应的标引字段。
在一具体应用场景中,如果用户的前次标引是初次标引,则重新标引是对初次标引的校验;如果用户的前次标引是校验,则重新标引是对校验结果的审核;如果用户的前次标引是审核结果,即完成了整个标引流程,则重新标引是对最终标引信息的修改。在一具体应用场景中,只有得到了审核结果才会将最终的标引信息更新至全文数据库,初次标引结果和校验结果并不是最终的标引信息,只会更新至关系型数据库,不会更新到全文数据库。
基于上述描述,如果前次标引是审核,则在前次标引时已经将历史标引信息存储至全文数据库中作为最终标引信息,即存储到标引字段,则重新标引完成后,还需要将完整的当前标引信息整体替换该标引字段,即完整的当前标引信息作为了新的标引字段。
值得说明的是,同族专利的内容是相同或相似的,则标引信息是相同的。如果同族号发生变更,说明全文数据库采集到了同族专利,且同族专利被标注了一致的同族号(即当前同族号)。因此,通过将所述关系型数据库中的所述当前标引信息更新至所述全文数据库中与所述当前同族号对应的位置,从而同族专利均标注上同样的当前标引信息,避免同族专利重复标注。
值得说明的是,由于全文数据库也会存储最终标引信息,然而在重新标引专利时,却向关系型数据库查找一致的历史同族号和历史标引信息,而非直接从全文数据库中查找和读取,这是因为:关系型数据库采用表格的储存方式,数据以行和列的方式进行存储,要读取和查询都十分方便。因此,采用关系型数据库作为“桥梁”实现高效率的标引。
本实施例中,目标专利在前次标引时不存在同族,则使用根据设定的同族号计算规则得到的历史同族号,从而不论专利是否存在同族,均会有一个同族号,则同一同族号的专利会标注上同样的标引信息,从而不用区分专利是否为同族,可以采用统一的方法、高效率标引。在“使用根据设定的同族号计算规则得到的历史同族号”的基础上,本实施例将前次标引时的历史同族号和历史标引信息均存储在关系型数据库中。在进行重新标引时,查找不到与当前同族号一致的历史同族号时,根据所述设定的同族号计算规则得到所述目标专利的临时同族号,并继续进行查找和读取,保证成功找到目标历史标引信息并显示在标引页面上,最终实现重新标引。本实施例在所述关系型数据库中,根据所述当前同族号,将所述当前标引信息替换所述目标历史标引信息;将所述关系型数据库中的所述当前标引信息更新至所述全文数据库中与所述当前同族号对应的位置,这种整体更新的方式,在保证标引效率的同时有效保证了标引的正确性。
在上述实施例和下述实施例中,在读取待重新标引的多件目标专利时,为了避免读取到同族专利,导致重复标引,可以针对性的读取同族专利中的一件专利。可选的,从全文数据库中读取待重新标引的多件目标专利的当前同族号,包括:从全文数据库中选取已标引的,向指定国申请的多件候选专利;如果所述多件候选专利中存在当前同族号相同的专利,从所述当前同族号相同的专利中删除申请日在后的专利,得到多件目标专利;从所述全文数据库中读取所述多件目标专利的当前同族号。
其中,指定国可以是中国。如果向指定国申请了同族号相同的多件专利,则还需要从中选取申请日最早的专利,作为目标专利,保证用户只需标引同族中的1件专利。
图2是本发明实施例提供的另一种基于数据库的专利标引方法的流程图,本实施例适用于批量标引的情况。不同于逐件标引,批量标引的专利数量巨大,需要的标引效率更高。因此,在查找一致的历史同族号之前,将全文数据库中的历史同族号和历史标引信息批量添加到关系型数据库中,提高在关系型数据库中一次性找到历史同族号的概率。具体包括以下操作:
S210、从全文数据库中读取待重新标引的多件目标专利的当前同族号。
S220、响应于用户对所述多件目标专利的开始批量标引操作,从所述全文数据库中读取所述多件目标专利的历史标引信息。
在前次标引时,将当时得到的标引信息同时存储到了关系型数据库和全文数据库中,则此时,全文数据库中目标专利的历史标引信息与关系型数据库中是一致的,但全文数据库中存储的是当前同族号,不一定与关系型数据库中的历史同族号一致。具体详见上述实施例中描述,此处不在赘述。
S230、将所述多件目标专利的历史标引信息和当前同族号添加至所述关系型数据库中。
具体以数据批量增加的方式向关系型数据库中添加历史标引信息和当前同族号。此时,关系型数据库中会存储同一专利的两条信息,一条是历史标引信息和历史同族号,另一条是新添加的历史标引信息和当前同族号。
如果在开始重复标引前,采集到一目标专利的同族专利,即该目标专利发生了同族号的变更,则关系型数据库中该目标专利的历史同族号与当前同族号不同。
如果在前次标引到重复标引的过程中,采集到一目标专利的同族专利,即该目标专利没有发生同族号的变更,则关系型数据库中该目标专利的历史同族号与当前同族号相同,就会查找到两个一致的同族号,导致错误。因此,在将所述多件目标专利的历史标引信息和当前同族号添加至所述关系型数据库中之后,还包括:在所述关系型数据库中查找与所述当前同族号一致的历史同族号;将所述与当前同族号一致的历史同族号以及对应的历史标引信息删除。
S240、在关系型数据库中查找与每件目标专利的当前同族号一致的历史同族号或当前同族号。
如果关系型数据库中该目标专利的历史同族号与当前同族号不同,则会一次性查找到与当前同族号一致的当前同族号;如果关系型数据库中该目标专利的历史同族号与当前同族号相同,仅保留了当前同族号以及对应的历史标引信息,则会一次性查找到与当前同族号一直的当前同族号。
S250、如果未查找到与所述当前同族号一致的历史同族号或当前同族号,根据所述设定的同族号计算规则得到所述目标专利的临时同族号。
在一种特殊情况下,在将多件目标专利的历史标引信息和当前同族号添加至所述关系型数据库中之后,用户进行批量标引的过程中,目标专利的当前同族号发生变更,则关系型数据库中存储的当前同族号与此时变更后的同族号也是不一致的,则在关系型数据库中不会查找到与(变更后的)当前同族号一致的当前同族号,则根据设定的同族号计算规则得到所述目标专利的临时同族号。
S260、在所述关系型数据库中查找与所述临时同族号一致的历史同族号,并读取查找到的历史同族号所对应的目标历史标引信息。
S270、在标引页面上显示所述目标历史标引信息,并响应于所述用户对所述目标历史标引信息的修改操作,得到当前标引信息。
S280、在所述关系型数据库中,根据所述当前同族号,将所述当前标引信息替换所述目标历史标引信息。
S290、将所述关系型数据库中的所述当前标引信息更新至所述全文数据库中与所述当前同族号对应的位置。
在上述实施例中,为了避免用户批量标引的过程中,由于同族号变更导致不能在关系型数据库中一次性找到历史同族号/当前同族号的情况,在从所述全文数据库中读取所述多件目标专利的历史标引信息之后,还包括:锁定所述全文数据库中的当前同族号,保证当前同族号不再变化。等到S290之后,解除全文数据库中对当前同族号的锁定。
下面以一具体实施方式,详细描述专利的初次标引、校验和审核过程。
在初次标引时,在全文数据库中,将待标引的多件目标专利根据专利的属性信息和文中关键字,划分为多个任务包,一个任务包包括多件目标专利。其中属性信息包括申请国家,使用语言和分类号等。具体的,预先根据专利的属性信息构建多个检索式,在全文数据库中根据检索式对专利文本进行全文检索,从而得到符合各检索式的多组目标专利,形成多个标引任务包,以包号为标识。设备将各标引任务包发送至对应的用户。设备响应于用户对多件目标专利的开始标引操作,根据任务包号从全文数据库中确定当前同族号,并将当前同族号对应的专利文本显示在标引页面上。响应于用户的标引操作得到标引信息,并将标引信息和当前同族号(作为校验过程的历史标引信息和历史同族号)存储至关系型数据库中;同时,将标引信息中的技术领域存储至全文数据库中的指定字段下。
然后,在初次标引后所有目标专利存储至待校验专利池,根据各目标专利的指定字段进下的技术领域进行检索和划分,生成多个校验任务包,以包号为标识。将多个任务包分别发送至用户进行校验。根据包号从全文数据库中读取待重新标引的多件目标专利的当前同族号;响应于用户对所述多件目标专利的开始标引操作,在关系型数据库中查找与每件目标专利的当前同族号一致的历史同族号;如果未查找到与所述当前同族号一致的历史同族号,根据所述设定的同族号计算规则得到所述目标专利的临时同族号;在所述关系型数据库中查找与所述临时同族号一致的历史同族号,并读取查找到的历史同族号所对应的目标历史标引信息;在标引页面上显示所述目标历史标引信息,并响应于所述用户对所述目标历史标引信息的修改操作,得到当前标引信息;在所述关系型数据库中,根据所述当前同族号,将所述当前标引信息(作为审核过程的历史标引信息替换所述目标历史标引信息。
完成所有目标专利的校验后,将校验任务包转换为审核任务包,以包号为标识。将多个审核任务包分别发送至用户进行审核。在审核时,从全文数据库中读取待重新标引的多件目标专利的当前同族号;响应于用户对所述多件目标专利的开始标引操作,在关系型数据库中查找与每件目标专利的当前同族号一致的历史同族号;如果未查找到与所述当前同族号一致的历史同族号,根据所述设定的同族号计算规则得到所述目标专利的临时同族号;在所述关系型数据库中查找与所述临时同族号一致的历史同族号,并读取查找到的历史同族号所对应的目标历史标引信息;在标引页面上显示所述目标历史标引信息,并响应于所述用户对所述目标历史标引信息的修改操作,得到当前标引信息;在所述关系型数据库中,根据所述当前同族号,将所述当前标引信息替换所述目标历史标引信息;将所述关系型数据库中的所述当前标引信息更新至所述全文数据库中与所述当前同族号对应的位置。
可选的,关系型数据库包括:标引、审核、校验任务包的状态(包括处理中、完成、退回、未处理),每件专利的标引信息(根据标引、校验、审核过程实时更新)。全文数据库中还存储有专利标引状态(包括已标引和未标引),便于对整个标引过程进行监控和汇总。
图3是本发明实施例提供的一种基于数据库的专利标引装置的结构示意图,本发明实施例适用于在对已标引的专利进行重新标引时,存在同族号变化的情况。结合图3,基于数据库的专利标引装置包括:同族号读取模块310、查找模块320、计算模块330、再次查找模块340、显示模块350、替换模块360和更新模块370。
同族号读取模块310,用于从全文数据库中读取待重新标引的多件目标专利的当前同族号;
查找模块320,用于响应于用户对所述多件目标专利的开始标引操作,在关系型数据库中查找与每件目标专利的当前同族号一致的历史同族号;其中,所述关系型数据库存储有所述多件目标专利在前次标引时的历史标引信息和历史同族号;如果每件目标专利在前次标引时不存在同族,则使用根据设定的同族号计算规则得到的历史同族号;
计算模块330,用于如果未查找到与所述当前同族号一致的历史同族号,根据所述设定的同族号计算规则得到所述目标专利的临时同族号;
再次查找模块340,用于在所述关系型数据库中查找与所述临时同族号一致的历史同族号,并读取查找到的历史同族号所对应的目标历史标引信息;
显示模块350,用于在标引页面上显示所述目标历史标引信息,并响应于所述用户对所述目标历史标引信息的修改操作,得到当前标引信息;
替换模块360,用于在所述关系型数据库中,根据所述当前同族号,将所述当前标引信息替换所述目标历史标引信息;
更新模块370,用于将所述关系型数据库中的所述当前标引信息更新至所述全文数据库中与所述当前同族号对应的位置。
本实施例中,目标专利在前次标引时不存在同族,则使用根据设定的同族号计算规则得到的历史同族号,从而不论专利是否存在同族,均会有一个同族号,则同一同族号的专利会标注上同样的标引信息,从而不用区分专利是否为同族,可以采用统一的方法、高效率标引。在“使用根据设定的同族号计算规则得到的历史同族号”的基础上,本实施例将前次标引时的历史同族号和历史标引信息均存储在关系型数据库中。在进行重新标引时,查找不到与当前同族号一致的历史同族号时,根据所述设定的同族号计算规则得到所述目标专利的临时同族号,并继续进行查找和读取,保证成功找到目标历史标引信息并显示在标引页面上,最终实现重新标引。本实施例在所述关系型数据库中,根据所述当前同族号,将所述当前标引信息替换所述目标历史标引信息;将所述关系型数据库中的所述当前标引信息更新至所述全文数据库中与所述当前同族号对应的位置,这种整体更新的方式,在保证标引效率的同时有效保证了标引的正确性。
可选的,所述开始标引操作包括开始批量标引操作。所述装置还包括:标引信息读取模块,用于在关系型数据库中查找与每件目标专利的当前同族号一致的历史同族号之前,响应于用户对所述多件目标专利的开始批量标引操作,从所述全文数据库中读取所述多件目标专利的历史标引信息;添加模块,用于将所述多件目标专利的历史标引信息和当前同族号添加至所述关系型数据库中。
可选的,该装置还包括删除模块,用于在将所述多件目标专利的历史标引信息和当前同族号添加至所述关系型数据库中之后,在所述关系型数据库中查找与所述当前同族号一致的历史同族号;将所述与当前同族号一致的历史同族号以及对应的历史标引信息删除。
可选的,该装置还包括锁定模块,用于在从所述全文数据库中读取所述多件目标专利的历史标引信息之后,锁定所述全文数据库中的当前同族号。
可选的,显示模块350在响应于所述用户对所述目标历史标引信息的修改操作,得到当前标引信息时,具体用于:响应于所述用户对所述目标历史标引信息的部分修改操作,得到当前部分标引信息。替换模块360具体用于在所述关系型数据库中,根据所述当前同族号,将所述当前部分标引信息替换所述目标历史标引信息中的对应部分。更新模块370具体用于将所述关系型数据库中的所述当前部分标引信息和另一部分目标历史标引信息整体替换所述全文数据库中与所述当前同族号对应的标引字段。其中,所述标引信息包括技术领域、技术手段和技术效果,所述当前部分标引信息包括技术领域、技术手段和技术效果中的一种或两种组合,所述标引字段包括技术领域、技术手段和技术效果。
可选的,同族号读取模块310具体用于从全文数据库中选取已标引的,向指定国申请的多件候选专利;如果所述多件候选专利中存在当前同族号相同的专利,从所述当前同族号相同的专利中删除申请日在后的专利,得到多件目标专利;从所述全文数据库中读取所述多件目标专利的当前同族号。
本发明实施例所提供的基于数据库的专利标引装置可执行本发明任意实施例所提供的基于数据库的专利标引方法,具备执行方法相应的功能模块和有益效果。
图4为本发明实施例提供的一种电子设备的结构示意图,如图4所示,该设备包括处理器40、存储器41、输入装置42和输出装置43;设备中处理器40的数量可以是一个或多个,图4中以一个处理器40为例;设备中的处理器40、存储器41、输入装置42和输出装置43可以通过总线或其他方式连接,图4中以通过总线连接为例。
存储器41作为一种计算机可读存储介质,可用于存储软件程序、计算机可执行程序以及模块,如本发明实施例中的基于数据库的专利标引方法对应的程序指令/模块(例如,基于数据库的专利标引装置中的同族号读取模块310、查找模块320、计算模块330、再次查找模块340、显示模块350、替换模块360和更新模块370)。处理器40通过运行存储在存储器41中的软件程序、指令以及模块,从而执行设备的各种功能应用以及数据处理,即实现上述的基于数据库的专利标引方法。
存储器41可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序;存储数据区可存储根据终端的使用所创建的数据等。此外,存储器41可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实例中,存储器41可进一步包括相对于处理器40远程设置的存储器,这些远程存储器可以通过网络连接至设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
输入装置42可用于接收输入的数字或字符信息,以及产生与设备的用户设置以及功能控制有关的键信号输入。输出装置43可包括显示屏等显示设备。
本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现任一实施例的基于数据库的专利标引方法。
本发明实施例的计算机存储介质,可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、电线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码,程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如”C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络,包括局域网(LAN)或广域网(WAN),连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。

Claims (10)

1.一种基于数据库的专利标引方法,其特征在于,包括:
从全文数据库中读取待重新标引的多件目标专利的当前同族号;
响应于用户对所述多件目标专利的开始标引操作,在关系型数据库中查找与每件目标专利的当前同族号一致的历史同族号;其中,所述关系型数据库存储有所述多件目标专利在前次标引时的历史标引信息和历史同族号;如果每件目标专利在前次标引时不存在同族,则使用根据设定的同族号计算规则得到的历史同族号;
如果未查找到与所述当前同族号一致的历史同族号,根据所述设定的同族号计算规则得到所述目标专利的临时同族号;
在所述关系型数据库中查找与所述临时同族号一致的历史同族号,并读取查找到的历史同族号所对应的目标历史标引信息;
在标引页面上显示所述目标历史标引信息,并响应于所述用户对所述目标历史标引信息的修改操作,得到当前标引信息;
在所述关系型数据库中,根据所述当前同族号,将所述当前标引信息替换所述目标历史标引信息;
将所述关系型数据库中的所述当前标引信息更新至所述全文数据库中与所述当前同族号对应的位置。
2.根据权利要求1所述的方法,其特征在于,所述开始标引操作包括开始批量标引操作;
在关系型数据库中查找与每件目标专利的当前同族号一致的历史同族号之前,还包括:
响应于用户对所述多件目标专利的开始批量标引操作,从所述全文数据库中读取所述多件目标专利的历史标引信息;
将所述多件目标专利的历史标引信息和当前同族号添加至所述关系型数据库中。
3.根据权利要求2所述的方法,其特征在于,在将所述多件目标专利的历史标引信息和当前同族号添加至所述关系型数据库中之后,还包括:
在所述关系型数据库中查找与所述当前同族号一致的历史同族号;
将与所述当前同族号一致的历史同族号以及对应的历史标引信息删除。
4.根据权利要求2所述的方法,其特征在于,在从所述全文数据库中读取所述多件目标专利的历史标引信息之后,还包括:
锁定所述全文数据库中的当前同族号。
5.根据权利要求1所述的方法,其特征在于,所述响应于所述用户对所述目标历史标引信息的修改操作,得到当前标引信息,包括:
响应于所述用户对所述目标历史标引信息的部分修改操作,得到当前部分标引信息;
所述在所述关系型数据库中,根据所述当前同族号,将所述当前标引信息替换所述目标历史标引信息,包括:
在所述关系型数据库中,根据所述当前同族号,将所述当前部分标引信息替换所述目标历史标引信息中的对应部分;
所述将所述关系型数据库中的所述当前标引信息更新至所述全文数据库中与所述当前同族号对应的位置,包括:
将所述关系型数据库中的所述当前部分标引信息和另一部分目标历史标引信息整体替换所述全文数据库中与所述当前同族号对应的标引字段;
其中,所述标引信息包括技术领域、技术手段和技术效果,所述当前部分标引信息包括技术领域、技术手段和技术效果中的一种或两种组合,所述标引字段包括技术领域、技术手段和技术效果。
6.根据权利要求1-5任一项所述的方法,其特征在于,所述从全文数据库中读取待重新标引的多件目标专利的当前同族号,包括:
从全文数据库中选取已标引的,向指定国申请的多件候选专利;
如果所述多件候选专利中存在当前同族号相同的专利,从所述当前同族号相同的专利中删除申请日在后的专利,得到多件目标专利;
从所述全文数据库中读取所述多件目标专利的当前同族号。
7.一种基于专利数据库的专利标引装置,其特征在于,包括:
同族号读取模块,用于从全文数据库中读取待重新标引的多件目标专利的当前同族号;
查找模块,用于响应于用户对所述多件目标专利的开始标引操作,在关系型数据库中查找与每件目标专利的当前同族号一致的历史同族号;其中,所述关系型数据库存储有所述多件目标专利在前次标引时的历史标引信息和历史同族号;如果每件目标专利在前次标引时不存在同族,则使用根据设定的同族号计算规则得到的历史同族号;
计算模块,用于如果未查找到与所述当前同族号一致的历史同族号,根据所述设定的同族号计算规则得到所述目标专利的临时同族号;
再次查找模块,用于在所述关系型数据库中查找与所述临时同族号一致的历史同族号,并读取查找到的历史同族号所对应的目标历史标引信息;
显示模块,用于在标引页面上显示所述目标历史标引信息,并响应于所述用户对所述目标历史标引信息的修改操作,得到当前标引信息;
替换模块,用于在所述关系型数据库中,根据所述当前同族号,将所述当前标引信息替换所述目标历史标引信息;
更新模块,用于将所述关系型数据库中的所述当前标引信息更新至所述全文数据库中与所述当前同族号对应的位置。
8.根据权利要求7所述的装置,其特征在于,所述开始标引操作包括开始批量标引操作;
所述装置还包括:
标引信息读取模块,用于在关系型数据库中查找与每件目标专利的当前同族号一致的历史同族号之前,响应于用户对所述多件目标专利的开始批量标引操作,从所述全文数据库中读取所述多件目标专利的历史标引信息;
添加模块,用于将所述多件目标专利的历史标引信息和当前同族号添加至所述关系型数据库中。
9.一种电子设备,其特征在于,包括:
一个或多个处理器;
存储器,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-6中任一所述的基于数据库的专利标引方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-6中任一所述的基于数据库的专利标引方法。
CN202110278160.2A 2021-03-16 2021-03-16 基于数据库的专利标引方法、装置、设备和存储介质 Pending CN112667691A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110278160.2A CN112667691A (zh) 2021-03-16 2021-03-16 基于数据库的专利标引方法、装置、设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110278160.2A CN112667691A (zh) 2021-03-16 2021-03-16 基于数据库的专利标引方法、装置、设备和存储介质

Publications (1)

Publication Number Publication Date
CN112667691A true CN112667691A (zh) 2021-04-16

Family

ID=75399351

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110278160.2A Pending CN112667691A (zh) 2021-03-16 2021-03-16 基于数据库的专利标引方法、装置、设备和存储介质

Country Status (1)

Country Link
CN (1) CN112667691A (zh)

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102004731A (zh) * 2009-08-28 2011-04-06 上海汉光知识产权数据科技有限公司 申请人同族专利统计分析方法
CN102117303A (zh) * 2009-12-31 2011-07-06 潘晓梅 一种专利数据分析方法和系统
CN102722495A (zh) * 2011-03-30 2012-10-10 上海铂龙信息科技有限公司 一种专利文献的标引方法
KR20130125119A (ko) * 2012-05-08 2013-11-18 (주) 아이피아이 특허 평가 및 분쟁예보 시스템과 그 방법
CN106325933A (zh) * 2016-08-24 2017-01-11 明算科技(北京)股份有限公司 批量数据同步方法和装置
CN106547927A (zh) * 2016-12-15 2017-03-29 北京科华万象科技有限公司 一种专利文件处理方法和装置
CN109726299A (zh) * 2018-12-19 2019-05-07 中国科学院重庆绿色智能技术研究院 一种不完备专利自动标引方法
CN111666443A (zh) * 2020-06-03 2020-09-15 腾讯科技(深圳)有限公司 业务处理方法、装置、电子设备及计算机可读存储介质
CN112380838A (zh) * 2020-10-29 2021-02-19 武汉蝉略科技有限公司 一种基于大数据的专利文件智能标引方法及装置

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102004731A (zh) * 2009-08-28 2011-04-06 上海汉光知识产权数据科技有限公司 申请人同族专利统计分析方法
CN102117303A (zh) * 2009-12-31 2011-07-06 潘晓梅 一种专利数据分析方法和系统
CN102722495A (zh) * 2011-03-30 2012-10-10 上海铂龙信息科技有限公司 一种专利文献的标引方法
KR20130125119A (ko) * 2012-05-08 2013-11-18 (주) 아이피아이 특허 평가 및 분쟁예보 시스템과 그 방법
CN106325933A (zh) * 2016-08-24 2017-01-11 明算科技(北京)股份有限公司 批量数据同步方法和装置
CN106547927A (zh) * 2016-12-15 2017-03-29 北京科华万象科技有限公司 一种专利文件处理方法和装置
CN109726299A (zh) * 2018-12-19 2019-05-07 中国科学院重庆绿色智能技术研究院 一种不完备专利自动标引方法
CN111666443A (zh) * 2020-06-03 2020-09-15 腾讯科技(深圳)有限公司 业务处理方法、装置、电子设备及计算机可读存储介质
CN112380838A (zh) * 2020-10-29 2021-02-19 武汉蝉略科技有限公司 一种基于大数据的专利文件智能标引方法及装置

Similar Documents

Publication Publication Date Title
CN108292323B (zh) 使用数据源的元数据的数据库操作
US10055509B2 (en) Constructing an in-memory representation of a graph
KR102213627B1 (ko) 분석 소프트웨어 관리 시스템 및 분석 소프트웨어 관리 방법
US10930389B2 (en) Systems and methods for the classification and indexing of contract documentation
CN110765773A (zh) 地址数据获取方法以及装置
CN111258990B (zh) 索引库数据迁移方法、装置、设备及存储介质
CN111143370B (zh) 用于分析多个数据表之间关系的方法、设备和计算机可读存储介质
CN112672370A (zh) 网元指标数据的自动检测方法及系统、设备和存储介质
US10261998B2 (en) Search apparatus and search method
US11573987B2 (en) System for detecting data relationships based on sample data
CN110737779A (zh) 知识图谱的构建方法、装置、存储介质和电子设备
EP3388960A1 (en) Systems and methods for constraint driven database searching
CN112905728A (zh) 一种面向多源地名数据的高效融合与检索系统及方法
EP3422177A1 (en) Systems and methods for code parsing and lineage detection
CN111061733B (zh) 数据处理方法、装置、电子设备和计算机可读存储介质
CN112667691A (zh) 基于数据库的专利标引方法、装置、设备和存储介质
CN112835905B (zh) 一种数组类型列的索引方法、装置、设备以及存储介质
JP2004326480A (ja) 大量データの分散並列分析方法
CN111666278A (zh) 数据存储、检索方法、电子设备及存储介质
CN108536819B (zh) 整型列与字符串比较的方法、装置、服务器及存储介质
CN113742321A (zh) 一种数据更新的方法和装置
CN111078671A (zh) 数据表字段的修改方法、装置、设备和介质
US8666972B2 (en) System and method for content management and determination of search conditions
CN114692595B (zh) 一种基于文本匹配的重复冲突方案检测方法
US20220405095A1 (en) Method, device, and program product for managing object in software development project

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information
CB02 Change of applicant information

Address after: 100176 3rd floor, building 4, courtyard 3, boxing 6th Road, Beijing Economic and Technological Development Zone, Daxing District, Beijing

Applicant after: Sinotruk Data Co.,Ltd.

Applicant after: China automobile information technology (Tianjin) Co.,Ltd.

Applicant after: CHINA AUTOMOTIVE TECHNOLOGY AND RESEARCH CENTER Co.,Ltd.

Address before: 100176 3rd floor, building 4, courtyard 3, boxing 6th Road, Beijing Economic and Technological Development Zone, Daxing District, Beijing

Applicant before: Sinotruk Data Co.,Ltd.

Applicant before: CNR (Tianjin) Automobile Information Consulting Co.,Ltd.

Applicant before: CHINA AUTOMOTIVE TECHNOLOGY AND RESEARCH CENTER Co.,Ltd.