CN102722495A - 一种专利文献的标引方法 - Google Patents

一种专利文献的标引方法 Download PDF

Info

Publication number
CN102722495A
CN102722495A CN2011100796370A CN201110079637A CN102722495A CN 102722495 A CN102722495 A CN 102722495A CN 2011100796370 A CN2011100796370 A CN 2011100796370A CN 201110079637 A CN201110079637 A CN 201110079637A CN 102722495 A CN102722495 A CN 102722495A
Authority
CN
China
Prior art keywords
patent documentation
word
technical
index
classification
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2011100796370A
Other languages
English (en)
Inventor
蒋晓山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
SHANGHAI BOLONG INFORMATION TECHNOLOGY Co Ltd
Original Assignee
SHANGHAI BOLONG INFORMATION TECHNOLOGY Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SHANGHAI BOLONG INFORMATION TECHNOLOGY Co Ltd filed Critical SHANGHAI BOLONG INFORMATION TECHNOLOGY Co Ltd
Priority to CN2011100796370A priority Critical patent/CN102722495A/zh
Publication of CN102722495A publication Critical patent/CN102722495A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开一种专利文献的标引方法,包括以下步骤:提供一相关技术主题专利文献数据库;建立该技术主题的技术分类及其对应的关键字/词;此处技术分类是根据一篇专利文献通常应当包括的内容进行划分;此外,还可对技术手段进行分类。如果确有必要还可以对技术手段的分类进一步分类;选择部分或全部专利文献进行标引,对每一篇专利文献,建立其与关键字/词和技术分类的对应关系;在此步骤中,根据标引的专利文献,修正技术分类或者技术分类对应的关键字。上述标引过程可以只标引部分专利文献,对于未标引部分,采用自动标引方法完成。本发明可以加快专利文献的阅读和标引速度,特别是在需要阅读和标引的专利文献数量巨大时,其有益效果非常明显。

Description

一种专利文献的标引方法
技术领域
本发明涉及一种资料标引方法,特别涉及专利文献的标引方法。
背景技术
目前专利文献的检索及标引已经成为众多科技企业的重要工作。利用各国专利局或其它知识产权组织提供的专利文献及其对应的检索入口,可以方便地找到相关专利文献。并对这些文献进行阅读和标引,以方便其它人员查找和阅读。但由于专利文献数量巨大,通常一个技术主题下,就可能存在成百上千,甚至上万篇相关专利文献。如果是对一个行业或一个技术领域进行专利战略分析,那么可能找到的专利文献数量将是数万或是数十万篇。例如,人类基因就包括有约30万篇专利文献,在找到这些专利之后,对其进行阅读和手工标引需要投入大量的人力和物力。传统处理方法有两种,一种是对所有的文献进行阅读并做手工标引,这种方式费时费力,而且效率低下。另一种方法是,缩小检索范围,将专利文献的数量控制在一定范围之内,例如控制在1万篇以内。然后逐一阅读和标引,这种方法可能导致一些有重要价值的专利文献被舍弃,并增加了侵犯他人专利的风险。此外,由于缺乏有效的标引工具,使得几乎每次做标引时,都需要手工填写关键词/字、技术分类或者萁它的专利信息。这使得标引工作本身也变成一繁重的任务。如何加快专利文献的阅读和标引速度,减少此方面工作人力和物力的投入,是本发明要解决的技术问题。
发明内容
本发明的目的在于,提供一种快速进行专利文献标引的方法。为达上述目的,本发明采用如下技术方案:
一种专利文献的标引方法,包括以下步骤:
1)提供一相关技术主题专利文献数据库;
2)建立该技术主题的技术分类及其对应的关键字/词;此处技术分类是根据一篇专利文献通常应当包括的内容进行划分,它可以包括技术手段、技术特点、技术功效、应用领域等;此外,还可对技术手段进行分类。如果确有必要还可以对技术手段的分类进一步分类;
3)选择部分或全部专利文献进行标引,对每一篇专利文献,建立其与关键字和技术分类的对应关系;在此步骤中,根据标引的专利文献,修正技术分类或者技术分类对应的关键字,其中,上述专利文献数据库、技术分类、关键字/词等均存储于计算机中。通过鼠标或键盘等输入设备输入信息,相关计算机程序响应该事件,从而建立专利文献与关键字/词和技术分类的对应关系,使得标引人员无需录入过多的其它信息,减少了工作量,简化了专利标引过程。
作为本发明的一种改进,上述标引过程可以只标引部分专利文献,对于未标引部分,采用以下方法自动完成标引过程:
根据已经标引的专利文献获得的关键字/词和技术分类,检索全部或部分专利文献,根据检索结果,建立专利文献与关键字/词和技术分类的对应关系,完成对未标引的专利文献的标引工作。这样可以不需要对未标引部分进行阅读和手工标引,减少工作量。作为本发明的又一改进,在完成少量专利文献的标引后,就开始利用已经标引的专利文献获得的关键字/词和技术分类,检索未标引的专利文献,根据检索结果建立未标引专剩文献与关键字/词和技术分类的对应关系。此时,可能存在以下两种情况:
第一种情况是,部分专利文献未被标引,此时需对其进行补充标引,修正关键字/词或技术分类,根据修正后关键字/词或技术分类,检索全部或部分专利文献,根据检索结果建立专利文献与关键字/词和技术分类的对应关系。
另一种情况是,有些专利文献未能在多个技术分类中出现。此时也可能存在以下两种情况,一是该专利文献与检索的技术主题不相关,这时只需删除此专利文献即可;另一种可能的情况是,该技术分类或者关键字/词存在遗漏,此时可对这些专利文献进行阅读和标引,进一步修正关键字/词或技术分类,并根据实际需要,决定是否依据进一步修正后的关键字/词或技术分类,检索全部或部分专利文献,并根据检索结果建立新的专利文献与关键字/词和技术分类的对应关系。
采用本发明技术方案,可以加快专利文献的阅读和标引速度,减少此方面工作人力和物力的投入,特别是在需要阅读和标引的专利文献数量巨大时,其有益效果非常明显。
以下结合附图及实施例进一步说明本发明。
附图说明
图1本发明实施例手工标引和自动标引相结合的实施例。
具体实施方式
实施例一
一种专利文献的标引方法,本实施例中以焊接这一技术领域为例,包括以下步骤:
1)提供一相关技术主题专利文献数据库;即与焊接技术相关的专利文献数据库,该专利文献可以是各个国家、地区或国际组织提供的专利文献,例如比较常见的中国、美国、日本、英国、法国、德国、欧洲专利局等提供的专利文献。
2)建立焊接技术主题的技术分类及其对应的关键字/词,此处技术分类是根据一篇专利文献通常应当包括的内容进行划分,它可以包括“技术手段”、“技术特点”、“技术功效”、“应用领域”等;其中技术手段又可以分为“工艺方法”、“焊接材料”、“焊接装置”、“制造方法”;如果确有必要还可以对技术手段的分类做进一步分类。技术分类所对应的关键字/词是根据技术分类的具体特点提取的字/词;例如“工艺方法”技术分类对应关键字有:“垂直方向”、“对接”、“定位焊”、“激光辅助”、“修补”、“补丁”等。
3)选择部分或全部专利文献进行手工标引,对每一篇专利文献,建立其与关键字/词和技术分类的对应关系;在此步骤中,可以根据标引的专利文献,增加技术分类对皮的关键字。
上述专利文献数据库、技术分类、关键字/词等可以是各种语言文字形式(本发明实施例中仅以中文表述),通过现有的计算机及软件编程技术对其进行控制和管理。通过鼠标或键盘等输入设备输入信息,由相关计算机程序响应该事件,完成对应关系的建立。例如,当前打开的一篇专利文献的技术手段为“工艺方法”,其对应的关键字为“垂直方向”时,此时可采用点击“工艺方法”和“垂直方向”,即可完成从摘要中取词和当前专利文献与“工艺方法”和“垂直方向”的对应关系的建立。标引人员无需录入“工艺方法”、“垂直方向”或其它专利文献信息,就可轻松地完成“工艺方法”和“垂直方向”的标引。从而减少了工作量,简化了专利标引过程。
实施例二
在实施例一基础上进行改进。实施例一中,只人工标引部分专利文献,对于未标引部分,采用以下自动标引方法完成标引过程:
根据已经标引的专利文献获得的关键字/词和技术分类,检索全部或部分专利文献,根据检索结果,建立专利文献与关键字/词和技术分类的对应关系,完成对未标引的专利文献的标引工作。这样可以不需要对未标引部分进行阅读和手工标引,减少工作量。
实旌例三
上述实施例二中采用的是先标引部分专利文献,然后利用标引的技术分类及关键字/词信息进行检索,完成标引。为使手工标引的专利文献更加具有代表性,即基本上代表了全部相关专利文献中不同类型,在实施例三中,只是在完成少量专利文献的标引后,就开始利用已经标引的专利文献获得的关键字/词和技术分类,检索未标引的专利文献,根据检索结果建立未标引专利文献与关键字/词和技术分类的对应关系。当出现部分专利文献未被标引时,可根据需要选择部分或全部进行补充标引,修正关键字/词或技术分类,根据修正后关键字/词或技术分类,检索全部或部分专利文献,根据检索结果建立专利文献与关键字/词和技术分类的对应关系。如图1所示,这一过程循环几次后,即先进行少量标引,获得关键字/词或技术分类,然后进行检索自动标引,再手工标引修正关键字/词或技术分类,再进杼检索自动标引,......,最终得取的专利文献标引结果将更加准确。
上述三实施例中,可能会有少量专利文献未在多个技术分类中出现。这可能是以下原因导致的:一种原因是该专利文献与检索的技术主题不相关,这时只需删除此专利文献即可;另一种原因是,该技术分类或者关键字/词存在遗漏,此时可对这些专利文献进行阅读和标引,进一步修正关键字/词或技术分类,并根据实际需要,决定是否依据进一步修正后的关键字/词或技术分类,检索全部或部分专利文献,并根据检索结果重新建立专利文献与关键字/词和技术分类的对应关系。
上述三实施例仅仅是对本发明技术方案的具体说明,本发明并不局限于上述三实施例,只要采用通过计算机程序检索完成专利文献的自动标引这一技术手段,均在本发明的保护范围之内。

Claims (6)

1.一种专利文献的标引方法,其特征在于包括以下步骤:
1)提供一相关技术主题专利文献数据库:
2)建立该技术主题的技术分类及其对应的关键字/词;
3)选择部分或全部专利文献进行标引,对每一篇专利文献,建立其与关键字/词和技术分类的对应关系;在此过程中,根据标引的专利文献,修正技术分类或者技术分类对应的关键字,其中,上述专利文献数据库、技术分类、关键字/词存储于计算机中,通过输入设备输入信息,相关计算机程序响应该输入信息,建立专利文献与关键字侗和技术分类的对应关系。
2.一种专利文献的标引方法,其特征在于包括以下步骤:
1)提供一相关技术主题专利文献数据库;
2)建立该技术主题的技术分类及其对应的关键字/词;
3)选择部分专利文献进行标引,对每一篇专利文献,建立其与关键字/词和技术分类的对应关系;在此步骤中,根据标引的专利文献,修正技术分类或者技术分类对应的的关键字,
4)根据已经标引的专利文献获得的关键字/词和技术分类,检索全部或部分专利文献,根据检索结果,建立专利文献与关键字/词和技术分类的对应关系,完成对未标引的专利文献的标引;其中,上述专利文献数据库、技术分类、信息,相关计箅机程序响应该输入信息,系。关键字/词存储于计算机中,通过输入设备输入建立专利文献与关键字/词和技术分类的对应关系。
3.根据权利要求2所述的一种专利文献的标引方法,其特征在于:所述步骤4)之后,还包括以下步骤:
当存在部分专利文献未被标引,对其进行补充标引,修正关键字/词或技术分类,根据修正后关键字/词或技术分类,检索全部或部分专利文献,根据检索结果建立专利文献与关键字/词和技术分类的对应关系。
4.根据权利要求2或3所述的一种专利文献的标引方法,其特征在于:当有些专利文献未能在多个技术分类中出现时,如果该专利文献与检索的技术主题不相关,则删除此专利文献。
5.根据权利要求2或3所述的一种专利文献的标引方法,其特征在于:当有些专利文献未能在多个技术分类中出现时,如果该专利文献与检索的技术主题相关,则标引该专利文献,修正技术分类或者关键字/词。
6.根据权利要求5所述的一种专利文献的标引方法,其特征在于:在修正关键字/词或技术分类后,检索全部或部分专利文献,并根据检索结果建立新的专利文献与关键字/词和技术分类的对应关系。
CN2011100796370A 2011-03-30 2011-03-30 一种专利文献的标引方法 Pending CN102722495A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2011100796370A CN102722495A (zh) 2011-03-30 2011-03-30 一种专利文献的标引方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2011100796370A CN102722495A (zh) 2011-03-30 2011-03-30 一种专利文献的标引方法

Publications (1)

Publication Number Publication Date
CN102722495A true CN102722495A (zh) 2012-10-10

Family

ID=46948262

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2011100796370A Pending CN102722495A (zh) 2011-03-30 2011-03-30 一种专利文献的标引方法

Country Status (1)

Country Link
CN (1) CN102722495A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105654114A (zh) * 2015-12-24 2016-06-08 国家电网公司信息通信分公司 一种文献查新的方法及装置
CN106547927A (zh) * 2016-12-15 2017-03-29 北京科华万象科技有限公司 一种专利文件处理方法和装置
CN107609169A (zh) * 2017-09-27 2018-01-19 合肥博力生产力促进中心有限公司 一种基于数据库的专利名称后台管理分析系统
CN112667691A (zh) * 2021-03-16 2021-04-16 中汽数据有限公司 基于数据库的专利标引方法、装置、设备和存储介质

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105654114A (zh) * 2015-12-24 2016-06-08 国家电网公司信息通信分公司 一种文献查新的方法及装置
CN106547927A (zh) * 2016-12-15 2017-03-29 北京科华万象科技有限公司 一种专利文件处理方法和装置
CN107609169A (zh) * 2017-09-27 2018-01-19 合肥博力生产力促进中心有限公司 一种基于数据库的专利名称后台管理分析系统
CN112667691A (zh) * 2021-03-16 2021-04-16 中汽数据有限公司 基于数据库的专利标引方法、装置、设备和存储介质

Similar Documents

Publication Publication Date Title
US11714839B2 (en) Apparatus and method for automated and assisted patent claim mapping and expense planning
CN109726293A (zh) 一种因果事件图谱构建方法、系统、装置及存储介质
CN102388374A (zh) 存储数据的方法和装置
CN103440232A (zh) 一种科技论文标准化自动检测编辑方法
CN110334214A (zh) 一种自动识别案件中虚假诉讼的方法
US20160253306A1 (en) The method of inserting objects into a pdf document
CN103440233A (zh) 一种科技论文标准化自动检测编辑系统
CN110427884A (zh) 文档篇章结构识别方法、装置、设备和存储介质
CN105740227A (zh) 一种求解中文分词中新词的遗传模拟退火方法
CN102722495A (zh) 一种专利文献的标引方法
CN110362596A (zh) 一种文本抽取信息结构化数据处理的控制方法及装置
CN110163268A (zh) 一种图像处理方法、装置及服务器、存储介质
CN106156111A (zh) 专利文件检索方法、装置和系统
CN109101519A (zh) 信息采集系统和异构信息融合系统
Ciravegna et al. LearningPinocchio: Adaptive information extraction for real world applications
CN109359296A (zh) 舆情情感识别方法、装置及计算机可读存储介质
CN102360436B (zh) 一种基于部件的联机手写藏文字符的识别方法
CN101957860A (zh) 一种发布、搜索信息的方法及装置
CN1818906A (zh) 专利文献的标引方法
Whyman et al. Evaluation metrics for a translation memory system
JP2007149087A (ja) 文書作成支援装置
CN1975723A (zh) 专利文献的快速标引方法
CN109815463A (zh) 文本编辑选取控制方法、装置、计算机设备及存储介质
CN109711799A (zh) 引导行政管理岗标准化办公的教学软件及其运行方法
CN113988020A (zh) 工程技术标标书编制方法、装置、设备及存储介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20121010