CN106802942A - 一种基于电力行业专利信息的精确检索方法和系统 - Google Patents

一种基于电力行业专利信息的精确检索方法和系统 Download PDF

Info

Publication number
CN106802942A
CN106802942A CN201710001116.0A CN201710001116A CN106802942A CN 106802942 A CN106802942 A CN 106802942A CN 201710001116 A CN201710001116 A CN 201710001116A CN 106802942 A CN106802942 A CN 106802942A
Authority
CN
China
Prior art keywords
ipc
electric power
term
power industry
ipc code
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710001116.0A
Other languages
English (en)
Inventor
顾方
鲁瑛
夏昕
武春亮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Chemical Information Center
Original Assignee
China Chemical Information Center
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Chemical Information Center filed Critical China Chemical Information Center
Priority to CN201710001116.0A priority Critical patent/CN106802942A/zh
Publication of CN106802942A publication Critical patent/CN106802942A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • Economics (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Public Health (AREA)
  • Water Supply & Treatment (AREA)
  • Computational Linguistics (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于电力行业专利信息的精确检索方法和系统,基于已经构建的电力行业专题专利数据库,利用计算机技术,提取专利文献中的电力术语,通过将电力术语与IPC关联,实现电力术语与IPC分类号的映射,系统自动根据IPC分类号实现专利文献检索并反馈结果。科研人员通过检索关键词即能实现基于IPC分类号的检索,达到精确检索的目的。

Description

一种基于电力行业专利信息的精确检索方法和系统
技术领域
本专利属于信息服务领域,具体涉及一种电力行业信息的检索方法和系统。
技术背景
目前,在专利文献检索中,科技研发人员习惯于使用专业术语或专有名词进行文献检索,但是实际检索过程中,经常遇到检索文献并不是自己所找的内容,或者说利用简单关键词检索,噪音太多,无法精确检索.例如电力行业中检索核电,会出现核潜艇、核武器电器相关内容,相关内容属于军事武器领域,与核电、核能等领域差别较大,并不是科研人员所要检索的文献。噪音文献的去除和筛选给技术人员精确检索专利文献信息带来很大困扰;
但是,实际上每篇中文专利在经过审查时,专利审查员都会根据专利内容分配一个分类号码,例如发明和实用新型为IPC分类号。IPC分类(国际专利分类)是根据1971年签订的《国际专利分类斯特拉斯堡协定》编制的,是目前惟一国际通用的专利文献分类和检索工具。IPC采用了功能和应用相结合,以功能性为主、应用性为辅的分类原则。采用等级的形式,将技术内容注明:部-分部-大类-小类-大组-小组,逐级分类形成完整的分类体系。依据某一种产品的国际分类,就可以很容易的检索出本产品所属技术领域的专利信息了。
目前存在的实际状况是:IPC分类号检索只有专业的专利文献检索人员或熟悉专利文献格式的人员才会采用,大多数研究学者、技术人员以及企业管理人员,甚至图书情报人员只会通过关键词及其组合,进行专利文献检索,专利文献检索结果不甚理想。
发明内容
为提升电力行业科研人员利用关键词或其组合检索专利文献的精确度,实现通过关键词精准检索电力行业专利文献的目的,本发明提出一种通过IPC分类号和电力行业关键词相关联检索专利文献方法,以及基于该方法开发的精确检索系统,具体方案如下:
一种基于电力行业专利信息的精确检索方法,包括以下步骤:首先采集电力行业相关专利文献文本数据,构建电力行业专题专利数据库;
其次利用计算机文本提取和汇聚技术,提取专题专利数据库中专利文献中的关键词、技术术语、专有名词及其他实体词,以下统称电力术语;
然后将全部电力术语与IPC分类号一一对应,每个电力术语对应一个或多个IPC分类号,使得电力术语与IPC分类号相互映射
最后通过计算机自动匹配技术,将电力术语自动映射IPC分类号,进而转化为通过IPC分类号进行检索专利文献,并反馈检索结果。
所述电力术语与IPC分类号对应是指与IPC分类号小组对应,实现精确检索专利文献的目的。
根据上述的基于电力行业专利信息的精确检索方法,本发明提出一种基于电力行业专利信息的精确检索系统,包括:数据存储部、术语处理部、IPC映射部、数据检索部和信息反馈部;
其中,数据存储部主要作用是存储电力行业相关专利文献,构建系统基础构架,形成底层数据库,支撑信息处理和检索;术语处理部采用计算机文本提取和汇聚技术,提取专利文本中的电力术语;IPC映射部支持人工加工电力术语与IPC分类号的对应,保存加工成果,形成映射关系数据库,为数据检索提供支持;IPC映射部能够将关键词与电力术语自动匹配,将检索词汇自动转换为IPC分类号,具有数据自动转换功能;数据检索部利用IPC映射部自动转换的IPC分类号进行主动检索,智能化搜集数据存储部的专利文献,并将检索结果反馈给信息反馈部;信息反馈部负责调用数据存储部信息,为系统使用人员提供信息检索结果。
通过以上电力行业专利信息的精确检索方法和系统,科研人员在检索专利文献时,只需要输入关键词等电力术语,计算机系统智能化比对,自动映射到IPC分类号小组,转化为根据IPC分类号号码进行检索的方式,并反馈检索结果。
由于IPC分类号是由专利审查员按照专利内容分配的号码,能够准确反映专利实际内容,因此通过关键词映射到IPC分类号,进而检索专利的方法能够达到精确检索专利文献的目的,非常方便科研、管理、技术人员检索专利文献。
具体实施方式
以下结合实施例对本发明的技术方案作进一步地详细介绍,需要说明的是,实施例仅用于进一步解释本发明内容,方便本技术领域技术人员理解,并不限制本发明的保护范围,相关人员对本发明显而易见的改变,仍然在本发明要求的保护范围之内。
首先基于已经构建的电力行业专题专利数据库,利用计算机技术文本提取和汇聚技术,提取专题专利数据库中专利文献中的电力术语,以提取到的关键词--熔断器为例;
其次,将关键词熔断器与IPC分类号对照,确定熔断器映射的IPC分类号小组为:
H01H69/02
·熔断器制造
G01R31/07
··熔断器的测试
H01H85/044
····低压,即低于1000伏的熔断器,或未指明使用电压的熔断器,其一般构成或结构
H01H85/047
····真空熔断器
H01H85/042
····高压,即高于1000伏的熔断器的一般构成或结构
H01H85/046
····形成为印制电路的熔断器
最后通过计算机自动匹配技术,将关键词熔断器映射到以上IPC分类号小组。计算机系统自动识别关键词与IPC分类号H01H69/02、G01R31/07、H01H85/044、H01H85/047、H01H85/042、H01H85/046对应,进而智能化转化为根据IPC分类号检索,并反馈检索结果。
基于上述电力行业专利信息的精确检索方法,开发了数据检索系统,包括数据存储部、术语处理部、IPC映射部、数据检索部和信息反馈部。
实际使用时,技术研发人员利用本发明数据检索系统,通过输入检索关键词----熔断器,系统IPC映射部将关键词主动与IPC分类号进行匹配,按照映射关系,自动映射到IPC分类号小组,数据检索部根据IPC分类号进行检索,并反馈检索结果,信息反馈部将检索结果从数据存储部调出,向用户反馈检索到的专利文献,由此通过关键词自动转化为IPC分类号,进而实现精确检索的目的。

Claims (3)

1.一种基于电力行业专利信息的精确检索方法,包括以下步骤:首先采集电力行业相关专利文献,构建电力行业专题专利数据库;
其次利用计算机技术,提取专题专利数据库中专利文献中的关键词、技术术语、专有名词及其他实体词,以下统称电力术语;
然后将全部电力术语与IPC分类号一一对应,每个电力术语对应一个或多个IPC分类号,使得电力术语与IPC分类号相互映射;
最后通过计算机自动匹配技术,将电力术语自动映射IPC分类号,进而转化为通过IPC分类号进行检索专利文献,并反馈检索结果。
2.根据权利要求1所述的检索方法,所述电力术语与IPC分类号对应是指与IPC分类号小组对应。
3.一种基于电力行业专利信息的精确检索系统,根据权利要求1所述的方法,开发的检索系统,所述系统包括:数据存储部、术语处理部、IPC映射部、数据检索部和信息反馈部。
CN201710001116.0A 2017-01-03 2017-01-03 一种基于电力行业专利信息的精确检索方法和系统 Pending CN106802942A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710001116.0A CN106802942A (zh) 2017-01-03 2017-01-03 一种基于电力行业专利信息的精确检索方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710001116.0A CN106802942A (zh) 2017-01-03 2017-01-03 一种基于电力行业专利信息的精确检索方法和系统

Publications (1)

Publication Number Publication Date
CN106802942A true CN106802942A (zh) 2017-06-06

Family

ID=58985577

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710001116.0A Pending CN106802942A (zh) 2017-01-03 2017-01-03 一种基于电力行业专利信息的精确检索方法和系统

Country Status (1)

Country Link
CN (1) CN106802942A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110503281A (zh) * 2018-05-16 2019-11-26 北京牡丹电子集团有限责任公司 创新产品加值功能开发辅助性系统及其方法
CN118093883A (zh) * 2024-04-26 2024-05-28 营动智能技术(山东)有限公司 一种基于产品分类与专利分类的映射方法及系统

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110503281A (zh) * 2018-05-16 2019-11-26 北京牡丹电子集团有限责任公司 创新产品加值功能开发辅助性系统及其方法
CN118093883A (zh) * 2024-04-26 2024-05-28 营动智能技术(山东)有限公司 一种基于产品分类与专利分类的映射方法及系统

Similar Documents

Publication Publication Date Title
CN105468605B (zh) 一种实体信息图谱生成方法及装置
Ni et al. Short text clustering by finding core terms
CN107085583B (zh) 一种基于内容的电子文档管理方法及装置
Barbosa et al. Organizing hidden-web databases by clustering visible web documents
US20040139059A1 (en) Method for automatic deduction of rules for matching content to categories
Bisandu et al. Clustering news articles using efficient similarity measure and N-grams
CN110399339A (zh) 知识库管理系统的文件分类方法、装置、设备及存储介质
CN104899281B (zh) 学术文章处理方法和学术文章的搜索处理方法及装置
CN106611053A (zh) 一种数据清理、索引方法
Fu et al. Automatic record linkage of individuals and households in historical census data
CN110704577A (zh) 一种电网调度数据的搜索方法及系统
Odeh et al. Arabic text categorization algorithm using vector evaluation method
CN1158460A (zh) 一种跨语种语料自动分类与检索方法
WO2012159558A1 (zh) 基于语意识别的自然语言处理方法、装置和系统
CN110347820A (zh) 一种电网文本信息匹配的方法、系统和存储介质
Yao et al. Chinese text clustering algorithm based k-means
CN101770291B (zh) 输入系统语意分析数据散列存储和分析方法
CN106802942A (zh) 一种基于电力行业专利信息的精确检索方法和系统
CN105488062A (zh) 一种精准信息系统数据搜索方法
CN107291700A (zh) 实体词识别方法及装置
Mohnot et al. Hybrid approach for Part of Speech Tagger for Hindi language
Dhanjal et al. Gravity based Punjabi question answering system
Ilic et al. Suffix tree clustering–data mining algorithm
Omri Effects of terms recognition mistakes on requests processing for interactive information retrieval
CN102207947A (zh) 一种直接引语素材库的生成方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20170606

WD01 Invention patent application deemed withdrawn after publication