CN106802942A - 一种基于电力行业专利信息的精确检索方法和系统 - Google Patents
一种基于电力行业专利信息的精确检索方法和系统 Download PDFInfo
- Publication number
- CN106802942A CN106802942A CN201710001116.0A CN201710001116A CN106802942A CN 106802942 A CN106802942 A CN 106802942A CN 201710001116 A CN201710001116 A CN 201710001116A CN 106802942 A CN106802942 A CN 106802942A
- Authority
- CN
- China
- Prior art keywords
- ipc
- electric power
- term
- power industry
- ipc code
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 19
- 238000013507 mapping Methods 0.000 claims abstract description 12
- 238000005516 engineering process Methods 0.000 claims abstract description 7
- 239000000284 extract Substances 0.000 claims abstract description 6
- 238000007689 inspection Methods 0.000 claims 1
- 238000011160 research Methods 0.000 abstract description 6
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000013500 data storage Methods 0.000 description 1
- 230000005611 electricity Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 238000004321 preservation Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2457—Query processing with adaptation to user needs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/28—Databases characterised by their database models, e.g. relational or object models
- G06F16/284—Relational databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- General Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- Economics (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Public Health (AREA)
- Water Supply & Treatment (AREA)
- Computational Linguistics (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于电力行业专利信息的精确检索方法和系统,基于已经构建的电力行业专题专利数据库,利用计算机技术,提取专利文献中的电力术语,通过将电力术语与IPC关联,实现电力术语与IPC分类号的映射,系统自动根据IPC分类号实现专利文献检索并反馈结果。科研人员通过检索关键词即能实现基于IPC分类号的检索,达到精确检索的目的。
Description
技术领域
本专利属于信息服务领域,具体涉及一种电力行业信息的检索方法和系统。
技术背景
目前,在专利文献检索中,科技研发人员习惯于使用专业术语或专有名词进行文献检索,但是实际检索过程中,经常遇到检索文献并不是自己所找的内容,或者说利用简单关键词检索,噪音太多,无法精确检索.例如电力行业中检索核电,会出现核潜艇、核武器电器相关内容,相关内容属于军事武器领域,与核电、核能等领域差别较大,并不是科研人员所要检索的文献。噪音文献的去除和筛选给技术人员精确检索专利文献信息带来很大困扰;
但是,实际上每篇中文专利在经过审查时,专利审查员都会根据专利内容分配一个分类号码,例如发明和实用新型为IPC分类号。IPC分类(国际专利分类)是根据1971年签订的《国际专利分类斯特拉斯堡协定》编制的,是目前惟一国际通用的专利文献分类和检索工具。IPC采用了功能和应用相结合,以功能性为主、应用性为辅的分类原则。采用等级的形式,将技术内容注明:部-分部-大类-小类-大组-小组,逐级分类形成完整的分类体系。依据某一种产品的国际分类,就可以很容易的检索出本产品所属技术领域的专利信息了。
目前存在的实际状况是:IPC分类号检索只有专业的专利文献检索人员或熟悉专利文献格式的人员才会采用,大多数研究学者、技术人员以及企业管理人员,甚至图书情报人员只会通过关键词及其组合,进行专利文献检索,专利文献检索结果不甚理想。
发明内容
为提升电力行业科研人员利用关键词或其组合检索专利文献的精确度,实现通过关键词精准检索电力行业专利文献的目的,本发明提出一种通过IPC分类号和电力行业关键词相关联检索专利文献方法,以及基于该方法开发的精确检索系统,具体方案如下:
一种基于电力行业专利信息的精确检索方法,包括以下步骤:首先采集电力行业相关专利文献文本数据,构建电力行业专题专利数据库;
其次利用计算机文本提取和汇聚技术,提取专题专利数据库中专利文献中的关键词、技术术语、专有名词及其他实体词,以下统称电力术语;
然后将全部电力术语与IPC分类号一一对应,每个电力术语对应一个或多个IPC分类号,使得电力术语与IPC分类号相互映射
最后通过计算机自动匹配技术,将电力术语自动映射IPC分类号,进而转化为通过IPC分类号进行检索专利文献,并反馈检索结果。
所述电力术语与IPC分类号对应是指与IPC分类号小组对应,实现精确检索专利文献的目的。
根据上述的基于电力行业专利信息的精确检索方法,本发明提出一种基于电力行业专利信息的精确检索系统,包括:数据存储部、术语处理部、IPC映射部、数据检索部和信息反馈部;
其中,数据存储部主要作用是存储电力行业相关专利文献,构建系统基础构架,形成底层数据库,支撑信息处理和检索;术语处理部采用计算机文本提取和汇聚技术,提取专利文本中的电力术语;IPC映射部支持人工加工电力术语与IPC分类号的对应,保存加工成果,形成映射关系数据库,为数据检索提供支持;IPC映射部能够将关键词与电力术语自动匹配,将检索词汇自动转换为IPC分类号,具有数据自动转换功能;数据检索部利用IPC映射部自动转换的IPC分类号进行主动检索,智能化搜集数据存储部的专利文献,并将检索结果反馈给信息反馈部;信息反馈部负责调用数据存储部信息,为系统使用人员提供信息检索结果。
通过以上电力行业专利信息的精确检索方法和系统,科研人员在检索专利文献时,只需要输入关键词等电力术语,计算机系统智能化比对,自动映射到IPC分类号小组,转化为根据IPC分类号号码进行检索的方式,并反馈检索结果。
由于IPC分类号是由专利审查员按照专利内容分配的号码,能够准确反映专利实际内容,因此通过关键词映射到IPC分类号,进而检索专利的方法能够达到精确检索专利文献的目的,非常方便科研、管理、技术人员检索专利文献。
具体实施方式
以下结合实施例对本发明的技术方案作进一步地详细介绍,需要说明的是,实施例仅用于进一步解释本发明内容,方便本技术领域技术人员理解,并不限制本发明的保护范围,相关人员对本发明显而易见的改变,仍然在本发明要求的保护范围之内。
首先基于已经构建的电力行业专题专利数据库,利用计算机技术文本提取和汇聚技术,提取专题专利数据库中专利文献中的电力术语,以提取到的关键词--熔断器为例;
其次,将关键词熔断器与IPC分类号对照,确定熔断器映射的IPC分类号小组为:
H01H69/02
·熔断器制造
G01R31/07
··熔断器的测试
H01H85/044
····低压,即低于1000伏的熔断器,或未指明使用电压的熔断器,其一般构成或结构
H01H85/047
····真空熔断器
H01H85/042
····高压,即高于1000伏的熔断器的一般构成或结构
H01H85/046
····形成为印制电路的熔断器
最后通过计算机自动匹配技术,将关键词熔断器映射到以上IPC分类号小组。计算机系统自动识别关键词与IPC分类号H01H69/02、G01R31/07、H01H85/044、H01H85/047、H01H85/042、H01H85/046对应,进而智能化转化为根据IPC分类号检索,并反馈检索结果。
基于上述电力行业专利信息的精确检索方法,开发了数据检索系统,包括数据存储部、术语处理部、IPC映射部、数据检索部和信息反馈部。
实际使用时,技术研发人员利用本发明数据检索系统,通过输入检索关键词----熔断器,系统IPC映射部将关键词主动与IPC分类号进行匹配,按照映射关系,自动映射到IPC分类号小组,数据检索部根据IPC分类号进行检索,并反馈检索结果,信息反馈部将检索结果从数据存储部调出,向用户反馈检索到的专利文献,由此通过关键词自动转化为IPC分类号,进而实现精确检索的目的。
Claims (3)
1.一种基于电力行业专利信息的精确检索方法,包括以下步骤:首先采集电力行业相关专利文献,构建电力行业专题专利数据库;
其次利用计算机技术,提取专题专利数据库中专利文献中的关键词、技术术语、专有名词及其他实体词,以下统称电力术语;
然后将全部电力术语与IPC分类号一一对应,每个电力术语对应一个或多个IPC分类号,使得电力术语与IPC分类号相互映射;
最后通过计算机自动匹配技术,将电力术语自动映射IPC分类号,进而转化为通过IPC分类号进行检索专利文献,并反馈检索结果。
2.根据权利要求1所述的检索方法,所述电力术语与IPC分类号对应是指与IPC分类号小组对应。
3.一种基于电力行业专利信息的精确检索系统,根据权利要求1所述的方法,开发的检索系统,所述系统包括:数据存储部、术语处理部、IPC映射部、数据检索部和信息反馈部。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710001116.0A CN106802942A (zh) | 2017-01-03 | 2017-01-03 | 一种基于电力行业专利信息的精确检索方法和系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710001116.0A CN106802942A (zh) | 2017-01-03 | 2017-01-03 | 一种基于电力行业专利信息的精确检索方法和系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN106802942A true CN106802942A (zh) | 2017-06-06 |
Family
ID=58985577
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710001116.0A Pending CN106802942A (zh) | 2017-01-03 | 2017-01-03 | 一种基于电力行业专利信息的精确检索方法和系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106802942A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110503281A (zh) * | 2018-05-16 | 2019-11-26 | 北京牡丹电子集团有限责任公司 | 创新产品加值功能开发辅助性系统及其方法 |
CN118093883A (zh) * | 2024-04-26 | 2024-05-28 | 营动智能技术(山东)有限公司 | 一种基于产品分类与专利分类的映射方法及系统 |
-
2017
- 2017-01-03 CN CN201710001116.0A patent/CN106802942A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110503281A (zh) * | 2018-05-16 | 2019-11-26 | 北京牡丹电子集团有限责任公司 | 创新产品加值功能开发辅助性系统及其方法 |
CN118093883A (zh) * | 2024-04-26 | 2024-05-28 | 营动智能技术(山东)有限公司 | 一种基于产品分类与专利分类的映射方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105468605B (zh) | 一种实体信息图谱生成方法及装置 | |
Ni et al. | Short text clustering by finding core terms | |
CN107085583B (zh) | 一种基于内容的电子文档管理方法及装置 | |
Barbosa et al. | Organizing hidden-web databases by clustering visible web documents | |
US20040139059A1 (en) | Method for automatic deduction of rules for matching content to categories | |
Bisandu et al. | Clustering news articles using efficient similarity measure and N-grams | |
CN110399339A (zh) | 知识库管理系统的文件分类方法、装置、设备及存储介质 | |
CN104899281B (zh) | 学术文章处理方法和学术文章的搜索处理方法及装置 | |
CN106611053A (zh) | 一种数据清理、索引方法 | |
Fu et al. | Automatic record linkage of individuals and households in historical census data | |
CN110704577A (zh) | 一种电网调度数据的搜索方法及系统 | |
Odeh et al. | Arabic text categorization algorithm using vector evaluation method | |
CN1158460A (zh) | 一种跨语种语料自动分类与检索方法 | |
WO2012159558A1 (zh) | 基于语意识别的自然语言处理方法、装置和系统 | |
CN110347820A (zh) | 一种电网文本信息匹配的方法、系统和存储介质 | |
Yao et al. | Chinese text clustering algorithm based k-means | |
CN101770291B (zh) | 输入系统语意分析数据散列存储和分析方法 | |
CN106802942A (zh) | 一种基于电力行业专利信息的精确检索方法和系统 | |
CN105488062A (zh) | 一种精准信息系统数据搜索方法 | |
CN107291700A (zh) | 实体词识别方法及装置 | |
Mohnot et al. | Hybrid approach for Part of Speech Tagger for Hindi language | |
Dhanjal et al. | Gravity based Punjabi question answering system | |
Ilic et al. | Suffix tree clustering–data mining algorithm | |
Omri | Effects of terms recognition mistakes on requests processing for interactive information retrieval | |
CN102207947A (zh) | 一种直接引语素材库的生成方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20170606 |
|
WD01 | Invention patent application deemed withdrawn after publication |