CN106909665A - 一种基于本体的专利检索方法 - Google Patents

一种基于本体的专利检索方法 Download PDF

Info

Publication number
CN106909665A
CN106909665A CN201710111288.3A CN201710111288A CN106909665A CN 106909665 A CN106909665 A CN 106909665A CN 201710111288 A CN201710111288 A CN 201710111288A CN 106909665 A CN106909665 A CN 106909665A
Authority
CN
China
Prior art keywords
retrieval
feature words
database
method based
degree
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710111288.3A
Other languages
English (en)
Inventor
董翔
蒋伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huaian Hi Tech Research Institute Of Lanzhou University
Original Assignee
Huaian Hi Tech Research Institute Of Lanzhou University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huaian Hi Tech Research Institute Of Lanzhou University filed Critical Huaian Hi Tech Research Institute Of Lanzhou University
Priority to CN201710111288.3A priority Critical patent/CN106909665A/zh
Publication of CN106909665A publication Critical patent/CN106909665A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/338Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2216/00Indexing scheme relating to additional aspects of information retrieval not explicitly covered by G06F16/00 and subgroups
    • G06F2216/01Automatic library building
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2216/00Indexing scheme relating to additional aspects of information retrieval not explicitly covered by G06F16/00 and subgroups
    • G06F2216/11Patent retrieval

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于本体的专利检索方法,过程如下:(1)专利本体库建设过程,首先对专利本体描述文本进行分析,逐一检索并统计其描述文本的特征词;根据检索的特征词以及出现次数,以特征词作为关键词,出现次数作为权重,建立专利本体单链表模型,并融合专利本身信息,存入数据库中;(2)专利检索过程,首先使用用户检索词到数据库中进行查找,与本体单链表模型进行匹配,根据匹配的关键词的权重累加,得到关联度。将检索结果根据关联度进行倒序排列,展示给客户。本发明在确保检索效率的前提下能有效提高专利的检索精度。

Description

一种基于本体的专利检索方法
技术领域
本发明属于专利检索领域,具体涉及一种基于本体的专利检索方法。
背景技术
专利已日益成为企业竞争力的核心要素,如何快速检索出专利并用于企业创新驱动是一个非常重要的问题。然而,目前,现有的专利检索方式基本上都是以匹配第三方描述信息进行查找,效率低,也很难达到用户满意的检索效果。为此,本方法通过专利描述信息进行本体建模,提高检索结果与本体的关联度,以实现兼顾效率与准确性的一种基于本体的专利检索方法。
发明内容
在本发明的目的在于:基于专利检索的原理,从专利本体出发,进行数据建模,既提高了关键词与本体关联性,同时保证了检索结果的准确性,从而提高了专利在用户检索中的效率和准确性。
为实现上述目的,本发明采取的技术方案主要包括以下过程:
(一)专利本体库建设过程
步骤11,特征词统计:
A)获取专利对象O ,对其文本进行逐一检索;
B)将检索到的特征词name存到TemName ([name0,num0]、…、[nameN,numN])中,num初始值为0,首次添加name直接加入数组,num为1;
C)如果TemName中已经存在检索name,则对应的num加一;
D)重复进行B)C)过程,直至检索完毕后,得到特征词数组TemName ([name0,num0]、…、[nameN,numN]);
步骤12,建立专利本体单链表模型:
A)将特征词数组Name中的元素,根据num倒序重新排列,取前十个元素得到最终特征词数组TemName ([name0,num0]、…、[nameN,numN]);
B)根据检索的特征词以及出现次数,以特征词name作为关键词KeyName,出现次数num作为权重Weight,融合专利申请号、日期等信息,建立专利本体单链表模型L;
步骤13,建立专利数据库D;
专利本体单链表模型,并融合专利本身信息,存入数据库中;
(二)专利检索过程
步骤21,检索词查找:
获取用户检索词Uname,通过用户检索词Uname,对数据库D进行查找;
步骤22,根据权重计算关联度Link(初始值为0):
A)对数据库中的每一条记录与用户检索词Uname进行匹配;
B)如果出现匹配的情况下,读取该关键词KeyName对于本条记录的权重值Weight,并加到Link中,Link为此条数据记录与用户检索词Uname的关联度;
步骤23,根据数据库中记录与关键词关联度Link倒序排列,得到检索结果。
上述方法,可在确保检索效率的前提下,有效实现专利的检索。
附图说明
图1是专利本体库建设和用户专利检索的流程图;
图2是基于单链表进行专利本体模型建模。
具体实施方式
本发明是一种专利检索方法,主要包括如下过程:(1)专利本体库建设过程,首先对专利本体描述文本进行分析,逐一检索并统计其描述文本的特征词;根据检索的特征词以及出现次数,以特征词作为关键词,出现次数作为权重,建立专利本体单链表模型,并融合专利本身信息,存入数据库中;(2)专利检索过程,首先使用用户检索词到数据库中进行查找,与本体单链表模型进行匹配,根据匹配的关键词的权重累加,得到关联度。将检索结果根据关联度进行倒序排列,展示给客户。本发明在确保检索效率的前提下能有效提高专利的检索精度。
本实施例选择专利《一种基于数字信封的矢量地图数据安全传输方法》作为测试数据,针对数据的提取、建模、入库、检索的整个过程,进一步详细的说明本发明。
(一)专利本体库建设过程
步骤11,特征词统计:
A)获取专利对象《一种基于数字信封的矢量地图数据安全传输方法》,对其文本进行逐一检索;
B)将检索到的特征词name存到TemName ([name0,num0]、…、[nameN,numN])中,num初始值为0,首次添加name直接加入数组,num为1;
C)如果TemName中已经存在检索name,则对应的num加一;
D)重复进行B)C)过程,直至检索完毕后,得到特征词数组TemName ([‘数字信封’,10]、…、[‘对称加密’,1]);
步骤12,建立专利本体单链表模型:
A)将特征词数组Name中的元素,根据num倒序重新排列,取前十个元素得到最终特征词数组TemName ([‘数字信封’,10]、…、[‘横坐标’,2]);
B)根据检索的特征词以及出现次数,以特征词name作为关键词KeyName,出现次数num作为权重Weight,融合专利申请号、日期等信息,建立专利本体单链表模型L;
步骤13,建立专利数据库D;
专利本体单链表模型,并融合专利本身信息,存入数据库中;
(二)专利检索过程
步骤21,检索词查找:
获取用户检索词Uname为‘数字信封’,通过用户检索词Uname,对数据库D进行查找;
步骤22,根据权重计算关联度Link(初始值为0):
A)对数据库中的每一条记录与用户检索词Uname进行匹配;
B)如果出现匹配的情况下,读取该关键词KeyName对于本条记录的权重值Weight,并累加到Link中,Link为此条数据记录与用户检索词Uname的关联度;
C)得到《一种基于数字信封的矢量地图数据安全传输方法》与用户检索词Uname的关联度Link为10;
步骤23,根据数据库中记录与关键词关联度Link倒序排列,得到检索结果。

Claims (7)

1.一种基于本体的专利检索方法,包括如下步骤:
(一)专利本体库建设过程,
(二)专利检索过程;
所述步骤(一)包括步骤11,特征词统计;步骤12,建立专利本体单链表模型;步骤13,建立专利数据库D;
所述步骤(二)包括步骤21,检索词查找;步骤22,根据权重计算关联度Link(初始值为0);步骤23,根据数据库中记录与关键词关联度Link倒序排列,得到检索结果。
2.根据权利要求1一种基于本体的专利检索方法,其特征在于:
所述步骤11,特征词统计;
A)获取专利对象O ,对其文本进行逐一检索;
B)将检索到的特征词name存到TemName ([name0,num0]、…、[nameN,numN])中,num初始值为0,首次添加name直接加入数组,num为1;
C)如果TemName中已经存在检索name,则对应的num加一;
D)重复进行B)C)过程,直至检索完毕后,得到特征词数组TemName ([name0,num0]、…、[nameN,numN])。
3.根据权利要求1一种基于本体的专利检索方法,其特征在于:
所述步骤12,建立专利本体单链表模型;
A)将特征词数组Name中的元素,根据num倒序重新排列,取前十个元素得到最终特征词数组TemName ([name0,num0]、…、[nameN,numN]);
B)根据检索的特征词以及出现次数,以特征词name作为关键词KeyName,出现次数num作为权重Weight,融合专利申请号、日期等信息,建立专利本体单链表模型L。
4.根据权利要求1一种基于本体的专利检索方法,其特征在于:
所述步骤13,建立专利数据库D;
专利本体单链表模型,并融合专利本身信息,存入数据库中。
5.根据权利要求1一种基于本体的专利检索方法,其特征在于:
所述步骤21,检索词查找;
获取用户检索词Uname,通过用户检索词Uname,对数据库D进行查找。
6.根据权利要求1一种基于本体的专利检索方法,其特征在于:
所述步骤22,根据权重计算关联度Link(初始值为0);
A)对数据库中的每一条记录与用户检索词Uname进行匹配;
B)如果出现匹配的情况下,读取该关键词KeyName对于本条记录的权重值Weight,并加到Link中,Link为此条数据记录与用户检索词Uname的关联度。
7.根据权利要求1一种基于本体的专利检索方法,其特征在于:
所述步骤23,根据数据库中记录与关键词关联度Link倒序排列,得到检索结果。
CN201710111288.3A 2017-02-28 2017-02-28 一种基于本体的专利检索方法 Pending CN106909665A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710111288.3A CN106909665A (zh) 2017-02-28 2017-02-28 一种基于本体的专利检索方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710111288.3A CN106909665A (zh) 2017-02-28 2017-02-28 一种基于本体的专利检索方法

Publications (1)

Publication Number Publication Date
CN106909665A true CN106909665A (zh) 2017-06-30

Family

ID=59208592

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710111288.3A Pending CN106909665A (zh) 2017-02-28 2017-02-28 一种基于本体的专利检索方法

Country Status (1)

Country Link
CN (1) CN106909665A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108345694A (zh) * 2018-03-19 2018-07-31 华北电力大学(保定) 一种基于主题数据库的文献检索方法及系统
CN113032258A (zh) * 2021-03-22 2021-06-25 北京百度网讯科技有限公司 一种电子地图的测试方法、装置、电子设备及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20060032310A (ko) * 2004-10-12 2006-04-17 한국과학기술정보연구원 특허정보 검색 시스템 및 그 방법과 그 방법에 대한컴퓨터프로그램 소스를 저장한 기록매체
CN101059806A (zh) * 2007-06-06 2007-10-24 华东师范大学 一种基于语义的本地文档检索方法
CN104765779A (zh) * 2015-03-20 2015-07-08 浙江大学 一种基于YAGO2s的专利文档查询扩展方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20060032310A (ko) * 2004-10-12 2006-04-17 한국과학기술정보연구원 특허정보 검색 시스템 및 그 방법과 그 방법에 대한컴퓨터프로그램 소스를 저장한 기록매체
CN101059806A (zh) * 2007-06-06 2007-10-24 华东师范大学 一种基于语义的本地文档检索方法
CN104765779A (zh) * 2015-03-20 2015-07-08 浙江大学 一种基于YAGO2s的专利文档查询扩展方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
吴红等: "基于领域本体的专利信息检索系统研究与实现", 《情报分析与研究》 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108345694A (zh) * 2018-03-19 2018-07-31 华北电力大学(保定) 一种基于主题数据库的文献检索方法及系统
CN108345694B (zh) * 2018-03-19 2021-09-03 华北电力大学(保定) 一种基于主题数据库的文献检索方法及系统
CN113032258A (zh) * 2021-03-22 2021-06-25 北京百度网讯科技有限公司 一种电子地图的测试方法、装置、电子设备及存储介质
CN113032258B (zh) * 2021-03-22 2022-11-25 北京百度网讯科技有限公司 一种电子地图的测试方法、装置、电子设备及存储介质

Similar Documents

Publication Publication Date Title
CN105373541B (zh) 数据库的数据操作请求的处理方法和系统
CN105094707B (zh) 一种数据存储、读取方法及装置
CN104166651B (zh) 基于对同类数据对象整合的数据搜索的方法和装置
CN103425691A (zh) 一种搜索方法和系统
WO2008019330A3 (en) Flexible request and response communications interfaces
CN105302810A (zh) 一种信息搜索方法和装置
CN105138670A (zh) 音频文件标签生成方法和系统
US9442949B2 (en) System and method for compressing data in a database
CN106227834A (zh) 多媒体资源的推荐方法及装置
CN110362689A (zh) 一种风险评估方法、装置、存储介质和服务器
CN103123650A (zh) 一种基于整数映射的xml数据库全文索引方法
CN108171071A (zh) 一种面向云计算的多关键字可排序密文检索方法
CN104636401B (zh) 一种scada系统数据回滚的方法及装置
CN107273529B (zh) 基于哈希函数的高效层级索引构建及检索方法
CN103870571B (zh) 多维联机分析处理系统中的立方体重构方法和装置
CN106909665A (zh) 一种基于本体的专利检索方法
CN101930458B (zh) 一种基于特征值的短信匹配方法
CN107729330A (zh) 获取数据集的方法和装置
CN103942056B (zh) 一种基于场景的人机交互方法和装置
CN106257449A (zh) 一种信息确定方法和装置
US11017031B2 (en) System and method of data transformation
CN104572887A (zh) 一种产品信息的检索方法和系统
CN107463679A (zh) 一种信息推荐方法及装置
CN107315831A (zh) 一种挖掘规则关联模型未知关联关系的方法及装置
CN108647243B (zh) 基于时间序列的工业大数据存储方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20170630

WD01 Invention patent application deemed withdrawn after publication