CN106909665A - 一种基于本体的专利检索方法 - Google Patents
一种基于本体的专利检索方法 Download PDFInfo
- Publication number
- CN106909665A CN106909665A CN201710111288.3A CN201710111288A CN106909665A CN 106909665 A CN106909665 A CN 106909665A CN 201710111288 A CN201710111288 A CN 201710111288A CN 106909665 A CN106909665 A CN 106909665A
- Authority
- CN
- China
- Prior art keywords
- retrieval
- feature words
- database
- method based
- degree
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/338—Presentation of query results
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2216/00—Indexing scheme relating to additional aspects of information retrieval not explicitly covered by G06F16/00 and subgroups
- G06F2216/01—Automatic library building
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2216/00—Indexing scheme relating to additional aspects of information retrieval not explicitly covered by G06F16/00 and subgroups
- G06F2216/11—Patent retrieval
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种基于本体的专利检索方法,过程如下:(1)专利本体库建设过程,首先对专利本体描述文本进行分析,逐一检索并统计其描述文本的特征词;根据检索的特征词以及出现次数,以特征词作为关键词,出现次数作为权重,建立专利本体单链表模型,并融合专利本身信息,存入数据库中;(2)专利检索过程,首先使用用户检索词到数据库中进行查找,与本体单链表模型进行匹配,根据匹配的关键词的权重累加,得到关联度。将检索结果根据关联度进行倒序排列,展示给客户。本发明在确保检索效率的前提下能有效提高专利的检索精度。
Description
技术领域
本发明属于专利检索领域,具体涉及一种基于本体的专利检索方法。
背景技术
专利已日益成为企业竞争力的核心要素,如何快速检索出专利并用于企业创新驱动是一个非常重要的问题。然而,目前,现有的专利检索方式基本上都是以匹配第三方描述信息进行查找,效率低,也很难达到用户满意的检索效果。为此,本方法通过专利描述信息进行本体建模,提高检索结果与本体的关联度,以实现兼顾效率与准确性的一种基于本体的专利检索方法。
发明内容
在本发明的目的在于:基于专利检索的原理,从专利本体出发,进行数据建模,既提高了关键词与本体关联性,同时保证了检索结果的准确性,从而提高了专利在用户检索中的效率和准确性。
为实现上述目的,本发明采取的技术方案主要包括以下过程:
(一)专利本体库建设过程
步骤11,特征词统计:
A)获取专利对象O ,对其文本进行逐一检索;
B)将检索到的特征词name存到TemName ([name0,num0]、…、[nameN,numN])中,num初始值为0,首次添加name直接加入数组,num为1;
C)如果TemName中已经存在检索name,则对应的num加一;
D)重复进行B)C)过程,直至检索完毕后,得到特征词数组TemName ([name0,num0]、…、[nameN,numN]);
步骤12,建立专利本体单链表模型:
A)将特征词数组Name中的元素,根据num倒序重新排列,取前十个元素得到最终特征词数组TemName ([name0,num0]、…、[nameN,numN]);
B)根据检索的特征词以及出现次数,以特征词name作为关键词KeyName,出现次数num作为权重Weight,融合专利申请号、日期等信息,建立专利本体单链表模型L;
步骤13,建立专利数据库D;
专利本体单链表模型,并融合专利本身信息,存入数据库中;
(二)专利检索过程
步骤21,检索词查找:
获取用户检索词Uname,通过用户检索词Uname,对数据库D进行查找;
步骤22,根据权重计算关联度Link(初始值为0):
A)对数据库中的每一条记录与用户检索词Uname进行匹配;
B)如果出现匹配的情况下,读取该关键词KeyName对于本条记录的权重值Weight,并加到Link中,Link为此条数据记录与用户检索词Uname的关联度;
步骤23,根据数据库中记录与关键词关联度Link倒序排列,得到检索结果。
上述方法,可在确保检索效率的前提下,有效实现专利的检索。
附图说明
图1是专利本体库建设和用户专利检索的流程图;
图2是基于单链表进行专利本体模型建模。
具体实施方式
本发明是一种专利检索方法,主要包括如下过程:(1)专利本体库建设过程,首先对专利本体描述文本进行分析,逐一检索并统计其描述文本的特征词;根据检索的特征词以及出现次数,以特征词作为关键词,出现次数作为权重,建立专利本体单链表模型,并融合专利本身信息,存入数据库中;(2)专利检索过程,首先使用用户检索词到数据库中进行查找,与本体单链表模型进行匹配,根据匹配的关键词的权重累加,得到关联度。将检索结果根据关联度进行倒序排列,展示给客户。本发明在确保检索效率的前提下能有效提高专利的检索精度。
本实施例选择专利《一种基于数字信封的矢量地图数据安全传输方法》作为测试数据,针对数据的提取、建模、入库、检索的整个过程,进一步详细的说明本发明。
(一)专利本体库建设过程
步骤11,特征词统计:
A)获取专利对象《一种基于数字信封的矢量地图数据安全传输方法》,对其文本进行逐一检索;
B)将检索到的特征词name存到TemName ([name0,num0]、…、[nameN,numN])中,num初始值为0,首次添加name直接加入数组,num为1;
C)如果TemName中已经存在检索name,则对应的num加一;
D)重复进行B)C)过程,直至检索完毕后,得到特征词数组TemName ([‘数字信封’,10]、…、[‘对称加密’,1]);
步骤12,建立专利本体单链表模型:
A)将特征词数组Name中的元素,根据num倒序重新排列,取前十个元素得到最终特征词数组TemName ([‘数字信封’,10]、…、[‘横坐标’,2]);
B)根据检索的特征词以及出现次数,以特征词name作为关键词KeyName,出现次数num作为权重Weight,融合专利申请号、日期等信息,建立专利本体单链表模型L;
步骤13,建立专利数据库D;
专利本体单链表模型,并融合专利本身信息,存入数据库中;
(二)专利检索过程
步骤21,检索词查找:
获取用户检索词Uname为‘数字信封’,通过用户检索词Uname,对数据库D进行查找;
步骤22,根据权重计算关联度Link(初始值为0):
A)对数据库中的每一条记录与用户检索词Uname进行匹配;
B)如果出现匹配的情况下,读取该关键词KeyName对于本条记录的权重值Weight,并累加到Link中,Link为此条数据记录与用户检索词Uname的关联度;
C)得到《一种基于数字信封的矢量地图数据安全传输方法》与用户检索词Uname的关联度Link为10;
步骤23,根据数据库中记录与关键词关联度Link倒序排列,得到检索结果。
Claims (7)
1.一种基于本体的专利检索方法,包括如下步骤:
(一)专利本体库建设过程,
(二)专利检索过程;
所述步骤(一)包括步骤11,特征词统计;步骤12,建立专利本体单链表模型;步骤13,建立专利数据库D;
所述步骤(二)包括步骤21,检索词查找;步骤22,根据权重计算关联度Link(初始值为0);步骤23,根据数据库中记录与关键词关联度Link倒序排列,得到检索结果。
2.根据权利要求1一种基于本体的专利检索方法,其特征在于:
所述步骤11,特征词统计;
A)获取专利对象O ,对其文本进行逐一检索;
B)将检索到的特征词name存到TemName ([name0,num0]、…、[nameN,numN])中,num初始值为0,首次添加name直接加入数组,num为1;
C)如果TemName中已经存在检索name,则对应的num加一;
D)重复进行B)C)过程,直至检索完毕后,得到特征词数组TemName ([name0,num0]、…、[nameN,numN])。
3.根据权利要求1一种基于本体的专利检索方法,其特征在于:
所述步骤12,建立专利本体单链表模型;
A)将特征词数组Name中的元素,根据num倒序重新排列,取前十个元素得到最终特征词数组TemName ([name0,num0]、…、[nameN,numN]);
B)根据检索的特征词以及出现次数,以特征词name作为关键词KeyName,出现次数num作为权重Weight,融合专利申请号、日期等信息,建立专利本体单链表模型L。
4.根据权利要求1一种基于本体的专利检索方法,其特征在于:
所述步骤13,建立专利数据库D;
专利本体单链表模型,并融合专利本身信息,存入数据库中。
5.根据权利要求1一种基于本体的专利检索方法,其特征在于:
所述步骤21,检索词查找;
获取用户检索词Uname,通过用户检索词Uname,对数据库D进行查找。
6.根据权利要求1一种基于本体的专利检索方法,其特征在于:
所述步骤22,根据权重计算关联度Link(初始值为0);
A)对数据库中的每一条记录与用户检索词Uname进行匹配;
B)如果出现匹配的情况下,读取该关键词KeyName对于本条记录的权重值Weight,并加到Link中,Link为此条数据记录与用户检索词Uname的关联度。
7.根据权利要求1一种基于本体的专利检索方法,其特征在于:
所述步骤23,根据数据库中记录与关键词关联度Link倒序排列,得到检索结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710111288.3A CN106909665A (zh) | 2017-02-28 | 2017-02-28 | 一种基于本体的专利检索方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710111288.3A CN106909665A (zh) | 2017-02-28 | 2017-02-28 | 一种基于本体的专利检索方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN106909665A true CN106909665A (zh) | 2017-06-30 |
Family
ID=59208592
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710111288.3A Pending CN106909665A (zh) | 2017-02-28 | 2017-02-28 | 一种基于本体的专利检索方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106909665A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108345694A (zh) * | 2018-03-19 | 2018-07-31 | 华北电力大学(保定) | 一种基于主题数据库的文献检索方法及系统 |
CN113032258A (zh) * | 2021-03-22 | 2021-06-25 | 北京百度网讯科技有限公司 | 一种电子地图的测试方法、装置、电子设备及存储介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20060032310A (ko) * | 2004-10-12 | 2006-04-17 | 한국과학기술정보연구원 | 특허정보 검색 시스템 및 그 방법과 그 방법에 대한컴퓨터프로그램 소스를 저장한 기록매체 |
CN101059806A (zh) * | 2007-06-06 | 2007-10-24 | 华东师范大学 | 一种基于语义的本地文档检索方法 |
CN104765779A (zh) * | 2015-03-20 | 2015-07-08 | 浙江大学 | 一种基于YAGO2s的专利文档查询扩展方法 |
-
2017
- 2017-02-28 CN CN201710111288.3A patent/CN106909665A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20060032310A (ko) * | 2004-10-12 | 2006-04-17 | 한국과학기술정보연구원 | 특허정보 검색 시스템 및 그 방법과 그 방법에 대한컴퓨터프로그램 소스를 저장한 기록매체 |
CN101059806A (zh) * | 2007-06-06 | 2007-10-24 | 华东师范大学 | 一种基于语义的本地文档检索方法 |
CN104765779A (zh) * | 2015-03-20 | 2015-07-08 | 浙江大学 | 一种基于YAGO2s的专利文档查询扩展方法 |
Non-Patent Citations (1)
Title |
---|
吴红等: "基于领域本体的专利信息检索系统研究与实现", 《情报分析与研究》 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108345694A (zh) * | 2018-03-19 | 2018-07-31 | 华北电力大学(保定) | 一种基于主题数据库的文献检索方法及系统 |
CN108345694B (zh) * | 2018-03-19 | 2021-09-03 | 华北电力大学(保定) | 一种基于主题数据库的文献检索方法及系统 |
CN113032258A (zh) * | 2021-03-22 | 2021-06-25 | 北京百度网讯科技有限公司 | 一种电子地图的测试方法、装置、电子设备及存储介质 |
CN113032258B (zh) * | 2021-03-22 | 2022-11-25 | 北京百度网讯科技有限公司 | 一种电子地图的测试方法、装置、电子设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105373541B (zh) | 数据库的数据操作请求的处理方法和系统 | |
CN105094707B (zh) | 一种数据存储、读取方法及装置 | |
CN104166651B (zh) | 基于对同类数据对象整合的数据搜索的方法和装置 | |
CN103425691A (zh) | 一种搜索方法和系统 | |
WO2008019330A3 (en) | Flexible request and response communications interfaces | |
CN105302810A (zh) | 一种信息搜索方法和装置 | |
CN105138670A (zh) | 音频文件标签生成方法和系统 | |
US9442949B2 (en) | System and method for compressing data in a database | |
CN106227834A (zh) | 多媒体资源的推荐方法及装置 | |
CN110362689A (zh) | 一种风险评估方法、装置、存储介质和服务器 | |
CN103123650A (zh) | 一种基于整数映射的xml数据库全文索引方法 | |
CN108171071A (zh) | 一种面向云计算的多关键字可排序密文检索方法 | |
CN104636401B (zh) | 一种scada系统数据回滚的方法及装置 | |
CN107273529B (zh) | 基于哈希函数的高效层级索引构建及检索方法 | |
CN103870571B (zh) | 多维联机分析处理系统中的立方体重构方法和装置 | |
CN106909665A (zh) | 一种基于本体的专利检索方法 | |
CN101930458B (zh) | 一种基于特征值的短信匹配方法 | |
CN107729330A (zh) | 获取数据集的方法和装置 | |
CN103942056B (zh) | 一种基于场景的人机交互方法和装置 | |
CN106257449A (zh) | 一种信息确定方法和装置 | |
US11017031B2 (en) | System and method of data transformation | |
CN104572887A (zh) | 一种产品信息的检索方法和系统 | |
CN107463679A (zh) | 一种信息推荐方法及装置 | |
CN107315831A (zh) | 一种挖掘规则关联模型未知关联关系的方法及装置 | |
CN108647243B (zh) | 基于时间序列的工业大数据存储方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20170630 |
|
WD01 | Invention patent application deemed withdrawn after publication |