CN105426369A - 一种专利检索用语义解码方法 - Google Patents

一种专利检索用语义解码方法 Download PDF

Info

Publication number
CN105426369A
CN105426369A CN201410446871.6A CN201410446871A CN105426369A CN 105426369 A CN105426369 A CN 105426369A CN 201410446871 A CN201410446871 A CN 201410446871A CN 105426369 A CN105426369 A CN 105426369A
Authority
CN
China
Prior art keywords
retrieval
meaning
word
keyword
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201410446871.6A
Other languages
English (en)
Inventor
姚王平
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
SHANGHAI YAOBO INFORMATION TECHNOLOGY Co Ltd
Original Assignee
SHANGHAI YAOBO INFORMATION TECHNOLOGY Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SHANGHAI YAOBO INFORMATION TECHNOLOGY Co Ltd filed Critical SHANGHAI YAOBO INFORMATION TECHNOLOGY Co Ltd
Priority to CN201410446871.6A priority Critical patent/CN105426369A/zh
Publication of CN105426369A publication Critical patent/CN105426369A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

一种专利检索用语义解码方法,包括设置在前台终端的用于检索者的命令接口模块,所述的用于检索者的命令接口模块能够导进输入的专利检索用关键词,另外所述的用于检索者的命令接口模块还能够导进用于检索的组件检索后发送来的检索得到的专利检索数据,而且还能把所述的检索得到的专利检索数据链接成专利检索数据的链接表并据此而导出;存放在后台服务器内的所述的用于检索的组件以及存放在后台服务器内的映射表,所述的映射表中包括有词义库。结合了步骤方法避免了现有技术的无法全方位多层次地适应客户的要求使得检索无法保证完整性、检索速度不高并且让通信链路的带宽损失大的缺陷。

Description

一种专利检索用语义解码方法
技术领域
本发明属专利检索技术领域,具体涉及一种专利检索用语义解码方法。
背景技术
现在由于专利的电子信息化公开的日见普遍,在通过通信链路来连接的各种存储专利文档的服务器中,产生了不断增大的各种专利文档的繁杂数据,但是于存储专利文档的服务器中检索客户所想检索的专利数据来说,在通过通信链路连接的存储专利文档的服务器中繁杂的专利数据进行检索确实太难以准确高效的得到检索结果了,而比如佰腾、soopat这样的一些专利检索工具的出现,终于能够部分的为客户检索专利数据提供提高检索速度的工具。专利检索工具往往为在通信链路中使用的模块化检索工具,按照特有的方式在存储专利文档的服务器中进行检索以及获取对应的专利数据,另外于获取对应的专利数据中实现规整以及排列,最终提供检索的结果。一般来说,此类专利检索工具采用BS架构的形式,通过客户端的检索用文本框输入检索用关键字,随之在短时间内在显示器上显示出检索出的专利数据概要,这样的专利数据的数量往往是非常大的,每一个检索出来的专利数据意味着针对该专利的一个链接。
但是迄今为止的专利检索工具面向客户端输入的检索用关键字均为根据检索用关键字所形成的序列码来认定的,好比面向客户端输入的检索用关键字为戴尔笔记本电脑,专利检索工具仅仅就会把这样的关键字所形成的序列码拆成戴尔与笔记本电脑,据此于存储专利文档的服务器中实施检索,把涉及到戴尔或笔记本电脑的关键词的链接机械的反映出来,但是这样的专利检索工具不可以把客户所输入的专利检索用关键词实施内涵以及词义的认识,好比客户端输入的专利检索用关键词是戴尔笔记本电脑,专利检索工具并没有把戴尔认识成笔记本电脑的一种型号;与此同时就没有认识专利检索用关键词的检索目的,乃至于专利检索用关键词还具备有格式种类不少并且检索的目的也不少的特性时,这样的检索工具就无法全方位多层次地适应客户的要求,使得检索无法保证完整性,从而使得要不断输入各种各样的专利检索用关键词方得到检索目的所要的专利检索数据,导致检索速度不高并且让通信链路的带宽损失大的缺陷。
发明内容
本发明的目的提供一种专利检索用语义解码方法,包括设置在前台终端的用于检索者的命令接口模块,所述的用于检索者的命令接口模块能够导进输入的专利检索用关键词,另外所述的用于检索者的命令接口模块还能够导进用于检索的组件检索后发送来的检索得到的专利检索数据,而且还能把所述的检索得到的专利检索数据链接成专利检索数据的链接表并据此而导出;存放在后台服务器内的所述的用于检索的组件能够把涉及到检索目的的专利检索用关键词在存放有专利数据的后台服务器内检索,以此获得检索到的专利数据;存放在后台服务器内的映射表,所述的映射表中包括有词义库。结合步骤方法避免了现有技术的无法全方位多层次地适应客户的要求使得检索无法保证完整性、检索速度不高并且让通信链路的带宽损失大的缺陷。
为了克服现有技术中的不足,本发明提供了一种专利检索用语义解码方法的解决方案,具体如下:
一种专利检索用语义解码方法,步骤如下:
步骤1:首先设置在前台终端5的用于检索者的命令接口模块1,所述的用于检索者的命令接口模块1能够导进输入的专利检索用关键词,另外所述的用于检索者的命令接口模块1还能够导进用于检索的组件2检索后发送来的检索得到的专利检索数据,而且还能把所述的检索得到的专利检索数据链接成专利检索数据的链接表并据此而导出;存放在后台服务器3内的所述的用于检索的组件2能够把涉及到检索目的的专利检索用关键词在存放有专利数据的后台服务器3内检索,以此获得检索到的专利数据;存放在后台服务器3内的映射表4,所述的映射表4中包括有词义库;所述的专利检索用语义解码方法另外还包括设置在前台终端5内的通信链路组织模块6,所述的通信链路组织模块6能够按照设定的通信规则经过通信链路导进前台终端5导出的检索者检索用关键词,另外还能把检索者检索用关键词传输至用于检索者的命令接口模块1,以及通信链路组织模块6还能够导入用于检索者的命令接口模块1导出的专利检索数据的链接表;所述的专利检索用语义解码方法内还包括存放在后台服务器3内的检索者的以前检索经验表8,所述的过去检索经验表8包括有检索者的以前检索的数据;所述的检索者的以前检索的数据包括专利检索用关键词、检索的计数量和选择检索的频率;所述的专利检索用语义解码方法内还包括存放在后台服务器3内的词义样本筛选模块9,所述的词义样本筛选模块9能够凭借所述的映射表4中的词义库以及以前检索经验表8中的专利检索用关键词,筛选出词义样本,并把词义样本存放在用来存放词义样本的词义样本表中;所述的后台服务器3中的专利数据是以XML格式存储的或者为带有指定检索用数据项的数据库;所述的后台服务器3中还包括有词义拓展模块10,所述的词义拓展模块10能够凭借所述的映射表4来把专利检索用关键词进行词义拓展;所述的以XML格式存储的专利数据包括XML格式的专利数据以及用来检索的关键词数据;所述的带有指定检索用数据项的数据库包括专利数据以及带有指定检索用数据项的数据;
步骤2:在专利检索过程时,先通过用于检索者的命令接口模块1导进输入的专利检索用关键词;
步骤3:通过前台终端5把输入的专利检索用关键词发送到后台服务器3中经过映射表和词义样本筛选模块的共同筛选出词义样本,并根据该词义样本来作为能够实现检索目的的关键词;
步骤4:并在后台服务器3的专利数据中进行检索,检索后得到的专利数据发送到前台终端5进行输出。
所述的经过映射表和词义样本筛选模块的共同筛选出词义样本,并根据该词义样本来作为能够实现检索目的的关键词的步骤如下:
步骤1:经过以前检索经验表8为映射表4中的词义库内的每个词义的每个检索目的进行等级划分,等级划分的大小用数值大小来区分,使得每个词义均带着各自对应的检索目的的等级值;
步骤2:把所述的专利检索用关键词同每个词义进行比较,获取同所属的专利检索用关键词相同或相近的若干词义;
步骤3:把同所述的专利检索用关键词相同或相近的若干词义各自对应的检索目的的等级值进行求和,获得初级求和值;
步骤4:经过同所述的专利检索用关键词相同或相近的若干词义在词义库内的属性值,分别来同初级求和值进行相加,获得词义库的全面的检索目的的数值组;
步骤5:把词义库的全面的检索目的的数值组中的每个数值把预设的限定值相比较;
步骤6:如果预设的限定值小于或等于词义库的全面的检索目的的数值组的一个以上的数值,就把词义库的全面的检索目的的数值组中的最大数值所对应的词义作为专利检索用关键词;
步骤7:如果预设的限定值大于词义库的全面的检索目的的数值组的一个以上的数值,就把原有的输入的专利检索用关键词作为专利检索用关键词。
应用本发明上述方案,具有如下优点:
根据包括有词义库的所述的映射表4,就能进一步深入的认识专利检索使用者导入的专利检索用关键词,由此拆分专利检索关键词的分解词,以此来专利检索关键词的组成体系,再把专利检索用关键词实施词义拓展,这样就能在专利检索使用者筛选出更好的检索关键词来适应检索使用者的目的,这样就可以让专利检索使用者检索速度加快并且让通信链路的带宽使用减小。
附图说明
图l为本发明的结构示意图。
具体实施方式
下面结合附图对发明内容作进一步说明:
参照图1所示,专利检索用语义解码方法,步骤如下:
步骤1:首先设置在前台终端5的用于检索者的命令接口模块1,所述的用于检索者的命令接口模块1能够导进输入的专利检索用关键词,另外所述的用于检索者的命令接口模块1还能够导进用于检索的组件2检索后发送来的检索得到的专利检索数据,而且还能把所述的检索得到的专利检索数据链接成专利检索数据的链接表并据此而导出;存放在后台服务器3内的所述的用于检索的组件2能够把涉及到检索目的的专利检索用关键词在存放有专利数据的后台服务器3内检索,以此获得检索到的专利数据;存放在后台服务器3内的映射表4,所述的映射表4中包括有词义库;所述的专利检索用语义解码方法另外还包括设置在前台终端5内的通信链路组织模块6,所述的通信链路组织模块6能够按照设定的通信规则经过通信链路导进前台终端5导出的检索者检索用关键词,另外还能把检索者检索用关键词传输至用于检索者的命令接口模块1,以及通信链路组织模块6还能够导入用于检索者的命令接口模块1导出的专利检索数据的链接表;所述的专利检索用语义解码方法内还包括存放在后台服务器3内的检索者的以前检索经验表8,所述的过去检索经验表8包括有检索者的以前检索的数据;所述的检索者的以前检索的数据包括专利检索用关键词、检索的计数量和选择检索的频率;所述的专利检索用语义解码方法内还包括存放在后台服务器3内的词义样本筛选模块9,所述的词义样本筛选模块9能够凭借所述的映射表4中的词义库以及以前检索经验表8中的专利检索用关键词,筛选出词义样本,并把词义样本存放在用来存放词义样本的词义样本表中;所述的后台服务器3中的专利数据是以XML格式存储的或者为带有指定检索用数据项的数据库;所述的后台服务器3中还包括有词义拓展模块10,所述的词义拓展模块10能够凭借所述的映射表4来把专利检索用关键词进行词义拓展;所述的以XML格式存储的专利数据包括XML格式的专利数据以及用来检索的关键词数据;所述的带有指定检索用数据项的数据库包括专利数据以及带有指定检索用数据项的数据;
步骤2:在专利检索过程时,先通过用于检索者的命令接口模块1导进输入的专利检索用关键词;
步骤3:通过前台终端5把输入的专利检索用关键词发送到后台服务器3中经过映射表和词义样本筛选模块的共同筛选出词义样本,并根据该词义样本来作为能够实现检索目的的关键词;
步骤4:并在后台服务器3的专利数据中进行检索,检索后得到的专利数据发送到前台终端5进行输出。
所述的经过映射表和词义样本筛选模块的共同筛选出词义样本,并根据该词义样本来作为能够实现检索目的的关键词的步骤如下:
步骤1:经过以前检索经验表8为映射表4中的词义库内的每个词义的每个检索目的进行等级划分,等级划分的大小用数值大小来区分,使得每个词义均带着各自对应的检索目的的等级值;
步骤2:把所述的专利检索用关键词同每个词义进行比较,获取同所属的专利检索用关键词相同或相近的若干词义;
步骤3:把同所述的专利检索用关键词相同或相近的若干词义各自对应的检索目的的等级值进行求和,获得初级求和值;
步骤4:经过同所述的专利检索用关键词相同或相近的若干词义在词义库内的属性值,分别来同初级求和值进行相加,获得词义库的全面的检索目的的数值组;
步骤5:把词义库的全面的检索目的的数值组中的每个数值把预设的限定值相比较;
步骤6:如果预设的限定值小于或等于词义库的全面的检索目的的数值组的一个以上的数值,就把词义库的全面的检索目的的数值组中的最大数值所对应的词义作为专利检索用关键词;
步骤7:如果预设的限定值大于词义库的全面的检索目的的数值组的一个以上的数值,就把原有的输入的专利检索用关键词作为专利检索用关键词。
以上所述,仅是本发明的较佳实施例而已,并非对本发明作任何形式上的限制,虽然本发明已以较佳实施例揭露如上,然而并非用以限定本发明,任何熟悉本专业的技术人员,在不脱离本发明技术方案范围内,当可利用上述揭示的技术内容做出些许更动或修饰为等同变化的等效实施例,但凡是未脱离本发明技术方案内容,依据本发明的技术实质,在本发明的精神和原则之内,对以上实施例所作的任何简单的修改、等同替换与改进等,均仍属于本发明技术方案的保护范围之内。

Claims (2)

1.一种专利检索用语义解码方法,其特征在于,步骤如下:
步骤1:首先设置在前台终端的用于检索者的命令接口模块,所述的用于检索者的命令接口模块能够导进输入的专利检索用关键词,另外所述的用于检索者的命令接口模块还能够导进用于检索的组件检索后发送来的检索得到的专利检索数据,而且还能把所述的检索得到的专利检索数据链接成专利检索数据的链接表并据此而导出;存放在后台服务器内的所述的用于检索的组件能够把涉及到检索目的的专利检索用关键词在存放有专利数据的后台服务器内检索,以此获得检索到的专利数据;存放在后台服务器内的映射表,所述的映射表中包括有词义库;所述的专利检索用语义解码方法另外还包括设置在前台终端内的通信链路组织模块,所述的通信链路组织模块能够按照设定的通信规则经过通信链路导进前台终端导出的检索者检索用关键词,另外还能把检索者检索用关键词传输至用于检索者的命令接口模块,以及通信链路组织模块还能够导入用于检索者的命令接口模块导出的专利检索数据的链接表;所述的专利检索用语义解码方法内还包括存放在后台服务器内的检索者的以前检索经验表,所述的过去检索经验表包括有检索者的以前检索的数据;所述的检索者的以前检索的数据包括专利检索用关键词、检索的计数量和选择检索的频率;所述的专利检索用语义解码方法内还包括存放在后台服务器内的词义样本筛选模块,所述的词义样本筛选模块能够凭借所述的映射表中的词义库以及以前检索经验表中的专利检索用关键词,筛选出词义样本,并把词义样本存放在用来存放词义样本的词义样本表中;所述的后台服务器中的专利数据是以XML格式存储的或者为带有指定检索用数据项的数据库;所述的后台服务器中还包括有词义拓展模块,所述的词义拓展模块能够凭借所述的映射表来把专利检索用关键词进行词义拓展;所述的以XML格式存储的专利数据包括XML格式的专利数据以及用来检索的关键词数据;所述的带有指定检索用数据项的数据库包括专利数据以及带有指定检索用数据项的数据;
步骤2:在专利检索过程时,先通过用于检索者的命令接口模块导进输入的专利检索用关键词;
步骤3:通过前台终端把输入的专利检索用关键词发送到后台服务器中经过映射表和词义样本筛选模块的共同筛选出词义样本,并根据该词义样本来作为能够实现检索目的的关键词;
步骤4:并在后台服务器的专利数据中进行检索,检索后得到的专利数据发送到前台终端进行输出。
2.根据权利要求1所述的专利检索用语义解码方法,其特征在于所述的经过映射表和词义样本筛选模块的共同筛选出词义样本,并根据该词义样本来作为能够实现检索目的的关键词的步骤如下:
步骤1:经过以前检索经验表为映射表中的词义库内的每个词义的每个检索目的进行等级划分,等级划分的大小用数值大小来区分,使得每个词义均带着各自对应的检索目的的等级值;
步骤2:把所述的专利检索用关键词同每个词义进行比较,获取同所属的专利检索用关键词相同或相近的若干词义;
步骤3:把同所述的专利检索用关键词相同或相近的若干词义各自对应的检索目的的等级值进行求和,获得初级求和值;
步骤4:经过同所述的专利检索用关键词相同或相近的若干词义在词义库内的属性值,分别来同初级求和值进行相加,获得词义库的全面的检索目的的数值组;
步骤5:把词义库的全面的检索目的的数值组中的每个数值把预设的限定值相比较;
步骤6:如果预设的限定值小于或等于词义库的全面的检索目的的数值组的一个以上的数值,就把词义库的全面的检索目的的数值组中的最大数值所对应的词义作为专利检索用关键词;
步骤7:如果预设的限定值大于词义库的全面的检索目的的数值组的一个以上的数值,就把原有的输入的专利检索用关键词作为专利检索用关键词。
CN201410446871.6A 2014-09-04 2014-09-04 一种专利检索用语义解码方法 Pending CN105426369A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410446871.6A CN105426369A (zh) 2014-09-04 2014-09-04 一种专利检索用语义解码方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410446871.6A CN105426369A (zh) 2014-09-04 2014-09-04 一种专利检索用语义解码方法

Publications (1)

Publication Number Publication Date
CN105426369A true CN105426369A (zh) 2016-03-23

Family

ID=55504582

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410446871.6A Pending CN105426369A (zh) 2014-09-04 2014-09-04 一种专利检索用语义解码方法

Country Status (1)

Country Link
CN (1) CN105426369A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107122436A (zh) * 2017-04-19 2017-09-01 重庆水利电力职业技术学院 大数据统计分析系统

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005173915A (ja) * 2003-12-10 2005-06-30 Ntt Docomo Inc 携帯端末、検索システム、及び、検索方法
CN101025753A (zh) * 2007-03-28 2007-08-29 上海汉光知识产权数据科技有限公司 专利检索方法
CN101276341A (zh) * 2007-03-29 2008-10-01 上海汉光知识产权数据科技有限公司 专利数据检索系统
CN101510221A (zh) * 2009-02-17 2009-08-19 北京大学 一种用于信息检索的查询语句分析方法与系统
CN101539916A (zh) * 2008-03-17 2009-09-23 亿维讯软件(北京)有限公司 初次专利检索装置、二次专利检索装置和专利检索系统
CN102999625A (zh) * 2012-12-05 2013-03-27 北京海量融通软件技术有限公司 一种检索请求语义扩展方法
CN103577423A (zh) * 2012-07-23 2014-02-12 阿里巴巴集团控股有限公司 关键词分类方法及系统

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005173915A (ja) * 2003-12-10 2005-06-30 Ntt Docomo Inc 携帯端末、検索システム、及び、検索方法
CN101025753A (zh) * 2007-03-28 2007-08-29 上海汉光知识产权数据科技有限公司 专利检索方法
CN101276341A (zh) * 2007-03-29 2008-10-01 上海汉光知识产权数据科技有限公司 专利数据检索系统
CN101539916A (zh) * 2008-03-17 2009-09-23 亿维讯软件(北京)有限公司 初次专利检索装置、二次专利检索装置和专利检索系统
CN101510221A (zh) * 2009-02-17 2009-08-19 北京大学 一种用于信息检索的查询语句分析方法与系统
CN103577423A (zh) * 2012-07-23 2014-02-12 阿里巴巴集团控股有限公司 关键词分类方法及系统
CN102999625A (zh) * 2012-12-05 2013-03-27 北京海量融通软件技术有限公司 一种检索请求语义扩展方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107122436A (zh) * 2017-04-19 2017-09-01 重庆水利电力职业技术学院 大数据统计分析系统

Similar Documents

Publication Publication Date Title
US9753960B1 (en) System, method, and computer program for dynamically generating a visual representation of a subset of a graph for display, based on search criteria
US20150278268A1 (en) Data encoding and corresponding data structure
CN105740303B (zh) 改进的对象存储的方法及装置
CN109241159B (zh) 一种数据立方体的分区查询方法、系统及终端设备
CN106326429A (zh) 一种基于solr的Hbase秒级查询方案
CN106970958B (zh) 一种流文件的查询与存储方法和装置
CN110275920A (zh) 数据查询方法、装置、电子设备及计算机可读存储介质
CN102332030A (zh) 用于分布式键-值存储系统的数据存储、管理和查询方法及系统
CN106911757A (zh) 一种业务信息的推送方法和装置
CN110515896B (zh) 模型资源管理方法、模型文件制作方法、装置和系统
CN104573022A (zh) 一种HBase的数据查询方法及装置
CN104731945A (zh) 一种基于HBase的全文检索方法及装置
CN103970842A (zh) 一种面向防洪减灾领域的水利大数据存取系统及方法
CN105183916A (zh) 一种管理非结构化数据的装置和方法
CN104504030A (zh) 一种面向电力调度自动化海量报文的索引方法
CN107526746B (zh) 管理文档索引的方法和设备
CN106528641A (zh) 一种数据存储方法、装置及通信网关机
CN105488471B (zh) 一种字形识别方法及装置
CN104408128B (zh) 一种基于b+树异步更新索引的读优化方法
CN103744952A (zh) NoSQL数据库多表特性的实现方法及系统
CN103425490B (zh) 基于crm系统中运行对象数据的管理方法
CN107807977B (zh) 一种基于配置的对象属性元数据抽取系统
CN112307318A (zh) 一种内容发布方法、系统及装置
CN113190645A (zh) 一种索引结构建立方法、装置、设备及存储介质
CN105426369A (zh) 一种专利检索用语义解码方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20160323