CN105069155A - 基于化合物制备专利的信息检索系统 - Google Patents
基于化合物制备专利的信息检索系统 Download PDFInfo
- Publication number
- CN105069155A CN105069155A CN201510527222.3A CN201510527222A CN105069155A CN 105069155 A CN105069155 A CN 105069155A CN 201510527222 A CN201510527222 A CN 201510527222A CN 105069155 A CN105069155 A CN 105069155A
- Authority
- CN
- China
- Prior art keywords
- information
- module
- compound
- subindex
- user
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2462—Approximate or statistical queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/22—Indexing; Data structures therefor; Storage structures
- G06F16/2228—Indexing structures
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Probability & Statistics with Applications (AREA)
- Software Systems (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Fuzzy Systems (AREA)
- Computational Linguistics (AREA)
- Mathematical Physics (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供一种基于化合物制备专利的信息检索系统。所述基于化合物制备专利的信息检索系统包括用户端平台、数据库服务器及文件服务器,所述用户端平台分别与所述数据库服务器及所述文件服务器建立连接并进行数据交换,同时所述数据库服务器与所述文件服务器建立连接并进行数据交换,所述用户端平台与所述文件服务器分别通过网络与互联网连接;所述数据库服务器包括信息分类模块、信息库模块、选择比对模块及关联模块,通过各模块结合将化合物制备专利信息经过分类预处理、选择比对及关联度排序,帮助用户检索到需要的专利,结果清楚明了,降低人力时间成本,提高工作效率。
Description
技术领域
本发明涉及信息处理技术领域,具体涉及一种基于化合物制备专利的信息检索系统。
背景技术
随着科技的蓬勃发展与网络资讯的日益普及,我国专利申请的数量逐年稳步递增,据统计截至2015年上半年,全国专利申请受理总量约112.4万件,同比增长20.5%。伴随着大量专利信息的产生,对于传统检索方式是一个巨大的冲击,如何能提高专利检索效率及检索资料的利用率成为了一个严峻的挑战。
目前各种检索系统都应运而生,不过这些检索系统基本类似于数据库,存储了大量的专利信息,供用户检索,但是用户在进行检索时,尤其对于检索化合物制备专利而言,很多化合物的制备方法包括多种化学成分,需要耗费大量的精力与时间进行全文筛选,方能找到最为需求的检索结果,而且在检索过程中只抽取其中部分关键词会造成化学成分信息的遗漏,导致检索结果不准确,费时费力,影响检索专利的利用价值,进而降低工作效率,不便于工作。
所以,有必要对上述化合物制备专利的检索方式做进一步改进,以避免上述缺陷。
发明内容
为了解决上述化合物制备专利的检索方式费时费力,检索结果不准确从而导致检索专利的利用价值不强、工作效率低的技术问题,本发明提供一种基于化合物制备专利的信息检索系统,具有省时省力、精确度高的优点,加强了检索专利的利用价值,并提高了工作效率。
本发明提供了一种基于化合物制备专利的信息检索系统,包括用户端平台、数据库服务器及文件服务器,所述用户端平台分别与所述数据库服务器及所述文件服务器建立连接并进行数据交换,同时所述数据库服务器与所述文件服务器建立连接并进行数据交换,所述用户端平台与所述文件服务器分别通过网络与互联网连接,所述数据库服务器包括信息分类模块、信息库模块、选择比对模块及关联模块,其中,
所述信息分类模块,用于将化合物制备专利信息进行分类预处理,建立分类索引;
所述信息库模块,用于存储分类预处理后的化合物制备专利信息;
所述选择比对模块,用于将所述信息库模块存储的化合物制备专利信息按照用户的要求进行选择比对,检索出符合用户检索要求的化合物制备专利;
所述关联模块,用于计算检索出的化合物制备专利与用户检索要求之间的关联度,并进行关联度排序。
在本发明提供的基于化合物制备专利的信息检索系统的一种较佳实施例中,所述用户端平台包括检索模块、显示模块及下载模块,所述检索模块用于按照用户的检索要求向互联网发出化合物制备专利的检索请求,所述显示模块用于将检索结果依序显示对应的化合物制备专利信息,所述下载模块用于将符合用户检索要求的化合物制备专利下载并存储至所述文件服务器。
在本发明提供的基于化合物制备专利的信息检索系统的一种较佳实施例中,所述信息分类模块包括分类索引创建单元、组频统计单元、信息筛选单元、回收单元及分配单元。
在本发明提供的基于化合物制备专利的信息检索系统的一种较佳实施例中,所述分类索引创建单元的分类索引包括化学成分索引、制备方法索引、化学作用索引及自定义索引。
在本发明提供的基于化合物制备专利的信息检索系统的一种较佳实施例中,所述化学成分索引的子索引包括化学元素子索引、单质子索引、化合物子索引、无机物子索引、有机物子索引、异构体子索引、手性结构子索引、官能团子索引及自定义子索引。
在本发明提供的基于化合物制备专利的信息检索系统的一种较佳实施例中,所述信息库模块包括与所述信息分类模块建立的分类索引对应的索引信息库。
在本发明提供的基于化合物制备专利的信息检索系统的一种较佳实施例中,所述数据库服务器还包括管理模块,所述管理模块用于根据用户的要求对所述信息分类模块的信息及所述信息库的信息进行增添、修改、替换、删除、在线更新及自定义管理。
在本发明提供的基于化合物制备专利的信息检索系统的一种较佳实施例中,所述文件服务器包括信息存储模块及备份模块,所述信息存储模块用于将互联网根据用户请求发送的化合物制备专利的信息及所述下载模块下载的专利信息进行存储,所述备份模块用于定期将所述信息库模块的信息进行备份。
相较于现有技术,本发明提供的基于化合物制备专利的信息检索系统具有以下有益效果:
一、所述数据库服务器设定了信息分类模块、信息库模块、选择比对模块、关联模块及管理模块,各模块的结合使用使得用户的检索不同于传统方式,能够根据将化合物制备专利信息预处理为字符组,并根据字符组的频率进行统计筛选并经选择比对、关联度排序,进而迅速检索到需要的专利,结果清楚明了,降低人力时间成本,提高工作效率,能够实现完整的检索过程,保证检索结果为用户所需,并方便用户阅读、参考;
二、所述信息分类模块创建多种分类索引,能够保证不会遗漏化合物制备专利的化学成分,在用户筛选时根据分类索引一目了然化合物制备成分,方便检索,提高了专利信息的利用价值;
三、通过所述信息存储模块及所述备份模块的结合设计,用户可以将所述信息检索系统检索到的专利信息及检索过程中的字符组信息进行存储及定期备份,方便用户在无法连接互联网时也可以对检索过的化合物制备专利信息进行二次检索。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图,其中:
图1是本发明一种实施例提供的基于化合物制备专利的信息检索系统的硬件架构示意图;
图2是图1所示基于化合物制备专利的信息检索系统的架构流程图;
图3是本发明一种实施例提供的应用基于化合物制备专利的信息检索系统的检索方法的流程图;
图4是图3所示应用基于化合物制备专利的信息检索系统的检索方法适用的架构流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
请参阅图1,是本发明提供的基于化合物制备专利的信息检索系统的硬件架构示意图。所述基于化合物制备专利的信息检索系统1包括用户端平台11、数据库服务器13和文件服务器15。所述用户端平台11分别与所述数据库服务器13及所述文件服务器15建立连接并进行数据交换,同时所述数据库服务器13与所述文件服务器15建立连接并进行数据交换;所述用户端平台11与所述文件服务器15分别通过网络与互联网17相连。
请同时参阅图2,其中图2是图1所示基于化合物制备专利的信息检索系统的架构流程图。
所述用户端平台11包括检索模块111、显示模块113及下载模块115。所述检索模块111用于按照用户的要求向互联网17发出化合物制备专利的检索请求,所述显示模块113用于将化合物制备专利的检索结果依序显示,所述下载模块115用于将符合用户检索要求的化合物制备专利下载并存储至所述文件服务器15。
所述数据库服务器13包括信息分类模块131、信息库模块133、选择比对模块135、关联模块137及管理模块139。
所述信息分类模块131,用于将化合物制备专利信息进行分类预处理;请结合参阅图4,是图3所示应用基于化合物制备专利的信息检索系统的检索方法适用的架构流程图。所述信息分类模块131包括分类索引创建单元1311、组频统计单元1313、信息筛选单元1315、回收单元1317及分配单元1319。
所述分类索引创建单元1311的分类索引包括化学成分索引、制备方法索引、化学作用索引及自定义索引;所述化学成分索引的子索引包括化学元素子索引、单质子索引、化合物子索引、无机物子索引、有机物子索引、异构体子索引、手性结构子索引、官能团子索引及自定义子索引。
所述信息库模块133,包括与所述信息分类模块131建立的分类索引对应的索引信息库,用于存储分类预处理后的化合物制备专利信息。
所述选择比对模块135,用于将所述信息库模块133存储的化合物制备专利信息按照用户的检索要求进行选择比对,检索出符合用户检索要求的化合物制备专利。
所述关联模块137,用于计算检索出的化合物制备专利与用户检索要求之间的关联度,并进行关联度排序。
所述管理模块139用于根据用户的要求对所述信息分类模块131建立的分类索引及所述信息库133的索引信息库进行增添、修改、替换、删除、在线更新及自定义管理。
所述文件服务器15包括信息存储模块151及备份模块153,所述信息存储模块151用于将互联网根据用户请求发送的化合物制备专利的信息及所述下载模块115下载的专利信息进行存储,所述备份模块153用于定期将所述信息库模块133的索引信息库及自定义专利信息进行备份。
请参阅图3并再次参阅图4,其中图3是本发明一种实施例提供的应用基于化合物制备专利的信息检索系统的检索方法的流程图。基于上述实施例提供的信息检索系统,在检索化合物制备专利时,检索方法如下:
步骤S1:提出检索请求
用户通过所述检索模块111向互联网17提出化合物制备专利的检索请求,互联网17根据用户的检索请求将化合物制备专利的信息发送至所述文件服务器15的信息存储模块151进行存储,然后所述信息存储模块151将对应的化合物制备专利信息发送至所述信息分类模块131。
步骤S2:创建分类索引
所述信息分类模块131通过所述分类索引创建单元1311将对应化合物制备专利信息分类预处理为字符组,并发送至所述组频统计单元1313。
步骤S3:组频统计
所述组频统计单元1313将经分类预处理的字符组在专利中出现的频率和位置进行统计,并将字符组统计结果发送至所述信息筛选单元1315。
步骤S4:信息判断与筛选
所述信息筛选单元1315对字符组统计结果进行判断,是否超过预设值;
当判断结果为否时,未超过预设值的字符组信息直接发送至所述回收单元1317。
步骤S5:回收备份
所述回收单元1317将未超过预设值的字符组信息进行回收,定期会清空数据,所述回收单元1317在清空数据前会将所述未超过预设值的字符组信息发送至所述文件服务器15的备份模块153进行备份,需要时重新提取。
当判断结果为是时,超过预设值的字符组信息发送至所述分配单元1319,进而分配至所述信息库模块133。
步骤S6:选择比对
所述选择比对模块135提取所述信息库模块133存储的化合物制备专利的字符组信息,并进行化合物成分的选择比对,从而得到初步检索结果,发送至所述关联模块137。
步骤S7:关联排序
所述关联模块137计算初步检索出的化合物制备专利与用户检索要求之间的关联度,并依照关联度进行排序,发送至所述显示模块113。
步骤S8:下载显示
所述显示模块113将化合物制备专利的检索结果依序显示,进而用户通过所述下载模块115将符合用户检索要求的化合物制备专利下载并存储至所述文件服务器15的信息存储模块151,从而结束检索过程。
相较于现有技术,本发明提供的基于化合物制备专利的信息检索系统具有以下有益效果:
一、所述数据库服务器13设定了信息分类模块131、信息库模块133、选择比对模块135、关联模块137及管理模块139,各模块的结合使用使得用户的检索不同于传统方式,能够根据将化合物制备专利信息预处理为字符组,并根据字符组的频率进行统计筛选并经选择比对、关联度排序,进而迅速检索到需要的专利,结果清楚明了,降低人力时间成本,提高工作效率,能够实现完整的检索过程,保证检索结果为用户所需,并方便用户阅读、参考;
二、所述信息分类模块131创建多种分类索引,能够保证不会遗漏化合物制备专利的化学成分,在用户筛选时根据分类索引一目了然化合物制备成分,方便检索,提高了专利信息的利用价值;
三、通过所述信息存储模块151及所述备份模块153的结合设计,用户可以将所述信息检索系统1检索到的专利信息及检索过程中的字符组信息进行存储及定期备份,方便用户在无法连接互联网17时也可以对检索过的化合物制备专利信息进行二次检索。
以上所述仅为本发明的实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其它相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (8)
1.一种基于化合物制备专利的信息检索系统,其特征在于,包括用户端平台、数据库服务器及文件服务器,所述用户端平台分别与所述数据库服务器及所述文件服务器建立连接并进行数据交换,同时所述数据库服务器与所述文件服务器建立连接并进行数据交换,所述用户端平台与所述文件服务器分别通过网络与互联网连接,所述数据库服务器包括信息分类模块、信息库模块、选择比对模块及关联模块,其中,
所述信息分类模块,用于将化合物制备专利信息进行分类预处理,建立分类索引;
所述信息库模块,用于存储分类预处理后的化合物制备专利信息;
所述选择比对模块,用于将所述信息库模块存储的化合物制备专利信息按照用户的要求进行选择比对,检索出符合用户检索要求的化合物制备专利;
所述关联模块,用于计算检索出的化合物制备专利与用户检索要求之间的关联度,并进行关联度排序。
2.根据权利要求1所述的基于化合物制备专利的信息检索系统,其特征在于,所述用户端平台包括检索模块、显示模块及下载模块,所述检索模块用于按照用户的检索要求向互联网发出化合物制备专利的检索请求,所述显示模块用于将检索结果依序显示对应的化合物制备专利信息,所述下载模块用于将符合用户检索要求的化合物制备专利下载并存储至所述文件服务器。
3.根据权利要求1所述的基于化合物制备专利的信息检索系统,其特征在于,所述信息分类模块包括分类索引创建单元、组频统计单元、信息筛选单元、回收单元及分配单元。
4.根据权利要求3所述的基于化合物制备专利的信息检索系统,其特征在于,所述分类索引创建单元的分类索引包括化学成分索引、制备方法索引、化学作用索引及自定义索引。
5.根据权利要求4所述的基于化合物制备专利的信息检索系统,其特征在于,所述化学成分索引的子索引包括化学元素子索引、单质子索引、化合物子索引、无机物子索引、有机物子索引、异构体子索引、手性结构子索引、官能团子索引及自定义子索引。
6.根据权利要求1所述的基于化合物制备专利的信息检索系统,其特征在于,所述信息库模块包括与所述信息分类模块建立的分类索引对应的索引信息库。
7.根据权利要求1所述的基于化合物制备专利的信息检索系统,其特征在于,所述数据库服务器还包括管理模块,所述管理模块用于根据用户的要求对所述信息分类模块的信息及所述信息库的信息进行增添、修改、替换、删除、在线更新及自定义管理。
8.根据权利要求2所述的基于化合物制备专利的信息检索系统,其特征在于,所述文件服务器包括信息存储模块及备份模块,所述信息存储模块用于将互联网根据用户请求发送的化合物制备专利的信息及所述下载模块下载的专利信息进行存储,所述备份模块用于定期将所述信息库模块的信息进行备份。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510527222.3A CN105069155A (zh) | 2015-08-25 | 2015-08-25 | 基于化合物制备专利的信息检索系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510527222.3A CN105069155A (zh) | 2015-08-25 | 2015-08-25 | 基于化合物制备专利的信息检索系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN105069155A true CN105069155A (zh) | 2015-11-18 |
Family
ID=54498524
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510527222.3A Pending CN105069155A (zh) | 2015-08-25 | 2015-08-25 | 基于化合物制备专利的信息检索系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105069155A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018103642A1 (en) * | 2016-12-05 | 2018-06-14 | Patsnap | Systems, apparatuses, and methods for searching and displaying information available in large databases according to the similarity of chemical structures discussed in them |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080172380A1 (en) * | 2007-01-17 | 2008-07-17 | Wojciech Czyz | Information retrieval based on information location in the information space. |
CN101546306A (zh) * | 2008-03-27 | 2009-09-30 | 上海市知识产权服务中心 | 利用ipc分类的专利文献检索方法及系统 |
CN101996170A (zh) * | 2009-08-11 | 2011-03-30 | 上海汉光知识产权数据科技有限公司 | 按技术分类的专利引证分析系统 |
CN103810242A (zh) * | 2013-11-29 | 2014-05-21 | 北京知立方科技有限公司 | 创新经纬网及文献位置自动识别系统及方法 |
CN104731810A (zh) * | 2013-12-20 | 2015-06-24 | 上海兵飞软件有限公司 | 专利检索相似度排序的方法 |
-
2015
- 2015-08-25 CN CN201510527222.3A patent/CN105069155A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080172380A1 (en) * | 2007-01-17 | 2008-07-17 | Wojciech Czyz | Information retrieval based on information location in the information space. |
CN101546306A (zh) * | 2008-03-27 | 2009-09-30 | 上海市知识产权服务中心 | 利用ipc分类的专利文献检索方法及系统 |
CN101996170A (zh) * | 2009-08-11 | 2011-03-30 | 上海汉光知识产权数据科技有限公司 | 按技术分类的专利引证分析系统 |
CN103810242A (zh) * | 2013-11-29 | 2014-05-21 | 北京知立方科技有限公司 | 创新经纬网及文献位置自动识别系统及方法 |
CN104731810A (zh) * | 2013-12-20 | 2015-06-24 | 上海兵飞软件有限公司 | 专利检索相似度排序的方法 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018103642A1 (en) * | 2016-12-05 | 2018-06-14 | Patsnap | Systems, apparatuses, and methods for searching and displaying information available in large databases according to the similarity of chemical structures discussed in them |
US11126668B2 (en) | 2016-12-05 | 2021-09-21 | Patsnap Limited | Search system, apparatus, and method |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106055621A (zh) | 一种日志检索方法及装置 | |
CN103902701B (zh) | 一种数据存储系统和存储方法 | |
CN104516903A (zh) | 关键词扩展方法及系统、及分类语料标注方法及系统 | |
CN102236672A (zh) | 一种数据导入方法及装置 | |
CN101025805A (zh) | 基于产品的物料清单生成方法 | |
CN103473230A (zh) | 服务范围确定方法、物流服务提供方推荐方法及相应装置 | |
CN101350869A (zh) | 基于索引和散列的电信计费去重方法及设备 | |
CN104298736A (zh) | 数据集合连接方法、装置及数据库系统 | |
CN104636502A (zh) | 一种查询系统的数据加速查询方法 | |
CN102955802B (zh) | 从数据报表中获取数据的方法和装置 | |
CN101661484A (zh) | 一种查询方法及系统 | |
CN111191123A (zh) | 业务信息推送方法、装置、可读存储介质和计算机设备 | |
CN103853838A (zh) | 一种数据处理方法和装置 | |
CN101751397B (zh) | 一种将文件导入数据库的方法及装置 | |
CN102521713B (zh) | 数据处理装置和数据处理方法 | |
CN104102694B (zh) | 树形节点排序方法和树形节点排序装置 | |
CN102222112A (zh) | 资源管理装置和资源管理方法 | |
CN108228787A (zh) | 按照多级类目处理信息的方法和装置 | |
CN105653576A (zh) | 信息搜索的方法及装置、人工座席服务方法及系统 | |
CN104142952B (zh) | 报表展示方法和装置 | |
CN103678415A (zh) | 一种处理项目日志数据的方法及装置 | |
CN105069155A (zh) | 基于化合物制备专利的信息检索系统 | |
CN105721586A (zh) | 信息智能分配装置、方法及系统 | |
CN105159946A (zh) | 一种基于jQuery的表格排序方法及系统 | |
CN112286879B (zh) | 基于元数据的数据资产构建方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20151118 |