CN106095933A - 一种专利信息查询系统及查询方法 - Google Patents
一种专利信息查询系统及查询方法 Download PDFInfo
- Publication number
- CN106095933A CN106095933A CN201610411504.1A CN201610411504A CN106095933A CN 106095933 A CN106095933 A CN 106095933A CN 201610411504 A CN201610411504 A CN 201610411504A CN 106095933 A CN106095933 A CN 106095933A
- Authority
- CN
- China
- Prior art keywords
- client computer
- module
- information
- patent document
- server
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/31—Indexing; Data structures therefor; Storage structures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/338—Presentation of query results
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/58—Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2216/00—Indexing scheme relating to additional aspects of information retrieval not explicitly covered by G06F16/00 and subgroups
- G06F2216/11—Patent retrieval
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及一种专利信息查询系统和查询方法,所述查询系统包括服务器、客户机和数据源,所述客户机向服务器发送专利查询请求,服务器将对应的专利文件信息返回给客户机,还包括翻译模块,所述翻译模块将服务器返回给客户机的专利文件信息转换成特定的语言形式以后再返回给客户机。本发明提供的专利信息查询系统可对检索到的专利文件信息进行翻译,并以特定的语言形式呈现,有利于技术人员理解专利技术,提高专利信息查询系统的利用效率。
Description
技术领域
本发明涉及专利信息查询技术领域,具体涉及一种专利信息查询系统和查询方法。
背景技术
随着经济的迅速发展,知识产权的作用日益体现,所受到的重视程度也在逐步提升。专利作为核心竞争力和创新能力的象征,包含了大量的技术信息,对研发人员来说,通过专利信息可以启发研究思路,避免重复研究;对于企业来说,更要时时监控相关领域的专利情况,避免专利侵权,降低企业经营风险。
目前,已经有很多成熟的专利查询管理系统,可以实现自动更新、按申请人、发明人、地址、IPC分类号等分类管理,有的甚至可以实现复杂的专利分析功能。国家知识产权局提供官方的专利查询工具,可以检索1985年至今所有在中国的专利申请,而美国、欧盟、日本、韩国等知识产权发达国家和地区及WIPO等国际知识产权组织也提供一些专利查询工具和平台;另一方面,还有很多专业的知识产权信息提供商也提供专利查询工具,如ThomsonReuters公司的innography专利数据库就提供世界诸多重要专利局的专利文件,可针对自己的需要构建检索式进行检索,对检索的专利文献可直接在注册账号下建立工程进行保存,在任何联网的地方都能方便的使用自己的搜索结果。对于检索得到的专利文献可进行下载,单篇专利的分析报告生成与下载,批量专利的分析报告生成与下载,批量专利标题、专利号、申请日、申请地、失效时间等各项重要信息的列表抽取等,方便世界范围内在需要领域的专利搜索,还具有强大的分析功能,有气泡图、直方图等各种直观的分析图表结果,帮助正确了解相关领域世界最前沿的技术态势和最具竞争力的对手。
但是,由于各国要求专利申请文件必须以本国文字撰写和提交,因此技术人员检索到的国外的专利申请文件的权利要求书和说明书等内容都是以外文撰写的,必然对于技术人员理解专利技术带来了很大的困难。
发明内容
本发明针对现有技术的专利信息查询系统不能提供查询者认同的语言形式这一技术问题,提出一种专利信息查询系统和专利信息查询方法,具体的技术方案是:
一种专利信息查询系统,包括服务器1、客户机2和数据源3,所述客户机2向服务器1发送专利查询请求,服务器1将对应的专利文件信息返回给客户机2,其特征在于:还包括翻译模块4,所述翻译模块4将服务器1返回给客户机2的专利文件信息转换成特定的语言形式以后再返回给客户机2。
本发明的有益效果:对检索到的专利文件信息进行翻译,并以特定的语言形式呈现,有利于技术人员理解专利技术。
附图说明
图1为专利信息查询系统的模块图;
图2为带OCR模块的专利信息查询系统模块图;
图3为服务器模块图;
图4为客户机模块图;
图5为专利信息查询系统的索引建立方法流程图;
图6为专利信息查询系统的检索方法流程图。
具体实施方式
本发明专利信息查询系统的模块图如图1所示,包括服务器1、客户机2和数据源3,所述客户机2向服务器1发送专利查询请求,服务器1将对应的专利文件信息返回给客户机2,其特征在于:还包括翻译模块4,所述翻译模块4将服务器1返回给客户机2的专利文件信息转换成特定的语言形式以后再返回给客户机2。
所述服务器1包括侦测模块11、转换模块12、索引模块13及数据库17。所述客户端2包括检索模块20及显示模块21。
每一专利文件包括说明书摘要、说明书、权利要求书三个组成部分,说明书部分又分为标题、技术领域、背景技术、发明内容、附图说明、具体实施方式等多个子部分。说明书摘要部分提供相应的说明书摘要主要内容和关键字,说明书各子部分也提供相应的主要内容和关键字,权利要求书部分的每一项权利要求提供相应权利要求的主要内容和关键字。
侦测模块11用于探测数据源3中是否增加了新的专利文件,当侦测到数据源3中增加了新的专利文件时,启动转换模块12进行转换作业。转换模块12用于从数据源3中获得新增的专利文件,依据上述描述的专利文件的组成部分对其进行分析,读取各组成部分的内容,并将该各组成部分的内容以预先定义的文件格式进行保存。该预先定义的文件格式的文件由标题、说明书摘要、说明书、权利要求书等部分组成,该预先定义的文件格式的文件所属的类型可以是网页、XML或其他可以转换成文本文件的类型。索引模块13使用索引建立技术将上述转换之后的专利文件各组成部分的内容添加到数据库17中,并对该数据库17中的所有转换之后的专利文件的各个组成部分的内容分别重新建立全文索引,包括对标题建立全文索引,说明书摘要部分建立全文索引,对说明书部分建立全文索引及对权利要求书部分建立全文索引。所述建立全文索引是指通过扫描每一部分内容的每一个词,对每一个词建立一个索引,指明该词在每一部分出现的次数及位置。该数据库17中包含与专利文件转换后的文件中各组成部分相对应的栏位,用来存储专利文件转换后各部分的内容和关键字。
数据源3可以采用国家知识产权局专利检索数据库或欧盟、美国、世界知识产权组织等建立的专利检索数据库。
检索模块20用于根据查询者的检索标的对上述建立好索引的数据库17进行检索。通过检索每一专利文件各组成部分的条目对应的栏位,获得检索结果。检索结果为按照关键字在数据库17中检索出的所有专利文件的简要信息,包括专利标题、部分摘要内容、申请号等,所述条目包括专利文件的标题、说明书摘要、说明书内容及权利要求书。检索模块20进行的检索方式可为单一条目检索和多条目联合检索。显示模块21用于显示上述检索出的与当前关键词相关的专利文件的简要信息,从而方便阅读、参考;还用于当查询者点击检索出的专利标题时将专利文件下载或开启供查询者阅读;还用于在下载专利全文前进行专利全文的预览。
还包括翻译模块4,所述翻译模块4将服务器1返回给客户机2的专利文件信息转换成特定的语言形式以后再返回给客户机2。
优选在翻译模块4之前还包括语言识别模块,所述语言识别模块的作用是在服务器1返回给客户机2的专利文件信息到达翻译模块4之前确认其语言形式,并通知翻译模块4,翻译模块4将服务器1返回给客户机2的专利文件信息转换成特定的语言形式以后再返回给客户机2。
所谓语言识别模块确定语言形式是指服务器1返回的专利文件信息是用什么语言记载的,语言识别模块确认专利文件信息的语言形式以后,通知翻译模块4。
所谓特定的语言形式是指查询者熟悉的语言,如汉语或英语。本发明的目的就是将检索到的以日语、韩语、德语、法语等查询者不熟悉的语言翻译成查询者熟悉的语言如汉语,呈现给查询者的是其熟悉的语言,有助于理解发明专利的技术内容。
本发明进一步优化的专利信息查询系统的模块图如图2所示,还包括OCR模块5,所述OCR模块5将服务器1返回给客户机2的图片形式的专利文件信息转换成文字形式,返回给翻译模块4,所述翻译模块4将文字形式的专利文件信息转换成特定的语言形式以后再返回给客户机2。
存储在数据库17中的专利文件信息大部分为文字形式,如标题、说明书摘要部分等,但是对于一些以纸件形式申请的专利,其权利要求书部分和说明书在数据源3中是以图片的形式存在,专利信息查询系统的服务器1将这些图片形式的专利信息存放到数据库17中,客户机查询到的权利要求书和说明书只能是图片形式,在这种情况下,翻译模块4不能对图片形式的专利信息进行转换,只有先通过OCR模块5对图片形式的专利信息进行识别,将图片形式的专利信息转换成文字形式的专利信息以后再返回给翻译模块4,翻译模块4才能对文字形式的专利信息进行识别,并转换成特定的语言形式以后再返回给客户机2。
本发明专利信息查询系统的索引建立方法流程图如图5所示。首先,侦测模块11在侦测到数据源3中增加了新的专利文件时,转换模块12从数据源3中获取该专利文件;转换模块12读取该专利文件各组成部分的内容,并将读取的专利文件的各组成部分的内容以预先定义的文件格式进行保存,该预先定义的文件格式的文件所属的类型可以是网页、XML或其他可以转换成文本文件的类型;索引模块13使用索引建立技术将上述转换之后的专利文件的各部分内容添加到数据库17中,并对该数据库17中的转换之后的所有专利文件的各个组在部分的内容分别重新建立全文索引,包括对标题建立全文索引,说明书摘要部分建立全文索引,对说明书部分建立全文索引及对权利要求书部分建立全文索引,所述建立全文索引是指通过扫描每一部分内容的每一个词,对每一个词建立一个索引,指明该词在每一部分出现的次数及位置。
本发明专利信息查询系统的检索方法流程图如图6所示。检索模块20根据查询者提供的关键字,在建立索引之后的数据库17中依专利条目进行专利文件检索,检索到与该关键字相关的所有专利;所述检索结果指检索到的所有专利的简要信息,该简要信息包括专利标题、部分摘要内容、申请号等;所述专利条目可以是标题、说明书摘要、说明书内容及权利要求书。显示模块21显示上述检索出的与当前关键字相关的专利文件的简要信息,从而方便阅读。显示模块21根据查询者的选择,下载及显示所需的专利全文或预览专利全文。
Claims (7)
1.一种专利信息查询系统,包括服务器(1)、客户机(2)和数据源(3),所述客户机(2)向服务器(1)发送专利查询请求,服务器(1)将对应的专利文件信息返回给客户机(2),其特征在于:还包括翻译模块(4),所述翻译模块(4)将服务器(1)返回给客户机(2)的专利文件信息转换成特定的语言形式以后再返回给客户机(2)。
2.根据权利要求1所述的专利信息查询系统,其特征在于:所述翻译模块(4)之前还包括语言识别模块。
3.根据权利要求1所述的专利信息查询系统,其特征在于:还包括OCR模块(5),所述OCR模块(5)将服务器(1)返回给客户机(2)的图片形式的专利文件信息转换成文字形式,返回给翻译模块(4),所述翻译模块(4)将文字形式的专利文件信息转换成特定的语言形式以后再返回给客户机(2)。
4.根据权利要求1所述的专利信息查询系统,其特征在于:所述服务器(1)包括侦测模块(11)、转换模块(12)、索引模块(13)及数据库(17);所述客户端(2)包括检索模块(20)及显示模块(21)。
5.一种专利信息查询方法,其特征在于,包括以下步骤:
步骤1:客户机(2)向服务器(1)发送专利查询请求;
步骤2:服务器(1)从数据库(17)中查找对应的专利文件信息;
步骤3:翻译模块(4)将上一步骤中的专利文件信息转换成特定的语言形式以后再返回给客户机(2)。
6.根据权利要求5所述的专利信息查询方法,其特征在于:
在步骤2和步骤3之间还有一个步骤2a:OCR模块(5)将上一步骤中的图片形式的专利文件信息转换成文字形式的专利文件信息。
7.根据权利要求5所述的专利信息查询方法,其特征在于:
在步骤2和步骤3之间还有一个步骤2b:语言识别模块确认上一步骤中返回的专利文件信息的语言形式,然后通知翻译模块(4)。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610411504.1A CN106095933A (zh) | 2016-06-14 | 2016-06-14 | 一种专利信息查询系统及查询方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610411504.1A CN106095933A (zh) | 2016-06-14 | 2016-06-14 | 一种专利信息查询系统及查询方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN106095933A true CN106095933A (zh) | 2016-11-09 |
Family
ID=57845409
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610411504.1A Pending CN106095933A (zh) | 2016-06-14 | 2016-06-14 | 一种专利信息查询系统及查询方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106095933A (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108132933A (zh) * | 2017-12-28 | 2018-06-08 | 中译语通科技(青岛)有限公司 | 一种跨语言分析报告的生成方法 |
CN108874885A (zh) * | 2018-05-08 | 2018-11-23 | 苏州显知禾创科技服务有限公司 | 一种专利数据管理系统 |
CN109992644A (zh) * | 2019-03-26 | 2019-07-09 | 苏州大成有方数据科技有限公司 | 一种知识产权类结构化文本智能语义重构系统 |
CN114048357A (zh) * | 2021-11-03 | 2022-02-15 | 北京中知智慧科技有限公司 | 多主题知识产权数据的联合检索方法及装置 |
WO2023179708A1 (zh) * | 2022-03-25 | 2023-09-28 | 诺正集团股份有限公司 | 个性化云数据库的建立方法、装置、设备及存储介质 |
-
2016
- 2016-06-14 CN CN201610411504.1A patent/CN106095933A/zh active Pending
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108132933A (zh) * | 2017-12-28 | 2018-06-08 | 中译语通科技(青岛)有限公司 | 一种跨语言分析报告的生成方法 |
CN108874885A (zh) * | 2018-05-08 | 2018-11-23 | 苏州显知禾创科技服务有限公司 | 一种专利数据管理系统 |
CN109992644A (zh) * | 2019-03-26 | 2019-07-09 | 苏州大成有方数据科技有限公司 | 一种知识产权类结构化文本智能语义重构系统 |
CN114048357A (zh) * | 2021-11-03 | 2022-02-15 | 北京中知智慧科技有限公司 | 多主题知识产权数据的联合检索方法及装置 |
CN114048357B (zh) * | 2021-11-03 | 2022-07-08 | 北京中知智慧科技有限公司 | 多主题知识产权数据的联合检索方法及装置 |
WO2023179708A1 (zh) * | 2022-03-25 | 2023-09-28 | 诺正集团股份有限公司 | 个性化云数据库的建立方法、装置、设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106095933A (zh) | 一种专利信息查询系统及查询方法 | |
US8346536B2 (en) | System and method for multi-lingual information retrieval | |
US7991608B2 (en) | Multilingual data querying | |
US20070250494A1 (en) | Enhancing multilingual data querying | |
US20100325169A1 (en) | Representing Markup Language Document Data in a Searchable Format in a Database System | |
Bird et al. | Extending Dublin Core metadata to support the description and discovery of language resources | |
CN112231494B (zh) | 信息抽取方法、装置、电子设备及存储介质 | |
CN101432733A (zh) | 利用来自搜索的所检索数据来增加电子文档的内容 | |
Penev et al. | XML schemas and mark-up practices of taxonomic literature | |
WO2008041367A1 (fr) | Dispositif de recherche de document, procédé de recherche de document et programme de recherche de document | |
Colavizza et al. | The references of references: a method to enrich humanities library catalogs with citation data | |
US20070168916A1 (en) | Specification wizard | |
KR20120094562A (ko) | 번역문에서 키워드 추출에 의해 부가 정보를 검색하는 시스템 및 방법 | |
WO2013147236A1 (ja) | 専門家評価情報管理装置 | |
JP2003288348A (ja) | 図書館蔵書検索システム | |
Rasmussen et al. | The data documentation initiative: a preservation standard for research | |
JP2007128224A (ja) | 文書インデキシング装置、文書インデキシング方法及び文書インデキシングプログラム | |
Montagne et al. | Drugs on the Internet, part IV: Google's Ngram viewer analytic tool applied to drug literature | |
Batjargal et al. | Metadata-related Challenges for Realizing a Federated Searching System for Japanese Humanities Databases. | |
Aumüller et al. | PDFMeat: managing publications on the semantic desktop | |
Mak et al. | What am I looking at: Contextualizing subject headings through linked open data | |
JP2007199987A (ja) | 特許情報検索システム | |
JP2000339333A (ja) | 自然言語検索支援システムおよび自然言語検索支援方法 | |
JP2002312525A (ja) | イベント情報表示システム、イベント情報表示方法、及び、イベント情報表示プログラム | |
Knoll | Homogenizing Access to Heterogeneous Resources of Digitized Manuscripts |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20161109 |
|
WD01 | Invention patent application deemed withdrawn after publication |