CN1808427A - 专利信息检索的语法转换方法 - Google Patents
专利信息检索的语法转换方法 Download PDFInfo
- Publication number
- CN1808427A CN1808427A CN 200510032977 CN200510032977A CN1808427A CN 1808427 A CN1808427 A CN 1808427A CN 200510032977 CN200510032977 CN 200510032977 CN 200510032977 A CN200510032977 A CN 200510032977A CN 1808427 A CN1808427 A CN 1808427A
- Authority
- CN
- China
- Prior art keywords
- retrieval
- indexing
- patent information
- transformation method
- grammatical
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
一种专利信息检索的语法转换方法,可将检索语法自动转换为各国专利信息网站上的不同检索语法。该方法包括如下步骤:输入检索字串;对输入的检索字串进行语法分析;对检索字串自动切分后,生成语法树;对生成的语法树进行优化;对优化后的个体进行语意分析及执行类型检查;进行语法转换,通过加载不同的Schema语言,将上述分析后的语法转译成不同的检索语句;通过语法转换,自动生成适合各国专利局网上数据库检索语法的语句,还可生成SQL检索语句及XML语言等其它格式的检索语句。
Description
【技术领域】
本发明涉及一种信息检索方法,尤其涉及一种专利信息检索的语法转换方法。
【背景技术】
专利信息,是指包括专利申请、授权、专利法律状态、专利技术内容等信息的集合,它汇集了大量的技术信息、经济信息和法律信息,是一个反映科技发展最迅速、最全面、最系统的知识库。专利信息对于技术进步和科研开发具有非常重要的意义。所以,如果作为发明人,则应该知已知彼,了解个人所掌握技术的发展历程;如果作为企业家,则应该监视竞争对手的新产品以及竞争对手所取得的专利;如果从事应用研究,则必须不时注意相关领域中的新专利和送审中的专利,以掌握关键技术的发展动向。而专利检索可以帮助研发人员和企业,追踪技术发展动向,掌握研发方向和研拟市场竞争策略,避免重复研究所造成的人力、物力、时间等资源的浪费,并及时把握竞争对手的发展动向。
查询专利在过去是一项既费时又费事的工作,首先是专利光盘系统或是Dialog等线上检索系统所费不菲,不是每个大学图书馆或是学术研究图书馆所负担得起,更无法建立专门图书馆。其次专利既是技术文件又是法律文件,其专利文件有其特殊的检索系统和检索策略,不是研究人员所熟悉,所以多半是委由专利律师或是相关机构的专利检索人员代为检索。由于专利检索系统的不普及和检索界面的不友善,使得研究人员参考引用专利信息的比例明显偏低,也使研发生产力受到相当程度的影响。
之后,随着互联网的发展,为专利信息检索开拓了新的局面。每位研究人员都可以利用网络的友善界面,联机检索各国的专利信息。然而,这些网站所支持的检索语法,有相当程度的差别,使用户在不同国家的专利信息网站进行检索时要注意不同的检索规则,既耗费人力又降低了效率。传统的检索程序设计,没有统一的语法描述方法;语法分析中对检索字串逐字匹配,其语法规则嵌入代码中;手工编写Java代码;且语法维护困难,逻辑复杂。
所以需要提供专利信息检索的语法转换方法,可实现将检索语法进行自动转换为各国专利信息网站上的不同检索语法,方便用户准确快捷地检索相关专利信息,其以JavaCC设计检索程序,语法描述采用BNF范式(Backus Naur Form,巴科斯-诺尔范式);提供语法分析;自动产生Java代码;且语法维护容易,语法简单。
【发明内容】
本发明的主要目的在于提供专利信息检索的语法转换方法,其可通过对专利信息的检索语法进行自动转换,实现对不同国家的专利信息进行检索。
为达成上述的目的,本发明提供一种专利信息检索的语法转换方法,其进行语法转换时参照一存储于数据库的语法参考文件。该方法包括以下步骤:输入检索字串,对输入字串的语法定义采用BNF范式(Backus Naur Form,巴科斯-诺尔范式);对输入的检索字串进行语法分析,即将检索字串自动切分成个体进行辨识和分析,分析过程中利用的工具是JavaCC(Java Compiler Compiler,纯Java的词法分析建构程序);对检索字串自动切分后,生成语法树;对生成的语法树进行优化,例如进行条件合并;对优化后的个体进行语意分析,识别个体在数据库中所表示的语意,并执行类型检查;经过各类分析后,进行语法转换,通过加载不同的Schema语言,将上述分析后的语法转译成不同的检索语句;通过语法转换,可以生成SQL(Structured QueryLanguage,结构化查询语言)检索语句,在数据库中进行检索;若需要检索的专利信息在数据库中无法检索到,或者数据库所存储的信息不够全面,则可通过语法转换自动生成适合各国专利局网上数据库检索语法的相关检索语句,直接至各国专利局网上数据库进行检索;此外,通过语法转换还可生成XML(Extensible Markup Language,可扩展标记语言)语句等其它格式的检索语句。其中,通过语法转换而生成的各类检索语句,其生成方式有两种类型,第一种是将Java代码嵌入到JavaCC脚本;第二种是利用JJTree(JJTree是一个JavaCC的插件,通过AST扩充JavaCC生成的解析器)产生动态树结构。
利用本发明,可提供通用的专利语法,并实现将检索语法自动转换为各国专利信息网站上的不同检索语法,方便用户准确快捷地检索相关专利信息。
【附图说明】
图1是本发明专利信息检索的语法转换方法的系统架构图。
图2是本发明专利信息检索的语法转换方法的流程图。
图3是本发明专利信息检索的语法转换方法的语法树图。
【具体实施方式】
如图1所示,是实施本发明专利信息检索的语法转换方法的系统架构图,其包括多个使用者端计算机1、至少一服务器2、至少一数据库3及将它们相连起来的网络4。用户通过使用者端计算机1输入一检索字串并发送至服务器2,服务器2对该检索字串进行语法分析,从数据库3中快速搜索相关专利信息,并将搜索结果进行处理后传送至使用者端计算机1;若数据库3中没有相关专利信息,服务器2可自动将输入的检索字串进行语法转换,即将语法转译为相应国家专利网站的检索语法,并通过网络4至相应国家的专利网站进行搜索及获取搜索结果。
网络4可以是一企业内部网(Intranet),也可以是互联网(Internet)或其它类型通讯网络。使用者端计算机1提供一交互式用户界面,以便于用户进行专利信息检索及查看相关结果。
数据库3中存储有服务器2通过互联网下载的各国专利信息,并且存储一语法参考文件,其列出定义的各类语法及对应的内容描述等信息,如专利名称(Patent Name)在检索时可用TTL表示,专利权人(Assignee Name)用AN表示,专利摘要(Abstract)用ABST表示,专利描述(Specification)用SPEC表示,专利范围(Claim)用ACLM表示,专利号(Patent Number)用PN表示,申请号(Application Number)用APN表示,专利公告日期(Issue Date)用ISD表示等等。
如图2所示,是本发明专利信息检索的语法转换方法的流程图。首先,输入检索字串,对输入字串的语法定义采用BNF范式(BackusNaur Form,巴科斯-诺尔范式),例如检索在2004年专利权人(AN)是B公司或者C公司,且专利范围(ACLM)包含连接器(Connector)的所有专利,其检索字串为AN/(B or C)and ACLM/Connector ANDISD/[2004.1.1-2004.12.31],其中AN、ACLM及ISD为自定义语法(步骤S1)。对输入的检索字串进行语法分析,即参照数据库3中的语法参考文件,将检索字串自动切分成个体进行辨识和分析,分析过程中利用的工具是JavaCC(Java Compiler Compiler,纯Java的词法分析建构程序),如对上述查询的分析,其JavaCC片段如下所示:
<LPAREN:“(”>
<LPAREN:“)”>
<STRING:([″A″-″Z″,″0″-″9″])+>
<QUOTED_STRING:“\\″″(~[″\\″″])+″\\″″>
<AND:(“AND”|“&&”)>
<OR:(“OR”|“‖”>
<TERM:[“AN”,”ACLM”,”ISD”,”ABST”]>
AN/(B or C)and ACLM/Connector AND ISD/[2004.1.1-2004.12.31](步骤S2)。
对检索字串自动切分后,生成如图3所示的语法树(步骤S3)。对生成的语法树进行优化,例如进行条件合并,如上述检索专利权人(AN)是B公司或者C公司所申请的专利,若其输入的检索字串为(AN/B orAN/C),则可优化为AN/(B or C)(步骤S4)。对优化后的个体进行语意分析,如识别个体“AN”在数据库中所表示的语意应为专利权人,且执行类型检查,AN应为字符类型,而代表公告目的ISD应为日期类型(步骤S5)。经过各类分析后,进行语法转换,通过加载不同的Schema语言,将上述分析后的语法转译成不同的检索语句(步骤S6)。通过语法转换,可以生成SQL(Structured Query Language,结构化查询语言)检索语句,在数据库3中进行检索,例如上述检索专利权人是B公司或者C公司所申请的连接器专利通过语法转换后生成如下所示SQL语句(片段):
(CONTAINS(PATENT_INFO.TX$ASN_NAME,
‘B or C’)>0 and CONTAINS(PATENT_INFO.TX$PNT_CLAM,
‘Connector’>0)And DECISION_DATE TO_DATE(′2004.1.1′,
′yyyy.mm.dd′)AND TO_DATE(′2004.12.31′,′yyyy.mm.dd′)(步骤S7)。
若需要检索的专利信息在数据库3中并不存在,或者数据库3所存储的信息不够全面,则可通过语法转换自动生成适合各国专利局网上数据库检索语法的相关检索语句,直接至各国专利局网上数据库进行搜索(步骤S8)。此外,通过语法转换还可生成XML(ExtensibleMarkup Language,可扩展标记语言)语句等其它格式的检索语句,以适应不同类型语法的要求(步骤S9)。
在上述检索语法的转换方法流程中,检索字串可通过语法转换而自动生成不同格式的代码,其生成方式有两种类型,第一种是将Java代码嵌入到JavaCC脚本;第二种是利用JJTree(JJTree是一个JavaCC的插件,通过AST扩充JavaCC生成的解析器)产生动态树结构。
如图3所示,是本发明专利信息检索的语法转换方法的语法树图。语法树是对检索语法进行语法分析后所生成。上述实施方式中举例:检索2004年专利权人是B公司或者C公司,且专利范围包含连接器的所有专利,其检索字串为AN/(B or C)and ACLM/Connector ANDISD/[2004.1.1-2004.12.31],对该检索字串进行语法分析后,则生成如本图所示的语法树。
Claims (6)
1.一种专利信息检索的语法转换方法,其进行语法转换时参照一存储于数据库的语法参考文件,其特征在于,该方法包括如下步骤:
通过使用者端计算机输入检索字串;
通过一与所述使用者端计算机相连的服务器,对输入的检索字串进行语法分析,即参照数据库中存储的语法参考文件,将检索字串自动切分成个体进行辨识和分析;
对检索字串自动切分后,生成语法树;
对生成的语法树进行优化;
对优化后的个体进行语意分析,识别个体在数据库中所表示的语意并执行类型检查;
进行语法转换,通过加载不同的Schema语言,将上述分析后的语法转译成不同的检索语句;及
通过语法转换,自动生成适合各国专利局网上数据库检索语法的相关检索语句,直接至各国专利局网上数据库进行搜索。
2.如权利要求1所述的专利信息检索的语法转换方法,其特征在于,所述输入检索字串的语法定义采用BNF范式。
3.如权利要求1所述的专利信息检索的语法转换方法,其特征在于,所述对输入的检索字串进行语法分析是采用JavaCC语言来实现。
4.如权利要求1所述的专利信息检索的语法转换方法,其特征在于,所述通过语法转换而生成的检索语句可为生成SQL检索语句,该SQL检索语句对企业内存储专利信息的数据库进行检索。
5.如权利要求1所述的专利信息检索的语法转换方法,其特征在于,所述通过语法转换而生成的检索语句可为生成XML语言格式的检索语句。
6.如权利要求1所述的专利信息检索的语法转换方法,其特征在于,所述通过语法转换而生成检索语句,其生成方式有如下两种类型:
将Java代码嵌入到JavaCC脚本;及
利用JJTree产生动态树结构。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 200510032977 CN1808427A (zh) | 2005-01-22 | 2005-01-22 | 专利信息检索的语法转换方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 200510032977 CN1808427A (zh) | 2005-01-22 | 2005-01-22 | 专利信息检索的语法转换方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN1808427A true CN1808427A (zh) | 2006-07-26 |
Family
ID=36840327
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN 200510032977 Pending CN1808427A (zh) | 2005-01-22 | 2005-01-22 | 专利信息检索的语法转换方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN1808427A (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2008116403A2 (en) * | 2007-03-28 | 2008-10-02 | Tencent Technology (Shenzhen) Company Limited | A method, system and equipment for client service |
CN101441645A (zh) * | 2007-11-23 | 2009-05-27 | 财团法人工业技术研究院 | 技术数据分析的系统与方法 |
CN101021874B (zh) * | 2007-03-21 | 2010-05-26 | 金蝶软件(中国)有限公司 | 一种对查询sql请求进行优化的方法及装置 |
CN101201815B (zh) * | 2006-12-13 | 2012-03-28 | 鸿富锦精密工业(深圳)有限公司 | 专利申请文件生成系统及方法 |
CN103455476A (zh) * | 2012-05-29 | 2013-12-18 | 阿里巴巴集团控股有限公司 | 网络信息的处理方法和抽象语法树的建立方法及其装置 |
CN110263931A (zh) * | 2010-08-17 | 2019-09-20 | 西格拉姆申德勒有限公司 | Fstp专家系统 |
CN111061757A (zh) * | 2019-12-19 | 2020-04-24 | 用友网络科技股份有限公司 | 数据库的语言转换方法、装置、电子设备及存储介质 |
-
2005
- 2005-01-22 CN CN 200510032977 patent/CN1808427A/zh active Pending
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101201815B (zh) * | 2006-12-13 | 2012-03-28 | 鸿富锦精密工业(深圳)有限公司 | 专利申请文件生成系统及方法 |
CN101021874B (zh) * | 2007-03-21 | 2010-05-26 | 金蝶软件(中国)有限公司 | 一种对查询sql请求进行优化的方法及装置 |
WO2008116403A2 (en) * | 2007-03-28 | 2008-10-02 | Tencent Technology (Shenzhen) Company Limited | A method, system and equipment for client service |
WO2008116403A3 (zh) * | 2007-03-28 | 2011-02-10 | 腾讯科技(深圳)有限公司 | 一种实现客户服务的方法、系统及设备 |
CN101441645A (zh) * | 2007-11-23 | 2009-05-27 | 财团法人工业技术研究院 | 技术数据分析的系统与方法 |
CN101441645B (zh) * | 2007-11-23 | 2016-09-28 | 财团法人工业技术研究院 | 技术数据分析的系统与方法 |
CN110263931A (zh) * | 2010-08-17 | 2019-09-20 | 西格拉姆申德勒有限公司 | Fstp专家系统 |
CN103455476A (zh) * | 2012-05-29 | 2013-12-18 | 阿里巴巴集团控股有限公司 | 网络信息的处理方法和抽象语法树的建立方法及其装置 |
CN111061757A (zh) * | 2019-12-19 | 2020-04-24 | 用友网络科技股份有限公司 | 数据库的语言转换方法、装置、电子设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8515733B2 (en) | Method, device, computer program and computer program product for processing linguistic data in accordance with a formalized natural language | |
EP3514694A1 (en) | Query translation | |
US20100121630A1 (en) | Language processing systems and methods | |
US8782619B2 (en) | Extending programming language semantics while maintaining standard syntax through aliasing | |
CN1808427A (zh) | 专利信息检索的语法转换方法 | |
US11768677B2 (en) | Method and system for software application optimization using natural language-based queries | |
US7460996B2 (en) | Using strong data types to express speech recognition grammars in software programs | |
US20070143321A1 (en) | Converting recursive hierarchical data to relational data | |
CN1906609A (zh) | 在数据中心中使用的用于进行数据格式转换的系统 | |
US8312437B2 (en) | Structured search in source code | |
KR20090069275A (ko) | 자연언어로 된 텍스트로부터 존재론을 전개하기 위한, 컴퓨터들에 의해 사용되는 방법 | |
US11010360B2 (en) | Extending tags for information resources | |
Burke et al. | Translating formal software specifications to natural language: a grammar-based approach | |
CN105787044A (zh) | 一种基于MySQL的SQL解析器及其解析方法 | |
CN113297251A (zh) | 多源数据检索方法、装置、设备及存储介质 | |
US20200183670A1 (en) | System and method for transforming cold fusion technology environment to open source environment | |
CN108008947B (zh) | 一种编程语句的智能提示方法、装置、服务器及存储介质 | |
US20210397609A1 (en) | Automated information retrieval system and semantic parsing | |
Bais et al. | A model of a generic natural language interface for querying database | |
WO2015012679A2 (en) | A system and method for interpreting logical connectives in natural language query | |
Fliedl et al. | From OWL class and property labels to human understandable natural language | |
CN101276330A (zh) | 一种专利检索的语法转换方法 | |
JP5425417B2 (ja) | 名前データベース作成装置、方法及びプログラム | |
CN102737025A (zh) | 一种专利检索的语法转换方法 | |
CN101546339A (zh) | 从词典中包含的术语定义自动地生成本体的设备和方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C12 | Rejection of a patent application after its publication | ||
RJ01 | Rejection of invention patent application after publication |