CN1808428A - 展现及编辑信息检索条件的系统及方法 - Google Patents
展现及编辑信息检索条件的系统及方法 Download PDFInfo
- Publication number
- CN1808428A CN1808428A CN 200510032978 CN200510032978A CN1808428A CN 1808428 A CN1808428 A CN 1808428A CN 200510032978 CN200510032978 CN 200510032978 CN 200510032978 A CN200510032978 A CN 200510032978A CN 1808428 A CN1808428 A CN 1808428A
- Authority
- CN
- China
- Prior art keywords
- inquiry
- assembly
- tree
- field
- data structure
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明揭露一种展现及编辑信息检索条件的方法,包括步骤:图形化查询字段组件和图形化操作组件;接收录入的查询字符串;定义该查询字符串的最小记号单位,将该查询字符串标记成为一记号序列;识别出上述记号序列的所有元素,调用相应的图形化查询字段组件和操作组件将其展开成为语法树,展现于客户端计算机介面;对上述所展现的语法树,用户可对相应的图形组件进行赋值等操作,再产生其它的查询条件;分析判断该语法树上的各个字段组件内容的类型是否正确;将上述语法树进行条件合并;产生查询代码。本发明还揭露一种展现及编辑信息检索条件的系统。
Description
【技术领域】
本发明涉及一种信息检索系统及方法。
【背景技术】
随着Internet的发展,人们越来越多的通过网络获得最新的咨询信息。
现在,几乎每个人都有看报纸的习惯,特别是一些对咨询信息需求紧迫的个人和企业,更加是要从很多的报纸上获得自己需要的信息。我们几乎能够从网络上看到所有的新闻,很多人已经通过上网来获取最新的新闻信息。但是,仅仅是上网看新闻并不能减少我们所需要的时间,我们仍然需要通读一大篇的新闻或文章才能得到我们所需要的咨询信息。而且网上的新闻一逝即过,很多人需要对多天以前的新闻进行查询,甚至需要对几个月,一年前的新闻进行查询。这种情况下,通过网络已经不能满足我们的要求了。
传统的检索所需文件的方法是基于统计的自动摘要的方法,一般利用数理统计的方法给文件中每一个词都赋予一定的权值,计算权值的方法一般是通过计算词在文章中的出现频率来计算的。出现频率高的词,所具有的权值就更高。具有高权值的词意味着这个词是文章的中心。
文章的句子也是根据词的权值来赋予的,当我们给词赋予完权值之后,我们就能够计算出每个句子的权值,权值越高的句子越能够代表文章的中心思想。我们能够直接用权值高的句子来产生摘要。
这种方法生成摘要的速度很快,但是由于出现频率高的词并不一定就是文章的中心思想,而且没有进行语法分析,用权值高的句子拼凑而成的摘要的可读性也是比较差的。
中国国家知识产权局于2004年10月13日公开、公开号为1536483的专利申请案,揭露了一种“网络信息抽取及处理的方法”,该方法采用人工智能与自然语言处理技术,能够自动从各个指定的站点下载每天最新的新闻信息,并且进行内容抽取,分类,自动摘要精简全文。
中国国家知识产权局于2004年10月13日公开、公开号为1536512的专利申请案,揭露了一种“快速检索电话簿的方法”。
上述专利申请案所揭露的技术方案都只涉及到如何进行信息检索及检索条件匹配,但却没有涉及到将信息查询检索条件可视化展现到用户面前,使得用户更容易处理逻辑复杂的查询条件。
【发明内容】
本发明的目的在于提供一种展现及编辑信息检索条件的系统,该系统可视觉化展现及编辑信息检索条件。
本发明的另一目的在于提供一种展现及编辑信息检索条件的方法,该方法可视觉化展现及编辑信息检索条件。
为实现第一个发明目的,本发明揭露一种展现及编辑信息检索条件的系统。该系统包括一档案服务器、通过网络与其相连的客户端计算机、及通过数据库连接与其相连的数据库。所述数据库用于存储语法参考列表和字段检索提示信息,该语法参考列表定义了不同的查询字段组件和操作组件。
所述档案服务器包括:一组件图形化模块,用于将每个查询字段组件及操作组件用图形表示;一接收查询字符串模块,用于接收用户根据查询问题描述,而通过客户端计算机介面输入的符合通用检索语法的查询字符串;一词句分析模块,用于定义所接收到的查询字符串的最小记号单位,以定义的多个最小记号单位将该查询字符串标记为一记号序列;一语法分析模块,识别出上述记号序列中的所有元素,查询数据库中的语法参考列表,调用相应用图形表示的查询字段组件和操作组件产生树状数据结构,即语法树,并将该语法树展现于客户端计算机介面;一语义分析模块,用于根据上述语法树,查询数据库中的语法参考列表及字段检索提示,执行各个字段组件的类型检查,查询值字段信息,判断各个字段组件所录入的值的类型是否符合值字段信息的内容;一优化模块,将上述语法树优化,使解析语法树更有效;一代码生成模块,用于根据优化后的语法树,生成查询代码。
为实现第二个发明目的,本发明揭露一种展现及编辑信息检索条件的方法。该方法包括如下步骤:(a)图形化查询字段组件和图形化操作组件;(b)接收录入的查询字符串;(c)定义该查询字符串的最小记号单位,并将该查询字符串标记成为一记号序列;(d)查询数据库中的语法参考列表,识别出上述记号序列的所有元素,调用相应的用图形表示的查询字段组件和用图形表示的操作组件将其展开成为树状数据结构,即语法树,展现于客户端计算机显示介面上;(e)查询数据库中的语法参考列表及字段检索提示,分析判断该语法树上的各个字段组件内容的类型是否正确;(f)将上述语法树进行条件合并;(g)产生查询代码。
为实现第二个发明目的,本发明还揭露另一种展现及编辑信息检索条件的方法。该方法包括如下步骤:(h)图形化查询字段组件和图形化操作组件;(i)拖动所需要的以图形化表示的查询字段组件和操作组件形成语法树;(j)对查询字段组件赋值,形成查询条件;(k)查询数据库中的语法参考列表及字段检索提示,分析判断上述语法树上的各个字段组件内容的类型是否正确;(l)将上述语法树进行条件合并;(m)产生查询代码。
【附图说明】
图1是本发明展现及编辑信息检索条件的系统的硬件实施环境示意图。
图2是本发明档案服务器的功能模块图。
图3是本发明标记查询字符串成一记号序列的示意图。
图4是本发明查询字符串树状结构示意图。
图5是本发明展现及编辑信息检索条件的方法的流程图。
【具体实施方式】
本实施例以专利检索条件为例进行描述。
参阅图1所示,是本发明展现及编辑信息检索条件系统的硬件实施环境示意图。该系统包括一档案服务器10及与其通过网络30相连的多个客户端计算机20,通过数据库连接40相连的一数据库50。其中档案服务器10用于将用户录入的查询字符串转化为树状图形展现出来,并提供进行检索的多个文件及信息,所述文件在本实施例中是指专利文件。客户端计算机20提供用户访问档案服务器10的浏览器介面。网络30可以是互联网,也可以是内部局域网络。
数据库50用于存储语法定义文件。该语法定义文件包括语法参考列表、字段检索提示等信息。在语法参考列表中定义了不同的查询字段组件、操作组件、值字段信息等。其中操作组件包括:AND(与操作)、OR(或操作)、NOT(不包含)等;查询字段组件指查询内容所处的范围,包括AN(专利权人)、ACLM(专利权利要求)、ISD(日期)、PTO(专利局)、TTL(专利名称)、PN(专利号)、IN(发明人姓名)、APN(申请号)等;值字段信息指日期类型、文字类型、枚举类型(如国家、专利类型等)。如一查询字符串为:AN/(award or ibm)andACLM/BIOS AND ISD/[2004.1.1-2004.12.31],则在该查询字符串中,操作组件有AND、OR、NOT;查询字段组件有AN、ACLM、ISD。其中字段AN及ACLM的的值字段信息是文字类型,字段ISD的值字段信息是日期类型。
参阅图2所示,是本发明档案服务器的功能模块图。该档案服务器10包括一组件图形化模块101、一接收查询字符串模块102、一词句分析模块103、一语法分析模块104、一语义分析模块105、一优化模块106及一代码生成模块107。
其中,组件图形化模块101用于将每个查询字段组件及操作组件用图形表示,该图形化组件可被通过拖动并赋值,产生查询条件,也可作为一个组件,嵌入到其它查询系统中。所述其它查询系统包括查询专利的系统。
接收查询字符串模块102用于接收用户根据专利查询问题描述,通过客户端计算机介面输入的符合通用专利检索语法的查询字符串。
词句分析模块103用于定义所接收到的查询字符串的最小记号单位,以定义的多个最小记号单位将该查询字符串标记为一记号序列。如将上述查询字符串:AN/(award or ibm)and ACLM/BIOS ANDISD/[2004.1.1-2004.12.31],以每一字段组件作为最小记号单位,即一元素,定义出17个最小记号(TOKEN)单位,标记为如图3所示的记号序列,保存于数据库50中。
语法分析模块104用于借助javaCC的JJTree功能,识别出上述记号序列中的所有元素,查询数据库50中的语法参考列表,调用相应用图形表示的查询字段组件和操作组件产生如图4所示的树状数据结构,即语法树,并将该语法树展现于客户端计算机的介面且保存于数据库50中。其中所述的树状数据结构可以是Java树据结构,也可以是用其它语言产生的树状数据结构,如XML。在本发明中也可以直接拖动图形化的查询字段组件和图形化的操作组件,对查询字段进行赋值形成语法树,产生查询条件。
语义分析模块105用于根据上述语法树,查询数据库50中的语法参考列表及字段检索提示,执行各个字段组件的类型检查,查询值字段信息,判断各个字段组件所录入的值的类型是否符合值字段信息的内容。
优化模块106将上述语法树优化,使解析语法树更有效,例如进行条件合并,将查询字符串:(AN/“award”or AN/ibm)优化成查询字符串:AN/(“award”or ibm)。
代码生成模块107根据优化后的语法树,生成查询条件。可利用JJTree产生动态树结构,或者生成Java查询代码并将Java代码嵌入到JavaCC脚本中,也可以生成SQL查询语句。
参阅图5所示,本发明展现及编辑信息检索条件方法的流程图。首先,通过组件图形化模块101图形化查询字段组件和图形化操作组件(步骤S400)。接收查询字符串模块102接收用户从客户端计算机20录入的查询字符串(步骤S402)。通过词句分析模块103定义该查询字符串的最小记号单位,并将该查询字符串标记成为一记号序列(步骤S404)。通过语法分析子模块104查询数据库50中的语法参考列表,识别出上述记号序列的所有元素,调用相应的用图形表示的查询字段组件和用图形表示的操作组件将其展开成为树状数据结构,即语法树,展现于客户端计算机显示介面上(步骤S406)。对上述所展现的树状结构,用户可对相应的图形组件进行赋值、拖动、增加、删除等操作,再产生其它的查询条件(步骤S408)。通过语义分析模块105查询数据库50中的语法参考列表及字段检索提示,分析判断该语法树上的各个字段组件的内容的类型是否正确(步骤S410)。通过优化模块106将上述语法树进行条件合并(步骤S412);通过代码生成模块107产生查询代码。
本发明还可以拖动上述以图形化表示的查询字段组件和图形化表示的操作组件,并对查询字段组件赋值而直接生成语法树,再对该语法树进行语义分析、条件优化及最后生成查询语句。
Claims (12)
1.一种展现及编辑信息检索条件的系统,该系统包括一档案服务器、通过网络与其相连的客户端计算机、及通过数据库连接与其相连的数据库,其特征在于:
所述数据库用于存储语法参考列表和字段检索提示信息,该语法参考列表定义了不同的查询字段组件和操作组件;
所述档案服务器包括:
一组件图形化模块,用于将每个查询字段组件及操作组件用图形表示;
一接收查询字符串模块,用于接收用户根据查询问题描述输入的符合通用检索语法的查询字符串;
一词句分析模块,用于定义所接收到的查询字符串的最小记号单位,以定义的多个最小记号单位将该查询字符串标记为一记号序列;
一语法分析模块,用于识别出上述记号序列中的所有元素,查询数据库中的语法参考列表,调用相应用图形表示的查询字段组件和操作组件产生树状数据结构,即语法树,并将该语法树展现于客户端计算机的介面;
一语义分析模块,用于根据上述语法树,查询数据库中的语法参考列表及字段检索提示,执行各个字段组件的类型检查,查询值字段信息,判断各个字段组件所录入的值的类型是否符合值字段信息的内容;
一优化模块,用于将上述语法树优化,使解析语法树更有效;
一代码生成模块,用于根据优化后的语法树,生成查询条件。
2.如权利要求1所述的展现及编辑信息检索条件的系统,其特征在于,其中数据库还用于存储语法树生成过程中所产生的信息,所述信息包括记号序列、树状数据结构及生成的查询代码。
3.如权利要求1所述的展现及编辑信息检索条件的系统,其特征在于,其中图形化的查询字段组件和操作组件可被通过拖动并赋值产生查询条件,也可作为一个组件,嵌入到另一个查询系统中。
4.如权利要求1所述的展现及编辑信息检索条件的系统,其特征在于,其中语法分析模块所产生的树状数据结构可以是Java树据结构。
5.如权利要求1所述的展现及编辑信息检索条件的系统,其特征在于,其中语法分析模块所产生的树状数据结构可以是用XML语言产生的树状数据结构。
6.如权利要求1所述的展现及编辑信息检索条件的系统,其特征在于,其中在代码生成模块中,可利用JJTree产生动态树结构,或者生成Java查询代码并将Java代码嵌入到JavaCC脚本中,也可以生成SQL查询语句。
7.一种利用权利要求1所述的系统展现及编辑信息检索条件的方法,其特征在于,该方法包括如下步骤:
图形化查询字段组件和图形化操作组件;
接收录入的查询字符串;
定义该查询字符串的最小记号单位,并将该查询字符串标记成为一记号序列;
查询数据库中的语法参考列表,识别出上述记号序列的所有元素,调用相应的用图形表示的查询字段组件和用图形表示的操作组件,将其展开成为树状数据结构,即语法树,展现于客户端计算机的显示介面上;
查询数据库中的语法参考列表及字段检索提示,分析判断该语法树上的各个字段组件内容的类型是否正确;
将上述语法树进行条件合并;
产生查询代码。
8.如权利要求7所述的展现及编辑信息检索条件的方法,其特征在于,其中所产生的树状数据结构是Java数据结构。
9.如权利要求7所述的展现及编辑信息检索条件的方法,其特征在于,其中所产生的树状数据结构是用XML语言产生的数据结构。
10.如权利要求7所述的展现及编辑信息检索条件的方法,其特征在于,其中展现的查询字符串的树状数据结构可作为一个组件,嵌入到另一个查询系统。
11.如权利要求7所述的展现及编辑信息检索条件的方法,其特征在于,其中对所展现的树状数据结构,用户可对相应的图形组件进行赋值、拖动、增加、删除操作,再产生新的查询条件。
12.一种利用权利要求1所述的系统进行展现及编辑信息检索条件的方法,其特征在于,该方法包括如下步骤:
图形化查询字段组件和图形化操作组件;
拖动所需要的以图形化表示的查询字段组件和操作组件形成语法树;
对查询字段组件赋值,形成查询条件;
查询数据库中的语法参考列表及字段检索提示,分析判断上述语法树上的各个字段组件内容的类型是否正确;
将上述语法树进行条件合并;
产生查询代码。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 200510032978 CN1808428A (zh) | 2005-01-22 | 2005-01-22 | 展现及编辑信息检索条件的系统及方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 200510032978 CN1808428A (zh) | 2005-01-22 | 2005-01-22 | 展现及编辑信息检索条件的系统及方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN1808428A true CN1808428A (zh) | 2006-07-26 |
Family
ID=36840328
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN 200510032978 Pending CN1808428A (zh) | 2005-01-22 | 2005-01-22 | 展现及编辑信息检索条件的系统及方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN1808428A (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2009062444A1 (fr) * | 2007-11-12 | 2009-05-22 | Huawei Technologies Co., Ltd. | Procédé, système et équipement permettant de fournir des informations utilisateur |
CN101621480B (zh) * | 2008-06-30 | 2012-03-28 | 国际商业机器公司 | 呈现服务器和在其中使用的xsl文件处理方法 |
WO2014198025A1 (zh) * | 2013-06-10 | 2014-12-18 | 天津海量信息技术有限公司 | 一种信息检索的方法和系统 |
CN104572970A (zh) * | 2014-12-31 | 2015-04-29 | 浙江大学 | 一种基于本体库内容的sparql查询语句生成系统 |
CN106708864A (zh) * | 2015-11-13 | 2017-05-24 | 北京国双科技有限公司 | 基于查询框架的数据查询方法及装置 |
CN113302927A (zh) * | 2019-01-18 | 2021-08-24 | 韦勒斯标准与技术协会公司 | 使用运动补偿的视频信号处理方法和设备 |
CN116010444A (zh) * | 2023-03-27 | 2023-04-25 | 中国人民解放军国防科技大学 | 低代码交互式的图查询语句构建方法 |
-
2005
- 2005-01-22 CN CN 200510032978 patent/CN1808428A/zh active Pending
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2009062444A1 (fr) * | 2007-11-12 | 2009-05-22 | Huawei Technologies Co., Ltd. | Procédé, système et équipement permettant de fournir des informations utilisateur |
CN101621480B (zh) * | 2008-06-30 | 2012-03-28 | 国际商业机器公司 | 呈现服务器和在其中使用的xsl文件处理方法 |
WO2014198025A1 (zh) * | 2013-06-10 | 2014-12-18 | 天津海量信息技术有限公司 | 一种信息检索的方法和系统 |
CN104572970A (zh) * | 2014-12-31 | 2015-04-29 | 浙江大学 | 一种基于本体库内容的sparql查询语句生成系统 |
CN104572970B (zh) * | 2014-12-31 | 2017-09-12 | 浙江大学 | 一种基于本体库内容的sparql查询语句生成系统 |
CN106708864A (zh) * | 2015-11-13 | 2017-05-24 | 北京国双科技有限公司 | 基于查询框架的数据查询方法及装置 |
CN113302927A (zh) * | 2019-01-18 | 2021-08-24 | 韦勒斯标准与技术协会公司 | 使用运动补偿的视频信号处理方法和设备 |
US11849106B2 (en) | 2019-01-18 | 2023-12-19 | Wilus Institute Of Standards And Technology Inc. | Video signal processing method and device using motion compensation |
CN113302927B (zh) * | 2019-01-18 | 2024-04-09 | 韦勒斯标准与技术协会公司 | 使用运动补偿的视频信号处理方法和设备 |
CN116010444A (zh) * | 2023-03-27 | 2023-04-25 | 中国人民解放军国防科技大学 | 低代码交互式的图查询语句构建方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN100568241C (zh) | 用于集中内容管理的方法和系统 | |
KR100461019B1 (ko) | 소형 화면 단말기를 위한 웹 컨텐츠 변환 시스템 및 방법 | |
US8484210B2 (en) | Representing markup language document data in a searchable format in a database system | |
US7370061B2 (en) | Method for querying XML documents using a weighted navigational index | |
CN1193305C (zh) | 具有多数据源能力的数据恢复方法和装置 | |
US8683324B2 (en) | Dynamic generation of target files from template files and tracking of the processing of target files | |
US6915303B2 (en) | Code generator system for digital libraries | |
US20070094246A1 (en) | System and method for searching dates efficiently in a collection of web documents | |
US20110283207A1 (en) | System and method for platform and language-independent development and delivery of page-based content | |
US20070094232A1 (en) | System and method for automatically extracting by-line information | |
US6339773B1 (en) | Data extractor | |
EP2092447A1 (en) | Email document parsing method and apparatus | |
CN1808428A (zh) | 展现及编辑信息检索条件的系统及方法 | |
JP5048956B2 (ja) | データベースのクローリングによる情報検索 | |
TWI381278B (zh) | 在網頁檔案中建立連結的方法及其網頁編輯系統 | |
US20030126109A1 (en) | Method and system for converting message data into relational table format | |
CN111708805A (zh) | 数据查询方法、装置、电子设备及存储介质 | |
CN102591897A (zh) | 文件检索装置以及文件检索方法 | |
CN1601524A (zh) | 模糊查询系统及方法 | |
US11620282B2 (en) | Automated information retrieval system and semantic parsing | |
CN113687827A (zh) | 基于微件的数据列表生成方法、装置、设备及存储介质 | |
CN116303641B (zh) | 一种支持多数据源可视化配置的实验室报告管理方法 | |
JP2002534741A (ja) | 半構造化テキストデータを処理する方法及び装置 | |
CN100422987C (zh) | 网络中智能信息处理的方法和系统 | |
US20060200495A1 (en) | System and method for displaying and editing information search conditions |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C12 | Rejection of a patent application after its publication | ||
RJ01 | Rejection of invention patent application after publication |
Open date: 20060726 |