CN101288073A - 用于利用多种查询语言检索信息的系统、方法和软件 - Google Patents

用于利用多种查询语言检索信息的系统、方法和软件 Download PDF

Info

Publication number
CN101288073A
CN101288073A CNA2006800021533A CN200680002153A CN101288073A CN 101288073 A CN101288073 A CN 101288073A CN A2006800021533 A CNA2006800021533 A CN A2006800021533A CN 200680002153 A CN200680002153 A CN 200680002153A CN 101288073 A CN101288073 A CN 101288073A
Authority
CN
China
Prior art keywords
inquiry
query
language
standardization
database
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2006800021533A
Other languages
English (en)
Other versions
CN101288073B (zh
Inventor
J·E·布赖
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Cengage Learning Co
Gail Holdings
Gale Group
Original Assignee
Thomson Global Resources AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Thomson Global Resources AG filed Critical Thomson Global Resources AG
Publication of CN101288073A publication Critical patent/CN101288073A/zh
Application granted granted Critical
Publication of CN101288073B publication Critical patent/CN101288073B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/3332Query translation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Machine Translation (AREA)

Abstract

一种示例性方法包括接收查询语言的描述;和基于所接收的查询语言描述来自动配置语言转换器。所述语言转换器或翻译器可被用于对系统进行适配以改变查询语言。

Description

用于利用多种查询语言检索信息的系统、方法和软件
相关申请
本申请要求于2005年1月13日和2005年9月2日分别提交的美国临时申请60/644,282和60/713,798的优先权,两者在此通过引用被纳入。
技术领域
本发明的不同实施例均涉及信息检索系统,尤其是用于处理多种查询语言的系统、方法和软件。
背景技术
某些信息检索系统从公共搜索接口向用户提供对多种数据库的访问。所述多种数据库通常包括需要使用与在搜索接口处所输入的查询语言不同的查询语言的一些数据库。这样,为了有效地搜索所述数据库,所述系统包括查询翻译器,所述查询翻译器可将输入查询翻译为与其它查询语言兼容的查询。
本发明人意识到所述系统中存在的一个问题涉及所述系统无法适应查询语言的转变。典型地,查询翻译器被设计并构建用以将查询从一种特定语言翻译为另一种特定语言。因此,如果改变或重定义输入查询语言,则翻译器无法生成有效的翻译。可重新设计并编码翻译器以适应改变,但是重新设计和重新编码在系统停工期间和编程资源方面是浪费的。而且,即使查询语言是稳定的,但系统本身可能被扩展以包括需要设计和构建新翻译器的新数据库。
因此,需要对传统的用于多个数据库的翻译查询方法的替代方案。
发明内容
为解决上述和/或其它需要,本发明人设计出用于在信息检索系统中翻译查询的一个或更多个系统、方法和软件。一个示例性方法要求接收查询语言的描述,并基于接收到的查询语言的描述自动配置语言翻译器或转换器。所述方法进一步包括使用自动配置的语言转换器对用户查询进行标准化,然后生成标准化查询的多种翻译以用于多个相应内容集或数据库。然后,汇总每个数据库的结果以生成全面的搜索结果。
附图说明
图1是对应于本发明一个或更多个实施例的示例性信息检索系统100的框图。
图2是对应于本发明一个或更多个实施例的示例性方法的流程图。
图3是对应于本发明一个或更多个实施例的示例性方法的流程图。
具体实施方式
结合附图和权利要求,本说明书描述本发明的一个或更多个具体实施例。为使本领域技术人员能够实现或实践本发明,所述实施例以足够的细节得以示出和说明,但其仅仅是示例的而非限制性的并教导本发明。因此,适当时为了避免使本发明晦涩,本说明书可以省略本领域技术人员公知的特定信息。
示例性信息检索系统
图1表示结合本发明教导的示例性信息检索系统100。系统100包括客户端访问设备110、服务器120和内容集130。
通常代表一个或多个访问设备的客户端访问设备110,包括用于通过网络与服务器120通信的硬件和软件。
服务器120尤其包括处理器模块121和存储器模块122。存储器模块122包括软件(机器可读或可执行指令),用于提供产品特定搜索部件(feature)123、产品特定结果部件124、基础搜索处理机125、并行搜索处理机126、127和128、以及合并结果处理机129。
产品特定搜索部件123和结果部件124是可与客户端访问设备110交互的应用服务层的部分。搜索部件123从访问设备110接收查询。结果部件123可采取结果列表的形式。
通常,基础搜索处理机125具有对查询进行标准化和基于产品特定搜索或查询来定义通向特定并行搜索处理机的搜索路径的功能。在该示例性实施例中,标准化通常要求捕获中性树(neutral tree)、如抽象语法树(abstract syntax tree,AST)形式的输入查询基本结构。例如,Gale CQL Query(查询)的标准化
“cat”prox/=/2//ordered“hat”(cat within two words of hat)获得以下XML结构:
<query>
 <positionalexpr type=”unidirectional”value=“2”>
   <queryterm type=″text”value=″cat″/>
   <queryterm type=″text”value=″hat″/>
 </positionalexpr>
</query>
在一个实施例中,并行搜索处理机之一将该标准化查询转化或翻译为“catW2 hat”,同时,另一搜索处理机将其翻译为“cat/2 hat”。在另一实施例中,基础搜索处理机122以与Z39.50 RPN Query:cat hat within/2相兼容的形式接收“cat within 2 of Hat”查询并将这标准化为:
<query>
 <positionalexpr type=”unidirectional”value=“2”>
   <queryterm type=″text”value=″cat″/>
   <queryterm type=″text”value=″hat″/>
 </positionalexpr>
</query>
搜索处理机之一将所述中性树形式翻译或去标准化为QF(CCL)查询:“catW2 hat”。响应于接收Gale QF Command scan(JN=management),基础搜索处理机将命令标准化为
<query>
 <command type=”scan”>
   <queryterm field=”JN”value=”management″/>
 </command>
</query>
其可被转换为QF:scan(JN,“management”)
并行搜索处理机126、127和128(也称为代理或目标代理)具有与内容集130一同管理状态和安全性问题的功能。同样,在某些实施例中,搜索处理机处理单独类型的搜索,并且在其它实施例中,所述搜索处理机处理相同类型的搜索。在某些实施例中,并行搜索处理机在从内容集130中所找到的内容路由到合并结果处理机120之前对所找到的内容进行标准化。
合并结果处理机129具有从一个或多个并行搜索处理机接收部分结果集并将这些结果合并成一个完整的诸如结果列表的结果集的功能。然后,将完整化的结果集路由回客户端访问设备110。
内容集130包括内容集131、132和133,其分别耦合到或可耦合到并行搜索处理机126、127和128。内容集130可采用任何不同的形式;然而,在图1的示例性实施例中,每个内容集与其他相比均使用不同的查询语言。在某些实施例中,由于冗余度或响应度的原因,一个或多个内容集反映其它内容集的内容。
对信息检索系统进行操作的示例性方法
图2表示对诸如图1所示的系统100的信息检索系统进行操作的示例性方法的流程图200。流程图200包括逐次排列并予以描述的块210-260。然而,其它实施例利用多处理器或类处理器设备或被组织为两个或多个虚拟机或子处理器的单处理器来并行执行两个或多个块。其它实施例还更改处理顺序或提供不同的功能部分或块以获得类似结果。而且,还有其它实施例把所述块实现为两个或多个内连硬件模块,其中在模块之间和经由模块传送相关的控制和数据信号。因此,示例性处理流应用于软件、硬件和固件实施。
在块210,所述示例性方法开始接收查询。在该示例性实施例中,这要求(entail)客户端访问设备110通过诸如因特网的网络向服务器120、尤其是产品特定搜索部件123传送(文本串形式的)查询。接下来执行块220。
块220要求对查询进行标准化。在该示例性实施例中,由基础搜索处理机125执行所述标准化。例如在图3所示,在某些实施例中,基础搜索处理机125采用JAVA解析器(parser)125’的形式,所述JAVA解析器125’可基于描述查询形式的所选择的可扩展样式语言(extensible style language,XSL)表单或输入来配置。因此,在这个意义上,基础搜索处理机125可容易地被适配或配置用以在实际上将任意查询结构标准化为所期望的AST形式。在块230处继续进行示例性执行。
块230要求将标准化了的查询翻译为多查询语言。在示例性实施例中,这要求图1中的基础搜索处理机125(或图3中的解析器125’)将标准化了的查询(ASP)330依次传送到一个或多个、通常两个或多个并行搜索处理机126-127(或目标代理126’)中的每一个,所述并行搜索处理机将标准化了的查询翻译为其相应的目标内容的特定查询语言。某些实施例中,并行搜索处理机(或目标代理)基于XLS输入和/或产品或索引信息生成翻译(或目标查询)。然而,在其它实施例中,一个或多个所述并行搜索处理机可以关于其他的被固定。
块240要求基于来自块230的所翻译的查询来识别内容或文档。在示例性实施例中,由一个或多个内容集130的本地搜索引擎对查询进行处理,用以为每个内容集生成各自的部分搜索结果集。
接下来,块250要求将结果合并到结果列表。为此,示例性实施例使每个并行搜索处理机参与翻译并且将各自的结果传送到合并结果处理机129。然后,继续执行块260。
块260要求向用户呈现搜索结果。在该示例性实施例中,将结果传送到客户端访问设备110。
结论
上述的和权利要求书中的实施例仅用于阐明和教导一种或多种实践或实现本发明的方式,而不限制对其宽度或范围。包含实践或实现本发明教导的所有方式的本发明的实际范围仅由所公布的权利要求书及其等价描述来限定。

Claims (14)

1、一种方法,包括:
接收查询语言描述;和
基于所接收的查询语言描述来自动配置语言转换器。
2、根据权利要求1所述的方法,进一步包括:
通过因特网连接从客户端访问设备接收用户查询;
使用自动配置的语言转换器来处理用户查询以定义标准化查询;
使用标准化查询的第一翻译版本以在第一数据库中识别文档;
使用标准化查询的第二翻译版本以在第二数据库中识别文档;
将对来自第一和第二数据库的文档进行识别的搜索结果返回给客户端访问设备。
3、根据权利要求1所述的方法,其中,自动配置语言转换器包括以一种XML样式表单来接收和基于XML样式表单配置解析器。
4、根据权利要求1所述的方法,其中标准化查询具有抽象语法树。
5、一种系统,包括:
用于接收查询语言描述的装置;和
用于基于所接收的语言转换器描述来自动配置语言转换器的装置。
6、根据权利要求5所述的系统,进一步包括:
用于通过因特网连接从客户端访问设备接收用户查询的装置;
用于使用自动配置的语言转换器来处理用户查询以定义标准化查询的装置;
响应于标准化查询的第一翻译版本来在第一数据库中识别文档的装置;
响应于标准化查询的第二翻译版本来在第二数据库中识别文档的装置;
用于将对来自第一和第二数据库的文档进行识别的搜索结果返回给客户端访问设备的装置。
7、一种信息检索系统,包括:
响应于第一查询语言描述用于对查询进行标准化的装置;
响应于第二查询语言描述用于将标准化查询翻译为适用于预定的第一数据库的第一目标查询的装置。
8、根据权利要求7所述的系统,进一步包括用于提供查询的客户端访问设备。
9、根据权利要求7所述的系统,进一步包括响应于第三查询语言描述用于将标准化查询翻译为适用于预定的第二数据库的第二目标查询的装置。
10、根据权利要求9所述的系统,进一步包括用于将基于所述第一查询来自第一数据库的搜索结果和基于所述第二查询来自第二数据库的搜索结果进行合并的装置。
11、一种信息检索系统,包括:
响应于第一查询语言描述用于对查询进行标准化的基础搜索处理机;
响应于第二查询语言描述用于将标准化查询翻译为适用于预定的第一数据库的第一目标查询的第一并行搜索处理机。
12、根据权利要求11所述的系统,其中所述基础搜索处理机包括用于对所述查询进行标准化的装置。
13、根据权利要求11所述的系统,其中所述第一并行搜索处理机包括用于翻译所述标准化查询的装置。
14、根据权利要求11所述的系统,进一步包括响应于第三查询语言描述用于将标准化查询翻译为适用于预定的第二数据库的第二目标查询的第二并行搜索处理机。
CN2006800021533A 2005-01-13 2006-01-13 用于利用多种查询语言检索信息的系统、方法和软件 Active CN101288073B (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US64428205P 2005-01-13 2005-01-13
US60/644,282 2005-01-13
US71379805P 2005-09-02 2005-09-02
US60/713,798 2005-09-02
PCT/US2006/001402 WO2006076665A1 (en) 2005-01-13 2006-01-13 Systems, methods, and software for retrieving information using multiple query languages

Publications (2)

Publication Number Publication Date
CN101288073A true CN101288073A (zh) 2008-10-15
CN101288073B CN101288073B (zh) 2013-04-24

Family

ID=36250874

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2006800021533A Active CN101288073B (zh) 2005-01-13 2006-01-13 用于利用多种查询语言检索信息的系统、方法和软件

Country Status (9)

Country Link
US (1) US20060190438A1 (zh)
EP (1) EP1856635A1 (zh)
JP (2) JP2008527575A (zh)
CN (1) CN101288073B (zh)
AR (1) AR052356A1 (zh)
AU (2) AU2006204771A1 (zh)
CA (1) CA2594827C (zh)
NZ (1) NZ589823A (zh)
WO (1) WO2006076665A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103488648A (zh) * 2012-06-13 2014-01-01 阿里巴巴集团控股有限公司 一种多语种混合检索方法和系统
CN104281583A (zh) * 2013-07-02 2015-01-14 索意互动(北京)信息技术有限公司 信息检索方法及装置

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060235852A1 (en) * 2005-04-14 2006-10-19 Lockheed Martin Corporation System for inter-database communication
US8285708B2 (en) * 2008-10-21 2012-10-09 Microsoft Corporation Query submission pipeline using LINQ
JP2014063897A (ja) 2012-09-21 2014-04-10 Toshiba Corp 半導体装置の製造方法、アニール装置及びアニール方法
GB2537670A (en) * 2015-04-23 2016-10-26 Fujitsu Ltd A query mediator, a method of querying a polyglot data tier and a computer program executable to carry out a method of querying a polyglot data tier
US11256709B2 (en) 2019-08-15 2022-02-22 Clinicomp International, Inc. Method and system for adapting programs for interoperability and adapters therefor

Family Cites Families (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5590319A (en) * 1993-12-15 1996-12-31 Information Builders, Inc. Query processor for parallel processing in homogenous and heterogenous databases
JP3277654B2 (ja) * 1993-12-20 2002-04-22 株式会社日立製作所 異種データベース・アクセス・システム
US6009422A (en) * 1997-11-26 1999-12-28 International Business Machines Corporation System and method for query translation/semantic translation using generalized query language
US6263342B1 (en) * 1998-04-01 2001-07-17 International Business Machines Corp. Federated searching of heterogeneous datastores using a federated datastore object
US6484155B1 (en) * 1998-07-21 2002-11-19 Sentar, Inc. Knowledge management system for performing dynamic distributed problem solving
JP2000242485A (ja) * 1999-02-24 2000-09-08 Nec Corp プログラミング言語変換プログラム開発支援システム、方法及び記録媒体
US6370541B1 (en) * 1999-09-21 2002-04-09 International Business Machines Corporation Design and implementation of a client/server framework for federated multi-search and update across heterogeneous datastores
US7590644B2 (en) * 1999-12-21 2009-09-15 International Business Machine Corporation Method and apparatus of streaming data transformation using code generator and translator
US6643652B2 (en) * 2000-01-14 2003-11-04 Saba Software, Inc. Method and apparatus for managing data exchange among systems in a network
IL152480A0 (en) * 2000-04-27 2003-05-29 Webfeat Inc Method and system for retrieving search results from multiple disparate databases
JP2001344147A (ja) * 2000-05-31 2001-12-14 Dainippon Printing Co Ltd 汎用データベースアクセス装置
US20020099738A1 (en) * 2000-11-22 2002-07-25 Grant Hugh Alexander Automated web access for back-end enterprise systems
US7099891B2 (en) * 2001-06-15 2006-08-29 International Business Machines Corporation Method for allowing simple interoperation between backend database systems
US20040243595A1 (en) * 2001-09-28 2004-12-02 Zhan Cui Database management system
US7567953B2 (en) * 2002-03-01 2009-07-28 Business Objects Americas System and method for retrieving and organizing information from disparate computer network information sources
JP4207438B2 (ja) * 2002-03-06 2009-01-14 日本電気株式会社 Xml文書格納/検索装置及びそれに用いるxml文書格納/検索方法並びにそのプログラム
JP2004126771A (ja) * 2002-09-30 2004-04-22 Toshiba Corp 半構造化文書データベース検索システム及びデータベース管理装置
US7383255B2 (en) * 2003-06-23 2008-06-03 Microsoft Corporation Common query runtime system and application programming interface
US7386541B2 (en) * 2004-03-18 2008-06-10 Microsoft Corporation System and method for compiling an extensible markup language based query
US20060004725A1 (en) * 2004-06-08 2006-01-05 Abraido-Fandino Leonor M Automatic generation of a search engine for a structured document
US7516121B2 (en) * 2004-06-23 2009-04-07 Oracle International Corporation Efficient evaluation of queries using translation
US7792878B2 (en) * 2004-07-29 2010-09-07 International Business Machines Corporation Fee-based model based on database federation and query support
US7512642B2 (en) * 2006-01-06 2009-03-31 International Business Machines Corporation Mapping-based query generation with duplicate elimination and minimal union

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103488648A (zh) * 2012-06-13 2014-01-01 阿里巴巴集团控股有限公司 一种多语种混合检索方法和系统
CN103488648B (zh) * 2012-06-13 2018-03-20 阿里巴巴集团控股有限公司 一种多语种混合检索方法和系统
CN104281583A (zh) * 2013-07-02 2015-01-14 索意互动(北京)信息技术有限公司 信息检索方法及装置
CN104281583B (zh) * 2013-07-02 2018-01-12 索意互动(北京)信息技术有限公司 信息检索方法及装置

Also Published As

Publication number Publication date
AU2010241304A1 (en) 2010-11-25
EP1856635A1 (en) 2007-11-21
JP2008527575A (ja) 2008-07-24
CA2594827C (en) 2013-08-20
NZ589823A (en) 2012-07-27
CA2594827A1 (en) 2006-07-20
US20060190438A1 (en) 2006-08-24
WO2006076665A1 (en) 2006-07-20
AR052356A1 (es) 2007-03-14
AU2010241304B2 (en) 2013-11-14
CN101288073B (zh) 2013-04-24
JP2011100498A (ja) 2011-05-19
AU2006204771A1 (en) 2006-07-20

Similar Documents

Publication Publication Date Title
CN101288073B (zh) 用于利用多种查询语言检索信息的系统、方法和软件
US5313635A (en) Compiling system for distributed computer system with multiple types of computers
CN100440208C (zh) 改进万维网设备中超文本标记语言页面表现的方法和系统
CN109033406B (zh) 用于搜索区块链数据的方法、装置及存储介质
CN111177788A (zh) Hive的动态脱敏方法及动态脱敏系统
CN101375247A (zh) 服务创建方法,用于实现所述方法的计算机程序产品和计算机系统
JP2005018777A (ja) 共通問い合わせ実行時システムおよびアプリケーションプログラミングインターフェイス
CN102681854A (zh) 业务执行方法、服务器和计算机系统
CN101271390A (zh) 修改xml数据结构的软件、系统和方法
CN111198901A (zh) 基于多数据源的统一数据服务开放方法及系统
CN102937981A (zh) 网页呈现系统和方法
US20030158894A1 (en) Multiterminal publishing system and corresponding method for using same
CN104270257A (zh) 基于pb和xpath的网元级网管业务配置适配系统及方法
CN107480223B (zh) 一种搜索方法、装置及存储介质
EP2874071A1 (en) Method of implementing structured and non-structured data in xml document
CN103559296A (zh) 一种基于xml的scpi命令解析方法
KR20030054110A (ko) 다중 자바 데이터베이스 연결 캐쉬 시스템 및 그 방법
US20140025696A1 (en) Method, Program and System for Generating RDF Expressions
JP2007087241A (ja) 多言語複層サイト作成システムおよび多言語複層サイト作成プログラム
KR100823883B1 (ko) 이동 통신 단말기를 이용한 알에스에스 콘텐츠 서비스 방법및 상기 서비스 시스템
JP3601869B2 (ja) 機械翻訳システム
Ichikawa et al. SQL as a mashup tool: Design and implementation of a web service integration approach based on the concept of extensible relational database management systems
CN114186018A (zh) 文档型数据库返回内容动态配置方法以及相关装置
KR101865931B1 (ko) 애플리케이션 제공 방법 및 이를 실행하는 장치
CN117539897A (zh) 数据查询方法、装置、设备及计算机可读存储介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
ASS Succession or assignment of patent right

Owner name: CENGAGE LEARNING, INC.

Free format text: FORMER OWNER: GALE GROUP INC.

Effective date: 20140627

Owner name: GALE GROUP INC.

Free format text: FORMER OWNER: GALE HOLDINGS INC.

Effective date: 20140627

Owner name: GALE HOLDINGS INC.

Free format text: FORMER OWNER: THOMSON GLOBAL RESOURCES

Effective date: 20140627

C41 Transfer of patent application or patent right or utility model
TR01 Transfer of patent right

Effective date of registration: 20140627

Address after: Massachusetts, USA

Patentee after: Cengage Learning Co.

Address before: Massachusetts, USA

Patentee before: Gale Group

Effective date of registration: 20140627

Address after: Massachusetts, USA

Patentee after: Gale Group

Address before: Massachusetts, USA

Patentee before: Gail Holdings

Effective date of registration: 20140627

Address after: Massachusetts, USA

Patentee after: Gail Holdings

Address before: Switzerland Zug

Patentee before: Thomson Global Resources