CN101685444A - 用于实现元数据搜索的系统和方法 - Google Patents

用于实现元数据搜索的系统和方法 Download PDF

Info

Publication number
CN101685444A
CN101685444A CN200810149813A CN200810149813A CN101685444A CN 101685444 A CN101685444 A CN 101685444A CN 200810149813 A CN200810149813 A CN 200810149813A CN 200810149813 A CN200810149813 A CN 200810149813A CN 101685444 A CN101685444 A CN 101685444A
Authority
CN
China
Prior art keywords
metadata resource
metadata
resource
path
type
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN200810149813A
Other languages
English (en)
Other versions
CN101685444B (zh
Inventor
倪渊
谢国彤
潘越
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Priority to CN2008101498131A priority Critical patent/CN101685444B/zh
Priority to US12/567,213 priority patent/US9275144B2/en
Publication of CN101685444A publication Critical patent/CN101685444A/zh
Application granted granted Critical
Publication of CN101685444B publication Critical patent/CN101685444B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

提出了一种用于实现元数据搜索的系统和方法,该系统包括:接收模块,其用于接收针对多个元数据资源的搜索查询,其中所述搜索查询中指定了元数据资源中的文本信息,而没有指定元数据资源之间的结构信息,或者仅指定了元数据资源之间的部分结构信息;查询处理器,其用于分析所述搜索查询,并根据对所述搜索查询的分析搜索相关的元数据资源以及相关的元数据资源之间的结构信息,从而形成搜索结果,其中所述搜索结果中包含了相关的元数据资源之间的完整的结构信息;以及输出模块,其用于输出所述搜索结果,从而实现了针对所述多个元数据资源的模糊结构搜索。这样,不仅能够搜索元数据资源中的文本信息,而且能够获得元数据资源中的结构信息,同时,不需要用户了解和指明元数据资源中的精确结构,从而方便了用户的搜索操作。

Description

用于实现元数据搜索的系统和方法
技术领域
本发明涉及数据处理领域,具体涉及一种用于实现元数据搜索的系统和方法。
背景技术
随着数据仓库应用、面向服务架构(SOA)等的发展,信息系统中的元数据,即关于数据的数据层,变得越来越重要。特别是在企业场景中,在不同的储存库中存储和管理着各种类型的元数据。例如,WebSphereService Registry and Repository(WSRR)是存储关于服务的元数据信息的地方;WebSphere Business Glossary(WBG)管理着针对企业和IT用户的通用词汇表和分类信息;WebSphere DataStage用于开发和存储ETL作业的元数据,等等。没有有效的元数据搜索方法,则元数据管理员和用户很可能被企业中所存在的大量的元数据所淹没;重要的元数据信息可能难于发现,而用户可能创建冗余的元数据。因此,一种元数据搜索引擎和元数据搜索方法对于成功的元数据管理来说是必不可少的。
存在着各种类型的元数据资源,例如XSD文档中的ComplexTypeDefinition,WSDL文档中的Service描述,BusinessTerm定义,BusinessCategory定义等等。每一个元数据资源具有某些属性,例如它的标签,用于描述它的注释等。不同的元数据资源可能是相互关联的。例如,一个BusinessTerm可能对一个Service进行分类(classify),一个BusinessCategory可能包含(contain)一个BusinessTerm,等等。这种关联信息被认为是元数据的结构信息。如果将每个元数据资源视为一个节点,而将元数据资源之间的关系视为节点之间的边,则可将这些元数据资源链接起来而产生一个元数据图。这样,元数据搜索的问题就是在这种元数据图中发现相关的元数据资源。由于元数据的数量和种类往往很大,因此,元数据管理员和用户很难在其中找到所需要的元数据信息。图1示意性地示出了在包含设计开发阶段和运行时阶段的一示例性企业场景中涉及的各种元数据资源及其复杂的关系。
在现有技术中存在一些可用于进行元数据搜索的工具。这些工具所采用的元数据搜索方法可被划分为如下两类。
第一类是利用基于关键字的搜索引擎。可以将元数据资源的描述发布为HTML页面,这样,就可以使用现有的基于HTML页面内容中的关键字的Web搜索引擎来进行元数据搜索。例如,图2示出了一示例性的用于元数据资源BusinessTerm AddressNumber的HTML页面。IBM OmiFindYahoo!Edition提供了用于Web站点的爬行器和简单的搜索引擎。可以配置OmniFind以使其获取用于元数据资源的所有HTML页面,然后可使用其搜索引擎来搜索元数据。例如,使用图2中的页面中包含的关键字“streetaddress”进行搜索,可以返回元数据资源BusinessTerm AddressNumber。这种传统的关键字搜索方法不需要用户知道元数据的结构,因而具有操作简单的优点,然而,由于它只是利用了元数据中的小的文本片段,而没有利用元数据资源内部的结构信息以及不同元数据资源之间的结构和语义信息,因此往往不足以搜索到有用的或相关的元数据信息。
第二类是利用基于查询的搜索引擎。如果用户知道元数据的结构,则有可能通过发出基于结构的查询来发现目标元数据资源。例如,如果使用资源描述框架(RDF)格式来表示元数据图,则可以利用SPARQL查询来获得元数据资源。图3示出了一示例性元数据图。针对该元数据图,如果要寻找使用ComplexTypeDefinition D并由BusinessTerm T分类(classify)的Service,则可构造并发出如下SPARQL查询:
Select?x
where   {?x  implement  ?y.?y  interfaceOperation  ?z.?zinterfaceMessageReference?w.?w use?v.?v name D.?u classify?x.?uname T}
然而,这种基于查询的搜索方法尽管能返回与元数据的结构相关的有用信息,但它的缺点是需要用户知道并指定从一个元数据资源到另一个元数据资源的精确路径。由于搜索引擎的用户通常并不确切地知道他们想要寻找的数据的结构,因此,用户很难构造这样的查询。
发明内容
本发明提供这样一种用于实现元数据搜索的解决方案,其既能够返回与元数据的结构有关的有用的元数据资源,同时又不需要用户知道和指明元数据资源之间的精确路径。
根据本发明的一个方面,提供了一种用于实现元数据搜索的系统,包括:接收模块,其用于接收针对多个元数据资源的搜索查询,其中所述搜索查询中指定了元数据资源中的文本信息,而没有指定元数据资源之间的结构信息,或者仅指定了元数据资源之间的部分结构信息;查询处理器,其用于分析所述搜索查询,并根据对所述搜索查询的分析搜索相关的元数据资源以及所述相关的元数据资源之间的结构信息,从而形成搜索结果,其中所述搜索结果中包含了所述相关的元数据资源之间的完整的结构信息;以及输出模块,其用于输出所述搜索结果,从而实现了针对所述多个元数据资源的模糊结构搜索。
根据本发明的另一个方面,提供了一种用于实现元数据搜索的方法,包括:接收针对多个元数据资源的搜索查询,其中所述搜索查询中指定了元数据资源中的文本信息,而没有指定元数据资源之间的结构信息,或者仅指定了元数据资源之间的部分结构信息;分析所述搜索查询,并根据对所述搜索查询的分析搜索相关的元数据资源以及所述相关的元数据资源之间的结构信息,从而形成搜索结果,其中所述搜索结果中包含了所述相关的元数据资源之间的完整的结构信息;以及输出所述搜索结果,从而实现了针对所述多个元数据资源的模糊结构搜索。
本发明能够同时实现针对元数据资源的基于关键字的搜索和模糊结构搜索,这样,不仅能够搜索元数据资源中的文本信息,而且能够获得元数据资源中的结构信息,从而为用户提供了更有用和相关的信息;同时,不需要用户了解和指明元数据资源中的精确结构,从而方便了用户的搜索操作。
附图说明
所附权利要求中阐述了被认为是本发明的特点的创造性特征。但是,通过参照附图阅读下面对说明性实施例的详细说明可更好地理解发明本身以及其优选使用模式、目标、特征以及优点,在附图中:
图1示意性地示出了在包含设计开发阶段和运行时阶段的一示例性企业场景中涉及的各种元数据资源及其复杂的关系;
图2示出了一示例性的用于元数据资源BusinessTermAddressNumber的HTML页面;
图3示出了一示例性元数据图;
图4示出了根据本发明的实施例的用于实现元数据搜索的系统;
图5A示出了一组示例性元数据资源以及元数据资源之间的语义关系;
图5B示出了具有等价关系的元数据资源的示例;
图6示出了响应于输入关键字credit所返回的搜索结果的示例;
图7示出了根据本发明的实施例根据如图5A中所示的示例性元数据资源生成的文本索引的示例。
图8示出了根据本发明的实施例根据图5A所示的示例性元数据资源生成的结构索引的示例;
图9示出了根据本发明的另一实施例根据图5A所示的示例性元数据资源生成的结构索引的示例;以及
图10示出了根据本发明的实施例的用于实现元数据搜索的方法。
具体实施方式
下面参照附图来说明本发明的实施例。在下面的说明中,阐述了许多具体细节以便更全面地了解本发明。但是,对于本技术领域内的技术人员明显的是,本发明的实现可不具有这些具体细节中的一些。此外,应当理解的是,本发明并不限于所介绍的特定实施例。相反,可以考虑用下面的特征和要素的任意组合来实施本发明,而无论它们是否涉及不同的实施例。因此,下面的方面、特征、实施例和优点仅作说明之用而不应被看作是所附权利要求的要素或限定,除非权利要求中明确提出。
根据本发明的实施例,提出了一种新的用于实现元数据搜索的系统和方法。该系统利用了元数据中的文本和结构信息这两者来处理搜索查询,并对搜索结果进行排序。简言之,本发明的系统的贡献包括如下几个方面:
首先,提供了新的搜索类型,这种新的搜索类型使得能够进行针对元数据的关键字搜索和模糊结构搜索这两者,而且还能获得元数据中的类型信息。为了减轻最终用户构造和发出搜索查询的负担,采用了简单的查询语法,使得用户不需要了解和指明元数据之间的精确的关系路径等结构信息。所述模糊结构搜索是指在搜索查询中没有指定元数据资源之间的精确的或完整的关系路径,例如,没有指定元数据资源之间的任何关系路径信息,或者只是提供了元数据资源之间不完整的或不精确的关系信息,然而在搜索结果中却包含了元数据资源之间的完整的或精确的关系路径信息。
其次,进一步提出了向用户显示搜索结果中的结构信息。考虑到元数据的结构信息的重要性,因此除了显示满足查询的元数据资源的文本片段外,还提供了所涉及的元数据资源之间的关系,这样用户可以迅速确定所返回的元数据资源是否确实是相关的。此外,还提出了一种新的对搜索结果进行排序的度量,该新的排序度量结合了文本搜索因素和结构相关因素这两者。
最后,提出了用于实现上述新的搜索类型的索引结构。该索引结构存储了元数据资源中的文本信息,以及元数据资源之间的关系路径信息,以便在不同的元数据资源之间导航。
图4示出了根据本发明的实施例的用于实现元数据搜索的系统。如图所示,该系统包括:接收模块401,其用于接收针对多个元数据资源的搜索查询,其中所述搜索查询中指定了元数据资源中的文本信息,而没有指定元数据资源之间的结构信息,或者仅指定了元数据资源之间的部分结构信息;查询处理器402,其用于分析所述搜索查询,并根据对所述搜索查询的分析搜索相关的元数据资源以及所述相关的元数据资源之间的结构信息,从而形成搜索结果,其中所述搜索结果中包含了所述相关的元数据资源之间的完整的结构信息;以及输出模块403,其用于输出所述从而实现了针对所述多个元数据资源的模糊结构搜索。
根据本发明的实施例,在所述搜索查询中指定了关键字,查询处理器402可通过接收并处理该搜索查询,获得包含所指定的关键字的元数据资源(可能还有该元数据资源中包含所指定关键字的文本片段和该文本片段在该元数据资源中所属的属性),从而实现了针对多个元数据资源的基于关键字的搜索;此外,查询处理器402还可通过接收并处理该搜索查询,获得与包含所指定的关键字的元数据资源具有直接或间接关系的元数据资源,从而实现了针对多个元数据资源的模糊结构搜索。另外,还可在所述搜索查询中指定元数据资源之间的关系,查询处理器402可通过接收并处理该搜索查询,获得在其间的关系路径中包含了所指定的关系的元数据资源,从而实现了针对多个元数据资源的模糊结构搜索。
根据本发明的进一步的实施例,所述搜索查询的类型为以下五种类型中的一个,即本发明的系统能够处理以下五种查询类型。
*查询类型一,用于搜索直接相关的元数据资源,即其中搜索查询指定了一组关键字,用于搜索其文本片段包含所指定的一组关键字的元数据资源。
该查询类型的示例性语法可以是“:K”,其中K为一组关键字。相应的语义为:返回其文本片段包含指定的一组关键字K的元数据资源。文本片段是指元数据资源的某个属性的值,所述属性例如可以是标签、名称、注释等。
例如,图5A示出了一组示例性元数据资源以及这些元数据资源之间的语义关系。其中,元数据资源R1的名称(name)为Accounting,类型(type)为BusinessCategory,元数据资源R2的名称为Account,类型为BusinessTerm,元数据资源R3的标签(label)为ProcessCredit,类型为Service,元数据资源R4的标签为ProcessCreditStatus,类型为InterfaceOperation,这些元数据资源之间的关系为R1包含(contain)R2,R2对R3分类(classify),R3实现(implement)R4。针对该组示例性元数据资源,如果输入的搜索查询为“:credit”,则输出的搜索结果为“R3,R4”。因为,R3和R4各自的属性label的值ProcessCredit和ProcessCreditStatus中分别包含了搜索查询中指定的关键字credit。
*查询类型二,用于搜索间接相关的元数据资源,即其中搜索查询指定了一组关键字,用于搜索这样的元数据资源,所述元数据资源具有到其文本片段包含所指定的一组关键字的元数据资源的关系路径。
该查询类型的示例性语法可以是“K”,其中K为一组关键字。相应的语义为:返回这样的元数据资源,所述元数据资源具有到其文本片段包含所指定的一组关键字K的元数据资源的关系路径。
例如,针对图5A中所示的一组示例性元数据资源,如果输入的搜索查询为“credit”,则输出的搜索结果为R1、R2、R3、R4。其中,R3和R4被返回是因为其各自的属性label的值ProcessCredit和ProcessCreditStatus中分别包含了搜索查询中指定的关键字credit,而R2被返回是因为R2具有到元数据资源R3的关系路径R2classify R3,或具有到R4的关系路径R2classify R3 implement R4,R1被返回是因为R1具有到元数据资源R3的关系路径R1 contains R2 classify R3,或具有到R4的关系路径R1 contains R2 classify R3 implement R4。根据本发明的进一步的实施例,该查询类型二用于搜索如下几类元数据资源:其文本片段中包含所指定的一组关键字的元数据资源S,具有到S中的任何一个元数据资源的直接关系路径的元数据资源S’,以及具有到S”中的任何一个元数据资源的包括等价关系或包含关系的关系路径的元数据资源。等价关系是指元数据资源之间语义上相同或相近的关系。图5B示出了具有等价关系的元数据资源的示例。如图所示,类型为BusinessTerm、名称为Account的元数据资源R1和类型为BusinessTerm、名称为Banking的元数据资源R2具有hasSynonym关系,而hasSynonym关系是一种等价关系,因此元数据资源R1 and R2具有等价关系,当样,当用户使用关键字“banking”进行搜索时,R2作为结果被返回,同时R1也作为结果被返回,因为R1具有与R2的等价关系。包含关系是指元数据资源之间语义上的包含关系,例如图5A中类型为BusinessCategory、名称为Accounting的元数据资源R1与类型为BusinessTerm、名称为Account的元数据资源R2之间的关系是包含关系,这样,当用户使用关键字“account”进行搜索时,R2作为结果被返回,同时R1也作为结果被返回,因为R1具有与R2的包含关系。*查询类型三,用于搜索具有类型约束的直接相关的元数据资源,即其中搜索查询指定了一组关键字以及元数据资源类型,用于搜索其文本片段包含所指定的一组关键字且其类型为所指定类型的元数据资源。
该查询类型的示例性语法可以是“T:K”,其中K为一组关键字,T为元数据资源的类型。相应的语义为:返回其文本片段包含所指定的一组关键字K、且其类型为所指定的类型T的元数据资源。
例如,针对图5A中所示的一组示例性元数据资源,如果输入的搜索查询为“BusinessTerm:credit”,则返回的搜索结果为空。这是因为不存在其文本片段包含关键字credit、而其类型为BusinessTerm的元数据资源。
*查询类型四,用于搜索具有类型约束的间接相关的元数据资源,即其中搜索查询指定了一组关键字以及元数据资源类型,用于搜索这样的元数据资源,所述元数据资源的类型为所指定类型且具有到其文本片段包含所指定的一组关键字的元数据资源的关系路径。
该查询类型的示例性语法可以是“T K”,其中K为一组关键字,T为元数据资源的类型。相应的语义为:返回这些样的元数据资源,所述元数据资源的类型为指定的类型K,且具有到其文本片段包含所指定的一组关键字K的元数据资源的关系路径,
例如,针对图5A中所示的一组示例性元数据资源,如果输入的搜索查询为“BusinessTerm credit”,则返回的搜索结果为R2。这是因为元数据资源R2的类型为BusinessTerm,同时R2具有到R3的关系路径R2classifyR3,而R3的属性label的文本片段中包含关键字credit。
根据本发明的另一实施例,该查询类型四用于搜索如下几类元数据资源:类型为指定类型且其文本片段中包含所指定的一组关键字的元数据资源S,类型为指定类型且具有到S中的任何一个元数据资源的直接关系路径的元数据资源S’,类型为指定类型且具有到S’中的任何一个元数据资源的包括等价关系或包含关系的关系路径的元数据资源。
*查询类型五,用于搜索具有某种关系的相关的元数据资源,即其中搜索查询指定了第一组关键字、第二组关键字以及关系,用于获得第一元数据资源,所述第一元数据资源具有到第二元数据资源的关系路径且该关系路径包含所指定的关系,所述第一元数据资源包含第一组关键字或具有到包含第一组关键字的元数据资源的关系路径,所述第二元数据资源包含第二组关键字或具有到包含第二组关键字的元数据资源的关系路径。
该查询类型的示例性语法可以是“A R A’”,其中A=:K|K|T:K|TK,A’=:K’|K’|T’:K’|T’K’,K和K’分别为一组关键字,T和T’分别为元数据资源的类型,R为元数据资源之间的关系。相应的语义为:返回由A指定的元数据资源,该元数据资源具有到由A’指定的元数据资源的关系路径,且该关系路径包含指定的关系R,其中A和A’以如上查询类型一、二、三、四中的方式指定元数据资源。
例如,针对图5A中所示的一组示例性元数据资源,如果输入的搜索查询为“Service:credit implement InterfaceOperation:credit”,则返回的搜索结果为R3。这是因为元数据资源R3的类型为指定的Service,其label属性的文本片段中包含了指定的credit,数据资源R4的类型为指定类型InterfaceOperation,其label属性的文本片段中包含了指定的credit,并且R3具有到R4的路径R3 implement R4,且该路径包含了指定的关系implement。
以上示出了根据本发明的实施例的系统能够支持的五种查询类型。应指出的是,在本发明的其他实施例中,该系统也可以只支持这五种查询类型的一部分,例如只支持查询类型二、四、五中的一个或多个以及查询类型一、三中的零个、一个或两个。
返回图4,根据本发明的实施例,所述输出模块403还用于显示搜索结果,所述搜索结果包括响应于所述搜索查询所返回的元数据资源或其部分(例如包含搜索查询中指定的关键字的文本片段,或具有到包含搜索查询中指定的关键字的元数据资源的关系路径的元数据资源中的某个文本片段)和/或到所述元数据资源的链接,以及响应于所述搜索查询所返回的元数据资源与包含所述搜索查询中指定的关键字的元数据资源之间的关系路径或用于在被点击时显示所述关系路径的链接。所述关系路径的信息可以告知用户为什么特定元数据资源作为结果被返回,从而使用户可以迅速确定该特定元数据资源是否是所需要的。
图6示出了响应于输入关键字credit所返回的搜索结果的示例。其中,Accounting|Metadata Web WBGRepository为元数据资源的名称及其所在的储存库,http://wbg.dyn.webahead.abc.com/resource/2008/wbg/category/Accounting为该元数据资源的网络地址,Relationship为到关系路径信息的链接,点击该链接将显示下面的关系路径信息,其中显示了所返回的名称为Accounting的元数据资源R1到其属性label的文本片段中包含搜索查询中指定的关键字的元数据资源R3的关系路径。
根据本发明的实施例,该系统中包括的输出模块402还可以可选地被配置用于对搜索结果中响应于搜索查询所返回的元数据资源进行排序,且所述排序是根据基于关键字匹配的度量以及基于所获得的元数据资源与包含搜索查询中指定的关键字的元数据资源之间的路径的度量进行的。也就是说,对搜索结果中返回的多个元数据资源的排序综合了文本匹配度量和结构匹配度量。在文本匹配度量方面,可利用现有的web搜索引擎中提供的基于关键字匹配的度量。在结构匹配度量方面,可利用下述假设:由较短的路径相连的两个元数据资源比由较长的路径相连的两个元数据资源更为相关。因此,仅作为示例,排序可按如下公式进行:
m=αmt+β|n|
其中,mt是通过基于关键字的匹配计算的;|n|是从作为搜索结果返回的元数据资源到其文本片段中包含搜索查询中指定的关键字的元数据资源的路径中的步数;α和β是用于调整这两个度量的权重的系数。这样,排序后的搜索结果既反映了作为搜索结果返回的元数据资源与搜索查询中指定的关键字之间的文本匹配程度,又反映了作为搜索结果返回的元数据资源与搜索查询中指定的关键字之间的结构匹配程度,从而可以为用户提供更有用和更相关的信息。
返回图4,根据本发明的实施例,该系统还包括可选的索引器403,其用于对所述多个元数据资源进行索引,以生成关于所述多个元数据资源中的文本的文本索引以及存储了所述多个元数据资源中的元数据资源对之间的关系路径的信息的结构索引;且其中,所述查询处理器402还可以可选地被配置用于通过使用所述文本索引以及所述结构索引来处理所述搜索查询,并生成搜索结果。当然,在本发明的其他一些实施例中,该系统可以不包括索引器403,且所述查询处理器402可通过直接搜索元数据资源来处理所述搜索查询,并生成搜索结果。
索引器403可以使用元数据资源以及这些元数据资源所遵循的元模型来生成关于这些元数据资源的文本索引和结构索引。所述元模型可以是元数据资源所在的储存库所采用的本领域中所知的任何元模型。仅作为示例,索引器403可以首先使用元数据资源以及元模型来产生关于反映这些元数据资源及其之间的关系的元数据图(如图3所例示的),并由该元数据图来产生所述文本索引和结构索引。所述元数据图例如可以是RDF格式的。使用元数据资源和元模型产生元数据图的方法是本领域中公知的。当然,索引器403也可以直接由元数据资源以及元模型生成所述文本索引和结构索引。
根据本发明进一步的实施例,所述文本索引存储了多个元数据资源中的文本片段或其部分与相应的元数据资源以及所述文本片段在相应的元数据资源中所属的属性之间的映射。根据本发明的更进一步的实施例,所述文本索引还存储了元数据资源的类型信息。
为了生成所述文本索引,可以首先识别其中每一个元数据资源中的文本片段。然后,可以利用信息检索(IR)中使用的经典的反相索引结构来构建文本索引。Lucene是一个基于文档、域(例如,标题、正文等)和项的概念的著名的基于IR的索引引擎。仅作为示例,本发明的系统中的索引器403可以利用Lucene来生成所述文本索引。这样,元数据资源可被视为文档;文本片段所属的属性,例如BusinessTerm的longDescription,Service的label等,可以被视为域;而这种属性的值,即文本片段本身,可以被视为项。此外,元数据资源的类型也可以被视为域,以便在文本索引中存储元数据资源的类型信息。当然,以上所述用于生成元数据资源的文本索引的具体方法仅为示例,而不是对本发明的限制。本发明的系统中的索引器403可以使用本领域中已知的或未来开发的任何方法来生成元数据资源的文本索引。
图7示出了本发明的系统中的索引器403根据如图5A中所示的示例性元数据资源生成的文本索引的示例。如图所示,该文本索引存储了元数据资源中的文本片段中的关键字,例如“accounting”、“account”“credit”等,与相应的元数据资源R1、R2、R3及相应的属性name、label等之间的映射,还存储了元数据资源R3、R4等的诸如“service”、“interfaceOperaiotn”等类型信息(类型可视为一种属性,即type属性)。这样,利用该文本索引,就可以通过所输入的搜索查询中的关键字,例如“credit”等,方便地找到包含该关键字的元数据资源R3、R4及相应的属性,例如label等。如该图所示的,在文本索引中既可以存储某个属性的整个文本片段作为关键字,例如,“service”、“interfaceOperaiotn”、“businessTerm”、“businessCategory”“accounting”和“account”,也可以存储某个属性的文本片段的部分作为关键字,例如。“credit”、“process”和“status”。因此,可选地,在将元数据资源中的文本片段或某中的关键字存储到文本索引之前,可以首先使用本领域中已知的任何分词方法将所述文本片段划分为部分,作为关键字。
根据本发明的实施例,所述结构索引是由两级散列表实现的,且第一级散列表中的条目是作为关系路径的终节点的元数据资源的标识,而第二级散列表中的条目是作为关系路径的起始节点的元数据资源的标识以及所述关系路径的信息。例如,对于给定的关系路径r1p1r2p2...rn,其中ri表示元数据资源,pj表示元数据资源之间的关系,i=1...n,j=1...n-1,rn被存储在散列表的第一级,而r1被存储在散列表的第二级对应于rn的条目中,且关系路径r1p1r2p2...rn被存储在r1的条目中。
根据本发明的一个实施例,在结构索引中存储了一组元数据资源中任何一对元数据资源之间的路径,包括所有直接路径和间接路径。图8示出了根据本发明的该实施例根据图5A所示的示例性元数据资源生成的结构索引的示例。如图所示,根据该结构索引,可以很容易地获得到达任何一个元数据资源例如R4的所有关系路径,例如,R3 implement R4,R2 classifyR3 implement R4,R1 contains R2 classify R3 implement R4
为了减少结构索引中存储的关系路径的数量,而只保留那些最相关的关系路径,根据本发明的进一步的实施例,在结构索引中存储的关系路径包括以下三类:
*元数据资源对之间的直接关系路径。直接关系路径表示作为该直接关系路径的起始节点和终节点的元数据资源之间具有直接的关系。这种直接关系路径可以直接从元数据图中获得,因为它们就是元数据图中的边。
*元数据资源对之间的包括等价关系的关系路径。这种路径指示了一组等价的元数据资源,且是可传递的,例如,类型为businessTerm且具有hasSynonym的一组元数据资源之间的等价关系。仅作为示例,用户可以通过在元模型的级别上提供注释来指示等价关系,例如,在WebSphereBusiness Glossary储存库的元模型中,用户可以指示属性hasSynonym表示等价关系。这样,索引器403将索引所有具有hasSynonym属性的路径。
*元数据资源对之间的包括包含关系的关系路径,这种关系路径指示了元数据资源之间的包含关系,且是可传递的。例如,一个类型为businessCategory的元数据资源包含一个类型为businessTerm的元数据资源。考虑到元模型通常是由UML模型表示的,并且UML模型中的组合关系和聚集关系具有包含关系的语义,默认地,可以从元模型中提取这些关系作为包含关系。此外,还可以允许用户在元模型级别上对包含关系进行定制。
图9示出了根据本发明的该另一实施例根据图5A所示的示例性元数据资源生成的结构索引的示例。如图中所示,在该结构索引中首先存储了根据元模型获得的从R3到R4、从R2到R3、以及从R1到R2的直接关系路径,其次还存储了在图中以阴影表示的根据元模型获得的从R1到R2的包含关系路径。
在本发明的系统中,所述查询处理器402使用上述索引结构来处理搜索查询的方法可以如下所述:
*对于查询类型一,例如“:K”,使用文本索引通过关键字K来寻找相应的元数据资源。
*对于查询类型二,例如“T:K”,使用类型信息进一步过滤掉那些不属于类型T的元数据资源。
*对于查询类型三(根据本发明的所述进一步的实施例),例如“K”,首先,使用文本索引通过关键字K来寻找相应的元数据资源,记为S。其次,对于S中的每个条目,使用结构索引来寻找所有与其直接相关的元数据资源,记为S’。最后,对于S’中的每个条目,使用结构索引来寻找所有具有等价或包含关系的元数据资源。
例如,针对如图7所示的文本索引示例以及如图9所示的结构索引的示例,如果发出的搜索查询为“credit”,则索引结果为R1、R2、R3、R4,其中R3和R4是直接包含关键字credit的元数据资源,而R2具有到R3的直接关系,R1具有到R2的包含关系。
*对于查询类型四,例如“T K”,进一步使用类型信息来过滤掉不属于类型T的元数据资源。
*对于查询类型五,首先使用文本索引或者文本索引和结构索引两者来寻找由A和A’表示的元数据资源。其次,使用结构索引过滤掉这样的由A表示的元数据资源,该元数据资源到由A’表示的元数据资源的路径不包含关系R。
以上描述了根据本发明的实施例的用于实现元数据搜索的系统,应指出的是,以上描述仅为示例性说明,而不是对本发明的限制。根据本发明的其他实施例,该系统可具有更多、更少或不同的模块,各模块的功能或各模块之间的关系可以与所描述和图示的不同,某些模块可划分为更小的模块或合并为更大的模块,某些模块的某些功能也可以由其他模块执行,等等。例如,在本发明的一些实施例中,该系统可以包括上述可选模块中的一个或多个。又例如,所述查询处理器402可进一步包括一个用于对搜索查询进行分析的查询分析器,以及一个根据查询分析器的分析结果对元数据资源进行搜索的搜索引擎。再例如,在以上描述中由输出模块403执行的排序功能也可以由查询处理器402来完成。此外,以上描述的根据本发明的实施例的索引结构仅为示例,而不是对本发明的限制。在根据本发明的其他实施例的系统中可以采用其他的索引结构或其他的数据结构来实现基于关键字的搜索和模糊结构搜索,等等。所有这些变化都处于本发明的范围之内。
下面描述根据本发明的实施例的用于实现元数据搜索的方法。该方法可以由根据本发明的实施例的用于实现元数据搜索的系统来执行,也可以由任何其他系统或装置来执行。为简明起见,在以下描述中省略了与以上描述的内容重复的部分细节,因此请参照以上描述获得对根据本发明的实施例的用于实现元数据搜索的方法的更详细的理解。
图10示出了根据本发明的实施例的用于实现元数据搜索的方法。如图所示,该方法包括如下步骤:
在步骤1002,接收针对多个元数据资源的搜索查询,其中所述搜索查询中指定了元数据资源中的文本信息,而没有指定元数据资源之间的结构信息,或者仅指定了元数据资源之间的部分结构信息。
在步骤1003,分析所述搜索查询,并根据对所述搜索查询的分析搜索相关的元数据资源以及所述相关的元数据资源之间的结构信息,从而形成搜索结果,其中所述搜索结果中包含了所述相关的元数据资源之间的完整的结构信息。
在步骤1004,输出所述搜索结果,从而实现了针对所述多个元数据资源的模糊结构搜索。
根据本发明的实施例,该方法还包括可选步骤1001,在该步骤中对所述多个元数据资源进行索引,以生成关于所述多个元数据资源中的文本的文本索引以及存储了所述多个元数据资源中的元数据资源对之间的关系路径的信息的结构索引;且其中,所述搜索查询,并生成搜索结果是通过使用所述文本索引以及所述结构索引执行的。
根据本发明的实施例,所述文本索引存储了所述多个元数据资源中的文本片段与相应的元数据资源以及所述文本片段在相应的元数据资源中所属的属性之间的映射,还存储了所述元数据资源的类型信息。
根据本发明的实施例,所述结构索引是由两级散列表实现的,且第一级散列表中的条目是作为所述关系路径的终节点的元数据资源的标识,而第二级散列表中的条目是作为所述关系路径的起始节点的元数据资源的标识以及所述关系路径的信息。
根据本发明的实施例,所述关系路径包括:元数据资源对之间的直接关系路径;元数据资源对之间的包括等价关系的间接关系路径;以及元数据资源对之间的包括包含关系的间接关系路径。
根据本发明的实施例,所述搜索查询的类型为包含以下任何一个或多个类型的组中的一个:
查询类型一,其中搜索查询指定了一组关键字,用于获得其文本片段包含所指定的一组关键字的元数据资源;
查询类型二,其中搜索查询指定了一组关键字,用于获得这样的元数据资源,所述元数据资源具有到其文本片段包含所指定的一组关键字的元数据资源的关系路径;
查询类型三,其中搜索查询指定了一组关键字以及元数据资源类型,用于获得其文本片段包含所指定的一组关键字且其类型为所指定类型的元数据资源;
查询类型四,其中搜索查询指定了一组关键字以及元数据资源类型,用于获得这样的元数据资源,所述元数据资源的类型为所指定类型且具有到其文本片段包含所指定的一组关键字的元数据资源的关系路径;以及
查询类型五,其中搜索查询指定了第一组关键字、第二组关键字以及关系,用于获得第一元数据资源,所述第一元数据资源具有到第二元数据资源的关系路径且该关系路径包含所指定的关系,所述第一元数据资源包含第一组关键字或具有到包含第一组关键字的元数据资源的关系路径,所述第二元数据资源包含第二组关键字或具有到包含第二组关键字的元数据资源的关系路径。
根据本发明的实施例,在所述步骤1004中,还可以可选地对所述搜索结果中响应于所述搜索查询所获得的元数据资源进行排序,且所述排序是根据基于关键字匹配的度量以及基于所获得的元数据资源与包含搜索查询中指定的关键字的元数据资源之间的路径的度量进行的。
根据本发明的实施例,在所述步骤1004中,还可以可选地显示所述搜索结果,包括响应于所述搜索查询所获得的元数据资源或其部分和/或到所述元数据资源的链接,以及响应于所述搜索查询所获得的元数据资源与包含所述搜索查询中指定的关键字的元数据资源之间的关系路径或用于在被点击时显示所述关系路径的链接。
以上描述了根据本发明的实施例的用于实现元数据搜索的方法,应指出的是,以上描述仅为示例性说明,而不是对本发明的限制。例如,在本发明的一些实施例中,该方法可不包括以上可选步骤中的一个或多个。
本发明可以硬件、软件、或硬件与软件的结合的方式实现。本发明可以集中的方式在一个计算机系统中实现,或以分布方式实现,在这种分布方式中,不同的部件分布在若干互连的计算机系统中。适于执行本文中描述的方法的任何计算机系统或其它装置都是合适的。一种典型的硬件和软件的组合可以是带有计算机程序的通用计算机系统,当该计算机程序被加载和执行时,控制该计算机系统而使其执行本发明的方法,并构成本发明的装置。
本发明也可体现在计算机程序产品中,该程序产品包含使能实现本文中描述的方法的所有特征,并且当其被加载到计算机系统中时,能够执行所述方法。
尽管已参照优选实施例具体示出和说明了本发明,但是本领域内的那些技术人员应理解,可在形式和细节上对其进行各种改变而不会背离本发明的精神和范围。

Claims (18)

1.一种用于实现元数据搜索的系统,包括:
接收模块,其用于接收针对多个元数据资源的搜索查询,其中所述搜索查询中指定了元数据资源中的文本信息,而没有指定元数据资源之间的结构信息,或者仅指定了元数据资源之间的部分结构信息;
查询处理器,其用于分析所述搜索查询,并根据对所述搜索查询的分析搜索相关的元数据资源以及所述相关的元数据资源之间的结构信息,从而形成搜索结果,其中所述搜索结果中包含了所述相关的元数据资源之间的完整的结构信息;以及
输出模块,其用于输出所述搜索结果,从而实现了针对所述多个元数据资源的模糊结构搜索。
2.根据权利要求1的系统,还包括:
索引器,其用于对所述多个元数据资源进行索引,以生成关于所述多个元数据资源中的文本的文本索引以及存储了所述多个元数据资源中的元数据资源对之间的关系路径的信息的结构索引;且其中,
所述查询处理器用于通过使用所述文本索引以及所述结构索引来处理所述搜索查询,并生成搜索结果。
3.根据权利要求2的系统,其中,所述文本索引存储了所述多个元数据资源中的文本片段或其部分与相应的元数据资源以及所述文本片段在相应的元数据资源中所属的属性之间的映射,还存储了所述元数据资源的类型信息。
4.根据权利要求2的系统,其中,所述结构索引是由两级散列表实现的,且第一级散列表中的条目是作为所述关系路径的终节点的元数据资源的标识,而第二级散列表中的条目是作为所述关系路径的起始节点的元数据资源的标识以及所述关系路径的信息。
5.根据权利要求2的系统,其中,所述关系路径包括:
元数据资源对之间的直接关系路径;
元数据资源对之间的包括等价关系的关系路径;以及
元数据资源对之间的包括包含关系的关系路径。
6.根据权利要求1的系统,其中,所述搜索查询的类型为包含以下任何一个或多个类型的组中的一个:
查询类型一,其中搜索查询指定了一组关键字,用于搜索其文本片段包含所指定的一组关键字的元数据资源;
查询类型二,其中搜索查询指定了一组关键字,用于搜索这样的元数据资源,所述元数据资源具有到其文本片段包含所指定的一组关键字的元数据资源的关系路径;
查询类型三,其中搜索查询指定了一组关键字以及元数据资源类型,用于搜索其文本片段包含所指定的一组关键字且其类型为所指定类型的元数据资源;
查询类型四,其中搜索查询指定了一组关键字以及元数据资源类型,用于搜索这样的元数据资源,所述元数据资源的类型为所指定类型且具有到其文本片段包含所指定的一组关键字的元数据资源的关系路径;以及
查询类型五,其中搜索查询指定了第一组关键字、第二组关键字以及关系,用于搜索第一元数据资源,所述第一元数据资源具有到第二元数据资源的关系路径且该关系路径包含所指定的关系,所述第一元数据资源包含第一组关键字或具有到包含第一组关键字的元数据资源的关系路径,所述第二元数据资源包含第二组关键字或具有到包含第二组关键字的元数据资源的关系路径。
7.根据权利要求6的系统,其中所述查询类型二用于搜索如下元数据资源:其文本片段中包含所指定的一组关键字的元数据资源S,具有到S中的任何一个元数据资源的直接关系路径的元数据资源S’,以及具有到S’中的任何一个元数据资源的包括等价关系或包含关系的关系路径的元数据资源类型;且所述查询类型四用于搜索如下元数据资源:类型为指定类型且其文本片段中包含所指定的一组关键字的元数据资源S,类型为指定类型且具有到S中的任何一个元数据资源的直接关系路径的元数据资源S’,以及类型为指定类型且具有到S’中的任何一个元数据资源的包括等价关系或包含关系的关系路径的元数据资源。
8.根据权利要求1的系统,其中,所述输出模块还用于:
显示所述搜索结果,包括响应于所述搜索查询所获得的元数据资源或其部分和/或到所述元数据资源的链接,以及响应于所述搜索查询所获得的元数据资源与包含所述搜索查询中指定的关键字的元数据资源之间的关系路径或用于在被点击时显示所述关系路径的链接。
9.根据权利要求1的系统,其中,所述输出模块还用于对所述搜索结果中响应于所述搜索查询所获得的元数据资源进行排序,且所述排序是根据基于关键字匹配的度量以及基于所获得的元数据资源与包含搜索查询中指定的关键字的元数据资源之间的路径的度量进行的。
10.一种用于实现元数据搜索的方法,包括:
接收针对多个元数据资源的搜索查询,其中所述搜索查询中指定了元数据资源中的文本信息,而没有指定元数据资源之间的结构信息,或者仅指定了元数据资源之间的部分结构信息;
分析所述搜索查询,并根据对所述搜索查询的分析搜索相关的元数据资源以及所述相关的元数据资源之间的结构信息,从而形成搜索结果,其中所述搜索结果包含了元数据资源之间的完整的结构信息;以及
输出所述搜索结果,从而实现了针对所述多个元数据资源的模糊结构搜索。
11.根据权利要求10的方法,还包括:
对所述多个元数据资源进行索引,以生成关于所述多个元数据资源中的文本的文本索引以及存储了所述多个元数据资源中的元数据资源对之间的关系路径的信息的结构索引;且其中,
所述搜索查询,并生成搜索结果是通过使用所述文本索引以及所述结构索引执行的。
12.根据权利要求11的方法,其中,所述文本索引存储了所述多个元数据资源中的文本片段与相应的元数据资源以及所述文本片段在相应的元数据资源中所属的属性之间的映射,还存储了所述元数据资源的类型信息。
13.根据权利要求11的方法,其中,所述结构索引是由两级散列表实现的,且第一级散列表中的条目是作为所述关系路径的终节点的元数据资源的标识,而第二级散列表中的条目是作为所述关系路径的起始节点的元数据资源的标识以及所述关系路径的信息。
14.根据权利要求11的方法,其中,所述关系路径包括:
元数据资源对之间的直接关系路径;
元数据资源对之间的包括等价关系的关系路径;以及
元数据资源对之间的包括包含关系的关系路径。
15.根据权利要求10的方法,其中,所述搜索查询的类型为包含以下任何一个或多个类型的组中的一个:
查询类型一,其中搜索查询指定了一组关键字,用于获得其文本片段包含所指定的一组关键字的元数据资源;
查询类型二,其中搜索查询指定了一组关键字,用于获得这样的元数据资源,所述元数据资源具有到其文本片段包含所指定的一组关键字的元数据资源的关系路径;
查询类型三,其中搜索查询指定了一组关键字以及元数据资源类型,用于获得其文本片段包含所指定的一组关键字且其类型为所指定类型的元数据资源;
查询类型四,其中搜索查询指定了一组关键字以及元数据资源类型,用于获得这样的元数据资源,所述元数据资源的类型为所指定类型且具有到其文本片段包含所指定的一组关键字的元数据资源的关系路径;以及
查询类型五,其中搜索查询指定了第一组关键字、第二组关键字以及关系,用于获得第一元数据资源,所述第一元数据资源具有到第二元数据资源的关系路径且该关系路径包含所指定的关系,所述第一元数据资源包含第一组关键字或具有到包含第一组关键字的元数据资源的关系路径,所述第二元数据资源包含第二组关键字或具有到包含第二组关键字的元数据资源的关系路径。
16.根据权利要求15的方法,其中所述查询类型二用于搜索如下元数据资源:其文本片段中包含所指定的一组关键字的元数据资源S,具有到S中的任何一个元数据资源的直接关系路径的元数据资源S’,以及具有到S’中的任何一个元数据资源的包括等价关系或包含关系的关系路径的元数据资源类型;且所述查询类型四用于搜索如下元数据资源:类型为指定类型且其文本片段中包含所指定的一组关键字的元数据资源S,类型为指定类型且具有到S中的任何一个元数据资源的直接关系路径的元数据资源S’,以及类型为指定类型且具有到S’中的任何一个元数据资源的包括等价关系或包含关系的关系路径的元数据资源。
17.根据权利要求10的方法,其中所述输出搜索结果进一步包括:
显示所述搜索结果,包括响应于所述搜索查询所获得的元数据资源或其部分和/或到所述元数据资源的链接,以及响应于所述搜索查询所获得的元数据资源与包含所述搜索查询中指定的关键字的元数据资源之间的关系路径或用于在被点击时显示所述关系路径的链接。
18.根据权利要求10的方法,其中所述输出搜索结果还包括:
对所述搜索结果中响应于所述搜索的元数据资源进行排序,且所述排序是根据基于关键字匹配的度量以及基于所获得的元数据资源与包含搜索查询中指定的关键字的元数据资源之间的路径的度量进行的。
CN2008101498131A 2008-09-27 2008-09-27 用于实现元数据搜索的系统和方法 Expired - Fee Related CN101685444B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN2008101498131A CN101685444B (zh) 2008-09-27 2008-09-27 用于实现元数据搜索的系统和方法
US12/567,213 US9275144B2 (en) 2008-09-27 2009-09-25 System and method for metadata search

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2008101498131A CN101685444B (zh) 2008-09-27 2008-09-27 用于实现元数据搜索的系统和方法

Publications (2)

Publication Number Publication Date
CN101685444A true CN101685444A (zh) 2010-03-31
CN101685444B CN101685444B (zh) 2012-05-30

Family

ID=42048608

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2008101498131A Expired - Fee Related CN101685444B (zh) 2008-09-27 2008-09-27 用于实现元数据搜索的系统和方法

Country Status (2)

Country Link
US (1) US9275144B2 (zh)
CN (1) CN101685444B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102893281A (zh) * 2010-05-14 2013-01-23 日本电气株式会社 信息搜索设备、信息搜索方法、计算机程序和数据结构
CN103593387A (zh) * 2012-08-17 2014-02-19 国际商业机器公司 在多个阶段高效地存储和检索数据和元数据的方法和系统
CN117493641A (zh) * 2024-01-02 2024-02-02 中国电子科技集团公司第二十八研究所 一种基于语义元数据的二次模糊搜索方法

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9323828B2 (en) * 2010-05-11 2016-04-26 International Business Machines Corporation Complex query handling
US9092515B2 (en) * 2010-07-02 2015-07-28 M-Files Oy Method, a computer system and a computer readable medium for querying objects by means of metadata
US9183279B2 (en) 2011-09-22 2015-11-10 International Business Machines Corporation Semantic questioning mechanism to enable analysis of information architectures
US9020920B1 (en) 2012-12-07 2015-04-28 Noble Systems Corporation Identifying information resources for contact center agents based on analytics
US9710568B2 (en) * 2013-01-29 2017-07-18 Oracle International Corporation Publishing RDF quads as relational views
US9311294B2 (en) * 2013-03-15 2016-04-12 International Business Machines Corporation Enhanced answers in DeepQA system according to user preferences
CN104424251B (zh) 2013-08-28 2019-03-15 腾讯科技(深圳)有限公司 一种多维度拆分的计算方法以及系统
US9449117B2 (en) * 2014-01-29 2016-09-20 Sap Se Metadata search based on semantics
US10394826B1 (en) * 2014-02-24 2019-08-27 Amazon Technologies, Inc. System and methods for searching query data
GB2530499A (en) * 2014-09-23 2016-03-30 Ibm Rest resource collection management
US10304007B2 (en) * 2015-12-08 2019-05-28 International Business Machines Corporation Using a plurality of heterogeneous decision engines to produce a single decision
US11755445B2 (en) * 2021-02-17 2023-09-12 Microsoft Technology Licensing, Llc Distributed virtual data tank for cross service quota management

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6546388B1 (en) 2000-01-14 2003-04-08 International Business Machines Corporation Metadata search results ranking system
US7146362B2 (en) * 2002-08-28 2006-12-05 Bpallen Technologies Llc Method and apparatus for using faceted metadata to navigate through information resources
US7228301B2 (en) 2003-06-27 2007-06-05 Microsoft Corporation Method for normalizing document metadata to improve search results using an alias relationship directory service
US20050138007A1 (en) * 2003-12-22 2005-06-23 International Business Machines Corporation Document enhancement method
US20070130112A1 (en) * 2005-06-30 2007-06-07 Intelligentek Corp. Multimedia conceptual search system and associated search method
CN100416569C (zh) * 2006-01-10 2008-09-03 西安交通大学 一种基于Web页面元数据的用户访问行为形式化描述方法
CN100442292C (zh) * 2007-03-22 2008-12-10 华中科技大学 一种语义网信息的索引与获取方法
US20080263006A1 (en) * 2007-04-20 2008-10-23 Sap Ag Concurrent searching of structured and unstructured data

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102893281A (zh) * 2010-05-14 2013-01-23 日本电气株式会社 信息搜索设备、信息搜索方法、计算机程序和数据结构
US9141727B2 (en) 2010-05-14 2015-09-22 Nec Corporation Information search device, information search method, computer program, and data structure
CN103593387A (zh) * 2012-08-17 2014-02-19 国际商业机器公司 在多个阶段高效地存储和检索数据和元数据的方法和系统
CN103593387B (zh) * 2012-08-17 2016-12-28 国际商业机器公司 在多个阶段高效地存储和检索数据和元数据的方法和系统
US9569518B2 (en) 2012-08-17 2017-02-14 International Business Machines Corporation Efficiently storing and retrieving data and metadata
CN117493641A (zh) * 2024-01-02 2024-02-02 中国电子科技集团公司第二十八研究所 一种基于语义元数据的二次模糊搜索方法
CN117493641B (zh) * 2024-01-02 2024-03-22 中国电子科技集团公司第二十八研究所 一种基于语义元数据的二次模糊搜索方法

Also Published As

Publication number Publication date
US20100106729A1 (en) 2010-04-29
US9275144B2 (en) 2016-03-01
CN101685444B (zh) 2012-05-30

Similar Documents

Publication Publication Date Title
CN101685444B (zh) 用于实现元数据搜索的系统和方法
US8230387B2 (en) System and method to organize assets in a repository
CN1310175C (zh) 搜索引擎管理系统和方法
CN1278263C (zh) 在一个或多个网络上进行通用搜索管理的系统
US7702685B2 (en) Querying social networks
EP2122490B1 (en) A method and system for integrating a social network and data repository to enable map creation
US8954469B2 (en) Query templates and labeled search tip system, methods, and techniques
US7747617B1 (en) Searching documents using a dimensional database
US8321444B2 (en) Federated search
US7539669B2 (en) Methods and systems for providing guided navigation
Li et al. A relation-based search engine in semantic web
EP0981097A1 (en) Search system and method for providing a fulltext search over web pages of world wide web servers
US20070055680A1 (en) Method and system for creating a taxonomy from business-oriented metadata content
CN101178728A (zh) 一种网址导航的方法和系统
CN102687138A (zh) 搜索建议聚类和呈现
US10810181B2 (en) Refining structured data indexes
CN102411580A (zh) 可扩展标记语言文档的检索方法及装置
CN101661490A (zh) 搜索引擎、其客户端及搜索网页的方法
Cox et al. SISSVoc: A Linked Data API for access to SKOS vocabularies
Azmeh et al. Wspab: A tool for automatic classification & selection of web services using formal concept analysis
Valentine et al. EarthCube Data Discovery Studio: A gateway into geoscience data discovery and exploration with Jupyter notebooks
Ferrández et al. A framework for enriching Data Warehouse analysis with Question Answering systems
KR20070065774A (ko) 온톨로지를 이용한 시맨틱 블로그 관리 시스템 및 방법
Daga et al. Sequential linked data: The state of affairs
KR20090072542A (ko) 다중 온톨로지를 이용한 의미형 검색시스템

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20120530