CN101057212A - 使用概念元数据和上下文元数据引擎在网络上搜索数据元素的方法 - Google Patents

使用概念元数据和上下文元数据引擎在网络上搜索数据元素的方法 Download PDF

Info

Publication number
CN101057212A
CN101057212A CNA2005800326202A CN200580032620A CN101057212A CN 101057212 A CN101057212 A CN 101057212A CN A2005800326202 A CNA2005800326202 A CN A2005800326202A CN 200580032620 A CN200580032620 A CN 200580032620A CN 101057212 A CN101057212 A CN 101057212A
Authority
CN
China
Prior art keywords
search
instance document
metadata
business report
xbrl
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA2005800326202A
Other languages
English (en)
Inventor
弗雷德里克·H·查普斯
斯蒂芬·N·霍瑞德
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
UBMATRIX Inc
Original Assignee
UBMATRIX Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by UBMATRIX Inc filed Critical UBMATRIX Inc
Publication of CN101057212A publication Critical patent/CN101057212A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/907Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Library & Information Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

一种典型的数据搜索方法,其包括:接收包括概念元数据参数和上下文元数据参数的搜索查询;定位包括上下文元数据的第一上下文元数据的第一组实例文档;基于实例文档内部的定义以及与实例文档相关的分类和扩展,过滤第一组中的每个实例文档,以识别指示搜索查询中每个参数的实例文档中的数据元素;以及显示过滤的结果(318)。

Description

使用概念元数据和上下文元数据引擎在网络上搜索数据元素的方法
本申请要求于2004年9月27号向美国专利商标局递交的美国临时申请No.60/612,871的优先权,美国临时申请No.60/612,871在此全部引入作为参考。
背景技术
网络搜索引擎上的搜索特征基于文本和超文本链接标示语言/可扩展标记语言(Hypertext Markup Language/Extensible Markup Language,HTML/XML)页中文本元素的出现。在一个实例中,使用Google搜索引擎和文本元素“Assets”、“Microsoft”、以及“2002”执行的网络搜索提供了655000个包括那些文本元素的HTML/XML页的结果。然而,如果用户希望基于该搜索结果找出2002年微软的资产是多少,用户必须开始一页接着一页地浏览所有655000页直到找到期望的信息。此外,一旦发现那些信息,用户必须通过再次键入信息或者执行复制粘贴操作而手动地提取或者转移期望的信息。因此,需要一种包括将数据元素自动化或自动地转移到用户系统的自动精确的搜索。
发明内容
一种典型的数据搜索方法,其包括:接收包括概念元数据(conceptualmetadatum)参数和上下文元数据(contextual metadata)参数的搜索查询;定位包括上下文元数据的第一上下文元数据的第一组实例文档;基于实例文档内部的定义以及与实例文档相关的分类和扩展,过滤第一组中的每个实例文档,以在实例文档中识别指示搜索查询中的每个参数的数据元素;以及显示过滤的结果。
另一种典型的数据搜索方法,其包括:接收包括表征实体的上下文元数据的指示的搜索定义;搜索所有包括表征实体的上下文元数据的可扩展商业报告语言(eXtensible Business Reporting Language,XBRL)实例文档;用在搜索中定位的但还没有处于储存库或高速缓冲存储器中的XBRL实例文档更新储存库或高速缓冲存储器;判定储存库或高速缓冲存储器中的XBRL实例文档以及相关的索引是否采用适合概念元数据索引的分类;识别储存库或高速缓冲存储器中包括搜索中识别的实体的XBRL实例文档,以生成第一组XBRL实例文档;基于搜索定义中的概念元数据元素,过滤第一组XBRL实例文档,以生成第二组XBRL实例文档;显示满足搜索定义的XBRL实例文档列表;接收用户的选择;以及基于用户的选择,显示满足搜索定义的信息。
附图说明
附图提供用于更充分地描述本文中公开的代表性实施例视觉表现,并使本领域的技术人员能够更好地理解代表性实施例及其内在的优势。附图中,相同的参考标号表示相应的元素。
图1示出了一种典型的方法;
图2示出了典型的搜索结果;
图3示出了一种典型的系统;
图4示出了一种典型的XBRL(eXtensible Business ReportingLanguage,可扩展商业报告语言)实例文档。
具体实施方式
网络搜索引擎上的搜索特征基于文本和HTML/XML页中文本元素的出现。在一个实例中,使用Google搜索引擎和文本元素“Assets”、“Microsoft”、以及“2002”而执行的搜索提供了655000个包括那些文本元素的HTML/XML页的结果。如果用户希望基于该搜索结果找出2002年微软的资产是多少,用户必须开始一页接着一页的浏览所有655000页,直到找到期望的信息。然后用户可通过再次键入信息或者执行复制粘贴操作而手动地提取或者转移期望的信息。本发明的典型实施例通过提供一种包括将数据元素自动化或自动地转移到用户系统的自动精确搜索,采用组合的概念元数据和上下文元数据在网络上搜索,减轻了用户的苦恼。UBmatrix概念和上下文元数据搜索方法的典型实施例包括概念元数据和上下文元数据搜索引擎和处理器(例如,Ubmatrix COMSEP),其可以用于所有的XML定义语言。
通过进一步的背景信息,在1998年可扩展标识语言(XML)从万维网联盟(W3C)中显现出来,成为标准化语言家族的重要一员。每个XML定义的标准化语言都是“垂直聚焦(vertically focused)”的。
可扩展商业报告语言是XML定义标准,用于分析、交流、以及报告金融和非金融信息,其已经在世界范围内为主要管理者、机构和公司所采用。
举例来说,该项服务可以在收费的基础上而被提供,从而,经授权或已知的用户或搜索者(消费者)在包括诸如UBMatrix COMSEP的搜索引擎网站上登录,接着为搜索引擎输入搜索定义以进行工作并完成。典型的搜索定义包括下列文本元素:
公司:Microsoft
数据概念:assets
时期:2002-12-31
货币:US$(In Million:Checked)
注意“Assets”是XBRL概念元数据元素,而日期“2002-12-31”、公司名称“Microsoft”、以及货币参数“US$,and in Million”是XBRL上下文元数据元素。图1示出了处理这种搜索定义以获得搜索结果的典型方法。
根据图1中示出的典型方法,第一方块102包括接收包括表征实体的上下文元数据的指示的搜索定义。可以通过图形用户界面、听觉界面、或其他的界面或界面的组合,例如响应于菜单和/或用户的查询,例如从用户接收搜索定义。在典型实施例中,搜索定义可以从用户提供或预定义的待执行的搜索列表中提取。实体(例如,实体概念元数据)可以是物理人(例如,Smith先生)或诸如公司(图4中:微软)、政府或非政府机构的任何结构实体,或者甚至是产品或诸如船、汽车、旅馆等等的对象。在典型实施例中,搜索定义包括XBRL概念或概念元素,还可包括附加的上下文元数据。举例来说,搜索定义可以包括代表实体的上下文元数据“Microsoft”、代表时间或时期的上下文元数据“2004-12-31”、以及XBRL概念“Assets”,例如具有查得相应的诸如“US$72359000000”的真实值的目标。在典型实施例中,搜索定义包括一个概念元数据。在另一典型实施例中,搜索定义包括多个概念元数据。
控制从方块102行进到方块104,其中对包括表征实体的上下文元数据的所有XBRL实例文档执行搜索。可以在网络上执行搜索,例如,整个万维网、整个互联网、任何一个网络的子网、任何网络或网络子网的组合等。可以使用任何搜索引擎。在典型实施例中,搜索可以指向还没处于搜索引擎可用的储存库或高速缓冲存储器中的XBRL实例文档(IDs),所述储存例如Ubmatrix商业报告储存库。
控制从方块104行进到方块106,其中用在搜索期间定位的并还没位于储存库或高速缓冲存储器中的XBRL实例文档更新储存库或高速缓冲存储器。在典型实施例中,储存库或高速缓冲存储器的索引,例如XBRL商业报告储存库索引,可以包括XBRL实例文档提供者的名称,例如,Microsoft、Edgar、Forbes等等。
控制从方块106行进到方块108,其中判定在储存库或高速缓冲存储器中的XBRL实例文档和相应的索引是否使用适当的概念元数据索引分类。在典型的实施例中,如果XBRL实例文档不采用合适的分类,其会被丢弃,或者标记为不合适(例如,对于当前搜索的目的),并且/或者转而使用适当的分类,例如使用美国专利No.6947947中描述的技术。在典型实施例中,在储存库或高速缓冲存储器中的其他的XBRL实例文档之前已经被验证为使用了合适的概念元数据分类的情况下,可以将判定和验证限于更新期间新增至储存库或高速缓冲存储器的XBRL实例文档。在典型实施例中,可以额外地或可选地执行其他类型的分析或验证。
控制从方块108行进到方块110,其中包括XBRL网络搜索中所识别的实体的储存库或高速缓冲存储器中的XBRL实例文档被识别,以形成第一组XBRL实例文档。其可以基于识别实体的上下文元数据,通过例如过滤或搜索储存库或高速缓冲存储器而执行,以确定例如哪个XBRL包括识别实体的上下文元数据。
控制从方块110行进至方块112,其中基于搜索定义中的概念元数据元素过滤第一组XBRL实例文档,以形成第二组XBRL实例文档。例如,可以(进一步)过滤第一组,以选择还包括搜索定义的概念元数据元素的第一组的XBRL实例文档。
控制从方块112行进到方块114,其中如果需要,基于搜索定义的任何附加的元数据,过滤第二组XBRL实例文档。举例来说,搜索定义可以包括附加的上下文元数据,因此,可以为每个附加的上下文元数据依次过滤第二组,或可以为所有附加的上下文元数据同时过滤第二组(例如,根据本领域中已知的各种搜索技术),以形成包括搜索定义的全部项或另外满足搜索定义的全部约束的下一组XBRL实例文档。例如,描述了除了实体和概念外还包括时期的方块100的实例。
控制从方块114行进到方块116,其中将满足搜索定义的XBRL实例文档列表展示给用户或其他的输出。例如该列表可以列出XBRL实例文档或XBRL实例文档的XBRL数据提供者,或者两者。在典型实施例中,该列表包括每个都具有满足搜索定义的(不同的)数据元素的XBRL实例文档(每个XBRL实例文档一个数据元素满足搜索定义,每个XBRL来自不同的提供者)。
控制从方块116行进到方块118,其中自用户接收XBRL实例文档和/或提供者的选择。还可以自用户接收对于XBRL实例文档和/或满足搜索定义的信息的具体表达形式的选择,并在下一方块中根据自用户接收的选择来显示信息。因此,XBRL搜索可以提供单个结果,例如:MicrosoftAssets@2004-12-31:US$72359 Million,如图3中的显示结果318所示的。
图3示出了用于执行图1所示的方法的典型系统。更具体地,图3示出了一个计算机或处理器302,其连接至数据存储单元304(例如,硬盘驱动器或硬盘驱动群集、一个或更多个服务器、或任何本地或移动的数据存储工具),其还连接至网络312,该网络包括万维网、因特网等等。还示出了具有样例搜索定义的计算机302的存储器314、以及显示满足搜索定义的样例结果的计算机302的显示器314。
Ubmatrix XBRL搜索系统及方法可以具有包括单个、多个、以及交叉文档搜索的多个搜索选项。此外,Ubmatrix XBRL搜索可以包括集合文档搜索,其中在搜索之前可以合并和/或处理一个或更多个文档。
用户可以有指定单个XBRL实例文档作为搜索目标的选项。他们可以将这个实例存储在本地硬盘驱动器或者较大的基于服务器的系统中,而且这个实例可以具有一个或更多个XBRL上下文。在任一种模式下,用户在开始搜索处理前预先选择具体的文档。搜索多个文档时,用户可以指定一组分别选择的文档、目录(或任何用于文档集的容器)、或储存库服务。无需考虑存储机制,用户可提供相似的搜索标准,例如,实体名称、时期、概念名称、以及可选的单元。搜索结果可以包括一个或更多个包括所期望数据的文档。
储存库或高速缓冲存储服务器可以包括简单的基于服务器的文件存储系统,该文件存储系统可以通过计算机语言例如SOAP、HTTP、或者任何其他的RMI(Remote Method Invocation,远程方法调用)技术而被任何普通计算机所访问。储存库还可以包括管理和集合服务,其试图通过网络发现并确认XBRL文档或通过公共或个人的登记/提交处理变为可用。
储存库可以扮演网络爬虫的角色,其试图发现公开的XBRL文档。计算机算法将用于判定文档的相关性和可靠性。作为增值服务,储存库可以提供核实或商业规则分析,其不仅可以使用户搜索到原始文档,也可以使用户搜索到所应用规则的结果。储存库还可以使用户上传或指向个人存储实例文档,并通过密码或其他的认证技术认证该实例文档。储存库使用各种存储技术,包括文件系统、相关数据库、或XML数据库。存储技术并不会影响储存库的功效。
现在论述关于UBMatrix XBRL搜索处理器方法的其他细节。考虑关于韩国公司“Auction”的XBRL搜索的一个实例,其中搜索定义包括公司名称“Auction”、XBRL概念元数据“Total Assets”、时间“1999-12-31”、以及货币流通“Korean Won”。如所示。
图4中示出了XBRL实例文档,一个元素(红色下划线)相应于上述的XBRL搜索元素。然而,a)上下文“Auction”(实体=上下文元数据)和“1999-12-31”(时期=上下文元数据)并没有在红色下划线的元素中直接提及:其出现在绿色下划线中的名为“context-1999”的“上下文标识”中;b)上下文“Korean Won”(单元=上下文元数据)并没有在元素中直接地提到:“Korean Won”定义为单元标识=“Units-Monetary”,其在元素中提及;以及c)概念“Assets”在XBRL实例文档中提及为“TotalAssets”(在相关分类中定义的概念元数据:korea-gaap-kosdaq)。
因此,在典型实施例中,搜索处理器评估“上下文标识”的定义,以识别其指具有值“Auction”和“1999-12-31”的实体和时期上下文元数据,并且还评估“Units-Monetary”上下文元数据,以识别其指“Korean Won”。从而,搜索处理器处理或“读取”实例文档,以判断数据元素<Korean-gaap-kosdaq:TotalAssets contextRef:=”context-1999”unitRef=”Units-Monetary”decimals=”0”>8550796007</Korean-gaap-kosdaq:TotalAssets>因为包括所有的搜索参数(或搜索参数的逻辑引用),故满足搜索请求。
在用XML语言(例如,XBRL)标准产生的实例文档中,存在(以及将要出现)其他的方法,以在上下文元数据及其在采用替换、元组等的实例文档数据元素中的其表征间产生关系。搜索处理器将能够读取和评估所有这些种类的实例文档,包括XBRL和非XBRL实例文档。在此描述的一些实施例是指XBRL。然而,在此列出的概念和原理也可以应用到非XBRL实例文档和元素(例如,其他的XML定义的语言标准)。
在典型实施例中,Ubmatrix XBRL搜索处理器(例如使用Ubmatrix技术或其他技术)具有读取XBRL实例文档的能力,包括上下文标识信息,并采用相关的分类、扩展、以及上下文(例如,其实例文档自身中的包括诸如定义的上下文信息),识别相应于XBRL搜索概念的数据元素。举例来说,使用网络链接、URL、或其他包括在实例文档中表明在哪里和可如何访问的分类和扩展等的信息,Ubmatrix XBRL搜索处理器可以自动地访问相关的分类和扩展等。Ubmatrix XBRL搜索处理器还将为XBRL实例文档建立索引。如果存在几个包括搜索概念“Assets”(例如,TotalAssets、GrossAssets、NetAssets、TotalAssets)的XBRL实例文档数据元素,XBRL搜索处理器将会给用户提供选择的相关列表。用户可以根据其需要选取适当的选项。该选择将使用SOAP(Simple Object Access Protocol,简单对象访问协议)被集成进用户遗产系统(legacy system)中。
在XBRL搜索引擎系统识别出合适的实例文档之后,Ubmatrix搜索引擎系统识别这样的实例文档的提供者并提交一份提供者的列表,该列表在此作为XBRL数据源示出。
用户接着可以选择其选择的提供者,并且最终被提示在多个“上下文”或包括其搜索的“上下文”的可能之间选择。举例来说,如果在搜索中提及Assets,用户就可以被要求在Current Assets、Non-Current Assets、GrossAssets、Net Assets、以及Total Assets间进行选择;上下文2002-12-31具有相同的情况:用户可以被提示在2002第4季度的末端或在历法年2002的末尾的结果处以及他想如何获取信息之间进行选择,在此示出了两种选择:集合的以及详细的。
在XBRL搜索服务器提供商建议的交易费用基础上、订阅费用基础上或在任何每个用户付费或固定费用基础上,还可以对用户收费以进行搜索。用户还可以被实时地告知该项XBRL搜索的花费,并且可以选择将结果自动输出至其选择的遗产系统中。在典型的实施例中,可以通过SOAP将Ubmatrix XBRL搜索服务集成进用户遗产系统中。
Ubmatrix XBRL搜索服务器引擎允许用户选择下列选项:数据源、详细或集合的信息、以及自动化输出,其中用户将有可能将XBRL数据的自动输出编程进遗产系统或其选择的诸如Microsoft Excel的应用软件中(使用例如Ubmatrix XBRL技术)。
Ubmatrix XBRL搜索引擎的典型实施例包括附加的“智能功能”。举例来说,引擎可以包括自动化货币转换器,使得如果用户从多个使用不同的货币用于其商业报告的实体中搜索几种金融数据元素,该UbmatrixXBRL搜索引擎将向用户提供将那些金融结果转换为选择的货币的可能性(使用自动化多货币互换系统)。引擎还可以执行或包括自动化语言翻译、度量系统、会计行业标准等等。
图2示出了Ubmatrix XBRL搜索选项的典型结果。
典型实施例还包括诸如网页链接的附加功能和特征,其中UbmatrixXBRL搜索引擎和处理器允许用户:a)在XBRL搜索处理期间或XBRL搜索完成之后,查看相关的网页(如果有的话);b)如果用户使用XML/XHTML搜索引擎在网络上进行搜索并达到了其正在查看的相关网页将要连接到现有的XBRL实例文档的状态,到Ubmatrix XBRL搜索引擎和处理器的链接将允许用户使用Ubmatrix XBRL搜索引擎和处理器完成用户的搜索。
典型的搜索引擎和处理器可以包括统计功能或能力,例如可以分析属于诸如公司(图4中的微软)、政府或非政府机构的“实体”的商业报告数据元素。统计数据元素可以涉及行为领域,或者甚至是产品或对象(船、汽车、旅馆等等)。统计数据是来自多个源的集合数据,并经常以片段和非标准的形式呈现:统计局、协会、政府机构等惯于采用非标准形式和片段提供统计数据。统计查询的一个实施例是:“世界上超过30英尺长的帆船的数目?”,几个国家的统计局可以提供非标准和不一致的数据元素,例如:美国普查局可以提供东海岸和北美五大湖上的超过30英尺长的帆船数;法国帆船生产协会可以提供欧洲大于10米的帆船的数量。当这样的统计数据被转换成XBRL并可用于网络时,Ubmatrix XBRL统计搜索引擎和处理器允许使用下列典型处理进行自动统计数据搜集:a)行为领域(例如制药行业、旅游行业等)或产品(例如,船、汽车、旅馆等)的选择;b)如需要对每个具体统计查询的相关产品或行为领域的“上下文”的选择;c)附加的查询信息:例如,长度30英尺(见上述统计查询:世界上超过30英尺长的帆船的数目?)
Ubmatrix XBRL SSE(Statistical Search Engine,统计搜索引擎)还可以处理用于商业报告数据元素的Ubmatrix XBRL搜索,不过是通过Ubmatrix XBRL统计数据储存库处理的。Ubmatrix XBRL统计数据储存库使用Ubmatrix XBRL商业报告储存库中的数据,通过集合商业报告数据元素生成统计数据。Ubmatrix XBRL SSE还在XBRL搜索期间提供多个选项(包括但不排它):一个或更多个统计源的选择;多个结果的集合,使用将要读取和分析所有相关XBRL实例文档的XBRL搜索处理器;以及来自片段信息的可选的“推断”会允许诸如从来自一个或几个区域的可用数目中评估全球的数量(推断可以基于任何标准,如:人口、总产量等)。Ubmatrix COMSEP可以适用于所有的XML定义的语言。
如本文中所使用,源数据是数据项的集合,其可以在可读存储或传输介质、文件、或流数据的任何类型中被提供为计算机程序的输入,其可包括个别项。该个别项可以包括或包含诸如可识别的单一事实(recognizablesingle fact)或商业度量。源数据的实施例包括:电子数据表或数据库表、从数据库表中提取的数据的查询结果、用逗号分开的变量文件、XML或HTML文件或流数据、从计算机输出至一个或更多个显示屏的数据流、存储器、硬盘驱动器、CD ROM驱动、软盘驱动器、打印机、或其他的设备的数据流、以及Microdoft Word文档中的数据表。
如本文中所使用,元数据是关于如下数据的数据,例如定义或特征化数据(例如,通过对源数据项进行分类)的数据。元数据可以包括描述特征,诸如名称、尺寸、属性、数字或字符串限定、条件、选择等等,的文档或信息。元数据可以包括或表示与数据的关系或数据间的相互关系,并且元数据可以是多维的。分类元数据通常以诸如图表、数据模式、分类、或字典的形式呈现给计算机程序。上下文元数据可以说明被描述的数据项的信息,例如,报告时期、数据项描述的实体(商业、政府部门、个体等)、以及报告情况;度量元数据(measurement metadata)可以说明数据项的度量单位(英尺或米,美元或日元)。相互关系元数据(interrelationshipmetadata)(可以认为是上下文元数据的一种形式)可以将同一雇员的诸如姓名、地址、部门号的数据项组织或分组在一起。注脚元数据(footnotemetadata)可以使多个数据项与相同的注脚引用相互关联,可以被认为是上下文元数据的一种形式。
在典型实施例中,搜索引擎在一个或更多个实例文档(用XML定义的语言标准产生的,例如XBRL实例文档)中查找一个或更多个实例文档数据元素。其中每个被定位的实例文档数据元素包括所有的搜索参数(概念和上下文元数据)和/或直接或间接地引用这样的搜索参数。参见本文中描述的“Auction”的实施例。
一种典型的方法包括:接收包括(但不限于)概念元数据和上下文元数据的搜索查询;定位第一组包括一个或更多个上下文元数据(例如,最精确地缩小初始搜索的具体的元数据)的实例文档;基于一个或更多个实例文档内部的定义、与实例文档相关的分类或扩展,过滤第一组中的实例文档以识别包括搜索查询中的每个参数或引用其的数据元素;以及显示过滤结果。
各种用于提供本文描述的功能的软件包、元件或模块都可以在计算机上实现。可以以网络外部分布的方式采用例如分布式的计算机资源,附加地或可选地执行那些运行在计算机上的软件,和/或可以采用网络资源执行。
本文中描述的方法、逻辑、技术以及伪代码序列都可以以各种编程类型(例如,结构化编程、面向对象编程等等)和各种不同的编程语言(例如,Java、C、C++、C#、Pascal、Ada等等)来实现。此外,本领域的技术人员应该理解,本文中描述的元素和方法、或过程可以通过微处理器、计算机、或任何其他的计算设备得以实现,这些元素和方法、或过程还可以在硬件和/或软件中实现,在单个物理本地的或以分布方式在各种本地或主计算平台中。可以在硬件和/或软件或任何期望或适当的本地计算机程序中执行代理。本领域的技术人员还应该理解,软件或计算机程序可以被存储在机器可读介质中,其中软件或计算机程序包括用于使诸如计算机、计算机系统、微处理器、或其他计算设备的计算设备执行该方法或处理的指令。
机器可读介质可以包括用于使计算设备执行本文中描述的方法和/或技术的软件或计算机程序或程序。
本领域的技术人员还应该理解,本发明可以在不背离其精神或本质特征的其他具体形式中实施,并且本发明并不限于本文中描述的具体的实施例。因此认为目前公开的实施例是说明性的而不是限制性的。由后述的权利要求而不是之前的描述来表明本发明的范围,并且在其含义和范围及其等同物内的所有改变应该包含于其中。本文中使用的术语“包括”是开放的而不是排外的。

Claims (7)

1.一种数据搜索方法,其包括:
接收包括概念元数据参数和上下文元数据参数的搜索查询;
定位包括所述上下文元数据的第一上下文元数据的第一组实例文档;
基于所述实例文档内部的定义以及与所述实例文档相关的分类或扩展,过滤所述第一组中的每个实例文档,以识别所述实例文档中指示所述搜索查询中每个参数的数据元素;以及
显示所述过滤的结果。
2.根据权利要求1所述的方法,其中,所述实例文档为可扩展商业报告语言实例文档。
3.根据权利要求1所述的方法,其中,所述定位包括在因特网上搜索所述实例文档。
4.一种数据搜索的典型方法,其包括:
接收包括表征实体的上下文元数据的指示的搜索定义;
搜索包括表征所述实体的所述上下文元数据的所有可扩展商业报告语言实例文档;
用在所述搜索中定位的但还没处于储存库或高速缓冲存储器中的可扩展商业报告语言实例文档更新所述储存库或高速缓冲存储器;
判定所述储存库或高速缓冲存储器中的可扩展商业报告语言实例文档以及相关的索引是否采用适合所述概念元数据索引的分类;
识别包括在所述搜索中所识别的所述实体的所述储存库或高速缓冲存储器中的可扩展商业报告语言实例文档,以生成第一组可扩展商业报告语言实例文档;
基于所述搜索定义中的所述概念元数据元素,过滤所述第一组可扩展商业报告语言实例文档,以生成第二组可扩展商业报告语言实例文档;
显示满足所述搜索定义的可扩展商业报告语言实例文档列表;
接收用户的选择;以及
基于所述用户的选择,显示满足所述搜索定义的信息。
5.根据权利要求4所述的方法,其中,所述搜索包括在因特网上搜索可扩展商业报告语言实例文件。
6.根据权利要求4所述的方法,其包括:
基于所述搜索定义的附加的元数据,过滤所述第二组可扩展商业报告语言实例文档。
7.一种机器可读介质,包括计算机程序,用于引起计算机执行以下步骤:
接收包括表征实体的上下文元数据的指示的搜索定义;
搜索包括表征所述实体的所述上下文元数据的所有可扩展商业报告语言实例文档;
用在所述搜索中定位的但还没有处于储存库或高速缓冲存储器中的可扩展商业报告语言实例文档更新所述储存库或高速缓冲存储器;
判定所述储存库或高速缓冲存储器中的可扩展商业报告语言实例文档以及相关的索引是否采用适合所述概念元数据索引的分类;
识别包括所述搜索中所识别的所述实体的所述储存库或高速缓冲存储器中的可扩展商业报告语言实例文档,以生成第一组可扩展商业报告语言实例文档;
基于所述搜索定义中的所述概念元数据元素,过滤所述第一组可扩展商业报告语言实例文档,以生成第二组可扩展商业报告语言实例文档;
显示满足所述搜索定义的可扩展商业报告语言实例文档列表;
接收用户的选择;以及
基于所述用户的选择,显示满足所述搜索定义的信息。
CNA2005800326202A 2004-09-27 2005-09-27 使用概念元数据和上下文元数据引擎在网络上搜索数据元素的方法 Pending CN101057212A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US61287104P 2004-09-27 2004-09-27
US60/612,871 2004-09-27

Publications (1)

Publication Number Publication Date
CN101057212A true CN101057212A (zh) 2007-10-17

Family

ID=36119540

Family Applications (1)

Application Number Title Priority Date Filing Date
CNA2005800326202A Pending CN101057212A (zh) 2004-09-27 2005-09-27 使用概念元数据和上下文元数据引擎在网络上搜索数据元素的方法

Country Status (6)

Country Link
US (1) US20080147601A1 (zh)
EP (1) EP1805596A4 (zh)
JP (1) JP2008515061A (zh)
KR (1) KR20070058684A (zh)
CN (1) CN101057212A (zh)
WO (1) WO2006036972A2 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102360367A (zh) * 2011-09-29 2012-02-22 广州中浩控制技术有限公司 一种xbrl数据搜索方法及搜索引擎
CN107403333A (zh) * 2009-09-08 2017-11-28 启创互联公司 使用消费者提供的上下文同步消息传送

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7917841B2 (en) * 2005-08-29 2011-03-29 Edgar Online, Inc. System and method for rendering data
US7877678B2 (en) * 2005-08-29 2011-01-25 Edgar Online, Inc. System and method for rendering of financial data
US20080059511A1 (en) * 2006-08-30 2008-03-06 Nathan Summers Dynamic Information Retrieval System for XML-Compliant Data
US8156154B2 (en) 2007-02-05 2012-04-10 Microsoft Corporation Techniques to manage a taxonomy system for heterogeneous resource domain
US20080243823A1 (en) * 2007-03-28 2008-10-02 Elumindata, Inc. System and method for automatically generating information within an eletronic document
US8719287B2 (en) 2007-08-31 2014-05-06 Business Objects Software Limited Apparatus and method for dynamically selecting componentized executable instructions at run time
US9189478B2 (en) * 2008-04-03 2015-11-17 Elumindata, Inc. System and method for collecting data from an electronic document and storing the data in a dynamically organized data structure
FI127113B (fi) * 2008-06-17 2017-11-15 Tekla Corp Tiedon haku
US20100023501A1 (en) * 2008-07-22 2010-01-28 Elumindata, Inc. System and method for automatically selecting a data source for providing data related to a query
US8176042B2 (en) * 2008-07-22 2012-05-08 Elumindata, Inc. System and method for automatically linking data sources for providing data related to a query
US9135352B2 (en) * 2010-06-03 2015-09-15 Cisco Technology, Inc. System and method for providing targeted advertising through traffic analysis in a network environment
US8849843B1 (en) 2012-06-18 2014-09-30 Ez-XBRL Solutions, Inc. System and method for facilitating associating semantic labels with content
US9135327B1 (en) 2012-08-30 2015-09-15 Ez-XBRL Solutions, Inc. System and method to facilitate the association of structured content in a structured document with unstructured content in an unstructured document
US8601367B1 (en) * 2013-02-15 2013-12-03 WebFilings LLC Systems and methods for generating filing documents in a visual presentation context with XBRL barcode authentication
JP6841322B2 (ja) 2017-04-06 2021-03-10 富士通株式会社 インデックス生成プログラム、インデックス生成装置、インデックス生成方法、検索プログラム、検索装置および検索方法

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6513036B2 (en) * 1999-08-13 2003-01-28 Mindpass A/S Method and apparatus for searching and presenting search result from one or more information sources based on context representations selected from the group of other users
US6651058B1 (en) * 1999-11-15 2003-11-18 International Business Machines Corporation System and method of automatic discovery of terms in a document that are relevant to a given target topic
US20020087416A1 (en) * 2000-04-24 2002-07-04 Knutson Roger C. System and method for providing learning material
US6947947B2 (en) * 2001-08-17 2005-09-20 Universal Business Matrix Llc Method for adding metadata to data
US7206778B2 (en) * 2001-12-17 2007-04-17 Knova Software Inc. Text search ordered along one or more dimensions
US7567953B2 (en) * 2002-03-01 2009-07-28 Business Objects Americas System and method for retrieving and organizing information from disparate computer network information sources
US20030220917A1 (en) * 2002-04-03 2003-11-27 Max Copperman Contextual search
JP2003316765A (ja) * 2002-04-23 2003-11-07 Hitachi Ltd 階層化文書マッピング装置
US6944612B2 (en) * 2002-11-13 2005-09-13 Xerox Corporation Structured contextual clustering method and system in a federated search engine
US20040193596A1 (en) * 2003-02-21 2004-09-30 Rudy Defelice Multiparameter indexing and searching for documents

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107403333A (zh) * 2009-09-08 2017-11-28 启创互联公司 使用消费者提供的上下文同步消息传送
CN102360367A (zh) * 2011-09-29 2012-02-22 广州中浩控制技术有限公司 一种xbrl数据搜索方法及搜索引擎

Also Published As

Publication number Publication date
EP1805596A2 (en) 2007-07-11
KR20070058684A (ko) 2007-06-08
EP1805596A4 (en) 2007-11-28
JP2008515061A (ja) 2008-05-08
WO2006036972A2 (en) 2006-04-06
US20080147601A1 (en) 2008-06-19
WO2006036972A3 (en) 2006-06-08

Similar Documents

Publication Publication Date Title
CN101057212A (zh) 使用概念元数据和上下文元数据引擎在网络上搜索数据元素的方法
US10832212B2 (en) Systems and methods for managing documents for law firms
US20020042784A1 (en) System and method for automatically searching and analyzing intellectual property-related materials
US6704723B1 (en) Method and system for providing business intelligence information over a computer network via extensible markup language
US6708166B1 (en) Method and apparatus for storing data as objects, constructing customized data retrieval and data processing requests, and performing householding queries
US7664732B2 (en) Method of managing websites registered in search engine and a system thereof
JP5536851B2 (ja) 情報のシンボルによるリンクとインテリジェントな分類を行う方法及びシステム
US20080235567A1 (en) Intelligent form filler
US8495073B2 (en) Methods and systems for categorizing and indexing human-readable data
US9244956B2 (en) Recommending data enrichments
US20090094327A1 (en) Method and apparatus for mapping a site on a wide area network
Dener Financial management information systems and open budget data: do governments report on where the money goes?
US20100185651A1 (en) Retrieving and displaying information from an unstructured electronic document collection
Oliveira et al. Open government data portals analysis: the Brazilian case
WO1997045800A1 (en) Querying heterogeneous data sources distributed over a network using context interchange and data extraction
TW201108007A (en) Semantic trading floor
US9141665B1 (en) Optimizing search system resource usage and performance using multiple query processing systems
EP1485849A2 (en) Method, software application and system for incorporating benchmarks into a business software application
KR20000054312A (ko) 맞춤 웹정보 구축 제공 방법
CN113806661A (zh) 网站信息无障碍检测工具
Albertsen The paradigma web harvesting environment
Lim et al. Integration of Wikipedia and a geography digital library
Zou et al. User feedback-based refinement for web services retrieval using multiple instance learning
Brändli et al. Customer investigation process at Credit Suisse: meeting the rising demand of regulators
WO2003021481A2 (en) Information classification system

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1105234

Country of ref document: HK

C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication
REG Reference to a national code

Ref country code: HK

Ref legal event code: WD

Ref document number: 1105234

Country of ref document: HK