CN1783124A - 基于电子邮件的语义网协作和注释 - Google Patents

基于电子邮件的语义网协作和注释 Download PDF

Info

Publication number
CN1783124A
CN1783124A CNA2005101141633A CN200510114163A CN1783124A CN 1783124 A CN1783124 A CN 1783124A CN A2005101141633 A CNA2005101141633 A CN A2005101141633A CN 200510114163 A CN200510114163 A CN 200510114163A CN 1783124 A CN1783124 A CN 1783124A
Authority
CN
China
Prior art keywords
semantic net
electronic information
attribute
relation
semantic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA2005101141633A
Other languages
English (en)
Inventor
约迪·A.·阿尔伯诺兹
肖恩·J.·马丁
贝加明·H.·斯泽克里
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of CN1783124A publication Critical patent/CN1783124A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • G06Q10/107Computer-aided management of electronic mailing [e-mailing]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/958Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/08Network architectures or network communication protocols for network security for authentication of entities
    • H04L63/0853Network architectures or network communication protocols for network security for authentication of entities using an additional device, e.g. smartcard, SIM or a different communication terminal
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99932Access augmentation or optimizing
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99941Database schema or data structure
    • Y10S707/99943Generating database or data structure, e.g. via user interface

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Strategic Management (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Tourism & Hospitality (AREA)
  • Quality & Reliability (AREA)
  • Operations Research (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • Information Transfer Between Computers (AREA)
  • Machine Translation (AREA)

Abstract

通过电子消息如电子邮件消息发送语义网属性。按照预定方案由程序代理从消息中提取属性。提取的属性被保存在存储器中,其中,存储器可选用注释存储器。

Description

基于电子邮件的语义网协作和注释
技术领域
本发明涉及计算机软件系统。更具体地说,本发明涉及通过电子消息传递分发语义网(Semantic Web)属性。
背景技术
语义网提供了一个允许跨越应用、企业以及团体的边界,共享或重新使用数据的通用构架。这是一个由W3C领导,有大量研究者和工业伙伴参与的协作成果。它基于资源描述框架(Resource DescriptionFramework,RDF),RDF集成了将XML用作语法,将URI用于命名的各种应用程序。这里将关于RDF的包括在“www.w3.org/TR/1999/REC-rdf-syntax-19990222”找到的“资源描述框架(RDF)模型和语法规范”;在“www.w3.org/TR/1999/PR-rdf-schema-19990303”的“资源描述框架(RDF)大纲规范”;以及在“www.w3.org/TR/rdf-syntax-grammar”的“RDF/XML语法规范(修订版)”的信息全部引用为参考。
“语义网是其中对信息给出了清楚定义的含义的当前网的扩展,使计算机和人能够更好地协调工作”-Tim Berners-Lee,JamesHendler,Ora Lassila,语义网,科学美国,2001年5月。关于语义网的更多信息可以在万维网上W3C技术与社会文献“Semantic Web”处找到,位于www.w3.or/2001/sw,引用到本文中作为参考。
如果由代理312生成的元数据必须被永久存储,则最好使用中央RDF元数据存储器。在示范实施例中,将HEWLETT-PACKARDDEVELOPMENT COMPANY的JENA框架用作这种存储器。JENA可以在万维网上,在“www.hp1.hp.com/semweb/jena.htm”处下载。
Jena是一个用于编写Semantic Web应用程序的Java框架。从2.0版本起,它有了它自己的,具有所有细节和在线文件的网站:
Jena概述:
Jena是一个用于写Semantic Web应用程序的Java框架。其特征为:
*RDF API
*用于将RDF模型作为一组RDF三元组(triple)进行操作的语句中心方法(statement centric method)
*用于将RDF模型作为一组具有某些特性的资源进行操作的资源中心方法(resource centric method)
*用于更方便的编程的级联方法
*被建立以支持RDF容器-包、可选对象和序列(bag,alt,seq)
*增强型资源-能够扩展资源的性能的应用程序
*用于RDF/XML(ARP)、N3以及N-TRIPLES的集成分析器(parser)和写入器
*支持打印文字
*ARP-Jena的RDF/XML分析器-ARP的目标在于要充分符合RDF核心工作组的最新决定。在发行时,Jena 2.0版本符合编辑工作草案(Editor’s Working Drafts)。一般可以通过Jena的读操作来调用ARP,但也可以单独使用ARP。
持久性:
Jena2持久性子系统对Jena模型类型(Model class)实施扩展,通过使用后端数据库引擎对模型提供持久性。除了某些数据库配置选项以外,Jena2在很大程度上对Jena1应用程序向后兼容。默认的Jena2数据库格式(layout)使用非规范化方案,其中,将文字和资源URI直接存储在语句表格中。这与将所有文字和资源存储在由语句引用的公共表格中的Jena1不同。因此,Jena2格式使得能够更快地进行插入和检取,但比Jena1使用了更多的存储器。为了减少存储消耗,配置选项可以给Jena2用户对非规范化程度的某些控制。
持久性子系统支持用于RDQL查询的快速通路(Fastpath)能力,RDQL查询动态地生成SQL查询,以便在SQL数据库引擎内尽可能多地进行RDQL查询。目前,Jena2使用三个SQL数据库引擎,即,MySQL、Oracle和PostgreSQL。这些数据库被支持在Linux和WindowsXP上。对于Jena1,持久性子系统被设计为可移植到其它SQL数据库引擎。
推理子系统:
Jena2推理机(reasoner)子系统包括基于通用规则的推导引擎连同经过配置的用于RDFS和用于OWL Full的OWL/Lite子集的规则组。这些推理机可以被用于构成推导模型,其示出了由经过推理的数据带来的RDF语句。这个子系统被设计为可扩展的,因而它应该可以将一套外部推理机插入Jena,不过完成这个任务的例子还有待将来发表。
在这些部件中,基础的规则引擎以及RDFS配置应该合理地稳定。OWL配置只是初步的并且仍然在开发中。
本体(ontology)子系统:
Jena2本体API用来对利用本体数据基于RDF进行工作的程序员进行支持。具体地说,这表示支持OWL、DAML+OIL和RDFS。一组Java抽象概念对普通的RDF资源和特性类型进行扩展,以利用上述语言和类型与特性之间的关系更直接地对在本体中找到的类型和特性表达进行建模。本体API与推理子系统密切协作,获得另外的信息,这些另外的信息可以从特定的本体源推导出。假定本体专家(ontologist)一般将本体模块化为个别的、可重复使用的组件,并且将这些组件发布在网上,则Jena2本体子系统也包括文档管理器,用于帮助对引进的本体文档进行管理。
RDQL查询语言:
RDQL是用于RDF数据的查询语言。在Jena中的实施被耦合到关系数据库存储器,从而对在Jena关系持久存储器中保存的数据进行最优化查询。
上述定义为与语义网有关的本发明提供了基础,但是,为了对本发明进行描述,还需要技术上的精确概括和附加的定义。在语义网的上下文中,页面是包含对其它文档或数据的链接的任何文档或数据项。具体地说,页面不局限于作为万维网中的一般页面的HTML文档。一般在RDF中定义页面之间的链接,但并非总是如此。此外,由于这些链接具有特定的含义或类型,因此这些链接是语义关系。例如,“...的作者”是这样一种关系,其可以用于将作者的页面链接到包含某些出版物的页面。语义网还支持关于页面的另外的语义元数据。例如,页面中的某个字段如“版权日期”可能本身就是表示版权日期的标准方式,而不是仅仅是标有“版权日期”的字段。
本发明解决了两个问题。第一个问题是如何从电子消息中提取知识以便对工作流进行流水线化。当前,电子邮件大量用于各种机构的日常工作流中。若干种特殊类型的电子邮件已经被用于加快工作流。例如,特殊的日程安排电子邮件(calendaring email)客户将在会议参加者之间自动协商空闲时间。本发明使这个想法通用化,从而允许根据已知的条件和关系,从任何电子邮件中提取知识。
第二个问题是如何推广具有有价值的页面和链接的语义网。必须将语义信息例如具有实际的已知含义的字段填满。为了使语义网取得成功,这是在创作web内容的过程中必须采取的一个额外步骤。通过提供用于通过电子邮件提供这个元数据的自动方法,本发明有助于克服对于采用语义网来说的一个很大的障碍。
发明内容
本发明的一个目的是通过电子消息发送语义网属性,由此,客户端系统的用户在电子消息中插入语义网属性和语义网关系,以便通过网络向语义网代理发送电子消息。
本发明的另一个目的是通过执行以下步骤生成语义网关系:接收电子消息;将电子消息送往语义网代理,电子消息包括一个或多个语义网属性以及一个或多个语义网数据关系;从电子消息中提取所述一个或多个语义网属性的第一属性以及所述一个或多个语义网关系的第一数据关系;并且将所述第一属性和所述第一数据关系保存在可搜索存储器中。
本发明的另一个目的是提供包括通过因特网接收的电子邮件或通过因特网接收的即时消息中的任何一个的电子消息。
本发明的另一个目的是提供具有语义网属性和包括RDF的关系的电子消息。
本发明的另一个目的是提供作为注释存储器的可搜索数据库。
本发明的另一个目的是提供作为关键词分析或自然语言分析中的任何一个的提取步骤。
本发明的另一个目的是提供作为以下步骤中的任何一个步骤的提取步骤:从电子消息中寻找表示感兴趣的信息的预定句法模式;对预定的文献格式如在电子消息中的XML或RDF进行分析(parse);或者对电子消息进行自然语言分析(analysis)。
本发明的另一个目的是将第一属性和第一数据关系附加到可搜索存储器中的预定属性和关系上。
本发明的另一个目的是当出现以下任何一种情况时,将电子消息送往语义网代理:接收的电子消息包括语义网代理的通信地址或者语义网代理的语义网ID中的任何一个;接收的电子消息包括语义网代理的电子身份,身份位于电子消息的“CC”(Carbon Copy,抄送)部分;利用包括SMTP/POP3协议或者SMTP/POP3服务器中的任何一个的消息交换设施接收电子消息;或者电子客户发送电子消息包括对语义网代理的直接通信。
本发明的另一个目的是进行如下步骤:从可搜索存储器中检取语义网属性和语义网关系,属性和关系包括第一属性和第一关系;按照语义网关系和属性,对检取的语义网属性和语义网关系进行解释;并且向用户呈现经过解释的语义网属性和语义网关系,其中,呈现的语义网属性和语义网关系包括以下各项中的任何一项:项目(project)报告,对话概要;概括的项目数据;概括的包括引用的项目数据;概括的包括语义关系的项目数据;或者浏览与语义网有关的相互连接的网项(web item)的性能。
本发明的另一个目的是进行如下步骤:在客户端计算机,将一个或多个语义网属性中的第一属性以及一个或多个语义网关系中的第一数据关系插入电子消息;并且通过网络将电子消息发送到所述语义网代理,所述电子消息包括插入的第一属性和插入的第一数据关系。
本发明的另一个目的是进行如下步骤,即,使授权信息与第一属性或第一关系中的任何一个联系起来,其中,基于系统配置信息或者包括在电子消息中的明确指令中的任何一个,将授权信息联系起来。
通过本发明的技术,实现另外的特性和优点。这里将对本发明的其它实施例和方面进行详细描述,并且将这些认为是声明了权利要求的本发明的一部分。为了更好地理解具有优点和特性的本发明,参照详细说明和附图。
附图说明
在本说明书的结束部分的权利要求中,具体指出并且清楚地声明了被视作本发明的主题。根据结合附图进行的详细描述,将清楚本发明的上述以及其他目的、特性和优点,其中:
图1示出了计算机系统的现有技术的部件;
图2示出了计算机系统的现有技术的网络;
图3示出了本发明的示范性组成部分的流程图;
图4示出了本发明的电子邮件分析器的例子;并且
图5A-5C示出了本发明的实施例的示范图。
通过参照附图进行举例,对本发明的优选实施例及其优点和特性进行了解释。
具体实施方式
图1示出了其中可以实现本发明的代表性的工作站或服务器的硬件系统。图1的系统100包括代表性的计算机系统101,如包括可选外围设备的个人计算机、工作站或服务器等。工作站101包括一个或多个处理器106以及用于按照已知技术在处理器106与系统101的其它部件之间进行连接并且使得能够进行通信的总线。总线将处理器106连接到存储器105和长期存储器107,例如,长期存储器107可以包括硬盘驱动器、软盘驱动器或磁带驱动器等。系统101还可以包括用户接口适配器,用户接口适配器通过总线将微处理器106连接到一个或多个接口设备,如键盘104、鼠标103、打印机/扫描仪110和/或可以是其他任何用户接口设备的其他接口设备,如触摸屏、数字化输入板等。总线还通过显示适配器将显示设备102如LCD屏或监视器等连接到微处理器106。
系统101可以通过能够与网络109通信的网络适配器与其他计算机或计算机网络进行通信。示范性的网络适配器是通信信道、令牌环、以太网或调解解调器等。或者,工作站101可以利用无线接口如CDPD(cellular digital packet data,蜂窝状数字式分组数据)卡进行通信。工作站101可以在局域网(LAN)或广域网(WAN)中与其他计算机联系起来,或者,工作站101可以是与另一台计算机构成的客户端/服务器结构中的客户端等。在本领域中,所有这些配置以及适当的通信硬件和软件是已知的。
图2示出了其中可以实施本发明的数据处理网络200。数据处理网络200可以包括多个单独的网络,如无线网络和有线网络,每种网络可以包括多个单独的工作站101。此外,本领域技术人员应该明白,可以包括一个或多个LAN,而每个LAN可以包括耦合到主处理器的智能工作站。
仍然参照图2,网络还可以包括主计算机或服务器,如网关计算机(客户端服务器206)或应用服务器(可以访问数据资料库(repository)的远程服务器208)。网关计算机206作为每个网络207的进入点。当将一个网络协议与另一个网络协议连接时,需要网关。最好,可以通过通信链路将网关206耦合到另一个网络(例如,因特网207)。也可以通过通信链路将网关206直接耦合到一个或多个工作站101。可以利用能够从IBM买到的IBM eServer zServer 900服务器来实现网关计算机。
一般由系统101的处理器106从长期存储介质107如CD-ROM驱动器或硬盘驱动器访问体现本发明的软件程序码。软件程序码可以体现在与数据处理系统一起使用的,各种已知的介质中的任何一种上,如软盘、硬盘驱动器或CD-ROM。代码可以被分布在这样的介质上,或者,可以通过网络,从一个计算机系统的存储器向其他计算机系统分发,以便由其他系统的用户使用。
或者,程序码111可以包含在存储器105中,并且由处理器106利用处理器总线进行访问。这样的程序码包括对各个计算机部件的功能和相互作用进行控制的操作系统以及一个或多个应用程序。通常,将程序代码从密集存储介质107复制(page)到可以由处理器106进行处理的高速存储器105。用于在存储器中、在物理介质上包含软件程序码,和/或用于通过网络分发软件代码的技术和方法是众所周知的,并且,将不在这里进行进一步讨论。
在优选实施例中,本发明被实施为一个或多个软件程序111。本发明的软件可以在用户的工作站上,作为当请求时调入的一个或多个模块或者应用程序111(也称为编码子程序或面向对象的程序中的“对象”)运行。或者,软件可以在网络中的服务器上或能够执行实现本发明的程序代码的任何设备中运行。在不脱离这里所披露的本发明的概念的情况下,对本发明的逻辑实现可以集成在应用程序的代码中,或者,可以将其实现为由该应用程序调用的一个或多个单独的实用模块。可以在Web环境中执行应用程序111,此时,Web服务器响应来自通过因特网连接的客户的请求,提供服务。在另一个实施例中,在公司内联网或外联网中,或者在任何其他网络环境中,执行应用程序。关于环境的配置包括客户端/服务器网络、对等网络(其中,客户端通过执行客户端和服务器两种功能,直接进行互动)以及多层(multi-tier)环境。在本领域中,这些环境和配置是众所周知的。
本发明提供了语义关系,即,例如使包含在用户任务中的部件和动作体(actor)联系起来的元数据的自动生成的网。汇集的元数据可以被查询和浏览,使得本发明能够用作对用户完成的工作以及不同的工作和不同的用户如何相关的有组织的记录。本发明使用了电子对话和交换如电子邮件来将语义元数据发送到语义元数据应用程序或数据库。
在图3中,示出了将数据插入语义元数据存储器(store)的处理。电子邮件示出了由用户采取的处理没有被修改。仍然照常发送和接收电子邮件。电子邮件合成器(composer)客户端301支持用于接收用户信息(如文本或文件附件)并且对其进行打包以便发送302到目标地址303的应用程序,其中,使其对人或自动的(程序代理)客户端305来说可用304。最好,电子邮件分析器程序代理307也通过与电子邮件客户端301的直接通信306或通过308负责通过因特网路由消息的SMTP服务器303,接收电子邮件。分析器307的结果是一组最好包括RDF语句的语义关系。这些结果被存储309在语义元数据存储器310中,然后,可以利用各种客户机对其进行浏览。
图4示出了电子邮件分析器401的更优选的功能。分析器401可以通过包括承担接收者401的角色等许多手段接收电子邮件,其中,分析器具有网络中的可寻址ID或者与具有这个ID的服务器有关,分析器具有提交前端402的直接作用(可能作为插件或通过API),或者,分析器按照预定计划对所有电子邮件传输进行监控。分析器400对内容进行分析404,以确定用于该消息的合适的分析方法。例如,可以选择使用自然语言分析器405,以提取语义元数据,或者,可能有已经嵌入消息406中的语义元数据,可能作为RDF。另外,它可以识别用户作为直接包括元数据的简单方式输入的特殊语义模式407。也可以使用这些方法的组合。然后,将分析的结果组合在元数据文档408中,为向语义元数据存储器发送做好准备。
表格1:
1 TO:Joe Manager
2 CC:miner@example.com
3 From:Bob Scientist
4 Subject:Temperature on Cell Proliferation Results
5 Hi Joe,
6 The results of the experiment look very promising.Theremight be a treatment lead here sinee temperature affectscancer proliferation atlevels that remain safe for healthycells.Note the fate at 99 degrees.Here is my experimentsummary:
7 Project:Cancer Cell Proliferation(urn:lsid:example.com:projects:ccp)
8 Experiment:Effect of Temperature on Proliferation Rate(urn:lsid:example.com:experiment:temperature)
9 References:
10 urn:lsid:pubmed.org:articles:234443
11 urn:lsid:pubmed.org:articles:776543
12 urn:lsid:pubmed.org:articles:999983
13 Hypothesis:
14 Higher temperatures will lower the cancer cell proliferationrate due to enzyme deactivation.
15 Methods:
16 Assay 13(urn:lsid:mylab.com:assay:13)
17 Proliferation rate from series of images using JEdit(urn:ncbi.org:algorithms:jedit122)
18 Data:
19 urn:lsid:mylab.com:data imgl2.GIFf
20 urn:lsid:mylab.com:data imgl3.GIFf
21 Results:
22 Proliferation Rate vs.Temperature Chart(urn:lsid:mylab.com:data:ratechart.GIF)
23 Proliferation Data Calculation(urn:lsid:mylab.com:data:ratedata.xls)
表格1示出了由电子邮件分析器截取的示范电子邮件。
注意,电子邮件是抄送到‘miner@example.com’(表格1,第2行)。这是一个假想地址,用于将电子邮件发送到作为在假想的生命科学公司’My Lab’中实施的本发明(程序代理)的实施方案中。然后,代理(分析器代理)将对这个电子邮件进行搜索,查找不同信息之间的关系,如实验(表格1,第8行)与引用(表格1,第9-12行)之间的关系,或者,查找繁殖率图(表格1,第22行)与用于到达该图的原始数据(表格1,第18-20行)之间的关系。用于搜索电子邮件的系统可以像查找关键词那样简单,并且可以是(本例采用的)预定的、规则的格式,或者,如高级自然语言分析技术那样复杂,或者,是用于提取这些关系的简单和复杂方法的组合。本发明将对电子邮件进行分析,建立数据组合之间的关系图,并且将这个图与已经根据以前的电子邮件得到的语义关系的任何当前的图一起存储。这样,在系统中建立数据的‘语义网’,这有利于协作,并且,基本上减轻了项目管理者起通信中枢的作用的负担,使他能够将注意力集中在对其他项目的评估和指导上。
在本发明的一个实施例中,程序代理将建立语义数据,并且,将这个数据附加到当前的语义数据资料库(repository)中。当接收到描述实验的电子邮件时,对电子邮件进行分析,寻找已知的规则的模式。例如利用关键词,寻找短语‘项目’、‘实验’、‘引用’、‘假定’、‘方法’、‘数据’以及‘结果’等。当在电子邮件中发现这些标题中的一个时,通过画出跟在标题后面的,直到发现另一个标题或到达电子邮件的结尾为止的一组线,建立关系以捕捉实验的那个方面。
代理利用已知的语义谓语列表建立关系,如‘做实验(HasExperiment)’和‘产生结果(YieldsResults)’。例如,谓语‘做实验’将实验与项目联系起来。相似地,‘产生结果’关系将实验与其产生的结果数据联系起来。在实施例中,代理对信息进行分析,寻找被括号包围的特殊标识符。如果提到了一个,则利用它来识别项目或实验,而不是人可读的名称。由于这样的标识符为唯一的,因此,这样做更有效。当使用标识符时,还结合了人可读标签(human readable label),以便于使用‘具有标签’关系。以下示出了由这样的示范实施例生成的关系的样本:
表格2:
1 urn:lsid:example.com:projects:ccp HasExperimenturn:lsid:example.com:experiment:temperature
2 urn:lsid:example.com:projects:ccp HasLabel″Cancer CellProliferation″
3 urn:lsid:example.com:experiment:temperature HasLabel″Effect of Temperature on Proliferation Rate″
4 urn:lsid:example.com:experlment:temperature HasReferenceurn:lsid:pubmed.org:articles:234443
5 urn:lsid:example.com:experiment:temperature HasReferenceurn:lsid:pubmed.org:articles:776543
6 urn:lsid:example.com:experiment:temperature HasReferenceurn:lsid:pubmed.org:articles:999983
7 urn:lsid:example.com:experiment:temperatuze HasMethodsurn:lsid:mylab.com:assay:13
8 urn:lsid:mylab.com:assay:13 HasLabel″Assay 13″
9 urn:lsid:example.com:experiment:temperature HasDataurn:lsid:mylab,com:data:imgl2.GIFf
10 urn:lsid:example.com:experiment:temperature HasDataurn:lsid:mylab.com:data:imgl3.GIFf
11 urn:lsid:example.com:experiment:temperature HasResultsurn:lsid:mylab.com:data:ratechart.GIF
12 urn:lsid:mylab.com:data:ratechart.GIF HasLabel″Proliferation Rate vs.Temperature Chart″
以简化的资源描述框架(RDF)格式示出了从表格2所示的电子邮件中提取的关系的样本网(sample web)。每行(例如,行11)包含一个三元组(triple),使得第一项为关系的主语(urn:lsid:example.com:experiment:
temperature),第二项为关系的谓语(HasResults),第三项为关系的宾语(urn:lsid:mylab.com:data:ratechart.GIF)。当代理提取该信息时,则它准备好将该信息并入包含了过去收集的所有关系的完整的语义数据存储系统。最好,语义元数据存储器(store)为‘Jena’RDF数据库。Jena数据库插入机制将提取由代理生成的关系并将它们放在数据库中。一旦它们处在数据库中,则可以由其它系统和应用程序如正以提供的形式呈现数据的语义网的用户接口使用查询语言。
例如,由于语义网是在进行许多如上面的例子的通信时,根据运用本发明而逐渐建立的,因此,相关的数据变得更容易被发现。例如,设想某人也曾利用如上述例子的表格2的Assay(化验)13进行过实验,并且,曾经引用相同论文中的一篇。在这样的情况下,当浏览存储在本发明中的关系时,链接变得显而易见。当研究者从他的实验浏览输出(out bound)链接时,将发现对“Assay 13”的链接,进而发现链接到“Assay 13”的其它实验。因此,研究者会更容易发现项目管理者可能还不知道的相似的研究。
另一个优点在于,对这些关系的存储捕捉了实验的上下文。对在语义上与项目相关的项进行浏览时,人们可以方便地跟踪关系的网,由此更容易进行浏览,以发现有关的数据、项目或实验。
表格1是电子邮件的一个例子,这个电子邮件可以被自然语言处理405和基于已知的本体的语法分析407处理,此外,可以由分析器解析出包含在文献中的URI,并由此从它们中直接得到元数据,以便在其分析中使用。在该例中,URI为生命科学标识(Life ScienceIdentifier,LSID),LSID被对象管理组织(Object Management Group,OMG)定义为能够容纳丰富的语义元数据的生命科学数据的标准标识。给出一个用于某个数据的LSID,软件系统就可以从任何位置找到与该数据有关的元数据。这个元数据是包含该数据与其它数据之间的语义链接和关系的最常见的RDF。可以在以下网址找到LSID标准:www.omg.org/cgi-bin/doc?dtc/04-05-01,来自Object ManagementGroup,Inc.“Life Sciences Identifiers Final adopted specification-dtc/04-05-01”。
LSID标准的开放源代码由IBM维护并且可以在以下网址下载:
www-124.ibm.com/developerworks/oss/lsid/
图5A-5C示出了可能的互动用户界面视图501,它利用了收集到本发明的元数据存储器中的元数据。图5A示出了示范视图501。图5B示出了具有为了清晰而展开的窗口520、523和511的视图501。图5C示出了具有为了清晰而展开的活动实验窗口502的视图501。附图示出了可以怎样探索已经捕捉过的关系,以捕捉新的思想。附图示出了由进行关于癌细胞迁移速度的研究的研究者进行的实验的简要视图502。实验被链接到多个期刊论文,这些论文示出了关于细胞倍增时间的其它结果,并且具有对实验中使用的数据源的链接。这些链接被显示在相关链接520部分中:PubMed 521。在右侧511上的注释为关于细胞繁殖的在论文中的位置。可以从癌症研究者队伍中的电子邮件通信中提取所有这些数据。本发明有利于通过提取、存储和提供语义关系来建立这样的界面。这一点说明了本发明的一个非常重要的方面。由于可以在全球范围对资料库进行查询,因此意味着资料库存储了来自不同人的许多对话的语义元数据,并且,资料库可以使从一个对话提取的数据与从其它对话提取的数据相关,该系统具有提供了为用户发现信息的独特优点。
例如,设想在上述的图5中的研究者在对他的项目进行研究和讨论时看到了他曾经引用过的论文。语义元数据存储器知道也曾经引用过这些论文中的每篇论文的其他所有人。然后,研究者可以通过跟踪在RDF存储器中的向后链路(backlink),或者进行RDF RDQL搜索,跟踪也曾经引用过与他曾经引用过的论文相同的论文的人的轨迹。在进行这些工作的过程中,研究者可以获悉正在进行相似工作的项目并且看到该项目的结果。对于从电子邮件对话中自动提取知识的语义网来说,这是一个关键的优点。假设通过电子邮件进行协作的情况很普遍,则本发明的优点在于研究者对关于如何完成他的工作只需进行很少改变或不改变。
本系统的一个实施例包含语义电子邮件分析器和语义元数据存储器,使得对电子邮件分析器服务器给出一个电子邮件地址,并且当用户需要经过分析的电子邮件时,他们可以将该地址放在电子邮件的CC栏中。在优选实施例中的语义元数据存储器(store)是一个RDF数据库系统,如可免费获得的用于Java的Jena语义网框架(在URL:jena.sourceforge.net找到的)和用于存储RDF数据的IBM DB2数据库。
RDF是资源描述格式,一种由万维网联盟(W3C)定义的标准数据模型,在RDF中,以“三元组(triple)”的形式表示数据。一个三元组包括三个组成RDF语句的项:主语、谓语和宾语。RDF数据可以是通用资源标识符(URI)或者是文字值。例如,描述一个人的年龄的RDF语句可以为:“urn:JohnDoe urn:HasAge 23”。这不是任何特殊的RDF句法。它仅用于说明性的目的。存在许多RDF数据的句法和系列,如由W3C定义的XML系列。在示范语句中,主语,即John Doe,被描述为URI,以唯一地识别John Doe。谓语,即“Has Age”,指定主语与宾语之间的关系。宾语,即“23”,是本例中的文字值。
利用RDF,语义元数据存储是非常灵活的,因为可以零散地增加新的关系,以便将更多的元数据加到当前的对象中。一般的关系数据库存储难以具有这样的灵活性。给关系数据库加上新的列和表格不是要成为一个通用的任务。另外,RDF还提供了非常有力的查询能力。此外,RDF允许从数据进行推导,主要是自动推导没有明确存储的关系。例如,如果元数据存储包括语句:“JohnDoe hasBrother Bill”和“JohnDoe hasSister Amy”,则RDF语义元数据存储可以根据假想的“hasBrother”谓语推导出语句“Bill hasSister Amy”。
RDF的这些特性使得本系统能够方便地建立对通过正在进行观察的电子邮件交换实现的工作进行记录。图3中的电子邮件会将许多RDF语句放在该存储器中,并且由此允许研究者浏览RDF关系图作为他们已经做过的工作的日志。他们可以挑选一个项目并且跟踪适当的谓语,以查看他们在进行关于该项目的工作中引用的论文。更重要的是,通过查询和可能的自动推导,他们可以对图进行进一步的跟踪,并且获悉如“哪些其它项目引用过这篇论文?”或者“谁还引用过这篇使用共焦距显微镜的论文?”。
可以利用Jena框架以及可用于Java或其它语言或系统的工具箱,建立用于进行这样的浏览和查询的用户界面。用于呈现图形的工具如免费可用的GraphViz(http://www.research.att.com/sw/tools/graphviz)以及用于浏览语义元数据的用户界面工具如实验的Haystack项目(haystack.lcs.mit.edu/)可以被用于提供一个丰富的界面。为了每次将系统配置得更好地适合特殊团队的需要,可以对用户界面解释的特定谓语和围绕这些谓语的推导规则进行专用化。另外,存在标准的谓语资料库,即,本体,并且应该加以利用。由W3C建立的OWL Web Ontology Language可以被用来指定用于电子邮件分析器以及查询和推导引擎的这些本体。
电子邮件分析器能够利用各种方法来提取语义元数据。一个简单的方法是寻找预定的句法模式,如表格2所示。在分析器的配置中,可以将这些模式与特定的OWL本体联系起来,并且,系统可以根据本体格式化数据并将其放入语义元数据存储器中。电子邮件分析器还可以利用更高级的自然语言提取装置。在研究文献中,已经对其中的很多进行了描述。最好,分析器应该使用其中调用多个提取机制的流水线方法,有可能包括RDF的文字插入,其可能由知道该系统的用户的智能电子邮件客户端直接放在电子邮件中。
在使用本发明的过程中的一个重要的考虑是安全和隐私。本发明留下了用于将特别访问权加在提取的关系上的空间,使得浏览语义元数据的人不会遇到作者想将秘密或隐私只留给选择的用户组的信息。每个配置的安全或隐私要求不同,并且,一般可以通过配置,在语义数据库层面上对安全进行操控。在一个实施例中,被解释的电子邮件本身可以包含关于对包含在其中的信息的访问权的指令。
本发明的性能可以在软件、固件、硬件或它们的某些组合中实施。
作为一个例子,本发明的一个或多个方面可以包括在具有,例如,计算机可用介质的制造品中(例如,一个或多个计算机程序产品)。例如,在介质中已经体现了用于提供和促进本发明的性能的计算机可读程序代码装置。可以将该制造品包括为计算机系统的一部分或单独出售。
或者,可以提供至少一个机器可读的程序存储设备,这个程序存储设备有形地包含了至少一个机器可执行指令程序,以实现本发明的性能。
这里画出的流程图只是一些例子。在不脱离本发明的精神的情况下,可以对这些图或其中所描述的步骤(或操作)进行许多改变。例如,可以按照不同的顺序执行这些步骤,或者,可以添加、删除或修改这些步骤。所有这些变化被认为是声明了权利要求的本发明的一部分。
尽管这里已经示出和描述了本发明的优选实施例,但应该理解,本发明不限于这里所披露的具体框架,并且,在如所附权利要求限定的本发明的范围内,“保留”了对所有改变和修改的权利。

Claims (33)

1.一种方法,用于生成语义网关系,该方法包括如下步骤:
接收电子消息;
将电子消息送往语义网代理,所述电子消息包括一个或多个语义网属性以及一个或多个语义网数据关系;
从电子消息中提取所述一个或多个语义网属性中的第一属性以及所述一个或多个语义网关系中的第一数据关系;并且
将所述第一属性和所述第一数据关系保存在可搜索存储器中。
2.如权利要求1所述的方法,其中,所述电子消息包括通过因特网接收的电子邮件或通过因特网接收的即时消息中的任何一个。
3.如权利要求1所述的方法,其中,所述属性和关系包括RDF。
4.如权利要求1所述的方法,其中,所述可搜索数据库包括注释存储器。
5.如权利要求1所述的方法,其中,所述提取步骤包括关键词分析或自然语言分析中的任何一个。
6.如权利要求1所述的方法,其中,所述提取步骤还包括以下步骤中的任何一个:
在所述电子消息中搜索表示感兴趣的信息的预定义的句法模式;
对预定义的文档格式如所述电子消息中的XML或RDF进行分析;或者
对所述电子消息进行自然语言分析。
7.如权利要求1所述的方法,其中,所述第一属性和第一数据关系被附加到所述可搜索存储器中的预定属性和关系上。
8.如权利要求1所述的方法,其中,当出现以下任何一种情况时,将所述电子消息送往语义网代理:
接收的电子消息包括语义网代理的消息地址或者语义网代理的语义网ID中的任何一个;
接收的电子消息包括语义网代理的电子身份,所述身份位于所述电子消息的“CC”(抄送)部分;
利用包括SMTP/POP3协议或者SMTP/POP3服务器中的任何一个的消息交换基础设施接收所述电子消息;或者
发送所述电子消息的电子消息客户端包括对所述语义网代理的直接通信。
9.如权利要求1所述的方法,还包括如下步骤:
从所述可搜索存储器中检取语义网属性和语义网关系,所述属性和关系包括所述第一属性和所述第一关系;
按照语义网关系和语义网属性,对检取的语义网属性和语义网关系进行解释;并且
向用户呈现经过解释的语义网关系和语义网属性,其中,呈现的语义网关系和语义网属性包括以下各项中的任何一项:
项目报告,对话概要;
概括的项目数据;
包括引用的概括的项目数据;
包括语义关系的概括的项目数据;或者
与语义网相关的相互连接的网项的浏览性能。
10.如权利要求1所述的方法,还包括如下步骤:
在客户端计算机,将一个或多个语义网属性中的第一属性以及一个或多个语义网关系中的第一数据关系插入所述电子消息;并且
通过网络将所述电子消息发送到所述语义网代理,所述电子消息包括所述插入的第一属性和所述插入的第一数据关系。
11.如权利要求1所述的方法,还包括使授权信息与所述第一属性或所述第一关系中的任何一个相联系的步骤,其中,基于系统配置信息或者包括在所述电子消息中的明确指令中的任何一个,联系授权信息。
12.一种计算机程序产品,用于生成语义网关系,所述计算机程序产品包括:
存储介质,可由处理电路读取,并存储由所述处理电路执行的指令,用于进行包括如下步骤的方法:
接收电子消息;
将电子消息送往语义网代理,所述电子消息包括一个或多个语义网属性以及一个或多个语义网数据关系;
从电子消息中提取所述一个或多个语义网属性中的第一属性以及所述一个或多个语义网关系中的第一数据关系;并且
将所述第一属性和所述第一数据关系保存在可搜索存储器中。
13.如权利要求12所述的计算机程序产品,其中,所述电子消息包括通过因特网接收的电子邮件或通过因特网接收的即时消息中的任何一个。
14.如权利要求12所述的计算机程序产品,其中,所述属性和关系包括RDF。
15.如权利要求12所述的计算机程序产品,其中,所述可搜索数据库包括注释存储器。
16.如权利要求12所述的计算机程序产品,其中,所述提取步骤包括关键词分析或自然语言分析中的任何一个。
17.如权利要求12所述的计算机程序产品,其中,所述提取步骤包括以下步骤中的任何一个:
在所述电子消息中搜索表示感兴趣的信息的预定义的句法模式;
对预定义的文档格式如所述电子消息中的XML或RDF进行分析;或者
对所述电子消息进行自然语言分析。
18.如权利要求12所述的计算机程序产品,其中,所述第一属性和第一数据关系被附加到所述可搜索存储器中的预定属性和关系上。
19.如权利要求12所述的计算机程序产品,其中,当出现以下任何一种情况时,将所述电子消息送往语义网代理:
接收的电子消息包括语义网代理的消息地址或者语义网代理的语义网ID中的任何一个;
接收的电子消息包括语义网代理的电子身份,所述身份位于所述电子消息的“CC”(抄送)部分;
利用包括SMTP/POP3协议或者SMTP/POP3服务器中的任何一个的消息交换基础设施接收所述电子消息;或者
发送所述电子消息的电子消息客户端包括对所述语义网代理的直接通信。
20.如权利要求12所述的计算机程序产品,还包括如下步骤:
从所述可搜索存储器中检取语义网属性和语义网关系,所述属性和关系包括所述第一属性和所述第一关系;
按照语义网关系和语义网属性,对检取的语义网属性和语义网关系进行解释;并且
向用户呈现经过解释的语义网关系和语义网属性,其中,呈现的语义网关系和语义网属性包括以下各项中的任何一项:
项目报告,对话概要;
概括的项目数据;
包括引用的概括的项目数据;
包括语义关系的概括的项目数据;或者
与语义网相关的相互连接的网项的浏览性能。
21.如权利要求12所述的计算机程序产品,还包括如下步骤:
在客户端计算机,将一个或多个语义网属性中的第一属性以及一个或多个语义网关系中的第一数据关系插入所述电子消息;并且
通过网络将所述电子消息发送到所述语义网代理,所述电子消息包括所述插入的第一属性和所述插入的第一数据关系。
22.如权利要求12所述的计算机程序产品,还包括使授权信息与所述第一属性或所述第一关系中的任何一个相联系的步骤,其中,基于系统配置信息或者包括在所述电子消息中的明确指令中的任何一个,联系授权信息。
23.一种系统,用于生成语义网关系,所述系统包括:
网络;
与所述网络通信的计算机系统,其中,所述计算机系统包括执行`包括如下方法的指令:
接收电子消息;
将电子消息送往语义网代理,所述电子消息包括一个或多个语义网属性以及一个或多个语义网数据关系;
从电子消息中提取所述一个或多个语义网属性中的第一属性以及所述一个或多个语义网关系中的第一数据关系;并且
将所述第一属性和所述第一数据关系保存在可搜索存储器中。
24.如权利要求23所述的系统,其中,所述电子消息包括通过因特网接收的电子邮件或通过因特网接收的即时消息中的任何一个。
25.如权利要求23所述的系统,其中,所述属性和关系包括RDF。
26.如权利要求23所述的系统,所述可搜索数据库包括注释存储器。
27.如权利要求23所述的系统,所述提取步骤包括关键词分析或自然语言分析中的任何一个。
28.如权利要求23所述的系统,其中,所述提取步骤还包括以下步骤中的任何一个:
在所述电子消息中搜索表示感兴趣的信息的预定义的句法模式;
对预定义的文档格式如所述电子消息中的XML或RDF进行语法分析;或者
对所述电子消息进行自然语言分析。
29.如权利要求23所述的系统,其中,所述第一属性和第一数据关系被附加到所述可搜索存储器中的预定属性和关系上。
30.如权利要求23所述的系统,其中,当出现以下任何一种情况时,将所述电子消息送往语义网代理:
接收的电子消息包括语义网代理的消息地址或者语义网代理的语义网ID中的任何一个;
接收的电子消息包括语义网代理的电子身份,所述身份位于所述电子消息的“CC”(抄送)部分;
利用包括SMTP/POP3协议或者SMTP/POP3服务器中的任何一个的消息交换基础设施接收所述电子消息;或者
发送所述电子消息的电子消息客户端包括对所述语义网代理的直接通信。
31.如权利要求23所述的系统,还包括如下步骤:
从所述可搜索存储器中检取语义网属性和语义网关系,所述属性和关系包括所述第一属性和所述第一关系;
按照语义网关系和语义网属性,对检取的语义网属性和语义网关系进行解释;并且
向用户呈现经过解释的语义网关系和语义网属性,其中,呈现的语义网关系和语义网属性包括以下各项中的任何一项:
项目报告,对话概要;
概括的项目数据;
包括引用的概括的项目数据;
包括语义关系的概括的项目数据;或者
与语义网相关的相互连接的网项的浏览性能。
32.如权利要求23所述的系统,还包括如下步骤:
在客户端计算机,将一个或多个语义网属性中的第一属性以及一个或多个语义网关系中的第一数据关系插入所述电子消息;并且
通过网络将所述电子消息发送到所述语义网代理,所述电子消息包括所述插入的第一属性和所述插入的第一数据关系。
33.如权利要求23所述的系统,还包括使授权信息与所述第一属性或所述第一关系中的任何一个相联系的步骤,其中,基于系统配置信息或者包括在所述电子消息中的明确指令中的任何一个,联系授权信息。
CNA2005101141633A 2004-10-26 2005-10-26 基于电子邮件的语义网协作和注释 Pending CN1783124A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US10/973,889 2004-10-26
US10/973,889 US7478105B2 (en) 2004-10-26 2004-10-26 E-mail based Semantic Web collaboration and annotation

Publications (1)

Publication Number Publication Date
CN1783124A true CN1783124A (zh) 2006-06-07

Family

ID=36317545

Family Applications (1)

Application Number Title Priority Date Filing Date
CNA2005101141633A Pending CN1783124A (zh) 2004-10-26 2005-10-26 基于电子邮件的语义网协作和注释

Country Status (2)

Country Link
US (2) US7478105B2 (zh)
CN (1) CN1783124A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100442292C (zh) * 2007-03-22 2008-12-10 华中科技大学 一种语义网信息的索引与获取方法
CN110837996A (zh) * 2018-08-16 2020-02-25 深圳市唯德科创信息有限公司 一种对邮件进行智能分析管理的方法及系统

Families Citing this family (75)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4517750B2 (ja) * 2004-06-30 2010-08-04 富士ゼロックス株式会社 文書処理システム
JP4081056B2 (ja) * 2004-08-30 2008-04-23 株式会社東芝 情報処理装置、情報処理方法及びプログラム
CN1825837B (zh) * 2005-02-23 2012-05-23 朗迅科技公司 通过即时消息传送进行的个人化信息订阅和传递
US7827169B2 (en) * 2005-10-24 2010-11-02 Sap Ag Methods and systems for data processing
US7822770B2 (en) * 2006-06-09 2010-10-26 Sap Ag Matchmaking of semantic web service behaviour using description logics
KR100823289B1 (ko) * 2006-08-28 2008-04-17 한국과학기술정보연구원 유알아이 기반 성과 정보 관리 시스템 및 그 방법
US8204856B2 (en) * 2007-03-15 2012-06-19 Google Inc. Database replication
US20100121839A1 (en) * 2007-03-15 2010-05-13 Scott Meyer Query optimization
US20090024590A1 (en) * 2007-03-15 2009-01-22 Sturge Timothy User contributed knowledge database
US20100174692A1 (en) * 2007-03-15 2010-07-08 Scott Meyer Graph store
WO2008141673A1 (en) * 2007-05-21 2008-11-27 Ontos Ag Semantic navigation through web content and collections of documents
US8326833B2 (en) * 2007-10-04 2012-12-04 International Business Machines Corporation Implementing metadata extraction of artifacts from associated collaborative discussions
CA2607537A1 (en) * 2007-10-22 2009-04-22 Ibm Canada Limited - Ibm Canada Limitee Software engineering system and method for self-adaptive dynamic software components
US8676902B2 (en) * 2007-11-28 2014-03-18 International Business Machines Corporation System and method for service oriented email client application
US8185606B2 (en) * 2007-12-12 2012-05-22 International Business Machines Corporation Email change tracking
US8291308B2 (en) * 2007-12-28 2012-10-16 International Business Machines Corporation Annotating collaborative information structures
US20090177634A1 (en) * 2008-01-09 2009-07-09 International Business Machine Corporation Method and System for an Application Domain
US8510646B1 (en) * 2008-07-01 2013-08-13 Google Inc. Method and system for contextually placed chat-like annotations
US8195692B2 (en) 2008-12-11 2012-06-05 International Business Machines Corporation System and method for managing semantic and syntactic metadata
US20110093500A1 (en) * 2009-01-21 2011-04-21 Google Inc. Query Optimization
MY168837A (en) * 2009-05-25 2018-12-04 Mimos Berhad A method and system for extendable semantic query interpretation
WO2010138972A2 (en) 2009-05-29 2010-12-02 Abacast, Inc. Selective access of multi-rate data from a server and/or peer
US8914368B2 (en) * 2010-03-31 2014-12-16 International Business Machines Corporation Augmented and cross-service tagging
US20110302249A1 (en) * 2010-06-02 2011-12-08 Research In Motion Limited Method for assisted message generation
US9713774B2 (en) 2010-08-30 2017-07-25 Disney Enterprises, Inc. Contextual chat message generation in online environments
US9396283B2 (en) 2010-10-22 2016-07-19 Daniel Paul Miranker System for accessing a relational database using semantic queries
US9552353B2 (en) 2011-01-21 2017-01-24 Disney Enterprises, Inc. System and method for generating phrases
US8930959B2 (en) 2011-05-13 2015-01-06 Orions Digital Systems, Inc. Generating event definitions based on spatial and relational relationships
US8521762B2 (en) * 2011-05-31 2013-08-27 International Business Machines Corporation Automated business process modeling
US8793273B1 (en) * 2011-06-29 2014-07-29 Google Inc. Parsing framework method and device
US8898234B2 (en) * 2011-06-30 2014-11-25 International Business Machines Corporation Email question object ownership and status tracking
US9176947B2 (en) 2011-08-19 2015-11-03 Disney Enterprises, Inc. Dynamically generated phrase-based assisted input
US9245253B2 (en) * 2011-08-19 2016-01-26 Disney Enterprises, Inc. Soft-sending chat messages
US9177000B2 (en) * 2012-04-30 2015-11-03 International Business Machines Corporation Data index using a linked data standard
US9165329B2 (en) 2012-10-19 2015-10-20 Disney Enterprises, Inc. Multi layer chat detection and classification
US10742577B2 (en) 2013-03-15 2020-08-11 Disney Enterprises, Inc. Real-time search and validation of phrases using linguistic phrase components
US10303762B2 (en) 2013-03-15 2019-05-28 Disney Enterprises, Inc. Comprehensive safety schema for ensuring appropriateness of language in online chat
US20140351678A1 (en) * 2013-05-22 2014-11-27 European Molecular Biology Organisation Method and System for Associating Data with Figures
US10223637B1 (en) 2013-05-30 2019-03-05 Google Llc Predicting accuracy of submitted data
US10146865B2 (en) * 2013-10-04 2018-12-04 Orions Digital Systems, Inc. Tagonomy—a system and method of semantic web tagging
US20160253630A1 (en) * 2015-02-27 2016-09-01 Anthony F. Oliveri System and method for automatically scheduling an appointment
US10706233B2 (en) * 2015-03-06 2020-07-07 M-Files Oy System and method for extracting and utilizing information from digital communications
US10824637B2 (en) 2017-03-09 2020-11-03 Data.World, Inc. Matching subsets of tabular data arrangements to subsets of graphical data arrangements at ingestion into data driven collaborative datasets
US11941140B2 (en) 2016-06-19 2024-03-26 Data.World, Inc. Platform management of integrated access of public and privately-accessible datasets utilizing federated query generation and query schema rewriting optimization
US11036697B2 (en) 2016-06-19 2021-06-15 Data.World, Inc. Transmuting data associations among data arrangements to facilitate data operations in a system of networked collaborative datasets
US11023104B2 (en) 2016-06-19 2021-06-01 data.world,Inc. Interactive interfaces as computerized tools to present summarization data of dataset attributes for collaborative datasets
US10353911B2 (en) 2016-06-19 2019-07-16 Data.World, Inc. Computerized tools to discover, form, and analyze dataset interrelations among a system of networked collaborative datasets
US11947554B2 (en) 2016-06-19 2024-04-02 Data.World, Inc. Loading collaborative datasets into data stores for queries via distributed computer networks
US10747774B2 (en) 2016-06-19 2020-08-18 Data.World, Inc. Interactive interfaces to present data arrangement overviews and summarized dataset attributes for collaborative datasets
US10645548B2 (en) 2016-06-19 2020-05-05 Data.World, Inc. Computerized tool implementation of layered data files to discover, form, or analyze dataset interrelations of networked collaborative datasets
US10438013B2 (en) 2016-06-19 2019-10-08 Data.World, Inc. Platform management of integrated access of public and privately-accessible datasets utilizing federated query generation and query schema rewriting optimization
US11675808B2 (en) 2016-06-19 2023-06-13 Data.World, Inc. Dataset analysis and dataset attribute inferencing to form collaborative datasets
US11468049B2 (en) 2016-06-19 2022-10-11 Data.World, Inc. Data ingestion to generate layered dataset interrelations to form a system of networked collaborative datasets
US10515085B2 (en) 2016-06-19 2019-12-24 Data.World, Inc. Consolidator platform to implement collaborative datasets via distributed computer networks
US10853376B2 (en) 2016-06-19 2020-12-01 Data.World, Inc. Collaborative dataset consolidation via distributed computer networks
US11042537B2 (en) 2016-06-19 2021-06-22 Data.World, Inc. Link-formative auxiliary queries applied at data ingestion to facilitate data operations in a system of networked collaborative datasets
US11042560B2 (en) 2016-06-19 2021-06-22 data. world, Inc. Extended computerized query language syntax for analyzing multiple tabular data arrangements in data-driven collaborative projects
US11042556B2 (en) 2016-06-19 2021-06-22 Data.World, Inc. Localized link formation to perform implicitly federated queries using extended computerized query language syntax
US11334625B2 (en) 2016-06-19 2022-05-17 Data.World, Inc. Loading collaborative datasets into data stores for queries via distributed computer networks
US11036716B2 (en) 2016-06-19 2021-06-15 Data World, Inc. Layered data generation and data remediation to facilitate formation of interrelated data in a system of networked collaborative datasets
US11042548B2 (en) 2016-06-19 2021-06-22 Data World, Inc. Aggregation of ancillary data associated with source data in a system of networked collaborative datasets
US10324925B2 (en) 2016-06-19 2019-06-18 Data.World, Inc. Query generation for collaborative datasets
US10452975B2 (en) 2016-06-19 2019-10-22 Data.World, Inc. Platform management of integrated access of public and privately-accessible datasets utilizing federated query generation and query schema rewriting optimization
US11755602B2 (en) 2016-06-19 2023-09-12 Data.World, Inc. Correlating parallelized data from disparate data sources to aggregate graph data portions to predictively identify entity data
US10452677B2 (en) 2016-06-19 2019-10-22 Data.World, Inc. Dataset analysis and dataset attribute inferencing to form collaborative datasets
US12008050B2 (en) 2017-03-09 2024-06-11 Data.World, Inc. Computerized tools configured to determine subsets of graph data arrangements for linking relevant data to enrich datasets associated with a data-driven collaborative dataset platform
US11238109B2 (en) 2017-03-09 2022-02-01 Data.World, Inc. Computerized tools configured to determine subsets of graph data arrangements for linking relevant data to enrich datasets associated with a data-driven collaborative dataset platform
US11113670B2 (en) * 2017-04-03 2021-09-07 Conduent Business Services, Llc System and method for automatic process error detection and correction
US11243960B2 (en) 2018-03-20 2022-02-08 Data.World, Inc. Content addressable caching and federation in linked data projects in a data-driven collaborative dataset platform using disparate database architectures
US10922308B2 (en) 2018-03-20 2021-02-16 Data.World, Inc. Predictive determination of constraint data for application with linked data in graph-based datasets associated with a data-driven collaborative dataset platform
USD940169S1 (en) 2018-05-22 2022-01-04 Data.World, Inc. Display screen or portion thereof with a graphical user interface
USD940732S1 (en) 2018-05-22 2022-01-11 Data.World, Inc. Display screen or portion thereof with a graphical user interface
US11947529B2 (en) 2018-05-22 2024-04-02 Data.World, Inc. Generating and analyzing a data model to identify relevant data catalog data derived from graph-based data arrangements to perform an action
US11442988B2 (en) 2018-06-07 2022-09-13 Data.World, Inc. Method and system for editing and maintaining a graph schema
US11947600B2 (en) 2021-11-30 2024-04-02 Data.World, Inc. Content addressable caching and federation in linked data projects in a data-driven collaborative dataset platform using disparate database architectures

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6418448B1 (en) * 1999-12-06 2002-07-09 Shyam Sundar Sarkar Method and apparatus for processing markup language specifications for data and metadata used inside multiple related internet documents to navigate, query and manipulate information from a plurality of object relational databases over the web
US6856992B2 (en) * 2001-05-15 2005-02-15 Metatomix, Inc. Methods and apparatus for real-time business visibility using persistent schema-less data storage

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100442292C (zh) * 2007-03-22 2008-12-10 华中科技大学 一种语义网信息的索引与获取方法
CN110837996A (zh) * 2018-08-16 2020-02-25 深圳市唯德科创信息有限公司 一种对邮件进行智能分析管理的方法及系统

Also Published As

Publication number Publication date
US8572060B2 (en) 2013-10-29
US7478105B2 (en) 2009-01-13
US20060100995A1 (en) 2006-05-11
US20090132528A1 (en) 2009-05-21

Similar Documents

Publication Publication Date Title
CN1783124A (zh) 基于电子邮件的语义网协作和注释
US8650194B2 (en) Task-based tagging and classification of enterprise resources
Dzbor et al. Magpie–towards a semantic web browser
US6662178B2 (en) Apparatus for and method of searching and organizing intellectual property information utilizing an IP thesaurus
Zhao et al. Annotating, linking and browsing provenance logs for e-science
US20100070448A1 (en) System and method for knowledge retrieval, management, delivery and presentation
US20040230572A1 (en) System and method for semantic knowledge retrieval, management, capture, sharing, discovery, delivery and presentation
US20180196697A1 (en) Dynamic context of tasks
US20070266095A1 (en) Seamless electronic mail capture with user awareness and consent
US20090070350A1 (en) Collaborative data and knowledge integration
Amato et al. Multimedia summarization using social media content
US20110219087A1 (en) Systems and methods for webpage creation and updating
CN1540552A (zh) 带关联的计算机搜索
CN1752974A (zh) 用于接收并响应知识互换查询的方法、系统和装置
McDowell et al. Mangrove: Enticing ordinary people onto the semantic web via instant gratification
CA2555280A1 (en) Semantic knowledge retrieval management and presentation
CN1752960A (zh) 用于创建知识互换概况文件的方法、系统和装置
CN1509442A (zh) 因特网和/或网站内容的自动管理
CN102713791A (zh) 收集用于协作文档开发的社群反馈
Liu et al. Influence analysis based expert finding model and its applications in enterprise social network
US8489590B2 (en) Cross-market model adaptation with pairwise preference data
Stegmaier et al. AIR: Architecture for Interoperable Retrieval on distributed and heterogeneous Multimedia Repositories
Franz et al. The X-COSIM integration framework for a seamless semantic desktop
Kim et al. Personal chronicling tools for enhancing information archival and collaboration in enterprises
Karger et al. Sticky notes for the semantic web

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C12 Rejection of a patent application after its publication
RJ01 Rejection of invention patent application after publication

Open date: 20060607