CN107077466A - 计算机自然语言处理中通用本体的词元映射 - Google Patents

计算机自然语言处理中通用本体的词元映射 Download PDF

Info

Publication number
CN107077466A
CN107077466A CN201580060929.6A CN201580060929A CN107077466A CN 107077466 A CN107077466 A CN 107077466A CN 201580060929 A CN201580060929 A CN 201580060929A CN 107077466 A CN107077466 A CN 107077466A
Authority
CN
China
Prior art keywords
lemma
language
noumenon
relation
service
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201580060929.6A
Other languages
English (en)
Other versions
CN107077466B (zh
Inventor
F·诺兹
G·J·克鲁斯特曼
A·D·E·委德拉尔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oracle International Corp
Original Assignee
Oracle International Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oracle International Corp filed Critical Oracle International Corp
Publication of CN107077466A publication Critical patent/CN107077466A/zh
Application granted granted Critical
Publication of CN107077466B publication Critical patent/CN107077466B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • G06F40/242Dictionaries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/268Morphological analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Animal Behavior & Ethology (AREA)
  • Machine Translation (AREA)

Abstract

在语言之间映射本体的方法可以包括接收第一语言的第一本体,其中第一本体包括第一多个词元以及所述多个词元之间的多个关系。所述方法还可以包括接收第二语言的第二多个词元,并且将第二语言的所述第二多个词元中的每一个词元映射到第一语言的所述第一多个词元中的相应词元。所述方法可以附加地包括通过使用第一本体中的所述多个关系创建第二语言的所述第二多个词元之间的关系来生成第二语言的第二本体。

Description

计算机自然语言处理中通用本体的词元映射
交叉引用
本申请要求于2014年11月10日提交的标题为“Automatic Batch Generation ofConcept Relations from N-Grams from Linguistic Input Data”的美国临时申请No.62/077,868的权益。本申请还要求美国临时2014年11月10日提交的标题为“LemmaMapping to Univerasal Ontologies”的美国临时申请号62/077,887的权益。为了所有目的,这些申请中的每一个都通过引用并入本文。
以下三个申请彼此相关,并于2015年7月7日在同一天提交:Fabrice Nauze等人于2015年7月7日提交的标题为“Automatic Generation of N-Grams and ConceptRelations From Linguistic Input Data”的美国序列号14/793,677,(代理人案号88325-934160);Margaret Salome等人于2015年7月7日提交的标题为“Automatic OntologyGeneration for Natural-Language Processing Applications”的美国序列号14/793,701(代理人案号88325-913826);以及Fabrice Nauze等人于2015年7月7日提交的标题为“Lemma Mapping to Universal Ontologies in Computer Natural-LanguageProcessing”的美国序列号14/793,658(代理人案号88325-934161)。这些申请中的每一个通过引用并入本文。
背景技术
在一般意义上,本体(ontology)是对基本概念及其彼此关系的哲学研究。本体处理涉及哪些实体可以说成是存在、这些实体如何在层次结构中被逻辑地分组在一起以及什么相似性和/或差异可以被用来彼此隔离本体概念组的问题。在计算机和信息科学中,一般本体转化为特定计算领域中根本存在的类型、属性和关系的命名和定义。例如,本体可以划分计算的集合所需的变量并建立这些变量之间的关系。
发明内容
在一个实施例中,在语言之间映射本体的方法可以包括接收第一语言的第一本体,其中第一本体包括第一多个词元(lemma)以及这多个词元之间的多个关系。该方法还可以包括接收第二语言的第二多个词元,并且将第二语言的第二多个词元中的每一个映射到第一语言的第一多个词元中的相应词元。该方法可以附加地包括通过使用第一本体中的多个关系创建第二语言的第二多个词元之间的关系来生成第二语言的第二本体。
在另一个实施例中,可以给出非暂态计算机可读介质。计算机可读存储器可以包括指令序列,当指令序列由一个或多个处理器执行时,使得这一个或多个处理器执行操作,包括接收第一语言的第一本体,其中第一本体由第一多个词元以及这多个词元之间的多个关系组成。操作还可以包括接收第二语言的第二多个词元,并且将第二语言的第二多个词元中的每一个映射到第一语言的第一多个词元中的相应词元。操作可以附加地包括通过使用第一本体中的多个关系创建第二语言的第二多个词元之间的关系来生成第二语言的第二本体。
在另一个实施例中,可以给出系统。系统可以包括一个或多个处理器和与这一个或多个处理器通信耦合并且可被其读取的存储器。存储器可以包括指令序列,当指令序列被一个或多个处理器执行时,使得这一个或多个处理器执行操作,包括接收第一语言的第一本体,其中第一本体由第一多个词元以及这多个词元之间的多个关系组成。操作还可以包括接收第二语言的第二多个词元,并且将第二语言的第二多个词元中的每一个映射到第一语言的第一多个词元中的相应词元。操作可以附加地包括通过使用第一本体中的多个关系创建第二语言的第二多个词元之间的关系来生成第二语言的第二本体。
附图说明
可以通过参考说明书的其余部分和附图来实现对本发明的本质和优点的进一步理解,其中贯穿几个附图使用相同的标号来表示相似的组件。在一些情况下,子标签与标号相关联,以表示多个相似组件中的一个。当在没有指定现有子标签的情况下引用标号时,意在指所有此类多个相似组件。
图1示出了根据一些实施例的用在自然语言处理中的本体的图。
图2A示出了根据一些实施例的用于生成两个不同本体的并行语言分析流水线。
图2B示出了根据一些实施例的使用通用本体的语言分析流水线。
图2C示出了根据一些实施例的使用词元翻译的语言分析流水线。
图3A示出了根据一些实施例的在词元映射期间的本体的图。
图3B示出了根据一些实施例的在关系映射期间的本体的图。
图4A示出了根据一些实施例的用于使用同义词数据库生成本体的系统。
图4B示出了根据一些实施例的用于使用语言翻译服务数据库生成本体的系统。
图5示出了根据一些实施例的用于生成用在自然语言处理中的本体的方法的流程图。
图6示出了用于实现一些实施例的分布式系统的简化框图。
图7示出了由实施例系统的组件提供的服务可以通过其作为云服务提供的系统环境的组件的简化框图。
图8示出了其中可以实现各种实施例的示例性计算机系统。
具体实施方式
一般而言,本体、层次结构和分类法常常用在搜索系统和信息检索系统中,以改善查全(recall)。例如知道“BMW”是“汽车品牌”可以提高搜索任务的查全率、提高分类任务的精度,等等。本体通常被构建为特定于语言的模块,首先将词形链接到词元,然后利用本体/层次结构关系将该词元与其它词元链接。但是,如本文所述,在本体中将词元链接在一起的关系可以被抽象为很大程度上与语言无关的模块。在本文所述的实施例中,给出实现这种抽象的方法,使得可以基于第一语言中的现有本体在第二语言中形成本体。
在一些实施例中,处理可以通过选择或定义第一本体开始。被称为“基础事实”或“通用”本体的第一本体可以用通用语言(诸如英语)形成。第一本体可以描述被编码为词元的概念之间的关系。然后,该处理可以利用在输入语料库的分段/记号化之后触发的语言分析流水线、词性分析以及其记号的词元化。然后,这个处理可以定义第一本体中的词元(以及可选地其词性)到第二本体中的词元的映射。通过使用通用本体来映射用于每种语言的词元和关系,实现新语言本体所需的时间被最小化,并且跨语言的整体质量可以被提高,因为本体的质量不绑定到特定语言中对关系进行编码的人的工作。
在一些实施例中,该处理可以构建与语言无关的本体作为第一本体。第一本体包括被编码为词元的概念之间的关系。例如,“tandem”是“bicycle”,并且“bicycle”是“vehicle”。接下来,该处理可以接收与第一本体的第一语言不同的第二语言的选择。第二语言可以是用于第二本体的期望语言。接下来,该处理可以生成第一语言和第二语言中的词之间的映射。该处理还可以利用跨语言映射常见含义的数据库。这个映射可以是通用的,使得第一语言中的词被映射到第二语言中的对应词,或者可以更具体,使得词性(PoS)之间的映射被促进。例如,通用映射可以导致“词元(第二语言)->词元(第一语言)”,而特定于词性的映射可以导致“PoS+词元(第二语言)->词元(第一语言)”。
在第一语言和第二语言之间映射词元之后,所映射的词元可以被传递到语言分析流水线中的下一步。具体而言,然后第一本体中的词元之间的关系可以使用第二本体中的词元之间的关系来直接映射。本质上,在第一本体中定义的关系被用来将第二本体中的词元链接在一起,以形成对应的关系。该处理在两个本体之间自动创建词到词的映射,然后使用这些映射在第二本体中建立关系。以这种方式,第一本体被用作第二本体的模板,其中来自第二语言的词填充模板中关系之间的节点。因此,用户不需要手动指派关系或确定用于第二本体的词汇。
这个处理也可以随着时间被不断更新。第一本体可以与特定语料库(诸如网站或web域)关联。当语料库随时间改变时(例如,网页被更新),第一本体也可以在第一语言中改变。可以添加新的词汇、可以删除旧的词汇,并且可以调整关系。当这种情况发生时,可以将第二语言中的新词汇添加到第二本体,或者可以从第二本体中去除已弃用的词汇。也可以根据第一本体中经调整的关系在第二本体中调整关系。这个自动化的处理可以基于自动保持最新的第一本体生成多个特定于语言的本体。
图1示出了根据一些实施例的用在自然语言处理中的本体的图100。图100可以表示通过含义将概念分组在一起并通过关系将这些概念关联到其它概念的通用本体。例如,bike 114可以表示两轮手动动力车辆的概念。本体还可以包括描述bike 114相同概念的其它词或同义词104的列表。bike 114可以以分层方式关联到其它概念。例如,bike 114是vehicle 102,其也具有可以被用来表达vehicle 102的概念的同义词集合。层次结构中的父子关系表示父与子之间的“是...的一种类型”关系。作为另一个示例,dirt bike 106、tandem bike 108和touring bike 110全都是表示bike 114的父节点的类型。
使用由一个或多个词表示的概念构建通用本体。但是,重要的是要指出,个体词(尤其是在英语语言中)可能表示多个概念。在一个示例中,术语“bike”可以既表示名词又表示动词。图1中所示的本体还包括第二个概念,其中术语“bike”用作动词,如在“to bike”中。与其名词对应物一样,动词bike 116概念也包括一组同义词112,其也可以被用来表示相同的概念。动词bike 116是父动词“move”118的孩子,因此与其具有“是...的一种类型”关系。
如下面将要讨论的,当使用通用本体在语言之间映射概念时,不仅仅通过在那种语言中使用的词而且通过词性来区分概念常常是有用的。如本文所使用的,这些概念被称为“词元”。通用本体中的词元可以通过使用连接各种语言之间的概念的映射引擎被映射到特定于语言的本体中的词元。示例映射引擎在下面在图4A-4B中讨论。而且,图1中所示的通用本体可以以与语言无关的方式表示概念和关系。虽然通用本体仅仅为了说明的目的而以英语显示,但是其它语言可以用于通用本体。
图2A示出了根据一些实施例的用于生成两个不同本体的并行语言分析流水线200a。语言分析流水线可以被用来从语料库202生成特定于语言的本体。语料库可以包括web域、文献的集合、技术文档等等。一般而言,语料库只是在特定上下文中使用的特定语言的子集。例如,语料库可以包括用于航空公司的web域,其中广泛使用航空业常见的术语。通过使用限于通用语言的子集的特定语料库,可以导出特定于语料库202的本体,这比通用语言本体更高效和更小,并且仅包括特定于语料库202的定义,从而加快了查全和查找效率。
传统上,将需要两次通过语言分析流水线,以生成不同语言中的本体。在这个示例中,将需要英语语言分析流水线和法语语言分析流水线,以分别生成英语本体214-1和法语本体214-2。将需要向流水线提供英语语料库202-1和法语语料库202-2,以供分析。在一些情况下,英语语料库202-1和法语语料库202-2可以在不同的翻译中表示相同的实质内容。例如,每个语料库202可以表示翻译成不同语言的相同网页。为了生成单独的本体,每个语料库需要分别运行通过语言分析流水线。
用于从语料库202生成本体214的处理可以如下进行。语料库202可以被提供给语料库分析引擎204,语料库分析引擎204隔离语料库202内感兴趣的文本。语料库分析引擎204可以去除元数据、注释、显示代码和/或其它非实质文本,以生成可以考虑用于本体21的单个词的列表。例如,对于web域,语料库分析引擎204可以擦除HTML格式化代码、开发者评论、元数据、属性等等,并且只有在屏幕上向用户显示的文本可用于搜索引擎。
接下来,词元生成引擎206可以接收单个的词并生成词元。词元可以由单个的词或单个的词的组合组成,从而形成n元语法(n-grams)。例如,对于描述电子邮件服务的网站,术语“email”将是单个词的词元,而术语“search filter”将是指单个概念的两个词的词元。词元生成引擎206可以接收定义用于生成n元语法的最大和/或最小数目n的输入。例如,输入可以定义用于创建n元语法的最小数目1和最大数目4。然后,词元生成引擎206将扫描通过语料库分析引擎204可用的文本,并生成在文本中作为连续的、单个或多个词的组合出现的可能词元的列表。
词元过滤/整合引擎208可以从词元生成引擎206接收可能词元的列表,并且随后削减候选词元,以生成将在本体214中出现的词元的最终列表。词元过滤/整合引擎208可以包括可以被用来过滤候选词元的列表的多个参数定义。例如,一个参数可以定义将候选词元保留在本体词元列表中所需的在语料库中的使用频率。在语料库202中仅出现一次或两次的候选词元可以被确定为不传达更广泛含义或传达在本体214中无用的含义的个体词的分组。因此,应当保留的候选词元可能需要在语料库202中出现至少最少次数。其它参数可以定义可以对照其比较候选词元的词典或其它可用词元数据库。这允许与先前已知的词元匹配的词元被保留,而其它词元被丢弃或接受进一步处理。在一些实施例中,词元过滤/整合引擎208可以为用户界面生成显示,使得用户可以在任何自动过滤处理发生之前或之后检查候选词元的列表。然后,用户可以快速扫描候选词元的剩余列表并消除任何不属于的词元。
在这个时候,语料库202中大量未处理的文本已经被变换为用于本体214的词元的最终列表。语言分析流水线的接下来的部分,关系指派引擎210和关系可视化/精炼引擎212,常常被认为是该处理中最耗时和困难的阶段。关系指派引擎210可以基于词元在语料库202中的相对位置以及它们的词性、词典定义和已知同义词自动地尝试生成词元之间的关系。关系可视化/精炼引擎212然后可以被用来在图形界面中向用户显示初步关系指派。然后,用户可以在显示设备上可视地操纵以图形或树形格式显示的关系,以生成词元之间的最终关系集合。然后可以从语言分析流水线输出最终词元216和最终关系218的组合,作为本体214。
为了生成法语本体214-2和英语本体214-1,必须对每个个体语言执行语言分析流水线中的每个步骤。这意味着用户可能需要手动检查来自词元过滤/整合引擎208的最终词元列表,并手动建立最终关系218的集合。这需要广泛的用户参与以生成本体,用户参与常常需要多于一种语言中的专业知识。
图2B示出了根据一些实施例的使用通用本体的语言分析流水线200b。如上所述,通用本体214-1可以是与语言无关的,尽管它必然由特定语言(诸如英语)表示。通用本体214-1将包括词元216-1的集合和用于词元216-1的集合的关系218-1的集合。为了从法语语料库202-2生成法语本体214-2,可以使用通用本体214-1来消除在语言分析流水线中生成法语词元之间关系的耗时步骤。
如上所述,可以使用语料库分析引擎204-2来分析法语语料库202-2,可以使用词元生成引擎206-2从中生成词元的集合。在使用词元过滤/整合引擎208-2过滤和编辑候选词元之后,将生成用于法语本体214-2的词元216-2的最终集合。在这个时候,跨语言的词元映射引擎220可以接收用于法语本体214-2的词元216-2的最终集合,并将词元216-2的最终集合的含义映射到通用本体214-1。
由跨语言词元映射引擎220用来将用于法语本体214-2的词元216-2的最终集合与通用本体214-1的词元216-1匹配的方法可以根据特定实施例而变化。在一些实施例中,现有数据库可以被用来通过将特定于语言的同义词或同义词集合链接到共享的索引层来链接语言之间的词元。例如,Euro WordNet项目提供了链接不同语言的概念之间的含义的数据库。在其它实施例中,可以使用自动语言翻译服务(例如,Google翻译)来生成跨语言的同义词。例如,来自词元216-2的最终集合的词元可以被翻译成通用本体214-1的语言,并且被映射到通用本体214-1的词元216-1中的词元。在一些实施例中,如果该语言已经被映射到通用本体,则该语料库可以被用来生成在通用本体语言中对于其存在平行(parallel)数据的词元。例如,在双语语料库中,来自新语言的对齐句子被直接映射到通用本体语言中的平行句子。词和多记号词可以使用在两种语言中都众所周知的统计方法来使其对齐。然后,可以自动生成词元和映射。
在将词元216-2的最终集合映射到通用本体214-1中的词元216-1之后,通用本体中的关系218-1可以被关系映射引擎222直接映射到词元216-2的最终集合。在许多情况下,关系218-1可以直接映射到法语本体214-2中的词元216-2的最终集合,以便生成法语关系218-2。在一些情况下,法语本体214-2的词元216-2的最终集合中的词元在通用本体214-1的词元216-1中可能没有直接的类似物。这种情况将在下面更详细地讨论。在一些实施例中,关系映射引擎222可以简单地从通用本体218-1读取关系并将它们直接应用到法语本体214-2,使得法语关系218-2与通用本体中关系218-1相同。如果存在无法在法语语言和通用本体之间直接映射的词元,那么如果需要,则可以手动添加附加关系,但这应当是很少使用的操作。
图2C示出了根据一些实施例的使用词元翻译的语言分析流水线200c。在这个实施例中,可以针对具体的材料语料库开发通用本体214-1。例如,出现英语的web域的主版本可以被用来生成特定于这个特定web域的通用本体。如对于跨国公司是常见的情况,web域的主版本可以被翻译成各种其它语言,以服务国际客户群。不是分别分析以英语出现的web域的主版本的翻译,而是通用本体214-1可以被用来自动生成各种其它语言的本体。
对于出现在通用本体214-1中的每个词元216-1,词元翻译引擎224可以生成另一种语言(诸如法语)的词元216-2的最终集合。在一些情况下,对英语词的翻译可能会导致可以在法语中使用的同义词集合。例如,“bicycle”的英语词可以生成法语语言中五个同义词的集合。法语同义词可以与web域的法语翻译的实际语料库进行比较,以确定哪个同义词应当在法语本体214-2中使用。在为法语本体214-2生成词元216-2的最终集合之后,关系映射引擎222可以被用来为法语本体214-2生成关系218-2。要指出的是,在这个实施例中,完整的法语本体214-2是基于通用本体214-1生成的,而不必在整个语言分析流水线中处理web域的法语语料库。
图3A示出了根据一些实施例的在词元映射期间本体的图300a。在处理的这个阶段,用于法语语言的词元集合可以由语言分析流水线生成。例如,已经对在巴黎处理自行车运输的web域进行了分析,以生成图3A中出现的词元。通过将法语词元的语言翻译成通用本体(例如,英语)的语言,法语语言的词元可以被映射到通用本体中的词元。如上所述,每个词元概念可以具有一个或多个同义词,其可以被用来在语言之间映射概念。在图3A中,用于vehicle 302、314的概念被映射,用于bike 304、316的概念被映射,并且具体类型的自行车(诸如touring bike 306、320,motor bike 310、322和/或tandem bike 312、324)被映射。
要指出的是,dirt bike 308的概念在来自特定法语语料库的法语词元集合中不具有类似的词。在一些实施例中,语言之间的差异是预期的,并且一种语言的词元可能不一定与另一种语言中的词元直接相关。
图3B示出了根据一些实施例的在关系映射期间本体的图300b。在使用图3B的映射词元之后,来自通用本体的词元之间的关系可以被映射并复制,以形成法语语言本体。如图300b中所示,法语本体是使用vehicle词元314、bike词元316等之间的“是...的一种类型”关系来建立的。不需要法语专家来组织在法语语料库中找到的词元之间的关系,而是通用本体的现有关系可以被用来自动生成法语本体中的对应关系。
图4A示出了根据一些实施例的用于使用同义词数据库生成本体的系统400a。语言分析流水线404可以接受语料库402(诸如web域)作为输入,以生成词元406。词元映射引擎408可以将生成的词元映射到通用本体412中的概念。词元映射引擎408还可以使用附加资源映射到词元,诸如在语言之间映射概念的市售或专有同义词数据库416。词元映射引擎408可以通过API或web接口420访问数据库416。接下来,关系映射引擎410可以重新使用来自通用本体412的关系,以生成如上所述的特定于最终语言的本体414。
图4B示出了根据一些实施例的用于使用语言翻译服务数据库生成本体的系统400b。系统400b的实施例与系统400a的实施例类似,不同之处在于API或web接口424使用web翻译服务422来生成语料库402的词元与通用本体412的词元之间的映射。
图5示出了根据一些实施例的用于生成用在自然语言处理中的本体的方法的流程图500。该方法可以包括接收第一语言的第一本体,第一本体具有词元和词元之间的关系(502)。第一本体可以是与语言无关的、利用关系链接在一起的词元概念的集合。第一本体可以特定于特定语料库,诸如web域或文档集合。在一些实施例中,可以使用语言分析流水线来生成第一本体,其中语言分析流水线从语料库中提取和过滤词元并且从语言专家接收词元之间的关系。
该方法还可以包括接收第二语言的第二词元集合(504)。第二语言可以与用来表达第一(或通用)本体的第一语言不同。第二词元集合可以以类似于第一本体的词元如何生成的方式从语言分析流水线生成。在一些实施例中,用于第一本体的语料库和用于第二词元集合的语料库可以从不同语言的相同语料库导出。该方法可以附加地包括将第二语言中的每个词元映射到第一语言的词元(506)。这个步骤可以通过将第二语言的词元翻译成第一语言的同义词集合、然后识别在第一本体的词元中出现的同义词来实现。最后,该方法还可以包括通过使用第一本体中的关系创建第二语言的词元之间的关系来生成第二语言的第二本体(508)。
应当认识到的是,图5中所示的具体步骤提供了根据本发明各种实施例的从通用本体生成本体的特定方法。还可以根据替代实施例执行其它步骤序列。例如,本发明的替代实施例可以以不同的次序执行上述步骤。而且,图5中所示的个体步骤可以包括可以以适于个体步骤的各种顺序执行的多个子步骤。此外,依赖于特定应用,可以添加或去除附加步骤。本领域普通技术人员将认识到许多变化、修改和替代。
本文描述的每种方法可以由计算机系统来实现。这些方法的每个步骤可以由计算机系统自动执行,和/或可以提供有涉及用户的输入/输出。例如,用户可以为方法中的每个步骤提供输入,并且这些输入中的每一个可以响应于请求这种输入的具体输出,其中输出由计算机系统生成。每个输入可以响应于对应的请求输出而被接收。此外,输入可以从用户接收、作为数据流从另一个计算机系统接收、从另一个计算机系统检索、从存储器位置检索、经网络检索、从web服务请求,等等。同样,输出可以作为数据流提供给用户、提供给另一个计算机系统、保存在存储器位置中、经网络发送、提供给web服务,等等。简而言之,本文所述的方法的每个步骤可以由计算机系统执行,并且可以涉及到计算机系统或来自计算机系统的可能涉及或不涉及用户的任何数量的输入、输出和/或请求。那些不涉及用户的步骤可以说是由计算机系统自动执行的,无需人为干预。因此,根据本公开内容将理解,本文所述的每个方法的每个步骤可以被更改,以包括到用户和来自用户的输入和输出,或者可以由计算机系统自动完成而无需人为干预,其中任何确定都由处理器进行。此外,本文所述的每个方法的一些实施例可以被实现为存储在有形的非暂态存储介质上以形成有形软件产品的指令集合。
图6绘出了用于实现实施例之一的分布式系统600的简化图。在所示实施例中,分布式系统600包括一个或多个客户端计算设备602、1304、606和608,这些客户端计算设备被配置为经由一个或多个网络610执行和操作客户端应用,诸如web浏览器、专有客户端(例如,Oracle Forms)等等。服务器612可以经由网络610与远程客户端计算设备602、604、606和608通信耦合。
在各种实施例中,服务器612可以适于运行由系统的组件中的一个或多个组件提供的一个或多个服务或软件应用。在一些实施例中,这些服务可以作为基于web或云的服务或者作为软件即服务(Software as a Service,SaaS)模型提供给客户端计算设备602、604、606和/或608的用户。操作客户端计算设备602、604、606和/或608的用户又可以利用一个或多个客户端应用与服务器612交互,以利用由这些组件提供的服务。
在该图所绘出的配置中,系统600的软件组件618、620和622被示为在服务器612上实现。在其它实施例中,系统600的组件中的一个或多个组件和/或由这些组件提供的服务也可以由客户端计算设备602、604、606和/或608中的一个或多个来实现。操作客户端计算设备的用户然后可以使用一个或多个客户端应用来使用由这些组件提供的服务。这些组件可以用硬件、固件、软件或其组合来实现。应当认识到的是,各种不同的系统配置是可能的,这些配置可以与分布式系统600不同。因此,在该图中示出的实施例是用于实现实施例系统的分布式系统的一个示例,并不是要进行限制。
客户端计算设备602、604、606和/或608可以是运行诸如Microsoft Windows和/或诸如iOS、Windows Phone、Android、BlackBerry 10、Palm OS等各种移动操作系统的软件并且启用互联网、电子邮件、短消息服务(SMS)、或其它通信协议的便携式手持设备(例如,蜂窝电话、计算平板电脑、个人数字助理(PDA))或可穿戴设备(例如,Google头戴式显示器)。客户端计算设备可以是通用个人计算机,作为示例,包括,运行各种版本的MicrosoftApple和/或Linux操作系统的个人计算机和/或笔记本计算机。客户端计算设备可以是运行任何各种商用或类UNIX操作系统,包括但不限于诸如像Google ChromeOS的各种GNU/Linux操作系统的工作站计算机。可替代地或附加地,客户端计算设备602、604、606和608可以是能够通过(一个或多个)网络610通信的任何其它电子设备,诸如瘦客户端计算机、启用互联网的游戏系统(例如,具有或不具有手势输入设备的Microsoft Xbox游戏控制台)和/或个人消息传送设备。
虽然示例性分布式系统600被示为具有四个客户端计算设备,但是任何数量的客户端计算设备都可以被支持。诸如具有传感器的设备等的其它设备可以与服务器612交互。
在分布式系统600中的(一个或多个)网络610可以是对本领域技术人员熟悉的、可以支持利用包括但不限于TCP/IP(传输控制协议/互联网协议)、SNA(系统网络体系结构)、IPX(互联网数据包交换)、AppleTalk等任何各种商用协议的数据通信的任何类型的网络。仅仅作为示例,(一个或多个)网络610可以是局域网(LAN),诸如基于以太网、记号环等的局域网。(一个或多个)网络610可以是广域网和互联网。它可以包括虚拟网络,包括但不限于,虚拟专用网(VPN)、内联网、外联网、公共交换电话网(PSTN)、红外网络、无线网络(例如,在任何电气和电子协会(IEEE)802.11协议套件、蓝牙和/或任何其它无线协议下操作的网络);和/或这些和/或其它网络的任意组合。
服务器612可以包括一个或多个通用计算机、专用服务器计算机(作为示例,包括PC(个人计算机)服务器、服务器、中档服务器、大型计算机、机架式服务器等)、服务器场、服务器集群或者任何其它适当的布置和/或组合。在各种实施例中,服务器612可以适于运行上述公开内容中描述的一个或多个服务或软件应用。例如,服务器612可以与用于执行上述根据本公开内容的实施例的处理的服务器对应。
服务器612可以运行操作系统,包括任何以上讨论的操作系统,以及任何商用的服务器操作系统。服务器612也可以运行任何各种附加的服务器应用和/或中间层应用,包括HTTP(超文本传输协议)服务器、FTP(文件传输协议)服务器、CGI(公共网关接口)服务器、服务器、数据库服务器等。示例性数据库服务器包括但不限于来自Oracle、Microsoft、Sybase、IBM(国际商业机器公司)等的那些商用数据库服务器。
在一些实现中,服务器612可以包括分析和整合从客户端计算设备602、604、606和608的用户接收到的数据馈送和/或事件更新的一个或多个应用。作为示例,数据馈送和/或事件更新可以包括,但不限于,馈送、更新或者从一个或多个第三方信息源和连续数据流接收到的实时更新,其可以包括与传感器数据应用、金融报价机、网络性能测量工具(例如,网络监视和流量管理应用)、点击流分析工具、汽车交通监视等相关的实时事件。服务器612也可以包括经由客户端计算设备602、604、606和608中的一个或多个显示设备显示数据馈送和/或实时事件的一个或多个应用。
分布式系统600也可以包括一个或多个数据库614和616。数据库614和616可以驻留在各种位置中。作为示例,数据库614和616中的一个或多个可以驻留在服务器612本地的非暂态存储介质上(和/或驻留在服务器612中)。可替代地,数据库614和616可以远离服务器612,并且经由基于网络的或专用的连接与服务器612通信。在一组实施例中,数据库614和616可以驻留在存储区域网络(SAN)中。类似地,用于执行属于服务器612的功能的任何必要的文件可以根据需要存储在服务器612本地上和/或远程地存储。在一组实施例,数据库614和616可以包括适于响应于SQL格式的命令来存储、更新和检索数据的关系数据库,诸如由提供的数据库。
图7是根据本公开内容实施例的系统环境700的一个或多个组件的简化框图,通过该系统环境的一个或多个组件,由实施例系统的一个或多个组件提供的服务可以作为云服务提供。在所示的实施例中,系统环境700包括可由用户使用以与提供云服务的云基础设施系统702交互的一个或多个客户端计算设备704、706和708。客户端计算设备可以被配置为操作可以被客户端计算设备的用户使用来与云基础设施系统702交互,以使用由云基础设施系统702提供的服务的客户端应用,诸如web浏览器、专有客户端应用(例如,OracleForms)或一些其它应用。
应当认识到的是,在该图中绘出的云基础设施系统702可以具有除了所绘出的那些之外的其它组件。此外,在该图中示出的实施例只是可以结合本发明实施例的云基础设施系统的一个示例。在一些其它实施例中,云基础设施系统702可以具有比在该图中示出的组件更多或更少的组件、可以合并两个或更多个组件、或者可以具有不同的组件配置或布置。
客户端计算设备704、706和708可以是类似于上述用于602、604、606和608的那些设备。
虽然示例性系统环境700被示为具有三个客户端计算设备,但是任何数量的客户端计算设备都可以被支持。诸如具有传感器的设备等的其它设备可以与云基础设施系统702交互。
(一个或多个)网络710可以促进客户端704、706和708与云基础设施系统702之间的通信和数据交换。每个网络可以是对本领域技术人员熟悉的、可以支持利用任何各种商业协议的数据通信的任何类型的网络,包括上述用于(一个或多个)网络610的那些网络。
云基础设施系统702可以包括一个或多个计算机和/或服务器,其可以包括上述用于服务器612的那些服务器。
在某些实施例中,由云基础设施系统提供的服务可以包括可以让云基础设施系统的用户按需使用的托管的服务,诸如在线数据存储和备份解决方案、基于Web的电子邮件服务、托管的办公套件和文档协作服务、数据库处理、受管理的技术支持服务等。由云基础设施系统提供的服务可以动态地扩展,以满足其用户的需求。由云基础设施系统提供的服务的具体实例在本文中被称为“服务实例”。一般而言,来自云服务提供商系统的、经由诸如互联网的通信网络对用户可用的任何服务被称为“云服务”。通常,在公共云环境中,构成云服务提供商的系统的服务器和系统与客户自己的办公场所服务器和系统不同。例如,云服务提供商的系统可以托管应用,并且用户可以经由诸如互联网的通信网络按需订购和使用应用。
在一些示例中,在计算机网络云基础设施中的服务可以包括对由云供应商提供给用户的存储、托管的数据库、托管的web服务器、软件应用或其它服务的受保护的计算机网络访问,或者如以其它方式在本领域中已知的。例如,服务可以包括通过互联网对云上远程存储的密码保护的访问。作为另一个示例,服务可以包括用于被联网的开发人员私人使用的基于web服务的托管的关系数据库和脚本语言中间件引擎。作为另一个示例,服务可以包括对在云供应商的网站上托管的电子邮件软件应用的访问。
在某些实施例中,云基础设施系统702可以包括以自助服务、基于订阅、弹性可扩展、可靠、高可用性并且安全的方式交付给客户的一套应用、中间件和数据库服务产品。这种云基础设施系统的示例是由本受让人提供的公共云。
在某些实施例中,云基础设施系统702可以适于自动供应、管理和跟踪客户对由云基础设施系统702提供的服务的订阅。云基础设施系统702可以经由不同的部署模型来提供云服务。例如,服务可以在公共云模型下提供,其中云基础设施系统702由销售云服务的组织拥有(例如,被Oracle拥有)并且使得服务对一般公众和不同行业的企业可用。作为另一个示例,服务可以在私有云模型下提供,其中云基础设施系统702只为单个组织运营并且可以为该组织内的一个或多个实体提供服务。云服务也可以在社区云模型下提供,其中云基础设施系统702和由云基础设施系统702提供的服务被相关社区中的若干个组织共享。云服务也可以在混合云模型下提供,它是两种或更多种不同模型的组合。
在一些实施例中,由云基础设施系统702提供的服务可以包括在软件即服务(SaaS)类别、平台即服务(PaaS)类别、基础设施即服务(IaaS)类别、或包括混合服务的其它服务类别下提供的一个或多个服务。客户经由订阅订单可以订购由云基础设施系统702提供的一个或多个服务。云基础设施系统702然后执行处理,以提供客户的订阅订单中的服务。
在一些实施例中,由云基础设施系统702提供的服务可以包括但不限于应用服务、平台服务和基础设施服务。在一些实例中,应用服务可以由云基础设施系统经由SaaS平台提供。SaaS平台可以被配置为提供属于SaaS类别的云服务。例如,SaaS平台可以提供在集成的开发和部署平台上构建和交付点播应用套件的能力。SaaS平台可以管理和控制用于提供SaaS服务的底层软件和基础设施。通过利用由SaaS平台提供的服务,客户可以利用在云基础设施系统上执行的应用。客户可以获取应用服务,而无需客户购买单独的许可证和支持。可以提供各种不同的SaaS服务。示例包括但不限于为大型组织提供用于销售绩效管理、企业集成和业务灵活性的解决方案的服务。
在一些实施例中,平台服务可以由云基础设施系统经由PaaS平台提供。PaaS平台可以被配置为提供属于PaaS类别的云服务。平台服务的示例可以包括但不限于,使组织(诸如)能够在共享的公共体系架构上整合现有应用,以及利用由平台提供的共享服务构建新应用的能力的服务。PaaS平台可以管理和控制用于提供PaaS服务的底层软件和基础设施。客户可以获得由云基础设施系统提供的PaaS服务,而无需客户购买单独的许可证和支持。平台服务的示例包括但不限于 Java云服务( Java CloudService,JCS)、数据云服务( Database Cloud Service,DBCS)以及其它服务。
通过利用由PaaS平台提供的服务,客户可以采用由云基础设施系统支持的编程语言和工具,并且还控制所部署的服务。在一些实施例中,由云基础设施系统提供的平台服务可以包括数据库云服务、中间件云服务(例如,Oracle Fusion Middleware服务)和Java云服务。在一个实施例中,数据库云服务可以支持共享服务部署模型,其使得组织能够汇集数据库资源并且以数据库云的形式向客户提供数据库即服务。中间件云服务可以为客户提供开发和部署各种业务应用的平台,以及Java云服务可以在云基础设施系统中为客户提供部署Java应用的平台。
可以由云基础设施系统中的IaaS平台提供各种不同的基础设施服务。基础设施服务促进底层计算资源(诸如存储装置、网络和其它基本计算资源)的管理和控制,以便客户利用由SaaS平台和PaaS平台提供的服务。
在某些实施例中,云基础设施系统702还可以包括基础设施资源730,用于提供用来向云基础设施系统的客户提供各种服务的资源。在一个实施例中,基础设施资源730可以包括执行由PaaS平台和SaaS平台提供的服务的硬件(诸如服务器、存储装置和联网资源)的预先集成和优化组合。
在一些实施例中,在云基础设施系统702中的资源可以由多个用户共享并且按需动态地重新分配。此外,资源可以分配给在不同时区中的用户。例如,云基础设施系统730可以使第一时区内的第一用户集合能够利用云基础设施系统的资源指定的小时数,然后使得能够将相同资源重新分配给位于不同时区中的另一用户集合,从而最大化资源的利用率。
在某些实施例中,可以提供由云基础设施系统702的不同组件或模块以及由云基础设施系统702提供的服务共享的多个内部共享服务732。这些内部共享服务可以包括,但不限于,安全性和身份服务、集成服务、企业储存库服务、企业管理器服务、病毒扫描和白名单服务、高可用性、备份和恢复服务、用于启用云支持的服务、电子邮件服务、通知服务、文件传输服务等。
在某些实施例中,云基础设施系统702可以在云基础设施系统中提供云服务(例如,SaaS、PaaS和IaaS服务)的综合管理。在一个实施例中,云管理功能可以包括用于供应、管理和跟踪由云基础设施系统702接收到的客户的订阅等的能力。
在一个实施例中,如在该图中所绘出的,云管理功能可以由诸如订单管理模块720、订单编制模块722、订单供应模块724、订单管理和监视模块726以及身份管理模块728的一个或多个模块提供。这些模块可以包括一个或多个计算机和/或服务器或者利用一个或多个计算机和/或服务器来提供,该一个或多个计算机和/或服务器可以是通用计算机、专用服务器计算机、服务器场、服务器集群或任何其它适当的布置和/或组合。
在示例性操作734中,使用客户端设备(诸如客户端设备704、706或708)的客户可以通过请求由云基础设施系统702提供的一个或多个服务并且对由云基础设施系统702提供的一个或多个服务的订阅下订单来与云基础设施系统702交互。在某些实施例中,客户可以访问云用户界面(UI)、云UI 712、云UI 714和/或云UI 716并经由这些UI下订阅订单。响应于客户下订单而由云基础设施系统702接收到的订单信息可以包括识别客户和客户打算订阅的由云基础设施系统702提供的一个或多个服务的信息。
在客户下订单之后,订单信息经由云UI 712、714和/或716被接收。
在操作736,订单被存储在订单数据库718中。订单数据库718可以是由云基础设施系统702操作和结合其它系统元素操作的若干个数据库之一。
在操作738,订单信息被转发到订单管理模块720。在一些情况下,订单管理模块720可以被配置为执行与订单相关的计费和记帐功能,诸如验证订单,并且在通过验证时,预订订单。
在操作740,关于订单的信息被传送到订单编排模块722。订单编排模块722可以利用订单信息为客户下的订单编排服务和资源的供应。在一些情况下,订单编排模块722可以编排资源的供应,以利用订单供应模块724的服务支持订阅的服务。
在某些实施例中,订单编排模块722使得能够管理与每个订单关联的业务流程,并且应用业务逻辑来确定订单是否应当继续供应。在操作742,当接收到新订阅的订单时,订单编排模块722向订单供应模块724发送分配资源和配置履行订阅订单所需的那些资源的请求。订单供应模块724使得能够为由客户订购的服务分配资源。订单供应模块724在由云基础设施系统700提供的云服务和用来供应用于提供所请求的服务的资源的物理实现层之间提供抽象层。订单编排模块722可以因此与实现细节隔离,诸如服务和资源是实际上被实时供应还是预先被供应并且仅在请求时才进行分配/指定。
在操作744,一旦供应了服务和资源,就可以通过云基础设施系统702的订单供应模块724向客户端设备704、706和/或708上的客户发送所提供的服务的通知。
在操作746,可以由订单管理和监视模块726来管理和跟踪客户的订阅订单。在一些情况下,订单管理和监视模块726可以被配置为收集订阅订单中的服务的使用统计数据,诸如所使用的存储量、所传送的数据量、用户的数量、以及系统运行时间和系统停机时间的量。
在某些实施例中,云基础设施系统702可以包括身份管理模块728。身份管理模块728可以被配置为提供身份服务,诸如云基础设施系统702中的访问管理和授权服务。在一些实施例中,身份管理模块728可以控制关于希望利用由云基础设施系统702提供的服务的客户的信息。这种信息可以包括认证这种客户的身份的信息和描述那些客户被授权相对于各种系统资源(例如,文件、目录、应用、通信端口、存储器段等)执行哪些动作的信息。身份管理模块728也可以包括关于每个客户的描述性信息和关于如何和由谁来访问和修改描述性信息的管理。
图8示出了其中可以实现本发明各种实施例的示例性计算机系统800。系统800可以用来实现上述计算机系统中的任何一个。如图所示,计算机系统800包括经由总线子系统802与多个外围子系统通信的处理单元804。这些外围子系统可以包括处理加速单元806、I/O子系统808、存储子系统818和通信子系统824。存储子系统818包括有形的计算机可读存储介质822和系统存储器810。
总线子系统802提供了用于让计算机系统800的各种组件和子系统按意图彼此通信的机制。虽然总线子系统802被示意性地示为单条总线,但是总线子系统的可替代实施例可以利用多条总线。总线子系统802可以是若干种类型的总线结构中的任何一种,包括存储器总线或存储器控制器、外围总线、以及利用任何各种总线体系架构的局部总线。例如,这些体系架构可以包括工业标准体系架构(ISA)总线、微通道体系架构(MCA)总线、增强型ISA(EISA)总线、视频电子标准协会(VESA)局部总线和外围组件互连(PCI)总线,其可以实现为按IEEE P1386.1标准制造的夹层(Mezzanine)总线。
可以实现为一个或多个集成电路(例如,常规的微处理器或微控制器)的处理单元804控制计算机系统800的操作。一个或多个处理器可以包括在处理单元804中。这些处理器可以包括单核或多核处理器。在某些实施例中,处理单元804可以实现为一个或多个独立的处理单元832和/或834,其中在每个处理单元中包括单核或多核处理器。在其它实施例中,处理单元804也可以实现为通过将两个双核处理器集成到单个芯片中形成的四核处理单元。
在各种实施例,处理单元804可以响应于程序代码执行各种程序并且可以维护多个并发执行的程序或进程。在任何给定时间,要执行的程序代码中的一些或全部可以驻留在(一个或多个)处理器804中和/或存储子系统818中。通过适当的编程,(一个或多个)处理器804可以提供上述各种功能。计算机系统800可以附加地包括处理加速单元806,其可以包括数字信号处理器(DSP)、专用处理器等。
I/O子系统808可以包括用户接口输入设备和用户接口输出设备。用户接口输入设备可以包括键盘、诸如鼠标或轨迹球的指示设备、结合到显示器中的触摸板或触摸屏、滚轮、点拨轮、拨盘、按钮、开关、键板、具有语音命令识别系统的音频输入设备、麦克风以及其它类型的输入设备。用户接口输入设备可以包括,例如,诸如Microsoft 运动传感器的运动感测和/或姿势识别设备,其使得用户能够通过利用姿势和口语命令的自然用户界面控制诸如Microsoft 360游戏控制器的输入设备并与其交互。用户接口输入设备也可以包括眼睛姿势识别设备,诸如从用户检测眼睛活动(例如,当拍摄图片和/或进行菜单选择时的“眨眼”)并将眼睛姿势变换为到输入设备(例如,Google )中的输入的Google 眨眼检测器。此外,用户接口输入设备可以包括使用户能够通过语音命令与语音识别系统(例如,导航器)交互的语音识别感测设备。
用户接口输入设备也可以包括,但不限于,三维(3D)鼠标、操纵杆或指示杆、游戏板和绘图平板、以及音频/视频设备,诸如扬声器、数码相机、数码摄像机、便携式媒体播放器、网络摄像机、图像扫描仪、指纹扫描仪、条形码读取器3D扫描仪、3D打印机、激光测距仪、以及眼睛注视跟踪设备。此外,用户接口输入设备可以包括,例如,医疗成像输入设备,诸如计算机断层扫描、磁共振成像、正电子发射断层摄影术、医疗超声设备。用户接口输入设备也可以包括,例如,音频输入设备,诸如MIDI键盘、数字乐器等。
用户接口输出设备可以包括显示子系统、指示器灯或诸如音频输出设备的非视觉显示器等。显示子系统可以是阴极射线管(CRT)、诸如利用液晶显示器(LCD)或等离子显示器的平板设备、投影设备、触摸屏等。一般而言,术语“输出设备”的使用旨在包括用于从计算机系统800向用户或其它计算机输出信息的所有可能类型的设备和机制。例如,用户接口输出设备可以包括但不限于,可视地传达文本、图形和音频/视频信息的各种显示设备,诸如监视器、打印机、扬声器、耳机、汽车导航系统、绘图仪、语音输出设备和调制解调器。
计算机系统800可以包括存储子系统818,其包括被示为当前位于系统存储器810内的软件元素。系统存储器810可以存储可加载并且可在处理单元804上执行的程序指令,以及在这些程序执行期间生成的数据。
依赖于计算机系统800的配置和类型,系统存储器810可以是易失性的(诸如随机存取存储器(RAM))和/或非易失性的(诸如只读存储器(ROM)、闪存存储器,等等)。RAM通常包含可被处理单元804立即访问和/或目前正被处理单元804操作和执行的数据和/或程序模块。在一些实现中,系统存储器810可以包括多种不同类型的存储器,诸如静态随机存取存储器(SRAM)或动态随机存取存储器(DRAM)。在一些实现中,诸如在启动期间,包含有助于在计算机系统800内的元素之间传送信息的基本例程的基本输入/输出系统(BIOS)通常可以存储在ROM中。作为示例,而不是限制,系统存储器810还示出了可以包括客户端应用、Web浏览器、中间层应用、关系数据库管理系统(RDBMS)等的应用程序812、程序数据814以及操作系统816。作为示例,操作系统816可以包括各种版本的MicrosoftApple和/或Linux操作系统、各种商用或类UNIX操作系统(包括但不限于各种GNU/Linux操作系统、Google 操作系统等)和/或诸如iOS、Phone、 OS、8OS和 OS操作系统的移动操作系统。
存储子系统818也可以提供用于存储提供一些实施例的功能的基本编程和数据结构的有形计算机可读存储介质。当被处理器执行时提供上述功能的软件(程序、代码模块、指令)可以存储在存储子系统818中。这些软件模块或指令可以被处理单元804执行。存储子系统818也可以提供用于存储根据本发明被使用的数据的储存库。
存储子系统818也可以包括计算机可读存储介质读取器820,其可以进一步连接到计算机可读存储介质822。可选地,与系统存储器810一起和组合,计算机可读存储介质822可以全面地表示用于临时和/或更持久地包含、存储、传送和检索计算机可读信息的远程、本地、固定和/或可移动存储设备加存储介质。
包含代码或代码的部分的计算机可读存储介质822也可以包括本领域已知或使用的任何适当的介质,包括存储介质和通信介质,诸如但不限于,以用于信息的存储和/或传输的任何方法或技术实现的易失性和非易失性、可移动和不可移动介质。这可以包括有形的计算机可读存储介质,诸如RAM、ROM、电可擦除可编程ROM(EEPROM)、闪存存储器或其它存储器技术、CD-ROM、数字多功能盘(DVD)或其它光存储装置、磁带盒、磁带、磁盘存储或其它磁存储设备、或其它有形的计算机可读介质。这也可以包括非有形的计算机可读介质,诸如数据信号、数据传输,或者可以用来传送期望的信息并且可以被计算机系统800访问的任何其它介质。
作为示例,计算机可读存储介质822可以包括从不可移动的非易失性磁介质读取或写到其的硬盘驱动器、从可移动的非易失性磁盘读取或写到其的磁盘驱动器、以及从可移动的非易失性光盘,诸如CD ROM、DVD和盘或其它光学介质,读取或写到其的光盘驱动器。计算机可读存储介质822可以包括,但不限于,驱动器、闪存卡、通用串行总线(USB)闪存驱动器、安全数字(SD)卡、DVD盘、数字音频带等。计算机可读存储介质822也可以包括基于非易失性存储器的固态驱动器(SSD),诸如基于闪存存储器的SSD、企业闪存驱动器、固态ROM等,基于易失性存储器的SSD,诸如固态RAM、动态RAM、静态RAM,基于DRAM的SSD,磁阻RAM(MRAM)SSD,以及使用DRAM和基于闪存存储器的SSD的组合的混合SSD。盘驱动器及其关联的计算机可读介质可以为计算机系统800提供计算机可读指令、数据结构、程序模块及其它数据的非易失性存储装置。
通信子系统824提供到其它计算机系统和网络的接口。通信子系统824用作用于从其它系统接收数据和从计算机系统800向其它系统传送数据的接口。例如,通信子系统824可以使计算机系统800能够经由互联网连接到一个或多个设备。在一些实施例中,通信子系统824可以包括用于访问无线语音和/或数据网络的射频(RF)收发器组件(例如,利用蜂窝电话技术,诸如3G、4G或EDGE(用于全球演进的增强型数据速率)的先进数据网络技术,Wi-Fi(IEEE802.11系列标准),或其它移动通信技术,或其任意组合)、全球定位系统(GPS)接收器组件和/或其它组件。在一些实施例中,作为无线接口的附加或替代,通信子系统824可以提供有线网络连接(例如,以太网)。
在一些实施例中,通信子系统824也可以代表可能使用计算机系统800的一个或多个用户以结构化和/或非结构化的数据馈送826、事件流828、事件更新830等形式接收输入通信。
作为示例,通信子系统824可以被配置为实时地从社交网络和/或其它通信服务的用户接收数据馈送826,诸如馈送、更新、诸如丰富站点摘要(RSS)馈送的web馈送和/或来自一个或多个第三方信息源的实时更新。
此外,通信子系统824也可以被配置为以连续数据流的形式接收本质上可能是连续的或无界的没有明确结束的数据,其中连续数据流可以包括实时事件的事件流828和/或事件更新830。生成连续数据的应用的示例可以包括例如传感器数据应用、金融报价机、网络性能测量工具(例如网络监视和流量管理应用)、点击流分析工具、汽车流量监视等。
通信子系统824也可以被配置为向一个或多个数据库输出结构化和/或非结构化的数据馈送826、事件流828、事件更新830等,其中这一个或多个数据库可以与耦合到计算机系统800的一个或多个流数据源计算机通信。
计算机系统800可以是各种类型中的一种,包括手持便携式设备(例如,蜂窝电话、计算平板、PDA)、可穿戴设备(例如,Google 头戴式显示器)、PC、工作站、大型机、信息站、服务器机架或任何其它数据处理系统。
由于计算机和网络不断变化的本质,在该图中绘出的计算机系统800的描述旨在仅仅作为具体示例。具有比该图中所绘出的系统更多或更少组件的许多其它配置是可能的。例如,定制的硬件也可以被使用和/或特定的元素可以用硬件、固件、软件(包括applets)或其组合来实现。另外,可以采用到诸如网络输入/输出设备的其它计算设备的连接。基于本文所提供的公开内容和教导,本领域普通技术人员将认识到实现各种实施例的其它方式和/或方法。
在前面的描述中,为了说明的目的,阐述了众多具体细节,以便提供对本发明各种实施例的透彻理解。但是,对本领域技术人员降显而易见的是,可以在没有这些具体细节中的一些的情况下实践本发明的实施例。在其它情况下,众所周知的结构和设备以框图形式示出。
前面的描述仅仅提供示例性实施例,并不意在限制本公开内容的范围、适用性或配置。相反,示例性实施例的前面描述将为本领域技术人员提供实现示例性实施例的使能描述。应当理解的是,在不背离如所附权利要求中阐述的本发明的精神和范围的情况下,可以对元件的功能和布置进行各种改变。
在前面的描述中给出了具体细节,以提供对实施例的透彻理解。但是,本领域普通技术人员将理解的是,可以在没有这些具体细节的情况下实践实施例。例如,电路、系统、网络、处理和其它组件可以以框图的形式被示为组件,以便不以不必要的细节模糊实施例。在其它情况下,可以以不必要的细节显示众所周知的电路、处理、算法、结构和技术,以避免模糊实施例。
而且,应当指出的是,各种实施例可以被描述为被绘制为流程表、流程图、数据流程图、结构图或框图的处理。虽然流程图可以将操作描述为顺序的处理,但是许多操作可以被并行或并发地执行。此外,操作的顺序可以被重新布置。处理在其操作完成时被终止,但是可以具有未包括在附图中的附加步骤。处理可以与方法、函数、过程(procedure)、子例程、子程序等对应。当处理与函数对应时,其终止可以与函数返回到调用函数或主函数对应。
术语“计算机可读介质”包括但不限于便携式或固定存储设备、光存储设备、无线信道,以及能够存储、包含或携带(一条或多条)指令/或数据的各种其它介质。代码段或机器可执行指令可以表示过程(procedure)、函数、子程序、程序、例程、子例程、模块、软件包、类、或指令、数据结构或程序语句的任何组合。代码段可以通过传递和/或接收信息、数据、自变量、参数或存储器内容耦合到另一代码段或硬件电路。信息、自变量、参数、数据等可以经由包括存储器共享、消息传递、记号传递、网络传输等的任何合适的手段来传递、转发或发送。
此外,实施例可以通过硬件、软件、固件、中间件、微代码、硬件描述语言或其任意组合来实现。当用软件、固件、中间件或微代码来实现时,执行必要任务的程序代码或代码段可以存储在机器可读介质中。(一个或多个)处理器可以执行这些必要的任务。
在前面的说明书中,参照本发明的具体实施例描述了本发明的各方面,但是本领域技术人员将认识到本发明不限于此。上述发明的各种特征和方面可以单独使用或共同使用。另外,在不背离本说明书的更广泛的精神和范围的情况下,实施例可以用在超出本文所述的任何数量的环境和应用中。因而,说明书和附图应当被认为是说明性而不是限制性的。
此外,为了说明的目的,以特定的次序描述了方法。应当认识到的是,在替代实施例中,方法可以以与所描述的次序不同的次序执行。还应当认识到的是,上述方法可以由硬件组件执行或者可以以机器可执行指令的序列来体现,机器可执行指令可以用来使诸如通用或专用处理器或用所述指令编程的逻辑电路的机器执行所述方法。这些机器可执行指令可以存储在一个或多个机器可读介质上,诸如CD-ROM或其它类型的光盘、软盘、ROM、RAM、EPROM、EEPROM、磁卡或光卡、闪存、或适于存储电子指令的其它类型的机器可读介质。可替代地,所述方法可以通过硬件和软件的组合来执行。

Claims (20)

1.一种在语言之间映射计算机域本体的方法,所述方法包括:
使用计算机系统接收第一语言的第一本体,其中第一本体由第一多个词元和所述多个词元之间的多个关系组成;
使用所述计算机系统接收第二语言的第二多个词元;
使用所述计算机系统将第二语言的所述第二多个词元中的每一个词元映射到第一语言的所述第一多个词元中的相应词元;及
使用所述计算机系统,通过使用第一本体中的所述多个关系创建第二语言的所述第二多个词元之间的关系来生成第二语言的第二本体。
2.如权利要求1所述的方法,其中第一本体包括与语言无关的本体,所述与语言无关的本体编码由所述第一多个词元表示的概念之间的关系。
3.如权利要求1所述的方法,其中所述第二多个词元是从第二语言的web域的版本生成的。
4.如权利要求3所述的方法,其中所述第一多个词元是从第一语言的所述web域的版本生成的。
5.如权利要求1所述的方法,其中所述第二多个词元包括在语料库中出现至少预定次数的小于预定长度的n元语法。
6.如权利要求1所述的方法,其中第一本体的所述多个关系被直接插入第二本体。
7.如权利要求1所述的方法,其中将第二语言的所述第二多个词元中的每一个词元映射到第一语言的所述第一多个词元中的相应词元包括将第二语言的所述第二多个词元翻译成第一语言。
8.一种包括指令的非暂态计算机可读介质,所述指令在由一个或多个处理器执行时使所述一个或多个处理器执行以下操作:
接收第一语言的第一本体,其中第一本体由第一多个词元和所述多个词元之间的多个关系组成;
接收第二语言的第二多个词元;
将第二语言的所述第二多个词元中的每一个词元映射到第一语言的所述第一多个词元中的相应词元;及
通过使用第一本体中的所述多个关系创建第二语言的所述第二多个词元之间的关系来生成第二语言的第二本体。
9.如权利要求8所述的非暂态计算机可读介质,其中第一本体包括与语言无关的本体,所述与语言无关的本体编码由所述第一多个词元表示的概念之间的关系。
10.如权利要求8所述的非暂态计算机可读介质,其中所述第二多个词元是从第二语言的web域的版本生成的。
11.如权利要求11所述的非暂态计算机可读介质,其中所述第一多个词元是从第一语言的所述web域的版本生成的。
12.如权利要求8所述的非暂态计算机可读介质,其中所述第二多个词元包括在语料库中出现至少预定次数的小于预定长度的n元语法。
13.如权利要求8所述的非暂态计算机可读介质,其中第一本体的所述多个关系被直接插入第二本体。
14.如权利要求8所述的非暂态计算机可读介质,其中将第二语言的所述第二多个词元中的每一个词元映射到第一语言的所述第一多个词元中的相应词元包括将第二语言的所述第二多个词元翻译成第一语言。
15.一种系统,包括:
一个或多个处理器;及
包括指令的一个或多个存储器设备,所述指令在由所述一个或多个处理器执行时使所述一个或多个处理器执行以下操作:
接收第一语言的第一本体,其中第一本体由第一多个词元和所述多个词元之间的多个关系组成;
接收第二语言的第二多个词元;
将第二语言的所述第二多个词元中的每一个词元映射到第一语言的所述第一多个词元中的相应词元;及
通过使用第一本体中的所述多个关系创建第二语言的所述第二多个词元之间的关系来生成第二语言的第二本体。
16.如权利要求15所述的系统,其中第一本体包括与语言无关的本体,所述与语言无关的本体编码由所述第一多个词元表示的概念之间的关系。
17.如权利要求15所述的系统,其中所述第二多个词元是从第二语言的web域的版本生成的。
18.如权利要求17所述的系统,其中所述第一多个词元是从第一语言的所述web域的版本生成的。
19.如权利要求15所述的系统,其中所述第二多个词元包括在语料库中出现至少预定次数的小于预定长度的n元语法。
20.如权利要求15所述的系统,其中第一本体的所述多个关系被直接插入第二本体。
CN201580060929.6A 2014-11-10 2015-10-14 计算机自然语言处理中通用本体的词元映射 Active CN107077466B (zh)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
US201462077868P 2014-11-10 2014-11-10
US201462077887P 2014-11-10 2014-11-10
US62/077,887 2014-11-10
US62/077,868 2014-11-10
US14/793,658 2015-07-07
US14/793,658 US9582493B2 (en) 2014-11-10 2015-07-07 Lemma mapping to universal ontologies in computer natural language processing
PCT/US2015/055489 WO2016077015A1 (en) 2014-11-10 2015-10-14 Lemma mapping to universal ontologies in computer natural language processing

Publications (2)

Publication Number Publication Date
CN107077466A true CN107077466A (zh) 2017-08-18
CN107077466B CN107077466B (zh) 2019-06-21

Family

ID=55912345

Family Applications (2)

Application Number Title Priority Date Filing Date
CN201580060929.6A Active CN107077466B (zh) 2014-11-10 2015-10-14 计算机自然语言处理中通用本体的词元映射
CN201580060933.2A Pending CN107111608A (zh) 2014-11-10 2015-10-14 从语言输入数据自动生成n‑元和概念关系

Family Applications After (1)

Application Number Title Priority Date Filing Date
CN201580060933.2A Pending CN107111608A (zh) 2014-11-10 2015-10-14 从语言输入数据自动生成n‑元和概念关系

Country Status (5)

Country Link
US (3) US9842102B2 (zh)
EP (2) EP3218821A1 (zh)
JP (3) JP6279153B2 (zh)
CN (2) CN107077466B (zh)
WO (2) WO2016077016A1 (zh)

Families Citing this family (148)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8677377B2 (en) 2005-09-08 2014-03-18 Apple Inc. Method and apparatus for building an intelligent automated assistant
US9318108B2 (en) 2010-01-18 2016-04-19 Apple Inc. Intelligent automated assistant
US8977255B2 (en) 2007-04-03 2015-03-10 Apple Inc. Method and system for operating a multi-function portable electronic device using voice-activation
US10002189B2 (en) 2007-12-20 2018-06-19 Apple Inc. Method and apparatus for searching using an active ontology
US9330720B2 (en) 2008-01-03 2016-05-03 Apple Inc. Methods and apparatus for altering audio output signals
US8676904B2 (en) 2008-10-02 2014-03-18 Apple Inc. Electronic devices with voice command and contextual data processing capabilities
US10706373B2 (en) 2011-06-03 2020-07-07 Apple Inc. Performing actions associated with task items that represent tasks to perform
US10276170B2 (en) 2010-01-18 2019-04-30 Apple Inc. Intelligent automated assistant
US8682667B2 (en) 2010-02-25 2014-03-25 Apple Inc. User profiling for selecting user specific voice input processing information
US9262612B2 (en) 2011-03-21 2016-02-16 Apple Inc. Device access using voice authentication
US10057736B2 (en) 2011-06-03 2018-08-21 Apple Inc. Active transport based notifications
US10134385B2 (en) 2012-03-02 2018-11-20 Apple Inc. Systems and methods for name pronunciation
US10417037B2 (en) 2012-05-15 2019-09-17 Apple Inc. Systems and methods for integrating third party services with a digital assistant
CN104969289B (zh) 2013-02-07 2021-05-28 苹果公司 数字助理的语音触发器
US10652394B2 (en) 2013-03-14 2020-05-12 Apple Inc. System and method for processing voicemail
US10748529B1 (en) 2013-03-15 2020-08-18 Apple Inc. Voice activated device for use with a voice-based digital assistant
WO2014197335A1 (en) 2013-06-08 2014-12-11 Apple Inc. Interpreting and acting upon commands that involve sharing information with remote devices
US10176167B2 (en) 2013-06-09 2019-01-08 Apple Inc. System and method for inferring user intent from speech inputs
KR101959188B1 (ko) 2013-06-09 2019-07-02 애플 인크. 디지털 어시스턴트의 둘 이상의 인스턴스들에 걸친 대화 지속성을 가능하게 하기 위한 디바이스, 방법 및 그래픽 사용자 인터페이스
US10296160B2 (en) 2013-12-06 2019-05-21 Apple Inc. Method for extracting salient dialog usage from live data
US9966065B2 (en) 2014-05-30 2018-05-08 Apple Inc. Multi-command single utterance input method
US10170123B2 (en) 2014-05-30 2019-01-01 Apple Inc. Intelligent assistant for home automation
US9715875B2 (en) 2014-05-30 2017-07-25 Apple Inc. Reducing the need for manual start/end-pointing and trigger phrases
US9633004B2 (en) 2014-05-30 2017-04-25 Apple Inc. Better resolution when referencing to concepts
US9430463B2 (en) 2014-05-30 2016-08-30 Apple Inc. Exemplar-based natural language processing
US9338493B2 (en) 2014-06-30 2016-05-10 Apple Inc. Intelligent automated assistant for TV user interactions
US9818400B2 (en) 2014-09-11 2017-11-14 Apple Inc. Method and apparatus for discovering trending terms in speech requests
US10074360B2 (en) 2014-09-30 2018-09-11 Apple Inc. Providing an indication of the suitability of speech recognition
US9668121B2 (en) 2014-09-30 2017-05-30 Apple Inc. Social reminders
US10127911B2 (en) 2014-09-30 2018-11-13 Apple Inc. Speaker identification and unsupervised speaker adaptation techniques
US9842102B2 (en) 2014-11-10 2017-12-12 Oracle International Corporation Automatic ontology generation for natural-language processing applications
GB2549240A (en) * 2015-01-06 2017-10-18 What3Words Ltd A method for suggesting one or more multi-word candidates based on an input string received at an electronic device
US9218427B1 (en) * 2015-01-21 2015-12-22 Maana, Inc. Dynamic semantic models having multiple indices
US10152299B2 (en) 2015-03-06 2018-12-11 Apple Inc. Reducing response latency of intelligent automated assistants
US9886953B2 (en) 2015-03-08 2018-02-06 Apple Inc. Virtual assistant activation
US9721566B2 (en) 2015-03-08 2017-08-01 Apple Inc. Competing devices responding to voice triggers
US10460227B2 (en) 2015-05-15 2019-10-29 Apple Inc. Virtual assistant in a communication session
US10262061B2 (en) 2015-05-19 2019-04-16 Oracle International Corporation Hierarchical data classification using frequency analysis
US10200824B2 (en) 2015-05-27 2019-02-05 Apple Inc. Systems and methods for proactively identifying and surfacing relevant content on a touch-sensitive device
US10083688B2 (en) 2015-05-27 2018-09-25 Apple Inc. Device voice control for selecting a displayed affordance
US10042998B2 (en) * 2015-06-04 2018-08-07 International Business Machines Corporation Automatically altering and encrypting passwords in systems
US9578173B2 (en) 2015-06-05 2017-02-21 Apple Inc. Virtual assistant aided communication with 3rd party service in a communication session
US20160378747A1 (en) 2015-06-29 2016-12-29 Apple Inc. Virtual assistant for media playback
US10740384B2 (en) 2015-09-08 2020-08-11 Apple Inc. Intelligent automated assistant for media search and playback
US10331312B2 (en) 2015-09-08 2019-06-25 Apple Inc. Intelligent automated assistant in a media environment
US10747498B2 (en) 2015-09-08 2020-08-18 Apple Inc. Zero latency digital assistant
US10671428B2 (en) 2015-09-08 2020-06-02 Apple Inc. Distributed personal assistant
US20170116180A1 (en) * 2015-10-23 2017-04-27 J. Edward Varallo Document analysis system
US10691473B2 (en) 2015-11-06 2020-06-23 Apple Inc. Intelligent automated assistant in a messaging environment
US10956666B2 (en) 2015-11-09 2021-03-23 Apple Inc. Unconventional virtual assistant interactions
US10049668B2 (en) 2015-12-02 2018-08-14 Apple Inc. Applying neural network language models to weighted finite state transducers for automatic speech recognition
US10223066B2 (en) 2015-12-23 2019-03-05 Apple Inc. Proactive assistance based on dialog communication between devices
US10878191B2 (en) * 2016-05-10 2020-12-29 Nuance Communications, Inc. Iterative ontology discovery
US11227589B2 (en) 2016-06-06 2022-01-18 Apple Inc. Intelligent list reading
US10049663B2 (en) 2016-06-08 2018-08-14 Apple, Inc. Intelligent automated assistant for media exploration
US10586535B2 (en) 2016-06-10 2020-03-10 Apple Inc. Intelligent digital assistant in a multi-tasking environment
DK179415B1 (en) 2016-06-11 2018-06-14 Apple Inc Intelligent device arbitration and control
DK201670540A1 (en) 2016-06-11 2018-01-08 Apple Inc Application integration with a digital assistant
US9948664B2 (en) * 2016-07-11 2018-04-17 Petabi, Inc. Method and system for correlation and management of distributed and heterogeneous events
HK1220319A2 (zh) * 2016-07-29 2017-04-28 李應樵 基於結構化網絡知識的自動中文本體庫建構方法、系統及計算機可讀介質
US10621314B2 (en) * 2016-08-01 2020-04-14 Palantir Technologies Inc. Secure deployment of a software package
US10762297B2 (en) * 2016-08-25 2020-09-01 International Business Machines Corporation Semantic hierarchical grouping of text fragments
US10474753B2 (en) 2016-09-07 2019-11-12 Apple Inc. Language identification using recurrent neural networks
US10043516B2 (en) 2016-09-23 2018-08-07 Apple Inc. Intelligent automated assistant
US10467347B1 (en) 2016-10-31 2019-11-05 Arria Data2Text Limited Method and apparatus for natural language document orchestrator
US10268680B2 (en) * 2016-12-30 2019-04-23 Google Llc Context-aware human-to-computer dialog
US11204787B2 (en) 2017-01-09 2021-12-21 Apple Inc. Application integration with a digital assistant
US11507743B2 (en) * 2017-02-28 2022-11-22 Nice Ltd. System and method for automatic key phrase extraction rule generation
US10417266B2 (en) 2017-05-09 2019-09-17 Apple Inc. Context-aware ranking of intelligent response suggestions
DK201770383A1 (en) 2017-05-09 2018-12-14 Apple Inc. USER INTERFACE FOR CORRECTING RECOGNITION ERRORS
DK180048B1 (en) 2017-05-11 2020-02-04 Apple Inc. MAINTAINING THE DATA PROTECTION OF PERSONAL INFORMATION
US10395654B2 (en) 2017-05-11 2019-08-27 Apple Inc. Text normalization based on a data-driven learning network
US10726832B2 (en) 2017-05-11 2020-07-28 Apple Inc. Maintaining privacy of personal information
DK179496B1 (en) 2017-05-12 2019-01-15 Apple Inc. USER-SPECIFIC Acoustic Models
DK179745B1 (en) 2017-05-12 2019-05-01 Apple Inc. SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT
DK201770427A1 (en) 2017-05-12 2018-12-20 Apple Inc. LOW-LATENCY INTELLIGENT AUTOMATED ASSISTANT
US11301477B2 (en) 2017-05-12 2022-04-12 Apple Inc. Feedback analysis of a digital assistant
DK201770432A1 (en) * 2017-05-15 2018-12-21 Apple Inc. Hierarchical belief states for digital assistants
DK201770431A1 (en) 2017-05-15 2018-12-20 Apple Inc. Optimizing dialogue policy decisions for digital assistants using implicit feedback
US10289615B2 (en) * 2017-05-15 2019-05-14 OpenGov, Inc. Natural language query resolution for high dimensionality data
US10311144B2 (en) 2017-05-16 2019-06-04 Apple Inc. Emoji word sense disambiguation
US20180336892A1 (en) 2017-05-16 2018-11-22 Apple Inc. Detecting a trigger of a digital assistant
US10403278B2 (en) 2017-05-16 2019-09-03 Apple Inc. Methods and systems for phonetic matching in digital assistant services
US10303715B2 (en) 2017-05-16 2019-05-28 Apple Inc. Intelligent automated assistant for media exploration
DK179560B1 (en) 2017-05-16 2019-02-18 Apple Inc. FAR-FIELD EXTENSION FOR DIGITAL ASSISTANT SERVICES
US11397558B2 (en) 2017-05-18 2022-07-26 Peloton Interactive, Inc. Optimizing display engagement in action automation
CA3065911A1 (en) * 2017-06-08 2018-12-13 3M Innovative Properties Company Systems and methods for word filtering in language models
US11544576B2 (en) * 2017-11-14 2023-01-03 International Business Machines Corporation Unified cognition for a virtual personal cognitive assistant of an entity when consuming multiple, distinct domains at different points in time
US11568273B2 (en) 2017-11-14 2023-01-31 International Business Machines Corporation Multi-dimensional cognition for unified cognition in cognitive assistance
US11443196B2 (en) 2017-11-14 2022-09-13 International Business Machines Corporation Unified cognition for a virtual personal cognitive assistant when cognition is embodied across multiple embodied cognition object instances
US10636424B2 (en) 2017-11-30 2020-04-28 Apple Inc. Multi-turn canned dialog
JP7074365B2 (ja) * 2017-12-11 2022-05-24 株式会社レボーン 香り品質特定システム、高機能携帯端末及びプログラム
CN108154395B (zh) * 2017-12-26 2021-10-29 上海新炬网络技术有限公司 一种基于大数据的客户网络行为画像方法
US10963499B2 (en) 2017-12-29 2021-03-30 Aiqudo, Inc. Generating command-specific language model discourses for digital assistant interpretation
US10963495B2 (en) 2017-12-29 2021-03-30 Aiqudo, Inc. Automated discourse phrase discovery for generating an improved language model of a digital assistant
US10929613B2 (en) 2017-12-29 2021-02-23 Aiqudo, Inc. Automated document cluster merging for topic-based digital assistant interpretation
US10176171B1 (en) * 2017-12-29 2019-01-08 Aiqudo, Inc. Language agnostic command-understanding digital assistant
US10733982B2 (en) 2018-01-08 2020-08-04 Apple Inc. Multi-directional dialog
US10872122B2 (en) * 2018-01-30 2020-12-22 Government Of The United States Of America, As Represented By The Secretary Of Commerce Knowledge management system and process for managing knowledge
US10733375B2 (en) 2018-01-31 2020-08-04 Apple Inc. Knowledge-based framework for improving natural language understanding
US10789959B2 (en) 2018-03-02 2020-09-29 Apple Inc. Training speaker recognition models for digital assistants
US10592604B2 (en) 2018-03-12 2020-03-17 Apple Inc. Inverse text normalization for automatic speech recognition
US10671812B2 (en) * 2018-03-22 2020-06-02 Equifax Inc. Text classification using automatically generated seed data
US10818288B2 (en) 2018-03-26 2020-10-27 Apple Inc. Natural assistant interaction
US10909331B2 (en) 2018-03-30 2021-02-02 Apple Inc. Implicit identification of translation payload with neural machine translation
US10928918B2 (en) 2018-05-07 2021-02-23 Apple Inc. Raise to speak
US11145294B2 (en) 2018-05-07 2021-10-12 Apple Inc. Intelligent automated assistant for delivering content from user experiences
US10984780B2 (en) 2018-05-21 2021-04-20 Apple Inc. Global semantic word embeddings using bi-directional recurrent neural networks
DK201870355A1 (en) 2018-06-01 2019-12-16 Apple Inc. VIRTUAL ASSISTANT OPERATION IN MULTI-DEVICE ENVIRONMENTS
DK180639B1 (en) 2018-06-01 2021-11-04 Apple Inc DISABILITY OF ATTENTION-ATTENTIVE VIRTUAL ASSISTANT
DK179822B1 (da) 2018-06-01 2019-07-12 Apple Inc. Voice interaction at a primary device to access call functionality of a companion device
US10892996B2 (en) 2018-06-01 2021-01-12 Apple Inc. Variable latency device coordination
US11386266B2 (en) 2018-06-01 2022-07-12 Apple Inc. Text correction
US10496705B1 (en) 2018-06-03 2019-12-03 Apple Inc. Accelerated task performance
CN110647589B (zh) * 2018-06-08 2021-06-25 北京三快在线科技有限公司 一种语料数据的生成方法、装置、电子设备及存储介质
US11010561B2 (en) 2018-09-27 2021-05-18 Apple Inc. Sentiment prediction from textual data
US11170166B2 (en) 2018-09-28 2021-11-09 Apple Inc. Neural typographical error modeling via generative adversarial networks
US11462215B2 (en) 2018-09-28 2022-10-04 Apple Inc. Multi-modal inputs for voice commands
US10839159B2 (en) 2018-09-28 2020-11-17 Apple Inc. Named entity normalization in a spoken dialog system
US11475898B2 (en) 2018-10-26 2022-10-18 Apple Inc. Low-latency multi-speaker speech recognition
WO2020109277A1 (en) * 2018-11-29 2020-06-04 Koninklijke Philips N.V. Method and system for creating a domain-specific training corpus from generic domain corpora
US11638059B2 (en) 2019-01-04 2023-04-25 Apple Inc. Content playback on multiple devices
US11328007B2 (en) * 2019-02-04 2022-05-10 International Business Machines Corporation Generating a domain-specific phrasal dictionary
US11348573B2 (en) 2019-03-18 2022-05-31 Apple Inc. Multimodality in digital assistant systems
US11423908B2 (en) 2019-05-06 2022-08-23 Apple Inc. Interpreting spoken requests
US11307752B2 (en) 2019-05-06 2022-04-19 Apple Inc. User configurable task triggers
US11475884B2 (en) 2019-05-06 2022-10-18 Apple Inc. Reducing digital assistant latency when a language is incorrectly determined
DK201970509A1 (en) 2019-05-06 2021-01-15 Apple Inc Spoken notifications
US11140099B2 (en) 2019-05-21 2021-10-05 Apple Inc. Providing message response suggestions
US11496600B2 (en) 2019-05-31 2022-11-08 Apple Inc. Remote execution of machine-learned models
US11289073B2 (en) 2019-05-31 2022-03-29 Apple Inc. Device text to speech
DK180129B1 (en) 2019-05-31 2020-06-02 Apple Inc. USER ACTIVITY SHORTCUT SUGGESTIONS
DK201970510A1 (en) 2019-05-31 2021-02-11 Apple Inc Voice identification in digital assistant systems
US11227599B2 (en) 2019-06-01 2022-01-18 Apple Inc. Methods and user interfaces for voice-based control of electronic devices
US11360641B2 (en) 2019-06-01 2022-06-14 Apple Inc. Increasing the relevance of new available information
US11163953B2 (en) 2019-06-12 2021-11-02 International Business Machines Corporation Natural language processing and candidate response evaluation
US11429789B2 (en) 2019-06-12 2022-08-30 International Business Machines Corporation Natural language processing and candidate response identification
US11488406B2 (en) 2019-09-25 2022-11-01 Apple Inc. Text detection using global geometry estimators
US20210097404A1 (en) * 2019-09-26 2021-04-01 Kpmg Llp Systems and methods for creating product classification taxonomies using universal product classification ontologies
US11636847B2 (en) * 2020-03-23 2023-04-25 Sorcero, Inc. Ontology-augmented interface
US11043220B1 (en) 2020-05-11 2021-06-22 Apple Inc. Digital assistant hardware abstraction
US11061543B1 (en) 2020-05-11 2021-07-13 Apple Inc. Providing relevant data items based on context
US11301639B2 (en) * 2020-06-26 2022-04-12 Huawei Technologies Co., Ltd. Methods and systems for generating a reference data structure for anonymization of text data
US11490204B2 (en) 2020-07-20 2022-11-01 Apple Inc. Multi-device audio adjustment coordination
US11438683B2 (en) 2020-07-21 2022-09-06 Apple Inc. User identification using headphones
US11775773B2 (en) 2020-12-15 2023-10-03 Kore.Ai, Inc. Methods for conducting a conversation in an application enabled by a virtual assistant server and devices thereof
TWI800982B (zh) 2021-11-16 2023-05-01 宏碁股份有限公司 文章標記資料的產生裝置及其產生方法
US11977841B2 (en) 2021-12-22 2024-05-07 Bank Of America Corporation Classification of documents

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1834955A (zh) * 2005-03-14 2006-09-20 富士施乐株式会社 多语种翻译存储器、翻译方法以及翻译程序
US20070130194A1 (en) * 2005-12-06 2007-06-07 Matthias Kaiser Providing natural-language interface to repository
US8423350B1 (en) * 2009-05-21 2013-04-16 Google Inc. Segmenting text for searching
US20130260358A1 (en) * 2012-03-28 2013-10-03 International Business Machines Corporation Building an ontology by transforming complex triples
US20140278362A1 (en) * 2013-03-15 2014-09-18 International Business Machines Corporation Entity Recognition in Natural Language Processing Systems
CN104133848A (zh) * 2014-07-01 2014-11-05 中央民族大学 藏语实体知识信息抽取方法

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB9727322D0 (en) 1997-12-29 1998-02-25 Xerox Corp Multilingual information retrieval
JP3768157B2 (ja) * 2001-12-28 2006-04-19 株式会社東芝 他言語オントロジー辞書利用装置及び方法並びにプログラム
JP2005316699A (ja) * 2004-04-28 2005-11-10 Hitachi Ltd コンテンツ公開システム、コンテンツ公開方法、及びコンテンツ公開プログラム
US20060122834A1 (en) 2004-12-03 2006-06-08 Bennett Ian M Emotion detection device & method for use in distributed systems
US7587308B2 (en) * 2005-11-21 2009-09-08 Hewlett-Packard Development Company, L.P. Word recognition using ontologies
JP2007219620A (ja) * 2006-02-14 2007-08-30 Fuji Xerox Co Ltd テキスト検索装置、テキスト検索プログラム、及びテキスト検索方法
US7797303B2 (en) * 2006-02-15 2010-09-14 Xerox Corporation Natural language processing for developing queries
US8204751B1 (en) 2006-03-03 2012-06-19 At&T Intellectual Property Ii, L.P. Relevance recognition for a human machine dialog system contextual question answering based on a normalization of the length of the user input
JP4891737B2 (ja) * 2006-11-17 2012-03-07 日本放送協会 知識メタデータ生成装置、ダイジェスト生成装置、知識メタデータ生成プログラム、及びダイジェスト生成プログラム
US20110087670A1 (en) 2008-08-05 2011-04-14 Gregory Jorstad Systems and methods for concept mapping
US8396287B2 (en) * 2009-05-15 2013-03-12 Google Inc. Landmarks from digital photo collections
US9984067B2 (en) 2014-04-18 2018-05-29 Thomas A. Visel Automated comprehension of natural language via constraint-based processing
US10540365B2 (en) 2014-05-30 2020-01-21 Apple Inc. Federated search
US9842102B2 (en) 2014-11-10 2017-12-12 Oracle International Corporation Automatic ontology generation for natural-language processing applications
US9711141B2 (en) * 2014-12-09 2017-07-18 Apple Inc. Disambiguating heteronyms in speech synthesis
US10095689B2 (en) 2014-12-29 2018-10-09 International Business Machines Corporation Automated ontology building
US10262061B2 (en) 2015-05-19 2019-04-16 Oracle International Corporation Hierarchical data classification using frequency analysis

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1834955A (zh) * 2005-03-14 2006-09-20 富士施乐株式会社 多语种翻译存储器、翻译方法以及翻译程序
US20070130194A1 (en) * 2005-12-06 2007-06-07 Matthias Kaiser Providing natural-language interface to repository
US8423350B1 (en) * 2009-05-21 2013-04-16 Google Inc. Segmenting text for searching
US20130260358A1 (en) * 2012-03-28 2013-10-03 International Business Machines Corporation Building an ontology by transforming complex triples
US20140278362A1 (en) * 2013-03-15 2014-09-18 International Business Machines Corporation Entity Recognition in Natural Language Processing Systems
CN104133848A (zh) * 2014-07-01 2014-11-05 中央民族大学 藏语实体知识信息抽取方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
CLAUDIA BRETSCHNEIDER 等: "Corpus-based Translation of Ontologies for Improved Multilingual Semantic Annotation", 《PROCEEDINGS OF THE THIRD WORKSHOP ON SEMANTIC WEB AND INFORMATION EXTRACTION》 *

Also Published As

Publication number Publication date
JP6714024B2 (ja) 2020-06-24
US20160132487A1 (en) 2016-05-12
JP6320637B2 (ja) 2018-05-09
US20160132484A1 (en) 2016-05-12
EP3218820A1 (en) 2017-09-20
JP2017539006A (ja) 2017-12-28
EP3218821A1 (en) 2017-09-20
US9678946B2 (en) 2017-06-13
US9842102B2 (en) 2017-12-12
CN107111608A (zh) 2017-08-29
JP2018097887A (ja) 2018-06-21
CN107077466B (zh) 2019-06-21
US9582493B2 (en) 2017-02-28
JP2017537391A (ja) 2017-12-14
US20160132482A1 (en) 2016-05-12
JP6279153B2 (ja) 2018-02-14
WO2016077016A1 (en) 2016-05-19
WO2016077015A1 (en) 2016-05-19

Similar Documents

Publication Publication Date Title
CN107077466B (zh) 计算机自然语言处理中通用本体的词元映射
US11334583B2 (en) Techniques for semantic searching
JP7449919B2 (ja) 自律型エージェントおよびシソーラスを用いるデータベースのための自然言語インターフェイス
JP7387714B2 (ja) 限られた知識ドメイン内でナレッジグラフを構築するための技術
JP7258047B2 (ja) 収束質問に対する回答を改善するための仮想談話ツリーの構築
US20210150153A1 (en) Using communicative discourse trees to detect a request for an explanation
US11386176B2 (en) Inferring logical clauses for answering complex multi-hop open domain questions
CN106796608B (zh) 上下文搜索字符串同义词的自动生成
US11449682B2 (en) Adjusting chatbot conversation to user personality and mood
US11556698B2 (en) Augmenting textual explanations with complete discourse trees
CN106796595A (zh) 用于推荐的数据变换和修复的声明性语言和可视化系统
JP2020537224A (ja) 名前付きエンティティの構文解析および識別に基づくクロスドキュメントの修辞的つながりの判断
US20210191938A1 (en) Summarized logical forms based on abstract meaning representation and discourse trees
US20220245360A1 (en) Machine reading between the lines
US11461314B2 (en) Techniques for generating a boolean switch interface for logical search queries
TWI815605B (zh) 自文件自動產生對話流程
US20230297861A1 (en) Graph recommendations for optimal model configurations

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant