CN112823332A - 语义行业术语 - Google Patents
语义行业术语 Download PDFInfo
- Publication number
- CN112823332A CN112823332A CN201980066773.0A CN201980066773A CN112823332A CN 112823332 A CN112823332 A CN 112823332A CN 201980066773 A CN201980066773 A CN 201980066773A CN 112823332 A CN112823332 A CN 112823332A
- Authority
- CN
- China
- Prior art keywords
- store
- industry term
- triple
- triples
- query
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 claims description 49
- 238000003058 natural language processing Methods 0.000 claims description 10
- 238000004891 communication Methods 0.000 description 35
- 238000010586 diagram Methods 0.000 description 19
- 238000012545 processing Methods 0.000 description 19
- 230000004044 response Effects 0.000 description 11
- 230000008569 process Effects 0.000 description 9
- 238000004590 computer program Methods 0.000 description 7
- 230000006870 function Effects 0.000 description 6
- 150000003839 salts Chemical class 0.000 description 6
- 230000005540 biological transmission Effects 0.000 description 4
- 238000004422 calculation algorithm Methods 0.000 description 4
- 239000003795 chemical substances by application Substances 0.000 description 4
- 230000014509 gene expression Effects 0.000 description 4
- 238000010200 validation analysis Methods 0.000 description 4
- 239000004566 building material Substances 0.000 description 3
- 230000007774 longterm Effects 0.000 description 3
- 230000002123 temporal effect Effects 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000013499 data model Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 239000012634 fragment Substances 0.000 description 2
- 238000007726 management method Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000008447 perception Effects 0.000 description 2
- 239000011435 rock Substances 0.000 description 2
- 239000013598 vector Substances 0.000 description 2
- 241000699670 Mus sp. Species 0.000 description 1
- 241000700564 Rabbit fibroma virus Species 0.000 description 1
- 241000270666 Testudines Species 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000009849 deactivation Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
- 238000004003 stimulated Raman gain spectroscopy Methods 0.000 description 1
- 238000000547 structure data Methods 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/1815—Semantic context, e.g. disambiguation of the recognition hypotheses based on word meaning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/167—Audio in a user interface, e.g. using voice commands for navigating, audio feedback
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/1822—Parsing for meaning understanding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Machine Translation (AREA)
Abstract
配置计算机存储器包括:将数字化语音解析为描述逻辑的三元组;确定解析的三元组是否记录在计算机存储器的通用语言三元组存储中;确定解析的三元组是否记录在计算机存储器的行业术语三元组存储中;以及如果解析的三元组没有记录在通用语言三元组存储和行业术语三元组存储中,则将解析的三元组记录在行业术语三元组存储中。
Description
背景技术
1948年EDVAC计算机系统的开发经常被看做计算机时代的开始。从那时起,计算机系统已经发展为复杂的装置。这些复杂的装置包括复杂的计算机存储器。用于有效使用计算机存储器的方法和系统不断发展。
附图说明
图1示出了说明根据本发明的实施例的用于配置计算机存储器的示例系统的网络图。
图2示出了语义三元组的图的线条图。
图3示出了根据本发明的实施例的用于在瘦客户端架构中配置计算机存储器的示例设备的功能框图。
图4示出了根据本发明的实施例的自动计算机器的框图,该自动计算机器包括用作配置语音使能装置的计算机存储器的声音服务器的计算机的示例。
图5示出了根据本发明的实施例的自动计算机器的框图,该自动计算机器包括用作配置计算机存储器的三元组服务器的计算机的示例。
图6示出了计算机存储器系统的框图。
图7示出了根据本发明的实施例的用于在胖客户端架构中配置计算机存储器的示例设备的功能框图。
图8示出了说明根据本发明的实施例的配置计算机存储器的示例方法的流程图。
图9示出了语言特定的三元组存储的图,其中,通用语言三元组存储和两个行业术语三元组存储是相同的总体图的逻辑连接段。
图10示出了通用语言三元组存储、英语的医学行业术语和英语的法律行业术语的单独的图。
图11示出了说明根据本发明的实施例的配置计算机存储器的另一示例方法的流程图。
图12示出了说明根据本发明的实施例的配置计算机存储器的另一示例方法的流程图。
具体实施方式
从图1开始,参考附图描述了用于配置计算机存储器的示例方法、设备和产品。图1示出了示出根据本发明的实施例的用于配置计算机存储器的示例系统的网络图。在图1的示例中,用至少一个语音使能装置(152)、三元组服务器(157)以及声音服务器(151),来实现配置计算机存储器。语音使能装置是被配置成接受和识别来自用户的语音并向用户表达声音提示和语音响应的自动计算机器。图1的示例中的语音使能装置包括台式计算机(107)、智能手表(112)、移动电话(110)和膝上型计算机(126)。在该示例中,每个语音使能装置被耦合以通过网络(100)与三元组服务器(157)和声音服务器(151)进行数据通信。台式计算机通过有线连接(120)被连接,而智能手表(112)、移动电话(110)和膝上型计算机(126)分别通过无线连接(114、116、118)被连接。
图1中所示的整个示例计算机系统通常操作为通过将来自对话(313)的数字化语音(508)的单词(509)解析为描述逻辑的三元组(752),来配置根据本发明的实施例的计算机存储器(169)。计算机存储器包括高速缓存、随机存取存储器(“RAM”)、磁盘存储器等大多数形式的计算机存储器。如此配置的计算机存储器通常驻留在语音使能装置上,或者如本文(169)所示,驻留在一个或多个三元组服务器(157)上。图1的总体示例系统还通常操作为确定解析的三元组(752)是否记录在通用语言三元组存储(323)中,确定解析的三元组是否记录在行业术语三元组存储(325)中,并且如果解析的三元组既未记录在通用语言三元组存储中也未记录在行业术语三元组存储中,则将解析的三元组记录在行业术语三元组存储中。通用语言三元组存储(323)由不是任何特定知识领域专用的单词的结构化定义组成,其中通用语言存储的每个结构化定义用描述逻辑的三元组实现。以类似的方式,行业术语三元组存储(325)由特定知识领域专用的单词的结构化定义组成,其中行业术语三元组存储的每个结构化定义用描述逻辑的三元组实现。
数字化语音(508)的单词(509)是用于来自对话(313)的识别语音(315)。用于识别的语音可以是整个对话,其中,例如,两个讲话的人在同一房间中,并且整个对话由语音使能装置上的麦克风获得。通过仅向语音使能装置提供对话的一方,如仅通过耳机(105)上的麦克风,可以减小用于识别的语音的范围。通过仅提供对来自在语音使能装置上执行的VoiceXML对话的提示进行响应的语音来进行识别,可以进一步减小用于识别的语音的范围。由于用于识别的语音的范围的减小,数据处理负担在整个系统上降低,但是至少在一些实施例中,识别整个对话并在显示器(110)上流出对话中所有单词流,仍是一种选择。
通过自然语言处理语音识别(“NLP-SR”)引擎(153)的操作,将来自对话(313)的语音识别为数字化语音,所述自然语言处理语音识别引擎在此被示出为设置在声音服务器(151)上,但是也适于安装在语音使能装置上。NLP-SR引擎还执行将如此数字化的语音(508)的单词(509)解析为描述逻辑的三元组(752)。
三元组是以逻辑形式表示的三部分陈述。根据上下文,不同的术语被用于有效地指代逻辑中的陈述的相同的三个部分。在一阶逻辑中,这些部分被称为常量(constant)、一元谓词(unary predicate)和二元谓词(binary predicate)。在Web本体语言(“OWL”)中,这些部分是个体、类和属性。在一些描述逻辑中,这些部分被称为个体、概念和角色。
在本文中,三元组的元素被称为主体、谓词和客体,并且这样表示:<主体><谓词><客体>。对于三元组有许多表达模式。三元组的元素可以表示为统一资源定位符(“URL”)、统一资源标识符(“URI”)或国际资源标识符(“IRI”)。例如,三元组可以用N-Quads、Turtle语法、TriG、Javascript Object Notation(“JSON”)来表示。这里使用的表达式,尖括号中的主体-谓词-客体,是一种抽象语法形式,其被优化用于人类可读性而不是机器处理,但是其实质内容对于三元组的表达式是正确的。使用该抽象语法,这里是三元组的示例:
<Bob><是(is a)><人(person)>
<Bob><朋友是(is a friend of)><Alice>
<Bob><出生于(is born on)><1990年7月4日>
<Bob><喜欢(is interested in)><蒙娜丽莎>
<蒙娜丽莎><创作者是(was created by)><列奥纳多·达·芬奇>
<视频“蒙娜丽莎在华盛顿(La JocondeàWashington)”><讲述的是(is about)><蒙娜丽莎>
相同项目可以在多个三元组中引用。在该示例中,Bob是四个三元组的主体,而蒙娜丽莎是一个三元组的主体和两个三元组的客体。这种使相同项目成为一个三元组的主体和另一个三元组的客体的能力使得可以实现三元组之间的连接,并且连接的三元组形成图。
为了进一步解释三元组和图之间的关系,图2示出了图(600)的线条图。图2的示例性图以图形式实现了上面关于Bob和蒙娜丽莎阐述的示例三元组。在图2的示例中,图形边(604、608、612、616、620、624)分别表示节点之间的关系,即,表示谓词<是>、<朋友是>、<出生于>、<喜欢>、<创作者是>、以及<讲述的是>。节点本身表示三元组的主体和客体,<Bob>、<人>、<Alice>、<1990年7月4日>、<蒙娜丽莎>、<列奥纳多·达·芬奇>和<视频“蒙娜丽莎在华盛顿”>。
在知识表示系统中,以三元组的图表示的知识包括例如在Prolog数据库、Lisp数据结构中实现的知识表示,或者在RDFS、OWL和其它本体语言中的面向RDF的本体中实现的知识表示。通过被配置为在例如Prolog或SPARQL中执行语义查询的搜索引擎针对这样的图来实现搜索和推断。Prolog是通用逻辑编程语言。SPARQL是“SPARQL协议和RDF查询语言”的递归首字母缩写。Prolog支持针对被表达为Prolog数据库中的陈述和规则的连接的三元组的查询。SPARQL支持对以RDFS或OWL或其它面向RDF的本体表达的本体的查询。关于Prolog、SPARQL、RDF等,这些是解释本发明的示例实施例的技术的示例。因此,这不是对本发明的限制。根据实施例有用的知识表示可以采取本领域技术人员现在或将来可能想到的许多形式,并且所有这些现在完全在本发明的范围内且将一直在本发明的范围内。
描述逻辑是形式知识表示语言家族的成员。一些描述逻辑比命题逻辑更具有表达性,但不如一阶逻辑具有表达性。与一阶逻辑相反,描述逻辑的推理问题通常是可决定的。因此,可以针对描述逻辑中的搜索和推断问题实现高效的决定过程。存在一般的、空间的、时间的、时空的和模糊的描述逻辑,并且每个描述逻辑通过支持不同的数学构造器集合而以表达性和推理复杂度之间的不同平衡为特征。
搜索查询沿语义的尺度设置。例如,传统的web搜索被设置在该尺度的零点上,无语义,无结构。针对关键词“派生”的传统web搜索返回讨论派生作品的文学概念以及演算过程的HTML文档。针对关键词“差速器(differential)”的传统web搜索返回描述汽车部件和演算函数的HTML页面。
其它查询沿尺度(scale)的中点、某些语义、某些结构、不完全完整地布置。这实际上是web搜索中的当前趋势。这样的系统可以被称为可执行的而不是可决定的。从一些观点来看,可决定性不是主要关注点。例如,在许多Web应用中,数据集是巨大的,并且它们根本不需要100%的正确模型来分析可能已经被某些本身不完美的启发式程序爬取、刮取并被转换成结构的数据。人们使用Google是因为它可以在很多时候找到好的答案,即使它不能一直找到完美的答案。在这种混乱的搜索环境中,可证明的正确性不是关键目标。
在结果的正确性是关键并且输入可决定性的情况下设置其它类别的查询。作为数据中心中的电话代理的用户通过电话与讨论前差速器的汽车客户通话,用户不关心需要对演算结果进行分类以找到正确的术语。这样的用户需要汽车术语的正确定义,并且用户需要实时(即,例如,在几秒内)对话的查询结果。
在形式逻辑中,如果存在一种方法,使得对于可以用系统表达的每个断言,该方法能够决定该断言在系统内是否有效,则该系统是可决定的。在实际情况中,针对可决定描述逻辑的查询将不会无限地循环、崩溃、不能返回答案或返回错误答案。可决定描述逻辑支持清楚、明确和机器可处理的数据模型或本体。不可决定的系统不支持清楚、明确和机器可处理的数据模型或本体。可决定描述逻辑支持算法,通过该算法,计算机系统可确定在逻辑中定义的类的等价性。不可决定的系统不支持该算法。可决定描述逻辑可以用C、C++、SQL、Lisp、RDF/RDFS/OWL等来实现。在RDF空间中,OWL的细分在可决定性方面是变化的。完全OWL不支持可决定性。而OWL DL支持可决定性。
为了进一步说明,图3示出了根据本发明的实施例的用于在瘦客户端架构中配置计算机存储器的示例设备的功能框图。瘦客户端架构是客户端-服务器架构,在该客户端-服务器架构中,语音处理和三元组处理中的至少一些、也许大多数、也许所有从客户端卸载到服务器。瘦客户端的瘦度是变化的。图3的示例中的语音使能装置是瘦客户端,其中大多数语音处理被卸载到声音服务器(151)。语音使能装置(152)接受声音输入(315、174),但是然后通过VOIP连接(216)将声音输入传送到执行所有语音处理的声音服务器(151)。在该示例中,语音使能装置实现了用于三元组处理(323、325)和查询执行(298)的一些能力,但是在瘦客户端中上述能力没有一种是绝对必要的。具有减少的存储容量的装置,例如智能手表或移动电话,可以不用语义查询引擎(298)且不用三元组存储(323、325)实现,仅将查询传递到三元组服务器(157),该三元组服务器本身执行所有三元组存储和所有查询处理。
在图3的特定示例中,语音使能装置占据瘦客户端架构的中间地带。它几乎不支持语音处理,但是它确实支持一些三元组处理。在该示例中的语音使能装置仅针对RAM(168)中的三元组存储执行三元组处理和查询执行,将大规模存储留给三元组服务器(157)。语义查询引擎根据需要加载三元组存储以响应查询。因此,存在查询遗漏。当语义查询引擎利用RAM中的三元组存储不能满足查询时,它不会推断出失败。相反,其将查询传递到三元组服务器,并且如果三元组服务器能够通过使用服务器上的三元组来满足查询,则其将查询结果和满足查询的三元组两者传递回语音使能装置,这些三元组然后被存储在语音使能装置上的RAM中以供将来针对类似查询使用。随着时间的推移,这种架构建立在包含频繁使用的三元组的语音使能装置查询存储上,并且减少了对通过网络到三元组服务器的昂贵查询行程的需要,同时在客户端侧以相对薄层的计算资源来运行。这是在根本没有三元组存储的极瘦客户端与以下关于图5描述的胖客户端之间的折衷。
图3的示例设备包括通过VOIP连接(216)经由数据通信网络(100)被连接用于数据通信的语音使能装置(152)和声音服务器(151)。语音使能应用(195)在语音使能装置(152)上运行。语音使能应用(195)可以被实现为在语音使能浏览器上执行的X+V或SALT文档的集合或序列、在Java虚拟机上执行的Java语音应用、或者本领域技术人员可以想到的在其他技术中实现的语音使能应用。图3的示例语音使能装置还包括声卡(174),其是I/O适配器的示例,该I/O适配器被专门设计用于从麦克风(176)接受模拟音频信号,并将音频模拟信号转换为数字形式,以便由编码解码器(183)进一步处理。
VOIP代表“互联网协议电话(Voice Over Internet Protocol)”,即在基于IP的数据通信网络上路由语音的通用术语。语音数据在通用分组交换数据通信网络上流动,而不是在传统的专用电路交换语音传输线上流动。用于通过IP数据通信网络承载语音信号的协议通常被称为“互联网协议电话”或“VOIP”协议。VOIP流量可以部署在任何IP数据通信网络上,包括缺少到互联网的其余部分的连接的数据通信网络,例如部署在私有建筑物范围的局域数据通信网络或“LAN”上。
许多协议可以用于实现VOIP,包括例如用IETF的会话发起协议(“SIP”)和ITU的协议(称为“H.323”)实现的VOIP的类型。SIP客户端使用TCP和UDP端口5060来连接到SIP服务器。SIP本身用于建立和拆除用于语音传输的呼叫。然后,具有SIP的VOIP使用RTP来传输实际的编码语音。类似地,H.323是来自国际电信联盟的标准分部的综合(umbrella)推荐,其定义了在任何分组数据通信网络上提供视听通信会话的协议。
语音使能应用(195)是用户级的语音使能的客户端侧的计算机程序,其向用户(128)呈现声音接口,提供音频提示和响应(314)并且接受输入的识别语音(315)。语音使能应用(195)提供语音接口,通过该接口,用户可以通过麦克风(176)提供用于口头的识别语音,并且通过声卡(174)的音频放大器(185)和编码器/解码器(“编码解码器”)(183)将该语音数字化,并且将数字化识别语音提供给声音服务器(151)。语音使能应用(195)根据VOIP协议将数字化语音打包到识别请求消息中,并通过在网络(100)上的VOIP连接(216)将语音发送到声音服务器(151)。
通过接受对话指令、VoiceXML段等,并返回语音识别结果(包括表示识别的语音的文本、用作对话中变量值的文本、以及从执行语义解释脚本的输出以及语音提示),声音服务器(151)为语音使能装置提供声音识别服务。声音服务器(151)包括计算机程序,该计算机程序在诸如X+V应用、SALT应用或Java语音应用的语音使能应用中为声音提示和用户输入的声音响应提供文本到语音(“TTS”)转换。
图3的示例中的语音使能装置(152)包括语义查询引擎(298),即从语音使能应用(195)接受三元组存储(323、325)并针对该三元组存储(323、325)执行语义查询(340)的自动计算机器的模块。语音使能应用(195)利用来自语音(315)、GUI、键盘、鼠标(180、181)等的用户输入来制定语义查询。语义查询是针对结构化数据设计和实现的查询。语义查询利用逻辑运算符、命名空间、模式匹配、子类化、传递关系、语义规则和上下文全文搜索。语义查询用于命名的图、链接数据或三元组。在本发明的实施方案中,三元组通常被链接以形成图。这使得语义查询能够处理信息项之间的实际关系并从数据网络推断答案。语义查询与语义搜索形成对比,语义搜索试图以各种成功水平在非结构化文本中使用语义来改进搜索结果的含义。
在C、C++、Java、Prolog、Lisp等中具有语义查询的示例公式。例如,W3C的语义web技术栈提供SPARQL以用类似于SQL的语法来公式化语义查询。语义查询用于在三元组存储、图形数据库、语义维基百科、自然语言和人工智能系统中结构化的数据。如上所述,语义查询用于结构化数据,并且在本情况的特定示例中,结构化数据是在以符合描述逻辑的方式连接的语义三元组中描述和定义的单词。在本发明的许多实施例中,针对根据实现可决定性的描述逻辑而结构化的数据来断言语义查询。
在图3的示例设备中,语音使能装置被耦合以通过通信适配器(167)、无线连接(118)、数据通信网络(100)和有线连接(121)与三元组服务器(157)进行数据通信。该三元组服务器(157)为三元组储存(323、325)提供大容量备份。三元组服务器是将三元组串行化并将串行化的三元组存储在关系数据库、表、文件等中的自动计算机器的配置。三元组服务器在请求时从非易失性存储装置检索这样的串行化(serialized)的三元组,将串行化的三元组解析为三元组存储,并且在请求时将这样的三元组存储提供给语音使能装置,以用于根据本发明的实施例在配置计算机存储器时利用三元组的系统中。
根据本发明的实施例,特别是在瘦客户端架构中,用描述逻辑的三元组配置计算机存储器可以用一个或多个声音服务器来实现。声音服务器是提供语音识别和语音合成的计算机,即自动计算机器。因此,为了进一步说明,图4示出了根据本发明实施例的自动计算机器的框图,该自动计算机器包括用作配置语音使能装置的计算机存储器的声音服务器(151)的计算机的示例。图2的声音服务器(151)包括至少一个计算机处理器(156)或“CPU”以及随机存取存储器(168)(“RAM”),随机存取存储器(168)通过高速存储器总线(166)和总线适配器(158)连接到处理器(156)和声音服务器的其它组件。
存储在RAM(168)中的是声音服务器应用(188),其是能够操作系统中的声音服务器的计算机程序指令的模块,该系统被配置用于根据本发明的实施例配置存储器。声音服务器应用(188)通过接受语音识别请求并返回语音识别结果来为多模式装置提供语音识别服务,所述语音识别结果包括表示识别的语音的文本、用作对话中的变量值的文本、以及作为用于语义解释的脚本的字符串表示的文本。声音服务器应用(188)还包括计算机程序指令,其在诸如例如启用语音的浏览器、X+V应用、SALT应用或Java语音应用等语音使能应用中为声音提示和用户输入的声音响应提供文本到语音(“TTS”)转换。
声音服务器应用(188)可以实现为web服务器,通过提供对来自X+V客户端、SALT客户端、Java语音客户端或其他语音使能客户端装置的HTTP请求的响应,以Java、C++、Python、Perl或支持X+V、SALT、VoiceXML或其他语音使能语言的任何语言实现该web服务器。对于另一个示例,声音服务器应用(188)可以被实现为Java服务器,该Java服务器在Java虚拟机(102)上运行,并且通过提供对来自运行在语音使能装置上的Java客户端应用的HTTP请求的响应来支持Java语音框架。并且,支持本发明实施例的声音服务器应用可以以本领域技术人员可以想到的其他方式来实现,并且所有这些方式都在本发明的范围内。
在该示例中,声音服务器(151)包括自然语言处理语音识别(“NLP-SR”)引擎(153)。NLP-SR引擎有时在本文中被简称为“语音引擎”。语音引擎是功能模块,通常是软件模块,但是它也可以包括专门的硬件,其完成识别和生成人类语音的工作。在该示例中,语音引擎(153)是包括自然语言处理(“NLP”)引擎(155)的自然语言处理语音引擎。NLP引擎从自动语音识别(“ASR”)引擎接受识别的语音,将识别的语音处理为语音部分,主体、谓词、客体等,然后将识别的处理后的语音部分转换为语义三元组以包括在三元组存储中。
语音引擎(153)包括用于语音识别的自动语音识别(“ASR”)引擎和用于生成语音的文本到语音(“TTS”)引擎。该语音引擎还包括语法(104)、词典(106)和语言特定的声学模型(108)。语言特定的声学模型(108)是例如将语音特征向量(“SFV”)与表示人类语言中的单词的发音的音素相关联的数据结构、表或数据库。词典(106)是文本形式的单词与表示每个单词的发音的音素的关联;词典有效地标识能够由ASR引擎识别的单词。在RAM(168)中还存储了文本到语音(“TTS”)引擎(194),其是接受文本作为输入并以数字编码语音的形式返回相同文本的计算机程序指令的模块,其用于提供语音作为语音使能系统的用户的提示并响应于该用户。
语法(104)将当前可以识别的单词和单词序列传送给ASR引擎(150)。为了进一步解释,区分语法的目的和词典的目的。词典将ASR引擎可以识别的所有单词与音素相关联。语法传送当前有资格识别的单词。在任何特定时间的两组可以不相同。
语法可以用ASR引擎支持的多种格式(包括例如Java语音语法格式(“JSGF”)、W3C语音识别语法规范(“SRGS”)的格式、来自IETF的RFC2234的扩展的巴科斯格式(“ABNF”)、如W3C的随机语言模型(N-Gram)规范中描述的随机语法的形式、以及如本领域技术人员可以想到的其它语法格式)来表达。语法通常作为对话的元素来操作,例如VoiceXML<菜单>或X+V<表单>。语法的定义可以在对话中被内嵌表达。或者,语法可以在外部在单独的语法文档中实现,并且从具有URI的对话中引用。这里是以JSFG表达的语法的示例:
在该示例中,名为<命令>(<command>)、<姓名>(<name>)和<何时>(<when>)的元素是语法的规则。规则是规则名和规则扩展的组合,该规则向ASR引擎或声音解释器建议当前可以识别哪些词。在该示例中,扩展包括与(conjunction)和或(disjunction),以及垂直条“|”表示“或”。ASR引擎或声音解释器按顺序处理规则,先处理<命令>,然后处理<姓名>,然后处理<何时>。<命令>规则接受识别“呼叫”或“打电话(phone或telephone)”加(即,结合)从<姓名>规则和<何时>规则返回的任何内容。<姓名>规则接受“bob”或“martha”或“joe”或“pete”或“chris”或“john”或“artoush”,而<何时>规则接受“今天”或“今天下午”或“明天”或“下周”。
命令语法作为整体匹配像这些的表达,例如:
·“下周给bob打电话”,
·“今天下午给martha打电话”,
·“提醒我(remind me to)明天给chris打电话”,和
·“提醒我今天给pete打电话”。
在该示例中,声音服务器应用(188)被配置为从通过网络与声音服务器远程定位的语音使能客户端装置接收来自用户的数字化的识别语音,并将该语音向前传递到ASR引擎(150)以用于识别。ASR引擎(150)是计算机程序指令的模块,在该示例中,其也存储在RAM中。在执行自动语音识别时,ASR引擎接收至少一个数字化单词形式的识别语音,并使用数字化单词的频率分量来导出语音特征向量(SFV)。SFV可以例如由数字化语音样本的前十二或十三傅立叶或频域分量来定义。ASR引擎可以使用SFV从语言特定声学模型(108)推断单词的音素。ASR引擎然后使用音素来查找词典(106)中的单词。
在RAM中还存储VoiceXML解释器(192),它是处理VoiceXML语法的计算机程序指令的模块。输入到VoiceXML解释器(192)的VoiceXML可以例如源自于在语音使能装置上远程运行的VoiceXML客户端、源自于在语音使能装置上远程运行的X+V客户端、源自于在语音使能装置上运行的SALT客户端、源自于在多媒体装置上远程运行的Java客户端应用等。在这个示例中,VoiceXML解释器(192)解释和执行VoiceXML段,该段表示从远程语音使能装置接收的并通过声音服务器应用(188)提供给VoiceXML解释器(192)的声音对话指令。
瘦客户端架构中的语音使能应用(图3中的195)可以向通过网络与这样的语音使能应用进行数据通信的VoiceXML解释器(149)提供声音对话指令、VoiceXML段、VoiceXML<表单>元素等。声音对话指令包括一个或多个语法、数据输入元素、事件处理器等等,它们建议VoiceXML解释器如何管理来自用户的声音输入以及要呈现给用户的声音提示和响应。VoiceXML解释器通过根据VoiceXML表单解释算法(“FIA”)(193)顺序处理对话指令来管理这些对话。VoiceXML解释器解释由语音使能应用提供给VoiceXML解释器的VoiceXML对话。
如上所述,表单解释算法(“FIA”)驱动用户和语音使能应用之间的交互。FIA通常负责选择和播放一个或多个语音提示,收集用户输入(填充一个或多个输入项的响应,或者一些事件的投掷),并解释属于新填充的输入项的动作。FIA还处理语音使能应用初始化、语法激活和停用、输入和离开具有匹配话语的表单以及许多其它任务。FIA还维护内部提示计数器,该计数器随着每次试图激发用户的响应而增加。也就是说,随着每次提示来自用户的匹配语音响应的失败尝试,内部提示计数器递增。
RAM(168)中还存储有操作系统(154)。根据本发明的实施例的声音服务器中使用的操作系统包括UNIXTM、LinuxTM、Microsoft NTTM、AIXTM、IBM的i5/OSTM和本领域技术人员将想到的其它操作系统。在图4的示例中,操作系统(154)、声音服务器应用(188)、VoiceXML解释器(192)、ASR引擎(150)、JVM(102)和TTS引擎(194)被示出在RAM(168)中,但是这种软件的许多组件通常也被存储在非易失性存储器中,例如也被存储在磁盘驱动(170)上。
图4的声音服务器(151)包括总线适配器(158)、包含用于高速总线的驱动电子器件的计算机硬件组件、前端总线(162)、视频总线(164)和存储器总线(166)、以及用于较慢扩展总线(160)的驱动电子器件。根据本发明的实施例的声音服务器中使用的总线适配器的示例包括英特尔北桥、英特尔存储器控制器集线器、英特尔南桥和英特尔I/O控制器集线器。根据本发明的实施例的声音服务器中使用的扩展总线的示例包括工业标准架构(“ISA”)总线和外围组件互连(“PCI”)总线。
图4的声音服务器(151)包括通过扩展总线(160)和总线适配器(158)耦合到处理器(156)和声音服务器(151)的其它组件的磁盘驱动适配器(172)。磁盘驱动适配器(172)将非易失性数据存储连接到磁盘驱动(170)形式的声音服务器(151)。在声音服务器中使用的磁盘驱动适配器包括集成驱动电子器件(“IDE”)适配器、小型计算机系统接口(“SCSI”)适配器以及本领域技术人员将想到的其他适配器。另外,对于声音服务器,非易失性计算机存储器可以实现为如本领域技术人员所知的光盘驱动器、电可擦除可编程只读存储器(所谓的“EEPROM”或“闪存”存储器)、RAM驱动器等。
图4的示例声音服务器包括一个或多个输入/输出(“I/O”)适配器(178)。声音服务器中的I/O适配器通过例如软件驱动器和计算机硬件来实现面向用户的输入/输出,以控制到诸如计算机显示屏的显示装置的输出,以及来自诸如键盘和鼠标的用户输入装置(181)的用户输入。图4的示例声音服务器包括视频适配器(209),其是专门设计用于到诸如显示屏或计算机监视器的显示装置(180)的图形输出的I/O适配器的示例。视频适配器(209)通过高速视频总线(164)、总线适配器(158)和也是高速总线的前端总线(162)连接到处理器(156)。
图4的示例声音服务器(151)包括用于与其它计算机(182)进行数据通信以及用于与数据通信网络(100)进行数据通信的通信适配器(167)。这种数据通信可以通过RS-232连接、通过诸如通用串行总线(“USB”)的外部总线、通过诸如IP数据通信网络的数据通信网络、以及以本领域技术人员将想到的其他方式串行地执行。通信适配器实现数据通信的硬件级别,通过该硬件级别,一个计算机直接或通过数据通信网络向另一计算机发送数据通信。可用于本发明实施例的通信适配器的示例包括用于有线拨号通信的调制解调器、用于有线数据通信网络通信的以太网(IEEE 802.3)适配器和用于无线数据通信网络通信的802.11适配器。
为了进一步说明,图5示出了根据本发明的实施例的自动计算机器的框图,该自动计算机器包括用作配置计算机存储器的三元组服务器(157)的计算机的示例。图5的三元组服务器(157)包括至少一个计算机处理器(156)或“CPU”以及随机存取存储器(168)(“RAM”),其通过高速存储器总线(166)和总线适配器(158)连接到处理器(156)和三元组服务器的其他组件。处理器通过视频总线(164)连接到视频适配器(209)和计算机显示器(180)。处理器通过扩展总线(160)连接到通信适配器(167)、I/O适配器(178)和磁盘驱动适配器(172)。处理器通过数据通信网络(100)和无线连接(118)连接到语音使能膝上型计算机(126)。在RAM中设置操作系统(154)。
在RAM中还设置有三元组服务器应用程序(297)、语义查询引擎(298)、通用语言三元组存储(323)、行业术语三元组存储(325)、三元组解析器/串行器(294)、三元组转换器(292)以及一个或多个三元组文件(290)。三元组服务器应用程序(297)通过网络(100)从诸如膝上型计算机(126)的语音使能装置接受语义查询,所述语义查询被传递到语义查询引擎(298)以针对三元组存储(323、325)执行。
三元组解析器/串行器(294)管理三元组存储和各种形式的磁盘存储器之间的三元组的传输。三元组解析器/串行器(294)接受三元组存储的内容作为输入,并将它们串行化以作为三元组文件(290)、表、关系数据库记录、电子表格等的输出,以便长期存储在诸如硬盘(170)的非易失性存储器中。三元组解析器/串行器(294)接受三元组文件(290)作为输入,并且将解析的三元组输出到三元组存储中。在许多实施例中,当三元组解析器/串行器(294)接受三元组文件(290)作为输入并且将解析的三元组输出到三元组存储中时,三元组解析器/串行器将输出的三元组存储存储到存储器的连续段中。连续存储可以在C编程语言中通过对malloc()函数的调用来实现。连续存储可由Python缓冲器协议实现。可以以本领域技术人员所能想到的其它方式来实现连续存储,并且所有这些方式都在本发明的范围内。在许多实施例中,两个三元组存储(323、325)将被存储在连续存储器的一个或两个段中。
参考图6更详细地解释了连续存储器。图6示出了包括计算机处理器的计算机存储器系统的框图,该计算机处理器由执行语音使能应用程序(195)的各种寄存器(190)组成。处理器的应用和寄存器利用虚拟存储器(708)中设置的存储器地址(700)进行操作。虚拟存储器的内容由处理器上高速缓存(186)、RAM(168)和磁盘(170)中的物理存储来备份。高速缓存的内容被组织在高速缓存行(702)中。RAM中的存储器被组织在页面(712)中。磁盘上的存储器被组织成帧(706)。存储器管理单元(“MMU”)(184)将虚拟存储器地址翻译成物理存储器位置,并且将存储器的内容从物理存储移动到处理器寄存器以及从处理器寄存器移出。在访问物理存储器时,MMU总是首先在高速缓存中查看。在高速缓存中找不到内容被称为高速缓存未命中(714)。在高速缓存未命中时,MMU在RAM(168)中找到所寻找的内容并将其移动到高速缓存中。如果在RAM中找不到所寻找的内容,即被称为页面错误(716)的失败,则MMU一直留意磁盘上的页帧(page frame),将内容移动到RAM中,然后移动到高速缓存中。
通过使用连续存储器解决这里的挑战。高速缓存访问花费10纳秒。RAM访问花费100纳秒。磁盘访问花费10000000纳秒。这些数字不是直观的。人们不能感受纳秒级的时间。以更熟悉的术语来看它。如果高速缓存访问被视为花费一分钟,则RAM访问花费10分钟,并且对相同数据的磁盘访问花费两年。分散在虚拟存储器地址上的三元组有被存储在多个页帧中的风险。在连续存储器段中彼此接近存储的三元组更可能存储在少量页帧中。
假设行业术语由500个词族组成,每个词族包括三个单词,使得整个行业术语以1500个单词来表达,平均来说,每个单词由10字节的存储组成,总共15千字节的存储的行业术语。现今,一些计算机系统支持兆字节或更大的存储器页面大小。这种行业术语可以存储在单个存储器页面中,并且一旦该页面在RAM中,该行业术语的操作可以在根本没有页面错误的风险的情况下进行。即使用于这种行业术语的连续存储落在页面边界上,整个行业术语也可以仅加载有两个页面错误,并且在将其加载到RAM中之后,可以在向前零页面错误的情况下操作。将仍然需要高速缓存未命中来将内容加载到高速缓存中,但是除了第一个或两个未命中之外,其它的未命中都不会有页面错误的风险。发明人估计在短的操作周期之后,高速缓存未命中率将小于百分之一。也就是说,当根据本发明的实施例在连续存储器中设置行业术语时,对于超过99%的存储器访问,存储器访问时间通常将近似于高速缓存访问时间,仅几纳秒。
为了进一步说明,图7示出了根据本发明的实施例的用于在胖客户端架构中配置计算机存储器的示例设备的功能框图。胖客户端架构是一种客户端-服务器架构,其中利用描述逻辑的三元组管理配置计算机存储器所需的所有或大部分功能直接在客户端侧语音使能装置上而不是在服务器上被支持。服务器用于备份和同步,而不是语音识别或语义查询。胖客户端需要资源、处理器功率和存储,这些可能在例如智能手表的小型装置上不总是可用。然而,在具有足够数据处理资源的胖客户端中,所有相关的功能、查询、三元组、语音通常立即且完全有用,而不管网络可用性如何。
图7的示例中的胖客户端语音使能装置是自动计算机机器,其包括处理器(156)、RAM(168)、数据总线(162、164、166、160)、视频(180、209)、数据通信(167)、I/O(178)和磁盘存储(170)。在RAM中设置了语音使能应用程序(195)、语义查询引擎(298)、通用语言三元组存储(323)、行业术语三元组存储(325)、三元组解析器/串行器(294)、三元组转换器(292)以及一个或多个三元组文件(290)。语音使能应用(195)从用户输入接受语义查询,其被传递到语义查询引擎(298)以便针对三元组存储(323、325)执行。所有相关的三元组在本地RAM中都是可用的。所有查询仅基于本地存储而成功或失败。没有查询被转发到三元组服务器(157)。当多个客户端侧装置共享三元组存储的内容时,三元组服务器(157)提供长期备份和同步功能,但是对于任何特定查询,所有响应的三元组在客户端侧直接可用。
三元组解析器/串行器(294)管理三元组存储和磁盘存储(170)之间的三元组的传输,并且磁盘存储直接在胖客户端(152)上可用,而不是在服务器上的网络可用。三元组解析器/串行器(294)接受三元组存储的内容作为输入,并将它们串行化以作为三元组文件(290)、表、关系数据库记录、电子表格等的输出,以便长期存储在诸如硬盘(170)的非易失性存储器中。三元组解析器/串行器(294)接受三元组文件(290)作为输入,并且将解析的三元组输出到三元组存储中。在许多实施例中,当三元组解析器/串行器(294)接受三元组文件(290)作为输入并且将解析的三元组输出到三元组存储中时,三元组解析器/串行器将输出的三元组存储存储到存储器的连续段中。
语音引擎(153)是全服务NLP-SR引擎,其包括自然语言处理(155)、语音识别(150)、语法(104)、词典(106)、模型(108)和文本到语音处理(194),所有这些都如以上关于图3更详细地描述的。胖客户端语音使能装置(152)不需要通过网络实现语音相关的处理。完全语音使能在语音使能装置本身上是直接可用的。
为了进一步说明,图8示出了说明根据本发明实施例的配置计算机存储器的示例方法的流程图。利用语音使能装置、声音服务器(151)和三元组服务器(157)的某种组合来实现图8的方法的功能,或将这些功能设置在语音使能装置、声音服务器(151)和三元组服务器(157)的某种组合上。即,例如,NLP-SR引擎(153)可以被设置在瘦客户端架构中的声音服务器(151)上或者胖客户端架构中的语音使能装置(152)上。因此,任何特定功能确切地出现在何处的问题取决于架构,但是所有此类元件都是计算机,且其都包含可根据实施例配置的计算机存储器。
图8的方法包括由自然语言处理语音识别(“NLP-SR”)引擎(153)将来自对话(313)的语音识别(302)为数字化语音(508)。该方法还包括将来自对话(313)的数字化语音(508)的单词(509)解析(304)为描述逻辑(306)的三元组(752)。在类似于这里所说明的方法的许多实施例中,描述逻辑(306)是形式知识表示语言家族的成员,其中逻辑的查询是可决定的。
在典型的实施例中,识别(302)语音和将单词解析(304)成三元组都由NLP-SR引擎(153)执行。NLP-SR引擎输入,可选地至少输入整个对话(313),并向解析功能(304)呈现数字化语音流(508)。解析功能处理单词(509),将三元组移交到查询引擎(298)以便进一步处理,然后循环(312)回去以解析数字化语音流中的下一个单词。
NLP-SR引擎将解析的三元组(752)移交到语义查询引擎(298)。语义查询引擎确定解析的三元组是否被记录(308)在计算机存储器(168)中的通用语言三元组存储(323)中,并且如果不是(314),则查询引擎确定解析的三元组是否被记录(316)在计算机存储器中的行业术语三元组存储(325)中。
如果解析的三元组既未记录在通用语言三元组存储中,也未记录在行业术语三元组存储中(314、320),则语音使能应用(195)将解析的三元组记录(322)在行业术语三元组存储(325)中。在记录(322)之后,该方法循环(312)回去以解析(304)数字化语音流(508)中的下一个单词(509)。如果解析的三元组已经存储在通用语言三元组存储(310)或行业术语三元组存储(318)中,则该方法直接循环(312)回去以解析(304)下一个单词(509)而不记录(322)。
通用语言三元组存储(323)由不是任何特定知识领域专用的单词的结构化定义组成,其中通用语言存储的每个结构化定义由描述逻辑的三元组组成。行业术语三元组存储(325)由特定知识领域专用的单词的结构化定义组成,其中行业术语三元组存储的每个结构化定义由描述逻辑的三元组组成。实施例中的两个三元组存储(323、325)可以存储在连续存储器中,或者存储在连续存储器的相同段中,或者存储在连续存储器的单独段中。
并且三元组存储可以包括多于一个的行业术语。例如,用户(128)可以是呼叫中心中的电话代理,该呼叫中心被期望处理来自健康护理、法律办公室和住宅建筑中的客户的呼叫。用户需要三个专门术语(而不仅仅是一个)对电话的帮助。因此,至少一些实施例包括在多个行业术语三元组存储中选择(301)行业术语三元组存储(325)以用于任何特定的对话。用户可以简单地按下或点击GUI上的仪表板中的按钮以在行业术语中进行选择。可以从用户在仪表板中与之交易的公司(电话代理正与之讲话的公司)的行业规范或SIC代码推断正确的行业术语。可以从使用推断出正确的行业术语,对照多个行业术语三元组存储断言具有解析的三元组的查询,并且选择具有最多命中的行业术语三元组存储。从使用推断可以意味着用户不需要什么,用户甚至可能在屏幕上没有仪表板,或者用户甚至可能在新对话开始时已经有了与新对话的主体区域无关的仪表板。
在一些实施例中,通用语言三元组存储(323)和行业术语三元组存储(325)是语言特定三元组存储的逻辑连接段。为了进一步解释,图9示出了语言特定的三元组存储的图,其中,通用语言三元组存储(323)和两个行业术语三元组存储是相同的总体图(201)的逻辑连接段。图(201)中的所有单词(202至224)是将它们标识为英语单词(200)的三元组的主体。单词(202至208)通常以三元组形式被识别为英语单词(225)。单词(210至216)以三元组形式被识别为医学行业术语的单词(226)。单词(218至224)以三元组形式被识别为法律行业术语的单词(228)。在实施例中,图中的所有单词通常是具有定义的三元组的主体。在该示例中,为了便于说明,仅示出了具有定义(236、244、252)的单词(208、210、218)。
在其他实施例中,通用语言三元组存储和行业术语三元组存储在单独的存储和单独的图中实现。为了进一步说明,图10示出了通用语言三元组存储(238)、英语的医学行业术语(240)和英语的法律行业术语(228)的单独的图。图(238、240、242)中的所有单词(202至224)是三元组的主体,三元组将单词标识为英文单词(200、226、228)。图(238)中的单词(202至208)通常以三元组的形式被识别为英语单词(200)。图(240)中的单词(210至216)以三元组的形式被识别为英语医学行业术语(226)的单词。图(242)中的单词(218至224)以三元组形式被识别为英语法律行业术语(228)的单词。在该示例中,所有三个图中的所有单词都是具有定义(230至258)的三元组的主体。
针对类似图(201)的图中的行业术语三元组存储的查询需要指定发出查询所针对的特定行业术语的子句:
查询:
SELECT?definition
WHERE{:word(210):is a word of:medical jargon.
:word(210):has definition?definition.}
响应::definition(244)
在像图10中所示的单独的图中的针对行业术语三元组存储的查询不需要指定发出查询所针对的特定行业术语的子句:
对图(240)的查询:
SELECT?definition
WHERE{:word(210):has definition?definition.}
响应::definition(244)
为了进一步说明,图11示出了说明根据本发明的实施例的配置计算机存储器的另一示例方法的流程图。图11的方法类似于图8的示例方法,包括其识别数字化语音(508),将数字化语音(508)的单词(509)解析(304)为描述逻辑(306)的三元组(752),确定解析的三元组是否记录(308)在通用语言三元组存储(323)中,并且如果不是(314),则确定解析的三元组是否记录(316)在计算机存储器中的行业术语三元组存储(325)中,将解析的三元组记录(322)在行业术语三元组存储(325)中,并且循环(312)回去以解析(304)数字化语音流(508)中的下一个单词(509)。
图11的方法与图8的方法的不同之处在于包括两种类型的查询,一种类型(339、340)是询问三元组是否在存储中,而另一种类型是查询定义。在图11的方法中,确定(308)解析的三元组(752)是否被记录在通用语言三元组存储(323)中是通过基于解析的三元组对通用语言三元组存储断言(324)查询(339)来执行的。类似地,确定(316)解析的三元组(752)是否被记录在行业术语三元组存储(325)中是通过基于解析的三元组对行业术语三元组存储断言(326)查询(340)来执行的。
这些查询(339、340)仅询问解析的三元组当前是否记录在三元组存储中。它们不要求定义或推断。这些查询(339、340)是采取与它们查询的数据类似的形式的语义查询。例如,以描述Bob和蒙娜丽莎的连接三元组为例,这里再次以抽象语法来表达,其中(主体谓词客体)由空格隔开:
(Bob isA person)
(Bob isAFriendOf Alice)
(Bob isBornOn“the 4th of July 1990”)
(Bob isInterestedIn“the Mona Lisa”)
(“the Mona Lisa”wasCreatedBv“Leonardo da Vinci”)
(“the video‘La Joconde à Washington”’isAbout“the Mona Lisa”)
在一个示例中,其中所解析的三元组断言(Bob isAFriendOf Mike),那么这个查询:
ASK{:Bob:isAFriendOF:Mike.}
返回“否”。ASK语法是在SPARQL之后形成的,并且它仅报告匹配查询的成功或失败,而没有其它报告。在一个示例中,其中解析的三元组断言(Bob isAFriendOf Alice),那么这个查询:
ASK{:Bob:isAFriendOf:Alice.}
返回“是”。因此,查询(339、340)仅询问解析的三元组当前是否记录在三元组存储(323、325)之一中。
图11的方法还包括由查询引擎(298)针对行业术语三元组存储(325)执行(338)语义查询(341),以定义在行业术语三元组存储中记录的行业术语项。例如,在查询引擎中通过图形用户界面(110)的元件,或者对于另一个示例,通过诸如麦克风(176)和VoiceXML对话(522)之类的语音使能用户界面,来接收(344)语义查询。查询引擎(298)检索(343)并且通过图形用户界面(110)的元件或者通过语音使能的用户界面(522、177)返回显示(348、350)语义查询(341)的结果。
查询(341)不同于刚刚在上面讨论的查询(339、340)。查询(341)不仅仅询问数据是否在存储中,查询(341)询问将被返回的数据本身。因此,再次参考Bob和蒙娜丽莎,这个查询从所有三元组中请求谓词和客体,其中Bob是主体:
SELECT?predicate?object
WHERE{:Bob:?predicate:?subject.}
返回这个:
:isA:person
:isAFriendOf:Alice
:isBornOn:“the 4th of July 1990”
:isInterestedIn:“the Mona Lisa”)
该查询:
SELECT?predicate?object
WHERE{:“the Mona Lisa”:?predicate:?subject.}
返回这个:
:wasCreatedBy:“Leonardo da Vinci”
以及该查询:
SELECT?subject?predicate?object
WHERE{:?subject:?predicate:?“the Mona Lisa”.}
返回这个:
:“the video‘La Joconde à Washington’”:isAbout:“the Mona Lisa”
为了进一步说明,图12示出了说明根据本发明的实施例的配置计算机存储器的另一示例方法的流程图。图12的方法类似于图8的示例方法,包括其识别数字化语音(508),将数字化语音的单词(509)解析(304)为描述逻辑的三元组(752),确定解析的三元组是否记录(308)在通用语言三元组存储(323)中,并且如果不是(314),则确定解析的三元组是否记录(316)在计算机存储器中的行业术语三元组存储(325)中,将解析的三元组记录(322)在行业术语三元组存储(325)中,以及循环(312)回去以解析(304)数字化语音流(508)中的下一个单词(509)。
图12的方法与图8的方法的不同之处在于包括附加的确认(328),即解析的三元组(752)实际上将被记录在行业术语三元组存储(325)中。在图12的示例中,解析的三元组(752)已经被确定为未被记录(314)在通用语言三元组存储中,并且未被记录(320)在相关的行业术语三元组存储中。在将解析的三元组记录(322)在行业术语三元组存储中之前,图12的方法确认(328)解析的三元组应当被记录在行业术语三元组存储中。如果所解析的三元组确认(330)失败,则该方法继续,以循环(312)回去以解析(304)数字化语音流(304)中的下一个单词。
考虑一个使用情况,在该使用情况下,作为呼叫中心中的电话代理的用户正与客户讨论住宅建筑材料的预期销售。NLP-SR引擎通常提供被组织在句子中并被标识为语音部分的数字化语音单词。解析过程然后可以例如从句子中取出主体、动词和直接客体,并将它们解析成具有主体、谓词和客体的三元组。根据该句子,例如,“门是建筑材料”,解析器可以产生(门是建筑材料),并将该三元组作为候选的经解析的三元组(752)传递到过程的其余部分,以包括在行业术语存储(325)中。但是这些关于门的断言更加困难:
门是时间上的网关。
门是摇滚乐团的成员。
门是Aldous Huxley创作的知觉之门(The Doors Of Perception)中的修辞手法。
难以说明为什么这种结果起源于关于住宅建筑的谈话中。也许语音引擎出错。用户可能从主题上游走。所有这些都几乎没有差别。要点是解析器将从这些与住宅建设不相关的单词产生三元组。这样的三元组可能不在行业术语三元组存储中,但是这样的三元组也可能不在通用语言三元组存储中。在这种情况下,尽管这样的三元组实际上不属于行业术语三元组存储,但是这样的三元组成为包含在行业术语三元组存储中的候选。
确认过程(328)可以查询建筑术语的技术字典(336)。技术字典是非结构化文本,无语义,无三元组,但是它确实包含可搜索的定义。如果“时间上的网关”、“摇滚乐团”或“知觉之门”没有出现在门的定义中,则确认处理可以推断(330)某些三元组不属于(330)行业术语三元组存储(325),并且循环(312)以继续处理。确认过程(328)可以通过例如GUI界面或语音接口查询用户(334),呈现候选的经解析的三元组,并且询问是否将其添加到行业术语三元组存储中。如果用户确认(332),则记录(322)并循环(312)。如果用户没有确认(330),则循环(312)而不记录(322)。
从前面的描述中可以理解,在不背离本发明的真实精神的情况下,可以对本发明的各种实施例进行修改和改变。本说明书中的描述仅用于说明的目的,而不应被解释为限制性的。本发明的范围仅由所附权利要求的语言来限定。
Claims (20)
1.一种配置计算机系统中的计算机存储器的方法,所述方法包括:
将来自对话的数字化语音的单词解析为描述逻辑的三元组;
确定解析的三元组是否被记录在所述计算机存储器的通用语言三元组存储中;
确定所述解析的三元组是否被记录在所述计算机存储器的行业术语三元组存储中;以及
如果所述解析的三元组既未记录在所述通用语言三元组存储中,也未记录在所述行业术语三元组存储中,则将所述解析的三元组记录在所述行业术语三元组存储中。
2.根据权利要求1所述的方法,还包括通过自然语言处理语音识别(“NLP-SR”)引擎,将来自所述对话的语音识别为所述数字化语音。
3.根据权利要求1所述的方法,其中,所述描述逻辑是形式知识表示语言家族的成员,其中所述逻辑的查询是可决定的。
4.根据权利要求1所述的方法,其中:
所述通用语言三元组存储包括不是任何特定知识领域专用的单词的结构化定义,所述通用语言存储的每个结构化定义包括所述描述逻辑的三元组;以及
所述行业术语三元组存储包括特定知识领域专用的单词的结构化定义,所述行业术语三元组存储的每个结构化定义包括所述描述逻辑的三元组。
5.根据权利要求1所述的方法,其中,所述通用语言三元组存储和所述行业术语三元组存储是语言特定三元组存储的逻辑连接段。
6.根据权利要求1所述的方法,还包括从多个行业术语三元组存储中选择所述行业术语三元组存储。
7.根据权利要求1所述的方法,其中,所述计算机存储器的所述行业术语三元组存储进一步包括设置在一段连续的计算机存储器内的行业术语三元组存储。
8.根据权利要求1所述的方法,其中:
确定所述解析的三元组是否被记录在通用语言三元组存储中包括针对所述通用语言三元组存储断言包括所述解析的三元组的查询;以及
确定所述解析的三元组是否被记录在行业术语三元组存储中包括针对所述行业术语三元组存储断言包括所述解析的三元组的查询。
9.根据权利要求1所述的方法,还包括:
由所述计算机系统的查询引擎针对所述行业术语三元组存储执行针对在所述行业术语三元组存储中记录的行业术语项的定义的语义查询,所述语义查询通过图形用户界面的元件在所述查询引擎中被接收;以及
通过所述图形用户界面的所述元件显示所述语义查询的结果。
10.根据权利要求1所述的方法,还包括:
由所述计算机系统的查询引擎针对所述行业术语三元组存储执行针对在所述行业术语三元组存储中记录的行业术语项的定义的语义查询,所述语义查询通过语音使能用户界面在所述查询引擎中被接收;以及
通过所述语音使能用户界面显示所述语义查询的结果。
11.一种计算机系统,包括:
计算机存储器,其可操作地耦合到计算机处理器;
所述计算机存储器的通用语言三元组存储,所述通用语言三元组存储包括描述逻辑的三元组;
所述计算机存储器的行业术语三元组存储,所述行业术语三元组存储包括所述描述逻辑的三元组;以及
所述描述逻辑的解析的三元组,包括来自对话的解析为解析的三元组的数字化语音的单词;
其中,所述计算机处理器被配置为运行以确定所述解析的三元组是否记录在所述通用语言存储中以及所述解析的三元组是否记录在所述行业术语三元组存储中,并且如果所述解析的三元组既未记录在所述通用语言存储中也未记录在所述行业术语三元组存储中,则将所述解析的三元组记录在所述行业术语三元组存储中。
12.根据权利要求10所述的计算机系统,还包括自然语言处理语音识别引擎,所述自然语言处理语音识别引擎被配置为运行以将来自所述对话的语音识别为数字化语音的单词。
13.根据权利要求10所述的计算机系统,其中,所述描述逻辑是形式知识表示语言家族的成员,其中,所述逻辑的查询是可决定的。
14.根据权利要求10所述的计算机系统,其中:
所述通用语言三元组存储包括不是任何特定知识领域专用的单词的结构化定义,所述通用语言存储的每个结构化定义包括所述描述逻辑的三元组;以及
所述行业术语三元组存储包括特定知识领域专用的单词的结构化定义,所述行业术语三元组存储的每个结构化定义包括所述描述逻辑的三元组。
15.根据权利要求10所述的计算机系统,其中,所述通用语言三元组存储和所述行业术语三元组存储是语言特定三元组存储的逻辑连接段。
16.根据权利要求10所述的计算机系统,其中,所述行业术语三元组存储包括从多个行业术语三元组存储中选择的行业术语三元组存储。
17.根据权利要求10所述的计算机系统,其中,所述计算机存储器的所述行业术语三元组存储包括设置在一段连续的计算机存储器内的行业术语三元组存储。
18.根据权利要求10所述的计算机系统,其中:
确定所述解析的三元组是否被记录在所述通用语言三元组存储中包括针对所述通用语言三元组存储断言包括所述解析的三元组的查询;以及
确定所述解析的三元组是否被记录在所述行业术语三元组存储中的步骤包括针对所述行业术语三元组存储断言包括所述解析的三元组的查询。
19.根据权利要求10所述的计算机系统,还包括查询引擎,即自动计算机器的模块,其被配置为通过以下操作来运行:
针对所述行业术语三元组存储执行针对在所述行业术语三元组存储中记录的行业术语项的定义的语义查询,所述语义查询通过图形用户界面的元件在所述查询引擎中被接收;以及
通过所述图形用户界面的所述元件显示所述语义查询的结果。
20.根据权利要求10所述的计算机系统,还包括查询引擎,即自动计算机器的模块,其被配置为通过以下操作来运行:
针对所述行业术语三元组存储执行针对在所述行业术语三元组存储中记录的行业术语项的定义的语义查询,所述语义查询通过语音使能用户界面在所述查询引擎中被接收;以及
通过所述语音使能用户界面显示所述语义查询的结果。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US16/157,075 US10923114B2 (en) | 2018-10-10 | 2018-10-10 | Semantic jargon |
US16/157,075 | 2018-10-10 | ||
PCT/US2019/055488 WO2020077021A1 (en) | 2018-10-10 | 2019-10-10 | Semantic jargon |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112823332A true CN112823332A (zh) | 2021-05-18 |
Family
ID=70159118
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201980066773.0A Pending CN112823332A (zh) | 2018-10-10 | 2019-10-10 | 语义行业术语 |
Country Status (4)
Country | Link |
---|---|
US (1) | US10923114B2 (zh) |
EP (1) | EP3844636A4 (zh) |
CN (1) | CN112823332A (zh) |
WO (1) | WO2020077021A1 (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108027664B (zh) | 2015-09-28 | 2021-05-28 | 微软技术许可有限责任公司 | 统一的虚拟现实平台 |
US11468882B2 (en) | 2018-10-09 | 2022-10-11 | Accenture Global Solutions Limited | Semantic call notes |
US11797586B2 (en) * | 2021-01-19 | 2023-10-24 | Accenture Global Solutions Limited | Product presentation for customer relationship management |
Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101414310A (zh) * | 2008-10-17 | 2009-04-22 | 山西大学 | 一种自然语言搜索的方法和装置 |
CN101436192A (zh) * | 2007-11-16 | 2009-05-20 | 国际商业机器公司 | 用于优化针对垂直存储式数据库的查询的方法和设备 |
CN102880645A (zh) * | 2012-08-24 | 2013-01-16 | 上海云叟网络科技有限公司 | 语义化的智能搜索方法 |
CN103488724A (zh) * | 2013-09-16 | 2014-01-01 | 复旦大学 | 一种面向图书的阅读领域知识图谱构建方法 |
US20150332672A1 (en) * | 2014-05-16 | 2015-11-19 | Microsoft Corporation | Knowledge Source Personalization To Improve Language Models |
CN105956052A (zh) * | 2016-04-27 | 2016-09-21 | 青岛海尔软件有限公司 | 一种基于垂直领域的知识图谱的构建方法 |
CN106447346A (zh) * | 2016-08-29 | 2017-02-22 | 北京中电普华信息技术有限公司 | 一种智能电力客服系统的构建方法及系统 |
CN106528522A (zh) * | 2016-08-26 | 2017-03-22 | 南京威卡尔软件有限公司 | 场景化的语义理解与对话生成方法及系统 |
CN107247736A (zh) * | 2017-05-08 | 2017-10-13 | 广州索答信息科技有限公司 | 一种基于知识图谱的厨房领域问答方法及系统 |
CN108345647A (zh) * | 2018-01-18 | 2018-07-31 | 北京邮电大学 | 基于Web的领域知识图谱构建系统及方法 |
CN108491443A (zh) * | 2018-02-13 | 2018-09-04 | 上海好体信息科技有限公司 | 由计算机实施的与用户对话的方法和计算机系统 |
CN108509519A (zh) * | 2018-03-09 | 2018-09-07 | 北京邮电大学 | 基于深度学习的通用知识图谱增强问答交互系统及方法 |
Family Cites Families (125)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7937312B1 (en) | 1995-04-26 | 2011-05-03 | Ebay Inc. | Facilitating electronic commerce transactions through binding offers |
US20050005266A1 (en) | 1997-05-01 | 2005-01-06 | Datig William E. | Method of and apparatus for realizing synthetic knowledge processes in devices for useful applications |
US6829603B1 (en) * | 2000-02-02 | 2004-12-07 | International Business Machines Corp. | System, method and program product for interactive natural dialog |
US7043531B1 (en) | 2000-10-04 | 2006-05-09 | Inetprofit, Inc. | Web-based customer lead generator system with pre-emptive profiling |
US6785380B2 (en) | 2001-06-01 | 2004-08-31 | Avaya Technology Corp. | Network-centric self-administered call center with intelligent mobile agent terminals |
CN1647070A (zh) | 2001-06-22 | 2005-07-27 | 诺萨·欧莫贵 | 用于知识检索、管理、交付和表示的系统和方法 |
WO2003032125A2 (en) | 2001-10-11 | 2003-04-17 | Visualsciences, Llc | System, method, and computer program product for processing and visualization of information |
US8015143B2 (en) | 2002-05-22 | 2011-09-06 | Estes Timothy W | Knowledge discovery agent system and method |
US7486785B2 (en) | 2002-08-05 | 2009-02-03 | International Business Machines Corporation | Method for customer recognition and management |
US7599842B2 (en) | 2003-01-16 | 2009-10-06 | Genworth Financial, Inc. | Systems and methods for assignment of sales leads |
US7606714B2 (en) | 2003-02-11 | 2009-10-20 | Microsoft Corporation | Natural language classification within an automated response system |
US7676034B1 (en) | 2003-03-07 | 2010-03-09 | Wai Wu | Method and system for matching entities in an auction |
ATE495626T1 (de) | 2003-03-11 | 2011-01-15 | Koninkl Philips Electronics Nv | Scriptorientierte dialogunterstützung für den bediener einer anrufzentrale |
US20040210881A1 (en) * | 2003-04-17 | 2004-10-21 | Richard Friedman | Method of generating an application program interface for resource description framwork (RDF) based information |
US8155951B2 (en) | 2003-06-12 | 2012-04-10 | Patrick William Jamieson | Process for constructing a semantic knowledge base using a document corpus |
US8725524B2 (en) | 2003-08-13 | 2014-05-13 | Accenture Global Services Limited | Fraud detection method and system |
US7433876B2 (en) | 2004-02-23 | 2008-10-07 | Radar Networks, Inc. | Semantic web portal and platform |
US8204884B2 (en) | 2004-07-14 | 2012-06-19 | Nice Systems Ltd. | Method, apparatus and system for capturing and analyzing interaction based content |
US8254557B2 (en) | 2004-11-10 | 2012-08-28 | Cisco Technology, Inc. | Supervisor intercept for teleagent voice over internet protocol communications |
US8165109B2 (en) | 2004-11-10 | 2012-04-24 | Cisco Technology, Inc. | Method for managing the quality of encrypted voice over IP to teleagents |
US8031852B2 (en) | 2005-04-26 | 2011-10-04 | International Business Machines Corporation | Method for increasing ease of doing business through use of an access point model |
US20070094183A1 (en) * | 2005-07-21 | 2007-04-26 | Microsoft Corporation | Jargon-based modeling |
CA2615659A1 (en) | 2005-07-22 | 2007-05-10 | Yogesh Chunilal Rathod | Universal knowledge management and desktop search system |
US8442208B2 (en) | 2005-08-23 | 2013-05-14 | Cisco Technology, Inc. | Method and system for transferring an automatic call distributor call |
US8411843B1 (en) | 2005-10-04 | 2013-04-02 | Avaya Inc. | Next agent available notification |
US8108237B2 (en) | 2006-02-22 | 2012-01-31 | Verint Americas, Inc. | Systems for integrating contact center monitoring, training and scheduling |
US20070233561A1 (en) | 2006-03-28 | 2007-10-04 | Christopher Golec | Automated Lead Scoring |
US20090070322A1 (en) | 2007-08-31 | 2009-03-12 | Powerset, Inc. | Browsing knowledge on the basis of semantic relations |
US20090245500A1 (en) | 2008-03-26 | 2009-10-01 | Christopher Wampler | Artificial intelligence assisted live agent chat system |
US8639512B2 (en) | 2008-04-23 | 2014-01-28 | Nvoq Incorporated | Method and systems for measuring user performance with speech-to-text conversion for dictation systems |
US8155948B2 (en) * | 2008-07-14 | 2012-04-10 | International Business Machines Corporation | System and method for user skill determination |
US8401991B2 (en) | 2008-08-08 | 2013-03-19 | Oracle International Corporation | Database-based inference engine for RDFS/OWL constructs |
KR101045762B1 (ko) | 2008-11-03 | 2011-07-01 | 한국과학기술원 | 실시간 시맨틱 어노테이션 장치 및 이를 활용하여 사용자가입력한 자연어 스트링을 실시간으로 의미 가독형 지식 구조 문서로 생성하는 방법 |
US20110077999A1 (en) | 2009-09-30 | 2011-03-31 | Sap Ag | Managing consistent interfaces for retail event business objects across heterogeneous systems |
US8583589B2 (en) | 2009-10-06 | 2013-11-12 | Oracle International Corporation | Hybrid approach for equivalence reasoning |
US8744848B2 (en) | 2010-04-23 | 2014-06-03 | NVQQ Incorporated | Methods and systems for training dictation-based speech-to-text systems using recorded samples |
CN103229168B (zh) | 2010-09-28 | 2016-10-19 | 国际商业机器公司 | 在问答期间在多个候选答案之间证据扩散的方法和系统 |
US10303999B2 (en) * | 2011-02-22 | 2019-05-28 | Refinitiv Us Organization Llc | Machine learning-based relationship association and related discovery and search engines |
US9632994B2 (en) | 2011-03-11 | 2017-04-25 | Microsoft Technology Licensing, Llc | Graphical user interface that supports document annotation |
US8848970B2 (en) | 2011-04-26 | 2014-09-30 | Digimarc Corporation | Salient point-based arrangements |
US20120303355A1 (en) * | 2011-05-27 | 2012-11-29 | Robert Bosch Gmbh | Method and System for Text Message Normalization Based on Character Transformation and Web Data |
EP2710542A4 (en) | 2011-07-01 | 2015-04-29 | Truecar Inc | METHOD AND SYSTEM FOR SELECTING, FILTERING OR PRESENTING AVAILABLE SALES POINTS |
US9172807B2 (en) | 2011-09-11 | 2015-10-27 | ZenDesk, Inc. | Techniques for customer relationship management |
US9165556B1 (en) | 2012-02-01 | 2015-10-20 | Predictive Business Intelligence, LLC | Methods and systems related to audio data processing to provide key phrase notification and potential cost associated with the key phrase |
US9202227B2 (en) | 2012-02-07 | 2015-12-01 | 6 Sense Insights, Inc. | Sales prediction systems and methods |
US8747115B2 (en) * | 2012-03-28 | 2014-06-10 | International Business Machines Corporation | Building an ontology by transforming complex triples |
EP2839391A4 (en) | 2012-04-20 | 2016-01-27 | Maluuba Inc | CONVERSATION AGENT |
US9245287B2 (en) | 2012-07-18 | 2016-01-26 | Teletech Holdings, Inc. | Method for providing support with associates anywhere and notifications |
US9049295B1 (en) | 2012-08-28 | 2015-06-02 | West Corporation | Intelligent interactive voice response system for processing customer communications |
ITRM20120446A1 (it) * | 2012-09-18 | 2014-03-19 | Calbatt S R L | Sistema e metodo per la misura e la predizione dell¿efficienza di carica di accumulatori. |
US9047333B2 (en) | 2012-09-20 | 2015-06-02 | Cray Inc | Dynamic updates to a semantic database using fine-grain locking |
US8914419B2 (en) | 2012-10-30 | 2014-12-16 | International Business Machines Corporation | Extracting semantic relationships from table structures in electronic documents |
US9497289B2 (en) | 2012-12-07 | 2016-11-15 | Genesys Telecommunications Laboratories, Inc. | System and method for social message classification based on influence |
US9021452B2 (en) | 2012-12-27 | 2015-04-28 | Commvault Systems, Inc. | Automatic identification of storage requirements, such as for use in selling data storage management solutions |
EP2939104A4 (en) | 2012-12-28 | 2016-09-07 | Xsb Inc | SYSTEMS AND METHODS FOR CREATING, EDITING, RECORDING AND RECOVERING KNOWLEDGE CONTAINED IN SPECIFICATION DOCUMENTS |
EP2755148A1 (en) * | 2013-01-15 | 2014-07-16 | Fujitsu Limited | Data storage system, and program and method for execution in a data storage system |
CN103106195B (zh) * | 2013-01-21 | 2018-12-11 | 刘树根 | 表意构件识别提取和基于表意构件的机译人校互动翻译方法 |
US9386152B2 (en) | 2013-03-15 | 2016-07-05 | Genesys Telecommunications Laboratories, Inc. | Intelligent automated agent and interactive voice response for a contact center |
US20170293610A1 (en) * | 2013-03-15 | 2017-10-12 | Bao Tran | Voice assistant |
US9201865B2 (en) | 2013-03-15 | 2015-12-01 | Bao Tran | Automated assistance for user request that determines semantics by domain, task, and parameter |
US20170006161A9 (en) | 2013-03-15 | 2017-01-05 | Genesys Telecommunications Laboratories, Inc. | Intelligent automated agent for a contact center |
IN2013CH01237A (zh) | 2013-03-21 | 2015-08-14 | Infosys Ltd | |
US8996779B2 (en) | 2013-06-12 | 2015-03-31 | International Business Machines Corporation | Service oriented architecture service dependency determination |
US20150012350A1 (en) | 2013-07-02 | 2015-01-08 | Yue Li | Measuring the value of marketing contributions to deals |
EP2821943A1 (en) | 2013-07-03 | 2015-01-07 | Accenture Global Services Limited | Query response device |
US20160021181A1 (en) | 2013-07-23 | 2016-01-21 | George Ianakiev | Data fusion and exchange hub - architecture, system and method |
US9189742B2 (en) | 2013-11-20 | 2015-11-17 | Justin London | Adaptive virtual intelligent agent |
US9600769B1 (en) * | 2013-12-06 | 2017-03-21 | Google Inc. | In-message suggestion by personal knowledge graph constructed from user email data |
US20150201077A1 (en) | 2014-01-12 | 2015-07-16 | Genesys Telecommunications Laboratories, Inc. | Computing suggested actions in caller agent phone calls by using real-time speech analytics and real-time desktop analytics |
US9805320B2 (en) | 2014-02-27 | 2017-10-31 | Genesys Telecommunications Laboratories, Inc. | Tag-based performance framework for contact center |
US9286292B2 (en) * | 2014-03-04 | 2016-03-15 | International Business Machines Corporation | Real-time jargon translation in a communication system |
AU2015201364A1 (en) | 2014-03-17 | 2015-10-01 | Accenture Global Services Limited | Generating a semantic network based on semantic connections between subject-verb-object units |
US20150294405A1 (en) | 2014-04-11 | 2015-10-15 | Bank Of America Corporation | Virtual banking center |
TWI566107B (zh) | 2014-05-30 | 2017-01-11 | 蘋果公司 | 用於處理多部分語音命令之方法、非暫時性電腦可讀儲存媒體及電子裝置 |
US10074122B2 (en) | 2014-06-30 | 2018-09-11 | Microsoft Technology Licensing, Llc | Account recommendations |
US11289077B2 (en) | 2014-07-15 | 2022-03-29 | Avaya Inc. | Systems and methods for speech analytics and phrase spotting using phoneme sequences |
US9619513B2 (en) | 2014-07-29 | 2017-04-11 | International Business Machines Corporation | Changed answer notification in a question and answer system |
US9848084B2 (en) | 2014-08-01 | 2017-12-19 | Genesys Telecommunications Laboratories, Inc. | Adaptable business objective routing for a contact center |
US9350867B2 (en) | 2014-08-01 | 2016-05-24 | Genesys Telecommunications Laboratories, Inc. | System and method for anticipatory dynamic customer segmentation for a contact center |
US9781270B2 (en) | 2014-08-01 | 2017-10-03 | Genesys Telecommunications Laboratories, Inc. | System and method for case-based routing for a contact |
US9645994B2 (en) | 2014-12-09 | 2017-05-09 | Conduent Business Services, Llc | Methods and systems for automatic analysis of conversations between customer care agents and customers |
US10242374B2 (en) | 2014-12-09 | 2019-03-26 | Facebook, Inc. | Providing insights to a merchant |
US9547823B2 (en) | 2014-12-31 | 2017-01-17 | Verizon Patent And Licensing Inc. | Systems and methods of using a knowledge graph to provide a media content recommendation |
SG10201500683TA (en) | 2015-01-28 | 2016-08-30 | Crayon Data Pte Ltd | Method and system for automatically recommending business prospects |
US20160239851A1 (en) | 2015-02-18 | 2016-08-18 | PokitDok, Inc. | Multi commodity system and method for calculating market dynamics in health networks systems |
WO2016139666A1 (en) | 2015-03-05 | 2016-09-09 | Wikistrat Ltd. | Predictive strategic outcomes by combining human crowdsourcing |
US20190124193A1 (en) | 2017-10-19 | 2019-04-25 | Pinn, Inc. | Wearable personal wireless media station |
US20160321748A1 (en) | 2015-04-29 | 2016-11-03 | International Business Machines Corporation | Method for market risk assessment for healthcare applications |
US10101976B2 (en) | 2015-04-30 | 2018-10-16 | OpenMethods, Inc. | Method, system and apparatus for visual programming of interaction workflows for omni-channel customer contact centers with integrated customer relationship management |
US20160335544A1 (en) * | 2015-05-12 | 2016-11-17 | Claudia Bretschneider | Method and Apparatus for Generating a Knowledge Data Model |
US20170024375A1 (en) | 2015-07-26 | 2017-01-26 | Microsoft Technology Licensing, Llc | Personal knowledge graph population from declarative user utterances |
US20170091390A1 (en) | 2015-09-30 | 2017-03-30 | T-Mobile Usa, Inc. | Delivering customer information from customer care site to customer care agent |
US10521410B2 (en) * | 2015-11-20 | 2019-12-31 | International Business Machines Corporation | Semantic graph augmentation for domain adaptation |
US10831811B2 (en) | 2015-12-01 | 2020-11-10 | Oracle International Corporation | Resolution of ambiguous and implicit references using contextual information |
US10057423B1 (en) * | 2015-12-03 | 2018-08-21 | Babak Sheikh | System and method for responding to telephone calls and written communications |
US10262062B2 (en) | 2015-12-21 | 2019-04-16 | Adobe Inc. | Natural language system question classifier, semantic representations, and logical form templates |
US9736306B2 (en) | 2016-01-05 | 2017-08-15 | Optum, Inc. | Systems and methods for providing predictive personalization interactions |
US20170200220A1 (en) | 2016-01-07 | 2017-07-13 | Tangerine Bank | Performance of a remotely managed customer service system |
JP6638480B2 (ja) | 2016-03-09 | 2020-01-29 | 富士通株式会社 | 類似文書検索プログラム、類似文書検索装置、及び類似文書検索方法 |
US10078632B2 (en) | 2016-03-12 | 2018-09-18 | International Business Machines Corporation | Collecting training data using anomaly detection |
US9848082B1 (en) | 2016-03-28 | 2017-12-19 | Noble Systems Corporation | Agent assisting system for processing customer enquiries in a contact center |
US10303466B1 (en) | 2016-09-07 | 2019-05-28 | Amazon Technologies, Inc. | Semantic annotations in source code |
WO2018064455A1 (en) | 2016-09-29 | 2018-04-05 | Convida Wireless, Llc | Access control policy synchronization for service layer |
US20180115644A1 (en) | 2016-10-25 | 2018-04-26 | Ali Hassan Al-Khaja | System and method for switching from a call on a voice communication channel to web based self-services |
KR102091240B1 (ko) | 2016-11-23 | 2020-03-20 | 한국전자통신연구원 | 결정적 및 비결정적 지식 처리의 융합을 위한 데이터 처리 장치 및 방법 |
KR101872863B1 (ko) | 2016-11-24 | 2018-07-02 | 주식회사 와이즈넛 | 채팅봇을 이용한 비즈니스 지원 방법 |
US11934465B2 (en) * | 2016-11-28 | 2024-03-19 | Thomson Reuters Enterprise Centre Gmbh | System and method for finding similar documents based on semantic factual similarity |
US10026092B2 (en) | 2016-12-09 | 2018-07-17 | Nuance Communications, Inc. | Learning and automating agent actions |
US9948783B1 (en) | 2017-03-17 | 2018-04-17 | Avaya Inc. | Publishing contacts to opt-in users |
US11151992B2 (en) | 2017-04-06 | 2021-10-19 | AIBrain Corporation | Context aware interactive robot |
US10810371B2 (en) | 2017-04-06 | 2020-10-20 | AIBrain Corporation | Adaptive, interactive, and cognitive reasoner of an autonomous robotic system |
US20180315001A1 (en) | 2017-04-26 | 2018-11-01 | Hrb Innovations, Inc. | Agent performance feedback |
US10127513B1 (en) | 2017-04-28 | 2018-11-13 | Cyara Solutions Pty Ltd | Automated multi-channel customer journey testing |
US10389879B2 (en) | 2017-05-19 | 2019-08-20 | Avaya Inc. | Real-time speech feed to agent greeting |
US10453150B2 (en) | 2017-06-16 | 2019-10-22 | Nauto, Inc. | System and method for adverse vehicle event determination |
US10694038B2 (en) | 2017-06-23 | 2020-06-23 | Replicant Solutions, Inc. | System and method for managing calls of an automated call management system |
US10652592B2 (en) * | 2017-07-02 | 2020-05-12 | Comigo Ltd. | Named entity disambiguation for providing TV content enrichment |
EP3642835A4 (en) | 2017-08-03 | 2021-01-06 | Telepathy Labs, Inc. | PROACTIVE, INTELLIGENT AND OMNICANAL VIRTUAL AGENT |
US11475488B2 (en) | 2017-09-11 | 2022-10-18 | Accenture Global Solutions Limited | Dynamic scripts for tele-agents |
US11853930B2 (en) | 2017-12-15 | 2023-12-26 | Accenture Global Solutions Limited | Dynamic lead generation |
US11269929B2 (en) | 2018-05-04 | 2022-03-08 | International Business Machines Corporation | Combining semantic relationship information with entities and non-entities for predictive analytics in a cognitive system |
US10824658B2 (en) | 2018-08-02 | 2020-11-03 | International Business Machines Corporation | Implicit dialog approach for creating conversational access to web content |
US20200097814A1 (en) | 2018-09-26 | 2020-03-26 | MedWhat.com Inc. | Method and system for enabling interactive dialogue session between user and virtual medical assistant |
US11036774B2 (en) | 2018-10-04 | 2021-06-15 | Robert Bosch Gmbh | Knowledge-based question answering system for the DIY domain |
US10482384B1 (en) | 2018-11-16 | 2019-11-19 | Babylon Partners Limited | System for extracting semantic triples for building a knowledge base |
-
2018
- 2018-10-10 US US16/157,075 patent/US10923114B2/en active Active
-
2019
- 2019-10-10 CN CN201980066773.0A patent/CN112823332A/zh active Pending
- 2019-10-10 EP EP19872221.7A patent/EP3844636A4/en active Pending
- 2019-10-10 WO PCT/US2019/055488 patent/WO2020077021A1/en unknown
Patent Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101436192A (zh) * | 2007-11-16 | 2009-05-20 | 国际商业机器公司 | 用于优化针对垂直存储式数据库的查询的方法和设备 |
CN101414310A (zh) * | 2008-10-17 | 2009-04-22 | 山西大学 | 一种自然语言搜索的方法和装置 |
CN102880645A (zh) * | 2012-08-24 | 2013-01-16 | 上海云叟网络科技有限公司 | 语义化的智能搜索方法 |
CN103488724A (zh) * | 2013-09-16 | 2014-01-01 | 复旦大学 | 一种面向图书的阅读领域知识图谱构建方法 |
CN106462608A (zh) * | 2014-05-16 | 2017-02-22 | 微软技术许可有限责任公司 | 改进语言模型的知识源个性化 |
US20150332672A1 (en) * | 2014-05-16 | 2015-11-19 | Microsoft Corporation | Knowledge Source Personalization To Improve Language Models |
CN105956052A (zh) * | 2016-04-27 | 2016-09-21 | 青岛海尔软件有限公司 | 一种基于垂直领域的知识图谱的构建方法 |
CN106528522A (zh) * | 2016-08-26 | 2017-03-22 | 南京威卡尔软件有限公司 | 场景化的语义理解与对话生成方法及系统 |
CN106447346A (zh) * | 2016-08-29 | 2017-02-22 | 北京中电普华信息技术有限公司 | 一种智能电力客服系统的构建方法及系统 |
CN107247736A (zh) * | 2017-05-08 | 2017-10-13 | 广州索答信息科技有限公司 | 一种基于知识图谱的厨房领域问答方法及系统 |
CN108345647A (zh) * | 2018-01-18 | 2018-07-31 | 北京邮电大学 | 基于Web的领域知识图谱构建系统及方法 |
CN108491443A (zh) * | 2018-02-13 | 2018-09-04 | 上海好体信息科技有限公司 | 由计算机实施的与用户对话的方法和计算机系统 |
CN108509519A (zh) * | 2018-03-09 | 2018-09-07 | 北京邮电大学 | 基于深度学习的通用知识图谱增强问答交互系统及方法 |
Also Published As
Publication number | Publication date |
---|---|
EP3844636A1 (en) | 2021-07-07 |
WO2020077021A1 (en) | 2020-04-16 |
US10923114B2 (en) | 2021-02-16 |
EP3844636A4 (en) | 2022-05-25 |
US20200118555A1 (en) | 2020-04-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US12001972B2 (en) | Semantic inferencing in customer relationship management | |
US10951763B2 (en) | Semantic artificial intelligence agent | |
US10623572B1 (en) | Semantic CRM transcripts from mobile communications sessions | |
US11468882B2 (en) | Semantic call notes | |
US8818795B1 (en) | Method and system for using natural language techniques to process inputs | |
CN112823332A (zh) | 语义行业术语 | |
AU2022200232A1 (en) | Product presentation for customer relationship management | |
US11816677B2 (en) | Call preparation engine for customer relationship management | |
US11132695B2 (en) | Semantic CRM mobile communications sessions | |
US12026525B2 (en) | Dynamic dashboard administration | |
US20230048077A1 (en) | Mobile intelligent outside sales assistant | |
US20230274295A1 (en) | Halfalogue insight generation | |
CA3181446A1 (en) | Unified, cross-channel, multidimensional insight generation |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20220427 Address after: Irish Dublin Applicant after: Accenture Global Solutions Ltd. Address before: Georgia State, USA Applicant before: N3 LLC |
|
TA01 | Transfer of patent application right |