CN114787814A

CN114787814A - 指代解析

Info

Publication number: CN114787814A
Application number: CN202080085413.8A
Authority: CN
Inventors: 石川隼辅; 富永康之; 植月洋晶; 岩井麻子; 长谷川彻; 渡边健太
Original assignee: International Business Machines Corp
Current assignee: International Business Machines Corp
Priority date: 2019-12-10
Filing date: 2020-12-04
Publication date: 2022-07-22
Anticipated expiration: 2040-12-04
Also published as: AU2020400345B2; CN114787814B; US20210174022A1; US11151321B2; KR102663846B1; JP2023505283A; GB202209859D0; GB2605120A; WO2021116858A1; GB2605120B; AU2020400345A1; KR20220091529A; DE112020005253T5

Abstract

一种用于解析指代的方法、结构和计算机系统。示例性实施方式可以包括从个体表达中提取个体上下文数据，并且基于个体上下文数据来确定个体表达是否包括指代表示。示例性实施例还可包括基于确定个体表达包括指代表示，提取指代上下文数据，并且基于将个体上下文数据和指代上下文数据与详述一个或多个对象的数据进行比较来识别在该一个或多个对象中该指代表示所指的对象。

Description

指代解析

技术领域

示例性实施例一般涉及文本挖掘，尤其涉及上下文文本挖掘。

背景技术

指代是指在句子中较早使用的词或代替该词的词。例如，在句子“我想要这个”中，代词“这个”是指对象的指代。用于分析和确定这种代词所指的对象的技术被称为指代解析。尽管在自然语言中通常使用和理解指代，但是聊天机器人、虚拟助理和其它人机界面的日益普及已经产生了对能够在基于计算机的系统中快速且有效地解析指代的技术的需要，特别是当用户输入数据可能受到限制时。

在传统的指代解析系统中，指代解析主要依赖于遍及对话的语音分析。例如，美国专利US9754591 B1描述了一种解析指代的方法，其中用户可以参与与计算设备的对话以便发起某一功能或获得某一信息。对话管理器可以管理对话并且存储关于一个或多个对话的上下文数据。处理和响应后续会话可以受益于先前存储的上下文数据，例如通过如果用户已经在先前会话的上下文中提供了信息则减少用户必须提供的信息量。

已经考虑了例如通过收集关于指代表示的附加信息，来改进解析指代中使用的基于语音的技术。例如，美国专利US9767501 B1描述了一种用于解析指代的方法，其中用户可以通过麦克风提供语音输入，并且可以激活扫描仪来扫描项目标识符(例如，条形码)。手持设备可以将语音数据和项目标识符信息传送到远程系统以进行语音辅助扫描。远程系统可以对语音数据执行自动语音识别(ASR)操作，并且可以基于扫描的标识符执行项目识别操作。通过将ASR信息与基于所扫描的标识符获得的项目信息组合，可以改善自然语言理解(NLU)处理。

还考虑了其它常规的解析指代的方法，并且总的来说，存在各种常规的方法来改进指代解析。然而，这些常规方法中的每一种都没有考虑关于指代表示的其它上下文数据。

发明内容

示例性实施例公开了一种用于解析指代的方法、结构和计算机系统。示例性实施方式可以包括从个体表达中提取个体上下文数据，并且基于个体上下文数据来确定个体表达是否包括指代表示。示例性实施例还可包括基于确定个体表达包括指代表示，提取指代上下文数据，并且基于将个体上下文数据和指代上下文数据与详述一个或多个对象的数据进行比较，来识别该一个或多个对象中该指代表示所指的对象。

附图说明

结合附图，将最好地理解以下详细描述，其通过示例给出示例性实施例而不旨在将示例性实施例仅限制于此，在附图中：

图1描绘了根据示例性实施例的指代解析系统100的示例性示意图；

图2描绘了示出根据示例性实施例的指代解析系统100的指代解析器132的操作的示例性流程图200；

图3描绘了根据示例性实施例的其中可实现指代解析系统100的环境300的示例性示意图；

图4描绘了根据示例性实施例的表示存储在指代解析系统100的对象数据库服务器120上的数据的示例性表400；

图5描绘了根据示例性实施例的描绘了图1的指代解析系统100的硬件组件的示例性框图；

图6描绘了根据示例性实施例的云计算环境；以及

图7描绘了根据示例性实施例的抽象模型层。

附图不一定是按比例的。附图仅仅是示意性表示，而不是旨在描绘示例性实施例的具体参数。附图旨在仅描述典型的示例性实施例。在附图中，相同的标号表示相同的元件。

具体实施方式

本文公开了所要求保护的结构和方法的详细实施例；然而，可以理解，所公开的实施例仅仅是对可以以各种形式实施的所要求保护的结构和方法的说明。示例性实施例仅是说明性的，然而，可以以许多不同的形式来实施，并且不应被解释为限于本文阐述的示例性实施例。相反，提供这些示例性实施例是为了使本公开透彻和完整，并且将向本领域技术人员充分传达示例性实施例所覆盖的范围。在描述中，可以省略公知的特征和技术的细节，以避免不必要地模糊所呈现的实施例。

说明书中对“一个实施例”、“实施例”、“示例性实施例”等的引用指示所描述的实施例可以包括特定特征、结构或特性，但是每个实施例可以不一定包括该特定特征、结构或特性。此外，这些短语不一定是指相同的实施例。此外，当结合实施例描述特定特征、结构或特性时，认为结合其它实施例实现这样的特征、结构或特性是在本领域技术人员的知识范围内的，而不管是否明确描述。

为了不模糊示例性实施例的呈现，在以下详细描述中，本领域已知的一些处理步骤或操作可能已经被组合在一起以用于呈现和用于说明目的，并且在一些情况下可能没有被详细描述。在其它情况下，可能根本不描述本领域已知的一些处理步骤或操作。应当理解，下面的描述集中在根据各种示例性实施例的区别特征或元件上。

本发明提出了一种通过不仅使用口述文本的内容而且使用上下文数据(例如用户定位和取向、用户视线、对象元数据等)来指定与会话目标相对应的对象，从而提高指代解析的精度的技术。用户定位/取向和视线可以从诸如相机、智能电话等传感器中推断，而对象元数据可以存储在本地或远程数据库中，并且包括例如可以是在指代表示中所提及的对象的地点、颜色、形状等。基于所收集的上下文信息，系统然后可确定指代表示所指的最可能的对象，如将在本文中更详细地描述的。

本发明通过将关于用户和环境的上下文信息并入自然语言和数据分析中来改进现有的指代解析技术。示例性实施例的突出显示包括增加的指代解析精度，从而导致自然语言处理和文本挖掘技术的改进的精度和效率。示例性实施例的使用情况包括遍及各种设置在自然语言中的指代解析，各种设置例如在个人助理、零售设置、工作设置、演示设置等中的使用。下面是示例性实施例的详细描述。

图1描绘了根据示例性实施例的指代解析系统100。根据示例性实施例，指代解析系统100可包括(一个或多个)传感器110、对象数据库服务器120和指代解析服务器130，它们都可经由网络108互连。虽然示例性实施例的编程和数据可以经由网络108跨若干服务器被远程地存储和访问，但是示例性实施例的编程和数据可以替代地或附加地被本地存储在少至一个物理计算设备上或除了所描绘的那些之外的其他计算设备之中。例如，在实施例中，指代解析器132和必要的组件可以存储在传感器110上以供本地使用，而不需要连接到网络108。在此更详细地描述指代解析系统100的操作。

在示例性实施例中，网络108可以是能够在连接的设备之间传输数据的通信信道。在示例性实施例中，网络108可以是互联网，表示支持在连接到互联网的设备之间的通信的网络和网关的世界范围的集合。此外，网络108可以利用各种类型的连接，诸如有线、无线、光纤等，其可以被实现为内联网、局域网(LAN)、广域网(WAN)或其组合。在另外的实施例中，网络108可以是蓝牙网络、Wi-Fi网络或其组合。网络108可以以包括2.4gHz和5dHz、近场通讯、Z-波。Zigee等的频率操作。在又一些实施例中，网络108可以是用于促进两方或更多方通话呼叫的电信网络，包括陆线网络、无线网络、封闭网络、卫星网络或其组合。通常，网络108可以表示将支持连接的设备之间的通信的连接和协议的任何组合。

在示例性实施例中，(一个或多个)传感器110可以是能够收集数据的一个或多个设备。具体而言，(一个或多个)传感器110可以被配置成收集在其中可以实现例如图3所描绘的指代解析系统100的环境内的上下文信息。在实施例中，(一个或多个)传感器110可以收集用户数据，例如用户位置/取向、移动、视线、说话动作、手势运动等。在一些实施例中，传感器110可以附加地收集对象数据，例如对象位置、颜色、形状等，并且可以进一步被配置为周期性地更新对象数据库服务器120内的对象元数据。根据一些实施例，(一个或多个)传感器110可以位于环境内，例如相机、麦克风、网络等，而在其他实施例中，(一个或多个)传感器110可以是移动的，例如计算机、智能电话、智能手表、智能眼镜、智能隐形眼镜等。一般而言，(一个或多个)传感器110可以是能够收集在环境中的用户和/或对象信息的任何设备。参考图2-5进行更详细地描述(一个或多个)传感器110。

在示例性实施例中，对象数据库服务器120包括对象数据库122，并且可以是企业服务器、膝上型计算机、笔记本、平板计算机、上网本计算机、个人计算机(PC)、台式计算机、服务器、个人数字助理(PDA)、转盘拨号电话、按键式电话、智能电话、移动电话、虚拟设备、瘦客户端、IoT设备、或者能够向其他计算设备发送数据和从其他计算设备接收数据的任何其他电子设备或计算系统。虽然对象数据库服务器120被示为单个设备，但是在其他实施例中，对象数据库服务器120可以以按照模块化方式等一起工作或独立工作的集群计算设备或多个计算设备组成。对象数据库服务器120参考图5被更详细地描述为硬件实现，参考图6被描述为云实现的一部分，和/或参考图7被描述为利用功能抽象层进行处理。

对象数据库122可以是关于一个或多个对象的信息和元数据的储存库。在实施例中，一个或多个对象可以表示指代所指的对象，并且可以是真实世界的对象(例如人、地点、事物等)以及虚拟对象(例如在屏幕、监视器、虚拟/增强/减少现实等上描绘的对象)。此外，对象数据库122可以包括描述一个或多个对象的信息和元数据，例如对象形状、颜色、大小、条形码、库存单位(SKU)、媒体访问控制(MAC)地址、互联网协议(IP)地址、位置(例如，环境的3D表示内的坐标)、对象的文本描述等。在实施例中，对象数据库122可以例如通过用户输入或通过对(一个或多个)传感器110的引用来填充和定期更新。参考图2-5更详细地描述对象数据库122。

在示例性实施例中，指代解析服务器130可以包括指代解析器132，并且可以是企业服务器、膝上型计算机、笔记本、平板计算机、上网本计算机、PC、台式计算机、服务器、PDA、转盘拨号电话、按键式电话、智能电话、移动电话、虚拟设备、瘦客户端、IoT设备或者能够向其他计算设备发送数据和从其他计算设备接收数据的任何其他电子设备或计算系统。尽管指代解析服务器130被示出为单个设备，但是在其他实施例中，指代解析服务器130可以包括一起工作或独立工作的集群计算设备或多个计算设备。指代解析服务器130参考图5被更详细地描述为硬件实现，参考图6被描述为云实现的一部分，和/或参考图7被描述为利用功能抽象层来进行处理。

在示例性实施例中，指代解析器132可以是能够从环境内在一个或多个个体之间的对话和/或动作中提取个体上下文数据的软件和/或硬件程序。另外，指代解析器132可能能够确定个体上下文数据是否包括指代表示，并且如果包括，则从用户对话和/或动作中提取指代上下文数据。此外，指代解析器132能够基于所提取的个体上下文数据和所提取的指代上下文数据来将指代表示匹配到对象。指代解析器132还能够对在指代表示与一个或多个对象之间的匹配进行评分和排名，并且进一步调整对匹配进行评分的模型。参考图2-5更详细地描述指代解析器132。

图2描绘了示例性流程图200，其示出根据示例性实施例的指代解析系统100的指代解析器132的操作。

指代解析器132可以提取个体上下文数据(步骤202)。在示例性实施例中，指代解析器132可从环境内在一个或多个个体之间的对话和/或动作中提取个体上下文数据，以便促进识别在个体之间作出的指代表示的对象。个体上下文数据可以包括与以下有关的数据：环境内的个体的数量、个体的身份、被识别为说话的个体、个体的位置(例如，3D空间中的坐标)、个体的分组、个体相对于说话者/一个或多个对象的取向、视线等。在示例性实施例中，指代解析器132可以使用(一个或多个)传感器110结合例如图像和视频分析、音频分析、模板匹配、面纹或声纹识别、实体提取等技术来检测和识别个体。在另一实施例中，(一个或多个)传感器110可以被实现为网络，例如WiFi网络，并且可以基于WiFi连接来识别个体和推断位置。此外，指代解析器132可以使用例如音频到视频匹配、三角测量、三边测量、空间分析、时间分析等技术，来识别那些正在讲话的人以及个人的位置、分组和取向。另外，指代解析器132可以参考被实现为智能设备或可穿戴设备的传感器110，例如智能眼镜或智能手表，以便提取个体的定位、视线、移动等。例如，指代解析器132可以基于从由个体佩戴的一副智能眼镜馈送的视频或图像来确定视线，或者基于智能手表来确定在区域内的位置。

另外，个体上下文数据还可以包括在环境内检测到的一个或多个个体的自然语言数据和/或表达，例如音频、文本和手势对话(步骤202继续)。指代解析器132可以通过首先经由传感器110检测由个人发出的文本、音频或手势来提取自然语言数据，所述传感器可以是麦克风、相机、智能设备或其他传感器的形式，并且可以安装在环境中、移动的、由用户佩戴的等等。在自然语言是可听和/或语音的实施例中，指代解析器132可以将(一个或多个)传感器110实现为麦克风，并且对检测到的音频进行提取、翻译、转录等。另外，指代解算器132可以将(一个或多个)传感器110实现为相机，并且利用唇读技术来提取自然语言。类似地，通过将(一个或多个)传感器110实现为相机并且参考将姿势和手语与自然语言相关联的数据库，指代解析器132可以被配置为从姿势(例如指向、挥动、手语等)提取自然语言。在自然语言是文本的实施例中，该指代解析器132可以将(一个或多个)传感器110实现为智能设备(例如智能电话或膝上型计算机)，并且拦截经由消息、社交网络等共享的文本对话。一般而言，指代解析器132可以实施用于通过(一个或多个)传感器110提取个体上下文数据的任何技术和策略。在提取了各个自然语言的音频、视频等之后，指代解析器132然后可以将自然语言处理和理解技术应用于所提取的自然语言，以便确定已经传送的自然语言。

为了更好地示出指代解析器132的操作，现在参考图3-4所描绘的说明性示例，其中个体316和个体318正在讨论由零售设置中的货架202所展示的商品。这里，指代解析器132利用作为相机和麦克风组合设备的传感器110，以便提取在个体之间的陈述“你喜欢哪一个？”和回应“黑色圆形的那一个”的对话。另外，指代解析器132使用作为相机的传感器110来提取个体316和318的身份、位置和相对于环境视线。

指代解析器132可确定个体语言是否包含一个或多个指代表示(判定204)。在示例性实施例中，指代解析器132可通过利用若干自然语言处理技术来确定用户语言是否包含一个或多个指代表示。在实施例中，指代解析器132可使用基于规则的方法或例如模板和/或模式匹配来识别指代表示。另外，指代解析器132还可实现机器学习技术，例如使用言语分析、实体提取、模型、对语料库的引用等，来学习在指代与言语的其他部分之间的对应。然而，在其他实施例中，指代解析器132可以实现用于检测用户对话或表达内的指代的其他技术。

进一步在图3-4所描述的说明性示例，其中对话包括“你喜欢哪一个？”和“黑色圆形的那一个”，则指代解析器132基于机器学习和模板匹配技术来确定两个句子中的术语“那一个”是指代表示。

指代解析器132可从个体上下文数据中提取指代上下文数据(步骤206)。在示例性实施例中，指代上下文数据包括与所识别的指代表示和对应的对象有关的项目。这样的指代上下文数据可以包括指代所指的对象的颜色、形状、放置、大小、时间等。为了提取指代上下文数据，指代解析器132可以从个体上下文数据中提取关键字和主题，例如涉及颜色、大小、形状、位置、时间等的音频或文本。另外，指代解析器132还可以从其它个体上下文数据中提取指代上下文数据，例如一个或多个个体指向的位置、个体的朝向、个体的视线等。指代解析器132可以从与所识别的指代相邻的一个或多个单词、句子、段落等中提取指代上下文数据。例如，指代解析器132可以利用对所识别的(一个或多个)指代表示之前和之后的N个句子的依赖性分析来执行自然语言处理。此外，指代解析器132可记录此类个体上下文数据和指代上下文数据并将其与所识别的个体相关联，使得指代解析器132可生成个体简档，以便跟踪个体兴趣、爱好、趋势、模式等。指代解析器132可以通过将简档数据合并到未来的指代解析中，来基于趋势、概率等进一步在提取指代上下文数据中利用个体简档信息。例如，如果个体过去提到参考时钟，则个体当前很可能提到时钟。

参考以上包括自然语言“你喜欢哪一个？”和“黑色圆形的那一个”说明性示例，指代解析器132基于分别作为主题颜色和形状的一部分的黑色和圆形来提取指代上下文数据“黑色”和“圆形”。另外，如果个体指向特定对象或用姿势朝向特定对象，则指代解析器132将进一步提取关于个体所作出的姿势的方向的信息。

指代解析器132可以将(一个或多个)指代表示匹配到一个或多个对象(步骤208)。在实施例中，指代解析器132可以通过将所提取的个体上下文数据和所提取的指代上下文数据两者与由对象数据库122详述的对象数据进行比较，来将指代表示匹配到对象。在实施例中，指代解析器132可以将个体上下文数据(例如位置、取向、视线等)与由对象数据库122详述的对象的位置进行比较。例如，指代器解析器132可利用一个或多个个体的位置和取向来确定个体正在朝特定货架的方向看，并利用视线来确定个体正在朝货架的顶部显示器看。此外，指代解析器132可以将指代上下文数据(例如对象的颜色、形状、大小等)与由对象数据库122详述的对象的颜色、形状、大小等的数据进行比较。例如，指代解析器132可以将由个体描述的颜色、形状、大小或发布日期与由对象数据库122详述的对象的颜色、形状、大小或发布日期进行比较。对于比较中所考虑的每个对象，指代解析器132可以确定所进行的每个比较的对象匹配分数(例如，针对位置、取向、视线、颜色、形状、大小等中的每一个的分数)，并且组合对象匹配分数以确定针对对象中的每一个对象的当其与所识别的指代解析表示中的每一个相关时的总体对象匹配分数。

在实施例中，当确定针对所考虑的每个对象的总体对象匹配分数时，指代解析器132可以考虑以上的任何或所有对象匹配分数以及任何其它的(步骤208继续)。在实施例中，指代解析器132可以将对象匹配分数视为模型内的特征，其中在计算总体对象匹配分数时对每个特征进行加权。例如，被确定为使指代表示与对象高度相关的那些特征可以比不是高度相关的那些特征更重地加权。于是，对于每个对象，例如，指代解析器132可以将特征乘以相关联的权重，并且将对象匹配分数求和以确定总体对象匹配分数。可以使用诸如机器学习、神经网络、回归等技术来生成和训练这样的模型。当可应用时，指代解析器132可被配置成识别指代所指的一个或多个对象。此外，指代解析器132可以被配置为在识别特定指代的对象时考虑其他指代。例如，如果个体大声说“在那个上方的那一个”的话，则在确定“那一个”是什么之前，指代解析器132可以首先确定“在那个上方”正在指的对象。

再次参考先前介绍的示例，指代解析器132确定在指代表示与如对象数据库122所详述的货架302、钟表308、钟表310、蛋糕312和棒棒糖314之间的对象匹配分数。指代解析器132另外对对象匹配分数求和，以将总体对象匹配分数确定为与钟表310的95％匹配、与钟表308的65％匹配、与棒棒糖314的30％匹配以及与蛋糕312的10％匹配。

指代解析器132可对指代-对象匹配进行评分和排名(步骤210)。基于指代表示与由对象数据库122详述的对象的比较，指代解析器132可基于成为指代所指的对象的概率来对潜在对象进行评分。另外，指代解析器132可以对经评分的潜在对象进行排名，并且在实施例中，将得分、个体上下文数据和指代上下文数据与对象数据库122内的对象相关联。在实施例中，指代解析器132将具有最高匹配的对象排名为指代所指的最可能对象。指代解析器132可将最高排名的对象输出到用户接口、另一计算设备等。例如，指代解析器132可以经由文本、推送通知、电子邮件等询问个体那是否是他们所指的对象，或者使用/转发该对象以供在自然语言处理和理解应用中使用。

参考先前介绍的示例，指代解析器132将钟表310排名为指代“黑色圆形的那一个”所指的最可能对象，并且在个体316和318之间的对话的自然语言处理中利用钟表310。

指代解析器132可调整模型(步骤212)。在实施例中，指代解算器132可以基于确定指代所指的正确对象是否被识别来调整模型。例如，指代解析器132可以继续提取个体上下文数据和指代上下文数据，以便重新分析是否最初识别了正确的对象。如果指代解析器132稍后确定不同的对象比原始对象更有可能是指代所指的对象，则指代解析器132可以调整与原始依赖的特征相关联的权重。另外，指代解析器132可以参考(一个或多个)传感器110，以便确定个人是否最终选择、拾起、使用等了原始识别的对象，从而确认所识别的对象。在其他实施例中，指代解析器132可以实现反馈回路的其他方法，例如接收个人或管理员进行的用户输入。

再次参考先前介绍的示例，指代解析器132基于个体最终选择钟表308而不是钟表310来调整与特征相关联的权重。

图3描绘了根据示例性实施例的其中可实现指代分解系统100的环境300的示例性示意图。

图3描绘了其中在零售设置中实现指代解析系统100的实施例。示例性环境300可包括零售货架302、用户316、用户318和传感器110。零售货架302可包括用于展示物体(例如商品)的中间层货架板304和下层货架板板306。中间层货架板304可包括灰色钟表308和黑色钟表310，而下级货架板306可包括蛋糕312和棒棒糖314。在示例性环境300中，(一个或多个)传感器110可以被配置为检测和测量用户自然语言和手势数据，例如用户语音、文本或动作。另外，传感器110可被配置成检测和测量关于环境300内的用户316和用户318的个体上下文数据，例如位置、运动、视线、移动、姿势等。在一些实施例中，(一个或多个)传感器110可以进一步被配置为检测和测量关于对象308、310、312和314的对象上下文数据，例如对象位置、形状、大小、颜色、移动等。

图4示出了根据示例性实施例的表示存储在指代解析系统100的对象数据库服务器120上的数据的示例性表400。更具体地说，表400示出了由对象数据库122详述的与图3的环境300内的对象相对应的示例性商品表。

图5示出了根据示例性实施例的图1的指代解析系统100内的设备的框图。应当理解，图5仅提供了一种实现方式的说明，而不暗示对其中可实现不同实施例的环境的任何限制。可以对所描述的环境进行许多修改。

这里使用的设备可以包括一个或多个处理器02、一个或多个计算机可读RAM0 4、一个或多个计算机可读ROM 06、一个或多个计算机可读存储介质08、设备驱动器12、读/写驱动器或接口14、网络适配器或接口16，所有这些都通过通信结构18互连，通信结构18可以用设计用于在处理器(例如微处理器、通信和网络处理器等)、系统存储器、外围设备和系统内的任何其它硬件组件之间传递数据和/或控制信息的任何体系结构来实现。

一个或多个操作系统10以及一个或多个应用程序11被存储在一个或多个计算机可读存储介质08上，以便由一个或多个处理器02经由一个或多个相应的RAM 04(通常包括高速缓冲存储器)来执行。在所示实施例中，每个计算机可读存储介质08可以是内部硬盘驱动器的磁盘存储设备、CD-ROM、DVD、记忆棒、磁带、磁盘、光盘、例如RAM、ROM、EPROM、闪存的半导体存储设备、或能够存储计算机程序和数字信息的任何其它计算机可读有形存储设备。

这里使用的设备还可以包括读/写驱动器或接口14，以从一个或多个便携式计算机可读存储介质26读取和向其写入。所述设备上的应用程序11可以存储在一个或多个便携式计算机可读存储介质26上，经由相应的读/写驱动器或接口14读取，并加载到相应的计算机可读存储介质08中。

这里使用的设备还可以包括网络适配器或接口16，例如TCP/IP适配卡或无线通信适配器(例如使用OFDMA技术的4G无线通信适配器)。所述计算设备上的应用程序11可以从外部计算机或外部存储设备经由网络(例如，互联网、局域网或其他广域网或无线网络)和网络适配器或接口16下载到计算设备，从网络适配器或接口16，程序可以被加载到计算机可读存储介质08上。网络可以包括铜线、光纤、无线传输、路由器、防火墙、交换机、网关计算机和/或边缘服务器。

这里使用的设备还可以包括显示屏20、键盘或小键盘22、以及计算机鼠标或触摸板24。设备驱动器12与显示屏20接口以便成像，与键盘或小键盘22接口，与计算机鼠标或触摸板24接口，和/或与显示屏20接口以便压力感测字母数字字符输入和用户选择。设备驱动程序12、R/W驱动器或接口14和网络适配器或接口16可包括硬件和软件(存储在计算机可读存储介质08和/或ROM 06上)。

这里描述的程序是基于在示例性实施例中的特定示例性实施例中实现它们的应用来识别的。然而，应当理解，这里的任何特定程序术语仅为了方便而使用，因此示例性实施例不应当限于仅在由这样的术语标识和/或暗示的任何特定应用中使用。

基于前述内容，公开了一种计算机系统、方法和计算机程序产品。然而，在不偏离示例性实施例的范围的情况下，可以进行许多修改和替换。因此，示例性实施例已经通过示例而非限制的方式公开。

应当理解，尽管本公开包括关于云计算的详细描述，但是本文所陈述的教导的实现不限于云计算环境。相反，示例性实施例能够结合现在已知或以后开发的任何其它类型的计算环境来实现。

云计算是服务交付的模型，用于使得能够方便地、按需地网络访问可配置计算资源(例如，网络、网络带宽、服务器、处理、存储器、存储、应用、虚拟机和服务)的共享池，所述可配置计算资源可以以最小的管理努力或与服务的提供者的交互来被快速供应和释放。该云模型可以包括至少五个特性、至少三个服务模型和至少四个部署模型。

特征如下：

按需自助服务：云消费者可以单方面地自动地根据需要提供计算能力，诸如服务器时间和网络存储，而不需要与服务的提供者进行人工交互。

广泛的网络接入：能力可通过网络获得并且通过标准机制接入，该标准机制促进异构瘦客户机平台或厚客户机平台(例如，移动电话、膝上型计算机和PDA)的使用。

资源池化：提供者的计算资源被池化以使用多租户模型来服务多个消费者，其中不同的物理和虚拟资源根据需求被动态地指派和重新指派。存在位置独立性的感觉，因为消费者通常不具有对所提供的资源的确切位置的控制或了解，但是能够以较高抽象级(例如，国家、州或数据中心)指定位置。

快速弹性：能够快速和弹性地提供能力，在一些情况下自动地快速放大和快速释放以快速缩小。对于消费者而言，可用于供应的能力通常显得不受限制并且可以在任何时间以任何数量购买。

测量的服务：云系统通过在适合于服务类型(例如，存储、处理、带宽和活动用户账户)的某个抽象级别处利用计量能力来自动控制和优化资源使用。可以监视、控制和报告资源使用，为所利用的服务的提供者和消费者提供透明度。

服务模型如下：

软件即服务(SaaS)：提供给消费者的能力是使用在云基础设施上运行的提供者的应用。可通过诸如web浏览器(例如，基于web的电子邮件)之类的瘦客户端接口从不同客户端设备访问应用。消费者不管理或控制包括网络、服务器、操作系统、存储或甚至单独的应用能力的底层云基础设施，可能的例外是有限的用户特定应用配置设置。

平台即服务(PaaS)：提供给消费者的能力是将消费者创建的或获取的使用由提供商支持的编程语言和工具创建的应用部署到云基础设施上。消费者不管理或控制包括网络、服务器、操作系统或存储的底层云基础设施，但是对所部署的应用和可能的应用托管环境配置具有控制。

基础设施即服务(IaaS)：提供给消费者的能力是提供处理、存储、网络和消费者能够部署和运行任意软件的其他基本计算资源，所述软件可以包括操作系统和应用。消费者不管理或控制底层云基础设施，而是具有对操作系统、存储、所部署的应用的控制以及对所选联网组件(例如，主机防火墙)的可能受限的控制。

部署模型如下：

私有云：云基础设施仅为组织操作。它可以由组织或第三方管理，并且可以存在于场所内或场所外。

社区云：云基础设施被若干组织共享并支持共享了关注(例如，任务、安全要求、策略、和合规性考虑)的特定社区。它可以由组织或第三方管理，并且可以存在于场所内或场所外。

公有云：使云基础设施对公众或大型行业组可用，并且由出售云服务的组织拥有。

混合云：云基础设施是两个或更多云(私有、共同体或公共)的组合，所述云保持唯一实体，但是通过使数据和应用能够移植的标准化或私有技术(例如，用于云之间的负载平衡的云突发)绑定在一起。

云计算环境是面向服务的，其焦点在于无状态、低耦合、模块性和语义互操作性。在云计算的核心是包括互连节点的网络的基础设施。

现在参考图6，描绘了说明性云计算环境50。如图所示，云计算环境50包括一个或多个云计算节点40，云消费者使用的本地计算设备可以与云计算节点40通信，所述本地计算设备例如个人数字助理(PDA)或蜂窝电话54A、台式计算机54B、膝上型计算机54C和/或汽车计算机系统54N。节点40可以彼此通信。它们可以被物理地或虚拟地分组(未示出)在一个或多个网络中，诸如如上文描述的私有云、社区云、公共云或混合云或其组合。这允许云计算环境50提供基础设施、平台和/或软件作为服务，云消费者不需要为其维护本地计算设备上的资源。应当理解，图6中所示的计算设备54A-N的类型仅旨在说明，并且计算节点40和云计算环境50可以在任何类型的网络和/或网络可寻址连接上(例如，使用web浏览器)与任何类型的计算机化设备通信。

现在参考图7，示出了由云计算环境50(图6)提供的一组功能抽象层。应当预先理解，图7中所示的组件、层和功能仅旨在说明，并且示例性实施例不限于此。如所描绘的，提供了以下层和相应的功能：

硬件和软件层60包括硬件和软件组件。硬件组件的示例包括：主机61；基于RISC(精简指令集计算机)架构的服务器62；服务器63；刀片服务器64；存储设备65；以及网络和网络组件66。在一些实施例中，软件组件包括网络应用服务器软件67和数据库软件68。

虚拟化层70提供抽象层，从该抽象层可以提供虚拟实体的以下示例：虚拟服务器71；虚拟存储器72；虚拟网络73，包括虚拟专用网络；虚拟应用和操作系统74；以及虚拟客户机75。

在一个示例中，管理层80可以提供以下描述的功能。资源供应81提供对计算资源和用于在云计算环境内执行任务的其它资源的动态采购。计量和定价82提供了在云计算环境中利用资源时的成本跟踪，以及用于消耗这些资源的开帐单或发票。在一个示例中，这些资源可以包括应用软件许可证。安全性为云消费者和任务提供身份验证，以及为数据和其他资源提供保护。用户门户83为消费者和系统管理员提供对云计算环境的访问。服务水平管理84提供云计算资源分配和管理，使得满足所需的服务水平。服务水平协议(SLA)规划和履行85提供对云计算资源的预安排和采购，其中根据SLA预期云计算资源的未来需求。

工作负载层90提供可以利用云计算环境的功能的示例。可以从该层提供的工作负荷和功能的示例包括：地图和导航91；软件开发和生命周期管理92；虚拟教室教育传送93；数据分析处理94；事务处理95；和指代处理96。

示例性实施例可以是任何可能的技术细节集成水平的系统、方法和/或计算机程序产品。计算机程序产品可包括其上具有用于使处理器执行本发明的各方面的计算机可读程序指令的计算机可读存储介质(或多个媒体)。

计算机可读存储介质可以是能够保留和存储由指令执行设备使用的指令的有形设备。计算机可读存储介质可以是例如但不限于电子存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备或前述的任何合适的组合。计算机可读存储介质的更具体示例的非穷举列表包括以下：便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或闪存)、静态随机存取存储器(SRAM)、便携式光盘只读存储器(CD-ROM)、数字多功能盘(DVD)、记忆棒、软盘、诸如上面记录有指令的打孔卡或凹槽中的凸起结构的机械编码装置，以及上述的任何适当组合。如本文所使用的计算机可读存储介质不应被解释为暂时性信号本身，诸如无线电波或其他自由传播的电磁波、通过波导或其他传输介质传播的电磁波(例如，通过光纤线缆的光脉冲)、或通过导线传输的电信号。

本文描述的计算机可读程序指令可以从计算机可读存储介质下载到相应的计算/处理设备，或者经由网络(例如互联网、局域网、广域网和/或无线网络)下载到外部计算机或外部存储设备。网络可以包括铜传输电缆、光传输光纤、无线传输、路由器、防火墙、交换机、网关计算机和/或边缘服务器。每个计算/处理设备中的网络适配卡或网络接口从网络接收计算机可读程序指令，并转发计算机可读程序指令以存储在相应计算/处理设备内的计算机可读存储介质中。

用于执行本发明的操作的计算机可读程序指令可以是汇编指令、指令集架构(ISA)指令、机器相关指令、微代码、固件指令、状态设置数据、集成电路的配置数据，或者以一种或多种编程语言(包括面向对象的编程语言，例如Smalltalk、C++等)和过程编程语言(例如“C”编程语言或类似的编程语言)的任意组合编写的源代码或目标代码。计算机可读程序指令可以完全在用户的计算机上执行，部分在用户的计算机上执行，作为独立的软件包执行，部分在用户的计算机上并且部分在远程计算机上执行，或者完全在远程计算机或服务器上执行。在后一种情况下，远程计算机可以通过任何类型的网络连接到用户的计算机，包括局域网(LAN)或广域网(WAN)，或者可以连接到外部计算机(例如，使用互联网服务提供商通过互联网)。在一些实施例中，为了执行本发明的各方面，包括例如可编程逻辑电路、现场可编程门阵列(FPGA)或可编程逻辑阵列(PLA)的电子电路可以通过利用计算机可读程序指令的状态信息来执行计算机可读程序指令以使电子电路个性化。

在此参考根据本发明实施例的方法、装置(系统)和计算机程序产品的流程图和/或框图描述本发明的各方面。将理解，流程图和/或框图的每个框以及流程图和/或框图中的框的组合可以由计算机可读程序指令来实现。

这些计算机可读程序指令可以被提供给计算机或其他可编程数据处理装置的处理器以产生机器，使得经由计算机或其他可编程数据处理装置的处理器执行的指令创建用于实现流程图和/或框图的一个或多个框中指定的功能/动作的装置。这些计算机可读程序指令还可以存储在计算机可读存储介质中，其可以引导计算机、可编程数据处理装置和/或其他设备以特定方式工作，使得其中存储有指令的计算机可读存储介质包括制品，该制品包括实现流程图和/或框图的一个或多个框中指定的功能/动作的各方面的指令。

计算机可读程序指令还可以被加载到计算机、其他可编程数据处理装置或其他设备上，以使得在计算机、其他可编程装置或其他设备上执行一系列操作步骤，以产生计算机实现的过程，使得在计算机、其他可编程装置或其他设备上执行的指令实现流程图和/或框图的一个或多个框中指定的功能/动作。

附图中的流程图和框图示出了根据本发明的各种实施例的系统、方法和计算机程序产品的可能实现的架构、功能和操作。在这点上，流程图或框图中的每个框可以表示指令的模块、段或部分，其包括用于实现指定的逻辑功能的一个或多个可执行指令。在一些替代实施方案中，框中所注明的功能可不按图中所注明的次序发生。例如，连续示出的两个框实际上可以作为一个步骤来实现，同时、基本同时、以部分或全部时间重叠的方式执行，或者这些框有时可以以相反的顺序执行，这取决于所涉及的功能。还将注意，框图和/或流程图图示的每个框以及框图和/或流程图图示中的框的组合可以由执行指定功能或动作或执行专用硬件和计算机指令的组合的专用的基于硬件的系统来实现。

Claims

1.一种用于解析指代的计算机实现的方法，所述方法包括：

从个体表达中提取个体上下文数据；

基于所述个体上下文数据确定所述个体表达是否包括指代表示；

基于确定所述个体表达包括所述指代表示，提取指代上下文数据；以及

基于将所述个体上下文数据和所述指代上下文数据与详述一个或多个对象的数据进行比较，识别所述一个或多个对象中所述指代表示所指的对象。

2.如权利要求1所述的方法，其中，识别所述一个或多个对象中所述指代表示所指的所述对象还包括：

提取与所述一个或多个对象对应的元数据；以及

将与所述一个或多个对象对应的所述元数据与所述个体上下文数据和所述指代上下文数据进行比较。

3.如权利要求2所述的方法，还包括：

确定针对所述元数据与所述个体上下文数据和所述指代上下文数据的每个比较的对象匹配分数；以及

确定针对所述一个或多个对象中的每一个对象的当其涉及解析所述指代表示时的总体对象匹配分数。

4.如权利要求3所述的方法，其中，确定针对所述一个或多个对象中的每一个对象的当其涉及解析所述指代表示时的总体对象匹配分数还包括：

生成对每个比较进行加权的模型；

将所述权重乘以所述比较；以及

对相乘的加权比较的乘积求和。

5.如权利要求1所述的方法，其中，所述指代上下文数据包括从包括以下的组中选择的数据：对象颜色，对象形状，对象放置，对象大小，和对象时间。

6.如权利要求1所述的方法，其中，所述个体上下文数据包括从包括以下的组中选择的数据：环境内的个体的数量，个体的身份，被识别为说话的个体，个体的相对位置，个体的分组，个体相对于说话者的取向，个体相对于一个或多个对象的取向，以及个体视线。

7.如权利要求6所述的方法，还包括：

产生针对产生所述个体表达的至少一个个体的个体简档；以及

其中，所述个体上下文数据包括所述个体简档。

8.一种用于解析指代的计算机程序产品，所述计算机程序产品包括：

一个或多个非暂时性计算机可读存储介质和存储在所述一个或多个非暂时性计算机可读存储介质上的能够执行方法的程序指令，所述方法包括：

从个体表达中提取个体上下文数据；

基于所述个体上下文数据来确定所述个体表达是否包括指代表示；

9.如权利要求8所述的计算机程序产品，其中，识别所述一个或多个对象中所述指代表示所指的所述对象还包括：

提取与所述一个或多个对象对应的元数据；以及

将与所述一个或多个对象对应的所述元数据与所述个体上下文数据和所述回应体上下文数据进行比较。

10.如权利要求9所述的计算机程序产品，还包括：

11.如权利要求10所述的计算机程序产品，其中，确定针对所述一个或多个对象中的每一个对象的当其涉及解析所述指代表示时的总体对象匹配分数还包括：

生成对每个比较进行加权的模型；

将所述权重乘以所述比较；以及

对相乘的加权比较的乘积求和。

12.如权利要求8所述的计算机程序产品，其中，所述指代上下文数据包括从包括以下的组中选择的数据：对象颜色，对象形状，对象放置，对象大小，和对象时间。

13.如权利要求8所述的计算机程序产品，其中，所述个体上下文数据包括从包括以下组中选择的数据：环境内的个体的数量，个体的身份，被识别为说话的个体，个体的相对位置，个体的分组，个体相对于说话者的取向，个体相对于一个或多个对象的取向，以及个体视线。

14.如权利要求13所述的计算机程序产品，还包括：

产生针对产生个体表达的至少一个个体的个体简档；以及

其中，所述个体上下文数据包括所述个体简档。

15.一种用于解析指代的计算机系统，所述系统包括：

一个或多个光学传感器，一个或多个应变仪传感器，一个或多个麦克风，一个或多个温度传感器以及一个或多个电池；一个或多个计算机处理器，一个或多个计算机可读存储介质，以及存储在所述一个或多个计算机可读存储介质上的程序指令，所述程序指令用于由能够执行一种方法的所述一个或多个处理器中的至少一个处理器执行，所述方法包括：

从个体表达中提取个体上下文数据；

16.如权利要求15所述的计算机系统，其中，识别所述一个或多个对象中所述指代表示所指的所述对象还包括：

提取与所述一个或多个对象对应的元数据；以及

17.如权利要求16所述的计算机系统，还包括：

18.如权利要求17所述的计算机系统，其中，确定针对所述一个或多个对象中的每一个对象的当其涉及解析所述指代表示时的总体对象匹配分数还包括：

生成对每个比较进行加权的模型；

将所述权重乘以所述比较；以及

对相乘的加权比较的乘积求和。

19.如权利要求15所述的计算机系统，其中，所述指代上下文数据包括从包括以下的组中选择的数据：对象颜色，对象形状，对象放置，对象大小，和对象时间。

20.如权利要求15所述的计算机系统，其中，所述个体上下文数据包括从包括以下的组中选择的数据：环境内的个体的数量，个体的身份，被识别为说话的个体，个体的相对位置，个体的分组，个体相对于说话者的取向，个体相对于一个或多个对象的取向，以及个体视线。