CN111448533A - 认知系统的通信模型 - Google Patents

认知系统的通信模型 Download PDF

Info

Publication number
CN111448533A
CN111448533A CN201880079324.5A CN201880079324A CN111448533A CN 111448533 A CN111448533 A CN 111448533A CN 201880079324 A CN201880079324 A CN 201880079324A CN 111448533 A CN111448533 A CN 111448533A
Authority
CN
China
Prior art keywords
user
features
data
computer
action
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201880079324.5A
Other languages
English (en)
Other versions
CN111448533B (zh
Inventor
L.劳伦斯
J.苏基斯
R.海
吴宏炜
J.安德森
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of CN111448533A publication Critical patent/CN111448533A/zh
Application granted granted Critical
Publication of CN111448533B publication Critical patent/CN111448533B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/004Artificial life, i.e. computing arrangements simulating life
    • G06N3/006Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/02Feature extraction for speech recognition; Selection of recognition unit
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • G10L15/1815Semantic context, e.g. disambiguation of the recognition hypotheses based on word meaning
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/12Protocols specially adapted for proprietary or special-purpose networking environments, e.g. medical networks, sensor networks, networks in vehicles or remote metering networks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/2866Architectures; Arrangements
    • H04L67/30Profiles
    • H04L67/306User profiles
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L2015/088Word spotting

Abstract

提供了用于认知系统与用户互动的系统和方法。各个方面包括接收认知系统配置文件和与用户相关联的观测数据。接收与用户相关联的环境数据,并从观测数据和环境数据中提取特征。将特征存储在用户配置文件中,并基于认知系统配置文件和用户配置文件进行分析,以确定每个特征的情境上下文。基于每个特征的情境上下文来识别触发事件。至少部分地基于一个或多个触发事件来确定一个或多个建议动作。至少一个动作是从一个或多个建议动作中发起的,并与一个或多个触发事件和一个或多个特征一起存储在用户配置文件中。

Description

认知系统的通信模型
技术领域
本发明总体上涉及认知系统,更具体地,涉及人与认知系统之间的通信的模型。
背景技术
认知系统(CS)具有更广泛的输入和输出范围,可以接收传感器数据以允许它们解释其环境并以超出计算机通常能力范围的方式向用户提供反馈(输出)。一个人通常使用视觉、声音、触觉、气味来感知和处理周围的环境,并使用语言、声音和身体表达以及动作进行交流。
然而,认知系统具有广泛的输入和输出,从一到几十、甚至可能是数百。然而,为了与人进行有效沟通,认知系统必须像人一样解释信息并发送适当的响应。
因此,在本领域中需要解决前述问题。
发明内容
从第一方面来看,本发明提供一种用于认知系统与用户互动的计算机实现的方法,该方法包括:由处理器接收认知系统配置文件;由处理器接收与用户相关联的观测数据,其中至少一部分观测数据是从一个或多个传感器接收的;接收与用户相关联的环境数据;从观测数据和环境数据中提取一个或多个特征;将一个或多个特征存储在用户配置文件中;基于认知系统配置文件和用户配置文件分析一个或多个特征,以确定一个或多个特征中的每个特征的情境上下文;至少部分基于一个或多个特征中的每个的情境上下文来识别一个或多个触发事件;至少部分地基于一个或多个触发事件来确定一个或多个建议动作;从一个或多个建议行动中发起至少一个行动;将至少一个动作、一个或多个触发事件以及一个或多个特征存储在用户配置文件中。
从另一方面来看,本发明提供一种认知系统与用户互动的计算机实现的方法,该方法包括:由处理器接收通信模型,该通信模型包括用于与用户通信的一组指令;至少部分基于通信模型提示用户输入用户数据;从用户接收用户数据并将用户数据存储在用户配置文件中;以及至少部分地基于用户数据来更新通信模型。
从另一方面来看,本发明提供了一种用于认知系统与用户互动的系统,该系统包括:通信地耦合至存储器的处理器,该处理器配置为:接收认知系统配置文件;以及接收与用户相关联的观测数据,其中至少一部分观测数据是从一个或多个传感器接收的;接收与用户相关联的环境数据;从观测数据和环境数据中提取一个或多个特征;将一个或多个特征存储在用户配置文件中;基于认知系统配置文件和用户配置文件分析一个或多个特征,以为一个或多个特征中的每个确定情境上下文;至少部分基于一个或多个特征中的每个的情境上下文来识别一个或多个触发事件;至少部分地基于一个或多个触发事件来确定一个或多个建议动作;从一个或多个建议行动中至少采取一个动作;并将至少一个操作、一个或多个触发事件以及一个或多个特征存储在用户配置文件中。
从另一方面来看,本发明提供一种用于认知系统与用户互动的计算机程序产品,该计算机程序产品包括计算机可读存储介质,该计算机可读存储介质可由处理电路读取,并存储由处理电路执行的指令以执行本发明的步骤的方法。
从另一方面来看,本发明提供了一种存储在计算机可读介质上并且可加载到数字计算机的内部存储器中的计算机程序,该计算机程序包括软件代码部分,当所述程序在计算机上运行时,用于执行本发明的步骤。
本发明的实施例针对一种用于认知系统与用户互动的计算机实现的方法。该计算机实现的方法的非限制性示例包括接收认知系统配置文件和与用户相关联的观测数据,其中,至少一部分观测数据是从一个或多个传感器接收的。接收与用户相关联的环境数据,并且从观测数据和环境数据中提取一个或多个特征。一个或多个特征被存储在用户配置文件中并且被基于认知系统配置文件和用户配置文件的分析以确定一个或多个特征中的每个的上下文。基于一个或多个特征中的每个特征的上下文来识别一个或多个触发事件。至少部分地基于一个或多个触发事件来确定一个或多个建议动作。至少一个动作是从一个或多个建议动作中发起的,并与一个或多个触发事件和一个或多个功能一起存储在用户配置文件中。
本发明的实施例针对一种用于认知系统与用户互动的系统。该系统的非限制性示例包括接收认知系统配置文件和与用户相关联的观测数据,其中,至少一部分观测数据是从一个或多个传感器接收的。接收与用户相关联的环境数据,并且从观测数据和环境数据中提取一个或多个特征。一个或多个特征被存储在用户配置文件中并且被基于认知系统配置文件和用户配置文件分析以确定一个或多个特征中的每个特征的上下文。基于一个或多个特征中的每个特征的上下文来识别一个或多个触发事件。至少部分地基于一个或多个触发事件来确定一个或多个建议动作。至少一个动作是从一个或多个建议动作中发起的,并与一个或多个触发事件和一个或多个功能一起存储在用户配置文件中。
本发明的实施例涉及一种用于认知系统与用户互动的计算机程序产品,该计算机程序产品包括计算机可读存储介质,该计算机可读存储介质具有嵌入其中的程序指令。程序指令可由处理器执行以使处理器执行方法。该方法的非限制性示例包括接收认知系统配置文件和与用户相关联的观测数据,其中,至少一部分观测数据是从一个或多个传感器接收的。接收与用户相关联的环境数据,并且从观测数据和环境数据中提取一个或多个特征。一个或多个特征被存储在用户配置文件中并且被基于认知系统配置文件和用户配置文件分析以确定一个或多个特征中的每个特征的上下文。基于一个或多个特征中的每个特征的上下文来识别一个或多个触发事件。至少部分地基于一个或多个触发事件来确定一个或多个建议动作。至少一个动作是从一个或多个建议动作中发起的,并与一个或多个触发事件和一个或多个功能一起存储在用户配置文件中。
本发明的实施例针对一种用于认知系统与用户互动的计算机实现的方法。该计算机实现的方法的非限制性示例包括由处理器接收通信模型,该通信模型包括用于与用户通信的一组指令。至少部分地基于通信模型来提示用户输入用户数据。从用户接收用户数据并将其存储在用户配置文件中。至少部分地基于用户数据来更新通信模型,
本发明的实施例针对一种用于认知系统以与用户互动的计算机程序产品,该计算机程序产品包括计算机可读存储介质,该计算机可读存储介质具有包含在其中的程序指令。程序指令可由处理器执行以使处理器执行方法。该方法的非限制性示例包括由处理器接收通信模型,该通信模型包括用于与用户通信的一组指令。至少部分地基于通信模型来提示用户输入用户数据。从用户接收用户数据并将其存储在用户配置文件中。至少部分地基于用户数据来更新通信模型。
通过本发明的技术实现了附加的技术特征和益处。本文详细描述本发明的实施例和各个方面,并且将其视为所要求保护的主题的一部分。为了更好的理解,请参考具体实施方式和附图。
附图说明
在说明书的结尾处的权利要求书中特别指出并明确要求保护本文所述的专有权的细节。通过以下结合附图的详细描述,本发明的实施例的前述以及其他特征和优点将变得显而易见,其中:
图1描绘了根据本发明一个或多个实施例的云计算环境;
图2描绘了根据本发明的一个或多个实施例的抽象模型层;
图3描绘了用于实现本发明的一个或多个实施例的计算机系统的框图;
图4描绘了根据本发明实施例的用于认知系统与用户互动的系统;
图5描绘了根据本发明的一个或多个实施例的用于认知系统与用户互动的方法的流程图;
图6描绘了根据本发明的一个或多个实施例的用于认知系统与用户互动的方法的流程图;以及
图7描绘了根据本发明的一个或多个实施例的用于认知系统与用户互动的方法的流程图。
本文所描绘的附图是说明性的。在不脱离本发明的范围的情况下,附图或本文描述的操作可以有许多变型。例如,可以以不同的顺序执行动作,或者可以添加、删除或修改动作。同样,术语“耦合”及其变型描述了在两个元件之间具有通信路径,并且并不意味着元件之间的直接连接,而在它们之间没有中间元件/连接。所有这些变体都被视为说明书的一部分。
具体实施方式
在此参考相关附图描述了本发明的各种实施例。可以设计本发明的替代实施例而不脱离本发明的范围。在以下描述和附图中,在元件之间阐述了各种连接和位置关系(例如,在上方,在下方,在相邻等)。除非另有说明,否则这些连接和/或位置关系可以是直接的或间接的,并且本发明并不意图在这方面进行限制。因此,实体的耦合可以指直接或间接耦合,并且实体之间的位置关系可以是直接或间接的位置关系。此外,本文描述的各种任务和过程步骤可以被合并到具有本文未详细描述的附加的步骤或功能的更全面的过程或流程中。
以下定义和缩写用于解释权利要求和说明书。如本文所用,术语“包括(现在时)”,“包括(进行时)”,“包含(现在时)”,“包含(进行时)”,“具有(现在时)”,“具有(进行时)”,“含有(现在时)”或“含有(进行时)”或其任何其他变型旨在涵盖非独家包容。例如,包括一系列元素的组合物、混合物、过程、方法、物品或设备不一定仅限于那些元素,而是可以包括未明确列出或对此类组合物、混合物、过程、方法、物品或设备所固有的其他元素。
另外,术语“示例性”在本文中用来表示“用作示例、实例或说明”。本文中被描述为“示例性”的任何实施例或设计不必被解释为比其他实施例或设计更优选或有利。术语“至少一个”和“一个或多个”可以理解为包括大于或等于一的任何整数,即一个、两个、三个、四个等。术语“多个”可以理解为包括任何大于或等于2的整数,即两个、三个、四个、五个等。术语“连接”可以包括间接“连接”和直接“连接”。
术语“大约”、“基本上”、“大约”及其变体旨在包括与基于提交申请时可用的设备的特定数量的测量相关的误差程度。例如,“约”可以包括给定值的±8%或5%或2%的范围。
为了简洁起见,在本文中可以详细或可以不详细描述与制造和使用本发明的方面有关的常规技术。特别地,实现本文所述的各种技术特征的计算系统和特定计算机程序的各个方面是众所周知的。因此,为了简洁起见,在不提供公知的系统和/或处理细节的情况下,本文仅简要提及或完全省略了许多常规的实施细节。
首先应当理解,尽管本公开包括关于云计算的详细描述,但其中记载的技术方案的实现却不限于云计算环境,而是能够结合现在已知或以后开发的任何其它类型的计算环境而实现。
云计算是一种服务交付模式,用于对共享的可配置计算资源池进行方便、按需的网络访问。可配置计算资源是能够以最小的管理成本或与服务提供者进行最少的互动就能快速部署和释放的资源,例如可以是网络、网络带宽、服务器、处理、内存、存储、应用、虚拟机和服务。这种云模式可以包括至少五个特征、至少三个服务模型和至少四个部署模型。
特征包括:
按需自助式服务:云的消费者在无需与服务提供者进行人为互动的情况下能够单方面自动地按需部署诸如服务器时间和网络存储等的计算能力。
广泛的网络接入:计算能力可以通过标准机制在网络上获取,这种标准机制促进了通过不同种类的瘦客户机平台或厚客户机平台(例如移动电话、膝上型电脑、个人数字助理PDA)对云的使用。
资源池:提供者的计算资源被归入资源池并通过多租户(multi-tenant)模式服务于多重消费者,其中按需将不同的实体资源和虚拟资源动态地分配和再分配。一般情况下,消费者不能控制或甚至并不知晓所提供的资源的确切位置,但可以在较高抽象程度上指定位置(例如国家、州或数据中心),因此具有位置无关性。
迅速弹性:能够迅速、有弹性地(有时是自动地)部署计算能力,以实现快速扩展,并且能迅速释放来快速缩小。在消费者看来,用于部署的可用计算能力往往显得是无限的,并能在任意时候都能获取任意数量的计算能力。
可测量的服务:云系统通过利用适于服务类型(例如存储、处理、带宽和活跃用户帐号)的某种抽象程度的计量能力,自动地控制和优化资源效用。可以监测、控制和报告资源使用情况,为服务提供者和消费者双方提供透明度。
基础架构即服务(IaaS):向消费者提供的能力是消费者能够在其中部署并运行包括操作系统和应用的任意软件的处理、存储、网络和其他基础计算资源。消费者既不管理也不控制底层的云基础架构,但是对操作系统、存储和其部署的应用具有控制权,对选择的网络组件(例如主机防火墙)可能具有有限的控制权。
部署模型如下:
私有云:云基础架构单独为某个组织运行。云基础架构可以由该组织或第三方管理并且可以存在于该组织内部或外部。
共同体云:云基础架构被若干组织共享并支持有共同利害关系(例如任务使命、安全要求、政策和合规考虑)的特定共同体。共同体云可以由共同体内的多个组织或第三方管理并且可以存在于该共同体内部或外部。
公共云:云基础架构向公众或大型产业群提供并由出售云服务的组织拥有。
混合云:云基础架构由两个或更多部署模型的云(私有云、共同体云或公共云)组成,这些云依然是独特的实体,但是通过使数据和应用能够移植的标准化技术或私有技术(例如用于云之间的负载平衡的云突发流量分担技术)绑定在一起。
云计算环境是面向服务的,特点集中在无状态性、低耦合性、模块性和语意的互操作性。云计算的核心是包含互连节点网络的基础架构
现在参考图1,其中显示了示例性的云计算环境50。如图所示,云计算环境50包括云计算消费者使用的本地计算设备可以与其相通信的一个或者多个云计算节点10,本地计算设备例如可以是个人数字助理(PDA)或移动电话54A,台式电脑54B、笔记本电脑54C和/或汽车计算机系统54N。云计算节点10之间可以相互通信。可以在包括但不限于如上所述的私有云、共同体云、公共云或混合云或者它们的组合的一个或者多个网络中将云计算节点10进行物理或虚拟分组(图中未显示)。这样,云的消费者无需在本地计算设备上维护资源就能请求云计算环境50提供的基础架构即服务(IaaS)、平台即服务(PaaS)和/或软件即服务(SaaS)。应当理解,图2显示的各类计算设备54A-N仅仅是示意性的,云计算节点10以及云计算环境50可以与任意类型网络上和/或网络可寻址连接的任意类型的计算设备(例如使用网络浏览器)通信。
现在参考图2,其中显示了云计算环境50(图1)提供的一组功能抽象层。首先应当理解,图2所示的组件、层以及功能都仅仅是示意性的,本发明的实施例不限于此。如图3所示,提供下列层和对应功能:
硬件和软件层60包括硬件和软件组件。硬件组件的例子包括:主机61;基于RISC(精简指令集计算机)体系结构的服务器62;服务器63;刀片服务器64;存储设备65;网络和网络组件66。软件组件的例子包括:网络应用服务器软件67以及数据库软件68。
虚拟层70提供一个抽象层,该层可以提供下列虚拟实体的例子:虚拟服务器71、虚拟存储72、虚拟网络73(包括虚拟私有网络)、虚拟应用和操作系统74,以及虚拟客户端75。
在一个示例中,管理层80可以提供下述功能:资源供应功能81:提供用于在云计算环境中执行任务的计算资源和其它资源的动态获取;计量和定价功能82:在云计算环境内对资源的使用进行成本跟踪,并为此提供帐单和发票。在一个例子中,该资源可以包括应用软件许可。安全功能:为云的消费者和任务提供身份认证,为数据和其它资源提供保护。用户门户功能83:为消费者和系统管理员提供对云计算环境的访问。服务水平管理功能84:提供云计算资源的分配和管理,以满足必需的服务水平。服务水平协议(SLA)计划和履行功能85:为根据SLA预测的对云计算资源未来需求提供预先安排和供应。
工作负载层90提供云计算环境可能实现的功能的示例。在该层中,可提供的工作负载或功能的示例包括:地图绘制与导航91;软件开发及生命周期管理92;虚拟教室的教学提供93;数据分析处理94;交易处理95;以及与用户互动的认知系统96。
参照图3,示出了用于实现本文的教导的处理系统300的实施例。在该实施例中,系统300具有一个或多个中央处理单元(处理器)21a、21b、21c等(统称为或总称为处理器21)。在一个或多个实施例中,每个处理器21可以包括精简指令集计算机(RISC)微处理器。处理器21通过系统总线33耦合到系统存储器34和各种其他组件。只读存储器(ROM)22耦合到系统总线33,并且可以包括控制系统300的某些基本功能的基本输入/输出系统(BIOS)。
图3进一步描绘了耦合到系统总线33的输入/输出(I/O)适配器27和网络适配器26。I/O适配器27可以是与硬盘23和/或磁带存储驱动器25或任何其他类似组件通信的小型计算机系统接口(SCSI)适配器。I/O适配器27、硬盘23和磁带存储设备25在此统称为大容量存储器24。在处理系统300上执行的操作系统40可以存储在大容量存储器24中。网络适配器26将总线33与外部网络36互连,使得数据处理系统300能够与其他这样的系统通信。屏幕(例如,显示监视器)35通过显示适配器32连接到系统总线33,显示适配器32可以包括用于提高图形密集型应用程序的性能的图形适配器和视频控制器。在一个实施例中,适配器27、26和32可以通过中间总线桥(未示出)连接到一个或多个连接到系统总线33的I/O总线。用于连接外围设备(例如硬盘控制器、网络适配器和图形适配器)的适当I/O总线通常包括公共协议,例如外围组件互连(PCI)。额外的输入/输出设备被示为经由用户接口适配器28和显示适配器32连接到系统总线33。键盘29、鼠标30和扬声器31都经由用户接口适配器28互连到总线33,用户接口适配器28可以包括例如将多个设备适配器集成到单个集成电路中的超级I/O芯片。
在示例性实施例中,处理系统300包括图形处理单元41。图形处理单元41是专用的电子电路,其设计用于操纵和改变存储器以加速在用于输出到显示器的帧缓冲器中创建图像。一般而言,图形处理单元41在处理计算机图形和图像处理方面非常有效,并且具有高度并行的结构,使得其对于并行处理大数据块的算法比通用CPU更有效。
因此,如图3所配置的,系统300包括处理器21形式的处理能力、包括系统存储器34和大容量存储器24的存储能力、诸如键盘29和鼠标30的输入设备以及包括扬声器31和显示器35的输出能力。在一个实施例中,系统存储器34和大容量存储器24的一部分统一存储协调图3所示的各个组件的功能的操作系统。
现在转向与本发明的方面更具体相关的技术的概述,通信模型(协议)可以用于描述和传达关于可观察环境(例如,我们周围的世界)的抽象概念。例如,使用Shannon-Weaver通信模型来解释机器之间的消息传输。该模型描述了消息如何在通过噪声的同时离开发送方并沿着通道传播到接收方。此模型已被用于描述人际交流和行为。但是,由于该模型的初衷是描述机器互动,因此无法解决上下文的解释以及传输失败或成功时的学习和改进。该模型也没有解决消息的存储(即,记忆)以及这些消息对将来的消息可能产生的影响。
另一个通信模型是Emmert-Donaghy通信模型。该模型详细阐述了Shannon-Weaver模型以包括传播者的环境上下文和接收者对消息的认知处理。该模型描述了两个传播者相互发送反馈的参与,以及通过思想处理对消息进行解码的过程。该模型承认含义无法与消息的上下文分开。尽管该模型解决了人与人之间通信的复杂性,但它没有概述通信的目的,学习新信息时消息发生了什么以及消息的存储(即记忆)。
有效地进行沟通需要更深层次的一组能力-包括感知该沟通的上下文、理解沟通方的动机、推理适当的响应并详细安排对接受者具有最大影响的响应的执行。在一个或多个实施例中,本发明的方面包括一种用于认知系统的方法,以实施相似的一组能力,以实现更加自然的互动形式,这将增加系统对用户理解的影响,并扩大他们自己的认知过程。
现在转到本发明各方面的概述,本发明的一个或多个实施例通过提供允许认知系统与用户互动的通信协议来解决现有技术的上述缺点。在一个或多个实施例中,通信协议对用户与认知系统之间的复杂互动进行建模,以更有效地设计和输出认知互动(例如,对用户的反馈)。认知系统可以接收范围和精度远远超过用户的输入数据。例如,诸如光或运动传感器之类的传感器,可以将传感器数据传输至认知系统控制器或“大脑”以进行解释。通常,该传感器数据以非结构化格式传输到认知系统控制器,然后认知系统对其进行组织(即,结构)和解释。认知系统试图模仿人类的认知,以使用认知来模拟人类的思维。
认知是通过思想、经验和感官获得知识和理解的精神行动或过程。认知描述了人类如何处理思想以彼此交流。对于计算机(例如,认知系统),认知描述了一种系统,该系统使用旨在增强人类认知能力的算法模型来模拟人类思想处理。认知系统分析大量数据,以构成有洞察力、上下文相关的,并不断改善的与系统用户的关系。对用户需求、目标和价值的不断增长的了解使认知系统能够提供个性化的响应,提出相关的见解并揭示上下文相关的重要发现。
现在转向对本发明各方面的更详细描述,图4描绘了根据本发明实施例的用于认知系统与用户互动的系统400。系统400包括认知系统(CS)控制器402、一个或多个传感器404和数据语料库406、一个或多个输出设备410、网络412,用户配置文件414和认知系统配置文件416。
在本发明的一个或多个实施例中,可以在图3中找到的处理系统300上实现CS控制器402。另外,云计算系统50可以与系统400的元件的一个或全部进行有线或无线电子通信。云50可以补充、支持或替换系统400的元件的某些或全部功能。此外,系统400的元件的某些或全部功能可以实现为云50的节点10(如图1和2所示)。云计算节点10仅是合适的云计算节点的一个示例,并且无意对本文所述的本发明的实施例的使用范围或功能提出任何限制。
在本发明的一个或多个实施例中,CS控制器402通过有线或无线连接与一个或多个传感器404电子通信。一个或多个传感器404也可以由CS控制器402通过网络412访问。CS控制器402可以通过利用一个或多个传感器404来收集观测数据、环境数据、以及与系统400的用户相关联的用户输入数据来与用户互动。CS控制器402还可以通过利用一个或多个输出设备410与用户进行互动。一个或多个输出设备410可以是以下任何一种:智能设备(例如电话、平板电脑、计算机、手表等)、多模式设备和/或哑设备(例如环境技术、照明、家用电器、扬声器等)、自动出行设备(例如汽车、药品推车、工厂设备等)以及类人动物设备(例如二维拟人化显示器、3-D拟人化显示器等)。在一个或多个实施例中,除了一个或多个传感器404之外,输出设备410还可以接收用户输入或用户反馈。在一个或多个实施例中,可以通过诸如图4中的网络412访问输出设备。
在一个或多个实施例中,系统400包括认知系统配置文件416。认知系统配置文件416包括关于系统400和系统在其中运行的域的某些基本事实。可以对这些基本事实进行预编程,以帮助CS控制器402接收输入并采取针对特定系统的预期动作。例如,为帮助个人解决健康问题而构建的系统将在认知系统配置文件416中具有某些协议,以用于识别某些类型的健康问题的症状和后果。认知系统配置文件416可以包括关于健康问题的性质的信息,包括例如那些问题如何表现为对人的行动的限制,或者具有健康问题的人如何对不同的环境条件做出反应。这些见解帮助系统400与用户进行互动,并且还包括用于教导用户如何与系统400进行互动的协议。系统400还包括用户配置文件414,该用户配置文件414通过预先编程的信息、有关用户的人口统计信息以及有关用户的收集信息(例如观测数据)的组合来存储关于用户的信息。基于系统400和用户之间的互动来建立和更新用户配置文件414。例如,系统400采取的某些动作可能产生来自用户的响应,该响应将指示用户不喜欢特定动作。然后,系统400将分析该动作以及响应于确定用户在这种类型的情况下不喜欢这种类型的动作,并利用该信息来形成并参与将来的动作。例如,认知系统可以决定不打断带有工作通知的呼叫,因为过去,当用户与家人通电话时,用户已经拒绝了类似的通知。作为另一个示例,系统400可以选择警告用户他们尚未订阅的新闻提要,因为用户最近在他们的工作中一直专注于这个新闻主题。或者,作为另一个示例,系统400可以收听会议记录并分析该记录,以采取向参与会议的团队发送一些反馈,以改善团队如何运行会议以及向团队发送会议记录的行动。当系统400与用户互动并接收来自用户的反馈/用户输入时,系统将更新用户配置文件414。类似地,当系统400与用户互动时,它可以学习有关世界如何运转的新事物以及将会用该新知识更新系统配置文件416。另外,可以将从互动中获得的任何见解存储在系统配置文件416中。
在一个或多个实施例中,系统400的用户通过一个或多个传感器404和/或输出设备410与系统400互动。一个或多个传感器404可以是任何类型的传感器,例如,例如、照相机、温度传感器、压力传感器、化学传感器等。用户的互动可以是语言的和/或非语言的。言语互动的示例可以是用户对系统400说话,并且言语数据(例如自然语言)由诸如麦克风的传感器收集。系统400可以从用户接收自然语言输入并且利用自然语言处理(NLP)来分析输入。NLP用于从自然语言中获取含义。即,由用户400提供的自然语言输入由系统400(例如,CS控制器402)通过解析、句法分析、形态分析以及包括统计建模和统计分析的其他过程来进行分析。NLP分析的类型可能会因语言和其他考虑而异。NLP分析被用来生成第一组NLP结构和/或特征,该第一组NLP结构和/或特征可以被计算机用来识别并生成对所收集的自然语言输入的潜在响应。这些NLP结构包括自然语言输入(包括其同义词)的翻译和/或解释。NLP也可以用于答案生成,以将从数据语料库406的信息转换为通过输出设备410输出的自然语言。
在一个或多个实施例中,认知系统配置文件416和/或用户配置文件414可以包括关于用户的信息,例如人口统计信息。人口统计信息可以包括关于用户的数据,例如年龄、收入水平等。在另一个实施例中,认知系统配置文件416可以包括不是特定于用户的关于用户人口统计的一般数据。例如,认知系统配置文件416可以包括关于个人听哪种类型的音乐以适合诸如年龄等某些人口统计类别的信息。系统400可以利用认知系统配置文件416提供响应或采取行动,同时系统400继续收集关于用户的信息以存储在用户配置文件414中。例如,系统400可以接收来自用户的口头请求以播放一些音乐。系统400将访问用户配置文件414以查看是否存在关于用户音乐的一些历史数据。在没有历史数据或有限的历史数据的情况下,系统400可以访问与用户匹配的总体上的人口统计数据,以确定用户可能喜欢的音乐类型。基于用户的反馈(或缺乏反馈),系统400将更新用户配置文件414,以确定音乐的类型、特定的艺术家等,以用于与用户的未来互动。当用户与系统400互动时,不断地收集信息以获得对用户的了解,并进一步分析以驱动与用户的附加的互动。
在一个或多个实施例中,用户配置文件414被连续更新以允许系统满足用户的需求、价值和期望。当收集与用户关联的数据时,系统将设法了解该数据背后的动机。例如,用户可以向系统400询问关于另一个城市的天气的问题。系统400将分析用户配置文件414以及任何可用的观测数据和环境数据,以理解用户为什么问这个特定问题。例如,用户配置文件414可能包含有关用户在该城市中有家庭成员的信息,或者从用户的电子日历中观察到,用户可能计划在不久的将来前往城市。系统400将确定针对该特定问题的动机,并且可以利用该动机来返回关于城市的当前天气和城市的天气预报的答案,以与用户到该城市的旅行计划相对应。或者系统400可以通过说“您的堂兄George,今天正在享受晴天”来提及该用户的正在该城市的家庭成员以及天气预报。
在一个或多个实施例中,系统400可以包括针对特定使用场景(例如,用于辅助生活服务(ALS)设施的布局和联系人列表)定制的认知系统配置文件416。在该示例中,系统400可以具有用于与ALS患者互动的预编程信息,诸如紧急协议等。系统400通过提示对开放式问题的回答来与患者互动。一个示例问题是:“您好,很高兴认识您。你能告诉我一个关于你的美好回忆的故事吗?”提示的问题应使用自然语言作为输入来引起用户的响应。系统400可以利用一个或多个传感器404来收集这种自然语言输入。如上所述,可以利用NLP分析从自然语言中提取特征。CS控制器402可以分析特征以确定特征的上下文并将特征存储在用户配置文件414中。随着系统400与用户互动,连续收集关于用户的观测数据和环境数据并存储在用户配置文件414中。基于系统400提示的开放式问题,系统400收集有关用户身份、首选项、历史记录、限定、限制以及联网设备(例如平板电脑,电话等)各个方面的数据。通过使用认知系统配置文件416和用户配置文件414来定制提示的问题。在一个或多个实施例中,随着收集关于用户的观测数据,用户配置文件414可能比认知系统配置文件416的使用更多以与用户互动。系统400可以通过收集的信息来确定患者的目标、设施,患者的家庭成员甚至患者的医生。
在一个或多个实施例中,系统400可以响应于触发事件而采取一个或多个动作。基于观测数据、环境数据、用户配置文件414和认知系统配置文件416来确定触发事件。触发事件可以是用户提出的问题。例如,用户问:“我的约会是几点?”基于NLP分析和从NLP的特征提取,CS控制器402将确定该问题是触发事件,系统400将需要响应该触发事件(即,采取行动)。CS控制器402将从问题中提取诸如“时间”和“约会”之类的特征,并利用这些特征来确定用户的问题的上下文。从这个意义上说,上下文被用于确定用户为什么问这个特定问题,以及关于该问题是针对什么约会。CS控制器402可以访问用户配置文件414以搜索用户先前提到的任何即将到来的约会和/或分析用户的电子日历以确定约会是否存在于日历上。如果存在多个约会,则由于用户未指定约会的类型,因此利用问题的上下文的CS控制器402将返回最近的约会。此外,CS控制器402基于用户配置文件414和先前有关该用户的观测数据,可能会确定该用户是在指医疗预约而不是社交预约,即使社交预约可能在医疗预约之前也将返回有关医疗预约的信息。基于示例问题,如果CS控制器402无法识别约会,则可以从用户那里获取更近一步的信息。例如,CS控制器402可以通过诸如扬声器的输出设备410询问“您是说要与伯德尔医生约会吗?”。可以基于关于用户的先前观测数据来从用户配置文件414访问医生的姓名,系统400在该观测数据中从开放式问题中提取了医生的姓名。在本发明的一个或多个实施例中,环境数据不限于关于当前物理环境的数据。确定该环境数据的上下文以包括用户在相关的先前时间范围内做出的任何先前声明,这些声明表明了用户的意图和动机。也就是说,确定了既具有物理(例如环境)维度又具有时间历史(例如先前陈述的声明)维度的情境的上下文。
在一个或多个实施例中,系统400可通过除听觉或语言数据之外通过一个或多个传感器404从患者收集的观测数据来识别触发事件。例如,如果基于用户配置文件414,系统400可以访问用户的用药时间表,则系统400可以通过一个或多个传感器404跟踪用户是否在规定的时间服药。如果要在早晨并且基于视觉传感器和心率监测器服用药物,则认知系统控制器402可以确定用户正在醒来但尚未服用药物。系统400可以确定该场景是触发事件,并与用户一起采取一个或多个动作。例如,系统400可以在听觉上提醒患者或在输出设备410上放置一条消息,提醒用户服用药物。其他示例可以包括改变房间中的照明以警告用户或为用户播放警报。为了确定采取什么动作,系统400可以制定多个动作并基于认知系统配置文件416、用户配置文件414对每个动作进行排序,并收集附加的观测数据和/或环境数据。一个或多个传感器404可收集指示用户正在倒一杯水的数据,该水通常与服用药物的用户相关。基于该动作,系统400可以识别用户将要服药并且不采取任何动作或者仅采取更柔和的动作来指导用户服药。柔和的动作可以包括告诉用户:“吃完药后,您想看电影吗?”采取的动作类型可以取决于由CS控制器402确定的排序。
在一个或多个实施例中,系统400从用户配置文件414收集上下文的历史,从系统配置文件416收集洞察力,并收集与用户和用户的情境上下文相关联的观测数据。情境上下文是环境数据和用户提供的声明的组合。从传感器404接收至少一部分观测数据。从观测数据和情境上下文中提取一个或多个特征。该一个或多个特征(也称为“感知”)被存储在用户配置文件414中,并进行分析以确定一个或多个触发事件。
在一个或多个实施例中,其他触发事件可以包括关于用户的不作为或其他视觉上可观察到的或可听见的数据。在ALS患者的例子中,系统400可以收集关于患者的数据,例如,患者已经凝视窗外了一段时间并且几乎没有运动或没有运动。一个或多个传感器404可以获取诸如面部识别数据之类的附加的信息来确定患者的心情(有时称为“情绪”)。情绪分析基于收集的视觉或听觉数据可用于来确定患者的情绪/心情。情绪分析可以使用基于知识的学习程序来学习患者的特征表达,以更准确地确定特征表达的情绪。情绪分析可以在每次使用时或周期性地从用户配置文件414中检索先前进行的情绪分析,以基于历史情绪分析数据来确定用户的特征表达,并分析先前的情绪分析以细化和改善用户的情绪分析。例如,用户可以特征地表现出紧锁的眉毛。通常,对用户眉毛的情绪分析可能表示情绪,例如轻微的困惑。然而,情绪分析可以基于对所存储的用户的历史情绪分析的回顾来确定,对于该用户而言,展现出其眉毛是特征表达并且指示中立情绪。在该示例中,紧锁的眉毛是特征性的面部表情,其可能不等同于混乱,而是可能是导致用户斜视或紧锁其眉毛的视觉挑战的结果。情绪分析分析用户的面部表情和面部运动,同时查看单个面部特征和整个面部特征,以表达面部表情。使用面部识别技术,情绪分析将用户面部上的各个面部特征和表情与已知面部表情的相似面部特征和面部表情进行比较,以确定或匹配相应的情绪。
基于患者在凝视窗外时缺乏运动和面部表情,系统400可以将其识别为触发事件,系统400将对此采取一个或多个动作。一个或多个动作可以包括播放一些令人振奋的音乐以尝试使患者振作起来和/或改变房间内部的照明。而且,系统400可以简单地用针对用户的建议动作来提示患者,例如“你想今天看电影吗?”。可以从观测数据、环境数据和用户配置文件414的组合中得出建议的动作。例如,基于用户的不活动,系统400可以确定用户感到无聊。收集有关时间和天气的附加的信息。天气数据可能指示下雨,不利于户外活动。时间数据可能指示存储在用户配置文件414中的患者日常活动是当天晚些时候和几乎是上床睡觉的时间。用户配置文件414还可以包括有关患者在去睡觉之前如何享受一些娱乐的信息。而且,用户配置文件414数据和观测数据可以指示,基于一天中的时间,患者的朋友很可能会忙于自己的夜间活动,因此不一定会接受访客。系统400的电影建议可以包括以下类型:患者过去已经指示对电影的偏好并且存储在用户配置文件414中。系统400可以通过从患者那里接收对问题的肯定回答来确认患者对电影的兴趣。在确认了患者对电影的兴趣之后,系统400可以将患者喜欢的类型的电影选项呈现给用户。在准备显示电影时,系统400可以关闭患者房间的窗帘,关闭灯光,调节房间温度,打开电视,然后从视频库中选择电影。一个或多个传感器404可以收集附加的观测数据和环境数据,例如,患者指示他或她对室温不舒服,则系统400可以相应地调节温度。另外,患者可以在电影期间入睡,并且系统400可以暂停电影,直到患者醒来或决定上床睡觉为止。
在一个或多个实施例中,上述情绪分析可以由CS控制器402上的情绪分析模块执行。此外,可以由CS控制器402上的语气分析模块执行语气分析以确定语气。当为系统400提供输入时,用户的情绪分析。情绪分析模块可以用于评估用户输入或动作的情绪质量。情绪分析可以通过
Figure BDA0002528781360000141
WatsonTM魔力(Alchemy)语言应用程序接口(API)或WatsonTM自然语言理解API提供。IBM和Watson是国际商业机器公司(International Business MachinesCorporation)的商标,已在全球许多司法管辖区注册。出于示例性目的提及上述API。情绪分析模块内可以使用任何认知系统。情绪分析模块可以处理自然语言,以在评估用户输入的上下文时将语言分析和统计分析结合在一起。在文本分析中(例如,从诸如平板电脑之类的输入设备),情绪是对某事表达的态度或观点。情绪可以是正面的,“听起来不错”,负面的,“这是不好的”或中立的。可以基于在关键字级别提取和评估的关键字来计算情绪。另外,情绪分析可能能够识别否定词,例如术语“不”以及当短语为“不”“好”时从关键词“好”引起的情绪变化。当术语“非常”或其他形容词与关键字结合使用时,情绪分析可能会考虑强度。另外,关键词可以被加权。例如,诸如“喜欢”之类的肯定短语将具有预定的正权重,而“爱”则可能具有较高的预定正权重。另外,可以提供负权重,诸如“不喜欢”之类的负性词组将具有预定的负权重,而“恨”之类的短语可能具有较高的负权重。情绪分析模块可以评估内容以提供情绪水平。该情绪水平还可包括强度值。
语气分析模块可以是例如
Figure BDA0002528781360000142
语气分析器服务。语气分析模块可以使用语言分析来从文本中检测三种类型的语气。由语气分析模块分析自然语言内容,以确定内容所投射出的情感影响、社交语气和写作风格。语气分析模块可以提供用于情感语气,社交语气和语言语气的语气分数。对于情感语气,语气分析模块可以使用“欢乐”,“恐惧”,“悲伤”,“厌恶”和“愤怒”的情感。每个自然语言元素都针对每种情感进行评估。针对每个自然语言的内容,每种情感可以被评为从值范围中的指示该情感不可能如被认为的那样出现的较低值,或者指示该情感更可能如被认为的那样出现的较高值。可以利用其他情感以及不同的得分值。
对于社交语气,利用了开放性、认真性、外向性、随和性以及情感范围五个要素。开放性是根据一个人对经历各种活动的开放程度来评估的。可以给该个性提供一个值范围,指示其更有可能被认为是胡说八道、直率、直率和明显,或者,如果内容指示其将被认为为有智慧的、好奇的、具有情感敏感的或具有想象力的,则可以被提供更高的值范围。认真性被评估为以有组织或周到的方式行事的倾向。如果呈现被认为是自发的、悠闲的、鲁莽的、不循规蹈矩的或杂乱无章的,则可以为该个性提供一个值范围;或者,如果内容被认为是纪律的、忠实的或自信的,则可以提供较高的值范围。外向性被评估为在他人陪伴下寻求刺激的趋势。如果被认为独立的、胆怯的、性格内向的、内敛的、无聊的,则可以为该个性提供一个价值范围,或者,如果内容被认为具有吸引力的、寻求关注的、自信的、善于交际的,则可以提供更高的值范围。随和性被评估为对他人富有同情心和合作的倾向。如果呈现被认为是自私的、不关心的、不合作的、对抗性的或自大的,则可以为该个性提供一个值范围;或者,如果内容被认为是关心的、同情的、合作的或可信赖的,则可以提供更高的值范围。情绪范围被评估为对环境敏感的趋势。如果呈现被认为是平静的、平淡的、满足的、放松的,则可以为该特征提供一个值范围,或者如果该内容被认为是相关的、沮丧愤怒的、热情的、难过的、紧张或冲动的,则可以提供更高的值范围。这些语气、描述和权重仅是说明性的,并且可以使用附加的语气、描述或权重。
可以分析语言语气以测量用户的说话风格。各种风格可以包括分析、置信度和试探性。分析风格可以集中于个人对事物的推理和分析态度。如果文本包含很少或没有分析语气的证据,则可以为分析风格提供一个值范围;或者,如果更可能呈现被认为是有才智的、理性的、系统的、无感情的或非个人的,则可以为分析风格提供一个较高的值范围。置信风格可以着眼于用户的确定程度。如果文本包含很少或没有对语气的置信度的证据,则可以为该置信度风格提供一个值范围,或者,如果该风格更有可能被认为是放心的、收集的、希望的或自负的,则可以为置信度风格提供一个较高的值范围。试探性风格可能会着重于用户的抑制程度。如果文本中几乎没有或没有语气情绪证据,则可以为试探性风格提供一个较低的值范围,如果更可能将其视为可疑、可疑的限制或有争议的风格,则可以为试探性风格提供较高的值。
在一个或多个实施例中,认知系统配置文件416可以包括具有用于与用户互动的指令的通信配置文件,并且可以被定制为适合于特定用户的特定任务和动作。例如,系统400可以被用来辅助航空公司飞行员,并且初始通信配置文件可以被预编程为包括关于飞行特定飞机并访问与操作飞机有关的某些类型的数据的信息。当系统400与飞行员互动时,可以创建用于飞行员的用户配置文件414,该用户配置文件414将针对特定飞行员调整通信配置文件。
在一个或多个实施例中,输出设备410可以是显示屏,其可以显示系统400的化身或任何计算机生成的图形以辅助与用户互动。化身可以具有类人的特征,并且当用户与系统400交谈时,通过微笑、点头和/或发出周到的声音来对来自用户的输入做出反应。
在一个或多个实施例中,认知系统400利用一种算法来识别并制定系统400提出的动作。图5描绘了根据本发明的一个或多个实施例的确定输出的算法的框图。算法500接收一个或多个输入502。如上所述,输入502可以从一个或多个传感器402接收,并且包括与用户相关联或与认知系统400的特定任务相关联的观测数据和/或环境数据。算法500利用输入来确定输出512(例如,动作)。算法500接收原始的、非结构化的数据和进入的消息作为输入502。算法500组织并解释该数据。感知504是将非结构化数据组织成含义的过程。当从输入502接收到数据和/或消息时,信息被组织和解释,使得CS系统400可以以适当的方式响应于输入提供动作。算法500还利用感知504来识别环境和会话上下文,以匹配输出512的适当性。
在本发明的一个或多个实施例中,当CS系统400已经评估了其周围环境时,系统400然后可以提供动作。然而,为了产生最高或最佳结果,系统400需要明确的目的、目标集和要遵循的值集。可以在制造系统之前确定系统的400的目的。例如,系统400可以具有被定义为在仓库中移动箱子、向酒店客人提供礼宾服务,照顾老年患者或协助经理解决问题的目的。系统400的目标可以预先编程,以与系统的总体目的保持一致。例如,为在仓库中移动箱子而建造的机器人的目标是不丢任何箱子。无论目标多么简单,系统400都需要许多不同的技能,以确保无论外界影响如何,箱子都不会掉落。某些情况(例如,箱子太重或有人试图将箱子推离机器人)可能会导致系统目标出现问题。机器人的程序员需要考虑围绕目标解决问题机器人需要什么技能,并描述系统如何响应外部影响。这些目标和总体目的可以被认为是算法500的动机506部分。
在本发明的一个或多个实施例中,推理510过程是基于来自输入502的感知504、动机506和知识(记忆)508的信息,做出逻辑决策并决定采取的最佳行动。一般来说,较高的推理能力被认为直接负责驱动人类认知能力增强,即认知计算和认知系统的主要目标。推理510包括与人类进行对话、与他们互动以使他们朝着已知或新颖的目标前进、向他们提供他们可能自己无法获得的观点、或者只是在正确的时间提供正确的信息帮助他们做出更好的决定。推理510还包括可能需要的任何推理策略以回答他们的问题。例如,对话、深度问题解答(深度-QA)、发现以及合规性可以被认为是推理510。
在本发明的一个或多个实施例中,识别动作是否成功完成了期望的结果可以改善系统提供未来动作的能力。例如,如果该动作不成功或未被用户注意到,则利用学习514的系统400将试图了解特定动作如何以及为什么未能达到期望的结果,并利用这种理解来改善未来的动作。可以通过用户反馈来实现对期望结果的标识,该用户反馈可以利用学习514来调整算法500以执行与输出512相同的动作或执行新的或不同的动作。
在本发明的一个或多个实施例中,当认知系统400发送消息时,该消息被精神解码该消息的用户接收。然后,一个人使用人类的认知过程创建一条新消息来响应CS,并将新消息返回给CS。消息在人员和CS之间来回传递,直到一个或另一个完成目标或任务为止。通信不仅限于听觉信号,还包括视觉和物理信号。有时,这些信号传输模式是单独表达的,例如告诉用户任务已完成,而其他时候则将信号编排在一起,例如告诉用户任务已完成并打开灯。如何将这些模式编排在一起以及相关的语气表达创造一种突现的个性,并且是鼓励用户继续参与认知系统的个性。
图6描绘了根据本发明的一个或多个实施例的用于认知系统与用户互动的方法的流程图。方法600包括由处理器接收认知系统配置文件,如框602所示。在框604,方法600包括由处理器接收与用户相关联的观测数据,其中至少一部分观测数据是从一个或多个传感器接收的。在框606处,方法600包括接收与该用户相关联的环境数据。在框608,方法600包括从该观测数据和该环境数据中提取一个或多个特征。方法600包括将该一个或多个特征存储在该用户配置文件中,如框610所示。在框612,方法600包括基于该认知系统配置文件和该用户配置文件分析该一个或多个特征以确定该一个或多个特征中的每个特征的上下文。在框614处,方法600包括至少部分基于该一个或多个特征中的每个特征的上下文来识别一个或多个触发事件。在方框616,方法600包括至少部分地基于该一个或多个触发事件来确定一个或多个建议动作。方法600包括从该一个或多个建议动作中发起至少一个动作,如框618所示。在框620,方法600包括将该至少一个动作、该一个或多个触发事件以及该一个或多个特征存储在用户配置文件中。
还可以包括附加处理。应当理解,图6中描绘的过程代表图示,并且在不脱离本公开的范围的情况下,可以添加其他过程或者可以移除、修改或重新布置现有过程。
图7描绘了根据本发明的一个或多个实施例的用于认知系统与用户互动的方法的流程图。方法700包括由处理器接收通信模型,该通信模型包括用于与用户通信的一组指令,如框702所示。在框704,方法700包括至少部分地基于该通信模型提示用户用户数据。在框706,方法700包括从该用户接收该用户数据并将该用户数据存储在用户配置文件中。在框708处,方法700包括至少部分基于该用户数据来更新该通信模型。
还可以包括附加处理。应当理解,图7中描绘的过程代表图示,并且在不脱离本公开的范围的情况下,可以添加其他过程或者可以移除、修改或重新布置现有过程。
技术益处包括用于认知系统实施类似一组能力的方法,以实现与用户的更自然的互动形式,这将增加系统对用户理解的影响,并扩大他们自己的认知流程。
在任何可能的技术细节结合层面,本发明可以是系统、方法和/或计算机程序产品。计算机程序产品可以包括计算机可读存储介质,其上载有用于使处理器实现本发明的各个方面的计算机可读程序指令。
计算机可读存储介质可以是可以保持和存储由指令执行设备使用的指令的有形设备。计算机可读存储介质例如可以是――但不限于――电存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备或者上述的任意合适的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、静态随机存取存储器(SRAM)、便携式压缩盘只读存储器(CD-ROM)、数字多功能盘(DVD)、记忆棒、软盘、机械编码设备、例如其上存储有指令的打孔卡或凹槽内凸起结构、以及上述的任意合适的组合。这里所使用的计算机可读存储介质不被解释为瞬时信号本身,诸如无线电波或者其他自由传播的电磁波、通过波导或其他传输媒介传播的电磁波(例如,通过光纤电缆的光脉冲)、或者通过电线传输的电信号。
这里所描述的计算机可读程序指令可以从计算机可读存储介质下载到各个计算/处理设备,或者通过网络、例如因特网、局域网、广域网和/或无线网下载到外部计算机或外部存储设备。网络可以包括铜传输电缆、光纤传输、无线传输、路由器、防火墙、交换机、网关计算机和/或边缘服务器。每个计算/处理设备中的网络适配卡或者网络接口从网络接收计算机可读程序指令,并转发该计算机可读程序指令,以供存储在各个计算/处理设备中的计算机可读存储介质中。
用于执行本发明操作的计算机程序指令可以是汇编指令、指令集架构(ISA)指令、机器指令、机器相关指令、微代码、固件指令、状态设置数据、集成电路配置数据或者以一种或多种编程语言的任意组合编写的源代码或目标代码,所述编程语言包括面向对象的编程语言—诸如Smalltalk、C++等,以及过程式编程语言—诸如“C”语言或类似的编程语言。计算机可读程序指令可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络—包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。在一些实施例中,通过利用计算机可读程序指令的状态信息来个性化定制电子电路,例如可编程逻辑电路、现场可编程门阵列(FPGA)或可编程逻辑阵列(PLA),该电子电路可以执行计算机可读程序指令,从而实现本发明的各个方面。
这里参照根据本发明实施例的方法、装置(系统)和计算机程序产品的流程图和/或框图描述了本发明的各个方面。应当理解,流程图和/或框图的每个方框以及流程图和/或框图中各方框的组合,都可以由计算机可读程序指令实现。
这些计算机可读程序指令可以提供给通用计算机、专用计算机或其它可编程数据处理装置的处理器,从而生产出一种机器,使得这些指令在通过计算机或其它可编程数据处理装置的处理器执行时,产生了实现流程图和/或框图中的一个或多个方框中规定的功能/动作的装置。也可以把这些计算机可读程序指令存储在计算机可读存储介质中,这些指令使得计算机、可编程数据处理装置和/或其他设备以特定方式工作,从而,存储有指令的计算机可读介质则包括一个制造品,其包括实现流程图和/或框图中的一个或多个方框中规定的功能/动作的各个方面的指令。
也可以把计算机可读程序指令加载到计算机、其它可编程数据处理装置、或其它设备上,使得在计算机、其它可编程数据处理装置或其它设备上执行一系列操作步骤,以产生计算机实现的过程,从而使得在计算机、其它可编程数据处理装置、或其它设备上执行的指令实现流程图和/或框图中的一个或多个方框中规定的功能/动作。
附图中的流程图和框图显示了根据本发明的多个实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或指令的一部分,所述模块、程序段或指令的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
以上已经描述了本发明的各实施例,上述说明是示例性的,并非穷尽性的,并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范围的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择,旨在最好地解释各实施例的原理、实际应用或对市场中的技术的技术改进,或者使本技术领域的其它普通技术人员能理解本文描述的各实施例。

Claims (18)

1.一种用于认知系统与用户互动的计算机实现的方法,该方法包括:
由处理器接收认知系统配置文件;
由处理器接收与用户相关联的观测数据,其中至少一部分观测数据是从一个或多个传感器接收的;
接收与所述用户相关联的环境数据;
从所述观测数据和所述环境数据中提取一个或多个特征;
将所述一个或多个特征存储在所述用户配置文件中;
基于所述认知系统配置文件和所述用户配置文件分析所述一个或多个特征,以确定所述一个或多个特征中的每个特征的情境上下文;
至少部分基于所述一个或多个特征中的每个特征的情境上下文来识别一个或多个触发事件;
至少部分地基于所述一个或多个触发事件来确定一个或多个建议动作;
从所述一个或多个建议动作中发起至少一个动作;以及
将所述至少一个动作、所述一个或多个触发事件以及所述一个或多个特征存储在所述用户配置文件中。
2.如权利要求1所述的计算机实现的方法,还包括:
响应于发起所述至少一个动作,接收用户输入数据;
从所述用户输入数据中提取一个或多个用户输入特征;
分析所述一个或多个用户输入特征,以为所述一个或多个用户输入特征中的每个特征确定情境上下文;
基于所述一个或多个特征的每个的所述情境上下文更新所述用户配置文件;
至少部分地基于所述一个或多个用户输入特征的所述情境上下文,调整所述一个或多个建议动作;
从所述一个或多个建议动作中发起至少一个新动作;
将所述至少一个新动作和所述一个或多个用户输入特征存储在所述用户配置文件中。
3.根据前述权利要求中的任一项所述的计算机实现的方法,其中,从所述一个或多个建议动作中发起所述至少一个动作包括:
对所述一个或多个建议动作中的每个动作进行排名;以及
至少部分地基于所述至少一个动作的排名,从所述一个或多个建议动作中发起至少一个动作。
4.根据前述权利要求中的任一项所述的计算机实现的方法,其中,确定所述一个或多个特征中的每个特征的情境上下文包括:
分析包括历史数据在内的所述用户配置文件,该历史数据包括从先前的观测数据和先前的环境数据中提取的先前特征;以及
将所述一个或多个特征与先前特征进行比较,以确定所述一个或多个特征中的每个特征的情境上下文,其中,情境上下文与每个先前特征相关联。
5.根据前述权利要求中的任一项所述的计算机实现的方法,还包括:
由处理器接收与所述用户相关联的附加的观测数据;
接收附加的环境数据;
从所述附加的观测数据和所述附加的环境数据中提取一个或多个附加的特征;
将所述一个或多个附加的特征与所述一个或多个特征进行比较,以识别确定变化阈值水平存在;
至少部分地基于确定变化的阈值水平存在,分析所述一个或多个附加的特征以确定所述一个或多个附加的特征中的每个的情境上下文;以及
至少部分地基于所述一个或多个附加的特征中的每个的情境上下文来更新所述一个或多个建议动作。
6.如权利要求5所述的计算机实现的方法,还包括:
至少部分地基于确定所述变化的阈值水平不存在,调整所述一个或多个建议动作;以及
从所述一个或多个建议动作中启动至少一个新动作。
7.根据前述权利要求中的任一项所述的计算机实现的方法,其中,所述认知系统配置文件包括:
包含指令的通信协议,该指令用于和所述用户互动。
8.一种认知系统与用户互动的计算机实现的方法,该方法包括:
由处理器接收通信模型,该通信模型包括用于与所述用户通信的一组指令;
至少部分基于所述通信模型提示用户输入用户数据;
从所述用户接收用户数据并将所述用户数据存储在用户配置文件中;以及
至少部分地基于所述用户数据来更新所述通信模型。
9.如权利要求8所述的计算机实现的方法,还包括:
至少部分基于所述通信模型和所述用户配置文件提示所述用户输入附加的用户数据;
至少部分地基于所述附加的用户数据来更新所述通信模型。
10.一种用于认知系统与用户互动的系统,该系统包括:
通信耦合到存储器的处理器,所述处理器被配置为:
接收认知系统资料;
接收与用户相关联的观测数据,其中至少一部分观测数据是从一个或多个传感器接收的;
接收与所述用户相关联的环境数据;
从所述观测数据和所述环境数据中提取一个或多个特征;
将所述一个或多个特征存储在所述用户配置文件中;
基于所述认知系统配置文件和所述用户配置文件分析所述一个或多个特征,以确定所述一个或多个特征中的每个特征的情境上下文;
至少部分基于所述一个或多个特征中的每个特征的情境上下文来识别一个或多个触发事件;
至少部分地基于所述一个或多个触发事件来确定一个或多个建议动作;
从所述一个或多个建议动作中发起至少一个动作;以及
将所述至少一个动作、所述一个或多个触发事件以及所述一个或多个特征存储在所述用户配置文件中。
11.如权利要求10所述的系统,其中,所述处理器还被配置为:
响应于发起所述至少一个动作,接收用户输入数据;
从所述用户输入数据中提取一个或多个用户输入特征;
分析所述一个或多个用户输入特征,以为所述一个或多个用户输入特征中的每个特征确定情境上下文;
基于所述一个或多个特征的每个的所述情境上下文更新所述用户配置文件;
至少部分地基于所述一个或多个用户输入特征的所述情境上下文,调整所述一个或多个建议动作;
从所述一个或多个建议动作中发起至少一个新动作;
将所述至少一个新动作和所述一个或多个用户输入特征存储在所述用户配置文件中。
12.如权利要求10或11所述的系统,其中从所述一个或多个建议动作中发起至少一个动作包括:
对所述一个或多个建议动作中的每个动作进行排名;以及
至少部分地基于所述至少一个动作的排名,从所述一个或多个建议动作中发起至少一个动作。
13.如权利要求10至12中的任一项所述的系统,其中,确定所述一个或多个特征中的每个特征的情境上下文包括:
分析包括历史数据在内的所述用户配置文件,该历史数据包括从先前的观测数据和先前的环境数据中提取的先前特征;以及
将所述一个或多个特征与先前特征进行比较,以确定所述一个或多个特征中的每个特征的情境上下文,其中,情境上下文与每个先前特征相关联。
14.如权利要求10至13中的任一项所述的系统,其中,所述处理器还被配置为:
接收与所述用户相关联的附加的观测数据;
接收附加的环境数据;
从所述附加的观测数据和所述附加的环境数据中提取一个或多个附加的特征;
将所述一个或多个附加的特征与所述一个或多个特征进行比较,以识别确定变化阈值水平存在;
至少部分地基于确定变化的阈值水平存在,分析所述一个或多个附加的特征以确定所述一个或多个附加的特征中的每个的情境上下文;以及
至少部分地基于所述一个或多个附加的特征中的每个的情境上下文来更新所述一个或多个建议动作。
15.如权利要求14所述的系统,其中,所述处理器还被配置为:
至少部分地基于确定所述变化的阈值水平不存在,调整所述一个或多个建议动作;以及
从所述一个或多个建议动作中启动至少一个新动作。
16.如权利要求10至15中的任一项所述的系统,其中,所述认知系统配置文件包括:
包含指令的通信协议,该指令用于和所述用户互动。
17.一种用于认知系统与用户互动的计算机程序产品,该计算机程序产品包括:
一种计算机可读存储介质,该计算机可读存储介质可由处理电路读取并存储由处理电路执行的指令以执行如权利要求1至9中任一项所述的方法。
18.一种存储在计算机可读介质上并且可加载到数字计算机的内部存储器中的计算机程序,该计算机程序包括软件代码部分,当所述程序在计算机上运行时,用于执行权利要求1至9中任一项所述的方法。
CN201880079324.5A 2017-12-15 2018-12-14 认知系统的通信模型 Active CN111448533B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US15/843,302 US11836592B2 (en) 2017-12-15 2017-12-15 Communication model for cognitive systems
US15/843,302 2017-12-15
PCT/IB2018/060099 WO2019116339A1 (en) 2017-12-15 2018-12-14 Communication model for cognitive systems

Publications (2)

Publication Number Publication Date
CN111448533A true CN111448533A (zh) 2020-07-24
CN111448533B CN111448533B (zh) 2024-02-13

Family

ID=66814571

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201880079324.5A Active CN111448533B (zh) 2017-12-15 2018-12-14 认知系统的通信模型

Country Status (6)

Country Link
US (1) US11836592B2 (zh)
JP (1) JP7292780B2 (zh)
CN (1) CN111448533B (zh)
DE (1) DE112018006374T5 (zh)
GB (1) GB2582726B (zh)
WO (1) WO2019116339A1 (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11836592B2 (en) 2017-12-15 2023-12-05 International Business Machines Corporation Communication model for cognitive systems
US11755822B2 (en) 2020-08-04 2023-09-12 International Business Machines Corporation Promised natural language processing annotations
US11520972B2 (en) * 2020-08-04 2022-12-06 International Business Machines Corporation Future potential natural language processing annotations
US11972636B2 (en) * 2020-09-30 2024-04-30 Ringcentral, Inc. System and method of determining an emotional state of a user
US20230153365A1 (en) * 2021-11-12 2023-05-18 Safe Kids LLC Methods and systems for determining user intents and sentiments

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140067729A1 (en) * 2012-08-30 2014-03-06 International Business Machines Corporation Human Memory Enhancement Using Machine Learning
CN105204357A (zh) * 2015-09-18 2015-12-30 小米科技有限责任公司 智能家居设备的情景模式调整方法及装置
CN105389097A (zh) * 2014-09-03 2016-03-09 中兴通讯股份有限公司 一种人机交互装置及方法
CN105512228A (zh) * 2015-11-30 2016-04-20 北京光年无限科技有限公司 一种基于智能机器人的双向问答数据处理方法和系统

Family Cites Families (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4263473B2 (ja) 2002-12-26 2009-05-13 Kddi株式会社 サービス情報提供システム
JP2005332127A (ja) 2004-05-19 2005-12-02 Nippon Telegr & Teleph Corp <Ntt> 個人プロファイルによる状況予測システムおよび方法、プログラムおよび記録媒体
US9245525B2 (en) 2011-01-05 2016-01-26 Interactions Llc Automated speech recognition proxy system for natural language understanding
JPWO2012132947A1 (ja) 2011-03-29 2014-07-28 日本電気株式会社 サービス提供条件最適化方法、サービス検索装置、及びサービス提供条件最適化システム
EP3200185A1 (en) 2011-09-30 2017-08-02 Apple Inc. Using context information to facilitate processing of commands in a virtual assistant
US9495874B1 (en) * 2012-04-13 2016-11-15 Google Inc. Automated system and method for modeling the behavior of vehicles and other agents
US20130346347A1 (en) * 2012-06-22 2013-12-26 Google Inc. Method to Predict a Communicative Action that is Most Likely to be Executed Given a Context
US9536049B2 (en) * 2012-09-07 2017-01-03 Next It Corporation Conversational virtual healthcare assistant
US10319022B2 (en) * 2013-02-28 2019-06-11 Lg Electronics Inc. Apparatus and method for processing a multimedia commerce service
US20140324747A1 (en) 2013-04-30 2014-10-30 Raytheon Company Artificial continuously recombinant neural fiber network
EP2821943A1 (en) 2013-07-03 2015-01-07 Accenture Global Services Limited Query response device
US9296395B2 (en) 2013-10-25 2016-03-29 International Business Machines Corporation Cognitive state supported automotive travel
US10102738B2 (en) * 2014-09-30 2018-10-16 Henry's Products Llc Portable security device
US10168677B2 (en) * 2014-11-11 2019-01-01 Weebee Corporation Systems and methods for smart spaces
US10990888B2 (en) 2015-03-30 2021-04-27 International Business Machines Corporation Cognitive monitoring
US20170098172A1 (en) 2015-10-06 2017-04-06 Evolv Technologies, Inc. Training Artificial Intelligence
CN106817342A (zh) 2015-11-30 2017-06-09 北京计算机技术及应用研究所 基于用户行为特征识别的主动身份认证系统
US20170255865A1 (en) * 2016-03-01 2017-09-07 Microsoft Technology Licensing, Llc Computer application action experimentation
US10831802B2 (en) * 2016-04-11 2020-11-10 Facebook, Inc. Techniques to respond to user requests using natural-language machine learning based on example conversations
AU2017263835B2 (en) * 2016-05-13 2021-06-10 WellDoc, Inc. Database management and graphical user interfaces for managing blood glucose levels
US20170337838A1 (en) * 2016-05-18 2017-11-23 Tamera Elkon Methods and apparatus for learning style preference assessment
US20180052842A1 (en) * 2016-08-16 2018-02-22 Ebay Inc. Intelligent online personal assistant with natural language understanding
US20190142062A1 (en) * 2017-11-14 2019-05-16 International Business Machines Corporation System and method to implement a cognitive quit smoking assistant
US11836592B2 (en) 2017-12-15 2023-12-05 International Business Machines Corporation Communication model for cognitive systems

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140067729A1 (en) * 2012-08-30 2014-03-06 International Business Machines Corporation Human Memory Enhancement Using Machine Learning
CN105389097A (zh) * 2014-09-03 2016-03-09 中兴通讯股份有限公司 一种人机交互装置及方法
CN105204357A (zh) * 2015-09-18 2015-12-30 小米科技有限责任公司 智能家居设备的情景模式调整方法及装置
CN105512228A (zh) * 2015-11-30 2016-04-20 北京光年无限科技有限公司 一种基于智能机器人的双向问答数据处理方法和系统

Also Published As

Publication number Publication date
US20190188552A1 (en) 2019-06-20
GB2582726A (en) 2020-09-30
GB202010430D0 (en) 2020-08-19
GB2582726B (en) 2021-05-12
JP2021507381A (ja) 2021-02-22
DE112018006374T5 (de) 2020-10-01
JP7292780B2 (ja) 2023-06-19
WO2019116339A1 (en) 2019-06-20
US11836592B2 (en) 2023-12-05
CN111448533B (zh) 2024-02-13

Similar Documents

Publication Publication Date Title
Portugal et al. A study on the deployment of a service robot in an elderly care center
Shaked Avatars and virtual agents–relationship interfaces for the elderly
Streitz et al. Grand challenges for ambient intelligence and implications for design contexts and smart societies
CN111448533B (zh) 认知系统的通信模型
Miller et al. Apps, avatars, and robots: The future of mental healthcare
US9830044B2 (en) Virtual assistant team customization
Breazeal et al. Designing social robots for older adults
CN105409197A (zh) 用于提供持久伙伴装置的设备和方法
Karyotaki et al. Chatbots as cognitive, educational, advisory & coaching systems
Kim et al. Conceptual metaphors for designing smart environments: device, robot, and friend
Tsiourti et al. The CaMeLi framework—a multimodal virtual companion for older adults
KR102274646B1 (ko) 치매 예방과 치료를 위한 인지강화훈련 제공 방법 및 그 시스템
Ostrowski et al. Personal narratives in technology design: the value of sharing older adults’ stories in the design of social robots
Armstrong Big Data, Big Design: Why Designers Should Care about Artificial Intelligence
Loveys et al. The impact of virtual humans on psychosomatic medicine
Kouroupetroglou Enhancing the human experience through assistive technologies and e-accessibility
Brown Unifying interaction across distributed controls in a smart environment using anthropology-based computing to make human-computer interaction" Calm"
Quintas Context-based human-machine interaction framework for arti ficial social companions
Achilleos et al. Lessons learned from older adults fusing of an augmented reality, assisted living and social interaction platform
Oliveira Using interactive agents to provide daily living assistance for visually impaired people
Shih et al. Virtual voice assistants
Hanke et al. Embodied Ambient Intelligent Systems.
Maria et al. Chatbots as cognitive, educational, advisory & coaching systems
US20240012860A1 (en) Systems, methods and computer readable media for special needs service provider matching and reviews
US20240078004A1 (en) Authoring context aware policies with real-time feedforward validation in extended reality

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant