WO2019158014A1

WO2019158014A1 - 由计算机实施的与用户对话的方法和计算机系统

Info

Publication number: WO2019158014A1
Application number: PCT/CN2019/074666
Authority: WO
Inventors: 邬学宁
Original assignee: 上海好体信息科技有限公司
Priority date: 2018-02-13
Filing date: 2019-02-03
Publication date: 2019-08-22
Also published as: CN108491443B; CN108491443A

Abstract

本公开涉及由计算机实施的与用户对话的方法和计算机系统。该方法包括从用户接收自然语言格式的输入；对输入进行自然语言理解，生成语义表示；利用知识图谱对语义表示进行处理，以生成答复；根据答复进行自然语言生成来得到自然语言格式的输出；以及将输出提供给用户。其中，该方法用于垂直领域。该计算机系统包括：输入\输出接口，被配置为从用户接收自然语言格式的输入并向用户提供自然语言格式的输出；处理器；以及存储器，其被配置为耦合到处理器并存储计算机程序。其中，处理器被配置为执行该程序以执行本公开的由计算机实施的与用户对话的方法。

Description

由计算机实施的与用户对话的方法和计算机系统

相关申请的交叉引用

本申请要求于2018年02月13日递交的中国专利申请201810147719.6号的优先权，在此全文引用上述中国专利申请公开的内容以作为本申请的一部分。

技术领域

本公开涉及用计算机实施的与用户对话的方法和计算机系统，具体来说，涉及一种由计算机实施的用于垂直领域的与用户对话的方法和计算机系统。

背景技术

近年来，对话和聊天机器人(Chatbot)正在代替图形用户界面而成为新的用户界面(UI)。随着智能音箱等的涌现，对话机器人被认为是替代移动设备APP的下一代用户入口。

当前，对话机器人在拟人化交互方面取得了一定进展。机器人以“说人话”作为优化目标，并且通过使用海量的语料进行训练并应用深度学习算法，用户有时已经难以分辨出是在与机器人进行对话。但是，由于所采用的技术的局限，当前的对话机器人仅能够进行简单地对话和处理简单的问题，并且如果遇到无法回答的问题或无法理解的表述，聊天机器人一般会简单地调用搜索引擎对用户输入中的关键词进行搜索，并直接将搜索结果的网页返回给用户。

发明内容

如上所述，已有的对话机器人能较好的与人简单地对话，但难以适当地回答复杂的问题或与用户进行深度对话。例如，当用户的问题或表述需要一步或多步的逻辑推理才能理解或应答时，对话机器人往往无法进行应对。相对于开放领域来说，这样的问题对于垂直领域的机器人更加普遍和常见。“开放领域”指的是在用户与机器人对话时，对话不被限制在某一个具体领域，用户可以和机器人聊任何话题。“垂直领域”也叫作“封闭领域”，垂直领域的对话机器人指的是在用户与机器人对话时，对话被限制在某一个具体领域或行业。对于开放领域的聊天机器人，用户的聊天往往比较简单，并且对聊天机器人的期望不高。而对于垂直领域的聊天机器人，由于对话被限制在某一领域，用户会试图与机器人针对该具体领域中有深度的话题进行复杂的对话，并且期望得到更有深度的答复。针对这样的话题和对话，因为不能通过简单的搜索和数据库查询来得到合适的答复，所以已有的对话机器人也无法应对垂直领域中的对话情景。

因此，需要提供一种特别是在垂直领域中能够答复用户的各种问题的对话机器人。本公开的一个目的是提供一种由计算机实施的与用户对话的方法和计算机系统，来解决以上的至少一个技术问题。

根据本公开的第一方面，提供了一种由计算机实施的与用户对话的方法，包括：从用户接收自然语言格式的输入；对输入进行自然语言理解，生成语义表示；利用知识图谱对语义表示进行处理，以生成答复；根据答复进行自然语言生成来得到自然语言格式的输出；以及将输出提供给用户。其中，该方法用于垂直领域。

根据本公开的第二方面，提供了一种计算机系统，包括：输入\输出接口，被配置为从用户接收自然语言格式的输入并向用户提供自然语言格式的输出；处理器；以及存储器，其被配置为耦合到处理器并存储计算机程序。处理器被配置为执行该程序以执行以下操作：从用户接收自然语言格式的输入；对输入进行自然语言理解，生成语义表示；利用知识图谱对语义表示进行处理，以生成答复；根据答复进行自然语言生成来得到自然语言格式的输出；以及将输出提供给用户。其中，该方法用于垂直领域。

根据本公开的实施例的优点之一在于，能够在垂直领域中答复用户的复杂和/或有深度的问题。

通过以下参照附图对本公开的示例性实施例的详细描述，本公开的其它特征及其优点将会变得清楚。

附图说明

构成说明书的一部分的附图描述了本公开的实施例，并且连同说明书一起用于解释本公开的原理。

参照附图，根据下面的详细描述，可以更加清楚地理解本公开，其中：

图1是示出根据本公开的实施例的计算机系统的示图。

图2是根据本公开的实施例的由计算机系统实施的与用户对话的方法的流程图。

图3是根据本公开的实施例的基于意图的语义表示的示意图。

图4是根据本公开的知识图谱的示意图。

图5是根据本公开的实施例的基于语法的语义表示的示意图。

图6是根据本公开的实施例的经过依存语法分析的文本的示意图。

图7是根据本公开的实施例的经过依存语法分析的文本的示意图。

图8是根据本公开的实施例的经过依存语法分析的文本的示意图。

图9是根据本公开的实施例的经过依存语法分析的文本的示意图。

图10是根据本公开的实施例的经过依存语法分析的文本的示意图。

图11是根据本公开的实施例的由知识图谱表示的表达式的示意图。

注意，在以下说明的实施例中，有时在不同的附图之间共同使用同一附图标记来表示相同部分或具有相同功能的部分，而省略其重复说明。在本说明书中，使用相似的标号和字母表示类似项，因此，一旦某一项在一个附图中被定义，则在随后的附图中不需要对其进行进一步讨论。

具体实施方式

现在将参照附图来详细描述本公开的各种示例性实施例。应注意到：除非另外具体说明，否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本公开的范围。

以下对至少一个示例性实施例的描述实际上仅仅是说明性的，决不作为对本公开及其应用或使用的任何限制。

对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论，但在适当情况下，所述技术、方法和设备应当被视为授权说明书的一部分。

在这里示出和讨论的所有示例中，任何具体值应被解释为仅仅是示例性的，而不是作为限制。因此，示例性实施例的其它示例可以具有不同的值。

图1是示出根据本公开的实施例的计算机系统1的示图，该计算机系统1用来实施根据本公开的与用户对话的方法。在一些情况下，该计算机系统1可以被称作为“对话机器人”。

图1中示出的该计算系统1为可以应用到本公开的硬件设备的示例。该计算系统1可以是执行处理和/或计算的各种计算设备，包括但不局限于工作站、服务器、桌面计算机、膝上计算机、平板电脑、个人数字助理、智能电话、车载计算机、智能音箱或者它们的组合。

该计算机系统1包括可以包括各种元件。例如，计算机系统1包括处理器10、存储器20和输入\输出接口30。该处理器10可以是任何类型的处理器，并且可以包括但不局限于通用目的处理器和/或专业目的处理器(诸如特殊处理的芯片)。存储器20可以包括或连接到任何存储设备，例如，非瞬态存储设备，并且可以进行数据存储。存储器20包括但不局限于计算机可以读取和记录数据、指令和/或代码的盘驱动器、光学存储设备、固态存储设备、软盘、硬盘、柔性盘或任何其他磁性介质。存储器20的类型例如包括但不局限于ROM(只读存储器)、RAM(随机存取存储器)、快速缓存存储器、其他存储芯片和/或其他存储介质。存储器20可以耦合到处理器10并存储任何数据/指令/代码。例如，该存储器存储用于本公开的技术方案的计算机程序，该计算机程序可以被处理器读取并执行，以实施本公开的技术方案。输入输出接口30被配置为从用户接收自然语言格式的输入并向用户提供自然语言格式的输出。例如，输入输出接口30可以包括和/或连接到可以从用户接收自言语言格式的输入和向用户提供自然语言格式的输出的任何设备，包括但不局限于鼠标、键盘、触摸屏、麦克风和/或遥控器，以及显示器、扬声器、视频/音频输出端口、振动器和/或打印机等。

图1中示出的各种设备可以由例如总线连接，并且由本地设备构成。另外，输入输出接口30可以位于远离处理器10的远程设备中，例如，位于用户的移动设备中。另外，图1中示出的各种设备可以采用云计算的配置，其中各个功能由通过网络连接的多个设备分割和共享。例如，处理器10和存储器20可以分布在多个设备中，并进行分布式部署。在一些实施例中，处理器10的一部分可以位于远程设备中，例如，位于用户的移动设备中，并由移动设备承载本公开的技术方案的一部分特征。例如，本公开的技术方案包括由移动设备执行的APP。各个设备之间的通信方式可以包括例如但不局限于有线通信设备和/或无线通信设备。有线通信设备例如包括调制解调器、网卡和光纤通信设备等。无线通信设备例如包括红外通信设备、蓝牙设备、1302.11设备、WIFI设备、WiMax设备、蜂窝通信设备等。

图2是根据本公开的实施例的由计算机系统1实施的与用户对话的方法的流程图。

如图2所示，根据本公开的实施例的由计算机实施的与用户对话的方法开始于步骤S201，即，处理器10通过输入/输出接口30从用户接收自然语言格式的输入。自然语言指的是人们日常使用的语言，它是人与人之间沟通所使用的语言。自然语言的简单例子包括人们日常使用的汉语、英语、德语等。与自然语言对应的是逻辑语言，它是人与机器沟通所使用的语言。逻辑语言的简单例子包括各种计算机语言。用户的输入可以是自然语言格式的文字、语音、视频等。例如，用户的输入可以是通过输入法输入的一段文字。或者，用户的输入可以是通过麦克风输入的一段语音，之后该语音可以通过语音识别被转换为文字。或者，用户的输入可以是通过摄像头和麦克风输入的一段视频，之后该视频中的语音可以通过语音识别被转换为文字。

用户的输入可以包括各种类型的句子。例如，用户的输入可以是用户希望得到解答的问题。例如，在“足球领域”中，用户的输入可以是“球员A在哪个球队效力？”、“球员A的教练是谁？”、“球队A的教练和球队B的教练之间是什么关系？”、“球员A的兄弟在哪个球队效力？”、“国际联赛的哪个球队的门将也是球队B的队员”等。针对这样的用户输入，根据本公开的实施例的聊天机器人可以提供该问题的解答，作为答复。此外，用户的输入也可以不是用户希望得到解答的问题，而可以是例如用户陈述的某种事实或者状态，例如，“球员A的表现不错”、“球队A和球队B的教练的战术很相似”、“球员A的兄弟的表现太差了”等。针对这样的用户输入，根据本公开的实施例的聊天机器人可以提供适当的反应，例如，根据用户的输入进行合理的解释或说明，来作为答复。在下文中会结合以上例子对根据本公开的实施例的聊天机器人的答复的示例进行具体说明。此外，本领域技术人员可以理解，用户的输入不仅局限于以上示例，并且也可以包括其他各种类型的句子。

之后，在步骤S202，由处理器10对输入进行自然语言理解，生成语义表示。自然语言理解(Natural Language Understanding，NLU)指的是用计算机能够理解和处理的方式来表示自然语言的意义，它是自然语言处理(Natural Language Processing，NLP)的一部分。简单来说，自然语言理解的目的是获得自然语言的语义表示，该语义表示使得计算机能够明白用户的想法。

语义表示可以具有各种表达方式，并且在本公开的实施例中，作为示例，提供了以意图表示的语义表示和以语法结构表示的语义表示。

根据本公开的一个实施例，语义表示是基于用户的意图的，并且对输入进行自然语言理解基本上包括实体抽取和意图识别两部分。具体来说，在接收到用户的输入的文本(通常是一句话)时，可以先对文本进行预处理。例如，可以通过切词将这句话划分为独立的词或词组，之后通过词性标注来确定每个词的词性并进行标注。之后，根据所标注的词性进行句法分析，来对句子中的词语语法功能进行分析，从而确定每个词在句子中的成分以及句子的结构。在对文本进行预处理之后，对句子进行实体抽取，抽取句子中的名词作为实体，从而确定句子中所涉及的对象。之后，根据所抽取的实体，对句子进行意图识别，以确定用户的意图。

如本领域中已知的，实体抽取采用基于例如词向量的方法，利用大量语料进行机器学习训练，并能通过手动添加实体的方法来优化模型表现。在本公开的实施例中，对语句经过实体抽取得到的表达式被称为模版。首先，利用分类器使用例如机器学习算法对具有已知意图的大量模版进行训练。经过训练，当接收到用户的输入并从其形成新的模版后，可以利用机器学习算法来自动估计该模版属于某个意图的概率，并选择概率最大的意图作为识别的意图。可以定期将新的模版加入训练模版以更新意图识别的模型。

在此之后，可以根据所抽取的实体和所识别的用户的意图来生成表示用户的意图的语义表示。图3是根据本公开的实施例的基于意图的语义表示的示意图。在本公开的一个实施例中，语义表示可以被表示为用户的意图和与该意图相关的一个或多个属性。如上文所讨论的，用户的意图可以是用户期望得到解答的问题。例如，用户的意图可以是“查询球员所属球队”，那么对应的属性至少可以包括“球员姓名”。另外，用户的意图可以是“查询球队的教练”，那么对应的属性至少可以包括“球队名”等。另外，用户的意图可以是“查询两人之间的关系”，那么对应的属性至少可以包括“人物1的姓名”和“人物2的姓名”等。另外，属性还可以包括查询所针对的时间段。例如，当用户的意图是“查询球员所属球队”时，属性可以包括“球员何时属于该球队”，当用户的意图是“查询球队的教练”时，属性可以包括“该教练何时执教该球队”，而当用户的意图是“查询两人之间的关系”时，属性可以包括“两人何时的关系”。在本公开的一些实施例中，用户的意图可以是陈述的某种事实或者状态。例如，用户的意图可以是“评价球员”、“评价球队”、“评价教练”等，对应的属性可以包括“球员姓名”、“球队名称”、“教练姓名”等。另外，类似地，属性也可以包括评价所针对的时间段。

本领域技术人员可以理解，以上提供的用户的意图和对应的属性是示例性的，并且意图和属性不被局限于以上示例，也可以包括其他各种意图和属性。

在本公开的实施例中，用户的意图和属性都可以通过对于用户的输入进行自然语言理解获得的实体来产生。但是，当某一属性无法通过对输入进行自然语言理解获得的实体得到时，可以通过一个或多个方式填充该属性。对于填充属性的方式，将在下文中详细描述。

除了以上内容之外，本领域技术人员已知的关于自然语言理解的所有内容都可以被结合在本公开中，被包括在本公开所讨论的范围内。

之后，在步骤S203，由处理器10利用知识图谱对语义表示进行处理，以生成答复。知识图谱(Knowledge graph)的概念对于本领域技术人员来说是已知的。知识图谱是一种结构化的语义知识库，用于以符号形式描述物理世界中的概念及其相互关系，其基本组成单位例如是“实体-关系-实体”三元组以及“实体-参数-值”三元组，实体间通过关系相互连接，构成网状的知识结构。也就是说，实体(或概念、事件等)构成了知识图谱中的节点，而实体间的各种关系构成了网络中的连线。相比于传统的信息检索方式，知识图谱的特点是具有推理能力(即，能够通过推理来实现信息的检索)以及能够以图形化方式展示经过分类整理的结构化知识。

图4是根据本公开的知识图谱的示意图。如图4所示，图中示出的各个实体(节点)包括“球队”、“球员”、“教练”、“国际联赛”、“国家队”等，而实体间的关系包括“效力”、“执教”、“兄弟”、“好朋友”等。另外，图中还包括实体的参数，例如，“国籍”、“进球数”、“助攻数”等以及对应的数值。图4中示出的实体、关系、参数等都是示意性的，并且本领域技术人员可以想到各种实体、关系、参数，它们都包括在本公开的范围内。此外，为了清楚，图4中仅示出了一部分实体、关系、参数，本领域技术人员可以想到可以向图中增加其他实体，并且每个实体之间可以具有各种关系，而每个实体也可以具有各种参数。

通过该知识图谱，可以直观地表示出为各个球队效力的球员和指导该球队的教练、球员之间的关系、教练之间的关系、球员的各种相关参数及其数值、球队的各种相关参数及其数值等等。根据图中示出的知识图谱，可以以图形化方式直观地展示关于示出的球队的各种知识，并且通过推理，可以从一个实体通过连接各个实体之间的关系确定另一个实体。

本领域技术人员可以明白，图4是中示出的节点、关系和参数等都是示意性的，根据本公开的实施例的知识图谱可以包括更多的节点、关系和参数，并且节点之间的关系可以更加复杂。另外，两个节点之间不局限于一个关系，而可以包括多种不同的关系。此外，在图4中示出的知识图谱的基础上，例如还可以增加表示时间的维度，以表示在各个不同时间段中节点之间的不同关系和参数。因此，根据本公开的实施例的知识图谱可以是非常庞大和复杂的，并且包括一维、二维、三维甚至更多维度的结构。

知识图谱的构建同样依赖于“实体-关系-实体”三元组以及“实体-参数-值”三元组的抽取。例如，可以利用自动手段(例如，深度神经网络等)或半自动(例如，人工干预的自动手段)从大量原始数据(例如，书籍、报纸、杂志、网页、各类数据库)中提取出知识要素，并进行三元组的抽取，并将其存入知识图谱中。在一些情况下，需要进一步进行知识融合，通过实体消歧(Entity Di sambiguation)和共指消解(Entity Resolution)来将名称不同的同一实体进行整合。

对于知识图谱的构建可以采取自上而下和自下而上而上2种方法。例如，对于球员和球队等重要节点采用自上而下的方法，即，从维基百科等高质量的数据源，提取本体信息加入知识库中。另外，对其他相对不那么重要的信息，采用自下而上的方法，从例如互联网上等公开的数据集合进行提取，选择置信度较高的信息，加入知识图谱。所构建的知识图谱的存储方式例如可以是资源描述框架(Resource Description Framework，RDF)或参数图(Property Graph)等。

除了以上内容之外，为了简洁，省略了本领域技术人员已知的各种构建知识图谱的技术，这些技术都被包括在本公开中并且可以应用到本公开的实施例中。

在本公开的一些实施例中，在步骤S203中，为了利用知识图谱对语义表示进行处理以生成答复，可以根据语义表示生成查询语句，并用查询语句对知识图谱进行查询，以生成答复。对知识图谱进行查询的语句例如可以是图数据库领域常用的Cypher语言或SPARQL语言等。通过用查询语句表示所生成的语义表示，并用查询语句对知识图谱进行查询，可以沿着知识图谱中的节点和关系得到答复。通过使用知识图谱来对语义表示进行处理，可以利用知识图谱的推理能力回答复杂和/或具有一定深度的问题。在下文中会提供用知识图谱来对语义表示进行处理的具体示例。

之后，在步骤S204，由处理器10根据答复进行自然语言生成来得到自然语言格式的输出。自然语言生成(Natural Language Generation,NLG)指的是用计算机能够理解和处理的方式来表示自然语言的意义，它也是自然语言处理(NLP)的一部分。简单来说，自然语言生成的目的是将计算机使用的语言转换成为人类使用的自然语言。本领域技术人员也已经熟悉和知晓自然语言生成的各种原理和常用手段。相比于自然语言理解，自然语言生成可以更加简单。例如，处理器10仅需要将所得到的答复简单提供给用户就可以了。因此，在此省略对于自然语言生成的具体解释，并且本领域技术人员已知的关于自然语言生成的所有内容都可以被结合在本公开中，被包括在本公开所讨论的范围内。自然语言格式的输出可以是由答复组成的文本、由语言合成所产生的语音或者由动画软件等生成的视频。

最后，在步骤S205，通过输入输出接口30将输出提供给用户。例如，可以通过显示设备将文本显示给用户、通过扬声器将语音播放给用户、通过显示器和扬声器将视频提供给用户等。

根据本公开的实施例，图2中所示的方法是用于垂直领域的。在本公开的实施例中，由于将对话限制在一个垂直领域，可以避免了同一名词在不同领域指代不同实体的情况，从而极大地减少实体提取中“实体消歧”和“共指消解”的难度。另外，还可以极大地减少构造知识图谱的难度和所构造的知识图谱的规模，并且极大地减少自然语言处理中识别意图和属性的难度。这样，在垂直领域应用本公开的实施例的方法能够答复复杂的问题。另外，由于使用了知识图谱来对语义表示进行处理来生成答复，可以利用知识图谱的推理能力来处理用户的输入，从而能够回答来自用户的更有深度的问题，使得用户可以与机器人针对该具体领域中的话题进行垂直的、有深度的对话。在下文中，结合下面的具体示例，可以更清楚地理解本公开的以上有益效果。在本公开中，以“单项运动领域”中的“足球领域”作为“垂直领域”的示例进行描述。但是，本领域技术人员可以理解，本公开的技术方案可以应用在各种“单项运动领域”中，例如，篮球领域、排球领域、橄榄球领域、羽毛球领域、乒乓球领域等。另外，本领域技术人也可以理解，除了“单项运动领域”，本公开的技术方案也可以应用在其他各种垂直领域，例如，演艺圈领域、历史领域、地理领域等。

接下来，结合图4来说明根据本公开的实施例的与用户对话的方法的具体示例。

示例1：

在步骤S201中，处理器10通过麦克风接收到用户用语言方式提供的自然语言格式的输入“球员A在哪个球队效力？”，并将该输入通过语音识别转换为文字。对于 “球员A”，即使在其它运动领域(例如，橄榄球领域、排球领域)也有多个同名的“球员A”，由于该实施例应用于垂直领域(足球领域)，所以不会发生误认为该球员A以及对应的球队是其它运动领域的球队的情况。所以，相比于开放领域的对话机器人，本公开的实施例减少了同一名词指向不同实体的情况，从而降低了语义识别的复杂度，并且在垂直领域应用本公开的实施例的方法能够答复复杂的问题。

之后，由处理器10对该文本进行预处理。例如，首先通过切词将该文本划分为独立的词或词组并对每个词进行词性标注。经过词性标注的文本可以被如下表示：

球员A/NN在/prep.哪个/r.球队/NN效力/v.？

其中，NN、prep.、r.和v.分别是名词、介词、代词和动词的英文缩写。

之后，根据所标注的词性进行句法分析，来确定每个词在句子中的成分以及句子的结构。经过句法分析的文本可以被如下表示：

球员A/Sub.在哪个球队/Obj.效力/Pred.？

其中，Sub.、Obj.和Pred.分别是主语、宾语和谓语的英文缩写。

在对文本进行预处理之后，由处理器10在步骤S202对文本进行实体抽取，抽取文本中的名词作为实体，从而确定句子中所涉及的对象。经过实体抽取的文本可以被如下表示：

球员A<Person>在哪个球队<Team>效力？

其中，<Person>和<Team>分别表示其前面的实体为人物和球队。

同时，对该文本进行意图识别，从而识别出的意图为“查询球员所属球队”。

之后，确定与该意图相关的属性为“姓名”，并且将“球员A”填充到该属性中。所得到的语义表示包括用户的意图“查询球员所属球队”和属性“球员A”。

接下来，由处理器10在步骤S203利用Cypher语句查询知识图谱，得到“球员A”所在球队。例如，查询语句为：

MATCH(:PERSON{name:"球员A"})-[:REL_BELONG_TO_TEAM]->(team:TEAM)

其中，“REL_BELONG_TO_TEAM”表示球员A与球队A的关系为“为该球队效力”。该查询语句的返回结果为：

RETURN team.team_name(返回结果:“球队A”)

所以，所得到的答复为“球队A”。

这也可以从图4中的相关部分中直观地得到：

之后，由处理器10在步骤S204根据答复进行自然语言生成来得到自然语言格式的输出。例如，所得到的自然语言格式的输出为“球员A在球队A踢球”。

最后，在步骤S205由处理器10通过显示器或扬声器将输出提供给用户。例如，在屏幕上显示“球员A在球队A踢球”、通过扬声器播放“球员A在球队A踢球”等。

上文中示出了以Cypher语言对知识图谱进行查询的示例，本领域技术人员可以明白对知识谱图进行查询的语句不局限于Cypher语言，还可以例如是SPARQL语言等。

当采用SPARQL语言时，查询知识图谱的语句为：

PREFIX football:<http://example.com/footaball/>

SELECT DISTINCT？x WHERE{

？player football:name"球员A"；

football:team？team.

？team football:clubName？x.

}

所得到的结果与Cypher语言的查询结果相同，都是“球队A”。

根据本公开的以上示例，完成了在足球运动的垂直领域的与用户的一次对话，针对用户的询问提供了自然语言格式的答复。与直接返回搜索结果的网页相比，极大地提升了答复准确度以及改善了用户体验。

本领域技术人员可以明白，以上示例仅仅是根据本申请的利用知识图谱的垂直领域聊天机器人的简单示例，并且通过下文中更复杂的示例，根据本申请的聊天机器人的特征和优点将会更加明显。

示例2：

在步骤S201中，处理器10通过麦克风接收到用户用语言方式提供的自然语言格式的输入“球员A的教练是谁？”，并将该输入通过语音识别转换为文字。关于该输入，从图4可以看到，“球员A”为“球队A”效力，而“球队A”由“教练A”执教，但是在“球员A”与“教练A”之间，并没有直接的连线来表明二者的关系。也就是说，在系统中存储的数据中，并没有记录二者之间的关系。此时，对于已有的聊天机器人，由于缺乏相应信息，所以可能无法正确答复这样的问题。但是对于根据本公开的实施例，通过按照如下所示的方式利用知识图谱，可以得到正确的答复，从而向用户提供合适的输出。

之后，由处理器10对该文本进行预处理。经过词性标注的文本可以被如下表示：

球员A/NN的/u.教练/NN是/v.谁/pron.？

其中，NN、u.、v.和pron.分别是名词、助词、动词和代词的英文缩写。

球员A的/Adj.教练/Sub.是/Pred.谁/Obj.？

其中，Adj.、Sub.、Obj.和Pred.分别是形容词、主语、宾语和谓语的英文缩写。

[球员A<Person>的教练]<Person>是谁<Person>？

其中，<Person>和<Name>分别表示其前面的实体为人。

同时，对该文本进行意图识别，从而识别出的意图为“查询球员的教练”。

之后，确定与该意图相关的属性为“球员ID”，并且将“球员A”填充到该属性中。所得到的语义表示包括用户的意图“查询球员的教练”和属性“球员A”。

接下来，由处理器10在步骤S203利用Cypher语句查询知识图谱，得到球员A的教练的姓名。例如，查询语句为：

MATCH(:PERSON{name:"球员A"})-[:REL_BELONG_TO_TEAM]->(team:TEAM)<-[:R EL_Coach]-(coach:Person)

在该查询语句中，通过MATCH语句首先查询该球员A所效力的球队，之后再查询该球队的教练，其中关系“[:REL_Coach]”表示球队与教练之间的关系为“球队由该教练执教”。通过以上查询语句并参照图4，可以看到通过在以上的查询语句中加入了利用知识图谱的一次推理过程，本公开的该实施例能够得到最后的答复。在该查询语句中，“REL_BELONG_TO_TEAM”表示球员A与球队A的关系为“为该球队效力”，而“REL_Coach”表示球队A的教练。该查询语句的返回结果为：

RETURN coach.name(查询结果为：“教练A”)

所以，所得到的答复为“教练A”。

这也可以从图4中的相关部分中直观地得到：

之后，由处理器10在步骤S204根据答复进行自然语言生成来得到自然语言格式的输出。例如，所得到的自然语言格式的输出为“球员A的教练为教练A”。

最后，在步骤S205由处理器10通过显示器或扬声器将输出提供给用户。例如，在屏幕上显示“球员A的教练为教练A”、通过扬声器播放“球员A的教练为教练A”等。

另外，当采用SPARQL语言时，查询知识图谱的语句为：

PREFIX football:<http://example.com/footaball/>

SELECT DISTINCT？x WHERE{

？player football:name"球员A"；

football:team？team.

？coach football:coach？team；

football:name？x.

}

所得到的结果与Cypher语言的查询结果相同，都是“教练A”。

根据本公开的以上示例，在生成答复的过程中在示例1的基础上进一步利用了知识图谱的推理能力，极大地提高了答复的深度和准确度，从而改善了用户体验。

另外，在得到答复之后，可以在知识图谱中产生新的三元组，将得到的新的关系存储在知识图谱中。例如，可以在知识图谱中增加以下三元组：

写入该三元组的Cypher语句例如可以是：

CREATE(:PERSON{name:"球员A"})<-[:REL_Coach]-(:PERSON{name:"教练A"})

为了提高知识图谱的数据的准确性，该三元组例如可以在询问用户“该答复是否有用？”并得到用户的肯定答复之后增加。在图4中，为了与知识图谱中的原三元组区分，新增加的三元组的连线用虚线表示。

通过根据与用户的对话来为知识图谱增加新的三元组，可以在用户的帮助下不断地补充、完善和增加知识图谱的内容，有利于知识图谱的管理。

示例3

如上文提到的，用户的输入也可以不是用户希望得到解答的问题，而可以是例如用户陈述的某种事实或者状态。

例如，在步骤S201中，处理器10通过麦克风接收到用户用语言方式提供的自然语言格式的输入“球员A的表现不错”，并将该输入通过语音识别转换为文字。之后，由处理器10对该文本进行预处理。例如，首先通过切词将该文本划分为独立的词或词组并对每个词进行词性标注。经过词性标注的文本可以被如下表示：

球员A/NN的/u.表现/NN不错/adj.

其中，NN、u和adj.分别是名词、助词和形容词的英文缩写。

球员A的/Adj.表现/Sub.不错/Pred.

其中，Adj.、Sub.和Pred.分别是形容词、主语、宾语和谓语的英文缩写。

球员A<Person>的表现不错？

其中，<Person>表示其前面的实体为人。

同时，对该文本进行意图识别，从而识别出的意图为“评价球员的表现”。

之后，确定与该意图相关的属性为“球员ID”，并且将“球员A”填充到该属性中。所得到的语义表示包括用户的意图“评价球员的表现”和属性“球员A”。

接下来，由处理器10在步骤S203利用Cypher语句查询知识图谱，查询与球员A的表现相关联的参数和数值。例如，可以查询该球员的进球数和助攻数。查询语句为：

MATCH(p:PERSON{name:"球员A"})

RETURN p.goal as goal,p.assist as assist

其中，“p.goal”和“p.assi st”分别表示球员A的进球数量和助攻数量，通过该MATCH语句获得这两个属性的对应数值。该查询语句的返回结果为：5,11。

所以，所得到的答复为“5个进球”和“11个助攻”。

这也可以从图4中的相关部分中直观地得到：

之后，由处理器10在步骤S204根据答复进行自然语言生成来得到自然语言格式的输出。例如，所得到的自然语言格式的输出为“球员A已经取得了5个进球和11个助攻的成绩”。

最后，在步骤S205由处理器10通过显示器或扬声器将输出提供给用户。例如，在屏幕上显示“球员A已经取得了5个进球和11个助攻的成绩”、通过扬声器播放“球员A已经取得了5个进球和11个助攻的成绩”等。

另外，当采用SPARQL语言时，查询知识图谱的语句为：

PREFIX football:<http://example.com/footaball/>

SELECT DISTINCT？n0？n1 WHERE{

？player football:name"球员A"；

football:goal？n0；

football:assist？n1.

}

所得到的结果与Cypher语言的查询结果相同，都是“5个进球”和“11个助攻”。

根据本公开的以上示例，完成了在足球运动的垂直领域的与用户的一次对话，针对用户陈述的某种事实或者状态提供了自然语言格式的答复。与直接返回搜索结果的网页相比，极大地提升了答复准确度以及改善了用户体验。

另外，通过对用户陈述的事实或状态进行答复，使得不仅可以回答用户提出的问题，还可以答复用户提出的除了问题之外的话题，改善了用户的感受。

根据本公开的另一个实施例，语义表示可以基于语法结构，并且对输入进行自然语言理解基本上包括实体抽取和语法结构识别两部分。实体抽取部分与上文中关于基于意图的语义表示的实体抽取类似，在此不再进行重复。在对输入进行切词、标注词性、确定句子成分并且抽取实体之后，根据所抽取的实体来识别输入的语法结构，并用所抽取的实体和所识别的语法结构来生成语义表示。

具体来说，用户的输入在经过切词、标注词性、确定句子成分并且抽取实体之后，可以根据例如依存语法分析将句子中的各个成分识别为具有不同的依存关系，从而揭示其语法结构。直观来讲，依存语法分析识别句子中的“主谓宾”、“定状补”这些语法成分，并分析各成分之间的关系。依存语法分析所包括的依存关系例如包括：主谓关系(SBV)、动宾关系(VOB)、间宾关系(IOB)、前置宾语(FOB)、兼语(DBL)、定中关系(ATT)、状中结构(ADV)、动补结构(CMP)、并列关系(COO)、介宾关系(POB)、左附加关系(LAD)、右附加关系(RAD)、独立结构(IS)、标点(WP)、核心关系(HED)等。通过提供这样的依存关系，可以表示出句子的语法结构。

在本公开的实施例中，对语句经过实体抽取得到的语法结构的表达式被称为模版。首先，利用分类器使用机器学习算法对具有已知语法结构的大量模版进行训练。经过训练，当接收到用户的输入并从其形成新的模版后，可以利用例如机器学习算法来自动估计该模版属于某个语法结构的概率，并选择概率最大的语法结构作为识别的语法结构。可以定期将新的模版加入训练模版以更新语法结构识别的模型。

在此之后，可以根据所抽取的实体和所识别的语法结构来生成表示用户的意图的语义表示。在本公开的一个实施例中，语义表示可以被表示为与所识别的语法结构对应的表达式。图5是根据本公开的实施例的基于语法结构的语义表示的示意图。为了清楚，图5中的表达式由图谱来表示。简单来说，由图谱表示的表达式是从整个知识图谱中截取的一小片段，包括一个或多个属性，并且这些属性对应于知识图谱中的例如实体、实体之间的关系、数值和对应的参数等。可以将输入的语法结构中的各个成分定位、放置或对齐到由图谱表示的表达式中的一个属性中，从而提供该输入的语义表示。其中，一个或多个属性是基于用户的输入而未知的并且因此由问号表示。由问号表示的属性中的至少一个可以作为被查询的对象。本领域技术人员可以理解如何根据由图谱表示的表达式生成查询语句，来对知识图谱进行查询。形象地说，这个过程类似于在知识图谱中查找符合表达式中的各个属性的关系的片段，并从查找到的片段中获得被查询对象的具体内容的过程。本领域技术人员可以明白，基于语法结构的语义表示可以由任何其他的形式来表示，只要其能够表示所识别的语法结构并且能够被用来产生查询知识图谱的查询语句即可。

与基于意图的语义表示相比，基于语法结构的语义表示不需要理解用户的意图，因此即使用户意图不明确、不容易表示或不容易理解或者预先没有获得针对该意图的模板，仍然可以对用户的输入进行处理，来得到合适的答复。

在本公开的实施例中，由知识图谱表示的表达式中的各个属性可以通过对于用户的输入进行自然语言理解来产生。但是，当某一属性无法通过对输入进行自然语言理解得到时，可以通过一个或多个方式填充该属性。对于填充属性的方式，将在下文中详细描述。

可以看出，图5中以最简单的“实体-关系-实体”三元组以及“实体-参数-值”三元组为例示出了由知识图谱表示的表达式的示例。本领域技术人员可以明白，由知识图谱表示的表达式可以具有各种其他更复杂的表达方式。下文中将结合具体示例提供由知识图谱表示的表达式的其他表达方式。

示例4

在步骤S201中，处理器10通过麦克风接收到用户用语言方式提供的自然语言格式的输入“球员A在哪个球队效力？”，并将该输入通过语音识别转换为文字。

之后，由处理器10在步骤S202对文本进行切词、词性标注、依存语法分析、实体抽取等。

经过依存语法分析的文本可以如图6所示。

对应的由知识图谱表示的表达式为：

之后，根据该表达式，用Cypher或SPARQL语言生成查询语句来查询知识图谱，可以得到答复为“球队A”。

示例5：

在步骤S201中，处理器10通过麦克风接收到用户用语言方式提供的自然语言格式的输入“球员A的教练是谁？”，并将该输入通过语音识别转换为文字。

经过依存语法分析的文本可以如图7所示。

对应的由知识图谱表示的表达式为：

之后，根据该表达式，用Cypher或SPARQL语言生成查询语句来查询知识图谱，可以得到答复为“教练A”。

在本公开的实施例中，在有些情况下，对于基于意图的语义表示和基于语法结构的语义表示来说，语义表示的某一属性可能无法通过对输入进行自然语言理解直接得到。例如，在一些情况下，用户的输入可能并不直接包括所涉及的实体，而是通过描述间接引出了所涉及的实体。例如，用户的输入可以是“球队A的教练”和“球员A的兄弟”等等。在这种情况下，无法直接根据用户输入来确定“球队A的教练”和“球员A的兄弟”所涉及的实体到底是什么。在另一些情况下，即使能够在用户的输入中直接获得所涉及的实体，但是因为队员、教练、球队等实体经常存在同名的情况、同一实体采用不同名称缩写或别名的情况、同一个外文名称对应不同中文翻译的情况等，可能仍然无法确定该实体对应于知识图谱中的哪一个实体。在另一些情况下，可能接收到的用户的语句不完整、不清楚，使得无法完全正确理解用户的意思，自然也无法获得语义表示的一些属性。

很明显，已有的聊天机器人无法应对这样的情况，不能提供给用户合适的答复。但是，根据本申请的实施例的聊天机器人可以根据用户的输入，利用知识图谱的推理能力对语义表示进行处理，确定该属性，从而能够进一步提供恰当的答复。

因此，当语义表示的某一属性无法通过对输入进行自然语言理解直接得到时，需要通过各种方式获得该属性。以下根据本公开的实施例对获取属性的各种方式进行说明。

根据本公开的一些实施例，当语义表示的某一属性不能通过对输入进行自然语言理解直接得到时，可以根据用户的输入，利用知识图谱对语义表示进行处理，确定该属性。例如，可以直接从知识谱图中存储的三元组中得到该属性，或者利用知识图谱的推理能力，从用户的输入经过若干步推理得到该属性。以下提供关于利用知识图谱确定该属性的示例。

本公开中用来确定属性的方式既可以应用到基于意图的语义表示，又可以应用到基于语法的语义表示。

示例6

在步骤S201中，处理器10通过麦克风接收到用户用语言方式提供的自然语言格式的输入“球队A的教练和球队B的教练是什么关系？”，并将该输入通过语音识别转换为文字。关于该输入，从图4可以看到，“球队A”的教练是“教练A”而“球队B”的教练是“教练B”，但是在用户的输入中，并没有直接询问“教练A和教练B是什么关系？”。此时，对于已有的聊天机器人，由于缺乏相应信息，所以可能无法正确答复这样的问题。但是对于根据本公开的实施例，通过按照如下所示的方式利用知识图谱，可以得到正确的答复，从而向用户提供合适的输出。

球队A/NN的/u.教练/NN和/conj.球队B/NN的/u.教练/NN是/v.什么/pron.关系/NN？

其中，NN、conj.、v.和pron.分别是名词、连词、动词、介词和代词的英文缩写。

球队A的/Adj.教练/Sub.和球队B的/Adj.教练/Sub.是/Pred.什么关系/Obj.？

[球队A<Team>的教练]<Person>和[球队B<Team>的教练]<Person>是什么关系<Relation>？

其中，<Team>、<Person>和<Relation>分别表示其前面的实体为球队、人物和关系。

同时，对该文本进行意图识别，从而识别出的意图为“查询两人之间的关系”。

之后，确定与该意图相关的属性为两者的“姓名”。在该示例中，用户的输入中仅提供了“球队A的教练”和“球队B的教练”，并没有提供两个教练的姓名，因此，无法通过对用户的输入的自然语言理解来填充两个教练的“姓名”的属性。

为了填充该属性，在本公开的该示例中，在利用知识图谱对语义表示进行处理时，利用知识图谱来得到该属性。

具体来说，由处理器10利用Cypher语句查询知识图谱，得到球队A的教练的姓名。例如，查询语句为：

MATCH(:TEAM{name:"球队A"})<-[:REL_Coach]-(person:PERSON)

RETURN person.name(返回结果：教练A)

在该查询语句中，通过知识图谱查询了球队A的教练，其中，“REL_Coach”表示球队的教练。

所以，所得到的结果为“教练A”。因此，将“教练A”填充到第一个教练的“姓名”的属性中。类似地，通过知识图谱查询球队B的教练，所得到的结果为“教练B”，并将“教练B”填充到第二个教练的“姓名”的属性中。最终，所得到的语义表示包括用户的意图“查询两人之间的关系”和属性“教练A”、“教练B”。

接下来，由处理器10在步骤S203中利用Cypher语句查询知识图谱，得到“教练A”和“教练B”之间的关系。例如，查询语句为：

MATCH(:PERSON{name:"教练A"})-[rel]->(:PERSON{name:"教练B"})

RETURN rel.label(返回结果：“Good friends”)

在该查询语句中，通过用MATCH语句和连接两个节点的符号“-[]->”直接查询了两个节点“教练A”和“教练B”之间的关系。该查询语句的返回结果为“Good friends”。

所以，所得到的答复为“好友关系”。

这也可以从图4中的相关部分中直观地得到：

之后，由处理器10在步骤S204根据答复进行自然语言生成来得到自然语言格式的输出。例如，所得到的自然语言格式的输出为“球队A的教练和球队B的教练是好友关系”。

最后，在步骤S205由处理器10通过显示器或扬声器将输出提供给用户。例如，在屏幕上显示“球队A的教练和球队B的教练是好友关系”、通过扬声器播放“球队A的教练和球队B的教练是好友关系”等。

除了以上内容的输出之外，自然语言格式的输出还可以是例如“教练A和教练B是好友关系”，从而省略了在填充属性时利用知识图谱进行推理的过程，而仅仅针对所识别的意图和所确定的属性来生成输出。这样有利于减少生成自然语言格式的输出时系统的负担，并且给用户提供直接的结果可以改善用户的体验。

另外，当采用SPARQL语言时，查询知识图谱的语句为：

PREFIX football:<http://example.com/footaball/>

SELECT DISTINCT？x WHERE{

？coach0 football:coach/football:clubName"球队A".

？coach1 football:coach/football:clubName"球队B".

？coach0？rel？coach1.

？rel？label？x.

}

所得到的结果与Cypher语言的查询结果相同，都是“好友关系”。

另外，也可以将基于语法结构的语义表示应用在该示例中。

该输入经过依存语法分析的文本可以如图8所示。

对应的由知识图谱表示的表达式为：

之后，根据该表达式，用Cypher或SPARQL语言生成查询语句来查询知识图谱，可以得到答复为“好友关系”。

根据本公开的以上示例，通过利用了知识图谱的推理能力来填充属性，极大地提高了答复的深度和准确度，从而改善了用户体验。

示例7

例如，用户的输入可以是“球队A和球队B的教练的战术很相似”。在这种情况下，由于用户没有直接询问关于“教练A”和“教练B”的问题，对于已有的聊天机器人，由于缺乏相应信息，所以可能无法正确答复这样的问题。但是对于根据本公开的实施例，通过按照如下所示的方式利用知识图谱，可以得到正确的答复，从而向用户提供合适的输出。

与以上的示例6类似地，通过自然语言理解，可以获得用户的意图是“评价两人之间的关系”，而与该意图相关的属性为两者的“姓名”。之后，与以上的示例6类似地，由处理器10利用Cypher语句查询知识图谱，得到球队A和球队B的教练的姓名，即，“教练A”和“教练B”。接下来，由处理器10利用Cypher语句查询知识图谱，得到“教练A”和“教练B”之间的关系，即，“好友关系”。最后，由处理器10根据答复进行自然语言生成来得到自然语言格式的输出。例如，所得到的自然语言格式的输出为“球队A和球队B的教练之间是好友关系”。

根据本公开的以上示例，进一步利用了知识图谱的推理能力，极大地提高了答复的深度和准确度，从而改善了用户体验。

示例8

在步骤S201中，处理器10通过麦克风接收到用户用语言方式提供的自然语言格式的输入“球员A的兄弟在哪个球队效力？”，并将该输入通过语音识别转换为文字。之后，由处理器10对该文本进行预处理。经过词性标注的文本可以被如下表示：

球员A/NN的/u.兄弟/NN在/prep.哪个/adv.球队/NN效力/v.？

其中，NN、u.、prep.、adv.和v.分别是名词、助词、介词、副词和动词的英文缩写。

球员A的/Adj.兄弟/Sub.在哪个球队/Obj.效力/Pred.

[球员A<Person>的兄弟]<Person>在哪个球队<Team>效力？

其中，<Team>和<Person>分别表示其前面的实体为球队和人物。

之后，确定与该意图相关的属性为“姓名”。与示例1不同，在该示例中，用户的输入中仅提供了“球员A”和“球员A的兄弟”的描述，并没有提供“球员A的兄弟”的姓名，因此，无法通过对用户的输入的自然语言理解来填充该属性。

具体来说，由处理器10利用Cypher语句查询知识图谱，得到球队A的兄弟的姓名。例如，查询语句为：

MATCH(:PERSON{name:"球员A"})-[:REL_BROTHER]->(person:PERSON)

RETURN person.name(返回结果：“球员B”)

在该查询语句中，通过知识图谱查询了球员A的兄弟，其中，“REL_BROTHER”表示球员A的兄弟。

所以，所得到的结果为“球员B”。因此，将“球员B”填充到该属性中。最终，所得到的语义表示包括用户的意图“查询球员所属球队”和属性“球员B”。

接下来，与示例1类似地，由处理器10在步骤S203中利用Cypher语句查询知识图谱，得到“球员B”所在的球队。例如，查询语句为：

MATCH(:PERSON{name:"球员B"})-[:REL_BELONG_TO_TEAM]->(team:TEAM)

RETURN team.team_name(返回结果：“球队B”)

其中，“REL_BELONG_TO_TEAM”表示球员B与球队B的关系为“为该球队效力”。

所以，所得到的答复为“球队B”。

这也可以从图4中的相关部分中直观地得到：

之后，由处理器10在步骤S204根据答复进行自然语言生成来得到自然语言格式的输出。例如，所得到的自然语言格式的输出为“球员B在球队B踢球”。

最后，在步骤S205由处理器10通过显示器或扬声器将输出提供给用户。例如，在屏幕上显示“球员B在球队B踢球”、通过扬声器播放“球员B在球队B踢球”等。

另外，当采用SPARQL语言时，查询知识图谱的语句为：

PREFIX football:<http://example.com/football/>

SELECT DISTINCT？x WHERE{

？player0 football:name"球员A"；

football:brother？player1.

？player1 football:team/football:clubName？x

}

所得到的结果与Cypher语言的查询结果相同，都是“球队B”。

另外，也可以将基于语法结构的语义表示应用在该示例中。

该输入经过依存语法分析的文本可以如图9所示。

对应的由知识图谱表示的表达式为：

之后，根据该表达式，用Cypher或SPARQL语言生成查询语句来查询知识图谱，可以得到答复为“球队B”。

在以上示例7和8中，为了描述方便，分别利用了两个Cypher语句来查询知识图谱，即，利用第一个Cypher语句来查找和填充属性，而利用第二个Cypher语句来获得答复。但是，本领域技术人员可以明白以上的描述是为了方便理解本公开。实际上，在合适的情况下，这两个Cypher语句可以被合并为一个Cypher语句。例如，示例7的两个Cypher语句可以被合并为以下的一个Cypher语句：

MATCH(:TEAM{name:"球队A"})<-[:REL_Coach]-(person:PERSON)-->(:PERSON{name:"教练B"})

类似地，示例8中的两个Cypher语句可以被合并为以下的一个Cypher语句：

MATCH(:PERSON{name:"球员A"})-[:REL_BROTHER]->(person:PERSON)-[:REL_BELONG_TO_TEAM]->(team:TEAM)

通过整合查询过程和查询语句，有助于优化查询流程、提高系统的工作效率、改善用户体验。

示例9

在步骤S201中，处理器10通过麦克风接收到用户用语言方式提供的自然语言格式的输入“国际联赛的哪个球队的门将也是国家队球队B的队员？”，并将该输入通过语音识别转换为文字。

很明显，以上语句非常复杂，并且没有提供答复该问题所需的信息。对于已有的聊天机器人，由于这样的复杂程度和信息的缺乏，可能无法正确答复这样的问题。但是对于根据本公开的实施例，通过按照如下所示的方式利用知识图谱，可以得到正确的答复，从而向用户提供合适的输出。

经过依存语法分析的文本可以如图10所示。

对应的由知识图谱表示的表达式如图11所示。

之后，由处理器10在步骤S204根据答复进行自然语言生成来得到自然语言格式的输出。例如，所得到的自然语言格式的输出为“球队A的门将也是国家队球队B的队员”或者“球队A的门将球员C也是国家队球队B的队员”等。

最后，在步骤S205由处理器10通过显示器或扬声器将输出提供给用户。例如，在屏幕上显示“球队A的门将也是国家队球队B的队员”、通过扬声器播放“球队A的门将也是国家队球队B的队员”等。

此外，本示例也可以应用基于用户的意图的语义表示，在此省略对其的描述。

示例10

例如，用户的输入可以是“球员A的兄弟的表现太差了”。在这种情况下，由于用户没有直接询问关于“球员B”(球员A的兄弟)的问题，对于已有的聊天机器人，由于缺乏相应信息，所以可能无法正确答复这样的问题。但是对于根据本公开的实施例，通过按照如下所示的方式利用知识图谱，可以得到正确的答复，从而向用户提供合适的输出。

与以上的示例3类似地，通过自然语言理解，可以获得用户的意图是“评价球员的表现”，而与该意图相关的属性为“姓名”。之后，与以上的示例8类似地，由处理器10利用Cypher语句查询知识图谱，得到球员A的兄弟的姓名，即，“球员B”。接下来，与示例3类似地，由处理器10利用Cypher语句查询知识图谱，查询与球员B的表现相关联的参数和数值。例如，可以查询该球员B的进球数和助攻数。所得到的答复为“2个进球”和“4个助攻”。最后，由处理器10根据答复进行自然语言生成来得到自然语言格式的输出。例如，所得到的自然语言格式的输出为“球员B已经取得了2个进球和4个助攻的成绩”。

根据本公开的一些实施例，用来确定属性的方式除了根据输入，利用知识图谱确定该属性之外，还可以有以下方式。

根据本公开的一些实施例，当语义表示的某一属性不能通过对输入进行自然语言理解直接得到时，可以为该属性设置默认值。例如，当用户的输入中未指定与输入相关联的时间时，可以默认用户的输入涉及当前赛季或今年的比赛。例如，当用户的输入中提到的球员可能涉及重名的多个球员时，可以默认用户的输入涉及这些球员中最著名的那一个球员。

根据本公开的一些实施例，当语义表示的某一属性不能通过对输入进行自然语言理解直接得到时，可以根据当前时间点之前和/或之后一段时间内发生的事件来确定该属性。例如，当用户的输入涉及多个球员时，如果当前时间点、当前时间点之前一段时间内和/或当前时间点之后一段时间内发生了与这些球员中的一个球员相关联的事件，那么确定该属性为该球员。一段时间例如可以是一小时、一天、一周、一个月、一个赛季或一年，相关联的事件可以是该球员参加的比赛、该球员参加的其他活动、与该球员相关联的其他新闻事件等。例如，在一个属性对应多个球员的情况下，如果在接收到用户的输入时，正在进行有某一球员参加的比赛，那么确定该属性为这一个球员。

根据本公开的一些实施例，当语义表示的某一属性不能通过对输入进行自然语言理解直接得到时，可以通过用户的输入的上下文确定该属性。例如，用户在对话的过程中，在上文中提到或讨论过某一球队，那么在一个属性对应多个球队或多个球员的情况下，确定该属性为上文讨论过的那个球队或该球队的球员。

根据本公开的一些实施例，当语义表示的某一属性不能通过对输入进行自然语言理解直接得到时，可以根据该用户的简档确定该属性。例如，可以建立用户的简档，记录该用户的各种参数。例如，用户所在的位置、用户所关心的球队、用户所关心的球员、用户不喜欢的球队、用户不喜欢的球员、用户用来指代球队或球员的代号和/或昵称等。根据用户简档，在某一属性有多个可能选项时，可以确定该属性应当对应哪一个选项。例如，当用户提到的球队或球员可能有多个对应的选项时，可以确定属性应当是用户所在的位置的球队、用户所关心的球队或用户所关心的球员。或者，当用户提到的球队或球员可能有多个对应的选项时，可以从这些选项中排除掉用户不喜欢的球队或球员。或者，可以根据用户常用的代号和/或昵称来确定属性所对应的球队或球员。

根据本公开的一些实施例，当语义表示的某一属性不能通过对输入进行自然语言理解直接得到时，可以生成针对该属性的询问，根据询问进行自然语言生成来得到输出，将输出提供给用户，并从用户接收针对该询问的输入。换句话说，可以通过对用户进行追问来确定该属性。例如，当用户提到的球队或球员可能有多个对应的选项时，可以向用户询问“您问的是XX球队吗？”或“您问的是XX球队的A吗？”等，并根据用户的针对该询问的输入来确定该属性。例如，询问的类型除了一般疑问句之外，还可以是选择疑问句，即，可以向用户询问“您问的是球队A、球队B还是球队C？”或“您问的是球员A、球员B还是球员C？”等。此外，选择疑问句中提供给用户的选项的顺序可以按照各个选项的概率来排列。例如，球队或球员的知名度越高、与问题的相关度越高，那么该选项的概率就越高，而概率高的选项将被排在更靠前的位置。

在本公开的一些实施例中，可以利用知识图谱来生成针对该属性的询问。例如，与上文的示例2类似地，当用户的输入是“球员A的教练是谁？”时，可以利用知识图谱来获得球员A的球队是“球队A”，之后，可以向用户询问“您问的是球队A的教练吗？”。例如，与上文的示例6类似地，当用户的输入是“球队A的教练和球队B的教练B之间是什么关系？”时，可以利用知识图谱来获得球队A的教练是“教练A”而球队B的教练是“教练B”，之后，可以向用户询问“您问的是教练A和教练B之间的关系吗？”。很明显，通过利用知识图谱来生成询问，可以极大地改善与用户沟通的效率，改善用户的体验。

本领域技术人员可以理解，以上提到的获取属性的各种方式都是示例性的，并且可以通过各种其它方式来确定语义表示的属性，例如，可以知识图谱领域中的各种“实体消歧”和“共指消解”技术等来确定属性。

另外，本领域技术人员可以理解，以上提到的确定语义表示的属性的各种方式可以彼此结合。例如，可以从通过上文提到的各种方式确定的参数出发来利用知识图谱最终确定属性。例如，可以将通过上文提到的各种方式分别确定的属性彼此结合，来确定属性。例如，可以根据通过上文提到的各种方式确定的属性的选项来生成询问，并根据用户针对该询问的输入来确定属性。

上文中利用Cypher语言和SPARQL语言为例描述了对知识图谱进行查询的语句，但是本领域技术人员可以明白，图数据库领域中的任何其他语言都可以用在本公开中对知识图谱进行查询。

另外，虽然在本公开的实施例中讨论了基于意图的语义表示和基于语法结构的语义表示，但是本领域技术人员也可以理解，语义表示可以具有其他各种表达方式，并且这些表达方式都被包括在本公开中并且可以应用到本公开的实施例中。另外，在本公开的一些实施例中，这些语义表示的各种表达方式可以彼此结合使用。例如，针对用户的输入，可以首先使用基于意图的语义表示进行处理，并且例如在不能识别用户的意图时，再使用基于语法结构的语义表示来进行处理。

另外，虽然在本公开的实施例中仅讨论了利用知识图谱对语义表示进行处理以生成答复的情况，但是本公开的实施例也可以结合本领域中已知的各种技术(例如，数据库、搜索引擎等)来针对用户的输入生成答复。这些技术也被结合在本公开中，作为本公开的一部分并且可以应用到本公开的实施例中。

在说明书及权利要求中的词语“之前”、“之后”等，如果存在的话，用于描述性的目的而并不一定用于描述不变的相对位置。应当理解，这样使用的词语在适当的情况下是可互换的，使得在此所描述的本公开的实施例，例如，能够在与在此所示出的或另外描述的那些取向不同的其他取向上操作。

如在此所使用的，词语“示例性的”意指“用作示例、实例或说明”，而不是作为将被精确复制的“模型”。在此示例性描述的任意实现方式并不一定要被解释为比其它实现方式优选的或有利的。而且，本公开不受在上述技术领域、背景技术、发明内容或具体实施方式中所给出的任何所表述的或所暗示的理论所限定。

另外，仅仅为了参考的目的，还可以在下面描述中使用某种术语，并且因而并非意图限定。例如，除非上下文明确指出，否则涉及结构或元件的词语“第一”、“第二”和其它此类数字词语并没有暗示顺序或次序。

还应理解，“包括/包含”一词在本文中使用时，说明存在所指出的特征、整体、步骤、操作、单元和/或组件，但是并不排除存在或增加一个或多个其它特征、整体、步骤、操作、单元和/或组件以及/或者它们的组合。

相关领域普通技术人员应当意识到，在上述操作/步骤之间的边界仅仅是说明性的。多个操作/步骤可以结合成单个操作/步骤，单个操作/步骤可以分布于附加的操作/步骤中，并且操作/步骤可以在时间上至少部分重叠地执行。而且，另选的实施例可以包括特定操作/步骤的多个实例，并且在其他各种实施例中可以改变操作/步骤顺序。但是，其它的修改、变化和替换同样是可能的。因此，本说明书和附图应当被看作是说明性的，而非限制性的。

虽然已经通过示例对本公开的一些特定实施例进行了详细说明，但是相关领域普通技术人员应该理解，以上示例仅是为了进行说明，而不是为了限制本公开的范围。在此公开的各实施例可以任意组合，而不脱离本公开的精神和范围。相关领域普通技术人员还应理解，可以对实施例进行多种修改而不脱离本公开的范围和精神。本公开的范围由所附权利要求来限定。

Claims

一种由计算机实施的与用户对话的方法，包括：

从用户接收自然语言格式的输入；

对输入进行自然语言理解并生成语义表示；

利用知识图谱对语义表示进行处理，以生成答复；

根据答复进行自然语言生成来得到自然语言格式的输出；以及

将输出提供给用户，

其中，所述方法用于垂直领域。
根据权利要求1所述的方法，其中，所述输入包括用户希望得到解答的问题和用户陈述的事实或状态。
根据权利要求1所述的方法，其中，所述语义表示是基于用户的意图的，对输入进行自然语言理解并生成语义表示的步骤包括从所述输入抽取实体以及识别用户的意图，并根据所抽取的实体和所识别的用户的意图来生成语义表示。
根据权利要求3所述的方法，其中，语义表示包括用户的意图和一个或多个属性。
根据权利要求1所述的方法，其中，所述语义表示是基于语法结构的，对输入进行自然语言理解并生成语义表示的步骤包括对所述输入进行实体抽取以及识别输入的语法结构，并用所抽取的实体和所识别的语法结构来生成语义表示。
根据权利要求5所述的方法，其中，语义表示包括与所识别的语法结构对应的表达式，并且所述表达式包括一个或多个属性。
根据权利要求4或6所述的方法，其中，在对输入进行自然语言理解并生成语义表示的步骤中，当某一属性无法通过对输入进行自然语言理解直接得到时，通过以下一个或多个方式获得该属性：

为该属性设置默认值；

根据所述输入，利用知识图谱确定该属性；

根据当前时间点、当前时间点之前一段时间内和/或当前时间点之后一段时间内发生的事件来确定该属性；

通过所述输入的上下文确定该属性；

根据该用户的简档确定该属性；和

生成针对该属性的询问，根据询问进行自然语言生成来得到输出，将输出提供给用户，并从用户接收针对该询问的输入。
根据权利要求7所述的方法，其中，利用知识图谱来生成针对该属性的询问。
根据权利要求1所述的方法，其中，利用知识图谱对语义表示进行处理以生成答复的步骤包括根据语义表示生成查询语句，并用查询语句对知识图谱进行查询，以生成答复。
根据权利要求1所述的方法，其中，所述输入和所述输出分别是自然语言格式的语音、视频和文字中的至少一个。
根据权利要求1所述的方法，其中，所述垂直领域包括单项运动领域。
根据权利要求11所述的方法，其中，所述单项运动领域包括足球领域、篮球领域、排球领域、橄榄球领域、羽毛球领域和乒乓球领域中的一个或多个。
一种计算机系统，包括：

输入\输出接口，被配置为从用户接收自然语言格式的输入并向用户提供自然语言格式的输出；

处理器；以及

存储器，其被配置为耦合到处理器并存储计算机程序，其中，处理器被配置为执行该程序以执行以下操作：

从用户接收自然语言格式的输入；

对输入进行自然语言理解并生成语义表示；

利用知识图谱对语义表示进行处理，以生成答复；

根据答复进行自然语言生成来得到自然语言格式的输出；以及

将输出提供给用户，

其中，所述方法用于垂直领域。
根据权利要求13所述的计算机系统，其中，所述输入包括用户希望得到解答的问题和用户陈述的事实或状态。
根据权利要求13所述的计算机系统，其中，所述语义表示是基于用户的意图的，并且在对输入进行自然语言理解并生成语义表示的操作中，处理器被进一步配置为从所述输入抽取实体以及识别用户的意图，并根据所抽取的实体和所识别的用户的意图来生成语义表示。
根据权利要求15所述的计算机系统，其中，语义表示包括用户的意图和与意图相关的一个或多个属性。
根据权利要求13所述的计算机系统，其中，所述语义表示是基于语法结构的，在对输入进行自然语言理解并生成语义表示的操作中，处理器被进一步配置为对所述输入进行实体抽取以及识别输入的语法结构，并用所抽取的实体和所识别的语法结构来生成语义表示。
根据权利要求17所述的计算机系统，其中，语义表示包括与所识别的语法结构对应的表达式，并且所述表达式包括一个或多个属性。
根据权利要求16或18所述的计算机系统，其中，在对输入进行自然语言理解并生成语义表示的操作中，处理器被配置为当语义表示的某一属性无法通过对输入进行自然语言理解得到时，通过以下一个或多个方式获得该属性：

为该属性设置默认值；

根据所述输入，利用知识图谱确定该属性；

根据当前时间点、当前时间点之前一段时间内和/或当前时间点之后一段时间内发生的事件来确定该属性；

通过所述输入的上下文确定该属性；

根据该用户的简档确定该属性；和

生成针对该属性的询问，根据询问进行自然语言生成来得到输出，将输出提供给用户，并从用户接收针对该询问的输入。
根据权利要求19所述的计算机系统，其中，利用知识图谱来生成针对该属性的询问。
根据权利要求13所述的计算机系统，其中，利用知识图谱对语义表示进行处理以生成答复包括根据语义表示生成查询语句，并用查询语句对知识图谱进行查询，以生成答复。
根据权利要求13所述的计算机系统，其中，所述输入和所述输出分别是自然语言格式的语音、视频和文字中的至少一个。
根据权利要求13所述的计算机系统，其中，所述垂直领域包括单项运动领域。
根据权利要求23所述的计算机系统，其中，所述单项运动领域包括足球领域、篮球领域、排球领域、橄榄球领域、羽毛球领域和乒乓球领域中的一个或多个。