CN110162600A - 一种信息处理的方法、会话响应的方法及装置 - Google Patents

一种信息处理的方法、会话响应的方法及装置 Download PDF

Info

Publication number
CN110162600A
CN110162600A CN201910419481.2A CN201910419481A CN110162600A CN 110162600 A CN110162600 A CN 110162600A CN 201910419481 A CN201910419481 A CN 201910419481A CN 110162600 A CN110162600 A CN 110162600A
Authority
CN
China
Prior art keywords
information
candidate
processed
antecedent
word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910419481.2A
Other languages
English (en)
Other versions
CN110162600B (zh
Inventor
熊昊奇
卢小东
曹云波
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201910419481.2A priority Critical patent/CN110162600B/zh
Publication of CN110162600A publication Critical patent/CN110162600A/zh
Application granted granted Critical
Publication of CN110162600B publication Critical patent/CN110162600B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/3332Query translation
    • G06F16/3335Syntactic pre-processing, e.g. stopword elimination, stemming
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Animal Behavior & Ethology (AREA)
  • Machine Translation (AREA)

Abstract

本申请公开了一种信息处理的方法,包括:获取第一待处理信息;若第一待处理信息中包括第一指代词,则从N组对话信息中获取候选先行词集合,其中,N组对话信息是与第一待处理信息相邻的对话信息,候选先行词集合包括至少一个候选先行词,候选先行词包括至少一个名词,N为大于或等于1的整数;通过信息处理模型获取候选先行词集合中候选先行词所对应的分类结果;根据候选先行词的分类结果,对第一待处理信息中的第一指代词进行消除,得到第二待处理信息。本申请还提供了一种会话响应的方法以及装置。本申请实施例能够提取到更贴近实际含义的候选先行词,从而提升指代消除的准确性。

Description

一种信息处理的方法、会话响应的方法及装置
技术领域
本申请涉及人工智能领域,尤其涉及一种信息处理的方法、会话响应的方法及装置。
背景技术
随着信息呈现爆炸式增长,人们对信息精确定位的需求促进了自然语言处理技术的研究,指代消除是自然语言理解中的重点和难点之一。指代是自然语言中常见的语言现象,对于简化表述,衔接上下文起着重要作用,但这也给计算机理解自然语言增加了难度。
目前,采用的指代消除方法主要依赖于词性特征,即通过词性特征提取指代词集合和候选先行词集合,然后基于笛卡尔积得到表述对,最后将每个表述对的特征输入到模型中,通过模型得到每个表述对的得分,将得分最高的先行词用于指代消除。
然而,根据词性特征提取所有名词作为候选先行词还存在这样的问题,比如,对于“蒲公英的约定”会被拆分成两个名词,即“蒲公英”和“约定”,使得这两个词语分别作为不同的候选先行词,从而导致指代错误。
发明内容
本申请实施例提供了一种信息处理的方法、会话响应的方法及装置,可以得到包括多个名词的候选先行词,使得提取到的候选先行词更贴近实际含义,从而提升指代消除的准确性。
有鉴于此,本申请第一方面提供一种信息处理的方法,包括:
获取第一待处理信息;
若所述第一待处理信息中包括第一指代词,则从N组对话信息中获取候选先行词集合,其中,所述N组对话信息是与所述第一待处理信息相邻的对话信息,所述候选先行词集合包括至少一个候选先行词,所述候选先行词包括至少一个名词,所述N为大于或等于1的整数;
通过信息处理模型获取所述候选先行词集合中所述候选先行词所对应的分类结果;
根据所述候选先行词的分类结果,对所述第一待处理信息中的所述第一指代词进行消除,得到第二待处理信息。
本申请第二方面提供一种会话响应的方法,包括:
获取第一待处理信息,其中,所述第一待处理信息包括指代词;
根据所述第一待处理信息,从N组对话信息中获取候选先行词集合,其中,所述N组对话信息是与所述第一待处理信息相邻的对话信息,所述对话信息包括请求信息以及响应信息,所述候选先行词集合包括至少一个候选先行词,所述候选先行词包括至少一个名词,所述N为大于或等于1的整数;
通过信息处理模型获取所述候选先行词集合中所述候选先行词所对应的分类结果;
根据所述候选先行词的分类结果,对所述第一待处理信息中的所述指代词进行消除,得到第二待处理信息;
展示会话响应信息,其中,所述会话响应信息为根据所述会话响应信息生成的。
本申请第三方面提供一种信息处理装置,包括:
获取模块,用于获取第一待处理信息;
所述获取模块,还用于若所述第一待处理信息中包括第一指代词,则从N组对话信息中获取候选先行词集合,其中,所述N组对话信息是与所述第一待处理信息相邻的对话信息,所述候选先行词集合包括至少一个候选先行词,所述候选先行词包括至少一个名词,所述N为大于或等于1的整数;
所述获取模块,还用于通过信息处理模型获取所述候选先行词集合中所述候选先行词所对应的分类结果;
消除模块,用于根据所述获取模块获取的所述候选先行词的分类结果,对所述第一待处理信息中的所述第一指代词进行消除,得到第二待处理信息。
在一种可能的设计中,在本申请实施例的第三方面的第一种实现方式中,
所述获取模块,具体用于获取所述N组对话信息,其中,所述对话信息包括请求信息以及响应信息;
从所述N组对话信息中提取实体信息集合,其中,所述实体信息集合包括至少一个实体信息,所述实体信息包括至少一个名词;
根据所述实体信息集合生成所述候选先行词集合。
在一种可能的设计中,在本申请实施例的第三方面的第二种实现方式中,
所述获取模块,具体用于检测所述实体信息集合中是否存在相同的实体信息;
若检测到所述实体信息集合中存在相同的实体信息,则对所述相同的实体信息进行合并处理,得到所述候选先行词集合;
若未检测到所述实体信息集合中存在相同的实体信息,则将所述实体信息集合作为所述候选先行词集合。
在一种可能的设计中,在本申请实施例的第三方面的第三种实现方式中,
所述获取模块,具体用于根据预置实体库对所述实体信息集合中的实体信息进行匹配,其中,所述预置实体库用于指示实体信息与语义信息的映射关系;
若所述实体信息集合中存在至少两个实体信息对应于相同的语义信息,则将所述至少两个实体信息进行合并处理,得到所述候选先行词集合;
若所述实体信息集合中的实体信息对应于不同的语义信息,则将所述实体信息集合作为所述候选先行词集合。
在一种可能的设计中,在本申请实施例的第三方面的第四种实现方式中,所述信息处理装置还包括生成模块;
所述获取模块,还用于从N组对话信息中获取候选先行词集合之后,从所述第一待处理信息中获取所述第一指代词所对应的上下文信息,其中,所述上下文信息包括第一信息和第二信息,所述第一信息为位于所述第一指代词之前的信息,所述第二信息为位于所述第一指代词之后的信息;
所述生成模块,用于根据所述候选先行词集合以及所述获取模块获取的所述上下文信息生成词序列集合,其中,所述词序列集合包括至少一个词序列,所述词序列与所述候选先行词具有对应关系;
所述获取模块,具体用于通过所述信息处理模型获取所述词序列集合中所述词序列所对应的分类结果。
在一种可能的设计中,在本申请实施例的第三方面的第五种实现方式中,
所述获取模块,具体用于通过所述信息处理模型中的嵌入层获取所述词序列所对应的词向量序列;
通过所述信息处理模型中的卷积层获取所述词向量序列所对应的第一特征数据;
通过所述信息处理模型中的最大池化层获取所述第一特征数据所对应的第二特征数据;
通过所述信息处理模型中的全连接层获取所述第二特征数据输出所述分类结果。
在一种可能的设计中,在本申请实施例的第三方面的第六种实现方式中,所述信息处理装置还包括确定模块以及训练模块;
所述获取模块,还用于通过信息处理模型获取所述候选先行词集合中所述候选先行词所对应的分类结果之前,获取待训练样本集合,其中,所述待训练样本集合包括待训练正样本以及待训练负样本,所述待训练正样本包括第一待训练信息、第一待训练指代词以及第一待训练先行词,所述第一待训练信息、所述第一待训练指代词与所述第一待训练先行词具有对应关系,所述待训练负样本包括第二待训练信息、第二待训练指代词以及第二待训练先行词,所述第二待训练信息、所述第二待训练指代词与所述第二待训练先行词不具有对应关系;
所述获取模块,还用于通过待训练信息处理模型获取所述待训练样本集合所对应的预测分类结果;
所述确定模块,用于根据所述获取模块获取的所述预测分类结果以及所述待训练样本集合所对应的真实分类结果,确定所述待训练信息处理模型所对应的模型参数;
所述训练模块,用于采用所述确定模块确定的所述模型参数对所述待训练信息处理模型进行训练,得到所述信息处理模型。
在一种可能的设计中,在本申请实施例的第三方面的第七种实现方式中,
所述获取模块,具体用于若所述第一待处理信息中还包括第二指代词,则从所述N组对话信息中获取所述候选先行词集合;
所述根据所述候选先行词的分类结果,对所述第一待处理信息中的所述第一指代词进行消除,得到第二待处理信息,包括:
根据所述候选先行词的分类结果,对所述第一待处理信息中的所述第一指代词以及所述第二指代词进行消除,得到第三待处理信息。
在一种可能的设计中,在本申请实施例的第三方面的第八种实现方式中,所述信息处理装置还包括生成模块以及展示模块;
所述生成模块,用于在所述消除模块根据所述候选先行词的分类结果,对所述第一待处理信息中的所述第一指代词进行消除,得到第二待处理信息之后,根据所述第二待处理信息生成会话响应信息;
所述展示模块,用于展示所述生成模块生成的所述会话响应信息。
本申请第四方面提供一种会话响应装置,包括:
获取模块,用于获取第一待处理信息,其中,所述第一待处理信息包括指代词;
所述获取模块,还用于根据所述第一待处理信息,从N组对话信息中获取候选先行词集合,其中,所述N组对话信息是与所述第一待处理信息相邻的对话信息,所述对话信息包括请求信息以及响应信息,所述候选先行词集合包括至少一个候选先行词,所述候选先行词包括至少一个名词,所述N为大于或等于1的整数;
所述获取模块,还用于通过信息处理模型获取所述候选先行词集合中所述候选先行词所对应的分类结果;
消除模块,用于根据所述获取模块获取的所述候选先行词的分类结果,对所述第一待处理信息中的所述指代词进行消除,得到第二待处理信息;
展示模块,用于展示会话响应信息,其中,所述会话响应信息为根据所述消除模块消除处理后所述会话响应信息生成的。
本申请第五方面提供一种终端设备,包括:存储器、收发器、处理器以及总线系统;
其中,所述存储器用于存储程序;
所述处理器用于执行所述存储器中的程序,包括如下步骤:
获取第一待处理信息;
若所述第一待处理信息中包括第一指代词,则从N组对话信息中获取候选先行词集合,其中,所述N组对话信息是与所述第一待处理信息相邻的对话信息,所述候选先行词集合包括至少一个候选先行词,所述候选先行词包括至少一个名词,所述N为大于或等于1的整数;
通过信息处理模型获取所述候选先行词集合中所述候选先行词所对应的分类结果;
根据所述候选先行词的分类结果,对所述第一待处理信息中的所述第一指代词进行消除,得到第二待处理信息;
所述总线系统用于连接所述存储器以及所述处理器,以使所述存储器以及所述处理器进行通信。
本申请第六方面提供一种终端设备,包括:存储器、收发器、处理器以及总线系统;
其中,所述存储器用于存储程序;
所述处理器用于执行所述存储器中的程序,包括如下步骤:
获取第一待处理信息,其中,所述第一待处理信息包括指代词;
根据所述第一待处理信息,从N组对话信息中获取候选先行词集合,其中,所述N组对话信息是与所述第一待处理信息相邻的对话信息,所述对话信息包括请求信息以及响应信息,所述候选先行词集合包括至少一个候选先行词,所述候选先行词包括至少一个名词,所述N为大于或等于1的整数;
通过信息处理模型获取所述候选先行词集合中所述候选先行词所对应的分类结果;
根据所述候选先行词的分类结果,对所述第一待处理信息中的所述指代词进行消除,得到第二待处理信息;
展示会话响应信息,其中,所述会话响应信息为根据所述会话响应信息生成的;
所述总线系统用于连接所述存储器以及所述处理器,以使所述存储器以及所述处理器进行通信。
本申请的第七方面提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述各方面所述的方法。
从以上技术方案可以看出,本申请实施例具有以下优点:
本申请实施例中,提供了一种信息处理的方法,首先获取第一待处理信息,如果第一待处理信息中包括第一指代词,则从N组对话信息中获取候选先行词集合,其中,N组对话信息是与第一待处理信息相邻的对话信息,候选先行词集合包括至少一个候选先行词,候选先行词包括至少一个名词,然后通过信息处理模型获取候选先行词集合中候选先行词所对应的分类结果,最后根据候选先行词的分类结果,对第一待处理信息中的第一指代词进行消除,得到第二待处理信息。通过上述方式,在确定候选先行词的时候不再局限于词性,而是考虑实体类型的候选先行词,由此,可以得到包括多个名词的候选先行词,使得提取到的候选先行词更贴近实际含义,从而提升指代消除的准确性。
附图说明
图1为本申请实施例中信息处理系统的一个架构示意图;
图2为本申请实施例中信息处理的方法一个流程示意图;
图3为本申请实施例中信息处理的方法一个实施例示意图;
图4为本申请实施例中信息处理模型的一个框架示意图;
图5为本申请实施例中会话响应的方法一个实施例示意图;
图6为本申请实施例中基于指代消除的人机对话一个界面示意图;
图7为本申请实施例中基于指代消除的人机对话另一个界面示意图;
图8为本申请实施例中信息处理装置的一个实施例示意图;
图9为本申请实施例中信息处理装置的另一个实施例示意图;
图10为本申请实施例中信息处理装置的另一个实施例示意图;
图11为本申请实施例中信息处理装置的另一个实施例示意图;
图12为本申请实施例中会话响应装置的一个实施例示意图;
图13为本申请实施例中终端设备的一个结构示意图;
图14为本申请实施例中服务器的一个结构示意图。
具体实施方式
本申请实施例提供了一种信息处理的方法、会话响应的方法及装置,可以得到包括多个名词的候选先行词,使得提取到的候选先行词更贴近实际含义,从而提升指代消除的准确性。
本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例例如能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“对应于”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
应理解,本申请所提供的信息处理的方法以及会话响应的方法可以应用于人工智能(Artificial Intelligence,AI),具体可以应用于自然语言处理(Natural LanguageProcessing,NLP),NLP是使用自然语言同计算机进行通讯的技术,因为处理自然语言的关键是要让计算机理解自然语言,所以自然语言处理又叫做自然语言理解(NaturalLanguage Understanding,NLU),一方面NLP是语言信息处理的一个分支,另一方面NLP是AI的核心课题之一。本申请所提供的信息处理的方法以及会话响应的方法还适用于基于NLP的人机对话场景,为了便于人机对话,大多数计算机操作系统都具有这个功能,操作人员通过各种命令与计算机对话,在对话过程中,计算机可能要求回答一些问题,给定某些参数或确定选择项。通过对话,人对计算机的工作给以引导或限定,监督任务的执行。该方式有利于将人的意图、判断和经验纳入计算机工作过程,增强计算机应用的灵活性,也便于软件编写。
在自然语言表达中,指代是一种重要的表达方式,它使得语言表达简洁连贯,然而在篇章中大量使用指代,增加了计算机对篇章理解的难度。指代消解的主要任务是识别篇章中对现实世界同一实体不同的表达的过程。从计算语言学的角度,指代消解可以看成是一个分类或者一个聚类的过程。分类的过程主要是判断实体表达之间是否指向同一个实体,聚类的过程主要是判断一个实体表达能否加入到指向某个实体的集合中。从数学的角度上来说,指代消解等同于判断一对实体表达对之间是否满足自反性、对称性以及传递性。句子中如果存在指代关系,抽象的语言单元称为照应语,而具体的实体被称为先行词。
为了便于理解,本申请提出了一种信息处理的方法,该方法应用于图1所示的信息处理系统,请参阅图1,图1为本申请实施例中信息处理系统的一个架构示意图,如图所示,客户端接收用户输入的待处理信息,该客户端可以是即时通信类应用,也可以是交互式应用,还可以是其他类型的应用。客户端根据用户输入的待处理信息进行指代消除,具体流程请参阅图2,图2为本申请实施例中信息处理的方法一个流程示意图,如图所示,步骤S1中,检测当前输入的待处理信息是否包含指代词,如果存在指代词,则进入步骤S2。在步骤S2中,从待处理信息相关的其他信息中提取实体信息,并且合并相同的实体信息。在步骤S3中,将提取到的实体信息作为候选先行词,再将候选先行词与指代词组成表述对。在步骤S4中,基于不同的表述对进行分词,将候选先行词与指代词的上下文组合生成词向量序列。在步骤S5中,将每一个表述对对应的向量序列输入至信息处理模型,由该信息处理模型输出分类结果。在步骤S6中,如果分类结果为“1”,则表示该候选先行词可以补充到指代词的位置上,完成指代消解。如果分类结果为“0”,则需要继续对下一组表述对对应的向量序列进行预测。
需要说明的是,客户端部署于终端设备上,其中,终端设备包含但不仅限于平板电脑、笔记本电脑、掌上电脑、手机、语音交互设备、可穿戴设备、机器人以及个人电脑(personal computer,PC),此处不做限定。其中,语音交互设备包含但不仅限于智能音响以及智能家电。
结合上述介绍,下面将对本申请中信息处理的方法进行介绍,请参阅图3,本申请实施例中信息处理的方法一个实施例包括:
101、获取第一待处理信息;
本实施例中,信息处理装置获取用户输入的第一待处理信息,其中,信息处理装置部署于终端设备上,且该信息处理装置可以表现为客户端的形式,也可以将信息处理装置部署于服务器上,服务器完成指代消除的处理后,通知客户端予以反馈。可以理解的是,用户可以通过终端设备的输入装置(比如键盘、手写板、触摸屏或者麦克风等)输入第一待处理信息,第一待处理信息表现为文本信息,且该第一处理信息可以表现为中文、英文、日文、法文以及德文等,本申请以中文文本为例进行说明,然而这不应理解为对本申请的限定。
102、若第一待处理信息中包括第一指代词,则从N组对话信息中获取候选先行词集合,其中,N组对话信息是与第一待处理信息相邻的对话信息,候选先行词集合包括至少一个候选先行词,候选先行词包括至少一个名词,N为大于或等于1的整数;
本实施例中,信息处理装置需要对第一待处理信息进行检测,如果检测到存在第一指代词,则从N组对话信息中获取候选先行词集合,其中,第一指代词即为第一待处理信息中的指示代词(demonstrative pronoun),第一指代词是用于指示人或事物的代词。指示代词与定冠词和人称代词一样,都具有指定的含义,用来起指示作用,或用来代替前面已提到过的名词。比如,中文文本为“我找到了这只皮夹子,哇,我找到了这个”,这里的“这个”即为“皮夹子”。又比如,英文文本为“I found this wallet.I found this”,这里的“this”即为“wallet”。
以一个对话场景为例,请参阅如下对话:
Q1:最近很喜欢听说唱,给我推荐一位歌手吧
R1:不如听听周杰伦的歌
Q2:好啊,杰伦最近有出新专辑吗
R2:近期正在准备出新专辑呢
Q3:那放一首周杰伦的歌吧
R3:好的,先来听听周杰伦的蒲公英的约定吧
Q4:再换一首他的晴天
基于上述对话场景,Q4中的“再换一首他的晴天”为用户当前输入的第一待处理信息,假设N为3,那么需要提取3组对话信息,其中,一组对话信息包括一个请求信息Q以及响应信息R,因此,3组对话信息即为“Q1和R1”、“Q2和R2”以及“Q3和R3”,从这些对话信息中获取候选先行词集合,候选先行词集合包括至少一个候选先行词,候选先行词包括至少一个名词,比如,从“Q1和R1”中提取的候选先行词为“说唱”、“歌手”以及“周杰伦”,从“Q2和R2”中提取的候选先行词为“杰伦”、“新专辑”和“新专辑”,从“Q3和R3”中提取的候选先行词为“周杰伦”、“周杰伦”以及“蒲公英的约定”。此时,第一指代词即为“再换一首他的晴天”中的“他”。
103、通过信息处理模型获取候选先行词集合中候选先行词所对应的分类结果;
本实施例中,信息处理装置对候选先行词集合中的候选先行词进行处理,假设候选先行词集合包括10个候选先行词,那么可以对这10个候选先行词均进行处理,也可以对其中的若干个候选先行词进行处理,处理的方式包括将不同的候选先行词分别代入到第一待处理信息中,从而对应的生成词序列,再对词序列进行向量化处理,得到词向量序列,将词向量序列输入至信息处理模型,由信息处理模型输出候选先行词所对应的分类结果。
104、根据候选先行词的分类结果,对第一待处理信息中的第一指代词进行消除,得到第二待处理信息。
本实施例中,信息处理装置得到候选先行词所对应的分类结果之后,判断该分类结果是否为第一结果,如果分类结果是第一结果,则将该候选先行词作为第一指代词,从而对第一待处理信息中的第一指代词进行消除,得到第二待处理信息。假设第一待处理信息为“再换一首他的晴天”,第一指代词为“他”,候选先行词为“周杰伦”,那么第二待处理信息为“再换一首周杰伦的晴天”。反之,如果分类结果为第二结果,则继续获取下一个候选先行词的分类结果,进而判断下一个候选先行词的分类结果是否属于第一结果。
可以理解的是,第一结果可以表示为“1”,也就是说,该候选先行词可替换指代词,第二结果可以表示为“0”,也就是说,该候选先行词不能替换指代词。
本申请实施例中,提供了一种信息处理的方法,首先获取第一待处理信息,如果第一待处理信息中包括第一指代词,则从N组对话信息中获取候选先行词集合,其中,N组对话信息是与第一待处理信息相邻的对话信息,候选先行词集合包括至少一个候选先行词,候选先行词包括至少一个名词,然后通过信息处理模型获取候选先行词集合中候选先行词所对应的分类结果,最后根据候选先行词的分类结果,对第一待处理信息中的第一指代词进行消除,得到第二待处理信息。通过上述方式,在确定候选先行词的时候不再局限于词性,而是考虑实体类型的候选先行词,由此,可以得到包括多个名词的候选先行词,使得提取到的候选先行词更贴近实际含义,从而提升指代消除的准确性。
可选地,在上述图3对应的实施例的基础上,本申请实施例提供的信息处理的方法第一个可选实施例中,从N组对话信息中获取候选先行词集合,可以包括:
获取N组对话信息,其中,对话信息包括请求信息以及响应信息;
从N组对话信息中提取实体信息集合,其中,实体信息集合包括至少一个实体信息,实体信息包括至少一个名词;
根据实体信息集合生成候选先行词集合。
本实施例中,将介绍一种提取候选先行词集合的方式。首先,信息处理装置获取与第一待处理信息相邻的N组对话信息,一组对话信息包括一个请求信息和一个响应信息,请求信息通常是由用户发起的,而响应信息通常是由机器反馈的。N可以设置为大于或等于1的整数,且为了使得指代的准确性更高,N组对话信息应与第一待处理信息具有较强的联系,比如为相邻的对话关系。
基于N组对话信息,可以采用命名实体识别(Named Entity Recognition,NER)工具提取这N组对话信息中的实体信息集合,其中,实体信息集合包括至少一个实体信息,实体信息包括至少一个名词,即实体信息不但可以包括名词,还可以包括短语。NER是信息提取、问答系统、句法分析以及机器翻译等应用领域的重要基础工具,在NLP技术走向实用化的过程中占有重要地位。一般来说,NER的任务可以识别出待处理信息中三大类(实体类、时间类和数字类)以及七小类(人名、机构名、地名、时间、日期、货币和百分比)的命名实体。NER工具的主要任务就是识别出文本信息中出现的专有名称和有意义的短语,并加以归类。在实际应用中,还可以提取其他的内容,比如专辑名称或者歌曲名称等,此次仅为一个示意,不应理解为对本申请的限定。
最后,信息处理装置根据提取到的实体信息集合生成候选先行词集合。
其次,本申请实施例中,提供了一种从N组对话信息中获取候选先行词集合的方法,获取N组对话信息,然后从N组对话信息中提取实体信息集合,最后根据实体信息集合生成候选先行词集合。通过上述方式,利用NER工具能够识别出实体信息,将实体信息作为候选先行词不局限于词组,还可以识别出短语或者专有名词等,从而提升指代的准确性。
可选地,在上述图3以及图3对应的第一个实施例的基础上,本申请实施例提供的信息处理的方法第二个可选实施例中,根据实体信息集合生成候选先行词集合,可以包括:
检测实体信息集合中是否存在相同的实体信息;
若检测到实体信息集合中存在相同的实体信息,则对相同的实体信息进行合并处理,得到候选先行词集合;
若未检测到实体信息集合中存在相同的实体信息,则将实体信息集合作为候选先行词集合。
本实施例中,介绍一种合并相同实体信息的方法。首先,信息处理装置检测实体信息集合中是否存在相同的实体信息,如果存在,则需要对相同的实体信息进行合并处理,反之,则无需进行合并。
为了便于理解,以一个对话场景为例,请参阅如下对话:
Q1:最近很喜欢听说唱,给我推荐一位歌手吧
R1:不如听听周杰伦的歌
Q2:好啊,杰伦最近有出新专辑吗
R2:近期正在准备出新专辑呢
Q3:那放一首周杰伦的歌吧
R3:好的,先来听听周杰伦的蒲公英的约定吧
Q4:再换一首他的晴天
基于上述对话场景,从“Q1和R1”中提取的实体信息为“说唱”、“歌手”以及“周杰伦”,从“Q2和R2”中提取的实体信息为“杰伦”、“新专辑”和“新专辑”,从“Q3和R3”中提取的实体信息为“周杰伦”、“周杰伦”以及“蒲公英的约定”。其中,在“Q2和R2”中提取到两个相同的实体信息“新专辑”,并且在“Q3和R3”中提取到两个相同的实体信息“周杰伦”,因此,在候选先行词的时候仅使用一个“新专辑”以及一个“周杰伦”,对相同的实体信息进行合并处理。
再次,本申请实施例中,提供了一种根据实体信息集合生成候选先行词集合的方式,首先检测实体信息集合中是否存在相同的实体信息,若检测到实体信息集合中存在相同的实体信息,则对相同的实体信息进行合并处理,得到候选先行词集合,若未检测到实体信息集合中存在相同的实体信息,则将实体信息集合作为候选先行词集合。通过上述方式,可以将相同的实体信息进行合并处理,这样能够减少候选先行词的数量,从而提高算法的效率和准确率。
可选地,在上述图3以及图3对应的第一个实施例的基础上,本申请实施例提供的信息处理的方法第三个可选实施例中,根据实体信息集合生成候选先行词集合,可以包括:
根据预置实体库对实体信息集合中的实体信息进行匹配,其中,预置实体库用于指示实体信息与语义信息的映射关系;
若实体信息集合中存在至少两个实体信息对应于相同的语义信息,则将至少两个实体信息进行合并处理,得到候选先行词集合;
若实体信息集合中的实体信息对应于不同的语义信息,则将实体信息集合作为候选先行词集合。
本实施例中,介绍一种合并具有相同语义的实体信息的方法。首先,信息处理装置根据预置实体库对实体信息集合中的实体信息进行匹配,如果存在至少两个实体信息对应于相同的语义信息,则将至少两个实体信息进行合并处理。反之,则无需进行合并。
为了便于理解,以一个对话场景为例,请参阅如下对话:
Q1:最近很喜欢听说唱,给我推荐一位歌手吧
R1:不如听听周杰伦的歌
Q2:好啊,杰伦最近有出新专辑吗
R2:近期正在准备出新专辑呢
Q3:那放一首周杰伦的歌吧
R3:好的,先来听听周杰伦的蒲公英的约定吧
Q4:再换一首他的晴天
基于上述对话场景,从“Q1和R1”中提取的实体信息为“说唱”、“歌手”以及“周杰伦”,从“Q2和R2”中提取的实体信息为“杰伦”、“新专辑”和“新专辑”,从“Q3和R3”中提取的实体信息为“周杰伦”、“周杰伦”以及“蒲公英的约定”。其中,在“Q1和R1”以及“Q3和R3”中提取到实体信息“周杰伦”,在“Q2和R2”中提取到实体信息“杰伦”,通过匹配预置实体库可以确定“周杰伦”和“杰伦”是同一个语义。请参阅表1,表1为预置实体库的一个示意。
表1
由此可见,不同的实体信息可能对应同一个语义。采用距离指代词最近的候选先行词,补充到当前待处理信息中的指代词所在的位置,从而完成指代消解。
再次,本申请实施例中,提供了另一种根据实体信息集合生成候选先行词集合的方式,首先根据预置实体库对实体信息集合中的实体信息进行匹配,若实体信息集合中存在至少两个实体信息对应于相同的语义信息,则将至少两个实体信息进行合并处理,得到候选先行词集合,若实体信息集合中的实体信息对应于不同的语义信息,则将实体信息集合作为候选先行词集合。通过上述方式,通过上述方式,可以将具有相同含义的实体信息进行合并处理,这样能够减少候选先行词的数量,从而提高算法的效率和准确率。
可选地,在上述图3、图3对应的第一个至第三个实施例中任一项的基础上,本申请实施例提供的信息处理的方法第四个可选实施例中,从N组对话信息中获取候选先行词集合之后,还可以包括:
从第一待处理信息中获取第一指代词所对应的上下文信息,其中,上下文信息包括第一信息和第二信息,第一信息为位于第一指代词之前的信息,第二信息为位于第一指代词之后的信息;
根据候选先行词集合以及上下文信息生成词序列集合,其中,词序列集合包括至少一个词序列,词序列与候选先行词具有对应关系;
通过信息处理模型获取候选先行词集合中候选先行词所对应的分类结果,可以包括:
通过信息处理模型获取词序列集合中词序列所对应的分类结果。
本实施例中,介绍了一种获取分类结果的方法。在信息处理装置获取到候选先行词集合之后,需要需要指代词的上下文信息进行组合。具体地,假设第一待处理信息为“再换一首他的晴天”,第一指代词为“他”,上下文信息中的第一信息为“再换一首”,上下文信息中的第二信息为“的晴天”,候选先行词集合包括三个候选先行词,分别为“新专辑”、“周杰伦”以及“蒲公英的约定”。于是,基于上述内容可以包括三个词序列的词序列集合,即,生成词序列分别为“再换一首新专辑的晴天”,“再换一首周杰伦的晴天”,“再换一首蒲公英的约定的晴天”。
在得到词序列集合之后,信息处理装置可以对词序列集合中的每个词序列进行向量化处理,分别将词序列“再换一首新专辑的晴天”,“再换一首周杰伦的晴天”,“再换一首蒲公英的约定的晴天”输入至信息处理模型,由信息处理模型输出三个词序列对应的分类结果。
需要说明的是,在生成词序列之前还可以对文本信息进行分词处理,以“好的,先来听听周杰伦的蒲公英的约定吧”为例,分词后得到“好的/先/来/听听/周杰伦/的/蒲公英的约定/吧”。
进一步地,本申请实施例中,提供了一种确定分类结果的方法,即首先从第一待处理信息中获取第一指代词所对应的上下文信息,然后根据候选先行词集合以及上下文信息生成词序列集合,其中,词序列集合包括至少一个词序列,词序列与候选先行词具有对应关系,最后通过信息处理模型获取词序列集合中词序列所对应的分类结果。通过上述方式,为方案的实现提供了具体的依据,将不同的候选先行词替换指代词,进而得到词向量序列,从而有利于增强方案的实用性。
可选地,在上述图3对应的第四个实施例的基础上,本申请实施例提供的信息处理的方法第五个可选实施例中,通过信息处理模型获取词序列集合中词序列所对应的分类结果,可以包括:
通过信息处理模型中的嵌入层获取词序列所对应的词向量序列;
通过信息处理模型中的卷积层获取词向量序列所对应的第一特征数据;
通过信息处理模型中的最大池化层获取第一特征数据所对应的第二特征数据;
通过信息处理模型中的全连接层获取第二特征数据输出分类结果。
本实施例中,介绍了一种通过信息处理模型输出分类结果的方法。为了便于介绍,请参阅图4,图4为本申请实施例中信息处理模型的一个框架示意图,如图所示,假设词序列为“换一首周杰伦的晴天”,经过分词后得到五个词语,分别为“换”、“一首”、“周杰伦”、“的”以及“晴天”,将这些词语输入至嵌入(Embedding)层,得到长度为100的词向量,即图4最左边的5×100的句子矩阵,每行表示一个词向量,维度d=100,这个可以类比为图像中的原始像素点,这些词向量构成词向量序列。
可以理解的是,词向量可以利用在维基百科语料和线上对话语料离线训练得到,并且还可以在训练时实现微调(fine-tune)。
得到词向量序列输入中卷积层,其中,过信息处理模型包括长度为3、4和5的三种卷积核,且每种卷积核具有100个通道(channel),经过卷积层后得到第一特征数据,其中,文本是一维数据,因此在信息处理模型卷积时用的是一维卷积,一维卷积需要通过设计不同卷积核大小获取不同宽度的视野。通过信息处理模型中的卷积层获取词向量序列所对应的第一特征数据,即分别得到三种卷积核所对应的第一特征数据。接下来,再通过信息处理模型中的最大池化(Max Poolling)层获取第一特征数据所对应的第二特征数据,经过最大池化层之后不同长度特征数据都能变成定长的表示,比如都为100维度的特征数据,经过拼接(concat)层后得到第二特征数据,第二特征数据可以是300维的数据。最后,通过信息处理模型中的全连接(Full Connection)层获取第二特征数据输出分类结果,其中,全连接层的两层长度分别设置为100和2,第二特征数据经过全连接层,即可得到两个逻辑节点,逻辑节点经过softmax后得到二分类结果,即得到分类结果。
本申请采用的信息处理模型是基于文本卷积神经网络(text convolutionalneural networks,text-CNN)的模型,再对响应速度要求比较高的多轮对话系统中,text-CNN模型是一个很好的选择。应该实验可以表明text-CNN的速度比双向长短期记忆(Bi-directional Long Short-Term Memory,BiLSTM)快10倍以上。此外,由于人机对话中的待处理信息都不会太长,且语法结构比较简单,采用基于text-CNN对表述对分类,其效果与BiLSTM相当。综上,本申请采用的text-CNN的信息处理模型是应用于人机多轮对话领域的较好方法。
下面将介绍具体的实验内容,本申请所使用的实验数据集由人工标注的真实数据构造而成的。标注人员观察三句对话数据后,撰写一个包含指代词的待处理信息,然后将指代词和三句对话中的实体组合成分类样本。
请参阅表2,表2是本申请基于text-CNN的信息处理模型和BiLSTM分别在构造数据上的效果。
表2
BiLSTM text-CNN
准确率 0.9214 0.9297
召回率 0.9228 0.9131
综合评价指标 0.9221 0.9213
用时 6毫秒/样本 0.58毫秒/样本
由表2可知,text-CNN的准确率(Precision)高于BiLSTM的Precision,其中,Precision表示所有预测为1结果里面有多少是真实为1,text-CNN的召回率(Recall)稍低于BiLSTM的Recall,其中,Recall表示所有真实为1的有多少能够被成功预测为1。text-CNN的综合评价指标(F1score)略低于BiLSTM的F1score,其中,F1score表示偏斜集衡量指标。综上,可以看text-CNN效果相比BiLSTM基本相同,但是速度快10倍。
更进一步地,本申请实施例中,提供了一种基于信息处理模型获取分类结果的方法,首先通过信息处理模型中的嵌入层获取词序列所对应的词向量序列,然后通过信息处理模型中的卷积层获取词向量序列所对应的第一特征数据,再通过信息处理模型中的最大池化层获取第一特征数据所对应的第二特征数据,最后通过信息处理模型中的全连接层获取第二特征数据输出分类结果。通过上述方式,对于响应速度要求比较高的多轮对话系统中,基于text-cnn的信息处理模型能够更高效地得到分类结果,且采用本申请提供的信息处理模型设计方法,还可以进一步提升数据处理效率。
可选地,在上述图3、图3对应的第一个至第五个实施例中任一项的基础上,本申请实施例提供的信息处理的方法第六个可选实施例中,通过信息处理模型获取候选先行词集合中候选先行词所对应的分类结果之前,还可以包括:
获取待训练样本集合,其中,待训练样本集合包括待训练正样本以及待训练负样本,待训练正样本包括第一待训练信息、第一待训练指代词以及第一待训练先行词,第一待训练信息、第一待训练指代词与第一待训练先行词具有对应关系,待训练负样本包括第二待训练信息、第二待训练指代词以及第二待训练先行词,第二待训练信息、第二待训练指代词与第二待训练先行词不具有对应关系;
通过待训练信息处理模型获取待训练样本集合所对应的预测分类结果;
根据预测分类结果以及待训练样本集合所对应的真实分类结果,确定待训练信息处理模型所对应的模型参数;
采用模型参数对待训练信息处理模型进行训练,得到信息处理模型。
本实施例中,介绍了一种训练信息处理模型的方式。用于训练神经网络的待训练样本集合包括训练正样本以及待训练负样本,其中,待训练正样本包括第一待训练信息、第一待训练指代词以及第一待训练先行词,比如第一待训练信息为“换一首他的晴天”,第一待训练指代词是“他”,第一待训练先行词为“周杰伦”,即待训练正样本中各个信息之间是具有对应关系的。待训练负样本包括第二待训练信息、第二待训练指代词以及第二待训练先行词,比如,第二待训练信息为“换一首他的晴天”,第二待训练指代词是“他”,第二待训练先行词为“新专辑”,即待训练负样本中的信息不具有对应关系。
假设待训练正样本为1,待训练负样本为0,将待训练正样本以及待训练负样本分别输入至待训练信息处理模型,从而分别得到待训练正样本的预测分类结果,以及待训练负样本的预测分类结果。接下来采用损失函数(loss function)确定预测分类结果和真是分类结果之间的最小值,基于最小化的损失函数即可得到模型参数,采用模型参数对待训练信息处理模型进行训练,得到信息处理模型。
可以理解的是,对于一个模型训练,需要提前定义一个损失函数,来判断这个模型的输出是否是达到最优,而后面不断的优化求梯度下降,使得损失函数最小。
需要说明的是,本申请所采用的损失函数包含但不仅限于均方误差(mean-squareerror,MSE)损失函数、交叉熵损失函数以及平方绝对误差(Mean Absolute Error,MAE)。
再进一步地,本申请实施例中,提供了一种训练得到信息处理模型的方式,通过信息处理模型获取候选先行词集合中候选先行词所对应的分类结果之前,还可以获取待训练样本集合,然后通过待训练信息处理模型获取待训练样本集合所对应的预测分类结果,再根据预测分类结果以及待训练样本集合所对应的真实分类结果,确定待训练信息处理模型所对应的模型参数,最后采用模型参数对待训练信息处理模型进行训练,得到信息处理模型。通过上述方式,可以利用具有共指关系的正样本和不具有共指关系的负样本进行训练,从而得到更为可靠的信息处理模型,由此提升方案的可行性和实用性。
可选地,在上述图3、图3对应的第一个至第六个实施例中任一项的基础上,本申请实施例提供的信息处理的方法第七个可选实施例中,从N组对话信息中获取候选先行词集合,可以包括:
若第一待处理信息中还包括第二指代词,则从N组对话信息中获取候选先行词集合;
根据候选先行词的分类结果,对第一待处理信息中的第一指代词进行消除,得到第二待处理信息,包括:
根据候选先行词的分类结果,对第一待处理信息中的第一指代词以及第二指代词进行消除,得到第三待处理信息。
本实施例中,介绍了一种多指代消除的方法,如果在第一待处理信息中除了包括抵押指代词以外,还包括第二指代词,可以理解的是,确定指代词的方式也可以通过查表实现,请参阅表3,表3为预设指代词的一个示意。
表3
这个 这个版本 这个场景 这个地方
这个地区 这个电视剧 这个动画 这个歌曲
这个歌词 这个节目 这个剧 这首歌
这首歌曲 这些 这张专辑 这支歌
他们
假设第一待处理信息为“他的这首歌是哪一年发行的”,通过查表3可以看出,“他”和“这首歌”均为指代词,即第一指代词可以是“他”,第二指代词可以是“这首歌”,基于多个指代词的情况,首先针对第一指代词进行指代消除,然后再对第二指代词进行指代消除,最后得到第三待处理信息,即“周杰伦的蒲公英的约定是哪一年发行的”。
其次,本申请实施例中,提供了一种多个指代词进行指代消除的方法,若第一待处理信息中还包括第二指代词,则从N组对话信息中获取候选先行词集合,再根据候选先行词的分类结果,对第一待处理信息中的第一指代词以及第二指代词进行消除,得到第三待处理信息。通过上述方式,在实际应用中,在用户发起的待处理信息中往往会包括多个指代词,为了能够更加准确地识别用户的需求,可以对待处理信息中所有的指代词均进行相应的操作,达到指代消解的效果,从而提升方案的可行性和可操作性。
可选地,在上述图3、图3对应的第一个至第七个实施例中任一项的基础上,本申请实施例提供的信息处理的方法第八个可选实施例中,根据候选先行词的分类结果,对第一待处理信息中的第一指代词进行消除,得到第二待处理信息之后,还可以包括:
根据第二待处理信息生成会话响应信息;
展示会话响应信息。
本实施例中,信息处理装置根据第二待处理信息,生成会话响应信息,假设第二待处理信息为“再换一首周杰伦的晴天”,那么会话响应信息可以是“好的,请收听晴天”,在实际应用中,会话响应信息还可以是推送消息,比如,向用户推送一个“晴天”的歌曲地址链接,用户点击后即可播放。
其次,本申请实施例中,提供了一种会话响应的方法,在根据候选先行词的分类结果,对第一待处理信息中的第一指代词进行消除,得到第二待处理信息之后,还可以根据第二待处理信息生成会话响应信息,展示会话响应信息。通过上述方式,使得提取到的候选先行词更贴近实际含义,提升指代消除的准确性,进而生成的会话响应消息也更为精准,从而有利于增强人机对话的可靠性和互动性。
结合上述介绍,下面将对本申请中会话响应的方法进行介绍,请参阅图5,本申请实施例中会话响应的方法一个实施例包括:
201、获取第一待处理信息,其中,第一待处理信息包括指代词;
本实施例中,会话响应装置获取用户输入的第一待处理信息,其中,会话响应装置部署于终端设备上,且该会话响应装置可以表现为客户端的形式。可以理解的是,用户可以通过终端设备的输入装置(比如键盘、手写板、触摸屏或者麦克风等)输入第一待处理信息,第一待处理信息表现为文本信息,且该第一处理信息可以表现为中文、英文、日文、法文以及德文等,本申请以中文文本为例进行说明,然而这不应理解为对本申请的限定。
会话响应装置对第一待处理信息进行检测,具体为检测第一待处理信息中的指代词。
202、根据第一待处理信息,从N组对话信息中获取候选先行词集合,其中,N组对话信息是与第一待处理信息相邻的对话信息,对话信息包括请求信息以及响应信息,候选先行词集合包括至少一个候选先行词,候选先行词包括至少一个名词,N为大于或等于1的整数;
本实施例中,会话响应装置从N组对话信息中获取候选先行词集合,其中,一组对话信息包括一个请求信息和一个响应信息,请求信息通常是由用户发起的,而响应信息通常是由机器反馈的。N可以设置为大于或等于1的整数,且为了使得指代的准确性更高,N组对话信息应与第一待处理信息具有较强的联系,比如为相邻的对话关系。候选先行词包括至少一个名词,即候选先行词可以是一个词语,也可以是一个短语,或者提前设置好的一个短句。
203、通过信息处理模型获取候选先行词集合中候选先行词所对应的分类结果;
本实施例中,会话响应装置对候选先行词集合中的候选先行词进行处理,假设候选先行词集合包括10个候选先行词,那么可以对这10个候选先行词均进行处理,也可以对其中的若干个候选先行词进行处理,处理的方式包括将不同的候选先行词分别代入到第一待处理信息中,从而对应的生成词序列,再对词序列进行向量化处理,得到词向量序列,将词向量序列输入至信息处理模型,由信息处理模型输出候选先行词所对应的分类结果。
204、根据候选先行词的分类结果,对第一待处理信息中的指代词进行消除,得到第二待处理信息;
本实施例中,会话响应装置得到候选先行词所对应的分类结果之后,判断该分类结果是否为第一结果,如果分类结果是第一结果,则将该候选先行词作为第一指代词,从而对第一待处理信息中的第一指代词进行消除,得到第二待处理信息。反之,如果分类结果为第二结果,则继续获取下一个候选先行词的分类结果,进而判断下一个候选先行词的分类结果是否属于第一结果。
可以理解的是,第一结果可以表示为“1”,也就是说,该候选先行词可替换指代词,第二结果可以表示为“0”,也就是说,该候选先行词不能替换指代词。本申请可以采用距离指代词最近的候选先行词,补充到当前待处理信息中的指代词所在的位置,从而完成指代消解。
205、展示会话响应信息,其中,会话响应信息为根据会话响应信息生成的。
本实施例中,会话响应装置根据第二待处理信息,生成会话响应信息,假设第二待处理信息为“再换一首周杰伦的晴天”,那么会话响应信息可以是“好的,请收听晴天”,请参阅图6,图6为本申请实施例中基于指代消除的人机对话一个界面示意图,如图所示,当用户输入“再换一首他的晴天”,经过指代消除后得到“再换一首周杰伦的晴天”,于是机器展示会话响应信息“好的,请收听晴天”。可选地,请参阅图7,图7为本申请实施例中基于指代消除的人机对话另一个界面示意图,如图所示,当用户输入“再换一首他的晴天”,经过指代消除后得到“再换一首周杰伦的晴天”,于是机器展示会话响应信息,即“晴天”这首歌的播放链接,用户点击后即可播放。
本申请实施例中,提供了一种会话响应的方法,首先获取第一待处理信息,然后根据第一待处理信息,从N组对话信息中获取候选先行词集合,其中,N组对话信息是与第一待处理信息相邻的对话信息,对话信息包括请求信息以及响应信息,候选先行词集合包括至少一个候选先行词,候选先行词包括至少一个名词,再通过信息处理模型获取候选先行词集合中候选先行词所对应的分类结果,基于候选先行词的分类结果,对第一待处理信息中的指代词进行消除,得到第二待处理信息,最后展示会话响应信息,其中,会话响应信息为根据会话响应信息生成的。通过上述方式,在确定候选先行词的时候不再局限于词性,而是考虑实体类型的候选先行词,由此,可以得到包括多个名词的候选先行词,使得提取到的候选先行词更贴近实际含义,提升指代消除的准确性,进而生成的会话响应消息也更为精准,从而有利于增强人机对话的可靠性和互动性。
下面对本申请中的信息处理装置进行详细描述,请参阅图8,图8为本申请实施例中信息处理装置一个实施例示意图,信息处理装置30包括:
获取模块301,用于获取第一待处理信息;
获取模块301,还用于若第一待处理信息中包括第一指代词,则从N组对话信息中获取候选先行词集合,其中,N组对话信息是与第一待处理信息相邻的对话信息,候选先行词集合包括至少一个候选先行词,候选先行词包括至少一个名词,N为大于或等于1的整数;
获取模块301,还用于通过信息处理模型获取候选先行词集合中候选先行词所对应的分类结果;
消除模块302,用于根据获取模块301获取的候选先行词的分类结果,对第一待处理信息中的第一指代词进行消除,得到第二待处理信息。
本实施例中,获取模块301获取第一待处理信息,若第一待处理信息中包括第一指代词,则获取模块301从N组对话信息中获取候选先行词集合,其中,N组对话信息是与第一待处理信息相邻的对话信息,候选先行词集合包括至少一个候选先行词,候选先行词包括至少一个名词,N为大于或等于1的整数,获取模块301通过信息处理模型获取候选先行词集合中候选先行词所对应的分类结果,消除模块302根据获取模块301获取的候选先行词的分类结果,对第一待处理信息中的第一指代词进行消除,得到第二待处理信息。
本申请实施例中,提供了一种信息处理装置,首先获取第一待处理信息,如果第一待处理信息中包括第一指代词,则从N组对话信息中获取候选先行词集合,其中,N组对话信息是与第一待处理信息相邻的对话信息,候选先行词集合包括至少一个候选先行词,候选先行词包括至少一个名词,然后通过信息处理模型获取候选先行词集合中候选先行词所对应的分类结果,最后根据候选先行词的分类结果,对第一待处理信息中的第一指代词进行消除,得到第二待处理信息。通过上述方式,在确定候选先行词的时候不再局限于词性,而是考虑实体类型的候选先行词,由此,可以得到包括多个名词的候选先行词,使得提取到的候选先行词更贴近实际含义,从而提升指代消除的准确性。
可选地,在上述图8所对应的实施例的基础上,本申请实施例提供的信息处理装置30的另一实施例中,
所述获取模块301,具体用于获取所述N组对话信息,其中,所述对话信息包括请求信息以及响应信息;
从所述N组对话信息中提取实体信息集合,其中,所述实体信息集合包括至少一个实体信息,所述实体信息包括至少一个名词;
根据所述实体信息集合生成所述候选先行词集合。
其次,本申请实施例中,提供了一种从N组对话信息中获取候选先行词集合的方法,获取N组对话信息,然后从N组对话信息中提取实体信息集合,最后根据实体信息集合生成候选先行词集合。通过上述方式,利用NER工具能够识别出实体信息,将实体信息作为候选先行词不局限于词组,还可以识别出短语或者专有名词等,从而提升指代的准确性。
可选地,在上述图8所对应的实施例的基础上,本申请实施例提供的信息处理装置30的另一实施例中,
所述获取模块301,具体用于检测所述实体信息集合中是否存在相同的实体信息;
若检测到所述实体信息集合中存在相同的实体信息,则对所述相同的实体信息进行合并处理,得到所述候选先行词集合;
若未检测到所述实体信息集合中存在相同的实体信息,则将所述实体信息集合作为所述候选先行词集合。
再次,本申请实施例中,提供了一种根据实体信息集合生成候选先行词集合的方式,首先检测实体信息集合中是否存在相同的实体信息,若检测到实体信息集合中存在相同的实体信息,则对相同的实体信息进行合并处理,得到候选先行词集合,若未检测到实体信息集合中存在相同的实体信息,则将实体信息集合作为候选先行词集合。通过上述方式,可以将相同的实体信息进行合并处理,这样能够减少候选先行词的数量,从而提高算法的效率和准确率。
可选地,在上述图8所对应的实施例的基础上,本申请实施例提供的信息处理装置30的另一实施例中,
所述获取模块301,具体用于根据预置实体库对所述实体信息集合中的实体信息进行匹配,其中,所述预置实体库用于指示实体信息与语义信息的映射关系;
若所述实体信息集合中存在至少两个实体信息对应于相同的语义信息,则将所述至少两个实体信息进行合并处理,得到所述候选先行词集合;
若所述实体信息集合中的实体信息对应于不同的语义信息,则将所述实体信息集合作为所述候选先行词集合。
再次,本申请实施例中,提供了另一种根据实体信息集合生成候选先行词集合的方式,首先根据预置实体库对实体信息集合中的实体信息进行匹配,若实体信息集合中存在至少两个实体信息对应于相同的语义信息,则将至少两个实体信息进行合并处理,得到候选先行词集合,若实体信息集合中的实体信息对应于不同的语义信息,则将实体信息集合作为候选先行词集合。通过上述方式,通过上述方式,可以将具有相同含义的实体信息进行合并处理,这样能够减少候选先行词的数量,从而提高算法的效率和准确率。
可选地,在上述图8所对应的实施例的基础上,请参阅图9,本申请实施例提供的信息处理装置30的另一实施例中,所述信息处理装置30还包括生成模块303;
所述获取模块301,还用于从N组对话信息中获取候选先行词集合之后,从所述第一待处理信息中获取所述第一指代词所对应的上下文信息,其中,所述上下文信息包括第一信息和第二信息,所述第一信息为位于所述第一指代词之前的信息,所述第二信息为位于所述第一指代词之后的信息;
所述生成模块303,用于根据所述候选先行词集合以及所述获取模块301获取的所述上下文信息生成词序列集合,其中,所述词序列集合包括至少一个词序列,所述词序列与所述候选先行词具有对应关系;
所述获取模块,具体用于通过所述信息处理模型获取所述词序列集合中所述词序列所对应的分类结果。
进一步地,本申请实施例中,提供了一种确定分类结果的方法,即首先从第一待处理信息中获取第一指代词所对应的上下文信息,然后根据候选先行词集合以及上下文信息生成词序列集合,其中,词序列集合包括至少一个词序列,词序列与候选先行词具有对应关系,最后通过信息处理模型获取词序列集合中词序列所对应的分类结果。通过上述方式,为方案的实现提供了具体的依据,将不同的候选先行词替换指代词,进而得到词向量序列,从而有利于增强方案的实用性。
可选地,在上述图8或图9所对应的实施例的基础上,本申请实施例提供的信息处理装置30的另一实施例中,
所述获取模块301,具体用于通过所述信息处理模型中的嵌入层获取所述词序列所对应的词向量序列;
通过所述信息处理模型中的卷积层获取所述词向量序列所对应的第一特征数据;
通过所述信息处理模型中的最大池化层获取所述第一特征数据所对应的第二特征数据;
通过所述信息处理模型中的全连接层获取所述第二特征数据输出所述分类结果。
更进一步地,本申请实施例中,提供了一种基于信息处理模型获取分类结果的方法,首先通过信息处理模型中的嵌入层获取词序列所对应的词向量序列,然后通过信息处理模型中的卷积层获取词向量序列所对应的第一特征数据,再通过信息处理模型中的最大池化层获取第一特征数据所对应的第二特征数据,最后通过信息处理模型中的全连接层获取第二特征数据输出分类结果。通过上述方式,对于响应速度要求比较高的多轮对话系统中,基于text-cnn的信息处理模型能够更高效地得到分类结果,且采用本申请提供的信息处理模型设计方法,还可以进一步提升数据处理效率。
可选地,在上述图8或图9所对应的实施例的基础上,请参阅图10,本申请实施例提供的信息处理装置30的另一实施例中,所述信息处理装置30还包括确定模块304以及训练模块305;
所述获取模块301,还用于通过信息处理模型获取所述候选先行词集合中所述候选先行词所对应的分类结果之前,获取待训练样本集合,其中,所述待训练样本集合包括待训练正样本以及待训练负样本,所述待训练正样本包括第一待训练信息、第一待训练指代词以及第一待训练先行词,所述第一待训练信息、所述第一待训练指代词与所述第一待训练先行词具有对应关系,所述待训练负样本包括第二待训练信息、第二待训练指代词以及第二待训练先行词,所述第二待训练信息、所述第二待训练指代词与所述第二待训练先行词不具有对应关系;
所述获取模块301,还用于通过待训练信息处理模型获取所述待训练样本集合所对应的预测分类结果;
所述确定模块304,用于根据所述获取模块301获取的所述预测分类结果以及所述待训练样本集合所对应的真实分类结果,确定所述待训练信息处理模型所对应的模型参数;
所述训练模块305,用于采用所述确定模块304确定的所述模型参数对所述待训练信息处理模型进行训练,得到所述信息处理模型。
再进一步地,本申请实施例中,提供了一种训练得到信息处理模型的方式,通过信息处理模型获取候选先行词集合中候选先行词所对应的分类结果之前,还可以获取待训练样本集合,然后通过待训练信息处理模型获取待训练样本集合所对应的预测分类结果,再根据预测分类结果以及待训练样本集合所对应的真实分类结果,确定待训练信息处理模型所对应的模型参数,最后采用模型参数对待训练信息处理模型进行训练,得到信息处理模型。通过上述方式,可以利用具有共指关系的正样本和不具有共指关系的负样本进行训练,从而得到更为可靠的信息处理模型,由此提升方案的可行性和实用性。
可选地,在上述图8、图9或图10所对应的实施例的基础上,本申请实施例提供的信息处理装置30的另一实施例中,
所述获取模块301,具体用于若所述第一待处理信息中还包括第二指代词,则从所述N组对话信息中获取所述候选先行词集合;
所述根据所述候选先行词的分类结果,对所述第一待处理信息中的所述第一指代词进行消除,得到第二待处理信息,包括:
根据所述候选先行词的分类结果,对所述第一待处理信息中的所述第一指代词以及所述第二指代词进行消除,得到第三待处理信息。
其次,本申请实施例中,提供了一种多个指代词进行指代消除的方法,若第一待处理信息中还包括第二指代词,则从N组对话信息中获取候选先行词集合,再根据候选先行词的分类结果,对第一待处理信息中的第一指代词以及第二指代词进行消除,得到第三待处理信息。通过上述方式,在实际应用中,在用户发起的待处理信息中往往会包括多个指代词,为了能够更加准确地识别用户的需求,可以对待处理信息中所有的指代词均进行相应的操作,达到指代消解的效果,从而提升方案的可行性和可操作性。
可选地,在上述图8、图9或图10所对应的实施例的基础上,请参阅图11,本申请实施例提供的信息处理装置30的另一实施例中,所述信息处理装置30还包括生成模块303以及展示模块306;
所述生成模块303,用于在所述消除模块302根据所述候选先行词的分类结果,对所述第一待处理信息中的所述第一指代词进行消除,得到第二待处理信息之后,根据所述第二待处理信息生成会话响应信息;
所述展示模块306,用于展示所述生成模块303生成的所述会话响应信息。
其次,本申请实施例中,提供了一种会话响应的方法,在根据候选先行词的分类结果,对第一待处理信息中的第一指代词进行消除,得到第二待处理信息之后,还可以根据第二待处理信息生成会话响应信息,展示会话响应信息。通过上述方式,使得提取到的候选先行词更贴近实际含义,提升指代消除的准确性,进而生成的会话响应消息也更为精准,从而有利于增强人机对话的可靠性和互动性。
下面对本申请中的会话响应装置进行详细描述,请参阅图12,图12为本申请实施例中会话响应装置一个实施例示意图,会话响应装置40包括:
获取模块401,用于获取第一待处理信息,其中,所述第一待处理信息包括指代词;
所述获取模块401,还用于根据所述第一待处理信息,从N组对话信息中获取候选先行词集合,其中,所述N组对话信息是与所述第一待处理信息相邻的对话信息,所述对话信息包括请求信息以及响应信息,所述候选先行词集合包括至少一个候选先行词,所述候选先行词包括至少一个名词,所述N为大于或等于1的整数;
所述获取模块401还用于通过信息处理模型获取所述候选先行词集合中所述候选先行词所对应的分类结果;
消除模块402,用于根据所述获取模块401获取的所述候选先行词的分类结果,对所述第一待处理信息中的所述指代词进行消除,得到第二待处理信息;
展示模块403,用于展示会话响应信息,其中,所述会话响应信息为根据所述消除模块402消除处理后所述会话响应信息生成的。
本实施例中,获取模块401获取第一待处理信息,其中,所述第一待处理信息包括指代词,所述获取模块401根据所述第一待处理信息,从N组对话信息中获取候选先行词集合,其中,所述N组对话信息是与所述第一待处理信息相邻的对话信息,所述对话信息包括请求信息以及响应信息,所述候选先行词集合包括至少一个候选先行词,所述候选先行词包括至少一个名词,所述N为大于或等于1的整数,所述获取模块401通过信息处理模型获取所述候选先行词集合中所述候选先行词所对应的分类结果,消除模块402根据所述获取模块401获取的所述候选先行词的分类结果,对所述第一待处理信息中的所述指代词进行消除,得到第二待处理信息,展示模块403展示会话响应信息,其中,所述会话响应信息为根据所述消除模块402消除处理后所述会话响应信息生成的。
本申请实施例中,提供了一种会话响应的方法,首先获取第一待处理信息,然后根据第一待处理信息,从N组对话信息中获取候选先行词集合,其中,N组对话信息是与第一待处理信息相邻的对话信息,对话信息包括请求信息以及响应信息,候选先行词集合包括至少一个候选先行词,候选先行词包括至少一个名词,再通过信息处理模型获取候选先行词集合中候选先行词所对应的分类结果,基于候选先行词的分类结果,对第一待处理信息中的指代词进行消除,得到第二待处理信息,最后展示会话响应信息,其中,会话响应信息为根据会话响应信息生成的。通过上述方式,在确定候选先行词的时候不再局限于词性,而是考虑实体类型的候选先行词,由此,可以得到包括多个名词的候选先行词,使得提取到的候选先行词更贴近实际含义,提升指代消除的准确性,进而生成的会话响应消息也更为精准,从而有利于增强人机对话的可靠性和互动性。
本申请实施例还提供了另一种图像显示控制装置,如图13所示,为了便于说明,仅示出了与本申请实施例相关的部分,具体技术细节未揭示的,请参照本申请实施例方法部分。该终端设备可以为包括手机、平板电脑、个人数字助理(personal digital assistant,PDA)、销售终端设备(point of sales,POS)、车载电脑等任意终端设备,以终端设备为手机为例:
图13示出的是与本申请实施例提供的终端设备相关的手机的部分结构的框图。参考图13,手机包括:射频(radio frequency,RF)电路510、存储器520、输入单元530、显示单元540、传感器550、音频电路560、无线保真(wireless fidelity,WiFi)模块570、处理器580、以及电源590等部件。本领域技术人员可以理解,图13中示出的手机结构并不构成对手机的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
下面结合图13对手机的各个构成部件进行具体的介绍:
RF电路510可用于收发信息或通话过程中,信号的接收和发送,特别地,将基站的下行信息接收后,给处理器580处理;另外,将设计上行的数据发送给基站。通常,RF电路510包括但不限于天线、至少一个放大器、收发信机、耦合器、低噪声放大器(low noiseamplifier,LNA)、双工器等。此外,RF电路510还可以通过无线通信与网络和其他设备通信。上述无线通信可以使用任一通信标准或协议,包括但不限于全球移动通讯系统(globalsystem of mobile communication,GSM)、通用分组无线服务(general packet radioservice,GPRS)、码分多址(code division multiple access,CDMA)、宽带码分多址(wideband code division multiple access,WCDMA)、长期演进(long term evolution,LTE)、电子邮件、短消息服务(short messaging service,SMS)等。
存储器520可用于存储软件程序以及模块,处理器580通过运行存储在存储器520的软件程序以及模块,从而执行手机的各种功能应用以及数据处理。存储器520可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器520可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
输入单元530可用于接收输入的数字或字符信息,以及产生与手机的用户设置以及功能控制有关的键信号输入。具体地,输入单元530可包括触控面板531以及其他输入设备532。触控面板531,也称为触摸屏,可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触控面板531上或在触控面板531附近的操作),并根据预先设定的程式驱动相应的连接装置。可选的,触控面板531可包括触摸检测装置和触摸控制器两个部分。其中,触摸检测装置检测用户的触摸方位,并检测触摸操作带来的信号,将信号传送给触摸控制器;触摸控制器从触摸检测装置上接收触摸信息,并将它转换成触点坐标,再送给处理器580,并能接收处理器580发来的命令并加以执行。此外,可以采用电阻式、电容式、红外线以及表面声波等多种类型实现触控面板531。除了触控面板531,输入单元530还可以包括其他输入设备532。具体地,其他输入设备532可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆等中的一种或多种。
显示单元540可用于显示由用户输入的信息或提供给用户的信息以及手机的各种菜单。显示单元540可包括显示面板541,可选的,可以采用液晶显示器(liquid crystaldisplay,LCD)、有机发光二极管(organic light-emitting diode,OLED)等形式来配置显示面板541。进一步的,触控面板531可覆盖显示面板541,当触控面板531检测到在其上或附近的触摸操作后,传送给处理器580以确定触摸事件的类型,随后处理器580根据触摸事件的类型在显示面板541上提供相应的视觉输出。虽然在图13中,触控面板531与显示面板541是作为两个独立的部件来实现手机的输入和输入功能,但是在某些实施例中,可以将触控面板531与显示面板541集成而实现手机的输入和输出功能。
手机还可包括至少一种传感器550,比如光传感器、运动传感器以及其他传感器。具体地,光传感器可包括环境光传感器及接近传感器,其中,环境光传感器可根据环境光线的明暗来调节显示面板541的亮度,接近传感器可在手机移动到耳边时,关闭显示面板541和/或背光。作为运动传感器的一种,加速计传感器可检测各个方向上(一般为三轴)加速度的大小,静止时可检测出重力的大小及方向,可用于识别手机姿态的应用(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等;至于手机还可配置的陀螺仪、气压计、湿度计、温度计、红外线传感器等其他传感器,在此不再赘述。
音频电路560、扬声器561,传声器562可提供用户与手机之间的音频接口。音频电路560可将接收到的音频数据转换后的电信号,传输到扬声器561,由扬声器561转换为声音信号输出;另一方面,传声器562将收集的声音信号转换为电信号,由音频电路560接收后转换为音频数据,再将音频数据输出处理器580处理后,经RF电路510以发送给比如另一手机,或者将音频数据输出至存储器520以便进一步处理。
WiFi属于短距离无线传输技术,手机通过WiFi模块570可以帮助用户收发电子邮件、浏览网页和访问流式媒体等,它为用户提供了无线的宽带互联网访问。虽然图13示出了WiFi模块570,但是可以理解的是,其并不属于手机的必须构成,完全可以根据需要在不改变发明的本质的范围内而省略。
处理器580是手机的控制中心,利用各种接口和线路连接整个手机的各个部分,通过运行或执行存储在存储器520内的软件程序和/或模块,以及调用存储在存储器520内的数据,执行手机的各种功能和处理数据,从而对手机进行整体监控。可选的,处理器580可包括一个或多个处理单元;可选的,处理器580可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器580中。
手机还包括给各个部件供电的电源590(比如电池),可选的,电源可以通过电源管理系统与处理器580逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。
尽管未示出,手机还可以包括摄像头、蓝牙模块等,在此不再赘述。
在本申请实施例中,该终端设备所包括的处理器580还具有以下功能:
获取第一待处理信息;
若所述第一待处理信息中包括第一指代词,则从N组对话信息中获取候选先行词集合,其中,所述N组对话信息是与所述第一待处理信息相邻的对话信息,所述候选先行词集合包括至少一个候选先行词,所述候选先行词包括至少一个名词,所述N为大于或等于1的整数;
通过信息处理模型获取所述候选先行词集合中所述候选先行词所对应的分类结果;
根据所述候选先行词的分类结果,对所述第一待处理信息中的所述第一指代词进行消除,得到第二待处理信息。
可选地,该终端设备所包括的处理器580具体用于执行如下步骤:
获取所述N组对话信息,其中,所述对话信息包括请求信息以及响应信息;
从所述N组对话信息中提取实体信息集合,其中,所述实体信息集合包括至少一个实体信息,所述实体信息包括至少一个名词;
根据所述实体信息集合生成所述候选先行词集合。
可选地,该终端设备所包括的处理器580具体用于执行如下步骤:
检测所述实体信息集合中是否存在相同的实体信息;
若检测到所述实体信息集合中存在相同的实体信息,则对所述相同的实体信息进行合并处理,得到所述候选先行词集合;
若未检测到所述实体信息集合中存在相同的实体信息,则将所述实体信息集合作为所述候选先行词集合。
可选地,该终端设备所包括的处理器580具体用于执行如下步骤:
根据预置实体库对所述实体信息集合中的实体信息进行匹配,其中,所述预置实体库用于指示实体信息与语义信息的映射关系;
若所述实体信息集合中存在至少两个实体信息对应于相同的语义信息,则将所述至少两个实体信息进行合并处理,得到所述候选先行词集合;
若所述实体信息集合中的实体信息对应于不同的语义信息,则将所述实体信息集合作为所述候选先行词集合。
可选地,该终端设备所包括的处理器580还用于执行如下步骤:
从所述第一待处理信息中获取所述第一指代词所对应的上下文信息,其中,所述上下文信息包括第一信息和第二信息,所述第一信息为位于所述第一指代词之前的信息,所述第二信息为位于所述第一指代词之后的信息;
根据所述候选先行词集合以及所述上下文信息生成词序列集合,其中,所述词序列集合包括至少一个词序列,所述词序列与所述候选先行词具有对应关系;
处理器580具体用于执行如下步骤:
通过所述信息处理模型获取所述词序列集合中所述词序列所对应的分类结果。
可选地,该终端设备所包括的处理器580具体用于执行如下步骤:
通过所述信息处理模型中的嵌入层获取所述词序列所对应的词向量序列;
通过所述信息处理模型中的卷积层获取所述词向量序列所对应的第一特征数据;
通过所述信息处理模型中的最大池化层获取所述第一特征数据所对应的第二特征数据;
通过所述信息处理模型中的全连接层获取所述第二特征数据输出所述分类结果。
可选地,该终端设备所包括的处理器580还用于执行如下步骤:
获取待训练样本集合,其中,所述待训练样本集合包括待训练正样本以及待训练负样本,所述待训练正样本包括第一待训练信息、第一待训练指代词以及第一待训练先行词,所述第一待训练信息、所述第一待训练指代词与所述第一待训练先行词具有对应关系,所述待训练负样本包括第二待训练信息、第二待训练指代词以及第二待训练先行词,所述第二待训练信息、所述第二待训练指代词与所述第二待训练先行词不具有对应关系;
通过待训练信息处理模型获取所述待训练样本集合所对应的预测分类结果;
根据所述预测分类结果以及所述待训练样本集合所对应的真实分类结果,确定所述待训练信息处理模型所对应的模型参数;
采用所述模型参数对所述待训练信息处理模型进行训练,得到所述信息处理模型。
可选地,该终端设备所包括的处理器580具体用于执行如下步骤:
若所述第一待处理信息中还包括第二指代词,则从所述N组对话信息中获取所述候选先行词集合;
根据所述候选先行词的分类结果,对所述第一待处理信息中的所述第一指代词以及所述第二指代词进行消除,得到第三待处理信息。
可选地,该终端设备所包括的处理器580还用于执行如下步骤:
根据所述第二待处理信息生成会话响应信息;
展示所述会话响应信息。
在本申请实施例中,该终端设备所包括的处理器580还具有以下功能:
获取第一待处理信息,其中,所述第一待处理信息包括指代词;
根据所述第一待处理信息,从N组对话信息中获取候选先行词集合,其中,所述N组对话信息是与所述第一待处理信息相邻的对话信息,所述对话信息包括请求信息以及响应信息,所述候选先行词集合包括至少一个候选先行词,所述候选先行词包括至少一个名词,所述N为大于或等于1的整数;
通过信息处理模型获取所述候选先行词集合中所述候选先行词所对应的分类结果;
根据所述候选先行词的分类结果,对所述第一待处理信息中的所述指代词进行消除,得到第二待处理信息;
展示会话响应信息,其中,所述会话响应信息为根据所述会话响应信息生成的。
图14是本申请实施例提供的一种服务器结构示意图,该服务器600可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上中央处理器(central processingunits,CPU)622(例如,一个或一个以上处理器)和存储器632,一个或一个以上存储应用程序642或数据644的存储介质630(例如一个或一个以上海量存储设备)。其中,存储器632和存储介质630可以是短暂存储或持久存储。存储在存储介质630的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对服务器中的一系列指令操作。更进一步地,中央处理器622可以设置为与存储介质630通信,在服务器600上执行存储介质630中的一系列指令操作。
服务器600还可以包括一个或一个以上电源626,一个或一个以上有线或无线网络接口650,一个或一个以上输入输出接口658,和/或,一个或一个以上操作系统641,例如Windows ServerTM,Mac OS XTM,UnixTM,LinuxTM,FreeBSDTM等等。
上述实施例中由服务器所执行的步骤可以基于该图14所示的服务器结构。
在本申请实施例中,该服务器所包括的CPU 622还具有以下功能:
获取第一待处理信息;
若所述第一待处理信息中包括第一指代词,则从N组对话信息中获取候选先行词集合,其中,所述N组对话信息是与所述第一待处理信息相邻的对话信息,所述候选先行词集合包括至少一个候选先行词,所述候选先行词包括至少一个名词,所述N为大于或等于1的整数;
通过信息处理模型获取所述候选先行词集合中所述候选先行词所对应的分类结果;
根据所述候选先行词的分类结果,对所述第一待处理信息中的所述第一指代词进行消除,得到第二待处理信息。
可选地,该服务器所包括的CPU 622具体用于执行如下步骤:
获取所述N组对话信息,其中,所述对话信息包括请求信息以及响应信息;
从所述N组对话信息中提取实体信息集合,其中,所述实体信息集合包括至少一个实体信息,所述实体信息包括至少一个名词;
根据所述实体信息集合生成所述候选先行词集合。
可选地,该服务器所包括的CPU 622具体用于执行如下步骤:
检测所述实体信息集合中是否存在相同的实体信息;
若检测到所述实体信息集合中存在相同的实体信息,则对所述相同的实体信息进行合并处理,得到所述候选先行词集合;
若未检测到所述实体信息集合中存在相同的实体信息,则将所述实体信息集合作为所述候选先行词集合。
可选地,该服务器所包括的CPU 622具体用于执行如下步骤:
根据预置实体库对所述实体信息集合中的实体信息进行匹配,其中,所述预置实体库用于指示实体信息与语义信息的映射关系;
若所述实体信息集合中存在至少两个实体信息对应于相同的语义信息,则将所述至少两个实体信息进行合并处理,得到所述候选先行词集合;
若所述实体信息集合中的实体信息对应于不同的语义信息,则将所述实体信息集合作为所述候选先行词集合。
可选地,该服务器所包括的CPU 622还用于执行如下步骤:
从所述第一待处理信息中获取所述第一指代词所对应的上下文信息,其中,所述上下文信息包括第一信息和第二信息,所述第一信息为位于所述第一指代词之前的信息,所述第二信息为位于所述第一指代词之后的信息;
根据所述候选先行词集合以及所述上下文信息生成词序列集合,其中,所述词序列集合包括至少一个词序列,所述词序列与所述候选先行词具有对应关系;
CPU 622具体用于执行如下步骤:
通过所述信息处理模型获取所述词序列集合中所述词序列所对应的分类结果。
可选地,该服务器所包括的CPU 622具体用于执行如下步骤:
通过所述信息处理模型中的嵌入层获取所述词序列所对应的词向量序列;
通过所述信息处理模型中的卷积层获取所述词向量序列所对应的第一特征数据;
通过所述信息处理模型中的最大池化层获取所述第一特征数据所对应的第二特征数据;
通过所述信息处理模型中的全连接层获取所述第二特征数据输出所述分类结果。
可选地,该服务器所包括的CPU 622还用于执行如下步骤:
获取待训练样本集合,其中,所述待训练样本集合包括待训练正样本以及待训练负样本,所述待训练正样本包括第一待训练信息、第一待训练指代词以及第一待训练先行词,所述第一待训练信息、所述第一待训练指代词与所述第一待训练先行词具有对应关系,所述待训练负样本包括第二待训练信息、第二待训练指代词以及第二待训练先行词,所述第二待训练信息、所述第二待训练指代词与所述第二待训练先行词不具有对应关系;
通过待训练信息处理模型获取所述待训练样本集合所对应的预测分类结果;
根据所述预测分类结果以及所述待训练样本集合所对应的真实分类结果,确定所述待训练信息处理模型所对应的模型参数;
采用所述模型参数对所述待训练信息处理模型进行训练,得到所述信息处理模型。
可选地,该服务器所包括的CPU 622具体用于执行如下步骤:
若所述第一待处理信息中还包括第二指代词,则从所述N组对话信息中获取所述候选先行词集合;
所述根据所述候选先行词的分类结果,对所述第一待处理信息中的所述第一指代词进行消除,得到第二待处理信息,包括:
根据所述候选先行词的分类结果,对所述第一待处理信息中的所述第一指代词以及所述第二指代词进行消除,得到第三待处理信息。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(read-only memory,ROM)、随机存取存储器(random access memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。

Claims (15)

1.一种信息处理的方法,其特征在于,包括:
获取第一待处理信息;
若所述第一待处理信息中包括第一指代词,则从N组对话信息中获取候选先行词集合,其中,所述N组对话信息是与所述第一待处理信息相邻的对话信息,所述候选先行词集合包括至少一个候选先行词,所述候选先行词包括至少一个名词,所述N为大于或等于1的整数;
通过信息处理模型获取所述候选先行词集合中所述候选先行词所对应的分类结果;
根据所述候选先行词的分类结果,对所述第一待处理信息中的所述第一指代词进行消除,得到第二待处理信息。
2.根据权利要求1所述的方法,其特征在于,所述从N组对话信息中获取候选先行词集合,包括:
获取所述N组对话信息,其中,所述对话信息包括请求信息以及响应信息;
从所述N组对话信息中提取实体信息集合,其中,所述实体信息集合包括至少一个实体信息,所述实体信息包括至少一个名词;
根据所述实体信息集合生成所述候选先行词集合。
3.根据权利要求2所述的方法,其特征在于,所述根据所述实体信息集合生成所述候选先行词集合,包括:
检测所述实体信息集合中是否存在相同的实体信息;
若检测到所述实体信息集合中存在相同的实体信息,则对所述相同的实体信息进行合并处理,得到所述候选先行词集合;
若未检测到所述实体信息集合中存在相同的实体信息,则将所述实体信息集合作为所述候选先行词集合。
4.根据权利要求2所述的方法,其特征在于,所述根据所述实体信息集合生成所述候选先行词集合,包括:
根据预置实体库对所述实体信息集合中的实体信息进行匹配,其中,所述预置实体库用于指示实体信息与语义信息的映射关系;
若所述实体信息集合中存在至少两个实体信息对应于相同的语义信息,则将所述至少两个实体信息进行合并处理,得到所述候选先行词集合;
若所述实体信息集合中的实体信息对应于不同的语义信息,则将所述实体信息集合作为所述候选先行词集合。
5.根据权利要求1至4中任一项所述的方法,其特征在于,所述从N组对话信息中获取候选先行词集合之后,所述方法还包括:
从所述第一待处理信息中获取所述第一指代词所对应的上下文信息,其中,所述上下文信息包括第一信息和第二信息,所述第一信息为位于所述第一指代词之前的信息,所述第二信息为位于所述第一指代词之后的信息;
根据所述候选先行词集合以及所述上下文信息生成词序列集合,其中,所述词序列集合包括至少一个词序列,所述词序列与所述候选先行词具有对应关系;
所述通过信息处理模型获取所述候选先行词集合中所述候选先行词所对应的分类结果,包括:
通过所述信息处理模型获取所述词序列集合中所述词序列所对应的分类结果。
6.根据权利要求5所述的方法,其特征在于,所述通过所述信息处理模型获取所述词序列集合中所述词序列所对应的分类结果,包括:
通过所述信息处理模型中的嵌入层获取所述词序列所对应的词向量序列;
通过所述信息处理模型中的卷积层获取所述词向量序列所对应的第一特征数据;
通过所述信息处理模型中的最大池化层获取所述第一特征数据所对应的第二特征数据;
通过所述信息处理模型中的全连接层获取所述第二特征数据输出所述分类结果。
7.根据权利要求1或6所述的方法,其特征在于,所述通过信息处理模型获取所述候选先行词集合中所述候选先行词所对应的分类结果之前,所述方法还包括:
获取待训练样本集合,其中,所述待训练样本集合包括待训练正样本以及待训练负样本,所述待训练正样本包括第一待训练信息、第一待训练指代词以及第一待训练先行词,所述第一待训练信息、所述第一待训练指代词与所述第一待训练先行词具有对应关系,所述待训练负样本包括第二待训练信息、第二待训练指代词以及第二待训练先行词,所述第二待训练信息、所述第二待训练指代词与所述第二待训练先行词不具有对应关系;
通过待训练信息处理模型获取所述待训练样本集合所对应的预测分类结果;
根据所述预测分类结果以及所述待训练样本集合所对应的真实分类结果,确定所述待训练信息处理模型所对应的模型参数;
采用所述模型参数对所述待训练信息处理模型进行训练,得到所述信息处理模型。
8.根据权利要求1所述的方法,其特征在于,所述从N组对话信息中获取候选先行词集合,包括:
若所述第一待处理信息中还包括第二指代词,则从所述N组对话信息中获取所述候选先行词集合;
所述根据所述候选先行词的分类结果,对所述第一待处理信息中的所述第一指代词进行消除,得到第二待处理信息,包括:
根据所述候选先行词的分类结果,对所述第一待处理信息中的所述第一指代词以及所述第二指代词进行消除,得到第三待处理信息。
9.根据权利要求1所述的方法,其特征在于,所述根据所述候选先行词的分类结果,对所述第一待处理信息中的所述第一指代词进行消除,得到第二待处理信息之后,所述方法还包括:
根据所述第二待处理信息生成会话响应信息;
展示所述会话响应信息。
10.一种会话响应的方法,其特征在于,包括:
获取第一待处理信息,其中,所述第一待处理信息包括指代词;
根据所述第一待处理信息,从N组对话信息中获取候选先行词集合,其中,所述N组对话信息是与所述第一待处理信息相邻的对话信息,所述对话信息包括请求信息以及响应信息,所述候选先行词集合包括至少一个候选先行词,所述候选先行词包括至少一个名词,所述N为大于或等于1的整数;
通过信息处理模型获取所述候选先行词集合中所述候选先行词所对应的分类结果;
根据所述候选先行词的分类结果,对所述第一待处理信息中的所述指代词进行消除,得到第二待处理信息;
展示会话响应信息,其中,所述会话响应信息为根据所述会话响应信息生成的。
11.一种信息处理装置,其特征在于,包括:
获取模块,用于获取第一待处理信息;
所述获取模块,还用于若所述第一待处理信息中包括第一指代词,则从N组对话信息中获取候选先行词集合,其中,所述N组对话信息是与所述第一待处理信息相邻的对话信息,所述候选先行词集合包括至少一个候选先行词,所述候选先行词包括至少一个名词,所述N为大于或等于1的整数;
所述获取模块,还用于通过信息处理模型获取所述候选先行词集合中所述候选先行词所对应的分类结果;
消除模块,用于根据所述获取模块获取的所述候选先行词的分类结果,对所述第一待处理信息中的所述第一指代词进行消除,得到第二待处理信息。
12.一种会话响应装置,其特征在于,包括:
获取模块,用于获取第一待处理信息,其中,所述第一待处理信息包括指代词;
所述获取模块,还用于根据所述第一待处理信息,从N组对话信息中获取候选先行词集合,其中,所述N组对话信息是与所述第一待处理信息相邻的对话信息,所述对话信息包括请求信息以及响应信息,所述候选先行词集合包括至少一个候选先行词,所述候选先行词包括至少一个名词,所述N为大于或等于1的整数;
所述获取模块,还用于通过信息处理模型获取所述候选先行词集合中所述候选先行词所对应的分类结果;
消除模块,用于根据所述获取模块获取的所述候选先行词的分类结果,对所述第一待处理信息中的所述指代词进行消除,得到第二待处理信息;
展示模块,用于展示会话响应信息,其中,所述会话响应信息为根据所述消除模块消除处理后所述会话响应信息生成的。
13.一种终端设备,其特征在于,包括:存储器、收发器、处理器以及总线系统;
其中,所述存储器用于存储程序;
所述处理器用于执行所述存储器中的程序,包括如下步骤:
获取第一待处理信息;
若所述第一待处理信息中包括第一指代词,则从N组对话信息中获取候选先行词集合,其中,所述N组对话信息是与所述第一待处理信息相邻的对话信息,所述候选先行词集合包括至少一个候选先行词,所述候选先行词包括至少一个名词,所述N为大于或等于1的整数;
通过信息处理模型获取所述候选先行词集合中所述候选先行词所对应的分类结果;
根据所述候选先行词的分类结果,对所述第一待处理信息中的所述第一指代词进行消除,得到第二待处理信息;
所述总线系统用于连接所述存储器以及所述处理器,以使所述存储器以及所述处理器进行通信。
14.一种终端设备,其特征在于,包括:存储器、收发器、处理器以及总线系统;
其中,所述存储器用于存储程序;
所述处理器用于执行所述存储器中的程序,包括如下步骤:
获取第一待处理信息,其中,所述第一待处理信息包括指代词;
根据所述第一待处理信息,从N组对话信息中获取候选先行词集合,其中,所述N组对话信息是与所述第一待处理信息相邻的对话信息,所述对话信息包括请求信息以及响应信息,所述候选先行词集合包括至少一个候选先行词,所述候选先行词包括至少一个名词,所述N为大于或等于1的整数;
通过信息处理模型获取所述候选先行词集合中所述候选先行词所对应的分类结果;
根据所述候选先行词的分类结果,对所述第一待处理信息中的所述指代词进行消除,得到第二待处理信息;
展示会话响应信息,其中,所述会话响应信息为根据所述会话响应信息生成的;
所述总线系统用于连接所述存储器以及所述处理器,以使所述存储器以及所述处理器进行通信。
15.一种计算机可读存储介质,包括指令,当其在计算机上运行时,使得计算机执行如权利要求1至9中任一项所述的方法,或执行如权利要求10所述的方法。
CN201910419481.2A 2019-05-20 2019-05-20 一种信息处理的方法、会话响应的方法及装置 Active CN110162600B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910419481.2A CN110162600B (zh) 2019-05-20 2019-05-20 一种信息处理的方法、会话响应的方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910419481.2A CN110162600B (zh) 2019-05-20 2019-05-20 一种信息处理的方法、会话响应的方法及装置

Publications (2)

Publication Number Publication Date
CN110162600A true CN110162600A (zh) 2019-08-23
CN110162600B CN110162600B (zh) 2024-01-30

Family

ID=67631609

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910419481.2A Active CN110162600B (zh) 2019-05-20 2019-05-20 一种信息处理的方法、会话响应的方法及装置

Country Status (1)

Country Link
CN (1) CN110162600B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110705206A (zh) * 2019-09-23 2020-01-17 腾讯科技(深圳)有限公司 一种文本信息的处理方法及相关装置
CN111159409A (zh) * 2019-12-31 2020-05-15 腾讯科技(深圳)有限公司 基于人工智能的文本分类方法、装置、设备、介质
CN111324707A (zh) * 2020-02-05 2020-06-23 贝壳技术有限公司 用户交互方法和装置、计算机可读存储介质、电子设备
CN113033664A (zh) * 2021-03-26 2021-06-25 网易(杭州)网络有限公司 问答模型训练方法、问答方法、装置、设备及存储介质
CN114787814B (zh) * 2019-12-10 2023-08-11 国际商业机器公司 指代解析

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106294322A (zh) * 2016-08-04 2017-01-04 哈尔滨工业大学 一种基于lstm的汉语零指代消解方法
CN107402913A (zh) * 2016-05-20 2017-11-28 腾讯科技(深圳)有限公司 先行词的确定方法和装置
CN109446517A (zh) * 2018-10-08 2019-03-08 平安科技(深圳)有限公司 指代消解方法、电子装置及计算机可读存储介质

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107402913A (zh) * 2016-05-20 2017-11-28 腾讯科技(深圳)有限公司 先行词的确定方法和装置
CN106294322A (zh) * 2016-08-04 2017-01-04 哈尔滨工业大学 一种基于lstm的汉语零指代消解方法
CN109446517A (zh) * 2018-10-08 2019-03-08 平安科技(深圳)有限公司 指代消解方法、电子装置及计算机可读存储介质

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110705206A (zh) * 2019-09-23 2020-01-17 腾讯科技(深圳)有限公司 一种文本信息的处理方法及相关装置
CN114787814B (zh) * 2019-12-10 2023-08-11 国际商业机器公司 指代解析
CN111159409A (zh) * 2019-12-31 2020-05-15 腾讯科技(深圳)有限公司 基于人工智能的文本分类方法、装置、设备、介质
CN111159409B (zh) * 2019-12-31 2023-06-02 腾讯科技(深圳)有限公司 基于人工智能的文本分类方法、装置、设备、介质
CN111324707A (zh) * 2020-02-05 2020-06-23 贝壳技术有限公司 用户交互方法和装置、计算机可读存储介质、电子设备
CN113033664A (zh) * 2021-03-26 2021-06-25 网易(杭州)网络有限公司 问答模型训练方法、问答方法、装置、设备及存储介质

Also Published As

Publication number Publication date
CN110162600B (zh) 2024-01-30

Similar Documents

Publication Publication Date Title
CN107943860B (zh) 模型的训练方法、文本意图的识别方法及装置
CN110162600A (zh) 一种信息处理的方法、会话响应的方法及装置
CN110334344B (zh) 一种语义意图识别方法、装置、设备及存储介质
CN111931501B (zh) 一种基于人工智能的文本挖掘方法、相关装置及设备
CN110288077A (zh) 一种基于人工智能的合成说话表情的方法和相关装置
CN110490213A (zh) 图像识别方法、装置及存储介质
CN107301213A (zh) 智能问答方法及装置
CN110162770A (zh) 一种词扩展方法、装置、设备及介质
CN110334347A (zh) 基于自然语言识别的信息处理方法、相关设备及存储介质
CN111177371B (zh) 一种分类方法和相关装置
CN109033156B (zh) 一种信息处理方法、装置及终端
CN109670174B (zh) 一种事件识别模型的训练方法和装置
WO2020147369A1 (zh) 自然语言处理方法、训练方法及数据处理设备
CN107608532A (zh) 一种联想输入方法、装置及电子设备
CN110852100A (zh) 关键词提取方法、装置、电子设备及介质
CN110717026B (zh) 一种文本信息识别的方法、人机对话的方法及相关装置
CN109561211B (zh) 一种信息显示方法及移动终端
CN110634474B (zh) 一种基于人工智能的语音识别方法和装置
CN111597804B (zh) 一种实体识别模型训练的方法以及相关装置
CN110853617A (zh) 一种模型训练的方法、语种识别的方法、装置及设备
CN111368525A (zh) 信息搜索方法、装置、设备及存储介质
CN111353299B (zh) 基于人工智能的对话场景确定方法和相关装置
CN111339737B (zh) 实体链接方法、装置、设备及存储介质
CN113220848A (zh) 用于人机交互的自动问答方法、装置和智能设备
CN111553163A (zh) 文本相关度的确定方法、装置、存储介质及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant