CN111966805B - 用于辅助实现会话的方法、装置、介质以及电子设备 - Google Patents
用于辅助实现会话的方法、装置、介质以及电子设备 Download PDFInfo
- Publication number
- CN111966805B CN111966805B CN202010813277.1A CN202010813277A CN111966805B CN 111966805 B CN111966805 B CN 111966805B CN 202010813277 A CN202010813277 A CN 202010813277A CN 111966805 B CN111966805 B CN 111966805B
- Authority
- CN
- China
- Prior art keywords
- conversation
- action
- session
- message
- emotion polarity
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
- G06F16/353—Clustering; Classification into predefined classes
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L51/00—User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
- H04L51/04—Real-time or near real-time messaging, e.g. instant messaging [IM]
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- Human Computer Interaction (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Machine Translation (AREA)
Abstract
公开了一种用于辅助实现会话的方法、装置、介质以及电子设备。其中的方法包括:根据多个历史会话中的第一会话方的会话消息,确定多个会话动作样本的动作名称和动作实体;根据多个历史会话中的第二会话方的会话消息,确定各会话动作样本各自对应的第二会话方的会话意图;根据多个历史会话中的第二会话方的会话消息,确定各会话动作样本各自在至少一会话意图下的动作优先级;根据动作名称、动作实体和至少一会话意图下的动作优先级,获得会话动作样本集合中的多个会话动作样本的多元组。本公开有利于辅助房产经纪人等会话方完成与用户的高质量会话,从而有利于达成会话目的,并有利于提高用户的会话体验。
Description
技术领域
本公开涉及计算机技术,尤其是一种用于辅助实现会话的方法、用于辅助实现会话的装置、存储介质以及电子设备。
背景技术
在很多领域中,工作人员需要与大量的用户进行会话,以解决用户的问题或者满足用户的需求等。例如,在房产领域中,联系大量的用户,是房产经纪人的日常工作的主要内容之一,房产经纪人通过与各式各样的用户进行会话,以便于为用户提供其所需的房屋。如何辅助房产经纪人等工作人员与用户进行高质量的会话,是一个值得关注的技术问题。
发明内容
为了解决上述技术问题,提出了本公开。本公开的实施例提供了一种用于辅助实现会话的方法、用于辅助实现会话的装置、存储介质以及电子设备。
根据本公开实施例的一方面,提供一种用于辅助实现会话的方法,包括:根据多个历史会话中的第一会话方的会话消息,确定多个会话动作样本的动作名称以及动作实体;根据所述多个历史会话中的第二会话方的会话消息,确定所述各会话动作样本各自对应的第二会话方的会话意图;根据所述多个历史会话中的第二会话方的会话消息,确定所述各会话动作样本各自在至少一会话意图下的动作优先级;根据所述动作名称、动作实体以及至少一会话意图下的动作优先级,获得会话动作样本集合中的多个会话动作样本的多元组。
在本公开一实施方式中,所述根据多个历史会话中的第一会话方的会话消息,确定多个会话动作样本的动作名称以及动作实体,包括:对多个历史会话中的第一会话方的文本类型的会话消息进行句式识别,获得疑问句集合和陈述句集合;对所述疑问句集合中的疑问句以及陈述句集合中的陈述句分别进行聚类处理,获得多个疑问句类簇以及多个陈述句类簇;为各疑问句类簇和各陈述句类簇分别设置动作名称;其中,所述会话动作样本的动作名称为其所属类簇的动作名称。
在本公开又一实施方式中,所述对所述疑问句集合中的疑问句以及陈述句集合中的陈述句分别进行聚类处理,包括:利用情感极性预测模型,对所述疑问句集合中的各疑问句以及所述陈述句集合中的各陈述句分别进行情感识别,获得各疑问句的情感信息以及各陈述句的情感信息;对所述疑问句集合中的情感信息为正向和中性的疑问句、以及所述陈述句集合中的情感信息为正向和中性的陈述句分别进行聚类处理。
在本公开再一实施方式中,所述情感极性预测模型的训练过程包括:将训练集中的多个文本类型的会话消息样本分别提供给情感极性预测模型;根据所述情感极性预测模型输出的情感极性预测结果和所述训练集中的会话消息样本的情感极性标签的差异,调整所述情感极性预测模型的模型参数;将验证集中的多个文本类型的会话消息样本,分别提供给模型参数调整后的情感极性预测模型;根据所述模型参数调整后的情感极性预测模型输出的情感极性预测结果和所述验证集中的会话消息样本的情感极性标签的差异,修正所述训练集中的会话消息样本的情感极性标签。
在本公开再一实施方式中,所述根据所述模型参数调整后的情感极性预测模型输出的情感极性预测结果和所述验证集中的会话消息样本的情感极性标签的差异,修正所述训练集中的会话消息样本的情感极性标签,包括:根据所述模型参数调整后的情感极性预测模型输出的情感极性预测结果和所述验证集中的会话消息样本的情感极性标签的差异,设置正则表达式;根据所述正则表达式,修正所述训练集中的会话消息样本的情感极性标签。
在本公开再一实施方式中,所述情感极性预测模型的训练过程还包括:将测试集中的具有情感极性标签的多个会话消息样本,分别提供给模型参数调整后的情感极性预测模型;根据所述模型参数调整后的情感极性预测模型输出的情感极性预测结果和所述测试集中的会话消息样本的情感极性标签的差异,判断所述情感极性预测模型是否成功训练完成;若所述判断结果为未成功训练完成,则继续利用所述训练集中的多个会话消息样本对所述情感极性预测模型进行训练。
在本公开再一实施方式中,所述根据多个历史会话中的第一会话方的会话消息,确定多个会话动作样本的动作名称以及动作实体,包括:对多个历史会话中的第一会话方的文本类型的会话消息进行实体词提取处理,并将提取出的实体词作为该会话消息对应的会话动作样本的动作实体。
在本公开再一实施方式中,所述根据多个历史会话中的第一会话方的会话消息,确定多个会话动作样本的动作名称以及动作实体,包括:对于多个历史会话中的第一会话方的卡片类型的会话消息,将该会话消息的卡片类型标识对应的预设动作名称,作为该会话消息对应的会话动作样本的动作名称,并将该会话消息对应的会话动作样本的动作实体设置为空。
在本公开再一实施方式中,所述根据多个历史会话中的第一会话方的会话消息,确定多个会话动作样本的动作名称以及动作实体,还包括:对具有相同动作名称和相同动作实体的会话动作样本进行合并处理,获得多个会话动作样本。
在本公开再一实施方式中,所述根据所述多个历史会话中的第二会话方的会话消息,确定所述各会话动作样本各自对应的第二会话方的会话意图,包括:针对任一会话动作样本,确定该会话动作样本所来自的所有会话消息,获得多条会话消息;针对所述多条会话消息中的任一会话消息,确定该会话消息所在的历史会话中的与该会话消息邻接、且位于该会话消息之前的第二会话方的会话消息,获得第二会话方的多条会话消息;对所述第二会话方的多条会话消息分别进行意图识别,获得该会话动作样本对应的第二会话方的各会话意图。
在本公开再一实施方式中,所述根据所述多个历史会话中的第二会话方的会话消息,确定所述各会话动作样本各自在相应会话意图下的动作优先级,包括:针对任一会话动作样本,根据该会话动作样本所来自的各会话消息各自对应的第二会话方是否回复、各会话消息所属历史会话是否达成预定目标动作以及该会话动作样本所来自的各会话消息的数量,确定该会话动作样本在相应会话意图下的动作优先级。
在本公开再一实施方式中,所述根据所述动作名称、动作实体以及动作优先级,获得会话动作样本集合中的多个会话动作样本的多元组,包括:根据所述动作名称、动作实体、会话动作样本所形成的会话消息的类型以及动作优先级,形成所述各会话动作样本的多元组。
根据本公开实施例的另一方面,提供了一种用于辅助实现会话的装置,该装置包括:确定名称和实体模块,用于根据多个历史会话中的第一会话方的会话消息,确定多个会话动作样本的动作名称以及动作实体;确定意图模块,用于根据所述多个历史会话中的第二会话方的会话消息,确定所述各会话动作样本各自对应的第二会话方的会话意图;确定优先级模块,用于根据所述多个历史会话中的第二会话方的会话消息,确定所述各会话动作样本各自在至少一会话意图下的动作优先级;形成样本模块,用于根据所述动作名称、动作实体以及至少一会话意图下的动作优先级,获得会话动作样本集合中的多个会话动作样本的多元组。
在本公开一实施方式中,所述确定名称和实体模块,包括:句式识别子模块,用于对多个历史会话中的第一会话方的文本类型的会话消息进行句式识别,获得疑问句集合和陈述句集合;聚类处理子模块,用于对所述疑问句集合中的疑问句以及陈述句集合中的陈述句分别进行聚类处理,获得多个疑问句类簇以及多个陈述句类簇;设置名称子模块,用于为各疑问句类簇和各陈述句类簇分别设置动作名称;其中,所述会话动作样本的动作名称为其所属类簇的动作名称。
在本公开又一实施方式中,所述聚类处理子模块,包括:情感识别单元,用于利用情感极性预测模型,对所述疑问句集合中的各疑问句以及所述陈述句集合中的各陈述句分别进行情感识别,获得各疑问句的情感信息以及各陈述句的情感信息;聚类处理单元,用于对所述疑问句集合中的情感信息为正向和中性的疑问句、以及所述陈述句集合中的情感信息为正向和中性的陈述句分别进行聚类处理。
在本公开再一实施方式中,所述装置还包括:训练模块,用于训练情感极性预测模型,且所述训练模块包括:第一输入子模块,用于将训练集中的多个文本类型的会话消息样本分别提供给情感极性预测模型;调整参数子模块,用于根据所述情感极性预测模型输出的情感极性预测结果和所述训练集中的会话消息样本的情感极性标签的差异,调整所述情感极性预测模型的模型参数;第二输入子模块,用于将验证集中的多个文本类型的会话消息样本,分别提供给模型参数调整后的情感极性预测模型;修正标签子模块,用于根据所述模型参数调整后的情感极性预测模型输出的情感极性预测结果和所述验证集中的会话消息样本的情感极性标签的差异,修正所述训练集中的会话消息样本的情感极性标签。
在本公开再一实施方式中,所述修正标签子模块进一步用于:根据所述模型参数调整后的情感极性预测模型输出的情感极性预测结果和所述验证集中的会话消息样本的情感极性标签的差异,设置正则表达式;根据所述正则表达式,修正所述训练集中的会话消息样本的情感极性标签。
在本公开再一实施方式中,所述训练模块还包括:第三输入子模块,用于将测试集中的具有情感极性标签的多个会话消息样本,分别提供给模型参数调整后的情感极性预测模型;判断子模块,用于根据所述模型参数调整后的情感极性预测模型输出的情感极性预测结果和所述测试集中的会话消息样本的情感极性标签的差异,判断所述情感极性预测模型是否成功训练完成;触发子模块,用于若所述判断子模块的判断结果为未成功训练完成,则触发所述第一输入子模块,以继续利用所述训练集中的多个会话消息样本对所述情感极性预测模型进行训练。
在本公开再一实施方式中,所述确定名称和实体模块,包括:确定实体子模块,用于对多个历史会话中的第一会话方的文本类型的会话消息进行实体词提取处理,并将提取出的实体词作为该会话消息对应的会话动作样本的动作实体。
在本公开再一实施方式中,所述确定名称和实体模块,包括:确定名称和实体子模块,用于对于多个历史会话中的第一会话方的卡片类型的会话消息,将该会话消息的卡片类型标识对应的预设动作名称,作为该会话消息对应的会话动作样本的动作名称,并将该会话消息对应的会话动作样本的动作实体设置为空。
在本公开再一实施方式中,所述确定名称和实体模块,还包括:合并子模块,用于对具有相同动作名称和相同动作实体的会话动作样本进行合并处理,获得多个会话动作样本。
在本公开再一实施方式中,所述确定意图模块进一步用于:针对任一会话动作样本,确定该会话动作样本所来自的所有会话消息,获得多条会话消息;针对所述多条会话消息中的任一会话消息,确定该会话消息所在的历史会话中的与该会话消息邻接、且位于该会话消息之前的第二会话方的会话消息,获得第二会话方的多条会话消息;对所述第二会话方的多条会话消息分别进行意图识别,获得该会话动作样本对应的第二会话方的各会话意图。
在本公开再一实施方式中,所述确定优先级模块进一步用于:针对任一会话动作样本,根据该会话动作样本所来自的各会话消息各自对应的第二会话方是否回复、各会话消息所属历史会话是否达成预定目标动作以及该会话动作样本所来自的各会话消息的数量,确定该会话动作样本在相应会话意图下的动作优先级。
在本公开再一实施方式中,所述形成样本模块进一步用于:根据所述动作名称、动作实体、会话动作样本所形成的会话消息的类型以及动作优先级,形成所述各会话动作样本的多元组。
根据本公开实施例的再一方面,提供一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序用于执行上述用于辅助实现会话的方法。
根据本公开实施例的又一方面,提供一种电子设备,该电子设备包括:处理器;用于存储所述处理器可执行指令的存储器;所述处理器,用于从所述存储器中读取所述可执行指令,并执行所述指令以实现上述用于辅助实现会话的方法。
基于本公开上述实施例提供的一种用于辅助实现会话的方法和装置,通过设置多元组的会话动作样本,并利用会话动作样本形成会话动作样本集合,使本公开建立了一套基于意图的标准会话动作体系,该标准会话动作体系有利于辅助会话方较好的完成与用户的会话,例如,在房产经纪人等会话方与用户进行会话的过程中,可以基于用户的当前会话消息及其会话意图,采用相应的策略从会话动作样集合中选取出该会话意图下动作优先级较高的相应会话动作样本,并利用选取出的会话动作样本形成会话消息,使房产经纪人等会话方可以在参考该会话消息的基础上,向用户发送会话消息;由于会话动作样本中的动作优先级有利于表征出会话动作样本在相应意图下的会话效果,因此,本公开有利于辅助会话方较好的完成与用户的会话,满足用户需求。由此可知,本公开提供的技术方案有利于辅助房产经纪人等会话方完成与用户的高质量会话,从而有利于达成会话目的,并有利于提高用户的会话体验。
下面通过附图和实施例,对本公开的技术方案做进一步的详细描述。
附图说明
构成说明书的一部分的附图描述了本公开的实施例,并且连同描述一起用于解释本公开的原理。
参照附图,根据下面的详细描述,可以更加清楚地理解本公开,其中:
图1为本公开的适用场景的一个实施例的示意图;
图2为本公开的用于辅助实现会话的方法一个实施例的流程图;
图3为本公开的确定多个会话动作样本的动作名称一个实施例的流程图;
图4为本公开的会话状态跳转图一个实施例的示意图;
图5为本公开的确定第二会话方的会话意图一个实施例的流程图;
图6为本公开的用于辅助实现会话的装置一个实施例的结构示意图;
图7为本公开一示例性实施例提供的电子设备的结构图。
具体实施方式
下面将参考附图详细地描述根据本公开的示例实施例。显然,所描述的实施例仅仅是本公开的一部分实施例,而不是本公开的全部实施例,应理解,本公开不受这里描述的示例实施例的限制。
应注意到:除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本公开的范围。
本领域技术人员可以理解,本公开实施例中的“第一”、“第二”等术语仅用于区别不同步骤、设备或模块等,既不代表任何特定技术含义,也不表示它们之间的必然逻辑顺序。
还应理解,在本公开实施例中,“多个”可以指两个或者两个以上,“至少一个”可以指一个、两个或两个以上。
还应理解,对于本公开实施例中提及的任一部件、数据或结构,在没有明确限定或者在前后文给出相反启示的情况下,一般可以理解为一个或多个。
另外,本公开中术语“和/或”,仅是一种描述关联对象的关联关系,表示可以存在三种关系,如A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本公开中字符“/”,一般表示前后关联对象是一种“或”的关系。
还应理解,本公开对各个实施例的描述着重强调各个实施例之间的不同之处,其相同或相似之处可以相互参考,为了简洁,不再一一赘述。
同时,应当明白,为了便于描述,附图中所示出的各个部分的尺寸并不是按照实际的比例关系绘制的。
以下对至少一个示例性实施例的描述实际上仅仅是说明性的,决不作为对本公开及其应用或使用的任何限制。
对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论,但在适当情况下,所述技术、方法和设备应当被视为说明书的一部分。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步讨论。
本公开的实施例可以应用于终端设备、计算机系统、服务器等电子设备,其可与众多其它通用或者专用计算系统环境或配置一起操作。适于与终端设备、计算机系统或者服务器等电子设备一起使用的众所周知的终端设备、计算系统、环境和/或配置的例子包括但不限于:个人计算机系统、服务器计算机系统、瘦客户机、厚客户机、手持或膝上设备、基于微处理器的系统、机顶盒、可编程消费电子产品、网络个人电脑、小型计算机系统、大型计算机系统和包括上述任何系统的分布式云计算技术环境等等。
终端设备、计算机系统、服务器等电子设备可以在由计算机系统执行的计算机系统可执行指令(诸如程序模块)的一般语境下描述。通常,程序模块可以包括例程、程序、目标程序、组件、逻辑、数据结构等等,它们执行特定的任务或者实现特定的抽象数据类型。计算机系统/服务器可以在分布式云计算环境中实施。在分布式云计算环境中,任务可以是由通过通信网络链接的远程处理设备执行的。在分布式云计算环境中,程序模块可以位于包括存储设备的本地或远程计算系统存储介质上。
本公开概述
在实现本公开的过程中,发明人发现,用户的需求、问题以及说话方式等往往是多样化的,而日常需要通过IM(Instant Messaging,即时消息)等工具,与大量用户进行会话的工作人员(如房产经纪人等)的数量通常较为庞大,工作人员的说话方式以及业务水平往往也是多样化的,如果能够预先建立标准会话动作体系,并在工作人员与用户的会话过程中,利用该标准会话动作体系为工作人员提供参考信息,以辅助每一位工作人员较好的完成与用户的会话,则不仅能够为用户提供更好的服务,也往往能够为工作人员自身以及公司带来一定的收益。
示例性概述
本公开提供的用于辅助实现会话的技术的应用场景的一个例子,如图1所示。
图1中,假设有n1个用户以及n2个房产经纪人,分别为用户100_1、用户100_2、……、用户100_n1、房产经纪人110_1、房产经纪人110_2、……、房产经纪人110_n2;且假设各用户以及各房产经纪人的终端设备分别为终端设备101_1、终端设备101_2、……、终端设备101_n1、终端设备111_1、终端设备111_2、……以及终端设备111_n2。每一个用户均可以通过其终端设备中安装的APP(Application,应用)或者客户端等程序中的IM(InstantMessaging,即时消息)功能,与相应的房产经纪人进行会话。当然,用户也可以通过其终端设备中的浏览器访问房产服务公司提供的网站,并通过该网站中的相应网页中的IM功能与相应的房产经纪人进行会话。
假设用户100_1有租房、房屋出租或者房屋买卖等需求。用户100_1可以通过其终端设备101_1触发该IM(Instant Messaging,即时消息)功能,从而开启了其与一房产经纪人(如房产经纪人110_2)的会话。
在用户100_1与相应房产经纪人110_2的会话过程中,该IM功能可以在参考用户100_1当前发出的会话消息所属的会话意图以及在该会话意图下的各会话动作样本的动作优先级等信息的情况下,从会话动作样本集合选取一会话动作样本,并基于选取出的会话动作样本形成一会话消息(即话术),将该会话消息提供给房产经纪人110_2,当然,该IM公开也可以直接将该会话动作样本提供给房产经纪人110_2;房产经纪人110_2可以在参考IM提供的会话消息或者会话动作样本的情况下,向用户100_1发出其当前会话消息。用户100_1和房产经纪人110_2可以基于上述方式,进行多个对话轮次,从而完成本次会话。
示例性方法
图2为本公开的用于辅助实现会话的方法一个实施例的流程示意图。
如图2所示,该实施例的方法包括步骤:S200、S201、S202以及S203。下面对各步骤分别进行说明。
S200、根据多个历史会话中的第一会话方的会话消息,确定多个会话动作样本的动作名称以及动作实体。
本公开中的历史会话可以是指第一会话方和第二会话方之间的会话。一个历史会话通常会包括:第一会话方的至少一条会话消息以及第二会话方的至少一条会话消息。第一会话方可以是指为用户提供服务的一方,如房产经纪人等。第二会话方可以是指用户一方。
本公开中的第一会话方的会话消息可以是指在历史会话中,由第一会话方向第二会话方发出的会话消息,且第一会话方的会话消息可以是回复第二会话方的问询的会话消息,也可以是向第二会话方提出问询的会话消息。第一会话方的会话消息可以是文本类型的会话消息,也可以是卡片等类型的会话消息。卡片类型的会话消息也可以称为图片类型的会话消息或者名片类型的会话消息等。卡片类型的会话消息可以是指通过点击图片上的信息而执行相应操作的会话消息,例如,通过点击图片而跳转到相应链接(如相应房源链接)的会话消息等。本公开中的会话消息也可以称为会话语句或者会话内容或者话术等。
本公开中的会话动作样本通常用于形成会话消息。本公开中的会话动作样本也可以称为标准会话动作等,且会话动作样本可以为N元组的形式,动作名称以及动作实体分别是N元组中的一元。动作名称可以表示出会话动作样本的主旨或者主要目的,动作名称可以认为是会话动作样本所属的大类。动作实体可以表示出会话动作样本的主旨所针对的具体对象,动作实体可以认为是会话动作样本所属的小类。一个例子,会话动作样本的动作名称可以为“回答房源详情”,且该会话动作样本的动作实体可以为“首付”或者“装修”等。动作实体通常与会话所针对的标的物(如标的物的属性等)相关。例如,在会话所针对的标的物为房屋的情况下,动作实体可以包括:房屋面积、户型、地址、价格、首付以及装修等房屋属性。
本公开可以对一段时间范围内的所有历史会话进行筛选,将筛选出的历史会话作为本公开中的用于确定动作名称和动作实体的历史会话。本公开可以通过对历史会话中的第一会话方的会话消息进行相应的识别分析等处理,获得每一个历史会话中的第一会话方的各会话消息各自对应的会话动作样本的动作名称和动作实体。
S201、根据上述多个历史会话中的第二会话方的会话消息,确定各会话动作样本各自对应的第二会话方的会话意图。
本公开中的第二会话方的会话消息可以是指在历史会话中,由第二会话方向第一会话方发出的会话消息,且第二会话方的会话消息可以是向第一会话方提出问询的会话消息,也可以是回复第一会话方的问询的会话消息。第二会话方的会话消息通常是文本类型的会话消息,当然,本公开也不排除第二会话方的会话消息为卡片等类型的会话消息的可能性。
对于任一会话动作样本而言,该会话动作样本对应的第二会话方的会话意图可以是指:历史会话中的与该会话动作样本所对应的第一会话方的会话消息相邻的第二会话方的会话消息所表达出的意图。本公开可以通过对相应的会话消息进行意图识别等方式,获得各会话动作样本各自对应的第二会话方的会话意图。
S202、根据上述多个历史会话中的第二会话方的会话消息,确定各会话动作样本各自在至少一会话意图下的动作优先级。
在本公开的会话动作样本为N元组的形式的情况下,动作优先级是N元组中的一元。本公开中的动作优先级用于表征会话动作样本在相应会话意图下的会话效果。例如,动作优先级越高表示在相应会话意图下会话效果越好,动作优先级越低表示在相应会话意图下会话效果越差。会话效果可以通过多种因素来体现,例如,可以通过会话动作样本所来自的历史会话所包含的对话轮次、会话动作样本所来自的历史会话是否达成预定会话目的以及历史会话中的第二会话方的满意度等因素体现。对于任一会话动作样本而言,本公开可以确定出该会话动作样本所涉及到的所有会话意图(该会话动作样本可以涉及到一个或者多个会话意图),并确定出该会话动作样本所涉及到的所有历史会话(该会话动作样本可以涉及到一个或者多个历史会话),本公开可以将该会话动作样本所涉及到的所有历史会话基于会话意图进行划分,并基于一会话意图下的所有历史会话中的第二会话方的会话消息所展现出的会话情况,确定出该会话动作样本在该会话意图下的动作优先级。
S203、根据动作名称、动作实体以及至少一会话意图下的动作优先级,获得会话动作样本集合中的多个会话动作样本的多元组。
本公开中的任一会话动作样本均可以使用多元组来表示,且该多元组至少为三元组,即会话动作样本的多元组至少包括:动作名称、动作实体以及基于会话意图的动作优先级。
本公开中的基于会话意图的动作优先级可以包括:多个会话意图下的动作优先级。例如,多元组中的基于会话意图的动作优先级可以为数组的形式,该数组所包括的数组元素的数量可以为所有预设会话意图的数量,该数组所包括的每一个数组元素各自对应一个会话意图,不同数组元素对应不同的会话意图。任一数组元素的取值表示会话动作样本在该数组元素所对应的会话意图下的动作优先级。
本公开通过设置多元组的会话动作样本,并利用会话动作样本形成会话动作样本集合,使本公开建立了一套基于意图的标准会话动作体系,该标准会话动作体系有利于辅助会话方较好的完成与用户的会话,例如,在房产经纪人等会话方与用户进行会话的过程中,可以基于用户的当前会话消息及其会话意图,采用相应的策略从会话动作样集合中选取出该会话意图下动作优先级较高的相应会话动作样本,并利用选取出的会话动作样本形成会话消息,使房产经纪人等会话方可以在参考该会话消息的基础上,向用户发送会话消息;由于会话动作样本中的动作优先级有利于表征出会话动作样本在相应意图下的会话效果,因此,本公开有利于辅助会话方较好的完成与用户的会话,满足用户需求。由此可知,本公开提供的技术方案有利于辅助房产经纪人等会话方完成与用户的高质量会话,从而有利于达成会话目的,并有利于提高用户的会话体验。
在一个可选示例中,本公开的历史会话中的每一条会话消息通常均带有消息类型标识。本公开可以基于消息类型标识确定出历史会话中的每一条会话消息的消息类型。本公开可以将所有历史会话中的所有第一会话方的文本类型的会话消息划分为多个类簇,并为每一个类簇分别设置一个动作名称,一个类簇下的所有第一会话方的会话消息各自对应的会话动作样本的动作名称均为该类簇的动作名称。本公开确定会话动作样本的动作名称的一个例子如图3所示。
图3中,S300、对多个历史会话中的第一会话方的文本类型的会话消息进行句式识别,获得疑问句集合和陈述句集合。
可选的,本公开中的陈述句通常包括:肯定的陈述句(即肯定句)和否定的陈述句(即否定句)。本公开可以采用预设规则和句式分类模型(如Fasttext模型等)相结合的方式,识别出各历史会话中的第一会话方的所有文本类型的会话消息的句式,从而获得疑问句集合和陈述句集合。本公开不限制句式识别的具体实现方式。
一个例子,本公开中的预设规则可以包括:基于疑问句的预设规则。针对任一历史会话中的第一会话方的任一文本类型的会话消息,如果该会话消息与基于疑问句的预设规则相匹配,则可以认为该会话消息的句式为疑问句句式,如果该会话消息没有与基于疑问句的预设规则相匹配,则可以将该会话消息提供给句式分类模型,并根据句式分类模型的输出,确定该会话消息的句式。例如,将句式分类模型输出的概率最大的句式作为该会话消息的句式。
另一个例子,本公开中的预设规则可以包括:基于陈述句的预设规则。针对任一历史会话中的第一会话方的任一文本类型的会话消息,如果该会话消息与基于陈述句的预设规则相匹配,则可以认为该会话消息的句式为陈述句句式。如果该会话消息没有与基于陈述句的预设规则相匹配,则可以将该会话消息提供给句式分类模型,并根据句式分类模型的输出,确定该会话消息的句式。例如,将句式分类模型输出的概率最大的句式作为该会话消息的句式。
再一个例子,本公开中的预设规则可以包括:基于疑问句的预设规则以及基于陈述句的预设规则。针对任一历史会话中的第一会话方的任一文本类型的会话消息,如果该会话消息与基于疑问句的预设规则相匹配,则可以认为该会话消息的句式为疑问句句式,如果该会话消息与基于陈述句的预设规则相匹配,则可以认为该会话消息的句式为陈述句句式。如果该会话消息既没有与基于疑问句的预设规则相匹配,也没有与基于陈述句的预设规则相匹配,则可以将该会话消息提供给句式分类模型,并根据句式分类模型的输出确定该会话消息的句式。如将句式分类模型输出的概率最大的句式作为该会话消息的句式。
S301、对疑问句集合中的疑问句以及陈述句集合中的陈述句分别进行聚类处理,获得多个疑问句类簇以及多个陈述句类簇。
可选的,本公开可以先利用情感极性预测模型,对疑问句集合中的各疑问句以及陈述句集合中的各陈述句分别进行情感识别,从而获得各疑问句的情感信息以及各陈述句的情感信息,之后,本公开可以从疑问句集合中选取出情感信息为正向和中性的所有疑问句,并从陈述句集合中选取出情感信息为正向和中性的所有陈述句;然后,本公开对选取出的情感信息为正向和中性的所有疑问句进行聚类处理(如kmeans聚类处理等,即k均值聚类处理),并对选取出的情感信息为正向和中性的所有陈述句进行聚类处理。聚类处理的过程在此不再详细说明。
需要特别说明的是,本公开在执行聚类处理过程中,通常需要将陈述句以及疑问句中的词分别转换为词向量,并对使用词向量表示的所有陈述句以及所有疑问句分别进行聚类处理。在将陈述句以及疑问句中的词转换为词向量时,可以先去除陈述句以及疑问句中的语气词等非关键词,然后,再将陈述句以及疑问句中的保留下来的关键词分别转换为词向量。当然,本公开也可以保留陈述句和疑问句中的所有的词,并将陈述句和疑问句中的所有词分别转换为词向量。另外,本公开中的情感识别过程可以在S300之前执行,即先对所有历史会话中的第一会话方的所有会话消息分别进行情感识别处理,并保留情感信息为正向和中性的会话消息,之后,对保留下来的会话消息进行句式识别。
可选的,本公开中的情感极性预测模型可以针对每一个输入的会话消息输出三个概率值,即会话消息的情感信息为正向的概率、会话消息的情感信息为负向的概率、以及会话消息的情感信息为中性的概率。本公开可以将概率最高的情感信息作为输入的会话消息的情感信息。本公开也可以将概率最高,且达到预设阈值的情感信息作为输入的会话消息的情感信息。本公开中的情感极性预测模型的训练过程的一个例子,可以参见下述针对图4的描述。
本公开通过筛除情感信息为负向的所有疑问句和所有陈述句,有利于避免基于情感信息为负向的会话消息产生会话动作样本的现象,从而有利于提高会话动作样本的会话效果。
S302、为各疑问句类簇和各陈述句类簇分别设置动作名称。
可选的,本公开可以将各疑问句类簇以及各陈述句类簇分别提供给标注平台,并根据标注平台返回的标注结果,获得每一个疑问句类簇的动作名称以及每一个陈述句类簇的动作名称。一个疑问句类簇的动作名称即为该疑问句类簇中的每一条会话消息各自对应的会话动作样本的动作名称。
本公开通过对第一会话方的文本类型的会话消息进行句式识别,并针对陈述句和疑问句分别进行聚类处理,可以从大量的会话消息中,便捷的获得用于问询的会话动作样本的动作名称以及用于陈述的会话动作样本的动作名称,从而有利于提高建立标准会话动作体系的效率。
在一个可选示例中,本公开可以利用文本类型的会话消息样本对情感极性预测模型进行训练。训练情感极性预测模型的一个过程如图4所示。
图4中,S400、开始对情感极性预测模型进行训练。
S401、将训练集中的多个文本类型的会话消息样本分别提供给情感极性预测模型。
可选的,本公开的训练集中的会话消息样本均为文本类型,且训练集中的会话消息样本均具有情感极性标签。本公开可以利用开源的中文情感分析平台对各会话消息样本分别进行标注处理,从而获得每一个会话消息样本的情感极性标签。对于房产领域而言,本公开可以准备多个房产经纪人以及多个用户的会话消息样本,并利用中文情感分析平台获得每一个会话消息样本的情感极性标签。
可选的,训练集中的会话消息样本可以在使用词向量表示后,提供给情感极性预测模型。词向量的维度通常由情感极性预测模型的超参数决定。
可选的,本公开的训练集中的会话消息样本的情感极性标签可能存在不准确的现象,例如,由于中文情感分析平台对特定领域(如房产领域等)的会话消息的标注准确性通常会存在一定程度的欠缺,从而导致训练集中的会话消息样本的情感极性标签的准确性存在一定程度的欠缺。本公开可以利用后续的步骤对训练集中的会话消息样本的情感极性标签进行校正。校正前的情感极性标签可以称为预标注情感极性标签或者情感极性初始标签等。
可选的,本公开中的情感极性预测模型可以为基于FastText(快速文本)分类算法的模型(即FastText模型或者FastText分类器)。本公开一次提供给情感极性预测模型的会话消息样本的数量可以根据预先设定的批处理数量来确定。例如,一次从训练集中获取十分之一的会话消息样本。一次提供给情感极性预测模型的会话消息样本分别被作为模型输入,顺序提供给情感极性预测模型,经由情感极性预测模型针对输入的每一个会话消息样本分别进行情感极性预测处理,并针对每一个会话消息样本分别输出情感极性预测结果。
S402、根据情感极性预测模型输出的情感极性预测结果和训练集中的会话消息样本的情感极性标签的差异,调整情感极性预测模型的模型参数。
可选的,本公开可以根据情感极性预测模型输出的情感极性预测结果和训练集中的相应会话消息样本的情感极性标签的差异,利用基于交叉熵的损失函数计算损失(即计算交叉熵),并在情感极性预测模型中反向传播该损失,以便于调整情感极性预测模型的模型参数。
可选的,本公开中的模型参数可以是指:模型的隐层的用于将输入的稀疏向量转换为具有第一预定维度的稠密向量的第一矩阵、以及输出层的用于将隐层输出的稠密向量转换为具有第二预定维度的向量的第二矩阵。第二预定维度与本公开对会话消息样本进行情感极性分类的分类数量相关。例如,在情感极性包括正向、负向和中性的情况下,第二预定维度即为3。本公开中的模型参数不包括情感极性预测模型的超参数。
S403、将验证集中的多个文本类型的会话消息样本,分别提供给模型参数调整后的情感极性预测模型。
可选的,本公开的验证集中的会话消息样本可以与训练集中的会话消息样本部分相同,也可以与训练集中的会话消息样本完全不相同。验证集中的各会话消息样本均具有情感极性标签。本公开中的验证集中的各会话消息样本的情感极性标签可以是采用人工标注方式设置的标签。例如,将验证集中的各会话消息样本均提供给众标平台,从而本公开可以从众标平台处获得各会话消息样本的情感极性标签。本公开的验证集中的会话消息样本的情感极性标签可以被认为是准确的标签。验证集所包含的会话消息样本的数量往往小于训练集所包含的会话消息样本的数量。例如,验证集包含3000条会话消息样本,而训练集包含30000条会话消息样本。
可选的,本公开一次从验证集中获取到的会话消息样本的数量,可以根据预先设定的批处理数量来确定。例如,一次从验证集中获取五分之一的会话消息样本。一次从验证集中获取到的所有会话消息样本,均被作为参数调整后的情感极性预测模型的输入,并顺序提供给参数调整后的情感极性预测模型,经由参数调整后的情感极性预测模型针对输入的每一个会话消息样本分别进行情感极性预测处理,并针对每一个会话消息样本分别输出情感极性预测结果。
S404、根据模型参数调整后的情感极性预测模型输出的情感极性预测结果和验证集中的会话消息样本的情感极性标签的差异,修正训练集中的会话消息样本的情感极性标签。
可选的,由于本公开的验证集中的会话消息样本的情感极性标签被认为是准确的标签,因此,如果参数调整后的情感极性预测模型针对一会话消息样本输出的情感极性预测结果与验证集中的该会话消息样本的情感极性标签不相同,则可以认为当前参数调整后的情感极性预测模型的情感极性预测结果不正确。产生该不正确的原因有可能包括:训练集中的会话消息样本的情感极性标签不正确,导致情感极性预测模型的模型参数未被调整到恰当的取值。
可选的,本公开可根据参数调整后的情感极性预测模型输出的情感极性预测结果和验证集中的会话消息样本的情感极性标签的差异,确定出训练集中的情感极性标签存在错误的会话消息样本,并对这些会话消息样本的情感极性标签进行修正。
可选的,本公开可以根据参数调整后的情感极性预测模型输出的情感极性预测结果和验证集中的相应会话消息样本的情感极性标签之间的差异,确定出一个会话消息样本集合。为便于描述,下述将该历史会话集合称为badcase集合。该badcase集合所包含的会话消息样本为:验证集中的被情感极性预测模型预测错误的会话消息样本。本公开可以根据badcase集合中的会话消息样本及其情感极性标签,设置相应的正则表达式,并利用该正则表达式,修正训练集中的相应会话消息样本的情感极性标签,从而使训练集中的会话消息样本的情感极性标签逐渐被修正。具体的,本公开可以利用正则表达式对训练集中的所有会话消息样本进行遍历,从而对训练集中的与正则表达式相匹配的会话消息样本的情感极性标签进行修正。另外,随着迭代次数的不断增加,badcase集合中的会话消息样本的数量通常会逐渐减少。
可选的,本公开中的正则表达式可以是针对句子结构的正则表达式,也可以是针对关键词的正则表达式。另外,本公开设置的正则表达式可以为一个或者多个。本公开不限定正则表达式的具体表现形式。
可选的,本公开还可以根据参数调整后的情感极性预测模型输出的情感极性预测结果和验证集中的相应会话消息样本的情感极性标签之间的差异,调整当前情感极性预测模型的超参数。本公开的情感极性预测模型的超参数可以包括但不限于:利用训练集中的会话消息样本对情感极性预测模型进行训练的次数、情感极性预测模型所采用的N-Gram(N元语法)、以及情感极性预测模型的隐含层输出的向量的初始化维度等。本公开在图4所示的一次循环过程中,通常只调整超参数中的其中一个参数,在经过多次循环过程后,如果认为该参数已经不需要再调整了,则再在后续的循环过程中调整超参数中的另一个参数。以此类推,直到认为超参数中的所有参数均不需要再调整。
可选的,S404调整当前情感极性预测模型的超参数的一个例子可以为:判断参数调整后的情感极性预测模型输出的情感极性预测结果和验证集中的会话消息样本的情感极性标签的差异与前次循环过程中的S404获得的差异是否大致相同(例如,本次差异与前次差异之间的区别属于预定范围),如果大致相同,则认为前次循环过程中调整的第i个参数不需要再调整,本次可以对超参数中的第i+1个参数的数值进行调整。例如,可以先将第i+1个参数的数值设置成一个较小值。如果不是大致相同,则认为前次循环过程中调整的第i个参数仍然需要调整。例如,在前次循环过程中,第i个参数设置的较小的情况下,本次可以将第i个参数调大一些。
本公开通过利用验证集对训练集中的会话消息样本的情感极性标签进行修正,有利于避免预先必须对训练集中的各会话消息样本进行精确标注的现象,从而有利于快速获得训练集;由于验证集中的会话消息样本的数量通常远小于训练集中的会话消息样本的数量,因此,本公开有利于降低对会话消息样本进行人工标注的工作量。最终本公开有利于提高情感极性预测模型的训练效率。
S405、将测试集中的具有情感极性标签的多个会话消息样本,分别提供给模型参数调整后的情感极性预测模型。
可选的,本公开的测试集中的会话消息样本最好与验证集中的会话消息样本完全不相同。测试集中的各会话消息样本均具有情感极性标签。本公开中的测试集中的各会话消息样本的情感极性标签可以是采用人工标注方式设置的标签。例如,将测试集中的各会话消息样本均提供给众标平台,从而本公开可以从众标平台处获得各会话消息样本的情感极性标签。本公开的测试集中的会话消息样本的情感极性标签可以被认为是准确的标签。测试集所包含的会话消息样本的数量往往小于训练集所包含的会话消息样本的数量。例如,测试集包含3000条会话消息样本,而训练集包含30000条会话消息样本。
可选的,本公开一次从测试集中获取到的会话消息样本的数量,可以根据预先设定的批处理数量来确定。例如,一次从测试集中获取五分之一的会话消息样本。一次从测试集中获取到的所有会话消息样本,均被作为参数调整后的情感极性预测模型的输入,并顺序提供给参数调整后的情感极性预测模型,经由参数调整后的情感极性预测模型针对输入的每一个会话消息样本分别进行情感极性预测处理,并针对每一个会话消息样本分别输出情感极性预测结果。
S406、根据模型参数调整后的情感极性预测模型输出的情感极性预测结果和测试集中的会话消息样本的情感极性标签的差异,确定当前情感极性预测模型的预测准确率。
可选的,由于本公开的测试集中的会话消息样本的情感极性标签被认为是准确的标签,因此,如果参数调整后的情感极性预测模型针对一会话消息样本输出的情感极性预测结果与测试集中的该会话消息样本的情感极性标签不相同,则可以认为当前参数调整后的情感极性预测模型的情感极性预测结果不正确。产生该不正确的原因有可能包括:训练集中的会话消息样本的情感极性标签不正确,导致情感极性预测模型的模型参数未被调整到恰当的取值。
可选的,本公开可根据参数调整后的情感极性预测模型输出的情感极性预测结果和测试集中的会话消息样本的情感极性标签的差异,统计出参数调整后的情感极性预测模型预测错误的会话消息样本的数量,并基于该数量,确定出当前情感极性预测模型的预测准确率。例如,将统计出的上述数量与本次从测试集中获取的会话消息样本的数量的比值,作为当前情感极性预测模型的预测准确率。
S407、判断当前情感极性预测模型的预测准确率是否达到预定准确率,如果达到预定准确率,则确定情感极性预测模型成功训练完成,到S408;如果未达到预定准确率,则确定情感极性预测模型未成功训练完成,返回S401。
可选的,本公开中的预定准确率为预先设置的数值,如90%等。在未达到预定准确率的情况下,本次迭代训练过程结束,开始下一次迭代训练过程。如果迭代训练的次数已经达到预定迭代次数,然而,当前情感极性预测模型的预测准确率仍然未达到预定准确率,则结束对情感极性预测模型的训练。
本公开通过利用测试集来判断情感极性预测模型是否成功训练完成,有利于避免情感极性预测模型在训练过程中出现过拟合现象,从而有利于提高情感极性预测模型的预测准确性。
S408、结束对情感极性预测模型的训练。
在一个可选示例中,本公开可以利用提取实体词的方式获得会话动作样本的动作实体。即对于任一历史会话中的第一会话方的文本类型的任一会话消息,本公开可以对该会话消息进行实体词提取处理,并将提取出的实体词作为该会话消息对应的会话动作样本的动作实体。例如,本公开可以同时采用两种或者更多种方式对会话消息进行实体词提取处理,并对通过不同方式提取出的实体词进行合并以及基于预设规则的筛选等进一步处理,从而获得最终的实体词,最终的实体词即动作实体。本公开可以采用biLSTM_CRF(双向长短期记忆网络_条件随机场)以及基于字典的识别等方式对会话消息进行实体词提取处理。
可选的,在不同领域,实体词的内容有所不同,例如,在房地产领域,本公开中的实体词可以为面积、户型、地址以及价格等。本公开可以根据领域的实际需求,预先设置多个实体词,并根据预先设置的实体词设置相应的规则。如果通过实体词提取处理无法从会话消息中获得任何实体词,则可以认为该会话消息对应的会话动作样的动作实体为空。本公开通过提取实体词,可以快速便捷的为每一个会话动作样本分别设置动作实体。
在一个可选示例中,本公开中的消息类型标识可以包括:多种不同的卡片类型标识,如房源推荐卡片类型标识以及税费卡片类型标识等。本公开中的每一种卡片类型标识分别对应有一个预设动作名称。即本公开可以预先针对每一种卡片类型标识分别设置一个动作名称,从而对于卡片类型的会话消息,本公开可以先识别该会话消息的卡片类型标识,并将该卡片类型标识所对应的预设动作名称作为该会话消息对应的会话动作样本的动作名称,卡片类型的会话消息所对应的会话动作样本的动作实体通常为空。本公开通过利用会话消息的卡片类型标识,可以快速的形成卡片类型的会话消息所对应的会话动作样本,从而有利于提高形成标准会话动作体系的效率。
在一个可选示例中,本公开在获得多条会话消息各自对应的会话动作样本之后,可以对所有会话动作样本进行合并处理,即具有相同动作名称和相同动作实体的会话动作样本被合并为一个会话动作样本,从而可以消除重复的会话动作样本,从而有利于消除标准会话动作体系中的会话动作样本的冗余显现。如果两个会话动作样本具有相同动作名称(如回答房屋详情),但是动作实体不相同(如一个为面积,另一个为户型),则这两个会话动作样本不能被合并成为一个会话动作样本。合并处理后的会话动作样本即为本公开的标准会话动作体系中的会话动作样本。
在一个可选示例中,针对任一会话动作样本,本公开确定该会话动作样本对应的第二会话方的会话意图的一个实现方式可以如图5所示。
图5中,S500、针对任一会话动作样本,确定该会话动作样本所来自的所有会话消息,获得多条会话消息。
可选的,本公开中的会话动作样本所来自的会话消息可以是指从中提取出动作名称和动作实体的会话消息。会话动作样本所来自的会话消息可以为文本类型的会话消息,也可以为卡片类型的会话消息。由于本公开对会话动作样本进行了合并处理操作,使本公开中的一条会话动作样本通常会对应有多条会话消息,这多条会话消息均为该会话动作样本所来自的会话消息。当然,本公开并不排除一个会话动作样本对应一条会话消息的情况。
S501、针对上述获得的多条会话消息中的任一会话消息,确定该会话消息所在的历史会话中的与该会话消息邻接、且位于该会话消息之前的第二会话方的会话消息,从而获得第二会话方的多条会话消息。
可选的,本公开在S500中获得的每一条会话消息分别属于一历史会话,一条会话消息所属的历史会话即为该会话消息所在的历史会话。
一个具体的例子,假设S500中获得的一会话消息所在的历史会话包括:第一历史会话,第二历史会话和第三历史会话。假设将第一历史会话、第二历史会话和第三历史会话中的所有会话消息,按照会话消息发送时间的先后顺序分别进行排序,假设S500中获得的该会话消息在第一历史会话中的顺序号为i1,在第二历史会话中的顺序号为i2,在第三历史会话中的顺序号为i3,如果第一历史会话中的顺序号为i1-1的会话消息为第二会话方的会话消息,第二历史会话中的顺序号为i2-1的会话消息为第二会话方的会话消息,第三历史会话中的顺序号为i3-1的会话消息为第二会话方的会话消息,则本公开可以将第一历史会话中的顺序号为i1-1的会话消息、第二历史会话中的顺序号为i2-1的会话消息和第三历史会话中的顺序号为i3-1的会话消息作为S501获得的第二会话方的多条会话消息。
S502、对上述第二会话方的多条会话消息分别进行意图识别,获得该会话动作样本对应的各会话意图。
可选的,本公开可以使用神经网络模型,获得第二会话方的各会话消息的意图。一个例子,本公开可以先将第二会话方的会话消息所包含的所有词(或者所有关键词)均使用词向量表示,然后,将该会话消息所包含的所有词向量作为神经网络模型的输入提供给神经网络模型,经由该神经网络模型对该会话消息进行意图预测处理(如编解码处理等),本公开可以根据神经网络模型输出的意图预测处理结果获得该会话消息的意图。例如,针对预先设置的所有意图(如几十或几百个意图等),神经网络模型输出其预测会话消息为不同意图的置信度,本公开可以将最高置信度对应的意图作为该会话消息的意图。例如,假设会话消息为“几楼的”,则本公开获得的该会话消息的意图可以为询问楼层。再例如,假设会话消息为“预算250万左右”,则本公开获得的该会话消息的意图可以为搜索房源。
可选的,本公开可以根据实际业务可能涉及到的多种意图,来设置上述所有意图。例如,对于房产领域而言,房屋租售业务可能涉及到用于询问首付的意图、用于询问是否出售的意图、用于询问楼层的意图、用于搜索房源的意图、用于房源推荐的意图、用于询问总价的意图、用于询问是否有钥匙的意图以及用于表示转委托的意图等。
可选的,本公开中的神经网络模型可以是利用历史会话中的会话消息样本成功训练获得的神经网络模型,且会话消息样本带有意图标注。会话消息样本的意图标注用于计算待训练神经网络模型的预测结果的损失,以便于利用该损失调整待训练神经网络模型的网络参数(如权重矩阵等)。该神经网络模型的训练过程在此不再详细说明。
由于会话动作样本对应的第一会话方的会话消息,通常与历史会话中的相应的第二会话方的会话消息具有关联,因此,本公开利用第二会话方的会话消息的意图,可以准确的获得会话动作样本对应的各会话意图。
在一个可选示例中,针对任一会话动作样本而言,本公开可以根据该会话动作样本所来自的各会话消息各自对应的第二会话方是否回复、各会话消息所属历史会话是否达成预定目标动作、以及该会话动作样本所来自的各会话消息的数量,确定该会话动作样本在相应会话意图下的动作优先级。其中的第二会话方是否回复以及历史会话是否达成预定目标动作是决定动作优先级的指标,例如,如果第二会话方存在回复,则相应的会话动作样本在相应会话意图下的动作优先级会被增加第一分数(如10分)等。其中的会话消息的数量用于计算在达成预定目标动作的情况下,第一会话方的每个动作的平均贡献。例如,如果一历史会话达成预定目标动作,则统计该历史会话中的第一会话方的会话消息的数量,并计算第二分数(如100分)与该数量的商,将相应的会话动作样本在相应会话意图下的动作优先级增加上述商值。本公开中的预定目标动作可以根据实际需求设置,如预定目标动作可以为用户留下联系方式、成功转委托、或者成功预约实地看房等。本公开不限制预定目标动作的具体内容。
一个具体的例子,假设一会话动作样本来自10条会话消息,这10条会话消息分别为第一会话消息、第二会话消息、……以及第十会话消息。假设这10条会话消息分别属于10个历史会话,即第一历史会话、第二历史会话、……以及第十历史会话。假设在前五个历史会话中,第二会话方针对上述第一会话消息至第五会话消息分别进行了回复,假设在后五个历史会话中,第二会话方针对上述第六会话消息至第十会话消息均未进行回复,假设只有第一历史会话达成了预定目标动作,且第一历史会话包括m条第一会话方的会话消息。假设第一会话消息至第三会话消息均对应第一会话意图,假设第四会话消息至第六会话消息均对应第二会话意图,假设第七会话消息至第十会话消息均对应第三会话意图。在上述假设情况下:该会话动作样本在第一会话意图下的动作优先级为:S2/m+3×S1;该会话动作样本在第二会话意图下的动作优先级为:2×S1;该会话动作样本在第三会话意图下的动作优先级为:0。其中的S1表示第一分数,其中的S2表示第二分数。
在一个可选示例中,本公开中的会话动作样本可以为由动作名称、动作实体以及动作优先级形成的三元组。本公开的会话动作样也可以为由动作名称、动作实体、会话动作样本所形成的会话消息的类型以及动作优先级形成的四元组。其中的会话动作样本所形成的会话消息的类型可以包括:文本类型以及卡片类型等。会话消息的类型用于表示基于该会话动作样本所形成的会话消息的呈现形式。本公开通过将会话消息的类型作为会话动作样本的多元组中的一元,有利于丰富会话消息的展现形式。
在一个可选示例中,本公开在建立标准会话动作体系之后,本公开可以对标准会话动作体系中的会话动作样本进行维护更新。具体的,本公开可以采用在线更新方式对标准会话动作体系中的会话动作样本进行维护更新,也可以采用线下更新方式对标准会话动作体系中的会话动作样本进行维护更新。
可选的,本公开的在线维护更新的一个例子可以为:在第一会话方与第二会话方的会话过程中,可以随时根据第二会话方发送的会话消息,为第一会话方提供相应的会话动作样本,并检测第二会话方是否针对该会话动作样本进行了回复,如果第二会话方针对该会话动作样本进行了回复,则本公开可以实时的调整该会话动作样本在相应会话意图下的动作优先级。另外,在本次会话结束时,本公开可以检测本次会话是否达成了预定目标动作,并根据检测结果,实时的调整本次会话中的各会话动作样本在相应会话意图下的动作优先级。
可选的,本公开的线下维护更新的一个例子可以为:针对新的历史会话,本公开可以计算新的历史会话中的第一会话方的文本类型的各会话消息分别与当前所有类簇的中心的距离,对于一文本类型的会话消息而言,如果该会话消息的最近距离满足预定距离要求,则可以认为该会话消息属于该最近距离的类簇,从而本公开可以获知该会话消息所对应的会话动作样本的动作名称,之后,如果该会话消息的动作实体以及该会话消息所对应的会话意图已经存在于该会话消息对应的会话动作样本的多元组中,则本公开可以仅更新该会话动作样本的动作优先级;如果该会话消息的动作实体未存在于该会话消息对应的会话动作样本的多元组中,则本公开可以增加新的会话动作样本;如果该会话消息所对应的会话意图未存在于相应的会话动作样本的多元组中,则本公开可以在相应会话动作样本的多元组中增加新的会话意图以及在新的会话意图下的动作优先级。对于新的历史会话中的卡片类型的会话消息,本公开的维护更新主要包括:增加新的会话动作样本以及更新现有的会话动作样本在相应会话意图下的动作优先级。
示例性装置
图6为本公开的用于辅助实现会话的装置一个实施例的结构示意图。该实施例的装置可用于实现本公开上述各方法实施例。
如图6所示,该实施例的装置主要包括:确定名称和实体模块600、确定意图模块601、确定优先级模块602以及形成样本模块603。可选的,该装置还可以包括:训练模块604。
确定名称和实体模块600用于根据多个历史会话中的第一会话方的会话消息,确定多个会话动作样本的动作名称以及动作实体。
可选的,确定名称和实体模块600可以包括:句式识别子模块6001、聚类处理子模块6002、设置名称子模块6003、确定实体子模块6004、确定名称和实体子模块6005以及合并子模块6006。其中的句式识别子模块6001用于对多个历史会话中的第一会话方的文本类型的会话消息进行句式识别,获得疑问句集合和陈述句集合。其中的聚类处理子模块6002用于对疑问句集合中的疑问句以及陈述句集合中的陈述句分别进行聚类处理,获得多个疑问句类簇以及多个陈述句类簇。例如,聚类处理子模块6002可以包括:情感识别单元60021以及聚类处理单元60022。其中的情感识别单元60021用于利用情感极性预测模型,对疑问句集合中的各疑问句以及所述陈述句集合中的各陈述句分别进行情感识别,获得各疑问句的情感信息以及各陈述句的情感信息。其中的聚类处理单元60022用于对疑问句集合中的情感信息为正向和中性的疑问句、以及陈述句集合中的情感信息为正向和中性的陈述句分别进行聚类处理。其中的设置名称子模块6003用于为各疑问句类簇和各陈述句类簇分别设置动作名称。其中的会话动作样本的动作名称为其所属类簇的动作名称。其中的确定实体子模块6004用于对多个历史会话中的第一会话方的文本类型的会话消息进行实体词提取处理,并将提取出的实体词作为该会话消息对应的会话动作样本的动作实体。其中的确定名称和实体子模块6005,用于对于多个历史会话中的第一会话方的卡片类型的会话消息,将该会话消息的卡片类型标识对应的预设动作名称,作为该会话消息对应的会话动作样本的动作名称,并将该会话消息对应的会话动作样本的动作实体设置为空。合并子模块6006用于对具有相同动作名称和相同动作实体的会话动作样本进行合并处理,获得多个会话动作样本。
确定意图模块601用于根据多个历史会话中的第二会话方的会话消息,确定各会话动作样本各自对应的第二会话方的会话意图。例如,针对任一会话动作样本,确定意图模块601可以确定该会话动作样本所来自的所有会话消息,获得多条会话消息,针对多条会话消息中的任一会话消息,确定意图模块601确定该会话消息所在的历史会话中的与该会话消息邻接、且位于该会话消息之前的第二会话方的会话消息,获得第二会话方的多条会话消息,确定意图模块601对第二会话方的多条会话消息分别进行意图识别,获得该会话动作样本对应的第二会话方的各会话意图。
确定优先级模块602用于根据多个历史会话中的第二会话方的会话消息,确定各会话动作样本各自在至少一会话意图下的动作优先级。例如,针对任一会话动作样本,确定优先级模块602可以根据该会话动作样本所来自的各会话消息各自对应的第二会话方是否回复、各会话消息所属历史会话是否达成预定目标动作以及该会话动作样本所来自的各会话消息的数量,确定该会话动作样本在相应会话意图下的动作优先级。
形成样本模块603用于根据动作名称、动作实体以及至少一会话意图下的动作优先级,获得会话动作样本集合中的多个会话动作样本的多元组。例如,形成样本模块603可以根据动作名称、动作实体、会话动作样本所形成的会话消息的类型以及动作优先级,形成各会话动作样本的多元组。
训练模块604用于训练情感极性预测模型。且该训练模块604可以包括:第一输入子模块6041、调整参数子模块6042、第二输入子模块6043、修正标签子模块6044、第三输入子模块6045、判断子模块6046和触发子模块6047。其中的第一输入子模块6041用于将训练集中的多个文本类型的会话消息样本分别提供给情感极性预测模型。其中的调整参数子模块6042用于根据情感极性预测模型输出的情感极性预测结果和训练集中的会话消息样本的情感极性标签的差异,调整情感极性预测模型的模型参数。其中的第二输入子模块6043用于将验证集中的多个文本类型的会话消息样本,分别提供给模型参数调整后的情感极性预测模型。其中的修正标签子模块6044用于根据模型参数调整后的情感极性预测模型输出的情感极性预测结果和验证集中的会话消息样本的情感极性标签的差异,修正训练集中的会话消息样本的情感极性标签。例如,修正标签子模块6044可以根据模型参数调整后的情感极性预测模型输出的情感极性预测结果和验证集中的会话消息样本的情感极性标签的差异,设置正则表达式,并根据该正则表达式修正所述训练集中的会话消息样本的情感极性标签。其中的第三输入子模块6045用于将测试集中的具有情感极性标签的多个会话消息样本,分别提供给模型参数调整后的情感极性预测模型。其中的判断子模块6046用于根据模型参数调整后的情感极性预测模型输出的情感极性预测结果和测试集中的会话消息样本的情感极性标签的差异,判断情感极性预测模型是否成功训练完成。其中的触发子模块6047用于若判断子模块6046的判断结果为未成功训练完成,则触发第一输入子模块6041,以便于继续利用训练集中的多个会话消息样本对情感极性预测模型进行训练。
本公开的装置所包含的各模块、各子模块以及各单元具体执行的操作,可以参见上述方法实施例中的相关描述,在此不再详细说明。
示例性电子设备
下面参考图7来描述根据本公开实施例的电子设备。图7示出了根据本公开实施例的电子设备的框图。如图7所示,电子设备71包括一个或多个处理器711和存储器712。
处理器711可以是中央处理单元(CPU)或者具有用于辅助实现会话的能力和/或指令执行能力的其他形式的处理单元,并且可以控制电子设备71中的其他组件以执行期望的功能。
存储器712可以包括一个或多个计算机程序产品,所述计算机程序产品可以包括各种形式的计算机可读存储介质,例如易失性存储器和/或非易失性存储器。所述易失性存储器,例如,可以包括:随机存取存储器(RAM)和/或高速缓冲存储器(cache)等。所述非易失性存储器,例如,可以包括:只读存储器(ROM)、硬盘以及闪存等。在所述计算机可读存储介质上可以存储一个或多个计算机程序指令,处理器711可以运行所述程序指令,以实现上文所述的本公开的各个实施例的用于辅助实现会话的方法以及/或者其他期望的功能。在所述计算机可读存储介质中还可以存储诸如输入信号、信号分量、噪声分量等各种内容。
在一个示例中,电子设备71还可以包括:输入装置713以及输出装置714等,这些组件通过总线系统和/或其他形式的连接机构(未示出)互连。此外,该输入设备713还可以包括例如键盘、鼠标等等。该输出装置714可以向外部输出各种信息。该输出设备714可以包括例如显示器、扬声器、打印机、以及通信网络及其所连接的远程输出设备等等。
当然,为了简化,图7中仅示出了该电子设备71中与本公开有关的组件中的一些,省略了诸如总线、输入/输出接口等等的组件。除此之外,根据具体应用情况,电子设备71还可以包括任何其他适当的组件。
示例性计算机程序产品和计算机可读存储介质
除了上述方法和设备以外,本公开的实施例还可以是计算机程序产品,其包括计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行本说明书上述“示例性方法”部分中描述的根据本公开各种实施例的用于辅助实现会话的方法中的步骤。
所述计算机程序产品可以以一种或多种程序设计语言的任意组合来编写用于执行本公开实施例操作的程序代码,所述程序设计语言包括面向对象的程序设计语言,诸如Java、C++等,还包括常规的过程式程序设计语言,诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。
此外,本公开的实施例还可以是计算机可读存储介质,其上存储有计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行本说明书上述“示例性方法”部分中描述的根据本公开各种实施例的用于辅助实现会话的方法中的步骤。
所述计算机可读存储介质可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以包括但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列举)可以包括:具有一个或者多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
以上结合具体实施例描述了本公开的基本原理,但是,需要指出的是,在本公开中提及的优点、优势、效果等仅是示例而非限制,不能认为这些优点、优势以及效果等是本公开的各个实施例必须具备的。另外,上述公开的具体细节仅是为了示例的作用和便于理解的作用,而非限制,上述细节并不限制本公开为必须采用上述具体的细节来实现。
本说明书中各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似的部分相互参见即可。对于系统实施例而言,由于其与方法实施例基本对应,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本公开中涉及的器件、装置、设备、系统的方框图仅作为例示性的例子并且不意图要求或暗示必须按照方框图示出的方式进行连接、布置、配置。如本领域技术人员将认识到的,可以按任意方式连接、布置、配置这些器件、装置、设备以及系统。诸如“包括”、“包含、“具有”等等的词语是开放性词汇,指“包括但不限于”,且可与其互换使用。这里所使用的词汇“或”和“和”指词汇“和/或”,且可与其互换使用,除非上下文明确指示不是如此。这里所使用的词汇“诸如”指词组“诸如但不限于”,且可与其互换使用。
可能以许多方式来实现本公开的方法和装置。例如,可通过软件、硬件、固件或者软件、硬件、固件的任何组合来实现本公开的方法和装置。用于所述方法的步骤的上述顺序仅是为了进行说明,本公开的方法的步骤不限于以上具体描述的顺序,除非以其它方式特别说明。此外,在一些实施例中,还可将本公开实施为记录在记录介质中的程序,这些程序包括用于实现根据本公开的方法的机器可读指令。因而,本公开还覆盖存储用于执行根据本公开的方法的程序的记录介质。
还需要指出的是,在本公开的装置、设备和方法中,各部件或各步骤是可以分解和/或重新组合的。这些分解和/或重新组合应视为本公开的等效方案。
提供所公开的方面的以上描述,以使本领域的任何技术人员能够做出或者使用本公开。对这些方面的各种修改等对于本领域技术人员而言,是非常显而易见的,并且在此定义的一般原理可以应用于其他方面,而不脱离本公开的范围。因此,本公开不意图被限制到在此示出的方面,而是按照与在此公开的原理和新颖的特征一致的最宽范围。
为了例示和描述的目的已经给出了以上描述。此外,此描述不意图将本公开的实施例限制到在此公开的形式中。尽管以上已经讨论了多个示例方面以及实施例,但是本领域技术人员将认识到其某些变型、修改、改变、添加和子组合。
Claims (24)
1.一种用于辅助实现会话的方法,包括:
根据多个历史会话中的第一会话方的会话消息,确定多个会话动作样本的动作名称以及动作实体;
根据所述多个历史会话中的第二会话方的会话消息,确定所述各会话动作样本各自对应的第二会话方的会话意图;
根据所述多个历史会话中的第二会话方的会话消息,确定所述各会话动作样本各自在至少一会话意图下的动作优先级;所述根据所述多个历史会话中的第二会话方的会话消息,确定所述各会话动作样本各自在至少一会话意图下的动作优先级包括:针对任一会话动作样本,根据该会话动作样本所来自的各会话消息各自对应的第二会话方是否回复、各会话消息所属历史会话是否达成预定目标动作以及该会话动作样本所来自的各会话消息的数量,确定该会话动作样本在相应会话意图下的动作优先级;
根据所述动作名称、动作实体以及至少一会话意图下的动作优先级,获得会话动作样本集合中的多个会话动作样本的多元组。
2.根据权利要求1所述的方法,其中,所述根据多个历史会话中的第一会话方的会话消息,确定多个会话动作样本的动作名称以及动作实体,包括:
对多个历史会话中的第一会话方的文本类型的会话消息进行句式识别,获得疑问句集合和陈述句集合;
对所述疑问句集合中的疑问句以及陈述句集合中的陈述句分别进行聚类处理,获得多个疑问句类簇以及多个陈述句类簇;
为各疑问句类簇和各陈述句类簇分别设置动作名称;
其中,所述会话动作样本的动作名称为其所属类簇的动作名称。
3.根据权利要求2所述的方法,其中,所述对所述疑问句集合中的疑问句以及陈述句集合中的陈述句分别进行聚类处理,包括:
利用情感极性预测模型,对所述疑问句集合中的各疑问句以及所述陈述句集合中的各陈述句分别进行情感识别,获得各疑问句的情感信息以及各陈述句的情感信息;
对所述疑问句集合中的情感信息为正向和中性的疑问句、以及所述陈述句集合中的情感信息为正向和中性的陈述句分别进行聚类处理。
4.根据权利要求3所述的方法,其中,所述情感极性预测模型的训练过程包括:
将训练集中的多个文本类型的会话消息样本分别提供给情感极性预测模型;
根据所述情感极性预测模型输出的情感极性预测结果和所述训练集中的会话消息样本的情感极性标签的差异,调整所述情感极性预测模型的模型参数;
将验证集中的多个文本类型的会话消息样本,分别提供给模型参数调整后的情感极性预测模型;
根据所述模型参数调整后的情感极性预测模型输出的情感极性预测结果和所述验证集中的会话消息样本的情感极性标签的差异,修正所述训练集中的会话消息样本的情感极性标签。
5.根据权利要求4所述的方法,其中,所述根据所述模型参数调整后的情感极性预测模型输出的情感极性预测结果和所述验证集中的会话消息样本的情感极性标签的差异,修正所述训练集中的会话消息样本的情感极性标签,包括:
根据所述模型参数调整后的情感极性预测模型输出的情感极性预测结果和所述验证集中的会话消息样本的情感极性标签的差异,设置正则表达式;
根据所述正则表达式,修正所述训练集中的会话消息样本的情感极性标签。
6.根据权利要求4所述的方法,其中,所述情感极性预测模型的训练过程还包括:
将测试集中的具有情感极性标签的多个会话消息样本,分别提供给模型参数调整后的情感极性预测模型;
根据所述模型参数调整后的情感极性预测模型输出的情感极性预测结果和所述测试集中的会话消息样本的情感极性标签的差异,判断所述情感极性预测模型是否成功训练完成;
若所述判断结果为未成功训练完成,则继续利用所述训练集中的多个会话消息样本对所述情感极性预测模型进行训练。
7.根据权利要求2所述的方法,其中,所述根据多个历史会话中的第一会话方的会话消息,确定多个会话动作样本的动作名称以及动作实体,包括:
对多个历史会话中的第一会话方的文本类型的会话消息进行实体词提取处理,并将提取出的实体词作为该会话消息对应的会话动作样本的动作实体。
8.根据权利要求1至7中任一项所述的方法,其中,所述根据多个历史会话中的第一会话方的会话消息,确定多个会话动作样本的动作名称以及动作实体,包括:
对于多个历史会话中的第一会话方的卡片类型的会话消息,将该会话消息的卡片类型标识对应的预设动作名称,作为该会话消息对应的会话动作样本的动作名称,并将该会话消息对应的会话动作样本的动作实体设置为空。
9.根据权利要求2所述的方法,其中,所述根据多个历史会话中的第一会话方的会话消息,确定多个会话动作样本的动作名称以及动作实体,还包括:
对具有相同动作名称和相同动作实体的会话动作样本进行合并处理,获得多个会话动作样本。
10.根据权利要求1至7中任一项所述的方法,其中,所述根据所述多个历史会话中的第二会话方的会话消息,确定所述各会话动作样本各自对应的第二会话方的会话意图,包括:
针对任一会话动作样本,确定该会话动作样本所来自的所有会话消息,获得多条会话消息;
针对所述多条会话消息中的任一会话消息,确定该会话消息所在的历史会话中的与该会话消息邻接、且位于该会话消息之前的第二会话方的会话消息,获得第二会话方的多条会话消息;
对所述第二会话方的多条会话消息分别进行意图识别,获得该会话动作样本对应的第二会话方的各会话意图。
11.根据权利要求1至7中任一项所述的方法,其中,所述根据所述动作名称、动作实体以及至少一会话意图下的动作优先级,获得会话动作样本集合中的多个会话动作样本的多元组,包括:
根据所述动作名称、动作实体、会话动作样本所形成的会话消息的类型以及动作优先级,形成所述各会话动作样本的多元组。
12.一种用于辅助实现会话的装置,其中,所述装置包括:
确定名称和实体模块,用于根据多个历史会话中的第一会话方的会话消息,确定多个会话动作样本的动作名称以及动作实体;
确定意图模块,用于根据所述多个历史会话中的第二会话方的会话消息,确定所述各会话动作样本各自对应的第二会话方的会话意图;
确定优先级模块,用于根据所述多个历史会话中的第二会话方的会话消息,确定所述各会话动作样本各自在至少一会话意图下的动作优先级;所述确定优先级模块进一步用于:针对任一会话动作样本,根据该会话动作样本所来自的各会话消息各自对应的第二会话方是否回复、各会话消息所属历史会话是否达成预定目标动作以及该会话动作样本所来自的各会话消息的数量,确定该会话动作样本在相应会话意图下的动作优先级;
形成样本模块,用于根据所述动作名称、动作实体以及至少一会话意图下的动作优先级,获得会话动作样本集合中的多个会话动作样本的多元组。
13.根据权利要求12所述的装置,其中,所述确定名称和实体模块,包括:
句式识别子模块,用于对多个历史会话中的第一会话方的文本类型的会话消息进行句式识别,获得疑问句集合和陈述句集合;
聚类处理子模块,用于对所述疑问句集合中的疑问句以及陈述句集合中的陈述句分别进行聚类处理,获得多个疑问句类簇以及多个陈述句类簇;
设置名称子模块,用于为各疑问句类簇和各陈述句类簇分别设置动作名称;
其中,所述会话动作样本的动作名称为其所属类簇的动作名称。
14.根据权利要求13所述的装置,其中,所述聚类处理子模块,包括:
情感识别单元,用于利用情感极性预测模型,对所述疑问句集合中的各疑问句以及所述陈述句集合中的各陈述句分别进行情感识别,获得各疑问句的情感信息以及各陈述句的情感信息;
聚类处理单元,用于对所述疑问句集合中的情感信息为正向和中性的疑问句、以及所述陈述句集合中的情感信息为正向和中性的陈述句分别进行聚类处理。
15.根据权利要求14所述的装置,其中,所述装置还包括:训练模块,用于训练情感极性预测模型,且所述训练模块包括:
第一输入子模块,用于将训练集中的多个文本类型的会话消息样本分别提供给情感极性预测模型;
调整参数子模块,用于根据所述情感极性预测模型输出的情感极性预测结果和所述训练集中的会话消息样本的情感极性标签的差异,调整所述情感极性预测模型的模型参数;
第二输入子模块,用于将验证集中的多个文本类型的会话消息样本,分别提供给模型参数调整后的情感极性预测模型;
修正标签子模块,用于根据所述模型参数调整后的情感极性预测模型输出的情感极性预测结果和所述验证集中的会话消息样本的情感极性标签的差异,修正所述训练集中的会话消息样本的情感极性标签。
16.根据权利要求15所述的装置,其中,所述修正标签子模块进一步用于:
根据所述模型参数调整后的情感极性预测模型输出的情感极性预测结果和所述验证集中的会话消息样本的情感极性标签的差异,设置正则表达式;
根据所述正则表达式,修正所述训练集中的会话消息样本的情感极性标签。
17.根据权利要求15所述的装置,其中,所述训练模块还包括:
第三输入子模块,用于将测试集中的具有情感极性标签的多个会话消息样本,分别提供给模型参数调整后的情感极性预测模型;
判断子模块,用于根据所述模型参数调整后的情感极性预测模型输出的情感极性预测结果和所述测试集中的会话消息样本的情感极性标签的差异,判断所述情感极性预测模型是否成功训练完成;
触发子模块,用于若所述判断子模块的判断结果为未成功训练完成,则触发所述第一输入子模块,以继续利用所述训练集中的多个会话消息样本对所述情感极性预测模型进行训练。
18.根据权利要求13所述的装置,其中,所述确定名称和实体模块,包括:
确定实体子模块,用于对多个历史会话中的第一会话方的文本类型的会话消息进行实体词提取处理,并将提取出的实体词作为该会话消息对应的会话动作样本的动作实体。
19.根据权利要求12至18中任一项所述的装置,其中,所述确定名称和实体模块,包括:
确定名称和实体子模块,用于对于多个历史会话中的第一会话方的卡片类型的会话消息,将该会话消息的卡片类型标识对应的预设动作名称,作为该会话消息对应的会话动作样本的动作名称,并将该会话消息对应的会话动作样本的动作实体设置为空。
20.根据权利要求13所述的装置,其中,所述确定名称和实体模块,还包括:
合并子模块,用于对具有相同动作名称和相同动作实体的会话动作样本进行合并处理,获得多个会话动作样本。
21.根据权利要求12至18中任一项所述的装置,其中,所述确定意图模块进一步用于:
针对任一会话动作样本,确定该会话动作样本所来自的所有会话消息,获得多条会话消息;
针对所述多条会话消息中的任一会话消息,确定该会话消息所在的历史会话中的与该会话消息邻接、且位于该会话消息之前的第二会话方的会话消息,获得第二会话方的多条会话消息;
对所述第二会话方的多条会话消息分别进行意图识别,获得该会话动作样本对应的第二会话方的各会话意图。
22.根据权利要求12至18中任一项所述的装置,其中,所述形成样本模块进一步用于:
根据所述动作名称、动作实体、会话动作样本所形成的会话消息的类型以及动作优先级,形成所述各会话动作样本的多元组。
23.一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序用于执行上述权利要求1-11中任一项所述的方法。
24.一种电子设备,所述电子设备包括:
处理器;
用于存储所述处理器可执行指令的存储器;
所述处理器,用于从所述存储器中读取所述可执行指令,并执行所述指令以实现上述权利要求1-11中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010813277.1A CN111966805B (zh) | 2020-08-13 | 2020-08-13 | 用于辅助实现会话的方法、装置、介质以及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010813277.1A CN111966805B (zh) | 2020-08-13 | 2020-08-13 | 用于辅助实现会话的方法、装置、介质以及电子设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111966805A CN111966805A (zh) | 2020-11-20 |
CN111966805B true CN111966805B (zh) | 2021-11-09 |
Family
ID=73365489
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010813277.1A Active CN111966805B (zh) | 2020-08-13 | 2020-08-13 | 用于辅助实现会话的方法、装置、介质以及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111966805B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115712706B (zh) * | 2022-11-07 | 2023-09-15 | 贝壳找房(北京)科技有限公司 | 一种基于会话确定动作决策的方法及装置 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10409913B2 (en) * | 2015-10-01 | 2019-09-10 | Conduent Business Services, Llc | Methods and systems to train classification models to classify conversations |
CN109145104B (zh) * | 2018-09-29 | 2023-04-18 | 北京百度网讯科技有限公司 | 用于对话交互的方法和装置 |
US11037048B2 (en) * | 2018-10-22 | 2021-06-15 | Moveworks, Inc. | Virtual conversation method or system |
CN111309899A (zh) * | 2018-12-11 | 2020-06-19 | 阿里巴巴集团控股有限公司 | 对话情感分析方法及装置、存储介质和处理器 |
CN110543556A (zh) * | 2019-09-05 | 2019-12-06 | 出门问问信息科技有限公司 | 对话配置方法及存储介质和电子设备 |
CN111026834B (zh) * | 2019-12-10 | 2022-07-08 | 思必驰科技股份有限公司 | 问答语料生成方法及系统 |
CN111368029B (zh) * | 2020-02-28 | 2021-06-25 | 深圳市人马互动科技有限公司 | 基于意图三元组的交互方法、装置、设备及存储介质 |
CN111160514B (zh) * | 2020-04-01 | 2020-08-28 | 支付宝(杭州)信息技术有限公司 | 一种对话的方法和系统 |
-
2020
- 2020-08-13 CN CN202010813277.1A patent/CN111966805B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN111966805A (zh) | 2020-11-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109101537B (zh) | 基于深度学习的多轮对话数据分类方法、装置和电子设备 | |
US11676067B2 (en) | System and method for creating data to train a conversational bot | |
CN111340148B (zh) | 一种业务分类模型的训练方法、业务分类方法以及终端 | |
US10467261B1 (en) | Methods, systems, and computer program product for implementing real-time classification and recommendations | |
US9262126B2 (en) | Recommendation system for agile software development | |
CN115398437A (zh) | 改进的域外(ood)检测技术 | |
US11928430B2 (en) | Detecting unrelated utterances in a chatbot system | |
WO2022159485A1 (en) | Context tag integration with named entity recognition models | |
US10496751B2 (en) | Avoiding sentiment model overfitting in a machine language model | |
US20230237502A1 (en) | Dynamic claims submission system | |
US12019994B2 (en) | Distance-based logit value for natural language processing | |
US11972220B2 (en) | Enhanced logits for natural language processing | |
US11775894B2 (en) | Intelligent routing framework | |
CN116802629A (zh) | 用于自然语言处理的多因素建模 | |
CN116615727A (zh) | 用于自然语言处理的关键词数据扩充工具 | |
CN116490879A (zh) | 用于神经网络中过度预测的方法和系统 | |
CN115481229A (zh) | 一种应答话术推送方法、装置、电子设备及存储介质 | |
CN111966805B (zh) | 用于辅助实现会话的方法、装置、介质以及电子设备 | |
CN115836304A (zh) | 利用基于示例的语音机器人开发技术更新受训练语音机器人 | |
CN111507849A (zh) | 核保方法及相关装置、设备 | |
WO2023076754A1 (en) | Deep learning techniques for extraction of embedded data from documents | |
CN115186179A (zh) | 保险产品推送方法和装置 | |
CN116724306A (zh) | 用于自然语言处理器的多特征平衡 | |
CN113806541A (zh) | 情感分类的方法和情感分类模型的训练方法、装置 | |
CN110909166B (zh) | 用于提高会话质量的方法、装置、介质以及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
TA01 | Transfer of patent application right | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20210319 Address after: 100085 Floor 101 102-1, No. 35 Building, No. 2 Hospital, Xierqi West Road, Haidian District, Beijing Applicant after: Seashell Housing (Beijing) Technology Co.,Ltd. Address before: Unit 05, room 112, 1st floor, office building, Nangang Industrial Zone, economic and Technological Development Zone, Binhai New Area, Tianjin 300457 Applicant before: BEIKE TECHNOLOGY Co.,Ltd. |
|
GR01 | Patent grant | ||
GR01 | Patent grant |