CN115391503A - 一种会话流程的应用方法及装置 - Google Patents

一种会话流程的应用方法及装置 Download PDF

Info

Publication number
CN115391503A
CN115391503A CN202210950450.1A CN202210950450A CN115391503A CN 115391503 A CN115391503 A CN 115391503A CN 202210950450 A CN202210950450 A CN 202210950450A CN 115391503 A CN115391503 A CN 115391503A
Authority
CN
China
Prior art keywords
statement
sentence
intention
user
conversation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210950450.1A
Other languages
English (en)
Inventor
吕晨旭
习翔宇
孙超博
江会星
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Sankuai Online Technology Co Ltd
Original Assignee
Beijing Sankuai Online Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Sankuai Online Technology Co Ltd filed Critical Beijing Sankuai Online Technology Co Ltd
Priority to CN202210950450.1A priority Critical patent/CN115391503A/zh
Publication of CN115391503A publication Critical patent/CN115391503A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Human Computer Interaction (AREA)
  • Machine Translation (AREA)

Abstract

本说明书公开了一种会话流程的应用方法及装置,可确定正在进行的会话的业务场景,并获取该会话中用户输入的语句,根据相似度模型以及该业务场景下预设的各语句意图,确定该语句对应的语句意图,其中,各语句意图为根据该业务场景的各会话数据中的各语句进行聚类,并对聚类后各簇进行标注确定的。然后,根据预设的该业务场景对应的会话流程以及该语句对应的语句意图,从该会话流程内衔接该语句意图的各语句意图中,确定回复该用户的语句意图对应的回复语句,回复该用户。可见,本方法提高了用户体验,并且无需进行人工标注,降低了成本。

Description

一种会话流程的应用方法及装置
技术领域
本说明书涉及数据处理领域,尤其涉及一种会话流程的应用方法及装置。
背景技术
随着互联网的发展,用户在网络上办理业务时往往需要客服解决问题。由于互联网业务数量大,人工客服压力大,因此,业务提供方通常会采用智能客服为用户解决问题。
在现有技术中,通常采用人工对会话记录进行分析,找出会话逻辑,从而构建智能客服的会话流程,或通过训练依赖于语义槽体系的会话模型,以构建会话流程。
但是,由于用户提出的问题种类繁多,采用人工构建对话流程的方式成本过高,并且难以及时更新。而由于用户的提问方式往往难以突出重点,依赖于语义槽体系的会话模型难以准确识别用户的问题,用户体验差,效率低,并且依赖于语义槽体系的会话模型在构建过程中需要采用大量人工标注的训练样本进行训练,成本高。
发明内容
本说明书提供一种会话流程的应用方法及装置,以部分的解决现有技术存在的上述问题。
本说明书采用下述技术方案:
本说明书提供了一种会话流程的应用方法,包括:
确定正在进行的会话的业务场景,并获取所述会话中用户输入的语句;
根据相似度模型以及所述业务场景下预设的各语句意图,确定所述语句对应的语句意图,其中,所述各语句意图为根据所述业务场景的各会话数据中的各语句进行聚类,并对聚类后各簇进行标注确定的;
根据预设的所述业务场景对应的会话流程以及所述语句对应的语句意图,从所述会话流程内衔接所述语句意图的各语句意图中,确定回复所述用户的语句意图对应的回复语句,回复所述用户。
可选的,所述业务场景对应的会话流程采用下述方式确定:
将预设语句意图槽位数量的初始化的会话序列,输入至回复概率模型中,确定所述会话序列后续衔接各语句意图的概率;
根据各语句意图的概率,确定衔接所述初始化的会话序列的第一数量的语句意图,并重新生成各会话序列;
将重新生成的各会话序列分别输入所述回复概率模型,继续重复上述过程,直至确定出的各会话序列后续衔接各语句意图的概率均小于所述预设概率为止,根据生成的各会话序列确定会话流程。
可选的,根据相似度模型以及所述业务场景下预设的各语句意图,确定所述语句对应的语句意图,具体包括:
根据相似算法以及所述业务场景下的各语句意图,确定与所述语句近似值最高的第二数量的语句意图,作为各待选语句意图;
根据相似度模型以及所述各待选语句意图,确定与所述语句相似度最高的待选语句意图,作为所述语句对应的语句意图。
可选的,根据所述业务场景对应的会话流程以及所述语句对应的语句意图,从所述会话流程内衔接所述语句意图的各语句意图中,确定回复所述用户的语句意图对应的回复语句,回复所述用户,具体包括:
确定预设的所述业务场景对应的会话流程;
根据所述语句对应的语句意图以及所述会话流程中的各语句意图,确定在所述会话流程中与所述语句意图匹配的语句意图,作为待回复语句意图;
根据所述待回复语句意图衔接各语句意图对应的衔接条件,确定回复所述用户的语句意图,所述衔接条件分别为各语句意图衔接所述待回复语句意图对应会话序列的概率;
根据所述语句意图,确定回复所述用户的回复语句,回复所述用户。
可选的,所述方法还包括:
根据通过所述回复概率模型确定出的衔接各会话序列的各语句意图的概率,确定所述各语句意图对应的概率分别为各语句意图的衔接条件,所述衔接条件,用于在确定用户输入的语句对应的语句意图后,从所述会话流程衔接所述语句意图的各语句意图中,确定用于回复所述用户的语句意图;
确定所述会话流程中需要调用操作接口回复的语句意图,并针对每个需要调用操作接口回复的语句意图,根据回复该语句意图需要调用的操作接口,在该语句意图后插入操作接口节点,根据所述操作接口的若干返回值以及衔接该语句意图的各语句意图,分别更新所述各语句意图对应的衔接条件。
可选的,根据所述业务场景对应的会话流程以及所述语句对应的语句意图,从所述会话流程内衔接所述语句意图的各语句意图中,确定回复所述用户的语句意图对应的回复语句,回复所述用户,具体包括:
确定预设的所述业务场景对应的会话流程;
根据所述语句对应的语句意图以及所述会话流程中的各语句意图,确定在所述会话流程中与所述语句意图匹配的语句意图,作为待回复语句意图;
根据所述待回复语句意图后的操作接口节点,调用所述操作接口节点对应的操作接口,确定所述操作接口的返回值;
根据所述返回值以及所述操作接口节点后衔接的各语句意图对应的衔接条件,确定回复所述用户的语句意图;
根据所述语句意图,确定回复所述用户的回复语句,回复所述用户。
可选的,根据所述业务场景的各会话数据中的各语句进行聚类,并对聚类后各簇进行标注,确定所述各语句意图,具体包括:
获取所述业务场景下的各会话数据,并确定所述各会话数据中的各客服语句以及各用户语句;
通过特征提取模型,分别对所述各客服语句和所述各用户语句进行特征提取,确定所述各客服语句分别对应的特征向量以及所述各用户语句分别对应的特征向量;
对所述各客服语句分别对应的特征向量进行聚类,标注聚类后的各簇分别对应的语句意图;
对所述各用户语句分别对应的特征向量进行聚类,标注聚类后的各簇分别对应的语句意图。
本说明书提供了一种会话流程的应用装置,包括:
获取模块,确定正在进行的会话的业务场景,并获取所述会话中用户输入的语句;
确定模块,根据相似度模型以及所述业务场景下预设的各语句意图,确定所述语句对应的语句意图,其中,所述各语句意图为根据所述业务场景的各会话数据中的各语句进行聚类,并对聚类后各簇进行标注确定的;
回复模块,根据预设的所述业务场景对应的会话流程以及所述语句对应的语句意图,从所述会话流程内衔接所述语句意图的各语句意图中,确定回复所述用户的语句意图对应的回复语句,回复所述用户。
本说明书提供的计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述会话流程的应用方法。
本说明书提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述会话流程的应用方法。
本说明书采用的上述至少一个技术方案能够达到以下有益效果:
在本说明书提供的会话流程的应用方法中,可确定正在进行的会话的业务场景,并获取该会话中用户输入的语句,根据相似度模型以及该业务场景下预设的各语句意图,确定该语句对应的语句意图,其中,各语句意图为根据该业务场景的各会话数据中的各语句进行聚类,并对聚类后各簇进行标注确定的。然后,根据预设的该业务场景对应的会话流程以及该语句对应的语句意图,从该会话流程内衔接该语句意图的各语句意图中,确定回复该用户的语句意图对应的回复语句,回复该用户。
从上述方法可以看出,本方法提高了用户体验,并且无需进行人工标注,降低了成本。
附图说明
此处所说明的附图用来提供对本说明书的进一步理解,构成本说明书的一部分,本说明书的示意性实施例及其说明用于解释本说明书,并不构成对本说明书的不当限定。在附图中:
图1为本说明书中一种会话流程的构建方法的流程示意图;
图2为本说明书中一种会话流程的应用方法的流程示意图;
图3为本说明书提供的一种会话流程的构建的示意图;
图4a为本说明书提供的一种会话流程的示意图;
图4b为本说明书提供的一种会话流程的应用的示意图;
图5为本说明书提供的一种会话流程的构建装置的示意图;
图6为本说明书提供的一种会话流程的应用装置的示意图;
图7为本说明书提供的对应于图1或图2的电子设备示意图。
具体实施方式
为使本说明书的目的、技术方案和优点更加清楚,下面将结合本说明书具体实施例及相应的附图对本说明书技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本说明书一部分实施例,而不是全部的实施例。基于本说明书中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
以下结合附图,详细说明本说明书各实施例提供的技术方案。
图1为本说明书中一种会话流程的构建方法的流程示意图,具体包括以下步骤:
S100:针对每个业务场景,通过特征提取模型,对该业务场景下获取的各会话数据中的各语句进行特征提取,确定所述各语句分别对应的特征向量。
由于客服在为用户解决问题时,在不同的业务场景下,用户陈述类似语句的目的也可能不同,例如,忘记关闭共享单车车锁的业务场景中,用户陈述“1点钟就用完了”,和外卖超时送达的业务场景中,用户陈述“1点钟才送到”的目的显然不同。因此,在本说明书的一个或多个实施例中,可针对每个业务场景,分别构建一个会话流程,以解决各业务场景下用户的问题。
由于对模型的训练通常需要大量的算力,因此可由服务器来执行。于是,在本说明书一个或多个实施例中,该会话流程的构建方法,可由服务器执行。当然,该服务器具体是单独的一台设备,或是由多台设备组成的分布式服务器系统,本说明书不做限制,可根据需要设置。
在本说明书的一个或多个实施例中,由于在客服与用户的实际对话中,对于一个问题可能有多种表述方式。例如,“一直找不到停车点”、“不知道在哪停车”、“不知道停车点在哪”,这三段语句都在陈述无法找到停车点,却采用了不同的方式表述。因此,为了确定用户陈述的语句具体表述的内容,可通过聚类这类方式确定各语句的语句意图。并且,由于对文字的聚类较为复杂,因此,可通过特征提取模型对各语句进行特征提取,确定各语句对应的特征向量,并对各特征向量进行聚类。
具体的,服务器获取各业务场景下的各会话数据。其中,该会话数据为客服与用户的会话记录。并针对每个业务场景,通过训练完成的特征提取模型,对该业务场景下各会话数据中的各语句进行特征提取,确定各语句分别对应的特征向量。
其中,该特征提取模型可采用现有的模型,例如,一种基于对比学习的句子表示迁移方法(A Contrastive Framework for Self-Supervised Sentence RepresentationTransfer,ConSERT)模型、最先进的(state of the art,SOTA)模型等,该特征提取模型具体采用何种模型,本说明书不做限制,可根据需要设置。由于上述特征提取模型为现有的模型,因此,需要对该特征提取模型进行训练。例如,当该特征提取模型为ConSERT模型时,需要根据各业务场景下的各会话数据,对该ConSERT模型进行微调(fine-tune),使该ConSERT模型可更准确的确定各会话数据中各语句对应的特征向量。
采用上述方式,可通过训练完成的特征提取模型对各语句进行特征提取,确定各语句对应的特征向量,该服务器便可对各特征向量进行聚类,确定各语句意图。使该会话流程在接收到用户输入的语句时,可从各语句意图中匹配该语句对应语句意图,从而回复该用户。
S102:对所述各特征向量聚类,标注聚类后各簇分别对应的语句意图。
在本说明书的一个或多个实施例中,确定出各语句对应的特征向量后,便可对各特征向量进行聚类,从而确定各语句意图。
具体的,首先,根据确定出的各语句对应的特征向量,通过预设的聚类算法,对各特征向量进行聚类,确定多个簇。其中,该聚类算法可采用现有的聚类算法。例如,k均值聚类算法(k-means clustering algorithm)、相似度度量算法(Similarity Measurement)、谱聚类算法(Spectral Clustering,SC)等。
其次,针对每个簇,确定该簇中各特征向量对应的语句。再根据该簇中各特征向量对应的语句,通过语义分析模型,确定该簇对应的语句意图。其中,该语义分析算法可采用现有的模型,例如主题模型(Topic Model)、第一种模型(Continuous Bag-of-WordsModel,CBOW)等。
当然,由于通过语义分析算法确定的各簇对应的语句意图可能不准确,因此,还可由人工根据各簇中的各特征向量对应语句,确定各簇对应的语句意图。
采用上述方式,该服务器可确定各语句意图,使该会话流程在接收到用户输入的语句时,可从各语句意图中匹配该语句对应语句意图,从而回复该用户。
S104:根据预设语句意图槽位数量,生成初始化的会话序列,并将所述初始化的会话序列输入至回复概率模型中,确定所述会话序列后续衔接各语句意图的概率。
S106:根据确定出的各语句意图的概率,确定第一数量的语句意图。
S108:按照所述会话序列中语句意图槽位从远到近的顺序,删除至少一条语句意图,并根据确定出的各语句意图,重新生成若干会话序列,并将重新生成各会话序列输入所述回复概率模型,继续重复上述过程,直至确定出的各会话序列后续衔接各语句意图的概率均小于所述预设概率为止。
在本说明书的一个或多个实施例中,由于实际情况中,客服与用户的对话通常采用问答的形式进行。因此,为了使该会话流程可在接收到用户输入的语句,并确定该语句对应的语句意图后,可准确回复该用户。服务器可根据各语句意图,确定各会话序列,以确定会话流程。
具体的,首先,该服务器可根据预设的语句意图槽位数量,生成初始化的会话序列。其中,该会话序列由若干语句意图构成,该语句意图槽位数量即为构成该会话数量的语句意图数量。
并且,由于在实际情况下,客服与用户的对话往往采用一问一答的方式,因此,在本说明书的一个或多个实施例中,也按照客服与用户一问一答的方式确定各会话序列。于是,该服务器可确定各语句意图携带的客服标识或用户标识,携带客服标识的语句意图即为客服陈述的语句意图,携带用户标识的语句意图即为用户陈述的语句意图。该客服标识以及该用户标识可以是步骤S102中确定各簇对应的语句意图时确定的,该客服标识以及该用户标识也可为人工确定的,该客服标识以及该用户标识具体如何确定,本说明书不做限制,可根据需要设置。
其次,该服务器可将该初始化的会话序列输入至训练完成的回复概率模型中,通过该回复概率模型,分别确定该会话序列后续衔接各语句意图的概率。例如,根据该回复概率模型确定该会话序列后,衔接客服输入的语句“您好,请问您遇到了什么问题?”的概率为0.8,衔接用户输入的语句“你好!”的概率为0.2。
再次,该服务器可根据确定出的各语句意图对应的概率,随机确定第一数量的语句意图。当然,为了更准确的确定会话流程,使该会话流程在确定用户输入的语句后,选择合适的语句意图对应的语句回复该用户,提高该用户的使用体验。该服务器也可根据确定出的各语句意图对应的概率,以及预设概率,从各语句意图中确定概率大于该预设概率的若干语句意图为若干候选语句意图。并按照该若干候选语句意图对应概率从大到小的顺序,确定概率最大的第一数量的候选语句意图,作为各语句意图。采用上述方式优先确定对应的概率大于该预设概率的若干语句意图,并从该若干语句意图中确定概率最大的第一数量的各语句意图,使得该会话流程在确定用户输入的语句后,可从该概率最大的第一数量的语句意图中确定语句意图以回复用户,提升了用户体验。
并且,由于任一用户的语句意图后续衔接若干客服的语句意图,因此,需要从各语句意图中选择语句回复用户。于是,该服务器可将上述各语句意图对应的概率分别作为各语句意图的衔接条件,使服务器可根据各衔接条件对应概率随机选取任一客服的语句意图,并根据该客服的语句意图确定对应语句回复用户。
然后,由于需要确定完整的会话流程,使该会话流程可完整的解决用户的问题。因此,在确定出该初始化的会话序列后续衔接的各语句意图后,该服务器可按照该会话序列中语句意图槽位从远到近的顺序,删除至少一条语句意图,并根据确定出的各语句意图,重新生成若干会话序列。例如,该会话序列为(a,b,c),确定出的各语句意图为1、2、3,则可将该会话序列中的“a”删除,并重新确定出会话序列(b,c,1)、(b,c,2),(b,c,3)。
最后,该服务器可针对重新生成的每个会话序列,继续采用上述方式,确定该会话序列后续衔接的各语句意图,重新确定各会话序列,直至确定出的各会话序列后续衔接各语句意图的概率均小于该预设概率为止。若某会话序列后续衔接的各语句意图中第五数量的语句意图对应概率大于该预设概率,其余语句意图对应概率均小于该预设概率。该第五数量小于该第一数量,该服务器可根据该第五数量的语句意图以及该会话序列,确定第五数量的会话序列。也可从衔接该会话序列的概率大于0的各语句意图中,确定第一数量各语句意图,根据该第一数量的语句意图以及该会话序列,确定第一数量的会话序列,具体如何确定,本说明书不做限制,可根据需要设置。
其中,当确定出该会话序列后续衔接各语句意图的概率均小于该预设概率时,表示已经为用户解决问题,无需继续对话,该会话序列后续也无需衔接任何语句意图。于是,在本说明书的一个或多个实施例中,确定各会话序列后续衔接各语句意图的概率均小于该预设概率时,则表示各会话序列确定完成。
并且,该回复概率模型可采用现有的模型,例如N元语法模型(N-Gram)、神经网络语言模型(Nerual Network Language Model,NNLM)等。并且需要对该回复概率模型进行训练。例如,当该回复概率模型为N-Gram模型时,可先获取若干会话数据,并根据步骤S104确定出的各语句意图,针对每个会话数据,确定该会话数据中各语句对应的语句意图,以确定由多个语句意图组成的会话数据样本。根据各会话数据样本,训练该N-Gram模型,确定任一语句意图衔接在N个语句意图后的概率。例如,N为3时,a、b、c、d为4个语句意图,那么,确定“a。b。c。”组成的对话后续衔接d的概率为“a。b。c。d。”这段对话在各会话样本中出现的次数与“a。b。c。”这段对话在各会话样本中出现的次数的比值。其中,N即为上述语句意图槽位数量。
上述确定概率的过程可采用以下下公式表示:
Figure BDA0003788926470000101
其中,P为概率,a{i-N-1:i}为第i-N-1句话到第i句话,C(a{i-N-1:i})为第i-N-1句话到第i句话出现的次数,a{i-N-1:i-1}为第i-N-1句话到第i-1句话,C(a{i-N-1:i-1})为第i-N-1句话到第i-1句话出现的次数。
其中,在训练该N-Gram模型时,需要确定每个会话数据中各语句对应的语句意图,因此,该服务器可针对每个会话数据中的每个语句,根据步骤S102中确定出的该业务场景下的各语句意图,通过训练完成的相似度模型,确定与该语句相似度最高的语句意图,作为该语句对应的语句意图。
上述确定该语句对应的语句意图的过程可采用以下公式表示:
Figure BDA0003788926470000111
其中,
Figure BDA0003788926470000112
为与该语句对应的语句意图,x1,…,xk为各语句意图,x为该语句,S(x,xi)为通过该相似度模型确定出的语句x与语句意图x1的相似度。
需要说明的是,该相似度模型可为现有的模型,例如,双向编码表示(Bidirectional Encoder Representations from Transformers,BERT)模型、双边多视角匹配(Bilateral Multi-Perspective Matching,BiMPM)模型等。并且,需要对上述相似度模型进行训练。例如,当该相似度模型为BERT模型时,可确定两个对应相同语句意图的语句作为一组正样本,两个对应不同语句意图的语句作为一组负样本,采用多组正样本以及多组负样本对该BERT模型进行训练。其中,正样本与负样本的数量比例可以是1:1、1:2、1:3、1:4、1:5等。
采用上述方式,可确定各业务场景下的会话流程,便可根据各业务场景下的会话流程确定会话流程,使该会话流程在接收到用户输入的语句时,可从各语句意图中匹配该语句对应语句意图,并根据该语句意图后衔接的各语句意图以及各语句意图对应的衔接条件,回复该用户。
S110:根据确定出的各会话序列,确定该业务场景下的会话流程,所述会话流程用于根据用户输入的语句回复所述用户。
在本说明书的一个或多个实施例中,确定出各业务场景下的会话序列后,便可确定各业务场景下的会话流程。而由于部分语句意图客服需要调用操作接口才能回复。例如,用户无法找到停车点,需要客服基于该用户的位置,查询该用户附近的停车点。于是,可采用以下方式确定各业务场景下的会话流程。
具体的,针对每个业务场景,根据该业务场景下的各会话序列,确定该业务场景下的各会话流程。并根据该会话流程中的各语句意图,人工判断该会话流程中是否存在需要调用操作接口回复的语句意图。
若是,则根据从该会话流程中确定出的若干需要调用操作接口回复的语句意图,针对每个语句意图,根据回复该语句意图需要调用的操作接口,在该语句意图后插入操作接口节点,确定该操作接口节点后续衔接的各语句意图为该操作接口节点后续衔接的各语句意图。并根据该操作接口的若干返回值以及该操作接口节点后续衔接的各语句意图,人工确定该操作接口节点后续衔接的各语句意图对应的衔接条件,并确定插入若干操作接口节点的会话流程为该业务场景下的会话流程。
若否,则无需进行操作。
另外,本说明书还提供了一种会话流程示意图,如图4a所示,其中,确定用户输入语句对应的语句意图A后,客服可从语句意图B以及语句意图C中确定任一语句意图对应语句回复用户,并根据用户的输入再次确定语句意图回复该用户,直至为解决该用户的问题为止。并且,本说明书还提供了一种会话流程的应用示意图,如图4b所示,确定用户输入语句对应的语句意图为A后,该服务器可从该语句意图A后续衔接的语句意图B以及语句意图C中确定任一语句意图对应语句回复该用户,并根据用户的输入再次确定语句意图回复该用户,直至为解决该用户的问题为止。
采用上述方式,可在需要调用操作接口才能回复的语句意图后插入对应的操作接口节点,使会话流程在接收到需要调用操作接口才能回复的语句时,可调用相应操作接口,并根据该操作接口的返回值确定语句意图对应的语句回复用户。
在本说明书提供的会话流程的构建方法中,可针对每个业务场景,通过特征提取模型,对该业务场景下获取的各会话数据中的各语句进行特征提取,确定各语句分别对应的特征向量,并对各特征向量聚类,标注聚类后各簇分别对应的语句意图。再根据预设语句意图槽位数量,生成初始化的会话序列,并将该初始化的会话序列输入至回复概率模型中,确定该会话序列后续衔接各语句意图的概率,并根据确定出的各语句意图的概率,确定第一数量的语句意图。再按照该会话序列中语句意图槽位从远到近的顺序,删除至少一条语句意图,根据确定出的各语句意图,重新生成若干会话序列,并将重新生成各会话序列输入该回复概率模型,继续重复上述过程,直至确定出的各会话序列后续衔接各语句意图的概率均小于该预设概率为止。最后,根据确定出的各会话序列,确定该业务场景下的会话流程,该会话流程用于根据用户输入的语句回复该用户。
从上述方法中可以看出,本方法无需人工标注,降低了成本,并且在接收到用户输入的语句后,可在会话流程中确定与该语句匹配的语句意图,并采用衔接该语句意图的语句意图对应语句进行回复,提高用户体验。
另外,本说明书还提供了一种会话流程的构建示意图,如图3所示,其中,该服务器可针对每个业务场景,从该业务场景中的大规模的会话数据中分别确定用户的语句意图以及客服的语句意图,并根据各用户的语句意图以及各客服的语句意图,确定各会话序列,再根据该业务场景的各会话序列,确定该业务场景的会话流程。
另外,在本说明书的一个或多个实施例中,由于客服输入的语句对应的语句意图可能与用户输入的语句对应的语句意图相同,但是,由于在构建会话流程中,客服的语句意图与用户的语句意图不能混淆。因此,可在步骤S102时,即对客服的语句与用户的语句进行区分。
具体的,针对每个业务场景,服务器可根据该业务场景下的各会话数据,确定各客服语句以及各用户语句。并通过训练完成的特征提取模型,对该业务场景下的各客服语句以及各用户语句分别进行特征提取,确定各客服语句分别对应的特征向量以及各用户语句分别对应的特征向量。
采用上述方式,可在确定特征向量时,将客服输入的语句与用户输入的语句进行区分,避免了客服输入的语句与用户输入的语句出现混淆,确定语句意图不准确的情况。
另外,在本说明书的一个或多个实施例中,当确定出各客服语句分别对应的特征向量以及各用户语句分别对应的特征向量后,还可对各客服语句对应的各特征向量以及各用户语句对应的各特征向量分别进行聚类。
具体的,首先,该服务器可根据确定出的各客服语句对应的特征向量,通过聚类算法,对各特征向量进行聚类,确定多个簇。并确定各簇对应的语句意图为携带客服标识的语句意图。
其次,该服务器可根据确定出的各用户语句对应的特征向量,通过聚类算法,对各特征向量进行聚类,确定多个簇。并确定各簇对应的语句意图为携带用户标识的语句意图。
采用上述方式,该服务器可对各客服语句对应的各特征向量以及各用户语句对应的各特征向量分别进行聚类,从而确定携带用户标识的各语句意图以及携带客服标识的各语句意图。
另外,在本说明书的一个或多个实施例中,为了提高聚类的准确性,该服务器在聚类后,可由人工对聚类后的各簇进行优化。例如,删除各簇中与其他语句表达内容不一致的语句,将多个表达内容相似的簇合并等,具体如何优化,本说明书不做限制,可根据需要设置。
另外,在本说明书的一个或多个实施例中,由于用户输入的语句往往无法控制,因此,在步骤S106中,为了节省成本,无需确定衔接各客服的语句意图的若干语句意图的衔接条件。
具体的,针对每个会话序列,可判断该会话序列中最后一个语句意图槽位对应的语句意图的标识是否为用户。若是,则该服务器可在确定该会话序列后续衔接的语句意图时,不确定衔接条件。
采用上述方式,可在构建各业务场景下的会话流程时,节约成本。
另外,在本说明书的一个或多个实施例中,在训练该回复概率模型时,由于该相似度模型计算时间较长,为了减少该相似度模型的计算量,进一步减少该相似度模型的计算时间,提高效率,可优先确定各待选语句意图。
具体的,针对该业务场景下各会话流程中的每个语句,该服务器额根据该语句以及该业务场景下的各语句意图,通过预设的相似算法,确定该业务场景下的各语句意图中与该语句近似值最高的第四数量的语句意图,为待选语句意图。再根据该相似度模型,从各待选语句意图中,确定与该语句相似度最高的待选语句意图,作为该语句对应的语句意图。
其中,该相似算法可采用现有的算法,例如,文本相似度(Okapi BM25,BM25)算法、词频逆文档(term frequency–inverse document frequency,TF-IDF)算法等。当然,在使用该相似算法前可对该相似算法进行预训练,具体预训练过程可参考现有的预训练过程,本说明书不做赘述。
另外,在本说明书的一个或多个实施例中,在步骤S106中,构建各业务场景下的会话流程时,可确定衔接该初始化的会话序列的各语句意图均为用户的语句意图,或确定衔接该初始化的会话序列的各语句意图均为客服的语句意图。当然,对于不同业务场景下的会话流程,无需统一。例如,确定A业务场景下的会话流程中衔接该初始化的会话序列的各语句意图均为客服的语句意图,B业务场景下的会话流程中衔接该初始化的会话序列的各语句意图均为用户的语句意图。
另外,在本说明书的一个或多个实施例中,为了提高构建各会话流程的效率,该服务器可在训练该回复概率模型时,在各会话数据的第一个语句前添加起始符,最后一个语句后添加结束符。在确定初始化的会话序列时,可根据该起始符,构建该初始化的会话序列。例如,该起始符为“SOS”,则该初始化的会话序列为(Null,Null,SOS)。
另外,在本说明书的一个或多个实施例中,由于需要确定用户正在咨询的问题属于哪个业务场景,因此,该服务器可构建业务场景确定流程。
由于若干个业务场景可构成一个会话场景。例如,关于共享单车的“忘记关锁”、“硬件故障”、“软件故障等业务场景”,可构成共享单车会话场景。而会话场景可由用户发起咨询的咨询通道确定。例如,共享单车会话场景的会话由用户通过“XX单车”应用程序对应的咨询通道发起咨询。于是,该服务器可针对每个会话场景,构建业务场景确定流程。
具体的,针对每个会话场景,获取该会话场景中各会话数据,并截取各会话数据中前第三数量的语句,作为各训练数据。再按照上述S100~S110的步骤,对各训练数据中的各语句对应的特征向量进行聚类,标注各簇对应的语句意图,并确定各会话序列,最后根据各会话序列确定该会话场景下的业务场景确定流程。
采用上述方式,可确定业务场景确定流程,该服务器在接收到用户输入的语句后,便可先根据该业务场景确定流程,确定用户输入语句对应的业务场景,并通过该业务场景对应的会话流程为该用户解决问题。
图2为本说明书中一种会话流程的应用方法的流程示意图,具体包括以下步骤:
S200:确定正在进行的会话的业务场景,并获取所述会话中用户输入的语句。
由于智能客服、会话流程等的运行需要大量的算力,因此可由服务器来执行。于是,在本说明书一个或多个实施例中,该会话流程的应用方法,可由服务器执行。当然,该服务器具体是单独的一台设备,或是由多台设备组成的分布式服务器系统,本说明书不做限制,可根据需要设置。
具体的,该服务器可获取用户输入的语句,并根据用户输入语句的渠道、平台等,确定正在进行会话的业务场景。当然,由于部分业务场景可能无法通过平台、渠道区分。例如,忘记关锁、车辆硬件故障两个业务场景的问题,用户均可通过共享单车平台进行反馈。因此,该服务器也可采用其他方式确定正在进行会话的业务场景,例如,提供给用户若干选项,并根据用户的选择确定业务场景、通过对用户输入的语句进行语义分析确定业务场景、通过前述构建完成的业务场景确定流程确定等。具体采用何种方式确定正在继续会话的业务场景,可根据需要设置,本说明书不做限制。
S202:根据相似度模型以及所述业务场景下的各语句意图,确定所述语句对应的语句意图。
在本说明书的一个或多个实施例中,在确定正在进行会话的业务场景以及用户输入的语句后,便可根据该业务场景下的会话流程,确定该语句对应的语句意图,以回复用户。
具体的,根据该业务场景,确定该业务场景下的各语句意图。再根据该用户输入的语句以及各语句意图,通过训练完成的相似度模型,确定与该语句相似度最高的语句意图,作为该语句对应的语句意图。具体过程可参考图1训练回复概率模型时,确定各会话数据中各语句对应的语句意图中对应描述,这里不再赘述。
采用上述方式,确定该用户输入的语句对应的语句意图后,便可回复该用户。
S204:根据所述业务场景对应的会话流程以及所述语句对应的语句意图,从所述会话流程内衔接所述语句意图的各语句意图中,确定回复所述用户的语句意图对应的回复语句,回复所述用户。
在本说明书的一个或多个实施例中,确定出用户输入的语句应的语句意图后,便可通过该业务场景下的会话流程,回复该用户。
具体的,首先,根据该业务场景,确定该业务场景对应的会话流程。并根据该语句对应的语句意图以及该会话流程中的各语句意图,确定在该会话流程的各语句意图中与该语句对应的语句意图匹配的语句意图,为待回复语句意图。其中,匹配可以是相同。
其次,根据该待回复语句,确定在该会话流程中该待回复语句后续衔接的各语句意图以及各语句意图对应的衔接条件,根据各衔接条件确定该待回复语句后续衔接各语句意图对应的衔接概率。根据各衔接概率,随机确定任一语句意图为回复该用户的语句意图,并根据回复该用户的语句意图,确定回复该用户的回复语句,回复该用户。
采用上述方式,该服务器可根据该用户输入的语句对应的语句意图,通过该业务场景下的会话流程,回复该用户。
采用上述方法,可确定正在进行的会话的业务场景,并获取该会话中用户输入的语句。再根据相似度模型以及该业务场景下的各语句意图,确定该语句对应的语句意图。最后,根据该业务场景对应的会话流程以及该语句对应的语句意图,从该会话流程内衔接该语句意图的各语句意图中,确定回复该用户的语句意图对应的回复语句,回复该用户。
从上述方法可以看出,可根据会话流程精准回复用户,提高用户体验,并且,该会话流程的训练过程中无需耗费大量人力,节约成本。
另外,在本说明书的一个或多个实施例中,由于该相似度模型计算时间较长,为了减少该相似度模型的计算量,进一步减少该相似度模型的计算时间,提高效率,在步骤S202中,可优先确定各待选语句意图。
具体的,根据该语句以及该业务场景下的各语句意图,通过预设的相似算法,确定该业务场景下的各语句意图中与该语句近似值最高的第二数量的语句意图,为待选语句意图。再根据该相似度模型,从各待选语句意图中,确定与该语句相似度最高的待选语句意图,作为该语句对应的语句意图。具体过程可参考图1训练回复概率模型时,确定各会话数据中各语句对应的语句意图中对应描述,这里不再赘述。
采用上述方式,可提前采用计算速度较快,但准确性较低的相似算法从多个语句意图中,确定第二数量的待选语句意图,再通过准确率较高的该相似度模型从各待选语句意图中,确定该语句对应的语句意图。从而提高效率。
另外,在本说明书的一个或多个实施例中,由于各会话流程中存在若干操作接口节点,因此,还可采用以下方式确定回复用户的回复语句。
具体的,首先,根据该业务场景,确定该业务场景对应的会话流程。并根据该语句对应的语句意图以及该会话流程中的各语句意图,确定在该会话流程的各语句意图中与该语句对应的语句意图匹配的语句意图,为待回复语句意图。
其次,当该待回复语句意图后续衔接操作接口节点时,该服务器可调用该操作接口节点对应的操作接口,并获取该操作接口的返回值。再根据该操作接口节点后续衔接的各语句意图对应的衔接条件以及该返回值,确定该返回值匹配的衔接条件对应的语句意图,为回复该用户的语句意图,并根据回复该用户的语句意图,确定回复该用户的回复语句,回复该用户。
另外,在本说明书的一个或多个实施例中,由于操作接口的调用需要一定的参数,因此,该服务器还可采用以下方式确定参数。
具体的,当确定出的待回复语句意图后续衔接操作接口节点时,该服务器可确定该待回复语句意图对应的语句,并通过参数识别模型确定该语句中的参数,从而进行操作接口的调用。
当然,由于用户输入的语句可能千奇百怪,因此,该参数识别模型可包括参数标注子模块以及参数提取子模块。该参数标注子模块可根据该语句,从该语句中标注出待选参数,该参数提取子模块可根据该待选参数,确定形式统一的参数。例如,该语句为“我一共骑了20分钟。”该参数标注子模块可将“20分钟”从该语句中标注出,标注后的语句为“我一共骑了20分钟。”,该参数提取子模块可根据标注出的“20分钟”,确定time=20min,其中,time为参数,20为数值,min为标准单位。
其中,该参数识别模型可采用现有的模型,例如,双向长短期记忆(Bi-directional Long Short-Term Memory,BILSTM)模型、条件随机场(conditional randomfield,CRF)模型、BILSTM模型与CRF模型的组合等。具体采用何种模型,本说明书不做限制,可根据需要设置。
采用上述方式,该会话流程可确定用户输入的语句中的参数,并根据该参数调用相应操作接口,以回复该用户。
需要说明的是,本申请中所有获取信号、信息或数据的动作都是在遵照所在地国家相应的数据保护法规政策的前提下,并获得由相应装置所有者给予授权的情况下进行的。
以上为本说明书的一个或多个实施例提供的会话流程的构建、应用方法,基于同样的思路,本说明书还提供了相应的会话流程的构建装置,如图5所示。
图5为本说明书提供的一种会话流程的构建装置示意图,具体包括:
特征提取模块300,针对每个业务场景,通过特征提取模型,对该业务场景下获取的各会话数据中的各语句进行特征提取,确定所述各语句分别对应的特征向量;
聚类模块302,对所述各特征向量聚类,标注聚类后各簇分别对应的语句意图;
确定概率模块304,根据预设语句意图槽位数量,生成初始化的会话序列,并将所述初始化的会话序列输入至回复概率模型中,确定所述会话序列后续衔接各语句意图的概率;
确定语句意图模块306,根据确定出的各语句意图的概率,确定第一数量的语句意图;
重复模块308,按照所述会话序列中语句意图槽位从远到近的顺序,删除至少一条语句意图,并根据确定出的各语句意图,重新生成若干会话序列,并将重新生成各会话序列输入所述回复概率模型,继续重复上述过程,直至确定出的各会话序列后续衔接各语句意图的概率均小于所述预设概率为止;
会话流程模块310,根据确定出的各会话序列,确定该业务场景下的会话流程,所述会话流程用于根据用户输入的语句回复所述用户。
可选的,所述确定语句意图模块306,根据确定出的各语句意图的概率以及预设概率,确定大于所述预设概率的概率对应的各语句意图,作为各候选语句意图,按照所述各候选语句意图对应概率从大到小的顺序,确定第一数量的候选语句意图,作为各语句意图。
可选的,所述确定概率模块304,根据通过所述回复概率模型确定出的衔接各会话序列的各语句意图的概率,确定所述各语句意图对应的概率分别为各语句意图的衔接条件,所述衔接条件,用于在确定用户输入的语句对应的语句意图后,从所述会话流程衔接所述语句意图的各语句意图中,确定用于回复所述用户的语句意图。
可选的,所述特征提取模块300,获取该业务场景下的各会话数据,并确定所述各会话数据中的各客服语句以及各用户语句,通过预训练的特征提取模型,对所述各客服语句进行特征提取,确定各客服语句分别对应的特征向量,通过预训练的特征提取模型,对所述各用户语句进行特征提取,确定各用户语句分别对应的特征向量。
可选的,所述聚类模块302,对各客服语句分别对应的特征向量进行聚类,并标注聚类后的各簇分别对应的语句意图,所述语句意图为所述簇中各特征向量对应客服语句表达的内容,对各用户语句分别对应的特征向量进行聚类,并标注聚类后的各簇分别对应的语句意图,所述语句意图为所述簇中各特征向量对应用户语句表达的内容。
可选的,所述确定概率模块304,按照所述会话序列中语句意图槽位从远到近的顺序,判断所述会话序列中最后一个槽位的语句意图是否为客服对应的语句意图,若是,则从各用户对应的语句意图中,确定衔接所述语句意图的各语句意图的概率,若否,则从各客服对应的语句意图中,确定衔接所述语句意图的各语句意图的概率。
可选的,所述会话流程模块310,根据确定出的各会话序列,确定该业务场景下的会话流程,根据该业务场景下的会话流程,确定所述会话流程中的各语句意图,当确定所述会话流程中存在需要调用操作接口回复的语句意图时,针对每个需要调用操作接口回复的语句意图,根据回复该语句意图需要调用的操作接口,在该语句意图后插入操作接口节点,并根据所述操作接口的若干返回值以及衔接该语句意图的各语句意图,更新各语句意图对应的衔接条件。
本说明书还提供了相应的会话流程的应用装置,如图6所示。
图6为本说明书提供的一种会话流程的应用装置示意图,具体包括:
获取模块400,确定正在进行的会话的业务场景,并获取所述会话中用户输入的语句;
确定模块402,根据相似度模型以及所述业务场景下的各语句意图,确定所述语句对应的语句意图;
回复模块404,根据所述业务场景对应的会话流程以及所述语句对应的语句意图,从所述会话流程内衔接所述语句意图的各语句意图中,确定回复所述用户的语句意图对应的回复语句,回复所述用户。
可选的,所述确定模块402,根据相似算法以及所述业务场景下的各语句意图,确定与所述语句近似值最高的第二数量的语句意图,作为各待选语句意图,根据相似度模型以及所述各待选语句意图,确定与所述语句相似度最高的待选语句意图,作为所述语句对应的语句意图。
可选的,所述回复模块404,确定所述业务场景对应的会话流程,根据所述语句对应的语句意图以及所述会话流程中的各语句意图,确定在所述会话流程中与所述语句意图匹配的语句意图,作为待回复语句意图,根据所述待回复语句意图衔接各语句意图对应的衔接条件,确定回复所述用户的语句意图,所述衔接条件分别为各语句意图衔接所述待回复语句意图对应会话序列的概率,根据所述语句意图,确定回复所述用户的回复语句,回复所述用户。
可选的,所述回复模块404,确定所述业务场景对应的会话流程,根据所述语句对应的语句意图以及所述会话流程中的各语句意图,确定在所述会话流程中与所述语句意图匹配的语句意图,作为待回复语句意图,根据所述待回复语句意图后的操作接口节点,调用所述操作接口节点对应的操作接口,确定所述操作接口的返回值,根据所述返回值以及所述操作接口节点后衔接的各语句意图对应的衔接条件,确定回复所述用户的语句意图,根据所述语句意图,确定回复所述用户的回复语句,回复所述用户。
本说明书还提供了一种计算机可读存储介质,该存储介质存储有计算机程序,计算机程序可用于执行上述图1或图2提供的会话流程的构建、应用方法。
本说明书还提供了图7所示的电子设备的示意结构图。如图7所述,在硬件层面,该电子设备包括处理器、内部总线、网络接口、内存以及非易失性存储器,当然还可能包括其他业务所需要的硬件。处理器从非易失性存储器中读取对应的计算机程序到内存中然后运行,以实现上述图1或图2所述的会话流程的构建、应用方法。当然,除了软件实现方式之外,本说明书并不排除其他实现方式,比如逻辑器件抑或软硬件结合的方式等等,也就是说以下处理流程的执行主体并不限定于各个逻辑单元,也可以是硬件或逻辑器件。
在20世纪90年代,对于一个技术的改进可以很明显地区分是硬件上的改进(例如,对二极管、晶体管、开关等电路结构的改进)还是软件上的改进(对于方法流程的改进)。然而,随着技术的发展,当今的很多方法流程的改进已经可以视为硬件电路结构的直接改进。设计人员几乎都通过将改进的方法流程编程到硬件电路中来得到相应的硬件电路结构。因此,不能说一个方法流程的改进就不能用硬件实体模块来实现。例如,可编程逻辑器件(Programmable Logic Device,PLD)(例如现场可编程门阵列(Field Programmable GateArray,FPGA))就是这样一种集成电路,其逻辑功能由用户对器件编程来确定。由设计人员自行编程来把一个数字系统“集成”在一片PLD上,而不需要请芯片制造厂商来设计和制作专用的集成电路芯片。而且,如今,取代手工地制作集成电路芯片,这种编程也多半改用“逻辑编译器(logic compiler)”软件来实现,它与程序开发撰写时所用的软件编译器相类似,而要编译之前的原始代码也得用特定的编程语言来撰写,此称之为硬件描述语言(Hardware Description Language,HDL),而HDL也并非仅有一种,而是有许多种,如ABEL(Advanced Boolean Expression Language)、AHDL(Altera Hardware DescriptionLanguage)、Confluence、CUPL(Cornell University Programming Language)、HDCal、JHDL(Java Hardware Description Language)、Lava、Lola、MyHDL、PALASM、RHDL(RubyHardware Description Language)等,目前最普遍使用的是VHDL(Very-High-SpeedIntegrated Circuit Hardware Description Language)与Verilog。本领域技术人员也应该清楚,只需要将方法流程用上述几种硬件描述语言稍作逻辑编程并编程到集成电路中,就可以很容易得到实现该逻辑方法流程的硬件电路。
控制器可以按任何适当的方式实现,例如,控制器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(Application Specific Integrated Circuit,ASIC)、可编程逻辑控制器和嵌入微控制器的形式,控制器的例子包括但不限于以下微控制器:ARC 625D、Atmel AT91SAM、Microchip PIC18F26K20以及Silicone Labs C8051F320,存储器控制器还可以被实现为存储器的控制逻辑的一部分。本领域技术人员也知道,除了以纯计算机可读程序代码方式实现控制器以外,完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件,而对其内包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至,可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。
上述实施例阐明的系统、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的,计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。
为了描述的方便,描述以上装置时以功能分为各种单元分别描述。当然,在实施本说明书时可以把各单元的功能在同一个或多个软件和/或硬件中实现。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域技术人员应明白,本说明书的实施例可提供为方法、系统或计算机程序产品。因此,本说明书可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本说明书可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本说明书可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本说明书,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本说明书的实施例而已,并不用于限制本说明书。对于本领域技术人员来说,本说明书可以有各种更改和变化。凡在本说明书的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。

Claims (10)

1.一种会话流程的应用方法,其特征在于,包括:
确定正在进行的会话的业务场景,并获取所述会话中用户输入的语句;
根据相似度模型以及所述业务场景下预设的各语句意图,确定所述语句对应的语句意图,其中,所述各语句意图为根据所述业务场景的各会话数据中的各语句进行聚类,并对聚类后各簇进行标注确定的;
根据预设的所述业务场景对应的会话流程以及所述语句对应的语句意图,从所述会话流程内衔接所述语句意图的各语句意图中,确定回复所述用户的语句意图对应的回复语句,回复所述用户。
2.如权利要求1所述的方法,其特征在于,所述业务场景对应的会话流程采用下述方式确定:
将预设语句意图槽位数量的初始化的会话序列,输入至回复概率模型中,确定所述会话序列后续衔接各语句意图的概率;
根据各语句意图的概率,确定衔接所述初始化的会话序列的第一数量的语句意图,并重新生成各会话序列;
将重新生成的各会话序列分别输入所述回复概率模型,继续重复上述过程,直至确定出的各会话序列后续衔接各语句意图的概率均小于所述预设概率为止,根据生成的各会话序列确定会话流程。
3.根据权利要求1所述的方法,其特征在于,根据相似度模型以及所述业务场景下预设的各语句意图,确定所述语句对应的语句意图,具体包括:
根据相似算法以及所述业务场景下的各语句意图,确定与所述语句近似值最高的第二数量的语句意图,作为各待选语句意图;
根据相似度模型以及所述各待选语句意图,确定与所述语句相似度最高的待选语句意图,作为所述语句对应的语句意图。
4.根据权利要求1所述的方法,其特征在于,根据所述业务场景对应的会话流程以及所述语句对应的语句意图,从所述会话流程内衔接所述语句意图的各语句意图中,确定回复所述用户的语句意图对应的回复语句,回复所述用户,具体包括:
确定预设的所述业务场景对应的会话流程;
根据所述语句对应的语句意图以及所述会话流程中的各语句意图,确定在所述会话流程中与所述语句意图匹配的语句意图,作为待回复语句意图;
根据所述待回复语句意图衔接各语句意图对应的衔接条件,确定回复所述用户的语句意图,所述衔接条件分别为各语句意图衔接所述待回复语句意图对应会话序列的概率;
根据所述语句意图,确定回复所述用户的回复语句,回复所述用户。
5.根据权利要求1所述的方法,其特征在于,所述方法还包括:
根据通过所述回复概率模型确定出的衔接各会话序列的各语句意图的概率,确定所述各语句意图对应的概率分别为各语句意图的衔接条件,所述衔接条件,用于在确定用户输入的语句对应的语句意图后,从所述会话流程衔接所述语句意图的各语句意图中,确定用于回复所述用户的语句意图;
确定所述会话流程中需要调用操作接口回复的语句意图,并针对每个需要调用操作接口回复的语句意图,根据回复该语句意图需要调用的操作接口,在该语句意图后插入操作接口节点,根据所述操作接口的若干返回值以及衔接该语句意图的各语句意图,分别更新所述各语句意图对应的衔接条件。
6.根据权利要求1所述的方法,其特征在于,根据所述业务场景对应的会话流程以及所述语句对应的语句意图,从所述会话流程内衔接所述语句意图的各语句意图中,确定回复所述用户的语句意图对应的回复语句,回复所述用户,具体包括:
确定预设的所述业务场景对应的会话流程;
根据所述语句对应的语句意图以及所述会话流程中的各语句意图,确定在所述会话流程中与所述语句意图匹配的语句意图,作为待回复语句意图;
根据所述待回复语句意图后的操作接口节点,调用所述操作接口节点对应的操作接口,确定所述操作接口的返回值;
根据所述返回值以及所述操作接口节点后衔接的各语句意图对应的衔接条件,确定回复所述用户的语句意图;
根据所述语句意图,确定回复所述用户的回复语句,回复所述用户。
7.根据权利要求1所述的方法,其特征在于,根据所述业务场景的各会话数据中的各语句进行聚类,并对聚类后各簇进行标注,确定所述各语句意图,具体包括:
获取所述业务场景下的各会话数据,并确定所述各会话数据中的各客服语句以及各用户语句;
通过特征提取模型,分别对所述各客服语句和所述各用户语句进行特征提取,确定所述各客服语句分别对应的特征向量以及所述各用户语句分别对应的特征向量;
对所述各客服语句分别对应的特征向量进行聚类,标注聚类后的各簇分别对应的语句意图;
对所述各用户语句分别对应的特征向量进行聚类,标注聚类后的各簇分别对应的语句意图。
8.一种会话流程的应用装置,其特征在于,包括:
获取模块,确定正在进行的会话的业务场景,并获取所述会话中用户输入的语句;
确定模块,根据相似度模型以及所述业务场景下预设的各语句意图,确定所述语句对应的语句意图,其中,所述各语句意图为根据所述业务场景的各会话数据中的各语句进行聚类,并对聚类后各簇进行标注确定的;
回复模块,根据预设的所述业务场景对应的会话流程以及所述语句对应的语句意图,从所述会话流程内衔接所述语句意图的各语句意图中,确定回复所述用户的语句意图对应的回复语句,回复所述用户。
9.一种计算机可读存储介质,其特征在于,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述权利要求1~7任一项所述的方法。
10.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现上述权利要求1~7任一项所述的方法。
CN202210950450.1A 2022-08-09 2022-08-09 一种会话流程的应用方法及装置 Pending CN115391503A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210950450.1A CN115391503A (zh) 2022-08-09 2022-08-09 一种会话流程的应用方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210950450.1A CN115391503A (zh) 2022-08-09 2022-08-09 一种会话流程的应用方法及装置

Publications (1)

Publication Number Publication Date
CN115391503A true CN115391503A (zh) 2022-11-25

Family

ID=84118724

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210950450.1A Pending CN115391503A (zh) 2022-08-09 2022-08-09 一种会话流程的应用方法及装置

Country Status (1)

Country Link
CN (1) CN115391503A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115640392A (zh) * 2022-12-06 2023-01-24 杭州心识宇宙科技有限公司 一种对话系统优化的方法、装置、存储介质及电子设备

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115640392A (zh) * 2022-12-06 2023-01-24 杭州心识宇宙科技有限公司 一种对话系统优化的方法、装置、存储介质及电子设备
CN115640392B (zh) * 2022-12-06 2023-04-07 杭州心识宇宙科技有限公司 一种对话系统优化的方法、装置、存储介质及电子设备

Similar Documents

Publication Publication Date Title
CN111309889B (zh) 用于文本处理的方法和装置
CN111639168B (zh) 一种多轮对话的处理方法、装置、电子设备及存储介质
CN112632961B (zh) 基于上下文推理的自然语言理解处理方法、装置以及设备
CN112671886B (zh) 基于边缘计算和人工智能的信息推送方法及大数据服务器
CN112527998A (zh) 一种答复推荐方法、答复推荐装置及智能设备
CN115952272B (zh) 一种生成对话信息的方法、装置、设备及可读存储介质
US11984115B2 (en) Dialog system capable of semantic-understanding mapping between user intents and machine services
CN112735374B (zh) 一种自动语音交互的方法及装置
CN115203394A (zh) 一种模型训练的方法、业务执行的方法及装置
CN109670033A (zh) 内容的检索方法、装置、设备及存储介质
CN111144132B (zh) 一种语义识别方法及装置
CN115759122A (zh) 一种意图识别方法、装置、设备及可读存储介质
CN115146601A (zh) 语言处理任务的执行方法、装置、可读存储介质以及设备
CN115391503A (zh) 一种会话流程的应用方法及装置
CN115129878A (zh) 一种对话业务执行方法、装置、存储介质及电子设备
AU2022201193A1 (en) System and method for designing artificial intelligence (ai) based hierarchical multi-conversation system
CN112735407B (zh) 一种对话处理方法及装置
CN113032538A (zh) 一种基于知识图谱的话题转移方法、控制器及存储介质
CN116186231A (zh) 一种回复文本的生成方法、装置、存储介质及电子设备
CN114297352A (zh) 对话状态追踪方法、装置、人机对话系统及作业机械
CN114817447A (zh) 文本处理方法、装置、存储介质、电子设备及系统
CN106682221B (zh) 问答交互的响应方法、装置及问答系统
CN113342956B (zh) 一种用于多轮对话中相同槽值填充的方法
CN112163078B (zh) 智能应答方法、装置、服务器及存储介质
CN115952271B (zh) 一种生成对话信息的方法、装置、存储介质及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination