CN110188190A - 对话解析方法、装置、服务器及可读存储介质 - Google Patents

对话解析方法、装置、服务器及可读存储介质 Download PDF

Info

Publication number
CN110188190A
CN110188190A CN201910267030.1A CN201910267030A CN110188190A CN 110188190 A CN110188190 A CN 110188190A CN 201910267030 A CN201910267030 A CN 201910267030A CN 110188190 A CN110188190 A CN 110188190A
Authority
CN
China
Prior art keywords
sentence
dialogue
terminal
point statement
classification
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910267030.1A
Other languages
English (en)
Other versions
CN110188190B (zh
Inventor
付锦华
崔恒斌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Advanced New Technologies Co Ltd
Advantageous New Technologies Co Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN201910267030.1A priority Critical patent/CN110188190B/zh
Publication of CN110188190A publication Critical patent/CN110188190A/zh
Application granted granted Critical
Publication of CN110188190B publication Critical patent/CN110188190B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • G06F16/355Class or cluster creation or modification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/211Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Machine Translation (AREA)

Abstract

本说明书实施例公开了一种对话解析方法,对待解析对话进行对话动作分类,得到所述待解析对话中每个对话角色的每个语句的对话动作类别;根据每个对话角色的每个语句的对话动作类别,对所述待解析对话中语句之间的对话依存关系进行分析,获取每个起点语句与终点语句之间的响应关系;根据每个对话角色的每个起点语句与终点语句之间的响应关系,对所述待解析对话进行解析;此时,由于在确定每个起点语句与终点语句之间的响应关系是利用每个语句的对话动作类别进行对话依存关系分析而得到的,能够确保每个起点语句和终点语句之间的响应关系的准确性,在响应关系的准确度较高的情况下进行对话解析,能够使得对话解析的准确性也随之提高。

Description

对话解析方法、装置、服务器及可读存储介质
技术领域
本说明书实施例涉及语言处理技术领域,尤其涉及一种对话解析方法、装置、服务器及可读存储介质。
背景技术
随着人工智能技术的发展,以智能对话系统为核心的语音、文本机器人出现在各行各业中。不论在什么场景下,构建者都是基于对该场景中人与人之间的对话内容进行理解,然后进一步划分到闲聊、问答、任务执行等具体的类别。在自助客服机器人、人工客服工作台、智能语音助理等产品中,用户于对于问答的需求占很大的比重。
现有技术中,对于对话模式的抽象中通常进行对话动作分类,得到每个语句的对话动作类别,再直接使用每个语句的对话动作类别对对话进行解析,其解析结果的准确性不高。
发明内容
本说明书实施例提供了一种对话解析方法、装置、服务器及可读存储介质,能够有效提高对话解析的准确度。
本说明书实施例第一方面提供了一种对话解析方法,包括:
对待解析对话进行对话动作分类,得到所述待解析对话中每个对话角色的每个语句的对话动作类别;
根据每个对话角色的每个语句的对话动作类别,对所述待解析对话中语句之间的对话依存关系进行分析,获取每个起点语句与终点语句之间的响应关系,其中,每个起点语句及其对应的终点语句均对应两个对话角色,且每个起点语句和每个终点语句的对话动作类别为设定类别的语句。
本说明书实施例第二方面提供了一种对话解析装置,包括:
对话动作类别获取单元,用于对待解析对话进行对话动作分类,得到所述待解析对话中每个对话角色的每个语句的对话动作类别;
响应关系获取单元,用于根据每个对话角色的每个语句的对话动作类别,对所述待解析对话中语句之间的对话依存关系进行分析,获取每个起点语句与终点语句之间的响应关系,其中,每个起点语句及其对应的终点语句均对应两个对话角色,且每个起点语句和每个终点语句的对话动作类别为设定类别的语句。
本说明书实施例第三方面还提供了一种服务器,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述对话解析方法的步骤。
本说明书实施例第四方面还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时上述对话解析方法的步骤。
本说明书实施例的有益效果如下:
基于上述技术方案,首先对待解析对话进行分类得到每个语句的对话动作类别,然后根据每个语句的对话动作类别确定每个起点语句和终点语句之间的响应关系,再利用每个起点语句与终点语句之间的响应关系进行对话解析,由于在确定每个起点语句与终点语句之间的响应关系是利用每个语句的对话动作类别进行对话依存关系分析而得到的,能够确保每个起点语句和终点语句之间的响应关系的准确性,在响应关系的准确度较高的情况下进行对话解析,能够使得对话解析的准确性也随之提高。
附图说明
图1为本说明书实施例中对话解析应用场景示意图;
图2为本说明书实施例中对话解析方法的方法流程图;
图3为本说明书实施例中获取每个起点语句与终点语句之间的响应关系的方法流程图;
图4为本说明书实施例中每个起点语句与对应的每个终点语句之间创建有向边的结构示意图;
图5为本说明书实施例中获取每个对话角色的每个语句的对话动作类别的方法流程图;
图6为本说明书上实施例中获取每个对话角色的每个语句的对话动作类别的结构示意图;
图7为本说明书实施例中对话解析装置的结构示意图;
图8为本说明书实施例中服务器的结构示意图。
具体实施方式
为了更好的理解上述技术方案,下面通过附图以及具体实施例对本说明书实施例的技术方案做详细的说明,应当理解本说明书实施例以及实施例中的具体特征是对本说明书实施例技术方案的详细的说明,而不是对本说明书技术方案的限定,在不冲突的情况下,本说明书实施例以及实施例中的技术特征可以相互组合。
请参见图1,为本说明书实施例的对话解析方法的一种应用场景示意图。包括用户100和机器人200。用户100可以与机器人200对话,例如用户100问C1:谁创造了你;机器人200回C2:某某团队创造了我;用户100问C3:xx歌曲的演唱者是谁;机器人200回C4:张三;这段对话为待解析对话,首先获取这段对话中每个语句的对话动作类别,再根据每个语句的对话动作类别对这段对话中语句之间的对话依存关系进行分析,确定出用户100中的每个起点语句是用于回答机器人200中的哪个终点语句的提问;确定出用户100中的每个起点语句是用于反问机器人200中的哪个终点语句的提问;确定出机器人200中的每个起点语句是用于回答用户100中的哪个终点语句的提问;确定出机器人200中的每个起点语句是用于反问用户100中的哪个终点语句的提问,进而确定出每个起点语句与终点语句之间的响应关系,再根据每个起点语句与终点语句之间的响应关系对这段对话进行解析,能够更准确的解析出该段对话的内容。
当然,本说明书实施例提供的一种对话解析方法还可以应用在用户与智能音箱进行的对话进行解析。
第一方面,如图2所示,本说明书实施例提供一种对话解析方法,包括:
S202、对待解析对话进行对话动作分类,得到所述待解析对话中每个对话角色的每个语句的对话动作类别;
S204、根据每个对话角色的每个语句的对话动作类别,对所述待解析对话中语句之间的对话依存关系进行分析,获取每个起点语句与终点语句之间的响应关系,其中,每个起点语句及其对应的终点语句对应两个对话角色,且每个起点语句和每个终点语句的对话动作类别为设定类别的语句。
其中,在步骤S202中,可以使用分类器对所述待解析对话进行对话动作分类,得到每个语句的对话动作类别,所述分类器例如可以是Softmax线性分类器、logistic分类器和决策树分类器等。
具体来讲,在使用所述分类器对所述待解析对话进行对话动作分类时,可以获取所述待解析对话中的每个语句的句子向量,然后将每个语句的句子向量输入到所述分类器中进行分类,从而得到每个语句的对话动作类别。
本说明书实施例中,所述对话动作类别包括提问类别、回答类别和其他类别等。例如,对话示例如下:“语句A1、用户:这个保险可以保多久?语句B1、客服:您咨询的哪款保险。语句A2、用户:****险。语句B2、客服:这个终身理赔”,然后对上述待解析对话进行对话动作分类,得到A1的对话角色为用户且对话动作类别为提问类别,B1的对话角色为客服且对话动作类别为提问类别,A2的对话角色为用户且对话动作类别为回答类别,B2的对话角色为客服且对话动作类别为回答类别。
接下来执行步骤S204,在该步骤中,获取每个起点语句与终点语句之间的响应关系。
本说明书实施例中,所述对话依存关系指在一段对话中,不同语句之间的响应关系。例如,对话示例如下:“语句A1、用户:这个保险可以保多久?语句B1、客服:您咨询的哪款保险。语句A2、用户:****险。语句B2、客服:这个终身理赔”。在这段对话中对话依存关系具体为:B1是对A1的反问,A2是对B1的回答,B2是对A1的回答;如此,使得所述对话依存关系是用于确定一个对话角色中的每个起点语句是用于回答另一对话角色中的哪个终点语句的提问;以及用于确定一个对话角色中的每个起点语句是用于反问另一对话角色中的哪个终点语句的提问。
具体地,在确定一个对话角色中的每个起点语句是用于回答另一对话角色中的哪个终点语句的提问时,此时,可以确定起点语句为对话动作类别为回答类别的语句,及其对应的终点语句为对话动作类别为提问类别的语句;相应地,在确定一个对话角色中的每个起点语句是用于反问另一对话角色中的哪个终点语句的提问,此时,可以确定起点语句和终点语句均为对话动作类别为提问类别的语句;由上述可知,所述设定类别具体为提问类别和回答类别。
具体来讲,在确定一个对话角色中的每个起点语句是用于回答另一对话角色中的哪个终点语句的提问;以及用于确定一个对话角色中的每个起点语句是用于反问另一对话角色中的哪个终点语句的提问时,具体可以通过以下步骤实现,如图3所示:
步骤S2041、根据每个对话角色的每个语句的对话动作类别,将一个对话角色中的每个起点语句与另一对话角色中的所有的终点语句进行对应,获取每个起点语句及其对应的每个终点语句;
具体来讲,若一个对话角色中一个起点语句的对话动作类别为回答类别,那么将另一对话角色中所有对话动作类别为提问类别和回答类别的每个语句作为该起点语句对应的终点语句;相应地,若一个对话角色中一个起点语句的对话动作类别为提问类别,那么将另一对话角色中所有对话动作类别为提问类别和回答类别的每个语句作为该起点语句对应的终点语句;如此,可以获取到每个起点语句及其对应的每个终点语句。
具体地,若一个对话角色中一个起点语句的对话动作类别为回答类别,那么还可以将另一对话角色中所有对话动作类别为提问类别的每个语句作为该起点语句对应的终点语句;相应地,若一个对话角色中一个起点语句的对话动作类别为提问类别,那么还可以将另一对话角色中所有对话动作类别为提问类别的每个语句作为该起点语句对应的终点语句;如此,可以获取到每个起点语句及其对应的每个终点语句;此时,能够使得具有对应关系的起点语句和终点语句的数量更少且对应的准确度更高,使得在后续进行相关度计算时能够有效降低计算量并使得计算得到的相关度的准确度更高。
步骤S2042、对每个起点语句及其对应的每个终点语句进行相关度评价,得到每个起点语句及其对应的每个终点语句的相关度;
具体来讲,在获取每个起点语句及其对应的每个终点语句之后,可以通过创建的相关度模型对每个起点语句及其对应的每个终点语句进行相关度评价,得到每个起点语句及其对应的每个终点语句的相关度。
具体地,在创建所述相关度模型时,可以通过对起点语句和终点语句进行标注,得到标注数据;然后使用所述标注数据进行模型训练,训练得到所述相关度模型,即创建出所述相关度模型;在创建出所述相关度模型之后,利用所述相关度模型对每个起点语句及其对应的每个终点语句进行相关度评价,得到每个起点语句及其对应的每个终点语句的相关度。
具体地,所述相关度用于表征起点语句及其对应的终点语句之间的相关度,所述相关度可以用百分比或数字进行表示,本说明书实施例不作具体限制。
在本申请说明书另一实施例中,还可以根据图网络方法,在每个起点语句及其对应的每个终点语句之间创建一条有向边;通过所述相关度模型对创建的每条有向边进行评分,得到每条有向边对应的评分,其中,每条有向边的评分作为该条有向边对应的起点语句和终点语句的相关度。
具体地,所述相关度模型构建方法与一般的二分类机器学习任务相似,通过历史起点语句与历史终点语句之间的有向边进行标注,并将标注数据作为样本数据进行模型训练,得到所述相关度模型,然后使用训练得到的所述相关度模型可以对未标注的有向边进行预测,从而得到每个起点语句及其对应的每个终点语句之间的有向边的评分。
例如,若所述待解析对话为“语句A1、用户:这个保险可以保多久?语句B1、客服:您咨询的哪款保险。语句A2、用户:****险。语句B2、客服:这个终身理赔”,其中,所述待解析对话中的对话角色分为用户和客服,其中,通过步骤S202确定出A1和B1的对话动作类别均为提问类别,以及A2和B2的对话动作类别均为回答类别;在对话角色为用户且A1作为起点语句时,由于A1的对话动作类别为提问类别,则在客服中确定出对话动作类别为提问类别的所有语句作为终点语句,即确定B1为终点语句与起点语句A1对应并用(A1,B1)表示;相应地,在对话角色为用户且A2作为起点语句时,由于A2的对话动作类别为回答类别,则在客服中确定出对话动作类别为提问类别的所有语句作为终点语句,即确定B1为终点语句与A2对应并用(A2,B1)表示;相应地,以客服中的B1和B2均作为起点语句时,采用上述相同的方法,确定出起点语句B1与终点语句A1对应并用(B1,A1)表示;起点语句B2与终点语句A1相对应并用(B2,A1)表示。
其中,通过上述方式获取到每个起点语句及其对应的每个终点语句包括(A1,B1)、(A2,B1)、(B1,A1)和(B2,A1),然后在每个起点语句及其对应的每个终点语句之间创建一条有向边,具体如图4所示,在(A1,B1)之间创建一条有向边30;在(A2,B1)之间创建一条有向边31;在(B1,A1)之间创建一条有向边32;以及在(B2,A1)之间创建一条有向边33;然后通过所述相关度模型对创建的每条有向边进行评分,得到有向边30的评分为15%,有向边31的评分为78%,有向边32的评分为85%,以及有向边33的评分为92%。
步骤S2043,根据每个起点语句及其对应的每个终点语句的相关度,确定每个起点语句与终点语句之间的响应关系。
具体来讲,可以将每个起点语句及其对应的每个终点语句的相关度与阈值进行比对;在每对比出一个起点语句及其对应的终点语句的相关度大于所述阈值时,则确定该起点语句及其对应的终点语句之间具有响应关系,得到每个起点语句与终点语句之间的响应关系。
本说明书实施例中,所述阈值可以由系统或人工自行设定,也可以根据实际情况进行设定,本说明书不作具体限制。
具体地,在每条有向边的评分作为该条有向边对应的起点语句和终点语句的相关度时,还可以在每对比出一个起点语句及其对应的终点语句之间的有向边的评分大于所述阈值时,则确定该起点语句及其对应的终点语句之间具有响应关系,进而得到每个起点语句与终点语句之间的响应关系。
如此,在每对比出一个起点语句及其对应的终点语句的相关度大于所述阈值时,则确定该起点语句及其对应的终点语句之间具有响应关系,由此,使得筛选出的每个具有响应关系的起点语句与终点语句的相关度均大于所述阈值,如此,使得筛选出的每个具有响应关系的起点语句与终点语句的准确度更高,即准确解析出了所述待解析对话中上下文的信息。
本申请另一实施例中,在通过步骤S204获取的每个起点语句与终点语句之间的响应关系之后,所述方法还包括:根据每个对话角色的每个起点语句与终点语句之间的响应关系,对所述待解析对话进行解析。
具体来讲,通过步骤S204能够准确的确定出了一个对话角色中的每个起点语句是用于回答另一对话角色中的哪个终点语句的提问;以及确定出一个对话角色中的每个起点语句是用于反问另一对话角色中的哪个终点语句的提问;从而能够准确地确定出了语句之间的回答关系和反问关系,在准确地确定出了语句之间的回答关系和反问关系基础上进行语义分析,从而使得解析出的所述待解析的表达意思的准确度更高。
例如,参见图4,若所述待解析对话为“语句A1、用户:这个保险可以保多久?语句B1、客服:您咨询的哪款保险。语句A2、用户:****险。语句B2、客服:这个终身理赔”,且获取到有向边30的评分为15%,有向边31的评分为78%,有向边32的评分为85%,以及有向边33的评分为92%;若所述阈值为65%,由于92%>85%>78%>65%>15%,则确定出大于所述阈值的有向边为有向边31、有向边32和有向边33,且由于有向边31与(A2,B1)对应,有向边32与(B1,A1)对应,以及有向边33与(B2,A1)对应,如此,可以确定(A2,B1)之间具有响应关系,(B1,A1)之间具有响应关系,以及(B2,A1)之间具有响应关系;再根据上述响应关系对所述待解析对话进行解析,确定出A2是对B1提问的回答,B1是对A1提问的反问,以及B2是对A1提问的回答。
如此,通过此种方式,首先对待解析对话进行分类得到每个语句的对话动作类别,然后根据每个语句的对话动作类别确定每个起点语句和终点语句之间的响应关系,再利用每个起点语句与终点语句之间的响应关系进行对话解析,由于在确定每个起点语句与终点语句之间的响应关系是利用每个语句的对话动作类别进行对话依存关系分析而得到的,能够确保每个起点语句和终点语句之间的响应关系的准确性,在响应关系的准确度较高的情况下进行对话解析,能够使得对话解析的准确性也随之提高。
而且,由于在确定每个起点语句与对应的终点语句之间的响应关系时,通过相关度模型获取的每个起点语句及其对应的每个终点语句的相关度与阈值进行比对,并确定出相关度大于所述阈值的每个起点语句及其对应的终点语句之间具有响应关系,能够促使确定出的具有响应关系的每个起点语句及其对应的终点语句的准确度更高,使得后续通过响应关系进行对话解析的准确度也会随之提高。
在本申请说明书另一实施例中,在对待解析对话进行对话动作分类,得到所述待解析对话中每个对话角色的每个语句的对话动作类别时,参见图5,具体可以包括以下步骤:
步骤S2021、获取每个语句的语句内容和每个语句所对应的对话角色;
其中,首先获取每个语句的句子表示层,句子表示层包含两部分,其中一部分是对对话内容的表示,另一部分是对对话角色的表示。
具体来讲,可以从所述待解析对话中提取每个语句的语句内容和每个语句所对应的对话角色。
步骤S2022、对每个语句的语句内容进行向量提取,得到每个语句的第一句子向量;
其中,可以通过神经网络模型对每个语句的语句内容进行向量提取,得每个语句的第一句子向量。所述神经网络模型例如可以是BiLSTM模型或CNN模型等。
具体来讲,首先获取每个语句中每个词的词向量,然后将每个语句中每个词的词向量输入到所述神经网络模型中进行向量提取,提取到每个句子的第一句子向量。
步骤S2023、将每个语句的第一句子向量输入到与所述待解析对话对应的深度学习模型中进行向量提取,得到每个语句的第二句子向量;
具体来讲,首先通过深度学习对所述待解析对话进行建模,得到创建的所述深度学习模型;然后将每个语句的第一句子向量输入到与所述待解析对话对应的深度学习模型中进行向量提取,得到每个语句的第二句子向量。
具体地,可以使用长短期记忆网络(Long Short-Term Memory,简称LSTM)算法对所述待解析对话建模,得到LSTM模型,然后将每个语句的第一句子向量输入到所述LSTM模型中进行向量提取,得到每个语句的第二句子向量。
步骤S2024、利用每个语句的第二句子向量进行分类,得到每个语句的对话动作类别;
具体来讲,可以将每个语句的第二句子向量输入到分类器中进行分类,得到每个语句的对话动作类别,其中,所述分类器例如可以是Softmax线性分类器、logistic分类器和决策树分类器等。
具体地,在使用所述分类器进行分类之前,获取历史语句样本,将历史语句样本中的每个语句的第二句子向量和对话动作类别执行分类器算法,生成所述分类器;然后将步骤S2024中的每个语句的第二句子向量输入到所述分类器中分类,得到每个语句的对话动作类别。
步骤S2025、根据每个语句的对话动作类别和每个语句所对应的对话角色,得到每个对话角色中每个语句的对话动作类别。
具体来讲,在确定每个语句的对话动作类别之后,根据每个语句所对应的对话角色,确定出每个对话角色中每个语句的对话动作类别。
在实际应用过程中,在对待解析对话进行对话动作分类,得到所述待解析对话中每个对话角色的每个语句的对话动作类别时,可以将处理过程分为三层,所述三层包括句子表示层、对话表示层和输出层,其中,所述句子表示层包括通过步骤S2021获取的每个语句的语句内容和每个语句所对应的对话角色;相应地,所述对话表示层包括每个语句所对应的对话角色和通过步骤S2022和步骤S2023处理后得到的每个语句的第二句子向量;相应地,所述输出层包括通过步骤S2024获取的每个语句的对话动作类别。
例如,参见图6,以待解析对话中的语句A1和语句B1为例,通过步骤S2021获取到句子表示层中显示的A1的语句内容50和对话角色为用户51;以及通过步骤S2021获取到句子表示层中显示的B1的语句内容60和对话角色为客服61;相应地,通过步骤S2022和步骤S2023获取到对话表示层中显示的A1的第二句子向量52和对话角色为用户51;以及通过步骤S2022和步骤S2023获取到对话表示层中显示的B1的第二句子向量62和对话角色为用户61;相应地,将对话表示层中A1的第二句子向量52输入到分类器53中进行分类,输出A1的对话动作类别54,以及将对话表示层中B1的第二句子向量62输入到分类器63中进行分类,输出B1的对话动作类别64。
如此,本说明书实施例采用的技术方案在获取每个语句的第一句子向量之后,还将每个语句的第一句子向量输入到与所述待解析对话对应的深度学习模型中进行向量提取,得到每个语句的第二句子向量,如此,使得每个语句的第二句子向量是在每个语句的第一句子向量的基础上再参考每个语句的上下文中的信息而得到的,能够提高获取的每个语句的第二句子向量的准确性,使得利用每个语句的第二句子向量进行分类得到的分类结果的准确度也会随之提高,即提高了每个句子的对话动作类别的准确度。
第二方面,基于与第一方面的同一发明构思,本说明书实施例提供一种对话解析装置,如图7所示,包括:
对话动作类别获取单元701,用于对待解析对话进行对话动作分类,得到所述待解析对话中每个对话角色的每个语句的对话动作类别;
响应关系获取单元702,用于根据每个对话角色的每个语句的对话动作类别,对所述待解析对话中语句之间的对话依存关系进行分析,获取每个起点语句与终点语句之间的响应关系,其中,每个起点语句及其对应的终点语句均对应两个对话角色,且每个起点语句和每个终点语句的对话动作类别为设定类别的语句。
在一种可选方式中,响应关系获取单元702,具体用于根据每个对话角色的每个语句的对话动作类别,将一个对话角色中的每个起点语句与另一对话角色中的所有的终点语句进行对应,获取每个起点语句及其对应的每个终点语句;对每个起点语句及其对应的每个终点语句进行相关度评价,得到每个起点语句及其对应的每个终点语句的相关度;根据每个起点语句及其对应的每个终点语句的相关度,确定每个起点语句与终点语句之间的响应关系。
在一种可选方式中,响应关系获取单元702,还用于将每个起点语句及其对应的每个终点语句的相关度与阈值进行比对;在每对比出一个起点语句及其对应的终点语句的相关度大于所述阈值时,则确定该起点语句及其对应的终点语句之间具有响应关系,进而得到每个起点语句与终点语句之间的响应关系。
在一种可选方式中,响应关系获取单元702,还用于根据图网络方法,在每个起点语句及其对应的每个终点语句之间创建一条有向边;通过相关度模型对创建的每条有向边进行评分,得到每条有向边对应的评分,其中,每条有向边的评分作为该条有向边对应的起点语句和终点语句的相关度。
在一种可选方式中,对话动作类别获取单元701,具体用于获取每个语句的语句内容和每个语句所对应的对话角色;对每个语句的语句内容进行向量提取,得到每个语句的第一句子向量;将每个语句的第一句子向量输入到与所述待解析对话对应的深度学习模型中进行向量提取,得到每个语句的第二句子向量;利用每个语句的第二句子向量进行分类,得到每个语句的对话动作类别;根据每个语句的对话动作类别和每个语句所对应的对话角色,得到每个对话角色中每个语句的对话动作类别。
在一种可选方式中,对话动作类别获取单元701,还用于使用LSTM算法对所述待解析对话建模,得到LSTM模型;将每个语句的第一句子向量输入到所述LSTM模型中进行向量提取,得到每个语句的第二句子向量。
在一种可选方式中,若一个起点语句的对话动作类别为提问类别,该起点语句对应的每个终点语句的对话动作类别均为提问类别;若一个起点语句的对话动作类别为回答类别,该起点语句对应的每个终点语句的对话动作类别均为提问类别。
在一种可选方式中,所述装置还包括:
对话解析单元703,用于根据每个对话角色的每个起点语句与终点语句之间的响应关系,对所述待解析对话进行解析
第三方面,基于与前述实施例中对话解析方法同样的发明构思,本说明书实施例还提供一种服务器,如图8所示,包括存储器804、处理器802及存储在存储器804上并可在处理器802上运行的计算机程序,所述处理器802执行所述程序时实现前文所述对话解析方法的任一方法的步骤。
其中,在图8中,总线架构(用总线800来代表),总线800可以包括任意数量的互联的总线和桥,总线800将包括由处理器802代表的一个或多个处理器和存储器804代表的存储器的各种电路链接在一起。总线800还可以将诸如外围设备、稳压器和功率管理电路等之类的各种其他电路链接在一起,这些都是本领域所公知的,因此,本文不再对其进行进一步描述。总线接口805在总线800和接收器801和发送器803之间提供接口。接收器801和发送器803可以是同一个元件,即收发机,提供用于在传输介质上与各种其他装置通信的单元。处理器802负责管理总线800和通常的处理,而存储器804可以被用于存储处理器802在执行操作时所使用的数据。
第四方面,基于与前述实施例中对话解析方法的发明构思,本说明书实施例还提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现前文所述对话解析方法的任一方法的步骤。
本说明书是参照根据本说明书实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的设备。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令设备的制造品,该指令设备实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本说明书的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本说明书范围的所有变更和修改。
显然,本领域的技术人员可以对本说明书进行各种改动和变型而不脱离本说明书的精神和范围。这样,倘若本说明书的这些修改和变型属于本说明书权利要求及其等同技术的范围之内,则本说明书也意图包含这些改动和变型在内。

Claims (18)

1.一种对话解析方法,包括:
对待解析对话进行对话动作分类,得到所述待解析对话中每个对话角色的每个语句的对话动作类别;
根据每个对话角色的每个语句的对话动作类别,对所述待解析对话中语句之间的对话依存关系进行分析,获取每个起点语句与终点语句之间的响应关系,其中,每个起点语句及其对应的终点语句均对应两个对话角色,且每个起点语句和每个终点语句的对话动作类别为设定类别的语句。
2.如权利要求1所述的方法,所述根据每个对话角色的每个语句的对话动作类别,对所述待解析对话中语句之间的对话依存关系进行分析,获取每个起点语句与终点语句之间的响应关系,具体包括:
根据每个对话角色的每个语句的对话动作类别,将一个对话角色中的每个起点语句与另一对话角色中的所有的终点语句进行对应,获取每个起点语句及其对应的每个终点语句;
对每个起点语句及其对应的每个终点语句进行相关度评价,得到每个起点语句及其对应的每个终点语句的相关度;
根据每个起点语句及其对应的每个终点语句的相关度,确定每个起点语句与终点语句之间的响应关系。
3.如权利要求2所述的方法,所述根据每个起点语句及其对应的每个终点语句的相关度,确定每个起点语句与终点语句之间的响应关系,具体包括:
将每个起点语句及其对应的每个终点语句的相关度与阈值进行比对;
在每对比出一个起点语句及其对应的终点语句的相关度大于所述阈值时,则确定该起点语句及其对应的终点语句之间具有响应关系,得到每个起点语句与终点语句之间的响应关系。
4.如权利要求3所述的方法,所述对每个起点语句及其对应的每个终点语句进行相关度评价,得到每个起点语句及其对应的每个终点语句的相关度,具体包括:
根据图网络方法,在每个起点语句及其对应的每个终点语句之间创建一条有向边;
通过相关度模型对创建的每条有向边进行评分,得到每条有向边对应的评分,其中,每条有向边的评分作为该条有向边对应的起点语句和终点语句的相关度。
5.如权利要求1所述的方法,所述对待解析对话进行对话动作分类,得到所述待解析对话中每个对话角色的每个语句的对话动作类别,具体包括:
获取每个语句的语句内容和每个语句所对应的对话角色;
对每个语句的语句内容进行向量提取,得到每个语句的第一句子向量;
将每个语句的第一句子向量输入到与所述待解析对话对应的深度学习模型中进行向量提取,得到每个语句的第二句子向量;
利用每个语句的第二句子向量进行分类,得到每个语句的对话动作类别;
根据每个语句的对话动作类别和每个语句所对应的对话角色,得到每个对话角色中每个语句的对话动作类别。
6.如权利要求5所述的方法,所述将每个语句的第一句子向量输入到与所述待解析对话对应的深度学习模型中进行向量提取,得到每个语句的第二句子向量,具体包括:
使用LSTM算法对所述待解析对话建模,得到LSTM模型;
将每个语句的第一句子向量输入到所述LSTM模型中进行向量提取,得到每个语句的第二句子向量。
7.如权利要求1-6任一项所述的方法,若一个起点语句的对话动作类别为提问类别,该起点语句对应的每个终点语句的对话动作类别均为提问类别;若一个起点语句的对话动作类别为回答类别,该起点语句对应的每个终点语句的对话动作类别均为提问类别。
8.如权利要求7所述的方法,在获取每个起点语句与终点语句之间的响应关系之后,所述方法还包括:
根据每个对话角色的每个起点语句与终点语句之间的响应关系,对所述待解析对话进行解析。
9.一种对话解析装置,包括:
对话动作类别获取单元,用于对待解析对话进行对话动作分类,得到所述待解析对话中每个对话角色的每个语句的对话动作类别;
响应关系获取单元,用于根据每个对话角色的每个语句的对话动作类别,对所述待解析对话中语句之间的对话依存关系进行分析,获取每个起点语句与终点语句之间的响应关系,其中,每个起点语句及其对应的终点语句均对应两个对话角色,且每个起点语句和每个终点语句的对话动作类别为设定类别的语句。
10.如权利要求9所述的装置,所述响应关系获取单元,具体用于根据每个对话角色的每个语句的对话动作类别,将一个对话角色中的每个起点语句与另一对话角色中的所有的终点语句进行对应,获取每个起点语句及其对应的每个终点语句;对每个起点语句及其对应的每个终点语句进行相关度评价,得到每个起点语句及其对应的每个终点语句的相关度;根据每个起点语句及其对应的每个终点语句的相关度,确定每个起点语句与终点语句之间的响应关系。
11.如权利要求10所述的装置,所述响应关系获取单元,还用于将每个起点语句及其对应的每个终点语句的相关度与阈值进行比对;在每对比出一个起点语句及其对应的终点语句的相关度大于所述阈值时,则确定该起点语句及其对应的终点语句之间具有响应关系,进而得到每个起点语句与终点语句之间的响应关系。
12.如权利要求11所述的装置,所述响应关系获取单元,还用于根据图网络方法,在每个起点语句及其对应的每个终点语句之间创建一条有向边;通过相关度模型对创建的每条有向边进行评分,得到每条有向边对应的评分,其中,每条有向边的评分作为该条有向边对应的起点语句和终点语句的相关度。
13.如权利要求9所述的装置,所述对话动作类别获取单元,具体用于获取每个语句的语句内容和每个语句所对应的对话角色;对每个语句的语句内容进行向量提取,得到每个语句的第一句子向量;将每个语句的第一句子向量输入到与所述待解析对话对应的深度学习模型中进行向量提取,得到每个语句的第二句子向量;利用每个语句的第二句子向量进行分类,得到每个语句的对话动作类别;根据每个语句的对话动作类别和每个语句所对应的对话角色,得到每个对话角色中每个语句的对话动作类别。
14.如权利要求13所述的装置,所述对话动作类别获取单元,还用于使用长短期记忆网络LSTM算法对所述待解析对话建模,得到LSTM模型;将每个语句的第一句子向量输入到所述LSTM模型中进行向量提取,得到每个语句的第二句子向量。
15.如权利要求9-14任一项所述的装置,若一个起点语句的对话动作类别为提问类别,该起点语句对应的每个终点语句的对话动作类别均为提问类别;若一个起点语句的对话动作类别为回答类别,该起点语句对应的每个终点语句的对话动作类别均为提问类别。
16.如权利要求15所述的装置,还包括:
对话解析单元,用于根据每个对话角色的每个起点语句与终点语句之间的响应关系,对所述待解析对话进行解析。
17.一种服务器,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现权利要求1-9任一项所述方法的步骤。
18.一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现权利要求1-9任一项所述方法的步骤。
CN201910267030.1A 2019-04-03 2019-04-03 对话解析方法、装置、服务器及可读存储介质 Active CN110188190B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910267030.1A CN110188190B (zh) 2019-04-03 2019-04-03 对话解析方法、装置、服务器及可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910267030.1A CN110188190B (zh) 2019-04-03 2019-04-03 对话解析方法、装置、服务器及可读存储介质

Publications (2)

Publication Number Publication Date
CN110188190A true CN110188190A (zh) 2019-08-30
CN110188190B CN110188190B (zh) 2023-07-14

Family

ID=67713818

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910267030.1A Active CN110188190B (zh) 2019-04-03 2019-04-03 对话解析方法、装置、服务器及可读存储介质

Country Status (1)

Country Link
CN (1) CN110188190B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112597757A (zh) * 2020-12-04 2021-04-02 光大科技有限公司 词的检测方法及装置、存储介质、电子装置
CN112989822A (zh) * 2021-04-16 2021-06-18 北京世纪好未来教育科技有限公司 识别对话中句子类别的方法、装置、电子设备和存储介质

Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009157791A (ja) * 2007-12-27 2009-07-16 Nippon Telegr & Teleph Corp <Ntt> 質問応答方法、装置、プログラム並びにそのプログラムを記録した記録媒体
JP2010282404A (ja) * 2009-06-04 2010-12-16 Toyota Motor Corp 対話処理装置、対話処理方法、及び対話処理プログラム
CN104166643A (zh) * 2014-08-19 2014-11-26 南京金娃娃软件科技有限公司 一种智能问答系统中的对话行为分析方法
US20150193429A1 (en) * 2014-01-09 2015-07-09 International Business Machines Corporation Automatic Generation of Question-Answer Pairs from Conversational Text
CN106528530A (zh) * 2016-10-24 2017-03-22 北京光年无限科技有限公司 一种确定句子类型的方法及装置
CN106897263A (zh) * 2016-12-29 2017-06-27 北京光年无限科技有限公司 基于深度学习的机器人对话交互方法及装置
US20170372694A1 (en) * 2016-06-23 2017-12-28 Panasonic Intellectual Property Management Co., Ltd. Dialogue act estimation method, dialogue act estimation apparatus, and storage medium
CN107870896A (zh) * 2016-09-23 2018-04-03 苏宁云商集团股份有限公司 一种对话分析方法及装置
US20180189267A1 (en) * 2016-12-30 2018-07-05 Google Inc. Context-aware human-to-computer dialog
US20180225365A1 (en) * 2017-02-08 2018-08-09 International Business Machines Corporation Dialog mechanism responsive to query context
CN109101537A (zh) * 2018-06-27 2018-12-28 北京慧闻科技发展有限公司 基于深度学习的多轮对话数据分类方法、装置和电子设备
US20190005951A1 (en) * 2017-06-30 2019-01-03 Samsung Sds Co., Ltd. Method of processing dialogue based on dialog act information
CN109284357A (zh) * 2018-08-29 2019-01-29 腾讯科技(深圳)有限公司 人机对话方法、装置、电子设备及计算机可读介质
CN109522545A (zh) * 2018-10-11 2019-03-26 华东师范大学 一种对多轮对话连贯性质量的评估方法

Patent Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009157791A (ja) * 2007-12-27 2009-07-16 Nippon Telegr & Teleph Corp <Ntt> 質問応答方法、装置、プログラム並びにそのプログラムを記録した記録媒体
JP2010282404A (ja) * 2009-06-04 2010-12-16 Toyota Motor Corp 対話処理装置、対話処理方法、及び対話処理プログラム
US20150193429A1 (en) * 2014-01-09 2015-07-09 International Business Machines Corporation Automatic Generation of Question-Answer Pairs from Conversational Text
CN104166643A (zh) * 2014-08-19 2014-11-26 南京金娃娃软件科技有限公司 一种智能问答系统中的对话行为分析方法
US20170372694A1 (en) * 2016-06-23 2017-12-28 Panasonic Intellectual Property Management Co., Ltd. Dialogue act estimation method, dialogue act estimation apparatus, and storage medium
CN107870896A (zh) * 2016-09-23 2018-04-03 苏宁云商集团股份有限公司 一种对话分析方法及装置
CN106528530A (zh) * 2016-10-24 2017-03-22 北京光年无限科技有限公司 一种确定句子类型的方法及装置
CN106897263A (zh) * 2016-12-29 2017-06-27 北京光年无限科技有限公司 基于深度学习的机器人对话交互方法及装置
US20180189267A1 (en) * 2016-12-30 2018-07-05 Google Inc. Context-aware human-to-computer dialog
US20180225365A1 (en) * 2017-02-08 2018-08-09 International Business Machines Corporation Dialog mechanism responsive to query context
US20190005951A1 (en) * 2017-06-30 2019-01-03 Samsung Sds Co., Ltd. Method of processing dialogue based on dialog act information
CN109101537A (zh) * 2018-06-27 2018-12-28 北京慧闻科技发展有限公司 基于深度学习的多轮对话数据分类方法、装置和电子设备
CN109284357A (zh) * 2018-08-29 2019-01-29 腾讯科技(深圳)有限公司 人机对话方法、装置、电子设备及计算机可读介质
CN109522545A (zh) * 2018-10-11 2019-03-26 华东师范大学 一种对多轮对话连贯性质量的评估方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
周小强: "基于深度学习的交互式问答技术研究", 《中国博士学位论文全文数据库 信息科技辑》 *
周小强: "基于深度学习的交互式问答技术研究", 《中国博士学位论文全文数据库 信息科技辑》, 15 January 2019 (2019-01-15), pages 1 - 5 *
周小强等: "交互式问答的关系结构体系及标注", 《中文信息学报》 *
周小强等: "交互式问答的关系结构体系及标注", 《中文信息学报》, no. 05, 15 May 2018 (2018-05-15) *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112597757A (zh) * 2020-12-04 2021-04-02 光大科技有限公司 词的检测方法及装置、存储介质、电子装置
CN112989822A (zh) * 2021-04-16 2021-06-18 北京世纪好未来教育科技有限公司 识别对话中句子类别的方法、装置、电子设备和存储介质
CN112989822B (zh) * 2021-04-16 2021-08-27 北京世纪好未来教育科技有限公司 识别对话中句子类别的方法、装置、电子设备和存储介质

Also Published As

Publication number Publication date
CN110188190B (zh) 2023-07-14

Similar Documents

Publication Publication Date Title
US11741484B2 (en) Customer interaction and experience system using emotional-semantic computing
Masche et al. A review of technologies for conversational systems
Ramesh et al. A survey of design techniques for conversational agents
Bala et al. Chat-bot for college management system using AI
CN108536681A (zh) 基于情感分析的智能问答方法、装置、设备及存储介质
CN107704482A (zh) 方法、装置以及程序
CN109271493A (zh) 一种语言文本处理方法、装置和存储介质
CN109165291A (zh) 一种文本匹配方法及电子设备
CN111738016A (zh) 多意图识别方法及相关设备
CN108960574A (zh) 问答的质量确定方法、装置、服务器和存储介质
CN111144097B (zh) 一种对话文本的情感倾向分类模型的建模方法和装置
Wohlgenannt et al. Extracting social networks from literary text with word embedding tools
Maher et al. Chatbots & its techniques using AI: an review
CN110188190A (zh) 对话解析方法、装置、服务器及可读存储介质
Almagro et al. Speech gestural interpretation by applying word representations in robotics
KR20220140260A (ko) 인공 신경망 기반의 감성 분석 장치, 방법 및 이의 학습 방법
US10970490B2 (en) Automatic evaluation of artificial intelligence-based processes
McLeod et al. Multi-task learning of system dialogue act selection for supervised pretraining of goal-oriented dialogue policies
CN115730221A (zh) 基于溯因推理的虚假新闻识别方法、装置、设备及介质
Bellegarda A data-driven affective analysis framework toward naturally expressive speech synthesis
CN111324710B (zh) 一种基于虚拟人的在线调研方法、装置和终端设备
Raj et al. A generative model based chatbot using recurrent neural networks
Durrani et al. Transfer learning based speech affect recognition in Urdu
Isaak et al. Experience and prediction: a metric of hardness for a novel litmus test
Jain et al. SentiGames-A Game Theoretic Approach To Sentiment Analysis

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20200923

Address after: Cayman Enterprise Centre, 27 Hospital Road, George Town, Grand Cayman Islands

Applicant after: Innovative advanced technology Co.,Ltd.

Address before: Cayman Enterprise Centre, 27 Hospital Road, George Town, Grand Cayman Islands

Applicant before: Advanced innovation technology Co.,Ltd.

Effective date of registration: 20200923

Address after: Cayman Enterprise Centre, 27 Hospital Road, George Town, Grand Cayman Islands

Applicant after: Advanced innovation technology Co.,Ltd.

Address before: A four-storey 847 mailbox in Grand Cayman Capital Building, British Cayman Islands

Applicant before: Alibaba Group Holding Ltd.

TA01 Transfer of patent application right
GR01 Patent grant
GR01 Patent grant