CN110795550A - 一种提高闲聊对话系统回答丰富性的方法 - Google Patents

一种提高闲聊对话系统回答丰富性的方法 Download PDF

Info

Publication number
CN110795550A
CN110795550A CN201911056272.2A CN201911056272A CN110795550A CN 110795550 A CN110795550 A CN 110795550A CN 201911056272 A CN201911056272 A CN 201911056272A CN 110795550 A CN110795550 A CN 110795550A
Authority
CN
China
Prior art keywords
answer
sentence
query
model
vocabulary
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201911056272.2A
Other languages
English (en)
Other versions
CN110795550B (zh
Inventor
刘渊
潘嵘
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sun Yat Sen University
Original Assignee
Sun Yat Sen University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sun Yat Sen University filed Critical Sun Yat Sen University
Priority to CN201911056272.2A priority Critical patent/CN110795550B/zh
Publication of CN110795550A publication Critical patent/CN110795550A/zh
Application granted granted Critical
Publication of CN110795550B publication Critical patent/CN110795550B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Human Computer Interaction (AREA)
  • Machine Translation (AREA)

Abstract

本发明涉及一种提高闲聊对话系统回答丰富性的方法,将查询语句和回答语句进行分词和词性标注后放入Transformer模型并对模型进行训练中。对于需要回答的查询语句进行分词和词性标注,并通过PMI公式获得回答语句的关键词。将获得的关键词输入训练好的模型中得到对应的回答语句,并输出得分最高的回答语句。利用Transformer模型代替了传统的循环神经网络模型,能使模型更加关注到语句中不同位置间的依赖关系,从而生成更加流畅的语句,使得语句不丧失语义相关性。

Description

一种提高闲聊对话系统回答丰富性的方法
技术领域
本发明涉及推荐系统领域,更具体地,涉及一种提高闲聊对话系统回答丰富性的方法。
背景技术
对话系统是一类能够使用自然语言跟人类交流的软件,为了处理各种对话系统相关的任务,例如智能客服、人机闲聊等,对话系统都必须要能理解用户的语义意图并且能够产生跟问题相关的回答。
其中一种闲聊对话系统,也叫做非任务(开放领域)的对话系统,目标是尽可能地模拟人类对话,理解用户语义意图并且做出与问题相关的回答;但以大量数据驱动训练产生的闲聊对话系统模型,有着明显的回答单一性和无趣的缺陷,例如会生成高频率的类似“我也是”、“我不知道”这样的回复。
现有的RNN(Recurrent Neural Network,循环神经网络)模型中,在编码器-解码器模型之间,存在一个由编码器模型生成的隐语义向量,它包含着源句子的语义信息,作为解码器模型的输入。为了提高闲聊对话系统的丰富性和有趣性,将原来编码器模型只生成单一确定的隐语义向量改为隐语义向量空间,在模型每次生成一个回复时,模型都会在隐语义向量空间中进行采样得到一个隐语义向量,作为解码器模型的输入。这技术方案虽然在直观上明显地解决了原闲聊对话系统存在的缺陷:单一的隐语义向量产生单一的回复,隐语义向量空间能产生多样的回复,但是因为隐语义向量的不确定性,导致这技术方案会不能产生流畅的句子。另外因为隐语义向量的不确定性,其产生的回复虽然多样,但是真正与问题相关的回复却不多。
发明内容
本发明为克服上述现有技术中闲聊对话系统回答单调或回答相关性低的问题,提供一种提高闲聊对话系统回答丰富性的方法,加入关键词来提高闲聊对话系统的丰富性,并且不丢失回答语句的语义相关性。
为解决上述技术问题,本发明采用的技术方案是:提供一种提高闲聊对话系统回答丰富性的方法,包括以下步骤:
步骤一:获取样本数量为N,样本形式为查询语句或回答语句,即算式表示为(查询语句,回答语句);其中,查询语句和回答语句均为中文词语句;
步骤二:对每个样本的查询语句和回答语句进行分词和词性标注,分别得到查询语句的查询词汇和查询词汇的词性,回答语句的回答词汇和回答词汇的词性;
步骤三:建立查询词汇的文件频率表、回答词汇的文件频率表以及查询词汇和回答词汇每对共同出现的共现文件频率表;
步骤四:采用训练样本训练Transformer模型,包括向前模型和向后模型;
步骤五:对输入的查询语句进行分词和词性标注,并采用PMI(Pointwise MutualInformation,逐点互信息)指标进行计算,得到逐点互信息值最高的三个回答语句词汇作为关键词;
步骤六:将三个关键词输入向后模型的解码器部分,得到三个前半句回答语句,再将三个前半句回答语句分别作为向前模型的解码器部分的输入,得到三个回答语句;
步骤七:使用打分函数对步骤六中的回答语句进行重排序,最终输出分数最高的回答语句。
为了将关键词作为预生成回答语句的其中一个词汇,那即是将关键词作为已经生成好的语句序列向量作为解码器的输入,因为关键词可以处于回答语句的任何一个位置,因此需要解码器模型需要两个,分别是向后模型和向前模型,其中向后模型的解码器部分的初始输入有关键词和编码器模型生成的隐语义向量,向前模型的解码器部分的初始输入有向后模型生成好的前半段语句序列以及编码器模型生成的隐语义向量。利用PMI方法生成关键词,由关键词生成包含关键词的回答语句,从外部加入另外的语义信息,引导模型生成更加有趣的回答语句。Transformer模型因为能用运用位置编码向量,比起RNN模型更加能关注到为语句中远距离的依赖关系,能够生成更加语义相关更加合理的回答语句。
优选的,在所述步骤五中,逐点互信息值的计算公式为:
Figure BDA0002256626190000031
其中,codf表示查询语句、回答语句词汇的共现文件频率次数,qdf表示查询语句词汇的文件频率,rdf表示回答语句词汇的文件频率,numdoc表示训练数据集总pair对数,alpha为可控参数,默认为0.8;
PMI值最高的三个回答语句词汇作为关键词的公式如下:
Figure BDA0002256626190000032
其中,m为查询语句分词后的词汇数量,qi为查询语句分词后的词汇,r为回答语句词汇的词汇,PMI值的阀值为1。
优选的,在所述步骤三中,文件频率表中只记录词性为动词、名词和形容词的词汇;对输入的查询语句进行逐点互信息指标计算时,计算词性为动词、名词以及形容词的词汇。由数据总结发现,词性为代词(例“我”、“你”)、副词(例如“一直”、“总是”)等词汇不具有较多含义,对生成多样性回复的帮助甚微,而词性为动词(例如“吃饭”)、名词(例如“笔”、“纸”)和形容词(例如“漂亮”、“好听”)等词汇,对一句话的含义影响很大。因此只记录词性为动词、名词和形容词的词汇,生成蕴含信息更为丰富的关键词。
优选的,所述文件频率表设置了过滤阀值。为了减少低频词对最终结果的影响,将回答语句的文件频率表的阈值设为300,将共现文件频率表的阈值设为15。
优选的,在所述步骤四中,为了让向后模型能从一个关键词生成从后往前的前半句话,因此需要对向后模型的训练样本的回答语句随机选择一个合法词性的词汇,并且以该词汇为终点,截取前半句话作为向后模型的训练样本。
优选的:在所述步骤六中,将查询语句词汇输入向前模型生成的第四个回答语句;在步骤7中,使用打分函数对四个回答语句进行重排序,最终输出分数最高的回答语句。
优选的:所述打分函数的公式为:
Score(query,reply)=log(query|reply)+log(reply|query)
其中,query为查询语句,reply为回答语句。
优选的,向前模型和向后模型的公式分别为:
Backward(keyword)=w1,w2,...,wn
Forward(w1,w2,...,wn,keyword)=wn+2,...,wm-1,wm
其中,W为每个词汇,keyword为关键词,n表示keyword前面词的数量,m表示keyword后面词的数量。
与现有技术相比,有益效果是:
1、利用PMI-alpha公式代替了原PMI公式,并且加入了大量的规则限制,例如词性选择、文件频率次数过滤以及PMI的阈值选取,使得最终得到的关键词更能跟输入的查询问题相关,而避免了一些稀疏词对对话系统的干扰。
2、利用Transformer模型代替了传统的RNN模型,能使模型更加关注到语句中不同位置间的依赖关系,从而生成更加流畅的语句,使得语句不丧失语义相关性。
3、加入了打分函数,使得系统不仅从关键词的角度来提高系统回复的多样性和相关性,还从查询语句和生成的回答语句本身,考虑互相之间的生成概率,得到最终的回答。
附图说明
图1是本发明的一种提高闲聊对话系统回答丰富性的方法的流程图;
图2是本发明的一种提高闲聊对话系统回答丰富性的方法的另一实施例的流程图。
具体实施方式
附图仅用于示例性说明,不能理解为对本专利的限制;为了更好说明本实施例,附图某些部件会有省略、放大或缩小,并不代表实际产品的尺寸;对于本领域技术人员来说,附图中某些公知结构及其说明可能省略是可以理解的。附图中描述位置关系仅用于示例性说明,不能理解为对本专利的限制。
本发明实施例的附图中相同或相似的标号对应相同或相似的部件;在本发明的描述中,需要理解的是,若有术语“上”、“下”、“左”、“右”“长”“短”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此附图中描述位置关系的用语仅用于示例性说明,不能理解为对本专利的限制,对于本领域的普通技术人员而言,可以根据具体情况理解上述术语的具体含义。
下面通过具体实施例,并结合附图,对本发明的技术方案作进一步的具体描述:
实施例1
如图1所示为一种提高闲聊对话系统回答丰富性的方法的是实施例,包括以下步骤:
步骤一:获取样本数量为N,样本形式为(查询语句,回答语句)的训练样本;其中,查询语句和回答语句均为中文词语句;
步骤二:对每个样本的查询语句和回答语句进行分词和词性标注,分别得到查询语句的查询词汇和查询词汇的词性,回答语句的回答词汇和回答词汇的词性;
步骤三:建立查询词汇的文件频率表、回答词汇的文件频率表以及查询词汇和回答词汇每对共同出现的共现文件频率表;
步骤四:采用训练样本训练Transformer模型,包括向前模型和向后模型;
步骤五:对输入的查询语句进行分词和词性标注,并采用PMI(Pointwise MutualInformation,逐点互信息)指标进行计算,得到逐点互信息值最高的三个回答语句词汇作为关键词;
步骤六:将三个关键词输入向后模型的解码器部分,得到三个前半句回答语句,再将三个前半句回答语句分别作为向前模型的解码器部分的输入,得到三个回答语句;
步骤七:使用打分函数对步骤六中的回答语句进行重排序,最终输出分数最高的回答语句。
本实施例的有益效果:1、利用Transformer模型代替了传统的RNN模型,能使模型更加关注到语句中不同位置间的依赖关系,从而生成更加流畅的语句。
2、加入了打分函数,使得系统不仅从关键词的角度来提高系统回复的多样性和相关性,还从查询语句和生成的回答语句本身,考虑互相之间的生成概率,得到最终的回答。
实施例2
如图2所示为一种提高闲聊对话系统回答丰富性的方法的是实施例,包括以下步骤:
步骤一:获取样本数量为N,样本形式为(查询语句,回答语句)的训练样本;其中,查询语句和回答语句均为中文词语句;
步骤二:对每个样本的查询语句和回答语句进行分词和词性标注,分别得到查询语句的查询词汇(q1,q2,…,qm)和查询词汇的词性(qpos1,qpos2,…,qposm),回答语句的回答词汇(r1,r2,…,rn)和回答词汇的词性(rpos1,rpos2,…,rposn),其中m和n分别表示查询语句和回答语句分词之后的词汇数量;
步骤三:建立查询词汇的文件频率表、回答词汇的文件频率表以及查询词汇和回答词汇每对共同出现的共现文件频率表;文件频率表中只记录词性为动词、名词和形容词的词汇;为了减少低频词对最终结果的影响,将回答语句的文件频率表的阈值设为300,将共现文件频率表的阈值设为15。
步骤四:采用训练样本训练Transformer模型,包括向前模型和向后模型;向前模型和向后模型的公式分别为:
Backward(keyword)=w1,w2,...,wn
Forward(w1,w2,...,wn,keyword)=wn+2,...,wm-1,wm
其中,W为每个词汇,keyword为关键词,n表示keyword前面词的数量,m表示keyword后面词的数量。
向后模型需要对训练样本的回答语句随机选择一个合法词性的词汇,并且以该词汇为终点,截取前半句话作为向后模型的训练样本。
步骤五:对输入的查询语句进行分词和词性标注,并采用PMI(Pointwise MutualInformation,逐点互信息)指标进行计算,对输入的查询语句进行逐点互信息指标计算时,计算词性为动词、名词以及形容词的词汇,将得到逐点互信息值最高的三个回答语句词汇作为关键词;PMI值的计算公式为:
Figure BDA0002256626190000061
其中,codf表示查询语句、回答语句词汇的共现文件频率次数,qdf表示查询语句词汇的文件频率,rdf表示回答语句词汇的文件频率,numdoc表示训练数据集总pair对数,alpha为可控参数,默认为0.8;
PMI值最高的三个回答语句词汇作为关键词的公式如下:
Figure BDA0002256626190000071
其中,m为查询语句分词后的词汇数量,qi为查询语句分词后的词汇,r为回答语句词汇的词汇,PMI值的阀值为1。
步骤六:将三个关键词输入向后模型的解码器部分,得到三个前半句回答语句,再将三个前半句回答语句分别作为向前模型的解码器部分的输入,得到三个回答语句;将查询语句词汇输入向前模型生成的第四个回答语句;
为了将关键词作为预生成回答语句的其中一个词汇,那即是将关键词作为已经生成好的语句序列向量作为解码器的输入,因为关键词可以处于回答语句的任何一个位置,因此需要解码器模型需要两个,分别是向后模型和向前模型,其中向后模型的解码器部分的初始输入有关键词和编码器模型生成的隐语义向量,向前模型的解码器部分的初始输入有向后模型生成好的前半段语句序列以及编码器模型生成的隐语义向量。
步骤七:使用打分函数对步骤六中的所有的回答语句进行重排序,最终输出分数最高的回答语句,打分函数的公式为:
Score(query,reply)=log(query|reply)+log(reply|query)
其中,query为查询语句,reply为回答语句。
本实施例的有益效果:
1、利用PMI-alpha公式代替了原PMI公式,并且加入了大量的规则限制,例如词性选择、文件频率次数过滤以及PMI的阈值选取,使得最终得到的关键词更能跟输入的查询问题相关,而避免了一些稀疏词对系统的干扰。
2、利用Transformer模型代替了传统的RNN模型,能使模型更加关注到语句中不同位置间的依赖关系,从而生成更加流畅的语句。
3、加入了打分函数,使得系统不仅从关键词的角度来提高系统回复的多样性和相关性,还从查询语句和生成的回答语句本身,考虑互相之间的生成概率,得到最终的回答。
显然,本发明的上述实施例仅仅是为清楚地说明本发明所作的举例,而并非是对本发明的实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明权利要求的保护范围之内。

Claims (8)

1.一种提高闲聊对话系统回答丰富性的方法,其特征在于,包括如下步骤:
步骤一:获取样本数量为N,样本形式为查询语句或回答语句;
步骤二:对每个样本的查询语句和回答语句进行分词和词性标注,分别得到查询语句的查询词汇和查询词汇的词性,回答语句的回答词汇和回答词汇的词性;
步骤三:建立查询词汇的文件频率表、回答词汇的文件频率表以及查询词汇和回答词汇每对共同出现的共现文件频率表;
步骤四:采用训练样本训练Transformer模型,包括向前模型和向后模型;
步骤五:对输入的查询语句进行分词和词性标注,并采用逐点互信息指标进行计算,得到逐点互信息值最高的三个回答语句词汇作为关键词;
步骤六:将三个关键词输入向后模型的解码器部分,得到三个前半句回答语句,再将三个前半句回答语句分别作为向前模型的解码器部分的输入,得到三个回答语句;
步骤七:使用打分函数对步骤六中的回答语句进行重排序,最终输出分数最高的回答语句。
2.根据权利要求1所述的一种提高闲聊对话系统回答丰富性的方法,其特征在于,在所述步骤五中,逐点互信息值的计算公式为:
Figure FDA0002256626180000011
其中,Codf表示查询语句、回答语句词汇的共现文件频率次数,qdf表示查询语句词汇的文件频率,rdf表示回答语句词汇的文件频率,numdoc表示训练数据集总pair对数,alpha为可控参数;
逐点互信息值最高的三个回答语句词汇作为关键词的公式如下:
Figure FDA0002256626180000021
其中,m为查询语句分词后的词汇数量,qi为查询语句分词后的词汇,r为回答语句词汇的词汇。
3.根据权利要求1所述的一种提高闲聊对话系统回答丰富性的方法,其特征在于,在所述步骤三中,文件频率表中只记录词性为动词、名词和形容词的词汇;在所述步骤五中,对输入的查询语句进行逐点互信息指标计算时,计算词性为动词、名词以及形容词的词汇。
4.根据权利要求3所述的一种提高闲聊对话系统回答丰富性的方法,其特征在于,所述文件频率表设置了过滤阀值。
5.根据权利要求1所述的一种提高闲聊对话系统回答丰富性的方法,其特征在于,在所述步骤四中,向后模型需要对训练样本的回答语句随机选择一个合法词性的词汇,并且以该词汇为终点,截取前半句话作为向后模型的训练样本。
6.根据权利要求1所述的一种提高闲聊对话系统回答丰富性的方法,其特征在于:在所述步骤六中,将查询语句词汇输入向前模型生成的第四个回答语句;在步骤7中,使用打分函数对四个回答语句进行重排序,最终输出分数最高的回答语句。
7.根据权利要求6所述的一种提高闲聊对话系统回答丰富性的方法,其特征在于:所述打分函数的公式为:
Score(query,reply)=log(query|reply)+log(reply|query)
其中,query为查询语句,reply为回答语句。
8.根据权利要求6所述的一种提高闲聊对话系统回答丰富性的方法,其特征在于:向前模型和向后模型的公式分别为:
Backward(keyword)=w1,w2,...,wn
Forward(w1,w2,...,wn,keyword)=wn+2,...,wm-1,wm
其中,W为每个词汇,keyword为关键词,n表示keyword前面词的数量,m表示keyword后面词的数量。
CN201911056272.2A 2019-10-31 2019-10-31 一种提高闲聊对话系统回答丰富性的方法 Active CN110795550B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911056272.2A CN110795550B (zh) 2019-10-31 2019-10-31 一种提高闲聊对话系统回答丰富性的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911056272.2A CN110795550B (zh) 2019-10-31 2019-10-31 一种提高闲聊对话系统回答丰富性的方法

Publications (2)

Publication Number Publication Date
CN110795550A true CN110795550A (zh) 2020-02-14
CN110795550B CN110795550B (zh) 2023-04-07

Family

ID=69442503

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911056272.2A Active CN110795550B (zh) 2019-10-31 2019-10-31 一种提高闲聊对话系统回答丰富性的方法

Country Status (1)

Country Link
CN (1) CN110795550B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111444399A (zh) * 2020-03-30 2020-07-24 腾讯科技(深圳)有限公司 回复内容的生成方法、装置、设备及可读存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW201102842A (en) * 2009-07-06 2011-01-16 Alibaba Group Holding Ltd Word matching and information searching method and device thereof
CN103353894A (zh) * 2013-07-19 2013-10-16 武汉睿数信息技术有限公司 一种基于语义分析的数据搜索方法和系统
CN104615755A (zh) * 2015-02-12 2015-05-13 北京航空航天大学 一种基于众包的新型问答系统
CN104809106A (zh) * 2015-05-15 2015-07-29 合肥汇众知识产权管理有限公司 一种专利方案的挖掘系统及挖掘方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW201102842A (en) * 2009-07-06 2011-01-16 Alibaba Group Holding Ltd Word matching and information searching method and device thereof
CN103353894A (zh) * 2013-07-19 2013-10-16 武汉睿数信息技术有限公司 一种基于语义分析的数据搜索方法和系统
CN104615755A (zh) * 2015-02-12 2015-05-13 北京航空航天大学 一种基于众包的新型问答系统
CN104809106A (zh) * 2015-05-15 2015-07-29 合肥汇众知识产权管理有限公司 一种专利方案的挖掘系统及挖掘方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111444399A (zh) * 2020-03-30 2020-07-24 腾讯科技(深圳)有限公司 回复内容的生成方法、装置、设备及可读存储介质

Also Published As

Publication number Publication date
CN110795550B (zh) 2023-04-07

Similar Documents

Publication Publication Date Title
US10642939B2 (en) Systems and methods for generating jokes
CN113128239B (zh) 促进以多种语言与自动化助理的端到端沟通
US20200395008A1 (en) Personality-Based Conversational Agents and Pragmatic Model, and Related Interfaces and Commercial Models
US10936664B2 (en) Dialogue system and computer program therefor
US10878817B2 (en) Systems and methods for generating comedy
Wu et al. Emotion recognition from text using semantic labels and separable mixture models
Malandrakis et al. Distributional semantic models for affective text analysis
WO2019158014A1 (zh) 由计算机实施的与用户对话的方法和计算机系统
US11080485B2 (en) Systems and methods for generating and recognizing jokes
CN111241250B (zh) 一种情感对话生成系统和方法
WO2008128423A1 (fr) Système de dialogue intelligent et son procédé de réalisation
CN113412515A (zh) 适配自动化助理以用多种语言使用
Wärnestål User evaluation of a conversational recommender system
Leuski et al. A statistical approach for text processing in virtual humans
KR102109866B1 (ko) 합성곱 신경망에 의한 발화 임베딩을 사용한 유사도 측정 기반의 채팅 말뭉치 확장을 위한 장치 및 방법
CN118246412A (zh) 文本润色训练数据筛选方法、装置、相关设备及计算机程序产品
CN110795550B (zh) 一种提高闲聊对话系统回答丰富性的方法
Brockmann et al. Modelling alignment for affective dialogue
Elworthy Automatic error detection in part-of-speech tagging
Shawar et al. A chatbot system as a tool to animate a corpus
Hung et al. Context‐Centric Speech‐Based Human–Computer Interaction
CN113743126B (zh) 一种基于用户情绪的智能交互方法和装置
CN115238711A (zh) 数据处理方法、装置、设备、程序产品及存储介质
Hoenkamp et al. How everyday language can and will boost effective information retrieval
Ivanovic Automatic instant messaging dialogue using statistical models and dialogue acts

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant