CN112052321A - 人机对话方法、装置、计算机设备及存储介质 - Google Patents

人机对话方法、装置、计算机设备及存储介质 Download PDF

Info

Publication number
CN112052321A
CN112052321A CN202010908558.5A CN202010908558A CN112052321A CN 112052321 A CN112052321 A CN 112052321A CN 202010908558 A CN202010908558 A CN 202010908558A CN 112052321 A CN112052321 A CN 112052321A
Authority
CN
China
Prior art keywords
information
topic type
topic
dialogue
type
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010908558.5A
Other languages
English (en)
Inventor
姚晓远
杨海钦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Technology Shenzhen Co Ltd
Original Assignee
Ping An Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Technology Shenzhen Co Ltd filed Critical Ping An Technology Shenzhen Co Ltd
Priority to CN202010908558.5A priority Critical patent/CN112052321A/zh
Publication of CN112052321A publication Critical patent/CN112052321A/zh
Priority to PCT/CN2021/091180 priority patent/WO2022048170A1/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Evolutionary Computation (AREA)
  • Biomedical Technology (AREA)
  • Software Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Machine Translation (AREA)
  • Probability & Statistics with Applications (AREA)
  • Computing Systems (AREA)
  • Biophysics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Databases & Information Systems (AREA)
  • Molecular Biology (AREA)

Abstract

本发明公开了一种人机对话方法、装置、计算机设备及存储介质,属于人工智能领域。本发明的人机对话方法通过对用户输入的第一对话信息进行识别第一话题类型,以确定当前的对话话题;从而结合历史信息、第一对话信息和第一话题类型对于回复用户的话题类型进行预测,得到符合当前对话情景的第二话题类型,以便于对用户的对话内容产生引导作用;再根据第一话题类型和第二话题类型生成符合第二话题类型的第二对话信息回复用户,提升用户的人机交互体验效果。

Description

人机对话方法、装置、计算机设备及存储介质
技术领域
本发明涉及人工智能领域,尤其涉及人机对话方法、装置、计算机设备及存储介质。
背景技术
目前的对话机器人主要能完成任务型对话、QA(问答系统,全称QuestionAnswering System)问答以及闲聊三大类功能,其中,任务型对话主要适用于领域内预定义好的任务对话,如:订机票查询天气;QA主要适用于领域内的问答对话,如:FAQ(经常问到的问题,在线顾客服务手段)、KBQA;闲聊主要适用于面向开放域的人机对话,以进一步提高用户的体验。
在实际应用中,通常在闲聊的基础上给定引导目标(即目标约束),对话过程既要满足人人对话逻辑又要完成引导目标。然而现有的闲聊对话存在的问题有:机器人的回复倾向于生成万能的通用回复,回复显得枯燥无味,容易让人失去兴趣,无法把握当前的对话话题,用户的体验效果差。
发明内容
针对现有人机闲聊对话回复的形式主要为通用回复,无法把握当前对话话题的问题,现提供一种旨在可根据用户的对话内容适应性的生成引导性的回复提升用户体验效果的人机对话方法、装置、计算机设备及存储介质。
为实现上述目的,本发明提供一种人机对话方法,包括:
获取用户的第一对话信息;
识别所述第一对话信息的第一话题类型;
基于历史信息、所述第一对话信息和所述第一话题类型预测回复所述用户的第二话题类型;
根据所述第一话题类型和所述第二话题类型生成回复所述用户的第二对话信息。
优选的,所述识别所述第一对话信息的第一话题类型,包括:
检测所述第一对话信息的话题模式,所述话题模式包括僵局模式和正常模式;
当所述第一对话信息属于所述僵局模式时,将上一次对话信息的话题类型作为所述第一对话信息的第一话题类型;
当所述第一对话信息属于所述正常模式时,采用第一神经网络模型对所述第一对话信息进行分类识别,获取所述第一话题类型。
优选的,所述当所述第一对话信息属于所述正常模式时,采用第一神经网络模型对所述第一对话信息进行分类识别,获取所述第一话题类型,包括:
对所述第一对话信息进行文本分词,分别将每一个词映射为第一数字参数,将所有的所述第一数字参数转换为第一词向量;
将所述第一词向量输入所述第一神经网络模型进行分类识别,以得到所述第一话题类型。
优选的,所述基于历史信息、所述第一对话信息和所述第一话题类型预测回复所述用户的第二话题类型,包括:
将所述历史信息、所述第一对话信息和所述第一话题类型进行拼接,生成第一拼接信息;
采用第二神经网络模型对所述第一拼接信息进行分类识别,获取回复所述用户的所述第二话题类型。
优选的,所述采用第二神经网络模型对所述第一拼接信息进行分类识别,获取回复所述用户的所述第二话题类型,包括:
对所述第一拼接信息进行文本分词,分别将每一个词映射为第二数字参数,将所有的所述第二数字参数转换为第二词向量;
将所述第二词向量输入所述第二神经网络模型进行分别识别,以得到话题类型集合;
对所述话题类型集合中的候选话题类型进行筛选,以得到所述第二话题类型。
优选的,所述根据所述第一话题类型和所述第二话题类型生成回复所述用户的第二对话信息,包括:
检测所述第二话题类型与所述第一话题类型是否相同;
当所述第二话题类型与所述第一话题类型不相同时,将所述历史信息、所述第一对话信息、所述第一话题类型和所述第二话题类型进行拼接,生成第二拼接信息;
采用第三神经网络模型对所述第二拼接信息进行预测,生成回复所述用户的第二对话信息。
优选的,所述根据所述第一话题类型和所述第二话题类型生成回复所述用户的第二对话信息,包括:
当所述第二话题类型与所述第一话题类型不相同时,在话题数据库中获取与所述第二话题类型匹配的对话信息作为所述第二对话信息。
为实现上述目的,本发明提供一种人机对话装置,包括:
获取单元,用于获取用户的第一对话信息;
识别单元,用于识别所述第一对话信息的第一话题类型;
预测单元,用于基于历史信息、所述第一对话信息和所述第一话题类型预测回复所述用户的第二话题类型;
生成单元,用于根据所述第一话题类型和所述第二话题类型生成回复所述用户的第二对话信息。
为实现上述目的,本发明提供一种计算机设备,所述计算机设备包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述方法的步骤。
为实现上述目的,本发明提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述方法的步骤。
本发明提供的人机对话方法、装置、计算机设备及存储介质,通过对用户输入的第一对话信息进行识别第一话题类型,以确定当前的对话话题;从而结合历史信息、第一对话信息和第一话题类型对于回复用户的话题类型进行预测,得到符合当前对话情景的第二话题类型,以便于对用户的对话内容产生引导作用;再根据第一话题类型和第二话题类型生成符合第二话题类型的第二对话信息回复用户,提升用户的人机交互体验效果。
附图说明
图1为本发明所述的人机对话方法一种实施例的流程图;
图2为本发明识别第一对话信息的第一话题类型的一种实施例的流程图;
图3为本发明基于历史信息、第一对话信息和第一话题类型预测回复用户的第二话题类型的一种实施例的流程图;
图4为本发明采用第二神经网络模型对第一拼接信息进行分类识别的一种实施例的流程图;
图5为本发明根据第一话题类型和第二话题类型生成回复用户的第二对话信息的一种实施例的流程图;
图6为本发明采用第三神经网络模型对第二拼接信息进行预测的一种实施例的流程图;
图7为本发明所述的人机对话装置的一种实施例的模块图;
图8为本发明计算机设备的一个实施例的硬件架构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本申请,并不用于限定本申请。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
需要说明的是,在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。
本发明提供的人机对话方法、装置、计算机设备及存储介质可适用于保险业务、金融业务、医疗业务等领域中。本发明通过对用户输入的第一对话信息进行识别第一话题类型,以确定当前的对话话题;从而结合历史信息、第一对话信息和第一话题类型对于回复用户的话题类型进行预测,得到符合当前对话情景的第二话题类型,以便于对用户的对话内容产生引导作用;再根据第一话题类型和第二话题类型生成符合第二话题类型的第二对话信息回复用户,提升用户的人机交互体验效果。
实施例一
请参阅图1,本实施例的一种人机对话方法包括以下步骤:
S1.获取用户的第一对话信息;
需要说明的是:第一对话信息可以是文本信息也可以是音频信息,此处不做具体限定,当第一对话信息为音频信息时,需将音频信息转换为文本信息,并存储文本信息,以便于进行历史信息记录。
S2.识别所述第一对话信息的第一话题类型;
在本实施例中,第一话题类型是指当前的对话话题。通过对第一对话信息进行识别以确定当前的对话话题。
作为举例而非限定,第一话题类型可包括:娱乐类型、游戏类型、综艺类型、新闻类型、天气类型、体育类型、财经类型、汽车类型、科技类型和时尚类型中的至少两种,本发明不作具体限定。
进一步地,参阅图2所示步骤S2可包括以下步骤:
S21.检测所述第一对话信息的话题模式;
其中,所述话题模式包括僵局模式和正常模式(即:非僵局模式)。
具体地,将第一对话信息与预设的僵局词语列表中的僵局词语信息进行匹配,若匹配,则表示第一对话信息处于僵局模式;若不匹配,则表示第一对话信息处于正常模式。
作为举例而非限定,僵局词语信息可以是“嗯嗯”、“呵呵”、“好的”、“哦”等。
S22.当所述第一对话信息属于所述僵局模式时,将上一次对话信息的话题类型作为所述第一对话信息的第一话题类型;
具体地,当所述第一对话信息属于所述僵局模式时,从历史信息中获取上一次对话信息及上一次对话信息对应的话题类型,将该话题类型作为第一对话信息的第一话题类型。历史信息可以是由预设时间段内的历史对话信息和历史话题类型构成的信息;历史信息还可以是由预设条数的历史对话信息和历史话题类型构成的信息。其中,每一个历史对话信息对应一个历史话题类型。
S23.当所述第一对话信息属于所述正常模式时,采用第一神经网络模型对所述第一对话信息进行分类识别,获取所述第一话题类型。
具体地,当所述第一对话信息属于所述正常模式时步骤S23可包括:
对所述第一对话信息进行文本分词,分别将每一个词映射为第一数字参数,将所有的所述第一数字参数转换为第一词向量;将所述第一词向量输入所述第一神经网络模型进行分类识别,以得到所述第一话题类型。
在本实施例中,对第一对话信息进行文本分词,根据预设映射表单,分别获取每一个词映射的数字id(第一数字参数),将所有的数字id根据文本顺序转换为第一词向量,再将第一词向量输入第一神经网络模型进行计算,通过分类层(softmax层)进行分类,得到话题类型的概率分布,选取概率最大的话题类型作为第一话题类型。其中,第一神经网络模型可采用CNN模型或BERT模型。
S3.基于历史信息、所述第一对话信息和所述第一话题类型预测回复所述用户的第二话题类型;
在本实施例中,结合历史信息、第一对话信息和第一话题类型对于回复用户的话题类型进行预测,得到符合当前对话情景的第二话题类型,以便于对用户的对话内容产生引导作用。
需要强调的是,为进一步保证上述历史信息的私密和安全性,上述历史信息还可以存储于一区块链的节点中。本发明所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
进一步地,参阅图3所示步骤S3可包括以下步骤:
S31.将所述历史信息、所述第一对话信息和所述第一话题类型进行拼接,生成第一拼接信息;
在本实施例中,历史信息包括历史对话信息和与历史对话信息对应的历史话题类型。
步骤S31的具体过程为:将历史对话信息、所述第一对话信息根据每一对话信息生成时间戳的顺序进行拼接,将相应的历史话题类型和第一话题类型根据生成的时间戳顺序进行拼接,将对拼接后的话信息和话题类型结合作为第一拼接信息。
S32.采用第二神经网络模型对所述第一拼接信息进行分类识别,获取回复所述用户的所述第二话题类型。
具体地,参阅图4所示步骤S32可包括以下步骤:
S321.对所述第一拼接信息进行文本分词,分别将每一个词映射为第二数字参数,将所有的所述第二数字参数转换为第二词向量;
在本实施例中,对第一拼接信息进行文本分词,根据预设映射表单,分别获取每一个词映射的数字id(第二数字参数),将所有的数字id根据文本顺序转换为第二词向量。
S322.将所述第二词向量输入所述第二神经网络模型进行分别识别,以得到话题类型集合;
在本实施例中,将第二词向量输入第二神经网络模型进行计算,通过分类层(softmax层)进行分类,得到预测回复的话题类型的概率分布,依次从最大概率的候选话题类型中选择预设数目(如:3个)的候选话题类型组成话题类型集合。其中,第二神经网络模型可采用CNN模型或BERT模型。
S323.对所述话题类型集合中的话题类型进行筛选,以得到所述第二话题类型。
在一实施方式中,第二话题类型的选择过程为:将所述话题类型集合中的每一个候选话题类型分别与目标话题进行匹配,将相似度最高的所述候选话题类型作为所述第二话题类型。其中,目标话题为预设的引导话题(如:保险话题、理财话题等)。
在另一实施方式中,第二话题类型的选择过程为:从所述话题类型集合中删除与限制话题列表中的限制话题类型匹配的候选话题类型,再将所述话题类型集合其他候选话题类型与目标话题进行匹配,从中选取相似度最高的所述候选话题类型作为所述第二话题类型。
限制话题列表包括的限制话题类型可以是处于僵局模式时的对话信息对应的话题类型;限制话题类型还可以是历史信息中历史对话信息的条数大于条数阈值的历史对话信息对应的历史话题类型。
S4.根据所述第一话题类型和所述第二话题类型生成回复所述用户的第二对话信息。
进一步地,参阅图5所示步骤S4可包括以下步骤:
S41.检测所述第二话题类型与所述第一话题类型是否相同;
在步骤S41中通过检测第二话题类型与第一话题类型是否相同,判断回复用户的对话是否需要跳转话题,当第二话题类型与第一话题类型不同时,表示当前对话语境可能处于僵局模式需要跳转话题,或可以结束当前的对话类型跳转至下一新的话题类型,由机器引导新的话题;当第二话题类型与第一话题类型相同时,表示可维持当前对话语境,继续当前的话题类型。
S42.当所述第二话题类型与所述第一话题类型相同时,将所述历史信息、第一对话信息、所述第一话题类型和所述第二话题类型进行拼接,生成第二拼接信息;
步骤S42的具体过程为:将历史对话信息、所述第一对话信息根据每一对话信息生成时间戳的顺序进行拼接,将相应的历史话题类型、第一话题类型和第二话题类型根据生成的时间戳顺序进行拼接,将对拼接后的话信息和话题类型结合作为第二拼接信息。
S43.采用第三神经网络模型对所述第二拼接信息进行预测,生成回复所述用户的第二对话信息。
具体地,参阅图6所示步骤S43可包括以下步骤:
S431.对所述第二拼接信息进行文本分词,分别将每一个词映射为第三数字参数,将所有的所述第三数字参数转换为第三词向量;
在本实施例中,对第二拼接信息进行文本分词,根据预设映射表单,分别获取每一个词映射的数字id(第二数字参数),将所有的数字id根据文本顺序转换为第三词向量。
S432.将所述第三词向量输入所述第三神经网络模型进行预测,以得到回复用户的第二对话信息。
在一实施方式中,当第一对话信息处于正常模式时,回复用户的第二对话信息的过程为:将第三词向量输入第三神经网络模型的编码器进行编码,将编码后的向量进行拼接,输入到解码器中进行解码,得到输出的数字id,再通过预设映射表单将数字id转换为文本,形成回复用户的第二对话信息,结束第一话题类型的对话,引导用户开启新的对话。
需要说明的是:第三神经网络模型采用transformer模型。
进一步地,步骤S4还可包括:
S44.当所述第二话题类型与所述第一话题类型不相同时,在话题数据库中获取与所述第二话题类型匹配的对话信息作为所述第二对话信息。
在一实施方式中,当所述第二话题类型与所述第一话题类型不相同,且第一对话信息处于僵局模式时,回复用户的第二对话信息的过程为:在话题数据库中获取与所述第二话题类型匹配的对话信息作为所述第二对话信息,结束第一话题类型的对话,引导用户开启新的对话。
在另一实施方式中,当所述第二话题类型与所述第一话题类型不相同,且第一对话信息处于正常模式时,回复用户的第二对话信息的过程为:基于第一对话信息从预设的话题表单中选择肯定的、正面的、短的过渡对话信息;在话题数据库中获取与所述第二话题类型匹配的对话信息作为所述第二对话信息,结束第一话题类型的对话,引导用户开启新的对话。
在本实施例中,人机对话方法通过对用户输入的第一对话信息进行识别第一话题类型,以确定当前的对话话题;从而结合历史信息、第一对话信息和第一话题类型对于回复用户的话题类型进行预测,得到符合当前对话情景的第二话题类型,以便于对用户的对话内容产生引导作用;再根据第一话题类型和第二话题类型生成符合第二话题类型的第二对话信息回复用户,提升用户的人机交互体验效果。
人机对话方法回复的话题能根据应用要求对用户对话进行引导,采用神经网络模型对用户的聊天话题进行预测,并根据历史信息和当前的对话信息预测机器人应回复的话题类型,按照历史信息与预测话题类型,自动生成回复。能够自动识别出对话僵局,并在衔接对话转移过程中自动生成结束上一个话题的回复,使转移更为自然。能够围绕话题生成具有信息量的回复,回复主题更加可控,并能按照要求引导到特定的对话话题。流畅自然的引导用户到指定的对话话题在对话机器人有很大的应用,能够帮助企业改善服务质量,提高客户满意度。
实施例二
请参阅图7,本实施例的一种人机对话装置1可包括:获取单元11、识别单元12、预测单元13和生成单元14。
获取单元11,用于获取用户的第一对话信息。
需要说明的是:第一对话信息可以是文本信息也可以是音频信息,此处不做具体限定,当第一对话信息为音频信息时,需将音频信息转换为文本信息,并存储文本信息,以便于进行历史信息记录。
识别单元12,用于识别所述第一对话信息的第一话题类型。
在本实施例中,第一话题类型是指当前的对话话题。通过对第一对话信息进行识别以确定当前的对话话题。
作为举例而非限定,第一话题类型可包括:娱乐类型、游戏类型、综艺类型、新闻类型、天气类型、体育类型、财经类型、汽车类型、科技类型和时尚类型中的至少两种,本发明不作具体限定。
进一步地,识别单元12用以检测所述第一对话信息的话题模式;
其中,所述话题模式包括僵局模式和正常模式(即:非僵局模式)。
具体地,将第一对话信息与预设的僵局词语列表中的僵局词语信息进行匹配,若匹配,则表示第一对话信息处于僵局模式;若不匹配,则表示第一对话信息处于正常模式。
作为举例而非限定,僵局词语信息可以是“嗯嗯”、“呵呵”、“好的”、“哦”等。
当所述第一对话信息属于所述僵局模式时,识别单元12用以将上一次对话信息的话题类型作为所述第一对话信息的第一话题类型;
具体地,当所述第一对话信息属于所述僵局模式时,从历史信息中获取上一次对话信息及上一次对话信息对应的话题类型,将该话题类型作为第一对话信息的第一话题类型。历史信息可以是由预设时间段内的历史对话信息和历史话题类型构成的信息;历史信息还可以是由预设条数的历史对话信息和历史话题类型构成的信息。其中,每一个历史对话信息对应一个历史话题类型。
当所述第一对话信息属于所述正常模式时,识别单元12采用第一神经网络模型对所述第一对话信息进行分类识别,获取所述第一话题类型。
具体地,当所述第一对话信息属于所述正常模式时,识别单元12采用第一神经网络模型对第一对话信息进行分类识别的过程为:对所述第一对话信息进行文本分词,分别将每一个词映射为第一数字参数,将所有的所述第一数字参数转换为第一词向量;将所述第一词向量输入所述第一神经网络模型进行分类识别,以得到所述第一话题类型。
在本实施例中,对第一对话信息进行文本分词,根据预设映射表单,分别获取每一个词映射的数字id(第一数字参数),将所有的数字id根据文本顺序转换为第一词向量,再将第一词向量输入第一神经网络模型进行计算,通过分类层(softmax层)进行分类,得到话题类型的概率分布,选取概率最大的话题类型作为第一话题类型。其中,第一神经网络模型可采用CNN模型或BERT模型。
预测单元13,用于基于历史信息、所述第一对话信息和所述第一话题类型预测回复所述用户的第二话题类型。
在本实施例中,结合历史信息、第一对话信息和第一话题类型对于回复用户的话题类型进行预测,得到符合当前对话情景的第二话题类型,以便于对用户的对话内容产生引导作用。
需要强调的是,为进一步保证上述历史信息的私密和安全性,上述历史信息还可以存储于一区块链的节点中。
进一步地,预测单元13用以将所述历史信息、所述第一对话信息和所述第一话题类型进行拼接,生成第一拼接信息;
在本实施例中,历史信息包括历史对话信息和与历史对话信息对应的历史话题类型。
生成第一拼接信息的具体过程为:将历史对话信息、所述第一对话信息根据每一对话信息生成时间戳的顺序进行拼接,将相应的历史话题类型和第一话题类型根据生成的时间戳顺序进行拼接,将对拼接后的话信息和话题类型结合作为第一拼接信息。
预测单元13用以采用第二神经网络模型对所述第一拼接信息进行分类识别,获取回复所述用户的所述第二话题类型。
具体地,预测单元13采用第二神经网络模型对第一拼接信息进行分类识别的过程为:对所述第一拼接信息进行文本分词,分别将每一个词映射为第二数字参数,将所有的所述第二数字参数转换为第二词向量;将所述第二词向量输入所述第二神经网络模型进行分别识别,以得到话题类型集合;对所述话题类型集合中的话题类型进行筛选,以得到所述第二话题类型。
在一实施方式中,第二话题类型的选择过程为:将所述话题类型集合中的每一个候选话题类型分别与目标话题进行匹配,将相似度最高的所述候选话题类型作为所述第二话题类型。其中,目标话题为预设的引导话题(如:保险话题、理财话题等)。
在另一实施方式中,第二话题类型的选择过程为:从所述话题类型集合中删除与限制话题列表中的限制话题类型匹配的候选话题类型,再将所述话题类型集合其他候选话题类型与目标话题进行匹配,从中选取相似度最高的所述候选话题类型作为所述第二话题类型。
限制话题列表包括的限制话题类型可以是处于僵局模式时的对话信息对应的话题类型;限制话题类型还可以是历史信息中历史对话信息的条数大于条数阈值的历史对话信息对应的历史话题类型。
生成单元14,用于根据所述第一话题类型和所述第二话题类型生成回复所述用户的第二对话信息。
进一步地,生成单元14用以检测所述第二话题类型与所述第一话题类型是否相同。通过检测第二话题类型与第一话题类型是否相同,判断回复用户的对话是否需要跳转话题,当第二话题类型与第一话题类型不同时,表示当前对话语境可能处于僵局模式需要跳转话题,或可以结束当前的对话类型跳转至下一新的话题类型,由机器引导新的话题;当第二话题类型与第一话题类型相同时,表示可维持当前对话语境,继续当前的话题类型。
当所述第二话题类型与所述第一话题类型相同时,生成单元14将所述历史信息、第一对话信息、所述第一话题类型和所述第二话题类型进行拼接,生成第二拼接信息;
当所述第二话题类型与所述第一话题类型相同时,生成第二拼接信息的具体过程为:将历史对话信息、所述第一对话信息根据每一对话信息生成时间戳的顺序进行拼接,将相应的历史话题类型、第一话题类型和第二话题类型根据生成的时间戳顺序进行拼接,将对拼接后的话信息和话题类型结合作为第二拼接信息。
生成单元14用以采用第三神经网络模型对所述第二拼接信息进行预测,生成回复所述用户的第二对话信息。
具体地,生成单元14用以采用第三神经网络模型对所述第二拼接信息进行预测的具体过程为:对所述第二拼接信息进行文本分词,分别将每一个词映射为第三数字参数,将所有的所述第三数字参数转换为第三词向量;将所述第三词向量输入所述第三神经网络模型进行预测,以得到回复用户的第二对话信息;
在一实施方式中,当第一对话信息处于正常模式时,回复用户的第二对话信息的过程为:将第三词向量输入第三神经网络模型的编码器进行编码,将编码后的向量进行拼接,输入到解码器中进行解码,得到输出的数字id,再通过预设映射表单将数字id转换为文本,形成回复用户的第二对话信息,结束第一话题类型的对话,引导用户开启新的对话。
进一步地,当所述第二话题类型与所述第一话题类型不相同时,生成单元14用以在话题数据库中获取与所述第二话题类型匹配的对话信息作为所述第二对话信息。
在一实施方式中,当所述第二话题类型与所述第一话题类型不相同,且第一对话信息处于僵局模式时,回复用户的第二对话信息的过程为:在话题数据库中获取与所述第二话题类型匹配的对话信息作为所述第二对话信息,结束第一话题类型的对话,引导用户开启新的对话。
在另一实施方式中,当所述第二话题类型与所述第一话题类型不相同,且第一对话信息处于正常模式时,回复用户的第二对话信息的过程为:基于第一对话信息从预设的话题表单中选择肯定的、正面的、短的过渡对话信息;在话题数据库中获取与所述第二话题类型匹配的对话信息作为所述第二对话信息,结束第一话题类型的对话,引导用户开启新的对话。
在本实施例中,人机对话装置1采用获取单元11获取用户输入的第一对话信息,通过识别单元12识别第一对话信息的第一话题类型,以确定当前的对话话题;采用预测单元13结合历史信息、第一对话信息和第一话题类型对于回复用户的话题类型进行预测,得到符合当前对话情景的第二话题类型,以便于对用户的对话内容产生引导作用;利用生成单元14根据第一话题类型和第二话题类型生成符合第二话题类型的第二对话信息回复用户,提升用户的人机交互体验效果。
实施例三
为实现上述目的,本发明还提供一种计算机设备2,该计算机设备2包括多个计算机设备2,实施例二的人机对话装置1的组成部分可分散于不同的计算机设备2中,计算机设备2可以是执行程序的智能手机、平板电脑、笔记本电脑、台式计算机、机架式服务器、刀片式服务器、塔式服务器或机柜式服务器(包括独立的服务器,或者多个服务器所组成的服务器集群)等。本实施例的计算机设备2至少包括但不限于:可通过系统总线相互通信连接的存储器21、处理器23、网络接口22以及人机对话装置1(参考图8)。需要指出的是,图8仅示出了具有组件-的计算机设备2,但是应理解的是,并不要求实施所有示出的组件,可以替代的实施更多或者更少的组件。
本实施例中,所述存储器21至少包括一种类型的计算机可读存储介质,所述可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘等。在一些实施例中,存储器21可以是计算机设备2的内部存储单元,例如该计算机设备2的硬盘或内存。在另一些实施例中,存储器21也可以是计算机设备2的外部存储设备,例如该计算机设备2上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。当然,所述存储器21还可以既包括计算机设备2的内部存储单元也包括其外部存储设备。本实施例中,存储器21通常用于存储安装于计算机设备2的操作系统和各类应用软件,例如实施例一的人机对话方法的程序代码等。此外,存储器21还可以用于暂时地存储已经输出或者将要输出的各类数据。
所述处理器23在一些实施例中可以是中央处理器(Central Processing Unit,CPU)、控制器、微控制器、微处理器、或其他数据处理芯片。该处理器23通常用于控制计算机设备2的总体操作例如执行与所述计算机设备2进行数据交互或者通信相关的控制和处理等。本实施例中,所述处理器23用于运行所述存储器21中存储的程序代码或者处理数据,例如运行所述的人机对话装置1等。
所述网络接口22可包括无线网络接口或有线网络接口,该网络接口22通常用于在所述计算机设备2与其他计算机设备2之间建立通信连接。例如,所述网络接口22用于通过网络将所述计算机设备2与外部终端相连,在所述计算机设备2与外部终端之间的建立数据传输通道和通信连接等。所述网络可以是企业内部网(Intranet)、互联网(Internet)、全球移动通讯系统(Global System of Mobile communication,GSM)、宽带码分多址(WidebandCode Division Multiple Access,WCDMA)、4G网络、5G网络、蓝牙(Bluetooth)、Wi-Fi等无线或有线网络。
需要指出的是,图8仅示出了具有部件21-23的计算机设备2,但是应理解的是,并不要求实施所有示出的部件,可以替代的实施更多或者更少的部件。
在本实施例中,存储于存储器21中的所述人机对话装置1还可以被分割为一个或者多个程序模块,所述一个或者多个程序模块被存储于存储器21中,并由一个或多个处理器(本实施例为处理器23)所执行,以完成本发明。
实施例四
为实现上述目的,本发明还提供一种计算机可读存储介质,其包括多个存储介质,如闪存、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘、服务器、App应用商城等等,其上存储有计算机程序,程序被处理器23执行时实现相应功能。本实施例的计算机可读存储介质用于存储人机对话装置1,被处理器23执行时实现实施例一的人机对话方法。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (10)

1.一种人机对话方法,其特征在于,包括:
获取用户的第一对话信息;
识别所述第一对话信息的第一话题类型;
基于历史信息、所述第一对话信息和所述第一话题类型预测回复所述用户的第二话题类型;
根据所述第一话题类型和所述第二话题类型生成回复所述用户的第二对话信息。
2.根据权利要求1所述的人机对话方法,其特征在于,所述识别所述第一对话信息的第一话题类型,包括:
检测所述第一对话信息的话题模式,所述话题模式包括僵局模式和正常模式;
当所述第一对话信息属于所述僵局模式时,将上一次对话信息的话题类型作为所述第一对话信息的第一话题类型;
当所述第一对话信息属于所述正常模式时,采用第一神经网络模型对所述第一对话信息进行分类识别,获取所述第一话题类型。
3.根据权利要求2所述的人机对话方法,其特征在于,所述当所述第一对话信息属于所述正常模式时,采用第一神经网络模型对所述第一对话信息进行分类识别,获取所述第一话题类型,包括:
对所述第一对话信息进行文本分词,分别将每一个词映射为第一数字参数,将所有的所述第一数字参数转换为第一词向量;
将所述第一词向量输入所述第一神经网络模型进行分类识别,以得到所述第一话题类型。
4.根据权利要求1所述的人机对话方法,其特征在于,所述基于历史信息、所述第一对话信息和所述第一话题类型预测回复所述用户的第二话题类型,包括:
将所述历史信息、所述第一对话信息和所述第一话题类型进行拼接,生成第一拼接信息;
采用第二神经网络模型对所述第一拼接信息进行分类识别,获取回复所述用户的所述第二话题类型。
5.根据权利要求4所述的人机对话方法,其特征在于,所述采用第二神经网络模型对所述第一拼接信息进行分类识别,获取回复所述用户的所述第二话题类型,包括:
对所述第一拼接信息进行文本分词,分别将每一个词映射为第二数字参数,将所有的所述第二数字参数转换为第二词向量;
将所述第二词向量输入所述第二神经网络模型进行分别识别,以得到话题类型集合;
对所述话题类型集合中的候选话题类型进行筛选,以得到所述第二话题类型。
6.根据权利要求1所述的人机对话方法,其特征在于,所述根据所述第一话题类型和所述第二话题类型生成回复所述用户的第二对话信息,包括:
检测所述第二话题类型与所述第一话题类型是否相同;
当所述第二话题类型与所述第一话题类型不相同时,将所述历史信息、所述第一对话信息、所述第一话题类型和所述第二话题类型进行拼接,生成第二拼接信息;
采用第三神经网络模型对所述第二拼接信息进行预测,生成回复所述用户的第二对话信息。
7.根据权利要求6所述的人机对话方法,其特征在于,所述根据所述第一话题类型和所述第二话题类型生成回复所述用户的第二对话信息,包括:
当所述第二话题类型与所述第一话题类型相同时,在话题数据库中获取与所述第二话题类型匹配的对话信息作为所述第二对话信息。
8.一种人机对话装置,其特征在于,包括:
获取单元,用于获取用户的第一对话信息;
识别单元,用于识别所述第一对话信息的第一话题类型;
预测单元,用于基于历史信息、所述第一对话信息和所述第一话题类型预测回复所述用户的第二话题类型;
生成单元,用于根据所述第一话题类型和所述第二话题类型生成回复所述用户的第二对话信息。
9.一种计算机设备,其特征在于,所述计算机设备包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现权利要求1至7任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7任一项所述方法的步骤。
CN202010908558.5A 2020-09-02 2020-09-02 人机对话方法、装置、计算机设备及存储介质 Pending CN112052321A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202010908558.5A CN112052321A (zh) 2020-09-02 2020-09-02 人机对话方法、装置、计算机设备及存储介质
PCT/CN2021/091180 WO2022048170A1 (zh) 2020-09-02 2021-04-29 人机对话方法、装置、计算机设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010908558.5A CN112052321A (zh) 2020-09-02 2020-09-02 人机对话方法、装置、计算机设备及存储介质

Publications (1)

Publication Number Publication Date
CN112052321A true CN112052321A (zh) 2020-12-08

Family

ID=73606781

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010908558.5A Pending CN112052321A (zh) 2020-09-02 2020-09-02 人机对话方法、装置、计算机设备及存储介质

Country Status (2)

Country Link
CN (1) CN112052321A (zh)
WO (1) WO2022048170A1 (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022048170A1 (zh) * 2020-09-02 2022-03-10 平安科技(深圳)有限公司 人机对话方法、装置、计算机设备及存储介质
CN115497482A (zh) * 2022-06-27 2022-12-20 湖北大学 一种语音对话方法及相关装置
WO2023231513A1 (zh) * 2022-05-31 2023-12-07 华院计算技术(上海)股份有限公司 对话内容的生成方法及装置、存储介质、终端

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115640392B (zh) * 2022-12-06 2023-04-07 杭州心识宇宙科技有限公司 一种对话系统优化的方法、装置、存储介质及电子设备
CN116737888B (zh) * 2023-01-11 2024-05-17 北京百度网讯科技有限公司 对话生成模型的训练方法和答复文本的确定方法、装置
CN117131182A (zh) * 2023-10-26 2023-11-28 江西拓世智能科技股份有限公司 一种基于ai的对话回复生成方法及系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030126089A1 (en) * 2001-12-28 2003-07-03 Fujitsu Limited Conversation method, device, program and computer-readable recording medium on which conversation program is recorded
CN106776926A (zh) * 2016-12-01 2017-05-31 竹间智能科技(上海)有限公司 改善机器人对话时的应答能力的方法及系统
CN106777364A (zh) * 2017-01-22 2017-05-31 竹间智能科技(上海)有限公司 话题驱动的人工智能回应方法及装置
CN109086329A (zh) * 2018-06-29 2018-12-25 出门问问信息科技有限公司 基于话题关键词引导的进行多轮对话方法及装置

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9501469B2 (en) * 2012-11-21 2016-11-22 University Of Massachusetts Analogy finder
CN105138671A (zh) * 2015-09-07 2015-12-09 百度在线网络技术(北京)有限公司 基于人工智能的人机交互的交互引导方法和装置
US10552843B1 (en) * 2016-12-05 2020-02-04 Intuit Inc. Method and system for improving search results by recency boosting customer support content for a customer self-help system associated with one or more financial management systems
CN112052321A (zh) * 2020-09-02 2020-12-08 平安科技(深圳)有限公司 人机对话方法、装置、计算机设备及存储介质

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030126089A1 (en) * 2001-12-28 2003-07-03 Fujitsu Limited Conversation method, device, program and computer-readable recording medium on which conversation program is recorded
CN106776926A (zh) * 2016-12-01 2017-05-31 竹间智能科技(上海)有限公司 改善机器人对话时的应答能力的方法及系统
CN106777364A (zh) * 2017-01-22 2017-05-31 竹间智能科技(上海)有限公司 话题驱动的人工智能回应方法及装置
CN109086329A (zh) * 2018-06-29 2018-12-25 出门问问信息科技有限公司 基于话题关键词引导的进行多轮对话方法及装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
卡蒂克.雷迪.博卡 等, 机械工业出版社 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022048170A1 (zh) * 2020-09-02 2022-03-10 平安科技(深圳)有限公司 人机对话方法、装置、计算机设备及存储介质
WO2023231513A1 (zh) * 2022-05-31 2023-12-07 华院计算技术(上海)股份有限公司 对话内容的生成方法及装置、存储介质、终端
CN115497482A (zh) * 2022-06-27 2022-12-20 湖北大学 一种语音对话方法及相关装置
CN115497482B (zh) * 2022-06-27 2024-05-03 湖北大学 一种语音对话方法及相关装置

Also Published As

Publication number Publication date
WO2022048170A1 (zh) 2022-03-10

Similar Documents

Publication Publication Date Title
CN112052321A (zh) 人机对话方法、装置、计算机设备及存储介质
US10380236B1 (en) Machine learning system for annotating unstructured text
CN112732911B (zh) 基于语义识别的话术推荐方法、装置、设备及存储介质
CN112380853B (zh) 业务场景交互方法、装置、终端设备及存储介质
CN111738016A (zh) 多意图识别方法及相关设备
CN111009238B (zh) 一种拼接语音的识别方法和装置以及设备
CN111694937A (zh) 基于人工智能的面试方法、装置、计算机设备及存储介质
CN104572852A (zh) 资源的推荐方法及装置
CN113392641A (zh) 文本处理方法、装置、存储介质和设备
CN112632244A (zh) 一种人机通话的优化方法、装置、计算机设备及存储介质
CN112836521A (zh) 问答匹配方法、装置、计算机设备及存储介质
CN113408278A (zh) 意图识别方法、装置、设备及存储介质
CN111079433B (zh) 一种事件抽取方法、装置及电子设备
CN113094478A (zh) 表情回复方法、装置、设备及存储介质
CN113535925B (zh) 语音播报方法、装置、设备及存储介质
CN113609866A (zh) 文本标记方法、装置、设备及存储介质
CN111126059B (zh) 一种短文文本的生成方法、生成装置及可读存储介质
CN113010785A (zh) 用户推荐方法及设备
CN113704393A (zh) 关键词提取方法、装置、设备及介质
CN112100491A (zh) 基于用户数据的信息推荐方法、装置、设备及存储介质
CN112052329A (zh) 文本摘要生成方法、装置、计算机设备及可读存储介质
CN116629423A (zh) 用户行为预测方法、装置、设备及存储介质
CN115828901A (zh) 敏感信息识别方法、装置、电子设备及存储介质
US11238236B2 (en) Summarization of group chat threads
CN113656566A (zh) 智能对话处理方法、装置、计算机设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20201208