CN114969295A - 基于人工智能的对话交互数据处理方法、装置及设备 - Google Patents

基于人工智能的对话交互数据处理方法、装置及设备 Download PDF

Info

Publication number
CN114969295A
CN114969295A CN202210614849.2A CN202210614849A CN114969295A CN 114969295 A CN114969295 A CN 114969295A CN 202210614849 A CN202210614849 A CN 202210614849A CN 114969295 A CN114969295 A CN 114969295A
Authority
CN
China
Prior art keywords
user
ith
data
current
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210614849.2A
Other languages
English (en)
Inventor
张建军
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Technology Shenzhen Co Ltd
Original Assignee
Ping An Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Technology Shenzhen Co Ltd filed Critical Ping An Technology Shenzhen Co Ltd
Priority to CN202210614849.2A priority Critical patent/CN114969295A/zh
Publication of CN114969295A publication Critical patent/CN114969295A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/335Filtering based on additional data, e.g. user or group profiles

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Human Computer Interaction (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请涉及人工智能技术,提供了基于人工智能的对话交互数据处理方法、装置及设备,是先获取用户账户信息和当前日期特征信息,之后根据用户账户信息和当前日期特征信息获取当前用户标签集并基于当前用户标签集获取当前推送问题集,然后获取对应的回答数据集并根据回答数据集获取与当前用户标签集对应的更新用户标签集及与回答数据集获取更新用户积分数据,最后根据更新用户标签集和更新用户积分数据更新用户账户信息。实现了交互过程的数据分析及用户标签提取更加高效,而且分析得到的结果能作为下一轮对话的参考数据。

Description

基于人工智能的对话交互数据处理方法、装置及设备
技术领域
本申请涉及人工智能的语音语义技术领域,尤其涉及一种基于人工智能的对话交互数据处理方法、装置、计算机设备及存储介质。
背景技术
目前,用户在网上商城购物或是网上投保时,存在有疑问且需要咨询问题时,一般是与在线智能客服进行交互。而目前的在线智能客服一般是面向所有客户提供服务的智能客服机器人,这一类智能客服机器人一般是获取到用户输入的问题后,基于自身的知识库获取到答案数据并推送至用户。而且这一类的智能客服机器人一般是在用户发送了首个问题之后,才开始与用户进行交互。
这就导致现有的智能客服机器人是未充分考虑用户自身信息(如用户兴趣爱好、擅长领域等)而检索到的回复数据,故该回复数据的准确率较低。而且所得到的回复数据并未得到充分再利用以得到用户辅助信息以作为下一轮对话的参考数据,造成了数据利用率较低。
发明内容
本申请实施例提供了一种基于人工智能的对话交互数据处理方法、装置、计算机设备及存储介质,旨在解决现有技术中智能客服机器人在基于用户问题得到答复时,未充分考虑用户自身信息,导致该回复数据的准确率较低,且未充分利用回复数据分析得到用户辅助信息以作为下一轮对话的参考数据,而造成了数据利用率较低的问题。
第一方面,本申请实施例提供了一种基于人工智能的对话交互数据处理方法,其包括:
若检测到用户成功登录指令时,获取与所述用户成功登录指令的用户账户信息,并获取当前日期特征信息;其中,所述当前日期特征信息包括节日特征和当日新闻资讯特征;
根据所述用户账户信息和所述当前日期特征信息获取当前用户标签集,基于所述当前用户标签集获取当前推送问题集,将所述当前推送问题集发送至与所述用户成功登录指令对应的用户端;
若接收到与所述当前推送问题集对应的回答数据集,根据所述回答数据集获取所述当前用户标签集对应的更新用户标签集,并根据所述回答数据集获取更新用户积分数据;以及
根据所述更新用户标签集对所述当前用户标签集进行更新以得到更新后用户标签集,并将所述更新用户积分数据增加至所述用户账户信息以更新所述用户账户信息。
第二方面,本申请实施例提供了一种基于人工智能的对话交互数据处理装置,其包括:
登录信息获取单元,用于若检测到用户成功登录指令时,获取与所述用户成功登录指令的用户账户信息,并获取当前日期特征信息;其中,所述当前日期特征信息包括节日特征和当日新闻资讯特征;
当前推送问题集获取单元,用于根据所述用户账户信息和所述当前日期特征信息获取当前用户标签集,基于所述当前用户标签集获取当前推送问题集,将所述当前推送问题集发送至与所述用户成功登录指令对应的用户端;
更新标签集获取单元,用于若接收到与所述当前推送问题集对应的回答数据集,根据所述回答数据集获取所述当前用户标签集对应的更新用户标签集,并根据所述回答数据集获取更新用户积分数据;以及
用户标签集更新单元,用于根据所述更新用户标签集对所述当前用户标签集进行更新以得到更新后用户标签集,并将所述更新用户积分数据增加至所述用户账户信息以更新所述用户账户信息。
第三方面,本申请实施例又提供了一种计算机设备,其包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述第一方面所述的基于人工智能的对话交互数据处理方法。
第四方面,本申请实施例还提供了一种计算机可读存储介质,其中所述计算机可读存储介质存储有计算机程序,所述计算机程序当被处理器执行时使所述处理器执行上述第一方面所述的基于人工智能的对话交互数据处理方法。
本申请实施例提供了一种基于人工智能的对话交互数据处理方法、装置、计算机设备及存储介质,先获取用户账户信息和当前日期特征信息,之后根据用户账户信息和当前日期特征信息获取当前用户标签集并基于当前用户标签集获取当前推送问题集,然后获取对应的回答数据集并根据回答数据集获取与当前用户标签集对应的更新用户标签集及与回答数据集获取更新用户积分数据,最后根据更新用户标签集和更新用户积分数据更新用户账户信息。实现了交互过程的数据分析及用户标签提取更加高效,而且分析得到的结果能作为下一轮对话的参考数据。
附图说明
为了更清楚地说明本申请实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的基于人工智能的对话交互数据处理方法的应用场景示意图;
图2为本申请实施例提供的基于人工智能的对话交互数据处理方法的流程示意图;
图3为本申请实施例提供的基于人工智能的对话交互数据处理装置的示意性框图;
图4为本申请实施例提供的计算机设备的示意性框图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
应当理解,当在本说明书和所附权利要求书中使用时,术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
还应当理解,在此本申请说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本申请。如在本申请说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。
还应当进一步理解,在本申请说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
请参阅图1和图2,图1为本申请实施例提供的基于人工智能的对话交互数据处理方法的应用场景示意图;图2为本申请实施例提供的基于人工智能的对话交互数据处理方法的流程示意图,该基于人工智能的对话交互数据处理方法应用于服务器中,该方法通过安装于服务器中的应用软件进行执行。
如图2所示,该方法包括步骤S101~S104。
S101、若检测到用户成功登录指令时,获取与所述用户成功登录指令的用户账户信息,并获取当前日期特征信息;其中,所述当前日期特征信息包括节日特征和当日新闻资讯特征。
在本实施例中,是以服务器为执行主体来描述技术方案。在服务器中部署有智能客服机器人,其可以自动向用户端推送筛选后的问题集和新闻资讯数据,并基于用户端发送的回答数据集和新闻资讯数据点击反馈数据更新用户标签及用户积分数据,不断动态调整用户标签,更加精准的进行下一次的数据推送。
具体是当用户使用具体为智能手机、平板电脑、笔记本电脑等形式的用户端启动应用程序并登录用户账号(登录用户账号成功即可触发用户成功登录指令)与服务器建立通讯连接后,在用户端的界面上显示智能客服机器人的交互界面,这样可以由智能客服机器人向用户端推送信息,也可以是用户端向智能客服机器人发送待咨询问题或是其他交互信息。在相互交互的过程中,智能客服机器人可以基于用户的回答数据进一步分析提取用户标签以更新用户画像,用户也可以向智能客服机器人获取所需要的信息。
其中,当用户使用用户端启动应用程序并登录用户账号后,服务器是先获取与所述用户成功登录指令的用户账户信息,其中用户账户信息包括用户基本信息(如用户昵称、性别、年龄、用户兴趣爱好等信息)、用户登录历史、用户登录历史IP地址信息等信息。而且服务器还获取当前日期特征信息,例如若当前日期对应某一节假日则当前日期特征信息的节日特征为该节假日名称,若当前日期对应一个或多个热点新闻资讯则当前日期特征信息的当日新闻资讯特征为上述一个或多个热点新闻资讯的新闻资讯关键词。
在一实施例中,步骤S101之前还包括:
若检测到用户端所发送的交互信息,获取所述交互信息及所述交互信息对应的信息类型;
获取所述信息类型对应的识别模型,根据所述识别模型对所述交互信息进行识别,得到交互识别数据;
获取所述交互信息对应的用户年龄区间,根据所述用户年龄区间确定待回复消息语音类型;
根据所述交互识别数据的语义向量在本地知识库中获取对应的答复数据;
将所述答复数据根据所述待回复消息语音类型生成对应的回复语音数据;
将所述回复语音数据发送至所述用户端。
在本实施例中,当用户使用用户端与服务器中的智能客服机器人建立通讯后,可以向其发送交互信息,所发送的交互信息可以是文本类型、语音类型、图片类型等,为了更快的提取交互信息中的文本信息,需要先确定交互信息的信息类型,具体如文本类型、语音类型、图片类型等。
此时若确定所述交互信息的信息类型是文本类型,先获取文本识别模型(如Transformer模型等),然后基于文本识别模型获取所述交互信息对应的文本识别信息,以作为交互识别数据。若确定所述交互信息的信息类型是图片类型,先获取图像识别模型(如卷积神经网络模型等),然后基于图像识别模型获取所述交互信息对应的图像文本识别信息,以作为交互识别数据。若确定所述交互信息的信息类型是语音类型,先获取语音识别类型(如N-gram模型也即多元模型等),然后基于语音识别模型获取所述交互信息对应的语音文本识别模型,以作为交互识别数据。在获取了交互识别数据后,可以进一步获取
由于对所述交互信息的来源端也即用户端进行用户识别时能获取到用户账户信息,故可基于用户端的用户账户信息获取到用户年龄区间。在确定了用户年龄区间后(如将男性0-20岁划分至男性少年阶段,将男性20-40岁划分至男性青年阶段,将男性40-60岁划分至男性中年阶段,将男性60岁以上划分至男性老年阶段等,女性也可以参考男性划分为四个阶段),可以获取与用户年龄区间对应的待回复消息语音类型,例如用户年龄区间为20-40岁阶段则对应第一待回复消息语音类型(如第一待回复消息语音类型为青年女性声音类型)。可见,基于每一用户年龄区间对应确定一种待回复语音消息类型,便于后续基于以该待回复语音消息类型为声音参数将回复数据合成对应的回复语音数据,增加了回复语音数据类型的多样性。
之后,一般交互信息是用户的提问数据,为了更快的获取该提问数据的回复答案,此时可以先获取所述交交互识别数据的语义向量,然后在本地知识库中获取与所述语义向量具有最大向量相似度值的回复语义向量作为目标语义向量,最后获取目标语义向量对应的原始文本数据作为答复数据。可见,基于语义相似度匹配的方式,可以快速准确的获取到所述交互识别数据对应的回复数据。
最后,在获取了回复数据对应的文本之后,可以将待回复语音消息类型作为声音参数将所述回复数据合成对应的回复语音数据,将所述回复语音数据发送至用户端即可完成此轮用户与智能客服机器人的交互过程。而且,在交互的过程中还能获取到用户年龄区间和确定待回复语音消息类型,为下一轮用户交互积累到了用户基础数据。其中,需要注意的是所获取到的用户各种数据均是在获得用户授权的前提下合法获取得到。
在一实施例中,作为基于交互信息获取用户年龄区间的具体实施例,所述获取所述交互信息对应的用户年龄区间,包括:
若确定所述交互信息是语音类型数据,获取所述交互信息对应的梅尔频率倒谱系数特征;
将所述梅尔频率倒谱系数特征输入至预先训练的语音年龄区间分类模型,得到用户年龄区间。
在本实施例中,可以将所述交互信息依次进行分帧处理、用周期图(periodogram)法来进行功率谱(power spectrum)估计、对功率谱用梅尔滤波器组进行滤波,计算每个滤波器里的能量、对每个滤波器的能量取log、进行DCT变换(即离散余弦变换)、保留DCT的第2-13个系数额处理后,得到所述交互信息对应的梅尔频率倒谱系数特征。
具体的,对所述交互信息进行分帧处理时,第一步是划分成20-40ms(最佳是25ms)的帧,且从每一帧抽取12个特征,得到分帧数据。第二步是对分帧数据中每帧数据进行DCT变换,得到DCT变换结果。第三步是对DCT变换结果用周期图法来进行功率谱估计,得到估计功率谱。第四步是对估计功率谱由26个长度为257的向量组(即三角滤波器组)进行滤波,得到滤波后信号。第五步是将滤波后信号取log,得到对数运算结果。第六步是将对数运算结果进行离散余弦变换,得到26个倒谱系数。第七步是保留26个倒谱系数中第2-13这12个倒谱系数,组成MFCC特征(即梅尔频率倒谱系数特征)。
在获取了所述交互信息对应的梅尔频率倒谱系数特征,可以获取服务器本地存储的语音年龄区间分类模型,如SVM(即支持向量机)、GMM(即高斯混合模型)等,将所述梅尔频率倒谱系数特征输入至预先训练的语音年龄区间分类模型进行分类,得到用户年龄区间。可见,这一方式基于交互信息可以准确获取到用户年龄区间。
S102、根据所述用户账户信息和所述当前日期特征信息获取当前用户标签集,根据所述当前用户标签集获取当前推送问题集,将所述当前推送问题集发送至与所述用户成功登录指令对应的用户端。
在本实施例中,当服务器获取到了所述用户账户信息和所述当前日期特征信息后,可以基于用户账户信息中提取到的用户初始用户标签集和所述当前日期特征信息中的节日特征和当日新闻资讯特征共同融合得到当前用户标签集。然后基于当前用户标签集在服务器中部署的问题库中筛选出与所述当前用户标签集相应的当前推送问题集,并将当前推送问题集发送至用户端。
在一实施例中,步骤S102中所述根据所述用户账户信息和所述当前日期特征信息获取当前用户标签集,包括:
获取所述用户账户信息的用户兴趣爱好关键词和用户基本信息,根据预设用户标签转化策略将所述用户兴趣爱好关键词和所述用户基本信息转换为对应的用户标签,以组成当前用户初始标签集。
在本实施例中,用户账户信息中的用户兴趣爱好关键词一般是用户在初始注册时根据自身兴趣爱好所选定的关键词,上述关键词基于预设用户标签转化策略转化得到的标签组成了第一类型初始用户标签集。且用户基本信息也是用户根据自身实际情况填写(如年龄、性别、学历等),这些基本信息基于预设用户标签转化策略得到的标签组成了第二类型初始用户标签集。将第一类型初始用户标签集与第二类型初始用户标签集组合,即可得到当前用户初始标签集。最后将所述当前日期特征信息对应的日期标签融入至所述当前用户初始标签集,即可得到当前用户标签集。可见,这一方式是通过用户兴趣爱好关键词、用户基本信息和当前日期特征信息进行多维度用户标签获取,能获取更多维度标签的用户标签集,刻画的用户形象更加准确。
在一实施例中,步骤S102中根据所述当前用户标签集获取当前推送问题集,包括:
获取所述当前用户标签集中每一用户标签分别在本地问题库中对应的推送问题,组成当前推送问题集。
在本实施例中,当获取到了所述当前用户标签集后,可以基于其中的每一个用户标签获取各自在在本地问题库中对应的推送问题。例如具体以其中获取一个用户标签对应的推送问题为例,首先是获取该用户标签对应的标签分类(如是金融类标签、或是投资类标签、或是运动类标签等),然后获取该标签分类对应的高热度题目(如该标签分类下题目热度值最高的问题是可视为高热度题目),最后将该标签分类对应的高热度题目作为该用户标签的推送问题。参照上述方式也可以获取到所述当前用户标签集中其他用户标签对应的推送问题,当得到了所述当前用户标签集中每一用户标签对应的推送问题后,即可组成当前推送问题集并发送至用户端。可见,通过上述方式,可以基于用户标签快速的获取推送问题集。
S103、若接收到与所述当前推送问题集对应的回答数据集,根据所述回答数据集获取所述当前用户标签集对应的更新用户标签集,并根据所述回答数据集获取更新用户积分数据。
在本实施例中,当用户端接收到所述当前推送问题集后,对每一推送问题可以具体回答。例如每一推送问题都是勾选“是”或“否”的问答题,用户可以操作用户端对每一推送问题分别答复后,得到每一推送问题的回答数据。当在用户端中针对所述当前推送问题集进行答复后,得到了对应的回答数据集。服务器接收到了用户端发送的回答数据集后,可以对回答数据集进行数据分析,判断每一回答数据是否能进一步转换为新用户标签,当完成了对各回答数据是否转换为新用户标签的判定后,即可得到所述当前用户标签集对应的更新用户标签集。
而且还能基于所述回答数据集中每一回答数据确定用户积分,例如可以设置用户上述答复题目中完成答复具有确定答案(如上述举例的是或否)的回答数据总个数,以每一确定答案对应积一分的转换策略,得到所述回答数据集获取更新用户积分数据。可见,在用户完成了与智能客服机器人的信息交互后,用户标签数据和积分数据得到了及时更新,能作为下一次推送问题的数据基础。
在一实施例中,所述根据所述回答数据集获取所述当前用户标签集对应的更新用户标签集,包括:
获取所述回答数据集中第i个回答数据;其中,i的初始值为1且i的取值范围是[1,N],N为所述回答数据集中回答数据的总个数;
若确定第i个回答数据为非空值,获取第i个回答数据对应的第i个当前推送问题;
获取第i个当前推送问题对应的第i个初始用户标签;
若确定第i个回答数据为肯定词性,将第i个初始用户标签作为第i个回答数据对应的第i个更新用户标签;
若确定第i个回答数据为否定词性,根据预设的用户正义反义标签列表获取第i个初始用户标签的第i个反义用户标签,将第i个反义用户标签作为第i个回答数据对应的第i个更新用户标签;
将i增1以更新i的取值;
若确定i未超出N,返回执行所述获取所述回答数据集中第i个回答数据的步骤;
若确定i超出N,获取第1个更新用户标签至第N个更新用户标签,组成更新用户标签集。
在本实施例中,以第i个回答数据为例来更新用户标签,具体是先判断该回答数据是否为空值,若确定第i个回答数据是空值表示用户未回答第i个当前推送问题,第i个回答数据对用户标签更新无任何影响。
若确定第i个回答数据不是空值表示用户回答了第i个当前推送问题,第i个回答数据对用户标签更新有影响,具体是判断用户是肯定性回答还是否定性回答。当确定第i个回答数据为肯定词性,则第i个当前推送问题对应的第i个初始用户标签不做任何调整,将第i个初始用户标签作为第i个回答数据对应的第i个更新用户标签即可。当确定第i个回答数据为否定词性,则第i个当前推送问题对应的第i个初始用户标签需做调整,将第i个初始用户标签对应的第i个反义用户标签作为第i个回答数据对应的第i个更新用户标签即可。可见,基于用户的实时回答不断的更新用户标签,使得作为下一次问题推送参考数据的用户标签集得到及时更新,能更为客观和准确的推送问题集。
在一实施例中,所述若确定第i个回答数据为肯定词性,将第i个初始用户标签作为第i个回答数据对应的第i个更新用户标签之前,或所述若确定第i个回答数据为否定词性,根据预设的用户正义反义标签列表获取第i个初始用户标签的第i个反义用户标签,将第i个反义用户标签作为第i个回答数据对应的第i个更新用户标签之前,还包括:
将第i个回答数据基于预先存储的肯定词词典和否定词词典确定第i个回答数据的回答数据词性;其中,所述回答数据词性为肯定词性或否定词性。
在本实施例中,由于第i个回答数据的词性会影响其对应的更新标签,故需要判断第i个回答数据的词性。具体是在服务器中可以预先存储两个词典,具体是肯定词词典和否定词词典,然后将第i个回答数据的关键词与肯定词词典和否定词词典中每一个词进行比较,找到与第i个回答数据的关键词最相近的词语并确定其是属于肯定词词典或是否定词词典,从而最终确定第i个回答数据的回答数据词性。
S104、根据所述更新用户标签集对所述当前用户标签集进行更新以得到更新后用户标签集,并将所述更新用户积分数据增加至所述用户账户信息以更新所述用户账户信息。
在本实施例中,当获取了所述更新用户标签集后,将所述更新用户标签集中包括的各标签增加至所述当前用户标签集后,去掉重复的用户标签即可得到更新后用户标签集。其中所述更新后用户标签集是在本轮答题后立即更新得到的最新版本的用户标签集,可作为下一轮答题开始时的用户标签集。
同时,还需将所述更新用户积分数据增加至所述用户账户信息,例如之前用户账户信息对应的用户累计积分数据是Score1,此时所述更新用户积分数是Score2,将Score2+Score1的求和结果来更新所述用户账户信息中的用户累计积分数据。可见,通过不断推送问题集并答复,即可实现用户标签和用户积分的及时更新。
具体实施时,还能基于用户答复数据获取到用户在指定领域的风险等级(如理财风险承受能力等指标)。更具体是基于更新后用户标签集中与财务相关的标签来组合确定用户在理财领域的风险承受等级。
本申请实施例可以基于人工智能技术对相关的服务器中数据进行获取和处理。其中,人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。
人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、机器人技术、生物识别技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
该方法实现了交互过程的数据分析及用户标签提取更加高效,而且分析得到的结果能作为下一轮对话的参考数据。
本申请实施例还提供一种基于人工智能的对话交互数据处理装置,该基于人工智能的对话交互数据处理装置用于执行前述基于人工智能的对话交互数据处理方法的任一实施例。具体地,请参阅图3,图3是本申请实施例提供的基于人工智能的对话交互数据处理装置100的示意性框图。
其中,如图3所示,基于人工智能的对话交互数据处理装置100包括登录信息获取单元101、当前推送问题集获取单元102、更新标签集获取单元103和用户标签集更新单元104。
登录信息获取单元101,用于若检测到用户成功登录指令时,获取与所述用户成功登录指令的用户账户信息,并获取当前日期特征信息;其中,所述当前日期特征信息包括节日特征和当日新闻资讯特征。
在本实施例中,是以服务器为执行主体来描述技术方案。在服务器中部署有智能客服机器人,其可以自动向用户端推送筛选后的问题集和新闻资讯数据,并基于用户端发送的回答数据集和新闻资讯数据点击反馈数据更新用户标签及用户积分数据,不断动态调整用户标签,更加精准的进行下一次的数据推送。
具体是当用户使用具体为智能手机、平板电脑、笔记本电脑等形式的用户端启动应用程序并登录用户账号(登录用户账号成功即可触发用户成功登录指令)与服务器建立通讯连接后,在用户端的界面上显示智能客服机器人的交互界面,这样可以由智能客服机器人向用户端推送信息,也可以是用户端向智能客服机器人发送待咨询问题或是其他交互信息。在相互交互的过程中,智能客服机器人可以基于用户的回答数据进一步分析提取用户标签以更新用户画像,用户也可以向智能客服机器人获取所需要的信息。
其中,当用户使用用户端启动应用程序并登录用户账号后,服务器是先获取与所述用户成功登录指令的用户账户信息,其中用户账户信息包括用户基本信息(如用户昵称、性别、年龄、用户兴趣爱好等信息)、用户登录历史、用户登录历史IP地址信息等信息。而且服务器还获取当前日期特征信息,例如若当前日期对应某一节假日则当前日期特征信息的节日特征为该节假日名称,若当前日期对应一个或多个热点新闻资讯则当前日期特征信息的当日新闻资讯特征为上述一个或多个热点新闻资讯的新闻资讯关键词。
在一实施例中,基于人工智能的对话交互数据处理装置100还包括:
信息类型获取单元,用于若检测到用户端所发送的交互信息,获取所述交互信息及所述交互信息对应的信息类型;
交互识别数据获取单元,用于获取所述信息类型对应的识别模型,根据所述识别模型对所述交互信息进行识别,得到交互识别数据;
语音类型获取单元,用于获取所述交互信息对应的用户年龄区间,根据所述用户年龄区间确定待回复消息语音类型;
答复数据获取单元,用于根据所述交互识别数据的语义向量在本地知识库中获取对应的答复数据;
回复语音数据生成单元,用于将所述答复数据根据所述待回复消息语音类型生成对应的回复语音数据;
回复语音数据发送单元,用于将所述回复语音数据发送至所述用户端。
在本实施例中,当用户使用用户端与服务器中的智能客服机器人建立通讯后,可以向其发送交互信息,所发送的交互信息可以是文本类型、语音类型、图片类型等,为了更快的提取交互信息中的文本信息,需要先确定交互信息的信息类型,具体如文本类型、语音类型、图片类型等。
此时若确定所述交互信息的信息类型是文本类型,先获取文本识别模型(如Transformer模型等),然后基于文本识别模型获取所述交互信息对应的文本识别信息,以作为交互识别数据。若确定所述交互信息的信息类型是图片类型,先获取图像识别模型(如卷积神经网络模型等),然后基于图像识别模型获取所述交互信息对应的图像文本识别信息,以作为交互识别数据。若确定所述交互信息的信息类型是语音类型,先获取语音识别类型(如N-gram模型也即多元模型等),然后基于语音识别模型获取所述交互信息对应的语音文本识别模型,以作为交互识别数据。在获取了交互识别数据后,可以进一步获取
由于对所述交互信息的来源端也即用户端进行用户识别时能获取到用户账户信息,故可基于用户端的用户账户信息获取到用户年龄区间。在确定了用户年龄区间后(如将男性0-20岁划分至男性少年阶段,将男性20-40岁划分至男性青年阶段,将男性40-60岁划分至男性中年阶段,将男性60岁以上划分至男性老年阶段等,女性也可以参考男性划分为四个阶段),可以获取与用户年龄区间对应的待回复消息语音类型,例如用户年龄区间为20-40岁阶段则对应第一待回复消息语音类型(如第一待回复消息语音类型为青年女性声音类型)。可见,基于每一用户年龄区间对应确定一种待回复语音消息类型,便于后续基于以该待回复语音消息类型为声音参数将回复数据合成对应的回复语音数据,增加了回复语音数据类型的多样性。
之后,一般交互信息是用户的提问数据,为了更快的获取该提问数据的回复答案,此时可以先获取所述交交互识别数据的语义向量,然后在本地知识库中获取与所述语义向量具有最大向量相似度值的回复语义向量作为目标语义向量,最后获取目标语义向量对应的原始文本数据作为答复数据。可见,基于语义相似度匹配的方式,可以快速准确的获取到所述交互识别数据对应的回复数据。
最后,在获取了回复数据对应的文本之后,可以将待回复语音消息类型作为声音参数将所述回复数据合成对应的回复语音数据,将所述回复语音数据发送至用户端即可完成此轮用户与智能客服机器人的交互过程。而且,在交互的过程中还能获取到用户年龄区间和确定待回复语音消息类型,为下一轮用户交互积累到了用户基础数据。其中,需要注意的是所获取到的用户各种数据均是在获得用户授权的前提下合法获取得到。
在一实施例中,作为基于交互信息获取用户年龄区间的具体实施例,所述获取所述交互信息对应的用户年龄区间,包括:
若确定所述交互信息是语音类型数据,获取所述交互信息对应的梅尔频率倒谱系数特征;
将所述梅尔频率倒谱系数特征输入至预先训练的语音年龄区间分类模型,得到用户年龄区间。
在本实施例中,可以将所述交互信息依次进行分帧处理、用周期图(periodogram)法来进行功率谱(power spectrum)估计、对功率谱用梅尔滤波器组进行滤波,计算每个滤波器里的能量、对每个滤波器的能量取log、进行DCT变换(即离散余弦变换)、保留DCT的第2-13个系数额处理后,得到所述交互信息对应的梅尔频率倒谱系数特征。
具体的,对所述交互信息进行分帧处理时,第一步是划分成20-40ms(最佳是25ms)的帧,且从每一帧抽取12个特征,得到分帧数据。第二步是对分帧数据中每帧数据进行DCT变换,得到DCT变换结果。第三步是对DCT变换结果用周期图法来进行功率谱估计,得到估计功率谱。第四步是对估计功率谱由26个长度为257的向量组(即三角滤波器组)进行滤波,得到滤波后信号。第五步是将滤波后信号取log,得到对数运算结果。第六步是将对数运算结果进行离散余弦变换,得到26个倒谱系数。第七步是保留26个倒谱系数中第2-13这12个倒谱系数,组成MFCC特征(即梅尔频率倒谱系数特征)。
在获取了所述交互信息对应的梅尔频率倒谱系数特征,可以获取服务器本地存储的语音年龄区间分类模型,如SVM(即支持向量机)、GMM(即高斯混合模型)等,将所述梅尔频率倒谱系数特征输入至预先训练的语音年龄区间分类模型进行分类,得到用户年龄区间。可见,这一方式基于交互信息可以准确获取到用户年龄区间。
当前推送问题集获取单元102,用于根据所述用户账户信息和所述当前日期特征信息获取当前用户标签集,根据所述当前用户标签集获取当前推送问题集,将所述当前推送问题集发送至与所述用户成功登录指令对应的用户端。
在本实施例中,当服务器获取到了所述用户账户信息和所述当前日期特征信息后,可以基于用户账户信息中提取到的用户初始用户标签集和所述当前日期特征信息中的节日特征和当日新闻资讯特征共同融合得到当前用户标签集。然后基于当前用户标签集在服务器中部署的问题库中筛选出与所述当前用户标签集相应的当前推送问题集,并将当前推送问题集发送至用户端。
在一实施例中,所述根据所述用户账户信息和所述当前日期特征信息获取当前用户标签集,包括:
获取所述用户账户信息的用户兴趣爱好关键词和用户基本信息,根据预设用户标签转化策略将所述用户兴趣爱好关键词和所述用户基本信息转换为对应的用户标签,以组成当前用户初始标签集。
在本实施例中,用户账户信息中的用户兴趣爱好关键词一般是用户在初始注册时根据自身兴趣爱好所选定的关键词,上述关键词基于预设用户标签转化策略转化得到的标签组成了第一类型初始用户标签集。且用户基本信息也是用户根据自身实际情况填写(如年龄、性别、学历等),这些基本信息基于预设用户标签转化策略得到的标签组成了第二类型初始用户标签集。将第一类型初始用户标签集与第二类型初始用户标签集组合,即可得到当前用户初始标签集。最后将所述当前日期特征信息对应的日期标签融入至所述当前用户初始标签集,即可得到当前用户标签集。可见,这一方式是通过用户兴趣爱好关键词、用户基本信息和当前日期特征信息进行多维度用户标签获取,能获取更多维度标签的用户标签集,刻画的用户形象更加准确。
在一实施例中,所述根据所述当前用户标签集获取当前推送问题集,包括:
获取所述当前用户标签集中每一用户标签分别在本地问题库中对应的推送问题,组成当前推送问题集。
在本实施例中,当获取到了所述当前用户标签集后,可以基于其中的每一个用户标签获取各自在在本地问题库中对应的推送问题。例如具体以其中获取一个用户标签对应的推送问题为例,首先是获取该用户标签对应的标签分类(如是金融类标签、或是投资类标签、或是运动类标签等),然后获取该标签分类对应的高热度题目(如该标签分类下题目热度值最高的问题是可视为高热度题目),最后将该标签分类对应的高热度题目作为该用户标签的推送问题。参照上述方式也可以获取到所述当前用户标签集中其他用户标签对应的推送问题,当得到了所述当前用户标签集中每一用户标签对应的推送问题后,即可组成当前推送问题集并发送至用户端。可见,通过上述方式,可以基于用户标签快速的获取推送问题集。
更新标签集获取单元103,用于若接收到与所述当前推送问题集对应的回答数据集,根据所述回答数据集获取所述当前用户标签集对应的更新用户标签集,并根据所述回答数据集获取更新用户积分数据。
在本实施例中,当用户端接收到所述当前推送问题集后,对每一推送问题可以具体回答。例如每一推送问题都是勾选“是”或“否”的问答题,用户可以操作用户端对每一推送问题分别答复后,得到每一推送问题的回答数据。当在用户端中针对所述当前推送问题集进行答复后,得到了对应的回答数据集。服务器接收到了用户端发送的回答数据集后,可以对回答数据集进行数据分析,判断每一回答数据是否能进一步转换为新用户标签,当完成了对各回答数据是否转换为新用户标签的判定后,即可得到所述当前用户标签集对应的更新用户标签集。
而且还能基于所述回答数据集中每一回答数据确定用户积分,例如可以设置用户上述答复题目中完成答复具有确定答案(如上述举例的是或否)的回答数据总个数,以每一确定答案对应积一分的转换策略,得到所述回答数据集获取更新用户积分数据。可见,在用户完成了与智能客服机器人的信息交互后,用户标签数据和积分数据得到了及时更新,能作为下一次推送问题的数据基础。
在一实施例中,所述根据所述回答数据集获取所述当前用户标签集对应的更新用户标签集,包括:
获取所述回答数据集中第i个回答数据;其中,i的初始值为1且i的取值范围是[1,N],N为所述回答数据集中回答数据的总个数;
若确定第i个回答数据为非空值,获取第i个回答数据对应的第i个当前推送问题;
获取第i个当前推送问题对应的第i个初始用户标签;
若确定第i个回答数据为肯定词性,将第i个初始用户标签作为第i个回答数据对应的第i个更新用户标签;
若确定第i个回答数据为否定词性,根据预设的用户正义反义标签列表获取第i个初始用户标签的第i个反义用户标签,将第i个反义用户标签作为第i个回答数据对应的第i个更新用户标签;
将i增1以更新i的取值;
若确定i未超出N,返回执行所述获取所述回答数据集中第i个回答数据的步骤;
若确定i超出N,获取第1个更新用户标签至第N个更新用户标签,组成更新用户标签集。
在本实施例中,以第i个回答数据为例来更新用户标签,具体是先判断该回答数据是否为空值,若确定第i个回答数据是空值表示用户未回答第i个当前推送问题,第i个回答数据对用户标签更新无任何影响。
若确定第i个回答数据不是空值表示用户回答了第i个当前推送问题,第i个回答数据对用户标签更新有影响,具体是判断用户是肯定性回答还是否定性回答。当确定第i个回答数据为肯定词性,则第i个当前推送问题对应的第i个初始用户标签不做任何调整,将第i个初始用户标签作为第i个回答数据对应的第i个更新用户标签即可。当确定第i个回答数据为否定词性,则第i个当前推送问题对应的第i个初始用户标签需做调整,将第i个初始用户标签对应的第i个反义用户标签作为第i个回答数据对应的第i个更新用户标签即可。可见,基于用户的实时回答不断的更新用户标签,使得作为下一次问题推送参考数据的用户标签集得到及时更新,能更为客观和准确的推送问题集。
在一实施例中,所述若确定第i个回答数据为肯定词性,将第i个初始用户标签作为第i个回答数据对应的第i个更新用户标签之前,或所述若确定第i个回答数据为否定词性,根据预设的用户正义反义标签列表获取第i个初始用户标签的第i个反义用户标签,将第i个反义用户标签作为第i个回答数据对应的第i个更新用户标签之前,还包括:
将第i个回答数据基于预先存储的肯定词词典和否定词词典确定第i个回答数据的回答数据词性;其中,所述回答数据词性为肯定词性或否定词性。
在本实施例中,由于第i个回答数据的词性会影响其对应的更新标签,故需要判断第i个回答数据的词性。具体是在服务器中可以预先存储两个词典,具体是肯定词词典和否定词词典,然后将第i个回答数据的关键词与肯定词词典和否定词词典中每一个词进行比较,找到与第i个回答数据的关键词最相近的词语并确定其是属于肯定词词典或是否定词词典,从而最终确定第i个回答数据的回答数据词性。
用户标签集更新单元104,用于根据所述更新用户标签集对所述当前用户标签集进行更新以得到更新后用户标签集,并将所述更新用户积分数据增加至所述用户账户信息以更新所述用户账户信息。
在本实施例中,当获取了所述更新用户标签集后,将所述更新用户标签集中包括的各标签增加至所述当前用户标签集后,去掉重复的用户标签即可得到更新后用户标签集。其中所述更新后用户标签集是在本轮答题后立即更新得到的最新版本的用户标签集,可作为下一轮答题开始时的用户标签集。
同时,还需将所述更新用户积分数据增加至所述用户账户信息,例如之前用户账户信息对应的用户累计积分数据是Score1,此时所述更新用户积分数是Score2,将Score2+Score1的求和结果来更新所述用户账户信息中的用户累计积分数据。可见,通过不断推送问题集并答复,即可实现用户标签和用户积分的及时更新。
具体实施时,还能基于用户答复数据获取到用户在指定领域的风险等级(如理财风险承受能力等指标)。更具体是基于更新后用户标签集中与财务相关的标签来组合确定用户在理财领域的风险承受等级。
该装置实现了交互过程的数据分析及用户标签提取更加高效,而且分析得到的结果能作为下一轮对话的参考数据。
上述基于人工智能的对话交互数据处理装置可以实现为计算机程序的形式,该计算机程序可以在如图4所示的计算机设备上运行。
请参阅图4,图4是本申请实施例提供的计算机设备的示意性框图。该计算机设备500是服务器,也可以是服务器集群。服务器可以是独立的服务器,也可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(Content Delivery Network,CDN)、以及大数据和人工智能平台等基础云计算服务的云服务器。
参阅图4,该计算机设备500包括通过装置总线501连接的处理器502、存储器和网络接口505,其中,存储器可以包括存储介质503和内存储器504。
该存储介质503可存储操作系统5031和计算机程序5032。该计算机程序5032被执行时,可使得处理器502执行基于人工智能的对话交互数据处理方法。
该处理器502用于提供计算和控制能力,支撑整个计算机设备500的运行。
该内存储器504为存储介质503中的计算机程序5032的运行提供环境,该计算机程序5032被处理器502执行时,可使得处理器502执行基于人工智能的对话交互数据处理方法。
该网络接口505用于进行网络通信,如提供数据信息的传输等。本领域技术人员可以理解,图4中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备500的限定,具体的计算机设备500可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
其中,所述处理器502用于运行存储在存储器中的计算机程序5032,以实现本申请实施例公开的基于人工智能的对话交互数据处理方法。
本领域技术人员可以理解,图4中示出的计算机设备的实施例并不构成对计算机设备具体构成的限定,在其他实施例中,计算机设备可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。例如,在一些实施例中,计算机设备可以仅包括存储器及处理器,在这样的实施例中,存储器及处理器的结构及功能与图4所示实施例一致,在此不再赘述。
应当理解,在本申请实施例中,处理器502可以是中央处理单元(CentralProcessing Unit,CPU),该处理器502还可以是其他通用处理器、数字信号处理器(DigitalSignal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。其中,通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
在本申请的另一实施例中提供计算机可读存储介质。该计算机可读存储介质可以为非易失性的计算机可读存储介质,也可以为易失性的计算机可读存储介质。该计算机可读存储介质存储有计算机程序,其中计算机程序被处理器执行时实现本申请实施例公开的基于人工智能的对话交互数据处理方法。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的设备、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
在本申请所提供的几个实施例中,应该理解到,所揭露的设备、装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为逻辑功能划分,实际实现时可以有另外的划分方式,也可以将具有相同功能的单元集合成一个单元,例如多个单元或组件可以结合或者可以集成到另一个装置,或一些特征可以忽略,或不执行。另外,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口、装置或单元的间接耦合或通信连接,也可以是电的,机械的或其它的形式连接。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本申请实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以是两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分,或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,后台服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。

Claims (10)

1.一种基于人工智能的对话交互数据处理方法,其特征在于,包括:
若检测到用户成功登录指令时,获取与所述用户成功登录指令的用户账户信息,并获取当前日期特征信息;其中,所述当前日期特征信息包括节日特征和当日新闻资讯特征;
根据所述用户账户信息和所述当前日期特征信息获取当前用户标签集,基于所述当前用户标签集获取当前推送问题集,将所述当前推送问题集发送至与所述用户成功登录指令对应的用户端;
若接收到与所述当前推送问题集对应的回答数据集,根据所述回答数据集获取所述当前用户标签集对应的更新用户标签集,并根据所述回答数据集获取更新用户积分数据;以及
根据所述更新用户标签集对所述当前用户标签集进行更新以得到更新后用户标签集,并将所述更新用户积分数据增加至所述用户账户信息以更新所述用户账户信息。
2.根据权利要求1所述的基于人工智能的对话交互数据处理方法,其特征在于,所述若检测到用户成功登录指令时,获取与所述用户成功登录指令的用户账户信息,并获取当前日期特征信息之前,还包括:
若检测到用户端所发送的交互信息,获取所述交互信息及所述交互信息对应的信息类型;
获取所述信息类型对应的识别模型,根据所述识别模型对所述交互信息进行识别,得到交互识别数据;
获取所述交互信息对应的用户年龄区间,根据所述用户年龄区间确定待回复消息语音类型;
根据所述交互识别数据的语义向量在本地知识库中获取对应的答复数据;
将所述答复数据根据所述待回复消息语音类型生成对应的回复语音数据;
将所述回复语音数据发送至所述用户端。
3.根据权利要求2所述的基于人工智能的对话交互数据处理方法,其特征在于,所述获取所述交互信息对应的用户年龄区间,包括:
若确定所述交互信息是语音类型数据,获取所述交互信息对应的梅尔频率倒谱系数特征;
将所述梅尔频率倒谱系数特征输入至预先训练的语音年龄区间分类模型,得到用户年龄区间。
4.根据权利要求1所述的基于人工智能的对话交互数据处理方法,其特征在于,所述根据所述用户账户信息和所述当前日期特征信息获取当前用户标签集,包括:
获取所述用户账户信息的用户兴趣爱好关键词和用户基本信息,根据预设用户标签转化策略将所述用户兴趣爱好关键词和所述用户基本信息转换为对应的用户标签,以组成当前用户初始标签集。
5.根据权利要求1所述的基于人工智能的对话交互数据处理方法,其特征在于,所述基于所述当前用户标签集获取当前推送问题集,包括:
获取所述当前用户标签集中每一用户标签分别在本地问题库中对应的推送问题,组成当前推送问题集。
6.根据权利要求1所述的基于人工智能的对话交互数据处理方法,其特征在于,所述根据所述回答数据集获取所述当前用户标签集对应的更新用户标签集,包括:
获取所述回答数据集中第i个回答数据;其中,i的初始值为1且i的取值范围是[1,N],N为所述回答数据集中回答数据的总个数;
若确定第i个回答数据为非空值,获取第i个回答数据对应的第i个当前推送问题;
获取第i个当前推送问题对应的第i个初始用户标签;
若确定第i个回答数据为肯定词性,将第i个初始用户标签作为第i个回答数据对应的第i个更新用户标签;
若确定第i个回答数据为否定词性,根据预设的用户正义反义标签列表获取第i个初始用户标签的第i个反义用户标签,将第i个反义用户标签作为第i个回答数据对应的第i个更新用户标签;
将i增1以更新i的取值;
若确定i未超出N,返回执行所述获取所述回答数据集中第i个回答数据的步骤;
若确定i超出N,获取第1个更新用户标签至第N个更新用户标签,组成更新用户标签集。
7.根据权利要求6所述的基于人工智能的对话交互数据处理方法,其特征在于,所述若确定第i个回答数据为肯定词性,将第i个初始用户标签作为第i个回答数据对应的第i个更新用户标签之前,或所述若确定第i个回答数据为否定词性,根据预设的用户正义反义标签列表获取第i个初始用户标签的第i个反义用户标签,将第i个反义用户标签作为第i个回答数据对应的第i个更新用户标签之前,还包括:
将第i个回答数据基于预先存储的肯定词词典和否定词词典确定第i个回答数据的回答数据词性;其中,所述回答数据词性为肯定词性或否定词性。
8.一种基于人工智能的对话交互数据处理装置,其特征在于,包括:
登录信息获取单元,用于若检测到用户成功登录指令时,获取与所述用户成功登录指令的用户账户信息,并获取当前日期特征信息;其中,所述当前日期特征信息包括节日特征和当日新闻资讯特征;
当前推送问题集获取单元,用于根据所述用户账户信息和所述当前日期特征信息获取当前用户标签集,基于所述当前用户标签集获取当前推送问题集,将所述当前推送问题集发送至与所述用户成功登录指令对应的用户端;
更新标签集获取单元,用于若接收到与所述当前推送问题集对应的回答数据集,根据所述回答数据集获取所述当前用户标签集对应的更新用户标签集,并根据所述回答数据集获取更新用户积分数据;以及
用户标签集更新单元,用于根据所述更新用户标签集对所述当前用户标签集进行更新以得到更新后用户标签集,并将所述更新用户积分数据增加至所述用户账户信息以更新所述用户账户信息。
9.一种计算机设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至7中任一项所述的基于人工智能的对话交互数据处理方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序当被处理器执行时使所述处理器执行如权利要求1至7任一项所述的基于人工智能的对话交互数据处理方法。
CN202210614849.2A 2022-05-31 2022-05-31 基于人工智能的对话交互数据处理方法、装置及设备 Pending CN114969295A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210614849.2A CN114969295A (zh) 2022-05-31 2022-05-31 基于人工智能的对话交互数据处理方法、装置及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210614849.2A CN114969295A (zh) 2022-05-31 2022-05-31 基于人工智能的对话交互数据处理方法、装置及设备

Publications (1)

Publication Number Publication Date
CN114969295A true CN114969295A (zh) 2022-08-30

Family

ID=82959063

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210614849.2A Pending CN114969295A (zh) 2022-05-31 2022-05-31 基于人工智能的对话交互数据处理方法、装置及设备

Country Status (1)

Country Link
CN (1) CN114969295A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115187431A (zh) * 2022-09-15 2022-10-14 广州天辰信息科技有限公司 一种基于大数据的养老服务机器人系统

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115187431A (zh) * 2022-09-15 2022-10-14 广州天辰信息科技有限公司 一种基于大数据的养老服务机器人系统

Similar Documents

Publication Publication Date Title
US10832686B2 (en) Method and apparatus for pushing information
CN107886949B (zh) 一种内容推荐方法及装置
CN110377911B (zh) 对话框架下的意图识别方法和装置
CN111488433B (zh) 一种适用于银行的提升现场体验感的人工智能交互系统
US10771627B2 (en) Personalized support routing based on paralinguistic information
CN110046230B (zh) 生成推荐话术集合的方法、推荐话术的方法和装置
CN111259132A (zh) 话术推荐方法、装置、计算机设备和存储介质
CN110990685B (zh) 基于声纹的语音搜索方法、设备、存储介质及装置
CN108021934B (zh) 多要素识别的方法及装置
CN110634472B (zh) 一种语音识别方法、服务器及计算机可读存储介质
CN113314119B (zh) 语音识别智能家居控制方法及装置
KR102100214B1 (ko) 음성 인식 기반의 세일즈 대화 분석 방법 및 장치
US12002454B2 (en) Method and apparatus for intent recognition and intent prediction based upon user interaction and behavior
CN111191450A (zh) 语料清洗方法、语料录入设备及计算机可读存储介质
CN114120516B (zh) 一种营业厅叫号顺序优化方法
CN111429157A (zh) 投诉工单的评价处理方法、装置、设备及存储介质
CN111858854A (zh) 一种基于历史对话信息的问答匹配方法及相关装置
CN110457454A (zh) 一种对话方法、服务器、对话系统及存储介质
CN111402864A (zh) 语音处理方法及电子设备
CN114969295A (zh) 基于人工智能的对话交互数据处理方法、装置及设备
CN112115248B (zh) 一种从对话语料中抽取对话策略结构的方法及系统
CN107562788B (zh) 交互方法、装置及计算机可读存储介质
CN116580704A (zh) 语音识别模型的训练方法、语音识别方法、设备及介质
CN110765242A (zh) 一种客服信息的提供方法,装置及系统
CN113836273A (zh) 基于复杂语境的法律咨询方法及相关设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination