CN111460113A - 一种数据交互方法及相关设备 - Google Patents

一种数据交互方法及相关设备 Download PDF

Info

Publication number
CN111460113A
CN111460113A CN202010161138.5A CN202010161138A CN111460113A CN 111460113 A CN111460113 A CN 111460113A CN 202010161138 A CN202010161138 A CN 202010161138A CN 111460113 A CN111460113 A CN 111460113A
Authority
CN
China
Prior art keywords
question
group
message
user
interaction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010161138.5A
Other languages
English (en)
Inventor
谢先武
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Life Insurance Company of China Ltd
Original Assignee
Ping An Life Insurance Company of China Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Life Insurance Company of China Ltd filed Critical Ping An Life Insurance Company of China Ltd
Priority to CN202010161138.5A priority Critical patent/CN111460113A/zh
Publication of CN111460113A publication Critical patent/CN111460113A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • G06F16/355Class or cluster creation or modification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/01Customer relationship services

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Mathematical Physics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Human Computer Interaction (AREA)
  • Artificial Intelligence (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Finance (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明实施例适用于运维领域中的业务过程优化,公开了一种数据交互方法及相关设备,所述方法包括:接收第一用户的第一提问问题,对第一提问问题的问题文本进行分词处理,得到至少一个问题分词,确定至少一个问题分词的分词编码矩阵;将至少一个问题分词的分词编码矩阵输入特征提取网络,输出问题特征矩阵;根据问题特征矩阵,确定至少一个第二提问问题的问题相似度;确定出第一提问问题匹配的目标互动群组;向第一用户发送群组邀请消息,在接收到第一用户响应所述群组邀请消息返回的群组添加确认消息的情况下,将第一用户加入所述目标互动群组。通过本发明可以将第一用户加入匹配度高的目标互动群组,进而提高第一提问问题的解答效率。

Description

一种数据交互方法及相关设备
技术领域
本申请涉及数据交互技术领域,尤其涉及一种数据交互方法及相关设备。
背景技术
随着互联网的发展,越来越多的业务可以实现线上开展,线上业务节约了业务开展方的经营成本,包括人力成本,场所成本等,提升了业务开展的效率,但同时,由于用户在开展业务时不能与业务开展方进行面对面沟通,使得用户在对业务有疑问时,业务开展方不能及时地解答用户的疑问,导致业务开展进度缓慢。目前为解决这一问题的在线客服,通常是以一对一的形式与用户进行交流,用户在有疑问时向业务系统申请在线客服,业务系统随机为用户分配在线客服,而业务系统随机分配的在线客服有时并不能准确地解答用户的疑问,这种随机分配的方式导致客服和用户疑问的匹配度低,直接影响用户疑问的解答效率。
发明内容
本申请提供一种数据交互方法及相关设备,本申请中根据第一提问问题和各个第二提问问题的问题相似度,确定第一提问问题匹配的目标互动群组,进而将第一提问问题对应的第一用户加入匹配度较高的目标互动群组,通过匹配度较高的目标互动群组中的群组成员解答第一提问问题,提高了第一提问问题的解答效率。
本发明实施例第一方面提供了一种数据交互方法,包括:
接收第一用户的第一提问问题,对所述第一提问问题的问题文本进行分词处理,得到所述第一提问问题的至少一个问题分词,对所述至少一个问题分词中的每个分词分别进行编码,得到所述至少一个问题分词的分词编码矩阵;
将所述至少一个问题分词的分词编码矩阵输入特征提取网络,输出对所述第一提问问题进行特征提取得到的问题特征矩阵;
根据所述问题特征矩阵,确定所述第一提问问题与至少一个第二提问问题的问题相似度,所述第二提问问题为具有已建立的互动解答群组的提问问题;
根据所述第一提问问题与各个所述第二提问问题的问题相似度,从所述第二提问问题各自对应的互动解答群组中,确定出所述第一提问问题匹配的目标互动群组;
向所述第一用户发送针对所述目标互动群组的群组邀请消息,在接收到所述第一用户响应所述群组邀请消息返回的群组添加确认消息的情况下,将所述第一用户加入所述目标互动群组,以使所述目标互动群组中的群组成员通过所述目标互动群组解答所述第一提问问题。
结合第一方面,在第二种可能的实现方式中,所述根据所述第一提问问题与各个所述第二提问问题的问题相似度,从所述第二提问问题各自对应的互动解答群组中,确定出所述第一提问问题匹配的目标互动群组包括:
获取各个所述第二提问问题的问题解答完善度;
将预设的问题相似度权重分别和各个所述第二提问问题对应的问题相似度相乘,得到各个所述第二提问问题的第一乘积;
将预设的完善度权重分别和各个所述第二提问问题的问题解答完善度相乘,得到各个所述第二提问问题的第二乘积;
将各个所述第二提问问题的所述第一乘积分别与各自的所述第二乘积对应相减,将所述第一群组匹配指数最高的第二提问问题对应的互动解答群组,确定为所述目标互动群组。
结合第一方面,在第二种可能的实现方式中,所述根据所述第一提问问题与各个所述第二提问问题的问题相似度,从所述第二提问问题各自对应的互动解答群组中,确定出所述第一提问问题匹配的目标互动群组包括:
获取各个所述第二提问问题的提问用户的用户特征信息,获取所述第一用户的用户特征信息;
根据各个所述第二提问问题的提问用户的用户特征信息以及所述第一用户的用户特征信息,确定各个所述第二提问问题的提问用户与所述第一用户的用户特征相似度;
将预设的问题相似度权重分别和各个所述第二提问问题对应的问题相似度相乘,得到各个所述第二提问问题的第三乘积;
将预设的用户特征相似度权重分别和各个所述第二提问问题的提问用户对应的用户特征相似度相乘,得到各个所述第二提问问题的第四乘积;
将各个所述第二提问问题的所述第三乘积分别与各自的所述第四乘积对应相加,将相加得到的和确定为各个所述第二提问问题相对于所述第一提问问题的第二群组匹配指数;
将所述第二群组匹配指数最高的第二提问问题对应的互动解答群组,确定为所述目标互动群组。
结合第一方面,在第三种可能的实现方式中,所述将所述第一用户加入所述目标互动群组之后,还包括:
接收所述目标互动群组中任一群组成员针对所述第一提问问题发送的群组互动消息;
确定所述目标互动群组中各个群组成员的成员状态,所述成员状态为离线状态或在线状态中的一种;
将所述群组互动消息推送至各个处于在线状态的群组成员对应的消息队列,并根据所述目标互动群组中所述各个群组成员的成员状态,确定所述各个群组成员的末次阅读消息标识,所述末次阅读消息标识用于确定所述目标互动群组的群组成员的未读群组消息。
结合第一方面的第三种可能的实现方式,在第四种可能的实现方式中,所述根据所述目标互动群组中所述各个群组成员的成员状态,确定所述各个群组成员的末次阅读消息标识包括:
将所述群组互动消息对应的消息标识,标记为对应处于在线状态的群组成员的末次阅读消息标识;
在所述群组互动消息为所述目标互动群组建立后的首条群组互动消息的情况下,将各个处于离线状态的群组成员的末次阅读消息标识设置为空;
在所述群组互动消息不为所述目标互动群组建立后的首条群组互动消息的情况下,若所述群组互动消息为处于离线状态第一离线用户加入所述目标互动群组后,接收到的首条群组互动消息,则将所述第一离线用户的末次阅读消息标识设置为空。
结合第一方面的第三种可能的实现方式,在第五种可能的实现方式,所述接收所述目标互动群组中任一群组成员针对所述第一提问问题发送的群组互动消息之后,还包括:
在list结构数据缓存中第一key对应的value队列的尾部插入第一value,所述第一key的取值为所述第一提问问题的问题标识,所述第一value的取值为所述群组互动消息的消息文本;
在zset结构数据缓存中所述第一key对应的value-score对集合中插入由第二value和第一score组成的value-score对,其中,所述第二value的取值为所述群组互动消息对应的消息标识,所述第一score的取值为接收到所述群组互动消息的时间对应的时间戳。
结合第一方面的第五种可能的实现方式,在第六种可能的实现方式中,所述方法还包括:
接收第一成员针对所述目标互动群组的未读消息获取请求,所述第一成员为所述目标互动群组中的任一群组成员;
获取所述第一成员的末次阅读消息标识;
在所述第一成员的末次阅读消息标识为空的情况下,获取所述第一成员加入所述目标互动群组之前,所述目标互动群组的末次互动消息标识,将所述末次互动消息标识确定为所述第一成员的未读消息偏移标识;在所述第一成员的末次阅读消息标识不为空的情况下,将所述第一成员的末次阅读消息标识确定为所述第一成员的未读消息偏移标识;
将所述zset结构数据缓存中所述第一key对应的value-score对集合中所有的value-score对,按照score的取值从小到大的顺序进行排序,确定取值为所述第一成员的未读消息偏移标识的value所在的value-score对的排序数目;
根据所述zset结构数据缓存中所述第一key对应的value-score对集合中所有value-score对的数量,以及所述排序数目,确定为所述第一成员的未读消息数量;
将所述list结构数据缓存中所述第一key对应的value队列中位置最靠近队列尾部的所述未读消息数量的value的取值,作为所述第一成员的未读群组消息返回给所述第一成员。
本发明实施例第二方面提供了一种数据交互装置,包括:
问题接收模块,用于接收第一用户的第一提问问题,对所述第一提问问题的问题文本进行分词处理,得到所述第一提问问题的至少一个问题分词,对所述至少一个问题分词中的每个分词分别进行编码,得到所述至少一个问题分词的分词编码矩阵;
特征提取模块,用于将所述至少一个问题分词的分词编码矩阵输入特征提取网络,输出对所述第一提问问题进行特征提取得到的问题特征矩阵;
相似度确定模块,用于根据所述问题特征矩阵,确定所述第一提问问题与至少一个第二提问问题的问题相似度,所述第二提问问题为具有已建立的互动解答群组的提问问题;
群组匹配模块,用于根据所述第一提问问题与各个所述第二提问问题的问题相似度,从所述第二提问问题各自对应的互动解答群组中,确定出所述第一提问问题匹配的目标互动群组;
群组添加模块,用于向所述第一用户发送针对所述目标互动群组的群组邀请消息,在接收到所述第一用户响应所述群组邀请消息返回的群组添加确认消息的情况下,将所述第一用户加入所述目标互动群组,以使所述目标互动群组中的群组成员通过所述目标互动群组解答所述第一提问问题。
本发明实施例第三方面提供了一种数据装置,包括:处理器和存储器;
所述处理器与存储器相连,其中,所述存储器用于存储程序代码,所述处理器用于调用所述程序代码,以执行本发明实施例中上述任一方面中的方法。
本发明实施例第四方面提供了一种计算机存储介质,所述计算机存储介质存储有计算机程序,所述计算机程序当被处理器执行时使所述处理器执行上述任一方面中的方法。
本发明实施例中,接收第一用户的第一提问问题后,对第一提问问题的问题文本进行分词处理,得到第一提问问题的至少一个问题分词,分别对所述至少一个问题分词进行编码,得到所述至少一个问题分词的分词编码矩阵,将所述至少一个问题分词的分词编码矩阵输入特征提取网络,输出对第一提问问题进行特征提取得到的问题特征矩阵,根据问题特征矩阵,确定第一问题与具有已建立了互动解答群组的第二提问问题的问题相似度,根据各个第二提问问题的问题相似度,从第二提问问题各自对应的互动解答群组中,确定第一提问问题匹配的目标互动群组,向第一用户发送针对目标互动群组的群组邀请信息,在接收到第一用户响应群组邀请消息返回的群组确认消息的情况下,将第一用户加入所述目标互动群组,以使目标互动群组中的群组成员通过目标互动群组解答所述第一提问问题。通过根据第一提问问题与第二提问问题的问题相似度,将与第一用户添加进匹配的目标互动群组。根据第一提问问题和各个第二提问问题的问题相似度,确定第一提问问题匹配的目标互动群组,进而将第一提问问题对应的第一用户加入匹配度较高的目标互动群组,通过匹配度较高的目标互动群组中的群组成员解答第一提问问题,提高了第一提问问题的解答效率。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种数据交互网络架构的示意图;
图2为本发明实施例提供的一种数据交互方法的流程示意图;
图3为本发明实施例提供的一种分词注意力特征矩阵确定方式的示例图;
图4为本发明实施例提供的一种待解决问题界面的展示示意图;
图5为本发明实施例提供的另一种数据交互方法的流程示意图;
图6为本发明实施例提供的一种数据缓存示意图;
图7为本发明实施例提供的一种数据交互装置的结构示意图;
图8为本发明实施例提供的另一种数据交互装置的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
参见图1,图1为本发明实施例提供的一种数据交互网络架构的示意图,如图所示,所述数据交互网络架构可以至少包括数据交互装置001和用户终端集群002,数据交互装置001可以为服务器,服务器中可以运营任意种类的业务,如金融业务、医疗业务、网购业务等等,用户终端集群002中可以包括多个用户终端,图1中示例性地示出了用户终端a、用户终端b和用户终端c,用户终端a用户终端b和用户终端c可以安装有数据交互装置001所运营业务的应用程序,并且可以与数据交互装置001之间建立网络连接,用户可以通过用户终端a、用户终端b或用户终端c以及各自建立的网络连接,执行数据交互装置001相关的业务操作。
接下来介绍本发明实施例中数据交互方法的应用场景,本发明实施例的数据交互方法可以应用在投保人对保险理赔进度等进行咨询时,客服通过线上互动的方法向投保人答疑的过程中,可以应用在患者咨询医生时,医生通过线上的沟通的方法为患者诊疗的过程中,还可以应用在消费者对商品规格等商品信息进行询问时,商家通过线上展示或介绍的方法向用户推荐商品的过程。需要指出的是,以上仅为本发明实施例示例性的应用场景,并非本发明实施例全部的应用场景。
请参见图2,图2为本发明实施例提供的一种数据交互方法的流程示意图,如图所示,所述方法可以包括以下步骤:
S201,接收第一用户的第一提问问题,对所述第一提问问题的问题文本进行分词处理,得到所述第一提问问题的至少一个问题分词,对所述至少一个问题分词中的每个分词分别进行编码,得到所述至少一个问题分词的分词编码矩阵。
具体的,接收第一提问问题的方式可以是通过文本形式接收,也可以通过语音形式接收,若第一提问问题通过文本形式接收,可以直接对第一提问问题的问题文本进行分词处理,若第一提问问题通过语音形式接收,可以对第一提问问题进行语音识别,识别得到第一提问问题的问题文本后,进行分词处理。
其中,对第一提问问题的问题文本进行分词处理的方式有多种,如基于字符串匹配的分词方法、基于n元语法的分词方法、基于隐马尔科夫模型的分词方法、基于条件随机场的分词方法等。
在对第一提问问题的问题文本进行分词后,得到第一提问问题的至少一个问题分词,进而对第一提问问题的至少一个问题分词进行编码,得到至少一个问题分词的分词编码矩阵,这里,对至少一个问题分词进行编码的过程可以首先分别对第一提问问题的至少一个问题分词进行语义嵌入和位置嵌入,得到各个问题分词的原始语义矩阵和原始位置矩阵,然后对各个问题分词的原始语义矩阵和原始位置矩阵进行融合,得到各个问题分词的分词编码矩阵。
这里,对问题分词进行语义嵌入的方式可以包含基于频率的语义嵌入方式和基于预测的语义嵌入方式。基于频率的语义嵌入方式包括Count Vector(计数向量)嵌入方式、TF-IDF Vector(Term Frequncy-Inverse Document Frequency Vector,词汇频率-逆文档频率向量)嵌入方式和Co-Occurence Vector(共现向量)嵌入方式,上述三种方式都是基于独热(one-hot)编码,以频率为主旨的加权改进方法。基于预测的语义嵌入方式包括CBOW(Continues Bag Of Words,连续词袋)。
其中,CBOW是可以根据某一个问题分词的上下文,对该问题分词进行预测的神经网络模型。CBOW的训练模型可以包括输入层、隐藏层和输出层,在训练过程中,将样本预测分词的上下文分词的独热编码分别输入各自在输入层对应的神经元,将输入层的输出输入隐藏层,将输入层的输出压缩至目标维度(目标维度即为训练完成后,通过CBOW得到的原始语义矩阵的维度),将隐藏层的输出输入输出层,将隐藏层的输出解码得到预测样本分词的解码形式,通过样本预测分词的解码形式与样本预测分词的独热编码,对CBOW的训练模型的网络参数进行调节,通过将不同的样本预测分词输入CBOW的训练模型,对CBOW的训练模型的多次调节,使得CBOW的训练模型输出的样本预测分词的解码形式与样本预测分词的独热编码之间的误差小于预设误差阈值的情况下,训练完成,即可将第一提问问题的至少一个问题分词输入CBOW,CBOW的隐藏层的输出,即为对应问题分词的原始语义矩阵。
对问题分词进行位置嵌入的方式,可以将问题分词在第一提问问题的问题文本中不同的位置索引映射成各自对应的预设维度的矩阵标识,得到各个问题分词的原始位置矩阵。可选的,原始位置矩阵的预设维度设置为与原始语义矩阵维度相同的维度。一种具体的实现方式中,原始位置矩阵和原始语义矩阵都为向量形式,原始位置矩阵和原始语义矩阵实际上对应原始位置向量和原始语义向量,可以通过以下公式得到对每个问题分词的原始位置向量:
Figure BDA0002405778790000081
其中,dpos是原始位置向量的预设维度,i是原始位置向量的维度索引因子,i是正整数,通过i取不同的整数,得到不同原始位置向量中不同维度的维度索引,p是问题分词在第一提问问题的问题文本中的位置索引,PE2i(p)表示原始位置向量中偶数的维度索引对应的值,PE2i+1(p)表示原始位置向量中奇数的维度索引对应的值。例如,若原始位置向量的预设维度为3,即dpos=3,第一提问问题的问题文本为“链接是什么”,则问题分词“链接”对应的原始位置向量确定方式为:令p=1,分别求得当i=0时,PE1(p=1)=cos1≈0.9998,当i=1时,PE2(p=1)=sin(1/100002/3)≈0.9696,PE3(p=1)=cos(1/100002/3)≈-0.2446,得到序列文字对应的原始位置向量为[0.998,0.9696,-0.2446],进而可以分别令p=2,p=3得到问题分词“是”、“什么”各自的原始位置向量。
将各个问题分词的原始语义矩阵和原始位置矩阵确定之后,可以将问题分词各自的原始语义矩阵和原始位置矩阵进行前后拼接,得到的新的矩阵即为各个问题分词对应的分词编码矩阵。可选的,在原始位置矩阵的预设维度与原始语义矩阵相同时,还可以将每个问题分词的原始语义矩阵与原始位置矩阵相加后得到各个序列文字的分词编码矩阵。
S202,将所述至少一个问题分词的分词编码矩阵输入特征提取网络,输出对所述第一提问问题进行特征提取得到的问题特征矩阵。
这里,可以根据第一提问问题的多个问题分词的分词编码矩阵,分别对多个问题分词进行特征提取,得到各个问题分词的分词注意力特征矩阵,进而将各个问题分词的分词编码矩阵的分词注意力特征矩阵的平均值,确定为第一提问问题的问题特征矩阵。其中,对多个问题分词进行特征提取的特征提取网络可以是基于CNN(Convolutional NeuralNetworks,卷积神经网络)的特征提取网络、基于RNN(Recurrent Neural Network,循环神经网络)的特征提取网络或是基于Transformer(转换器)的特征提取网络。基于Transformer的特征提取网络融合了自注意力(self-attention)机制和残差(residuals)机制,通过自注意力机制兼顾了问题分词和问题分词之间的关联,通过残差机制,使模型具有较快的训练速度,这里详细介绍基于Transformer的特征提取网络对第一提问问题中问题分词进行的特征提取。
基于Transformer的特征提取网络中引入了查询因子(query)矩阵、键因子(key)矩阵和值因子(value)矩阵,通过对各个问题分词上述三种因子矩阵进行相关运算得到的点乘相似度,衡量问题分词之间的关联重要程度。对问题分词进行特征提取的过程,以对第一提问问题中的第一问题分词进行特征提取的过程为例进行介绍:根据各个问题分词的分词编码矩阵与预设的查询因子标准化权重,确定各个问题分词查询因子矩阵;根据各个问题分词的分词编码矩阵与预设的键因子标准化权重,确定各个问题分词的键因子矩阵;根据各个问题分词的分词编码矩阵与预设的值因子标准化权重,确定各个问题分子的值因子矩阵;分别确定各个问题分词的查询因子矩阵与第一问题分词的键因子矩阵之间的相关性,得到各个问题文本关于第一序列文字的相关性权重;将各个问题分词关于第一问题分词的相关性权重,与各自的值因此矩阵相乘后的和,确定为第一问题分词的分词注意力特征矩阵。
参见图3,图3为本发明实施例提供的一种分词注意力特征矩阵确定方式的示例图,如图所示,所述第一提问问题的问题文本为“头痛是什么原因”,对应的问题分词包括四个,分别为“头痛”、“是”、“什么”、“原因”,对上述四个问题分词进行编码后,得到分词编码矩阵一次为X1、X2、X3和X4,然后,将X1分别与训练好的查询因子标准化权重、键因子标准化权重和值因子标准化权重分别相乘,得到“头痛”对应的查询因子矩阵,(query矩阵)、键因子矩阵(key矩阵)和值因子矩阵(value矩阵):Q1、K1和V1,按照同样的方式,确定“是”的query矩阵、key矩阵和value矩阵:Q2、K2和V2,“什么”的query矩阵、key矩阵和value矩阵:Q3、K3和V3、“原因”的query矩阵、key矩阵和value矩阵:Q4、K4和V4。进而生成针对“头痛”的分词注意力特征矩阵:将“头痛”的query矩阵分别与“头痛”、“是”、“什么”、“原因”各自的key矩阵相乘,得到“头痛”、“是”、“什么”、“原因”各自的注意力得分S1、S2、S3和S4,上述注意力得分也就是“头痛”、“是”、“什么”、“原因”各自关于“头痛”的相关性权重,用于进一步与“头痛”、“是”、“什么”、“原因”各自的value矩阵加权求和得到“头痛”对应的分词注意力特征矩阵。为了避免各个矩阵相乘后的结果数值过大,图3对应的实施例中对注意力得分进行归一化处理,得到“头痛”、“是”、“什么”、“原因”各自的归一化注意力得分S1’、S2’、S3’和S4’,进而分别将S1’、S2’、S3’和S4’与“头痛”、“是”、“什么”、“原因”各自的value矩阵加权求和,得到“头痛”对应的分词注意力特征矩阵。按照同样的方式可以得到“是”、“什么”、“原因”的分词注意力特征矩阵Z2、Z3和Z4。
S203,根据所述问题特征矩阵,确定所述第一提问问题与至少一个第二提问问题的问题相似度,所述第二提问问题为具有已建立的互动解答群组的提问问题。
具体的,在步骤S203之前,执行本实施例的数据交互方法的系统接收到至少一个第二提问问题,可以针对第二提问问题建立互动解答群组,以通过建立的互动解答群组中的群组成员对相应的第二提问问题进行解答,其中,第二提问问题的互动解答群组中的成员是与第二提问问题的业务匹配度较高的成员。一种实现方式中,针对第二提问问题建立互动解答群组的方式,可以是业务人员,根据业务经验选取问题解答人员,与第二提问问题的提问用户共同构建第二提问问题的互动解答群组。另一种实现方式中,也可以是在接收到第二提问问题之后,执行本实施例的数据交互方法的系统自动针对第二提问问题自动选取问题解答人员,建立互动解答群组。
其中,自动为第二提问问题建立互动解答群组的方式可以为:对第二提问问题的问题文本进行分词,通过特征提取网络(如CNN网络、RNN网络或Transformer网络等,可以与对第一提问问题进行特征提取的特征提取网络相同,也可以不同)对分词后的第二提问问题的问题文本进行特征提取,得到第二提问问题的特征矩阵;进而将第二提问问题的特征矩阵输入文本分类网络(如softmax网络),得到第二提问问题对应的至少一个业务类别;然后根据第二提问问题对应的至少一个业务类型,从针对至少一个业务类别预设的多个互动成员中,针对第二提问问题确定出多个第一目标互动成员;从而将第二提问问题的提问用户以及针对第二提问问题确定出的多个第一目标互动成员添加进第二提问问题对应的互动解答群组。
其中,第二提问问题对应的业务类别可以有多个,例如,在患者对医生进行线上咨询时,仅仅描述了头痛的病症,但由于头痛对应的原因有多种,不同的原因可能对应不同的科室,比如神经科或心脑血管科,文本分类网络可能得到第二提问问题针对这两个科室的业务类别的概率较为接近,因此可以将这神经科和心脑血管科都作为第二提问问题的业务类别。后续从这两个科室对应的医生中选取医生加入互动解答群组,从这两个科室的角度,以及二者的结合角度对患者进行诊断。
从针对至少一个业务类别预设的多个互动成员中确定第一目标互动成员的过程中,可以根据上述至少一个业务类别预设的多个互动成员的待解答问题数量进行确定,可以将每个业务类别下待解答问题数量最少的预设数量的互动成员,确定为第一目标互动成员。
可选的,建立第二提问问题对应的互动解答群组过程中,得到第二提问问题对应的至少一个业务类别之后,还可以从针对至少一个业务类别预设的多个互动成员中,确定出第二提问问题对应的多个候选互动成员,获取多个候选互动成员的成员资质信息,在待解决问题界面展示第二提问问题的问题文本和多个候选互动成员的成员资质信息;接收针对第二提问问题的群组构建请求,群组构建请求中携带有第二目标互动成员的标识信息,第二目标互动成员为群组构建请求的发送用户从多个候选互动成员中选取的构建互动群组的互动成员,群组构建请求的发送用户为第二提问问题的提问用户,或为第二提问问题对应的候选互动成员;根据第二目标互动成员的标识信息,构建第二提问问题的互动解答群组,互动解答群组的群组成员包括第二提问问题的提问用户以及第二目标互动成员。
参见图4,图4为本发明实施例提供的一种待解决问题界面的展示示意图,图4所示的示意图中,“A业务的业务流程是什么?”为第二提问问题用户1、用户2、用户3和用户4为多个候选互动成员,用户可以通过点击“建立群组”的图标,展示第二提问问题的多个候选互动成员的成员资质信息,在点击确认图标后,即发送了群组构建请求,图4中点击确认图标后,发送的群组构建请求中携带的第二目标互动成员的标识信息为用户1和用户4的标识信息,进而系统构建包含第二提问问题的提问用户、用户1和用户4的互动解答群组。
这一过程中可以将候选互动成员的成员资质信息展示出来,可以由第二提问问题的提问用户根据成员资质信息选取感兴趣的候选互动成员进行建群,也可以由候选互动成员根据成员资质信息,选取需要一同进行互动沟通以解决第二提问问题的候选互动成员进行建群。
若上述过程中同时接收到多个群组构建请求时,可以判断多个群组构建请求中是否包含第二提问问题的提问用户发送的群组构建请求;若包含,则将第二提问问题的提问用户发送的群组构建请求确定为目标群组构建请求;若不包含,则获取多个群组构建请求的发送用户的优先级别,将优先级别最高的发送用户所发送的群组构建请求确定为目标群组构建请求;根据目标群组构建请求中携带的目标互动成员的标识信息,构建第二提问问题的互动解答群组。
本步骤中根据第一提问问题的问题特征矩阵,确定第一提问问题与至少一个第二提问问题的问题相似度,首先可以参阅步骤S201和步骤S202中确定第一提问问题的问题特征矩阵的过程,实现对第二提问问题的特征矩阵的确定,进而确定第一提问问题与第二提问问题的问题相似度。问题相似度可以根据第一提问问题的问题特征矩阵和第二提问问题的特征矩阵,确定在上述矩阵对应的空间中,第一提问问题与第二提问问题之间的距离,通过该距离反映问题相似度。上述距离可以是二者之间的欧式距离、曼哈顿距离、切比雪夫距离、闽可夫斯基距离、马氏距离、余弦夹角距离等等。若在针对第二提问问题构建互动解答群组的过程中采用的分词方式以及特征提取网络,与步骤S201和S202中采用的分词方式以及特征提取网络相同,可以直接采用在针对第二提问问题构建互动解答群组的过程中得到的第二提问问题的特征矩阵,确定第一提问问题与第二提问问题之间的距离。
S204,根据所述第一提问问题与各个所述第二提问问题的问题相似度,从所述第二提问问题各自对应的互动解答群组中,确定出所述第一提问问题匹配的目标互动群组。
这里,可以直接将问题相似度最高的第二提问问题的互动解答群组,确定为第一提问问题匹配的目标互动群组。
一种可选的方式中,可以获取各个第二提问问题的问题解答完善度,将预设的问题相似度权重分别和各个第二提问问题对应的问题相似度相乘,得到各个第二提问问题的第一乘积;将预设的完善度权重分别和各个第二提问问题的问题解答完善度相乘,得到各个第二提问问题的第二乘积;将各个第二提问问题的第一乘积分别与各自的第二乘积对应相减,将相减得到的差值确定为第二提问问题相对于所述第一提问问题的第一群组匹配指数,从而将第一群组匹配指数最高的第二提问问题对应的互动解答群组,确定为目标互动群组。
这里,第二提问问题的问题解答完善度可以由第二提问问题的提问用户设置,也可以根据第二提问问题的互动解答群组的建立时长确定,还可以根据第二提问问题的互动解答群组建立后产生的群组消息数量确定。若问题解答完善度由第二提问问题的提问用户设置,可以周期性地(如目标互动群组建立后每5min为一个周期,或每10min为一个周期)向第二提问问题的提问用户的目标互动群组的界面展示问题解答进度的询问界面,将用户输入的问题解答进度确定为第二提问问题的问题解答完善度。若问题解答完善度根据第二提问问题的互动解答群组的建立时长确定,可以根据第二提问问题的互动解答群组的建立时长,与第二提问问题同一业务类别的提问问题所对应的平均问题解决时长的比值,确定为第二提问问题的问题解答完善度。若问题解答完善度根据第二提问问题的互动解答群组建立后产生的群组消息数量确定,可以根据第二提问问题的互动解答群组建立后产生的群组消息数量,与第二提问问题同一业务类别的提问问题被解决后所对应产生的全部互动消息数量的比值,确定为第二提问问题的问题解答完善度。
另一种可选的方式中,可以获取各个第二提问问题的提问用户的用户特征信息,获取第一用户的用户特征信息,根据各个第二提问问题的提问用户的用户特征信息以及第一用户的用户特征信息,确定各个第二提问问题的提问用户与第一用户的用户特征相似度,将预设的问题相似度权重分别和各个第二提问问题对应的问题相似度相乘,得到各个第二提问问题的第三乘积;将预设的用户特征相似度权重分别和各个第二提问问题的提问用户对应的用户特征相似度相乘,得到各个第二提问问题的第四乘积;将各个第二提问问题的第三乘积分别与各自的第四乘积对应相加,将相加得到的和确定为各个第二提问问题相对于第一提问问题的第二群组匹配指数,将第二群组匹配指数最高的第二提问问题对应的互动解答群组,确定为目标互动群组。
这里,可以预设多个不同的特征标签,在获取第二提问问题的提问用户以及第一用户的用户特征信息时,根据预设的特征标签获取对应的用户特征信息。例如,在患者向医生进行线上咨询诊病的场景中,预设的特征标签可以有第一用户(即患者)的年龄、性别、是否有遗传病史(以及遗传病史的种类)等标签;在消费者对商品规格等商品信息进行询问的场景中,预设的特征标签可以有第一用户(即消费者)的年龄、穿衣偏好、职业等标签;在用户对保险理赔进度等进行咨询时,预设的特征标签可以有第一用户(即投保人)的投保种类、投保金额等标签。
针对不同的特征标签,将特征标签对应的特征预先划分为不同种类的特征信息,例如,针对性别这一特征标签,划分为男和女两个种类的性别特征信息,针对年龄这一特征标签,划分为0~3岁、3岁~8岁、8岁~16岁、16岁~25岁、25岁~45岁、45岁以上这六个种类的年龄特征信息,针对是否有遗传病史(以及遗传病史的种类)这一特征标签,可以划分为无遗传病史、单基因遗传病史、多基因遗传病史和染色体病史四个种类的遗传病特征信息,等等。此外,针对不同的特征标签,根据特征标签下的特征信息对第一提问问题以及第二提问问题所在的业务类别的影响程度,为不同的特征标签设置不同的标签权重,进而确定第一用户和第二提问问题的提问用户在同一特征标签下的、属于同一种类的用户特征信息,将在同一特征标签下的、属于同一种类的用户特征信息所对应的特征标签的标签权重累加,得到第二提问问题的提问用户与第一用户的用户特征相似度。例如,在患者向医生进行线上咨询诊病的场景中,年龄、性别、是否有遗传病史(以及遗传病史的种类)这三个特征标签对应标签权重分别为0.3、0.1和0.6,第二提问问题的提问用户在年龄、性别、是否有遗传病史(以及遗传病史的种类)这三个特征标签下的用户特征信息分别为27、女、无遗传病史,第一用户在年龄、性别、是否有遗传病史(以及遗传病史的种类)这三个特征标签下的用户特征信息分别为82、女、无遗传病史,则第二提问问题的提问用户与第一用户的用户特征相似度为0.1+0.6=0.7。
又一种可选的方式中,可以将各个第二提问问题的第二群组匹配指数,分别减去各自的第二乘积(第二提问问题的第二乘积为预设的完善度权重与第二提问问题的问题解答完善度的乘积),将得到的差值,确定为各个所述第二提问问题相对于第一提问问题的第三群组匹配指数,将第三群组匹配指数最高的第二提问问题对应的互动解答群组,确定为目标互动群组。
S205,向所述第一用户发送针对所述目标互动群组的群组邀请消息,在接收到所述第一用户响应所述群组邀请消息返回的群组添加确认消息的情况下,将所述第一用户加入所述目标互动群组,以使所述目标互动群组中的群组成员通过所述目标互动群组解答所述第一提问问题。
具体的,可以向第一用户发送加入目标互动群组的群组邀请消息,可选的,群组邀请消息中可以携带目标互动群组对应的第二提问问题,还可以携带目标互动群组中第二提问问题的问题解答完善度,以使第一用户根据群组邀请消息决定是否加入目标互动群组。
本发明实施例中,接收第一用户的第一提问问题后,对第一提问问题的问题文本进行分词处理,得到第一提问问题的至少一个问题分词,分别对所述至少一个问题分词进行编码,得到所述至少一个问题分词的分词编码矩阵,将所述至少一个问题分词的分词编码矩阵输入特征提取网络,输出对第一提问问题进行特征提取得到的问题特征矩阵,根据问题特征矩阵,确定第一问题与具有已建立了互动解答群组的第二提问问题的问题相似度,根据各个第二提问问题的问题相似度,从第二提问问题各自对应的互动解答群组中,确定第一提问问题匹配的目标互动群组,向第一用户发送针对目标互动群组的群组邀请信息,在接收到第一用户响应群组邀请消息返回的群组确认消息的情况下,将第一用户加入所述目标互动群组,以使目标互动群组中的群组成员通过目标互动群组解答所述第一提问问题。通过根据第一提问问题与第二提问问题的问题相似度,将与第一用户添加进匹配的目标互动群组。根据第一提问问题和各个第二提问问题的问题相似度,确定第一提问问题匹配的目标互动群组,进而将第一提问问题对应的第一用户加入匹配度较高的目标互动群组,通过匹配度较高的目标互动群组中的群组成员解答第一提问问题,提高了第一提问问题的解答效率。
一方面针对第一用户来说,可以同时向目标互动群组中的群组成员提问第一提问问题,避免了在需要向多个解答人员提问时反复对问题进行描述,另一方面,针对解答人员来说,作为目标互动群组中群组成员的解答人员可以针对近似的第一提问问题和目标互动群组各个所述第二提问问题同时进行解答,避免了解答人员对近似问题的重复解答。从而基于上述两方面,本发明实施例提高了针对第一用户的第一提问问题的解答效率,并且节约了目标互动群组中群组成员解答问题的人力资源和时间资源。
参见图5,图5为本发明实施例提供的另一种数据交互方法的流程示意图,如图所示,所述方法可以包括以下步骤:
S501,接收第一用户的第一提问问题,对所述第一提问问题的问题文本进行分词处理,得到所述第一提问问题的至少一个问题分词,对所述至少一个问题分词中的每个分词分别进行编码,得到所述至少一个问题分词的分词编码矩阵。
S502,将所述至少一个问题分词的分词编码矩阵输入特征提取网络,输出对所述第一提问问题进行特征提取得到的问题特征矩阵。
S503,根据所述问题特征矩阵,确定所述第一提问问题与至少一个第二提问问题的问题相似度,所述第二提问问题为具有已建立的互动解答群组的提问问题。
S504,根据所述第一提问问题与各个所述第二提问问题的问题相似度,从所述第二提问问题各自对应的互动解答群组中,确定出所述第一提问问题匹配的目标互动群组。
S505,向所述第一用户发送针对所述目标互动群组的群组邀请消息,在接收到所述第一用户响应所述群组邀请消息返回的群组添加确认消息的情况下,将所述第一用户加入所述目标互动群组。
步骤S501~步骤S505的实现步骤请参阅图2对应的实施例中步骤S201~步骤S205的实现过程,此处不再赘述。
S506,接收所述目标互动群组中任一群组成员针对所述第一提问问题发送的群组互动消息。
这里,将第一用户加入目标互动群组后,可以将第一提问问题的问题文本展示在目标互动群组的界面中,以使目标互动群组中的群组成员可以针对第一提问问题进行互动,并发送群组互动消息。群组互动消息可以包含互动消息文本以及发送群组互动消息的群组成员的标识。
在接收到群组互动消息之后,可以将群组互动消息进行存储,以在目标互动群组中当前处于离线状态的群组成员后续上线后请求群组互动消息时,获取存储的群组互动消息并发送给当前处于离线状态的群组成员。除存储之外,还将群组互动消息推送给处于在线状态的群组成员。其中,为了保证在大量用户同时访问时的数据读写效率,对群组互动消息进行的存储,可以是存储在执行本实施例提供的数据交互方法的数据交互装置的缓存,如redis(Remote Dictionary Server远程字典服务)数据缓存中。
在将群组互动消息存储在redis数据缓存中时,可以将群组互动消息基于list(队列)数据结构和zset(有序集合)数据结构存储在数据缓存中。本实施例中将list数据结构的数据缓存称为list结构数据缓存,将zset数据结构的数据缓存称为zset结构数据缓存。其中,在list结构数据缓存中,一个key对应一个value队列,list的key中存放提问问题的问题标识,key对应的value队列中存放提问问题对应的互动消息,value队列中存放的互动消息为按照接收到互动消息的先后顺序存放的,即接收时间最晚的互动消息存放在相应value队列的尾部。在zset结构数据缓存中,key、value和score一一对应,zset的key中存放提问问题的问题标识,value中存放提问问题的互动消息对应的消息标识,score中存放接收到相应的互动消息的时间对应的时间戳。一个提问问题通常可以对应多个互动消息,因此在zset结构数据缓存中可以有多个key的取值均为某一提问问题的问题标识,进而,取值为该提问问题的问题标识的key,各自对应的value-score对,构成了取值为该提问问题的问题标识的key对应的value-score对集合。
在具体的存储过程中,将list结构数据缓存中第一key对应的value队列的尾部插入第一value,其中第一key的取值为第一提问问题的问题标识,第一value的取值为接收到的群组互动消息文本;在zset结构数据缓存中,第一key对应的value-score对集合中插入由第二value和第一score组成的value-score对,其中,第二value的取值为群组互动消息对应的消息标识,第一score的取值为接收到群组互动消息的时间对应的时间戳。具体实现中,可以通过rpush函数将第一value插入第一key对应的value队列的尾部,例如,redis->rpush('a5314g','案件1101的处理进度是什么')实现将“案件1101的处理进度是什么”作为第一value,将“a5314g”作为第一key存储在list结构数据缓存中。通过zadd函数将第二value和第一score组成的value-score对,插入第一key对应的value-score对集合中,例如,通过redis->zadd('a5314g','1562725042','a5314g')实现将“a5314g”作为zset的key,将“1562725042”作为第一score,将“a5314g”作为第二value存储在zset结构数据缓存中。
S507,确定所述目标互动群组中各个群组成员的成员状态。
其中,所述成员状态为离线状态或在线状态中的一种,在线状态可以包括离开、忙碌、隐身等状态。在第一用户加入目标互动群组之后,可以针对第一用户以及目标互动群组中的其他群组成员维护各自的状态标签,用以标记各个群组成员的成员状态。
S508,将所述群组互动消息推送至各个处于在线状态的群组成员对应的消息队列,并根据所述目标互动群组中所述各个群组成员的成员状态,确定所述各个群组成员的末次阅读消息标识。
这里,各个处于在线状态的群组成员的用户终端与执行本实施例提供的数据交互方法的数据交互装置之间,存在各个用户终端对应的消息队列,执行本实施例提供的数据交互方法的数据交互装置为消息队列的消息生产者,相应的用户终端为消息队列的消息消费者。
针对各个群组成员维护对应的末次阅读消息标识,末次阅读消息标识用于在接收到目标互动群组中群组成员的未读消息获取请求后,确定目标互动群组的群组成员的未读群组消息。在将群组互动消息推送至处于在线状态的群组成员对应的消息队列后,确定各个群组成员的末次阅读消息标识。
具体确定各个群组成员的末次阅读消息标识的实现中,将群组互动消息推送给处于在线状态的群组成员的消息队列之后,将群组互动消息对应的消息标识,标记为对应处于在线状态的群组成员的末次阅读消息标识;针对处于离线状态的群组成员的末次阅读消息标识的维护中,首先判断群组互动消息是否是目标互动群组在建立之后的首条群组互动消息:若是,则将各个处于离线状态的群组成员的末次阅读消息标识设置为空,若否,则将针对各个处于离线状态的群组成员,判断群组互动消息是否是处于离线状态的群组成员加入目标互动群组后,接收到的首条群组互动消息:若群组互动消息时处于离线状态的第一离线用户加入目标互动群组后,接收到的首条群组互动消息,将第一离线用户的末次阅读消息标识设置为空,对其他的虽然处于离线状态,但群组互动消息不为其加入目标互动群组后接收到的收条群组互动消息的群组成员,则不对其末次阅读消息标识做任何处理。
S509,接收第一成员针对目标互动群组的未读消息获取请求。
其中,所述第一成员为目标互动群组中的任一群组成员。
S510,获取所述第一成员的末次阅读消息标识,并根据所述第一成员的末次阅读消息标识获取所述第一成员的未读群组消息返回给所述第一成员。
这里,在第一成员的末次阅读消息标识为空的情况下,表示第一成员在加入目标互动群组后未阅读任何互动消息,则可以将第一成员加入目标互动群组后,目标互动群组中产生的所有的互动消息推送给第一成员。在第一成员的末次阅读消息标识不为空的情况下,表示第一成员在加入目标互动群组后阅读过部分互动消息,可以将产生时间比第一用户最后一次阅读的互动消息的产生时间晚的互动消息推送给第一成员。
具体的,若第一成员的末次阅读消息标识为空,则获取系统在第一成员加入目标互动群组时,所标记的第一成员的加入所述目标互动群组之前,目标互动群组产生的最后一条互动消息的末次互动消息标识,将末次互动消息标识确定为第一成员的未读消息偏移标识;若第一成员的末次阅读消息标识不为空,则将第一成员的末次阅读消息标识确定为第一成员的未读消息偏移标识。将zset结构数据缓存中第一key对应的value-score对集合中所有的value-score对,按照score的取值从大到小的顺序进行排序,确定取值为第一成员的未读消息偏移标识的value所在的value-score对的排序数目。根据zset结构数据缓存中第一key对应的value-score对集合中所有value-score对的数量,与排序数目,确定为第一成员的未读消息数量。将list结构数据缓存中第一key对应的value队列中位置最靠近队列尾部的未读消息数量的value的取值,作为第一成员的未读群组消息返回给第一成员。
参阅图6,图6为本发明实施例提供的一种数据缓存示意图,如图所示,在list结构数据缓存中key中存储的为不同提问问题的问题标识,各个key对应的value队列中存储各个提问问题对应的互动消息的消息文本;在zset结构数据缓存中key中存储的为不同提问问题的问题标识,各个key对应的value中存储提问问题的互动消息的消息标识,各个key对应的score为提问问题的互动消息的接收时间对应的时间戳。
假设key1为第一提问问题的问题标识,若第一成员的末次阅读消息标识为空,获取到第一成员对应的末次互动消息标识为m3标识,则将m3标识确定为第一成员的未读消息偏移标识,进而在zset结构数据缓存中通过zrevrank key member函数,获取value为m3的value-score对,在key1对应的所有value-score对中的排序数目,具体函数形式为<zrevrank value m3>,返回值为2(从0开始排序,2表示排序第3)。进而zset中key1对应的value-score对集合中所有的value-score对的数量为10,由于m3对应的排序数目为2,即排序为3,则第一成员的未读消息数量为7。从而在list结构数据缓存中,可以通过irang keystart end函数,具体函数形式为<irange key1 2 9>,将list结构数据缓存中key1对应的value队列中最靠近尾部的7个value的取值,即m4~m10,作为未读群组消息返回给第一用户。若第一成员的末次阅读消息标识不为空,获取到第一成员的末次互动消息标识为m4,则将m4标识确定为第一成员的未读消息偏移标识,进而参照上述过程,获取m5~m10,作为未读群组消息返回给第一用户。这里,通过zrerang key start end函数可以将第一用户的全部未读群组消息获取并发送给第一用户,还可以对第一用户的未读群组消息进行分页获取并发送给第一用户,具体可以通过limit offset count函数实现,offset为获取第一用户未读群组消息的起始点,count为每一页获取的消息的数量,例如,<limit 2 10>可以在list中,从排序数目为2的value向后取10个value,并返回各个value的值,作为最早的第一页未读群组消息,进而通过<limit 12 10>获取第二页未读群组消息,直到获取所有的群组未读消息。
通过本发明实施例,在将第一用户加入目标互动群组之后,将目标互动群组的群组互动消息存储在list数据结构和zset数据结构的redis数据缓存中,可以实现在大量用户同时交互时,群组互动消息的快速写入和读取,保证了群组成员交互的效率。
参见图7,图7为本发明实施例提供的一种数据交互装置的结构示意图,如图所示,所述数据交互装置70包括:
问题接收模块701,用于接收第一用户的第一提问问题,对所述第一提问问题的问题文本进行分词处理,得到所述第一提问问题的至少一个问题分词,对所述至少一个问题分词中的每个分词分别进行编码,得到所述至少一个问题分词的分词编码矩阵;
特征提取模块702,用于将所述至少一个问题分词的分词编码矩阵输入特征提取网络,输出对所述第一提问问题进行特征提取得到的问题特征矩阵;
相似度确定模块703,用于根据所述问题特征矩阵,确定所述第一提问问题与至少一个第二提问问题的问题相似度,所述第二提问问题为具有已建立的互动解答群组的提问问题;
群组匹配模块704,用于根据所述第一提问问题与各个所述第二提问问题的问题相似度,从所述第二提问问题各自对应的互动解答群组中,确定出所述第一提问问题匹配的目标互动群组;
群组添加模块705,用于向所述第一用户发送针对所述目标互动群组的群组邀请消息,在接收到所述第一用户响应所述群组邀请消息返回的群组添加确认消息的情况下,将所述第一用户加入所述目标互动群组,以使所述目标互动群组中的群组成员通过所述目标互动群组解答所述第一提问问题。
具体实现中,所述数据交互装置70通过其内置的各个功能模块执行如图2和图5的数据交互方法中各个步骤,具体实施细节可参阅图2和图5对应的实施例中各个步骤的实现细节,此处不再赘述。
本发明实施例中,问题接收模块接收第一用户的第一提问问题后,对第一提问问题的问题文本进行分词处理,得到第一提问问题的至少一个问题分词,分别对所述至少一个问题分词进行编码,得到至少一个问题分词的分词编码矩阵,特征提取模块将至少一个问题分词的分词编码矩阵输入特征提取网络,输出对第一提问问题进行特征提取得到的问题特征矩阵,相似度确定模块根据问题特征矩阵,确定第一问题与具有已建立了互动解答群组的第二提问问题的问题相似度,群组匹配模块根据各个第二提问问题的问题相似度,从第二提问问题各自对应的互动解答群组中,确定第一提问问题匹配的目标互动群组,群组添加模块向第一用户发送针对目标互动群组的群组邀请信息,在接收到第一用户响应群组邀请消息返回的群组确认消息的情况下,将第一用户加入所述目标互动群组,以使目标互动群组中的群组成员通过目标互动群组解答所述第一提问问题。通过根据第一提问问题与第二提问问题的问题相似度,将与第一用户添加进匹配的目标互动群组。根据第一提问问题和各个第二提问问题的问题相似度,确定第一提问问题匹配的目标互动群组,进而将第一提问问题对应的第一用户加入匹配度较高的目标互动群组,通过匹配度较高的目标互动群组中的群组成员解答第一提问问题,提高了第一提问问题的解答效率。
一方面针对第一用户来说,可以同时向目标互动群组中的群组成员提问第一提问问题,避免了在需要向多个解答人员提问时反复对问题进行描述,另一方面,针对解答人员来说,作为目标互动群组中群组成员的解答人员可以针对近似的第一提问问题和目标互动群组各个所述第二提问问题同时进行解答,避免了解答人员对近似问题的重复解答。从而基于上述两方面,本发明实施例提高了针对第一用户的第一提问问题的解答效率,并且节约了目标互动群组中群组成员解答问题的人力资源和时间资源。
参见图8,图8为本发明实施例提供的另一种数据交互装置的结构示意图。如图8所示,所述数据交互装置80可以应用于上述图1对应实施例中的数据交互装置001,所述数据交互装置80可以包括:至少一个处理器801,例如CPU,至少一个网络接口804,用户接口803,存储器805,至少一个通信总线802。其中,通信总线802用于实现这些组件之间的连接通信。其中,用户接口803可以包括显示屏(Display)、键盘(Keyboard),可选用户接口803还可以包括标准的有线接口、无线接口。网络接口804可选地可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器805可以是高速RAM存储器,也可以是非不稳定的存储器(non-volatile memory),例如至少一个磁盘存储器。存储器805可选地还可以是至少一个位于远离前述处理器801的存储装置。如图8所示,作为一种计算机存储介质的存储器805中可以包括操作系统、网络通信模块、用户接口模块以及设备控制应用程序。
在图8所示的数据交互装置80中,网络接口804主要用于用户终端;而用户接口803主要用于为用户提供输入的接口;而处理器801可以用于调用存储器805中存储的设备控制应用程序,以实现:
接收第一用户的第一提问问题,对所述第一提问问题的问题文本进行分词处理,得到所述第一提问问题的至少一个问题分词,分别对所述至少一个问题分词进行编码,得到所述至少一个问题分词的分词编码矩阵;
将所述至少一个问题分词的分词编码矩阵输入特征提取网络,输出对所述第一提问问题进行特征提取得到的问题特征矩阵;
根据所述问题特征矩阵,确定所述第一提问问题与至少一个第二提问问题的问题相似度,所述第二提问问题为具有已建立的互动解答群组的提问问题;
根据所述第一提问问题与各个所述第二提问问题的问题相似度,从所述第二提问问题各自对应的互动解答群组中,确定出所述第一提问问题匹配的目标互动群组;
向所述第一用户发送针对所述目标互动群组的群组邀请消息,在接收到所述第一用户响应所述群组邀请消息返回的群组添加确认消息的情况下,将所述第一用户加入所述目标互动群组,以使所述目标互动群组中的群组成员通过所述目标互动群组解答所述第一提问问题。
应当理解,本发明实施例中所描述的数据交互装置80可执行前文图2和图5所对应实施例中对所述数据交互方法的描述,也可执行前文图7所对应实施例中对所述数据交互装置70的描述,在此不再赘述。另外,对采用相同方法的有益效果描述,也不再进行赘述。
此外,这里需要指出的是:本发明实施例还提供了一种计算机存储介质,且所述计算机存储介质中存储有前文提及的数据交互装置70所执行的计算机程序,且所述计算机程序包括程序指令,当所述处理器执行所述程序指令时,能够执行前文图2和图5所对应实施例中对所述数据交互方法的描述,因此,这里将不再进行赘述。另外,对采用相同方法的有益效果描述,也不再进行赘述。对于本发明所涉及的计算机存储介质实施例中未披露的技术细节,请参照本发明方法实施例的描述。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(Random AccessMemory,RAM)等。
以上所揭露的仅为本发明较佳实施例而已,当然不能以此来限定本发明之权利范围,因此依本发明权利要求所作的等同变化,仍属本发明所涵盖的范围。

Claims (10)

1.一种数据交互方法,其特征在于,包括:
接收第一用户的第一提问问题,对所述第一提问问题的问题文本进行分词处理,得到所述第一提问问题的至少一个问题分词,对所述至少一个问题分词中的每个分词分别进行编码,得到所述至少一个问题分词的分词编码矩阵;
将所述至少一个问题分词的分词编码矩阵输入特征提取网络,输出对所述第一提问问题进行特征提取得到的问题特征矩阵;
根据所述问题特征矩阵,确定所述第一提问问题与至少一个第二提问问题的问题相似度,所述第二提问问题为具有已建立的互动解答群组的提问问题;
根据所述第一提问问题与各个所述第二提问问题的问题相似度,从所述第二提问问题各自对应的互动解答群组中,确定出所述第一提问问题匹配的目标互动群组;
向所述第一用户发送针对所述目标互动群组的群组邀请消息,在接收到所述第一用户响应所述群组邀请消息返回的群组添加确认消息的情况下,将所述第一用户加入所述目标互动群组,以使所述目标互动群组中的群组成员通过所述目标互动群组解答所述第一提问问题。
2.根据权利要求1所述的方法,其特征在于,所述根据所述第一提问问题与各个所述第二提问问题的问题相似度,从所述第二提问问题各自对应的互动解答群组中,确定出所述第一提问问题匹配的目标互动群组包括:
获取各个所述第二提问问题的问题解答完善度;
将预设的问题相似度权重分别和各个所述第二提问问题对应的问题相似度相乘,得到各个所述第二提问问题的第一乘积;
将预设的完善度权重分别和各个所述第二提问问题的问题解答完善度相乘,得到各个所述第二提问问题的第二乘积;
将各个所述第二提问问题的所述第一乘积分别与各自的所述第二乘积对应相减,将相减得到的差值确定为所述第二提问问题相对于所述第一提问问题的第一群组匹配指数;
将所述第一群组匹配指数最高的第二提问问题对应的互动解答群组,确定为所述目标互动群组。
3.根据权利要求1所述的方法,其特征在于,所述根据所述第一提问问题与各个所述第二提问问题的问题相似度,从所述第二提问问题各自对应的互动解答群组中,确定出所述第一提问问题匹配的目标互动群组包括:
获取各个所述第二提问问题的提问用户的用户特征信息,获取所述第一用户的用户特征信息;
根据各个所述第二提问问题的提问用户的用户特征信息以及所述第一用户的用户特征信息,确定各个所述第二提问问题的提问用户与所述第一用户的用户特征相似度;
将预设的问题相似度权重分别和各个所述第二提问问题对应的问题相似度相乘,得到各个所述第二提问问题的第三乘积;
将预设的用户特征相似度权重分别和各个所述第二提问问题的提问用户对应的用户特征相似度相乘,得到各个所述第二提问问题的第四乘积;
将各个所述第二提问问题的所述第三乘积分别与各自的所述第四乘积对应相加,将相加得到的和确定为各个所述第二提问问题相对于所述第一提问问题的第二群组匹配指数;
将所述第二群组匹配指数最高的第二提问问题对应的互动解答群组,确定为所述目标互动群组。
4.根据权利要求1所述的方法,其特征在于,所述将所述第一用户加入所述目标互动群组之后,还包括:
接收所述目标互动群组中任一群组成员针对所述第一提问问题发送的群组互动消息;
确定所述目标互动群组中各个群组成员的成员状态,所述成员状态为离线状态或在线状态中的一种;
将所述群组互动消息推送至各个处于在线状态的群组成员对应的消息队列,并根据所述目标互动群组中所述各个群组成员的成员状态,确定所述各个群组成员的末次阅读消息标识,所述末次阅读消息标识用于确定所述目标互动群组的群组成员的未读群组消息。
5.根据权利要求4所述的方法,其特征在于,所述根据所述目标互动群组中所述各个群组成员的成员状态,确定所述各个群组成员的末次阅读消息标识包括:
将所述群组互动消息对应的消息标识,标记为对应处于在线状态的群组成员的末次阅读消息标识;
在所述群组互动消息为所述目标互动群组建立后的首条群组互动消息的情况下,将各个处于离线状态的群组成员的末次阅读消息标识设置为空;
在所述群组互动消息不为所述目标互动群组建立后的首条群组互动消息的情况下,若所述群组互动消息为处于离线状态第一离线用户加入所述目标互动群组后,接收到的首条群组互动消息,则将所述第一离线用户的末次阅读消息标识设置为空。
6.根据权利要求4所述的方法,其特征在于,所述接收所述目标互动群组中任一群组成员针对所述第一提问问题发送的群组互动消息之后,还包括:
在list结构数据缓存中第一key对应的value队列的尾部插入第一value,所述第一key的取值为所述第一提问问题的问题标识,所述第一value的取值为所述群组互动消息的消息文本;
在zset结构数据缓存中所述第一key对应的value-score对集合中插入由第二value和第一score组成的value-score对,其中,所述第二value的取值为所述群组互动消息对应的消息标识,所述第一score的取值为接收到所述群组互动消息的时间对应的时间戳。
7.根据权利要求6所述的方法,其特征在于,所述方法还包括:
接收第一成员针对所述目标互动群组的未读消息获取请求,所述第一成员为所述目标互动群组中的任一群组成员;
获取所述第一成员的末次阅读消息标识;
在所述第一成员的末次阅读消息标识为空的情况下,获取所述第一成员加入所述目标互动群组之前,所述目标互动群组的末次互动消息标识,将所述末次互动消息标识确定为所述第一成员的未读消息偏移标识;在所述第一成员的末次阅读消息标识不为空的情况下,将所述第一成员的末次阅读消息标识确定为所述第一成员的未读消息偏移标识;
将所述zset结构数据缓存中所述第一key对应的value-score对集合中所有的value-score对,按照score的取值从小到大的顺序进行排序,确定取值为所述第一成员的未读消息偏移标识的value所在的value-score对的排序数目;
根据所述zset结构数据缓存中所述第一key对应的value-score对集合中所有value-score对的数量,以及所述排序数目,确定为所述第一成员的未读消息数量;
将所述list结构数据缓存中所述第一key对应的value队列中位置最靠近队列尾部的所述未读消息数量的value的取值,作为所述第一成员的未读群组消息返回给所述第一成员。
8.一种数据交互装置,其特征在于,包括:
问题接收模块,用于接收第一用户的第一提问问题,对所述第一提问问题的问题文本进行分词处理,得到所述第一提问问题的至少一个问题分词,对所述至少一个问题分词中的每个分词分别进行编码,得到所述至少一个问题分词的分词编码矩阵;
特征提取模块,用于将所述至少一个问题分词的分词编码矩阵输入特征提取网络,输出对所述第一提问问题进行特征提取得到的问题特征矩阵;
相似度确定模块,用于根据所述问题特征矩阵,确定所述第一提问问题与至少一个第二提问问题的问题相似度,所述第二提问问题为具有已建立的互动解答群组的提问问题;
群组匹配模块,用于根据所述第一提问问题与各个所述第二提问问题的问题相似度,从所述第二提问问题各自对应的互动解答群组中,确定出所述第一提问问题匹配的目标互动群组;
群组添加模块,用于向所述第一用户发送针对所述目标互动群组的群组邀请消息,在接收到所述第一用户响应所述群组邀请消息返回的群组添加确认消息的情况下,将所述第一用户加入所述目标互动群组,以使所述目标互动群组中的群组成员通过所述目标互动群组解答所述第一提问问题。
9.一种数据交互装置,其特征在于,包括:处理器和存储器;
所述处理器与存储器相连,其中,所述存储器用于存储程序代码,所述处理器用于调用所述程序代码,以执行如权利要求1-7任一项所述的方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行以实现权利要求1至7任意一项所述的方法。
CN202010161138.5A 2020-03-10 2020-03-10 一种数据交互方法及相关设备 Pending CN111460113A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010161138.5A CN111460113A (zh) 2020-03-10 2020-03-10 一种数据交互方法及相关设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010161138.5A CN111460113A (zh) 2020-03-10 2020-03-10 一种数据交互方法及相关设备

Publications (1)

Publication Number Publication Date
CN111460113A true CN111460113A (zh) 2020-07-28

Family

ID=71681800

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010161138.5A Pending CN111460113A (zh) 2020-03-10 2020-03-10 一种数据交互方法及相关设备

Country Status (1)

Country Link
CN (1) CN111460113A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113300935A (zh) * 2020-09-15 2021-08-24 阿里巴巴集团控股有限公司 群组处理方法、终端设备、服务端设备及存储介质
CN113645123A (zh) * 2021-08-03 2021-11-12 福建天泉教育科技有限公司 一种消息存储方法及终端

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113300935A (zh) * 2020-09-15 2021-08-24 阿里巴巴集团控股有限公司 群组处理方法、终端设备、服务端设备及存储介质
CN113645123A (zh) * 2021-08-03 2021-11-12 福建天泉教育科技有限公司 一种消息存储方法及终端

Similar Documents

Publication Publication Date Title
CN112732911B (zh) 基于语义识别的话术推荐方法、装置、设备及存储介质
CN111680217B (zh) 内容推荐方法、装置、设备及存储介质
CN111159367B (zh) 一种信息处理方法及相关设备
WO2020192307A1 (zh) 基于深度学习的答案抽取方法、装置、计算机设备和存储介质
CN111460113A (zh) 一种数据交互方法及相关设备
CN111008335A (zh) 一种信息处理方法、装置、设备及存储介质
CN111241850B (zh) 提供业务模型的方法及装置
CN113011884A (zh) 账户特征的提取方法、装置、设备及可读存储介质
CN112906361A (zh) 文本数据的标注方法和装置、电子设备和存储介质
CN114358023B (zh) 智能问答召回方法、装置、计算机设备及存储介质
CN110399473B (zh) 为用户问题确定答案的方法和装置
CN115544560A (zh) 一种敏感信息的脱敏方法、装置、计算机设备及存储介质
CN113656699B (zh) 用户特征向量确定方法、相关设备及介质
CN114398866A (zh) 基于预测模型的文本匹配方法、装置、设备及存储介质
CN111340574B (zh) 风险用户的识别方法、装置和电子设备
CN116629423A (zh) 用户行为预测方法、装置、设备及存储介质
CN110442767B (zh) 一种确定内容互动平台标签的方法、装置及可读存储介质
CN114443824A (zh) 数据处理方法、装置、电子设备及计算机存储介质
CN114418609A (zh) 成交概率预估方法、存储介质及程序产品
CN113010664A (zh) 一种数据处理方法、装置及计算机设备
CN115329183A (zh) 数据处理方法、装置、存储介质及设备
CN112035613B (zh) 基于多轮对话的信息推送方法及装置、存储介质、电子装置
CN117633165B (zh) 一种智能ai客服对话引导方法
CN116911304B (zh) 一种文本推荐方法及装置
CN117252995B (zh) 智能名片的使用方法、智能销售系统及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination