CN110765328A - 一种数据处理的方法、装置及存储介质 - Google Patents

一种数据处理的方法、装置及存储介质 Download PDF

Info

Publication number
CN110765328A
CN110765328A CN201911025235.5A CN201911025235A CN110765328A CN 110765328 A CN110765328 A CN 110765328A CN 201911025235 A CN201911025235 A CN 201911025235A CN 110765328 A CN110765328 A CN 110765328A
Authority
CN
China
Prior art keywords
data information
service data
information
service
classification type
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201911025235.5A
Other languages
English (en)
Inventor
王斌
余志伟
许阳寅
陈露开
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201911025235.5A priority Critical patent/CN110765328A/zh
Publication of CN110765328A publication Critical patent/CN110765328A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/906Clustering; Classification

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请实施例公开了一种数据处理方法、装置及存储介质,所述方法包括:获取用户终端针对第一业务数据信息发送的业务辅助信息;所述第一业务数据信息的分类类型为第一分类类型;基于所述业务辅助信息、所述第一分类类型,在与业务数据库相关联的相似模型中获取与所述第一业务数据信息相关联的第一标签向量;基于所述第一标签向量从所述业务数据库中获取满足向量相似条件的第二业务数据信息;将具有所述第二分类类型的第二业务数据信息发送至所述用户终端,以使所述用户终端在与所述第一业务数据信息相关联的第二显示界面上显示所述第二业务数据信息。采用本申请实施例,可以丰富业务数据信息推荐的类型。

Description

一种数据处理的方法、装置及存储介质
技术领域
本申请涉及计算机技术领域,尤其涉及一种数据处理的方法、装置及存储介质。
背景技术
现有的业务数据信息推荐系统在向目标用户推荐业务数据信息时,可以根据目标用户已阅读过的业务数据信息为该目标用户推荐相似的同类型的其他业务数据信息。比如,当用户A点击阅读了一本书籍(例如,书籍A)时,可以为该用户推荐与书籍A相似的其他书籍(例如,书籍B);换言之,现有的业务数据信息推荐系统在向目标用户推荐业务数据信息时,是基于用户阅读过的业务数据信息的标签,从同一类型的业务数据集中搜索并推荐包含该标签的其他业务数据信息,以至于始终是在较小的范围内搜索到推荐数据,进而导致推荐数据的类型过于单一。
发明内容
本申请实施例提供一种数据处理方法、装置及存储介质,可以丰富推荐数据的类型。
本申请实施例一方面提供了一种数据处理方法,所述方法应用于业务服务器,包括:
获取用户终端针对第一业务数据信息发送的业务辅助信息;所述第一业务数据信息为所述用户终端响应针对第一显示界面触发的触发操作所确定的;所述第一业务数据信息的分类类型为第一分类类型;
基于所述业务辅助信息、所述第一分类类型,在与业务数据库相关联的相似模型中获取与所述第一业务数据信息相关联的第一标签向量;
基于所述第一标签向量从所述业务数据库中获取满足向量相似条件的第二业务数据信息;所述第二业务数据信息的分类类别为第二分类类型,且所述第二分类类型不同于所述第一分类类型;
将具有所述第二分类类型的第二业务数据信息发送至所述用户终端,以使所述用户终端在与所述第一业务数据信息相关联的第二显示界面上显示所述第二业务数据信息。
其中,所述获取用户终端针对第一业务数据信息发送的业务辅助信息,包括:
获取用户终端对应的目标用户的历史行为信息,基于所述历史行为信息从业务数据库中获取多个业务数据信息;
将所述多个业务数据信息构成的信息数据流返回给所述用户终端,以使所述用户终端在第一显示界面上显示所述信息数据流中的每个业务数据信息;
获取所述用户终端响应针对所述第一显示界面触发的触发操作所发送的目标推荐请求,从所述目标推荐请求中获取第一业务数据信息相关联的业务辅助信息;所述第一业务数据信息为所述多个业务数据信息中与所述触发操作对应的业务数据信息。
其中,所述获取用户终端对应的目标用户的历史行为信息,基于所述历史行为信息从业务数据库中获取多个业务数据信息,包括:
接收用户终端发送的首页加载请求;所述首页加载请求中携带所述用户终端的终端标识信息;
基于所述终端标识信息从历史行为数据库中获取所述用户终端对应的目标用户的历史行为信息;所述历史行为信息中包含历史电子读物以及所述历史电子读物的阅读进度;
基于所述历史电子读物以及所述历史电子读物的阅读进度,从业务数据库中获取多个业务数据信息。
其中,所述方法还包括:
获取业务数据库中的所有业务数据信息,确定每个业务数据信息所属的聚类簇;一个聚类簇对应一个分类类型;
从所述聚类簇对应的分类类型中获取目标分类类型,从与所述目标分类类型相关联的聚类簇中获取目标业务数据信息;
获取所述业务数据库相关联的词向量识别模型,基于所述目标业务数据信息、所述词向量识别模型,确定与所述目标业务数据信息相关联的标签向量;
将所述标签向量以及所述标签向量对应的分类类型,存储至与所述业务数据库相关联的相似模型。
其中,所述获取所述业务数据库相关联的词向量识别模型,基于所述目标业务数据信息、所述词向量识别模型,确定与所述目标业务数据信息相关联的标签向量,包括:
获取所述业务数据库相关联的词向量识别模型;
对所述目标业务数据信息进行分词处理,从分词处理后的M个分词中确定N个关键词,将所述N个关键词分别作为所述目标业务数据信息的标签信息;所述N为小于或者等于所述M的正整数;
基于N个标签信息分别对应的编码向量、所述词向量识别模型,得到每个标签信息对应的词向量;
获取每个标签信息对应的权重值,根据所述每个标签信息对应的权重值以及相应标签信息对应的词向量,确定所述目标业务数据信息对应的标签向量。
其中,所述基于N个标签信息分别对应的编码向量、所述词向量识别模型,得到每个标签信息对应的词向量;包括:
将N个标签信息中的每个标签信息转换为编码向量;每个编码向量均具备同一映射空间中的K个维度信息;所述K为大于或者等于N的正整数,且在所述映射空间中的任意两个标签信息所对应的编码向量均不相同;
在所述映射空间中确定所述每个编码向量中非零值所在的目标维度信息;
在与所述词向量识别模型相关联的权重矩阵中分别确定与每个目标维度信息的维度值相同的行数值所关联的权重系数;所述权重矩阵的行数等于所述映射空间中的K个维度信息;
将确定的与所述每个目标维度信息的维度值相同的行数值所关联的权重系数分别作为与所述每个编码向量对应的每个标签信息的词向量。
其中,所述相似模型中包含与所述业务数据库相关联的聚类簇中的每个业务数据信息相关联的标签向量;所述聚类簇对应的分类类型包含所述第一分类类型;
所述基于所述第一标签向量从所述业务数据库中获取满足向量相似条件的第二业务数据信息,包括:
从所述相似模型相关联的分类类型中将除所述第一分类类型之外的分类类型确定为待处理分类类型,根据所述待处理分类类型确定第二分类类型;
在所述相似模型中将与所述第二分类类型相关联的标签向量分别作为第二标签向量;
通过所述相似模型确定所述第一标签向量与每个第二标签向量之间的相似距离;
在业务数据库中将相似距离大于相似距离阈值的第二标签向量所对应的业务数据信息,确定为满足向量相似条件的第二业务数据信息。
其中,所述从所述相似模型相关联的分类类型中将除所述第一分类类型之外的分类类型确定为待处理分类类型,根据所述待处理分类类型确定第二分类类型,包括:
从所述相似模型相关联的分类类型中将除所述第一分类类型之外的分类类型确定为待处理分类类型;
将包含所述待处理分类类型的中转显示界面返回给所述用户终端,以使所述用户终端对应的目标用户在分类选取时长内从所述待处理分类类型中选取第二分类类型;
接收所述用户终端在所述分类选取时长内所发送的第二分类类型。
其中,所述第二分类类型包含M个子分类类型;M为正整数;
所述将具有所述第二分类类型的第二业务数据信息发送至所述用户终端,包括:
从具有所述第二分类类型的第二业务数据信息中确定所述M个子分类类型中的每个子分类类型分别对应的第二业务数据信息;
在所述每个子分类类型分别对应的第二业务数据信息中,将携带已推荐标识的第二业务数据信息确定为待过滤业务数据信息;
在所述每个子分类类型分别对应的第二业务数据信息中过滤所述待过滤业务数据信息,得到所述每个子分类类型分别对应的待推荐业务数据信息;
将所述每个子分类类型分别对应的待推荐业务数据信息发送至所述用户终端。
本申请一方面提供了另一种数据处理方法,所述方法应用于用户终端,包括:
响应针对第一显示界面中的第一业务数据信息触发的触发操作,向业务服务器发送针对所述第一业务数据信息的业务辅助信息;所述第一业务数据信息的分类类型为第一分类类型;
接收所述业务服务器基于所述第一业务数据信息相关联的第一标签向量所确定的第二业务数据信息;所述第二业务数据信息为在业务数据库中所确定的满足向量相似条件的业务数据信息;所述第一标签向量是所述业务服务器基于所述业务辅助信息、所述第一分类类型以及与所述业务数据库相关联的相似模型所确定的;
在与所述第一业务数据信息相关联的第二显示界面上显示所述第二业务数据信息。
本申请一方面提供了一种数据处理装置,所述装置应用于业务服务器,包括:
第一获取模块,用于获取用户终端针对第一业务数据信息发送的业务辅助信息;所述第一业务数据信息为所述用户终端响应针对第一显示界面触发的触发操作所确定的;所述第一业务数据信息的分类类型为第一分类类型;
第二获取模块,用于基于所述业务辅助信息、所述第一分类类型,在业务数据库中获取与所述第一业务数据信息相关联的第一标签向量;
第三获取模块,用于基于所述第一标签向量从所述业务数据库中获取满足向量相似条件的第二业务数据信息;所述第二业务数据信息的分类类别为第二分类类型,且所述第二分类类型不同于所述第一分类类型;
发送模块,用于将具有所述第二分类类型的第二业务数据信息发送至所述用户终端,以使所述用户终端在与所述第一业务数据信息相关联的第二显示界面上显示所述第二业务数据信息。
其中,所述第一获取模块包括:
第一获取单元,用于获取用户终端对应的目标用户的历史行为信息,基于所述历史行为信息从业务数据库中获取多个业务数据信息;
信息数据流返回单元,用于将所述多个业务数据信息构成的信息数据流返回给所述用户终端,以使所述用户终端在第一显示界面上显示所述信息数据流中的每个业务数据信息;
第二获取单元,用于获取所述用户终端响应针对所述第一显示界面触发的触发操作所发送的目标推荐请求,从所述目标推荐请求中获取第一业务数据信息相关联的业务辅助信息;所述第一业务数据信息为所述多个业务数据信息中与所述触发操作对应的业务数据信息。
其中,所述第一获取单元包括:
第一接收子单元,用于接收用户终端发送的首页加载请求;所述首页加载请求中携带所述用户终端的终端标识信息;
第一获取子单元,用于基于所述终端标识信息从历史行为数据库中获取所述用户终端对应的目标用户的历史行为信息;所述历史行为信息中包含历史电子读物以及所述历史电子读物的阅读进度;
第二获取子单元,用于基于所述历史电子读物以及所述历史电子读物的阅读进度,从业务数据库中获取多个业务数据信息。
其中,所述相似模型中包含与所述业务数据库相关联的聚类簇中的每个业务数据信息相关联的标签向量;所述聚类簇对应的分类类型包含所述第一分类类型;
所述第三获取模块包括:
第一确定单元,用于从所述相似模型相关联的分类类型中将除所述第一分类类型之外的分类类型确定为待处理分类类型,根据所述待处理分类类型确定第二分类类型;
第二确定单元,用于在所述相似模型中将与所述第二分类类型相关联的标签向量分别作为第二标签向量;
第三确定单元,用于通过所述相似模型确定所述第一标签向量与每个第二标签向量之间的相似距离;
第四确定单元,用于在业务数据库中将相似距离大于相似距离阈值的第二标签向量所对应的业务数据信息,确定为满足向量相似条件的第二业务数据信息。
其中,所述第一确定单元包括:
第一确定子单元,用于从所述相似模型相关联的分类类型中将除所述第一分类类型之外的分类类型确定为待处理分类类型;
返回子单元,用于将包含所述待处理分类类型的中转显示界面返回给所述用户终端,以使所述用户终端对应的目标用户在分类选取时长内从所述待处理分类类型中选取第二分类类型;
第二接收子单元,用于接收所述用户终端在所述分类选取时长内所发送的第二分类类型。
其中,所述第二分类类型包含M个子分类类型;M为正整数;
所述发送模块包括:
第五确定单元,用于从具有所述第二分类类型的第二业务数据信息中确定所述M个子分类类型中的每个子分类类型分别对应的第二业务数据信息;
第六确定单元,用于在所述每个子分类类型分别对应的第二业务数据信息中,将携带已推荐标识的第二业务数据信息确定为待过滤业务数据信息;
过滤单元,用于在所述每个子分类类型分别对应的第二业务数据信息中过滤所述待过滤业务数据信息,得到所述每个子分类类型分别对应的待推荐业务数据信息;
发送单元,用于将所述每个子分类类型分别对应的待推荐业务数据信息发送至所述用户终端。
其中,所述装置还包括:
聚类簇确定模块,用于获取业务数据库中的所有业务数据信息,确定每个业务数据信息所属的聚类簇;一个聚类簇对应一个分类类型;
第四获取模块,用于从所述聚类簇对应的分类类型中获取目标分类类型,从与所述目标分类类型相关联的聚类簇中获取目标业务数据信息;
标签向量确定模块,用于获取所述业务数据库相关联的词向量识别模型,基于所述目标业务数据信息、所述词向量识别模型,确定与所述目标业务数据信息相关联的标签向量;
存储模块,用于将所述标签向量以及所述标签向量对应的分类类型,存储至与所述业务数据库相关联的相似模型。
其中,所述标签向量确定模块包括:
第三获取单元,用于获取所述业务数据库相关联的词向量识别模型;
分词单元,用于对所述目标业务数据信息进行分词处理,从分词处理后的M个分词中确定N个关键词,将所述N个关键词分别作为所述目标业务数据信息的标签信息;所述N为小于或者等于所述M的正整数;
第四获取单元,用于基于N个标签信息分别对应的编码向量、所述词向量识别模型,获取每个标签信息对应的词向量;
第五获取单元,用于获取每个标签信息对应的权重值,根据所述每个标签信息对应的权重值以及相应标签信息对应的词向量,确定所述目标业务数据信息对应的标签向量。
其中,所述第四获取单元包括:
转换子单元,用于将N个标签信息中的每个标签信息转换为编码向量;每个编码向量均具备同一映射空间中的K个维度信息;所述K为大于或者等于N的正整数,且在所述映射空间中的任意两个标签信息所对应的编码向量均不相同;
目标维度确定子单元,用于在所述映射空间中确定所述每个编码向量中非零值所在的目标维度信息;
权重系数确定子单元,用于在与所述词向量识别模型相关联的权重矩阵中分别确定与每个目标维度信息的维度值相同的行数值所关联的权重系数;所述权重矩阵的行数等于所述映射空间中的K个维度信息;
词向量确定子单元,用于将确定的与所述每个目标维度信息的维度值相同的行数值所关联的权重系数分别作为与所述每个编码向量对应的每个标签信息的词向量。
本申请一方面提供了一种计算机设备,包括:处理器、存储器、网络接口;
所述处理器与存储器、网络接口相连,其中,网络接口用于提供数据通信功能,所述存储器用于存储计算机程序,所述处理器用于调用所述计算机程序,以执行本申请实施例中上述一方面中的方法。
本申请一方面提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被处理器执行时,执行本申请实施例中上述一方面中的方法。
本申请一方面提供了另一种数据处理装置,所述装置应用于用户终端,其特征在于,包括:
响应模块,用于响应针对第一显示界面中的第一业务数据信息触发的触发操作,向业务服务器发送针对所述第一业务数据信息的业务辅助信息;所述第一业务数据信息的分类类型为第一分类类型;
接收模块,用于接收所述业务服务器基于所述第一业务数据信息相关联的第一标签向量所确定的第二业务数据信息;所述第二业务数据信息为在业务数据库中所确定的满足向量相似条件的业务数据信息;所述第一标签向量是所述业务服务器基于所述业务辅助信息、所述第一分类类型以及与所述业务数据库相关联的相似模型所确定的;
显示模块,用于在与所述第一业务数据信息相关联的第二显示界面上显示所述第二业务数据信息。
本申请一方面提供了一种计算机设备,包括:处理器、存储器、网络接口;
所述处理器与存储器、网络接口相连,其中,网络接口用于提供数据通信功能,所述存储器用于存储计算机程序,所述处理器用于调用所述计算机程序,以执行本申请实施例中上述一方面中的方法。
本申请一方面提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被处理器执行时,执行本申请实施例中上述一方面中的方法。
在本申请实施例中,用户终端响应针对第一显示界面的触发操作,向业务服务器发送第一业务数据信息的辅助信息,该第一业务数据信息的分类类型为第一分类类型;此时,业务服务器可以基于获取到的业务辅助信息、所述第一分类类型,在与业务数据库相关联的相似模型中获取与所述第一业务数据信息相关联的第一标签向量。进一步地,业务服务器可以基于所述第一标签向量从所述业务数据库中获取满足向量相似条件的第二业务数据信息;该第二业务数据信息的分类类别为第二分类类型,且所述第二分类类型不同于所述第一分类类型;并将具有所述第二分类类型的第二业务数据信息发送至所述用户终端,以使所述用户终端在与所述第一业务数据信息相关联的第二显示界面上显示所述第二业务数据信息。由此可见,本申请实施例可以通过第一业务数据信息相关联的第一标签向量,从业务数据库中查找到满足向量相似条件的第二业务数据信息,所推荐的第二业务数据信息与第一业务数据信息的分类类型不同,从而可以丰富业务数据信息推荐的类型。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的一种网络架构的结构示意图;
图2是本申请实施例提供的一种进行数据交互的场景示意图;
图3是本申请实施例提供的一种数据处理方法的流程示意图;
图4是本申请实施例提供的一种业务数据库与相似模型的场景示意图;
图5a是本申请实施例提供的一种确定第二分类类型的场景示意图;
图5b是本申请实施例提供的一种确定待推荐业务数据信息的场景示意图;
图6是本申请实施例提供的另一种数据处理方法的流程示意图;
图7是本申请实施例提供的一种获取标签信息所对应词向量的场景示意图;
图8是本申请实施例提供的一种根据目标维度信息确定词向量的场景示意图;
图9是本申请实施例提供的一种数据处理装置的结构示意图;
图10是本申请实施例提供的一种计算机设备的示意图;
图11是本申请提供的另一种数据处理装置的结构示意图;
图12是本申请实施例提供的另一种计算机设备的示意图;
图13是本申请实施例提供的一种数据处理系统的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
请参见图1,是本申请实施例提供的一种网络架构的结构示意图。如图1所示,该网络架构可以包括业务服务器2000和用户终端集群,所述用户终端集群可以包括多个用户终端,如图1所示,具体可以包括用户终端3000a、用户终端3000b、用户终端3000c、…、用户终端3000n。
如图1所示,用户终端3000a、用户终端3000b、用户终端3000c、…、用户终端3000n可以分别与所述业务服务器2000进行网络连接,以便于每个用户终端可以通过该网络连接与业务服务器2000进行数据交互。
如图1所示,该用户终端集群中的每个用户终端均可以集成安装有目标应用,当该目标应用运行于各用户终端中时,可以分别与上述图1所示的业务服务器2000之间进行数据交互。其中,该目标应用可以包含具有显示和播放公众号文章、书籍、视频、音频等业务数据信息功能的应用。
其中,为便于理解,本申请实施例可以在图1所示的多个用户终端中选择一个用户终端作为目标用户终端,该目标用户终端可以包括:智能手机、平板电脑、桌上型电脑等携带显示和播放业务数据信息功能的智能终端。例如,本申请实施例可以将图1所示的用户终端3000a作为所述目标用户终端,该目标用户终端中可以集成有上述目标应用,此时,该目标用户终端可以通过该目标应用对应的业务数据平台与业务服务器2000之间实现数据交互。
比如,目标用户在访问该目标应用之后,可以将该目标应用的当前显示界面(例如,首页所在的显示页面)称之为第一显示界面。进一步地,可以理解的是,用户终端3000a在响应目标用户针对该目标应用的触发操作时,业务服务器2000可以从历史行为数据库中,获取到该用户终端3000a对应的该目标用户的历史行为信息。此时,业务服务器2000可以根据该历史行为信息,主动向该目标用户所对应的用户终端3000a推荐多个业务数据信息构成的信息数据流,并将该信息数据流显示在用户终端3000a的第一显示界面上。换言之,目标用户针对用户终端3000a中的该目标应用进行触发操作时,可以登录进入该目标应用。与此同时,业务服务器2000可以主动的将获取的多个业务信息构成的信息数据流返回给该用户终端3000a,并在该用户终端3000a的第一显示界面上显示该信息数据流。
其中,可以理解的是,用户终端3000a(即目标用户终端)上集成的目标应用可以是电子类阅读应用(例如,微信读书应用),此时,本申请实施例可以将该微信读书应用中的公众号文章、书籍、视频、音频等业务数据信息统称为电子读物。此外,这些电子读物也还可以是该用户终端3000a中的浏览器中的电子读物,这里将不对其进行限制。
可选的,当目标用户进入该目标应用时,业务服务器2000还可以接收用户终端3000a所发送的首页加载请求,即该业务服务器2000可以根据该首页加载请求中所携带的历史行为信息,搜索并向该用户终端3000a推荐多个业务数据信息所构成的信息数据流,以使用户终端3000a可以将该信息数据流显示在第一显示界面上。
可以理解的是,用户终端3000a可以响应目标用户针对该第一显示界面中的目标按钮(例如,故事图标)触发的触发操作,向业务服务器2000发送携带该用户终端3000a的终端标识信息的首页加载请求,基于该用户终端3000a的终端标识信息,业务服务器2000可以从历史行为数据库中获取该目标用户的历史行为信息,并基于获取到的首页加载请求针对性的推荐多个业务数据信息构成的信息数据流。其中,该历史行为信息可以包含历史电子读物以及历史电子读物的阅读进度和分类类型,其中,历史电子读物可以包括已阅读过的历史电子读物、加入书架的电子读物以及感兴趣的电子读物等,这里将不对其进行限定。
进一步地,该目标用户可以基于业务服务器2000所推荐的多个业务数据信息构成的信息数据流,从该信息数据流中选取一个目标业务数据信息作为第一业务数据信息。其中,可以理解的是,用户终端3000a可以针对该第一业务数据信息发送业务辅助信息,该业务辅助信息可以是该第一业务数据信息所对应的业务数据信息标识号码(例如,第一业务数据信息的Identity,简称ID)。该第一业务数据信息对应的分类类型为第一分类类型。
可以理解的是,业务服务器2000基于获取到的业务辅助信息和该第一分类类型,在与业务数据库相关联的相似模型中,获取该第一业务数据信息相关联的标签向量,并将该标签向量称之为第一标签向量。
其中,可以理解的是,业务服务器2000能够获取业务数据库中的所有业务数据信息,并可以确定出每个业务数据信息所属的聚类簇。其中,一个聚类簇对应一个分类类型。在与该业务数据库相关联的相似模型中,存储着与该业务数据库相关联的聚类簇中每个业务数据信息相关联的标签向量。
业务服务器2000可以从所述相似模型相关联的分类类型中,将除所述第一分类类型之外的分类类型确定为待处理分类类型,从而根据所述待处理分类类型确定第二分类类型。进一步地,业务服务器2000可以在相似模型中,将与该第二分类类型相关联的标签向量分别作为第二标签向量,并可以通过相似模型确定第一标签向量与每一个第二标签向量之间的相似距离。在业务数据库中,业务服务器2000可以将满足向量相似条件的业务数据信息作为第二业务数据信息。其中,可以理解的是,向量相似条件是指第一标签向量与第二标签向量之间的相似距离大于业务服务器2000所预设的相似距离阈值。
应当理解,业务服务器2000可以从该相似模型中获取待处理分类类型,并可以将该待处理分类类型统称为第二分类类型。在该相似模型中,业务服务器2000可以将与该第二分类类型相关联的标签向量分别作为第二标签向量。可以理解的是,业务服务器2000可以通过该相似模型确定该第一标签向量与每个第二标签向量之间的相似距离。当该相似距离大于业务服务器所预设的相似距离阈值时,可以将该第二标签向量对应的业务数据信息确定为第二业务数据信息。例如,在业务数据库中,业务服务器2000可以预设一个相似距离阈值,比如,业务服务器2000可以预设0.8作为相似距离阈值,此时,可以将大于该相似距离阈值(即,0.8)的第二标签向量所对应的业务数据信息确定为满足向量相似条件的第二业务数据信息。
可选的,业务服务器2000还可以将该待处理分类类型返回给用户终端3000a,以使该用户终端3000a在显示界面上输出该待处理分类类型。其中,该显示界面可以称之为中转显示界面。该用户终端3000a对应的目标用户可以在一定时长(例如,2-3秒)内,从该中转显示界面的待处理分类类型中选取第二分类类型。其中,可以理解的是,本申请实施例可以将用于选取第二分类类型的一定时长称之为分类选取时长。
应当理解,在分类选取时长内,目标用户从中转显示界面中逐个选取第二分类类型,从而可以在当前时长达到分类选取时长之后,通过用户终端3000a将所选取的第二分类类型一并发送给业务服务器2000,以使业务服务器2000可以在相似模型中快速找到满足向量相似条件的第二业务数据信息。其中,在分类选取时长中所选取的第二分类类型的数量可以为一个或多个。
应当理解,目标用户还可以在分类选取时长内,每确定一个第二分类类型就立即向业务服务器2000发送该第二分类类型,以使业务服务器2000在相似模型中快速确定出满足向量相似条件的第二业务数据信息。其中,可以理解的是,该用户终端3000a所对应的目标用户在分类选取时长中所选取的第二分类类型可以为书籍类,此时,该用户终端3000a可以立即将该书籍类这个分类类型发送给业务服务器2000。然后,业务服务器2000可以根据该用户终端3000a所发送的第二分类类型,在相似模型中快速确定满足向量相似条件的第二业务数据信息。此外,该目标用户还可以在该分类选取时长中选取下一个第二分类类型(例如,视频类)。此时,该用户终端3000a可以继续将视频类这个分类类型发送给业务服务器2000,以使业务服务器2000可以进一步在相似模型中确定满足向量相似条件的又一第二业务数据信息。
其中,可以理解的是,若目标用户在分类选取时长结束后,没有在用户终端3000a的中转显示界面上选取自己感兴趣的第二分类类型。换言之,业务服务器没有接收到该用户终端3000a发送的第二分类类型,业务服务器2000可以将中转显示界面上的待处理分类类型分别确定为第二分类类型,从而可以在相似模型中确定满足向量相似条件的第二业务数据信息。
进一步地,业务服务器2000可以将具有该第二分类类型的第二业务数据信息发送给该用户终端3000a,用户终端3000a在与该第一业务数据信息相关联的显示界面上显示该第二业务数据信息,其中,该显示界面可以称之为第二显示界面。
可以理解的是,当该目标用户选择的第一业务数据信息为公众号文章A时,用户终端3000a可以在显示第一业务数据信息具体详细内容的显示界面上显示公众号文章A的具体详细内容和第二业务数据信息。其中,该显示界面可以称之为详情页面。可选的,该详情页面可以显示该公众号文章对应的链接(即阅读全文)和第二业务数据信息的链接。可以理解的是,目标用户可以通过点击该公众号文章对应的链接跳转至该详情页面的顶端进行文章的阅读。
可选的,当该目标用户选择的第一业务数据信息为书籍A时,用户终端3000a的详情页面可以按照书籍A的章节进行独立推荐。换言之,该用户终端3000a可以在该详情页面上显示某个章节(比如,章节120)的具体详细内容。此外,该用户终端3000a也可以在该详情页面上显示该章节(章节120)的部分内容。同时,目标用户可以根据该详情页面上设置的可供用户继续浏览全文的按钮,选择是否在该详情页面中浏览该章节的剩余内容。可以理解的是,在该详情页面上推荐的第二业务数据信息可以为该章节的下一章节(比如,章节121)对应的文章链接,也可以是视频类,公众号文章类、音频类等分类类型对应的业务数据信息。
进一步地,请参见图2,是本申请实施例提供的一种进行数据交互的场景示意图。如图2所示,用户A可以在第一显示界面1000a显示的上述信息数据流中执行触发操作,从该数据信息流中选择一个业务数据信息作为第一业务数据信息(例如,业务数据信息10a),其中,业务数据信息10a的分类类型可以为第一分类类型(例如,公众号文章类)。此时,目标用户终端可以响应该触发操作向业务服务器发送目标推荐请求。业务服务器可以从目标推荐请求中获取该第一业务数据信息相关联的业务辅助信息(例如,第一业务数据信息对应的ID)。进一步地,业务服务器可以根据所选择的第一业务数据信息的业务辅助信息和第一分类类型,在业务数据库相关联的相似模型中获取与第一业务数据信息相关联的第一标签向量。
应当理解,业务数据库可以根据该第一标签向量,从业务数据库中获取满足向量相似条件的第二业务数据信息。其中,可以将该第二业务数据信息的分类类型称之为第二分类类型。通过第一业务数据相关联的第一标签向量从业务数据库中查找到满足向量相似条件的第二标签向量所对应的第二业务数据信息(例如,业务数据信息20a、业务数据信息20b以及业务数据信息20c)。此外,由于该第二业务数据信息与第一业务数据信息的分类类型不同,从而可以丰富业务数据信息推荐的类型。
其中,如图2所示的第一显示界面1000a中可以包含多个业务数据信息构成的信息数据流(即多个业务数据信息)。比如,第一显示界面1000a可以包含图2所示业务数据信息10a、业务数据信息10b、业务数据信息10c和业务数据信息10d。此时,显示在该第一显示界面1000a中的这些业务数据信息可以为根据用户A的历史行为信息从业务数据库中获取的多个业务数据信息。
应当理解,该第一显示界面1000a上的业务数据信息所构成的数据信息流还可以是用户A针对第一显示界面触发所得到的。可以理解的是,用户A可以在第一显示界面1000a上针对目标按钮(例如,故事图标)执行触发操作(例如,单击,长按等接触性操作),此时,图2所示的目标用户终端(例如,上述用户终端3000a)可以响应该触发操作,将携带该目标用户终端的终端标识信息的首页加载请求发送给业务服务器(该业务服务器可以为上述业务服务器2000),以使业务服务器可以基于该终端标识信息,从历史行为数据库中获取该用户A的历史行为信息(例如,历史电子读物的分类类型,阅读进度、阅读兴趣等)。进一步地,业务服务器可以基于历史行为数据信息从业务数据库中获取多个业务数据信息,并将这多个业务数据信息构成的信息数据流返回给该目标用户终端,以使该信息数据流显示在第一显示界面1000a上。
其中,本申请实施例可以将公众号文章类、书籍类、视频类以及音频类等分类类型所对应的数据信息统称为业务数据信息,所以,在第一显示界面1000a中所显示的业务数据可以是公众号文章类对应的业务数据信息、书籍类对应的业务数据信息、视频类对应的业务数据信息和音频类对应的业务数据信息等。可以理解的是,本申请实施例可以将第一显示界面1000a统称为推荐页面,即在该推荐页面中所推送的业务数据信息可以以信息数据流(即feed流)的方式进行呈现。
其中,如图2所示的用户A可以针对第一显示界面1000a进行触发操作,基于业务服务器发送的信息数据流从中选择业务数据信息10a作为第一业务数据信息,目标用户终端响应针对业务数据信息10a的触发操作,进一步地,可以根据业务数据信息10a向业务服务器发送目标推荐请求,业务服务器可以从目标推荐请求中获取业务数据信息10a相关联的业务辅助信息(比如,业务数据信息10a所对应的ID)。其中,该业务数据信息10a的分类类型(第一分类类型)可以为公众号文章类。
其中,如图2所示的,业务服务器可以基于该业务数据信息10a的业务辅助信息(例如,业务数据信息10a对应的ID)以及业务数据信息10a的分类类型(第一分类类型,即公众号文章类),从业务数据库相关联的相似模型中获取业务数据信息10a相关联的标签向量(第一标签向量)。
其中,可以理解的是,业务数据库中的每个业务数据信息均包含在聚类簇中,一个聚类簇对应一个分类类型。应当理解,该业务数据库中可以包含与公众号文章类相关联的聚类簇、与书籍类相关联的聚类簇、与视频类相关联的聚类簇以及与音频类相关联的聚类簇。
业务服务器可以从上述聚类簇对应的分类类型中获取一个目标分类类型,进而可以从目标分类类型对应的聚类簇中获取目标业务数据信息。进一步地,业务服务器可以获取与业务数据库相关联的词向量识别模型,根据目标业务数据信息和该词向量识别模型,可以确定出该目标业务数据信息的标签向量,并将该标签向量根据该标签向量所对应的分类类型,存储在与业务数据库相关联的相似模型中。换言之,与业务数据库相关联的相似模型中可以存储业务数据库中每个聚类簇的所有业务数据信息的标签向量。
应当理解,根据业务数据信息10a的分类类型(第一分类类型,即公众号文章类),业务服务器可以在业务数据库中获取除与公众号文章类相关联的聚类簇之外的其他聚类簇(例如,与书籍类相关联的聚类簇、与视频类相关联的聚类簇、与音频类相关联的聚类簇等),并在与业务数据库相关联的相似模型中获取满足向量相似条件的业务数据信息,该业务数据信息可以统称为第二业务数据信息,并将该第二业务数据信息返回给目标用户终端,在图2所示的目标用户终端的详情页面上,可以显示第一业务数据信息10a的具体详细内容100a(如具体文章内容)以及显示该第二业务数据信息。其中,显示在详情页面上的第二业务数据信息具体可以包括图2所示的业务数据信息20a(例如,书籍A),业务数据信息20b(例如,视频A)以及业务数据信息20c(例如,音频A)。进一步地,用户A可以通过针对业务数据信息20a的触发操作,以使目标用户终端从详情页面上跳转至第二显示界面2000a上,从而可以显示该业务数据信息20a的具体详细内容200a(如具体书籍内容)。
其中,目标用户终端接收业务服务器针对具有第一分类类型的第一业务数据信息所返回的具有第二分类类型的第二业务数据信息的具体实现方式可以参见下述图3-图8所对应的实施例。
进一步地,请参见图3,是本申请实施例提供的一种数据处理方法的流程示意图。该方法可以应用于业务服务器。如图3所示,所述方法可以包括:
S101,获取用户终端针对第一业务数据信息发送的业务辅助信息;所述第一业务数据信息为所述用户终端响应针对第一显示界面触发的触发操作所确定的;所述第一业务数据信息的分类类型为第一分类类型;
具体地,业务服务器可以获取目标用户的历史行为信息,并基于该历史行为信息从业务数据库中获取多个业务数据信息。进一步地,业务服务器可以将多个业务信息所构成的信息数据流返回给该目标用户所对应的用户终端,以使该用户终端可以在第一显示界面上显示该信息数据流中的每个业务数据信息。应该理解,用户终端可以响应目标用户针对第一显示界面触发的触发操作,向业务服务器发送目标推荐请求。业务服务器可以从该目标推荐请求中获取第一业务数据信息相关联的业务辅助信息。
其中,应当理解,本申请实施例中的用户终端可以为上述图2所对应实施例中的目标用户终端,该目标用户终端可以为上述图1所对应实施例中的用户终端3000a。此外,本申请实施例中的业务服务器可以为上述图2所对应实施例中的业务服务器,该业务服务器可以为上述图1所对应实施例中的业务服务器2000。
可以理解的是,集成目标应用(例如,显示和播放公众号文章、书籍、视频、音频等业务数据信息功能的应用)的用户终端可以接收目标用户在第一显示界面中执行的触发操作(例如,触发目标按钮,即故事图标),此时,向业务服务器发送携带所述用户终端的终端标识信息的首页加载请求。其中,该触发操作可以包含点击或者长按等接触性操作,也可以包含语音或者手势等非接触性操作,这里将不对其进行限定。
应当理解,业务服务器可以基于该终端标识信息从历史行为数据库中获取该用户终端对应的目标用户的历史行为信息。其中,该历史行为信息可以包含历史电子读物以及历史电子读物的阅读进度和分类类型,其中,历史电子读物可以包括已阅读过的历史电子读物、加入书架的电子读物以及感兴趣的电子读物等,这里将不对其进行限制。进一步地,根据该历史电子读物以及历史电子读物的阅读进度和分类类型,业务服务器可以从业务数据库中获取多个业务数据信息。
可以理解的是,业务服务器可以将获取到的多个业务数据信息所构成的信息数据流返回给该用户终端,以使该用户终端在目标应用的首页(即第一显示界面)上输出该信息数据流中的每一个业务数据信息。比如,上述图2所示的业务数据信息10a、业务数据信息10b、业务数据信息10c和业务数据信息10d。
其中,目标用户可以在该第一显示界面上进行触发操作,以使用户终端从上述信息数据流中选择一个业务数据信息作为第一业务数据信息。业务服务器可以获取针对该第一业务数据信息所发送的目标推荐请求,进而从中获取第一业务数据信息相关联的业务辅助信息,以进一步地执行步骤S102,从而提高推荐业务数据信息的准确度。其中,该第一业务数据信息的分类类型可以称之为第一分类类型。该业务辅助信息可以是该第一业务数据信息所对应的业务数据信息标识号码(例如,第一业务数据信息的Identity,简称ID)。
S102,基于所述业务辅助信息、所述第一分类类型,在与业务数据库相关联的相似模型中获取与所述第一业务数据信息相关联的第一标签向量;
具体地,业务数据库中的每个业务数据信息均包含在聚类簇中,一个聚类簇中可以对应一个分类类型。可以理解的是,业务服务器可以根据第一业务数据信息相关联的业务辅助信息,在业务数据库中获取到第一业务数据信息的第一分类类型所对应的聚类簇。业务服务器可以在与业务数据库相关联的相似模型中,根据该聚类簇对应的分类类型获取与该第一业务数据信息相关联的标签向量。其中,本申请实施例可以将该标签向量称之为第一标签向量。所述相似模型中存储有与所述业务数据库相关联的聚类簇中的每个业务数据信息相关联的标签向量;所述聚类簇对应的分类类型可以包含所述第一分类类型。
为便于理解,进一步的,请参见图4,是本申请实施例提供的一种业务数据库与相似模型的场景示意图。其中,可以理解的是,在业务数据库中可以包含多个与分类类型相关联的聚类簇,为便于阐述,这里仅以4个与分类类型相关联的聚类簇为例,来阐述业务数据库与相似模型之间的对应关系。
如图4所示,业务数据库中可以包含4个与分类类型相关联的聚类簇,即与公众号文章类相关联的聚类簇30A、与书籍类相关联的聚类簇30B、与视频类相关联的聚类簇30C以及与音频类相关联的聚类簇30D。其中,每个聚类簇包含着相应分类类型的业务数据信息。
可以理解的是,在与该业务数据库相关联的相似模型中,可以包含与所述业务数据库相关联的聚类簇中的每个业务数据信息相关联的标签向量。换言之,聚类簇30A中所有业务数据信息的标签向量均存储于相似模型与公众号文章类相关联的标签向量集40A中,聚类簇30B中所有业务数据信息的标签向量均存储于相似模型与书籍类相关联的标签向量集40B中,聚类簇30C中所有业务数据信息的标签向量均存储于相似模型与视频类相关联的标签向量集40C中,聚类簇30D中所有业务数据信息的标签向量均存储于相似模型与音频类相关联的标签向量集40D中。
应当理解,若用户终端响应触发操作所确定的第一业务数据信息为文章A所对应的业务数据信息,则该第一业务数据信息的分类类型为公众号文章类(第一分类类型)。进一步地,业务服务器可以根据文章A的业务辅助信息(文章A的ID)和第一分类类型,在业务数据库中获取到与公众号文章类相关联的聚类簇30A。进而业务服务器可以在与该业务数据库相关联的相似模型中,从与公众号文章类相关联的标签向量集40A中获取到与文章A相关联的标签向量(第一标签向量)。
S103,基于所述第一标签向量从所述业务数据库中获取满足向量相似条件的第二业务数据信息;
其中,所述第二业务数据信息的分类类别为第二分类类型,且所述第二分类类型不同于所述第一分类类型。
具体地,业务服务器可以从所述相似模型相关联的分类类型中将除所述第一分类类型之外的分类类型确定为待处理分类类型,从而根据所述待处理分类类型确定第二分类类型。进一步地,业务服务器可以在相似模型中,将与该第二分类类型相关联的标签向量分别作为第二标签向量,并可以通过相似模型确定第一标签向量与每一个第二标签向量之间的相似距离。在业务数据库中,业务服务器可以获取满足向量相似条件的第二业务数据信息。其中,所述相似模型中包含与所述业务数据库相关联的聚类簇中的每个业务数据信息相关联的标签向量;所述聚类簇对应的分类类型包含所述第一分类类型。
其中,向量相似条件是指第一标签向量与第二标签向量之间的相似距离大于业务服务器所预设的相似距离阈值。
应当理解,业务服务器可以将待处理分类类型均确定为第二分类类型。其中,该第二分类类型可以包含M个子分类类型,M可以为正整数。比如,该第二分类类型可以包含M=3个子分类类型,这3个子分类类型可以具体包含:书籍类、视频类、音频类。可以理解的是,业务服务器可以根据该第二分类类型,在业务数据库中确定出满足向量相似条件的第二标签向量所对应的业务数据信息(第二业务数据信息)。换言之,若第一分类类型为公众号文章类,则业务服务器从业务数据库中确定的第二业务数据信息可以是书籍类、视频类以及音频类这些子分类类型对应的满足向量相似条件的业务数据信息。
可选的,目标用户还可以从待处理分类类型中选择一个或多个子分类类型作为第二分类类型,以使业务服务器可以根据目标用户所选择的第二分类类型,在业务数据库中确定满足向量相似条件的业务数据信息(第二业务数据信息),并对用户终端进行推荐。
为便于理解,进一步地,请参见图5a,是本申请实施例提供的一种确定第二分类类型的场景示意图。如图5a所示,该相似模型中包含着与业务数据库相关联的聚类簇中的每个业务数据信息相关联的标签向量。其中,图5a所示的目标用户终端可以为上述图2所示的目标用户终端。本申请实施例的待处理分类类型可以包含除第一分类类型外的分类类型,为便于阐述,仅以图5a所示中转显示界面的3个子分类类型为例。
应当理解,如图2对应的实施例所示,目标用户可以在目标用户终端的第一显示界面1000a中,通过对第一显示界面1000a显示的信息数据流所触发的触发操作,将业务数据信息10a可以确定为第一业务数据信息。其中,确定出的第一业务数据信息的第一分类类型可以为公众号文章类。业务服务器可以从所述相似模型相关联的分类类型中,将除所述第一分类类型之外的分类类型确定为待处理分类类型。换言之,可以将书籍类、视频类以及音频类这些子分类类型称之为待处理分类类型。进一步地,业务服务器可以将包含所述待处理分类类型的显示界面返回给目标用户终端,其中,本申请实施例可以将包含待处理分类类型的显示界面称之为中转显示界面。该中转显示界面可以为图5a所示的中转显示界面。
应当理解,在一定选取时长(例如,2-3秒)内,目标用户终端对应的目标用户可以在图5a所示的中转显示界面上所显示的待处理分类类型中,选取自己所感兴趣的子分类类型,作为目标用户终端发送给业务服务器的第二分类类型。其中,本申请实施例可以将这段选取时长称之为分类选取时长,将在分类选取时长内选取的分类类型称之为第二分类类型。
可以理解的是,当目标用户在分类选取时长选取一个待处理分类类型(例如,书籍类)作为第二分类类型时,目标用户终端可以向业务服务器发送该第二分类类型,以使业务服务器从业务数据库中,确定满足向量相似条件的与该第二分类类型相关联的聚类簇中的第二业务数据信息(例如,书籍A)。当目标用户在分类选取时长再选取一个待处理分类类型(例如,视频类)作为第二分类类型时,目标用户终端可以向业务服务器发送该第二分类类型,以使业务服务器从业务数据库中,确定满足向量相似条件的与该第二分类类型相关联的聚类簇中的第二业务数据信息(例如,视频A)。换言之,目标用户在分类选取时长内每选取一个第二分类类型,目标用户终端立即向业务服务器发送该第二分类类型,以使业务服务器从业务数据库中,可以确定满足向量相似条件且与该第二分类类型相关联的第二业务数据信息。
可选的,目标用户可以在分类选取时长内选取待处理分类类型中的书籍类和视频类这两个分类类型作为第二分类类型,在分类选取时长结束后,目标用户终端可以将选取的这两个第二分类类型一并发送至业务服务器,以使业务服务器从业务数据库中,确定满足向量相似条件的与该第二分类类型相关联的聚类簇中的第二业务数据信息。换言之,目标用户可以在分类选取时长内,选取一个或多个待处理分类类型作为第二分类类型,目标用户终端在分类选取时长结束后,可以一并向业务服务器发送该第二分类类型,以使业务服务器从业务数据库中,确定满足向量相似条件且与该第二分类类型相关联的第二业务数据信息。
其中,可以理解的是,若目标用户在分类选取时长结束后,没有在目标用户终端的中转显示界面上确定第二分类类型。换言之,业务服务器没有接收到该目标用户终端发送的第二分类类型,业务服务器可以将图5a所示的目标用户终端的中转显示界面上的3个待处理分类类型分别确定为第二分类类型,从而可以在相似模型中确定满足向量相似条件的第二业务数据信息。
进一步地,业务服务器可以通过所述相似模型确定所述第一标签向量与每个第二标签向量之间的相似距离。其中,可以理解的是,第一标签向量与每个第二标签向量之间的相似距离在0至1之间,在本申请实施例中,业务服务器可以确定一个相似距离阈值(例如,0.8),在业务数据库中可以将相似距离大于相似距离阈值的第二标签向量所对应的业务数据信息,确定为满足向量相似条件的第二业务数据信息。
应当理解,如图2所示,业务服务器可以将目标用户所选择的第一业务数据信息10a(第一业务数据信息)的具体详细内容100a(如具体文章内容)和通过目标用户所选择的第二分类类型对应的第二业务数据信息显示在目标用户终端的详情页面上,以使目标用户针对该详情页面上多个第二业务数据信息所构成的信息数据流进行触发操作,从而跳转至第二显示界面2000a上显示第二业务数据信息的具体详细内容。其中,业务服务器根据第二分类类型在业务数据库中确定第二业务数据信息的描述具体参见图2所对应的实施例,在此不再继续赘述。
S104,将具有所述第二分类类型的第二业务数据信息发送至所述用户终端,以使所述用户终端在与所述第一业务数据信息相关联的第二显示界面上显示所述第二业务数据信息。
具体地,业务服务器可以从具有所述第二分类类型的第二业务数据信息中确定所述M个子分类类型中的每个子分类类型分别对应的第二业务数据信息。此时,业务服务器可以在所述每个子分类类型分别对应的第二业务数据信息中,将携带已推荐标识的第二业务数据信息确定为待过滤业务数据信息。进一步地,业务服务器可以在所述每个子分类类型分别对应的第二业务数据信息中过滤所述待过滤业务数据信息,得到所述每个子分类类型分别对应的待推荐业务数据信息,进而可以将所述每个子分类类型分别对应的待推荐业务数据信息发送至所述用户终端。所述用户终端可以在与所述第一业务数据信息相关联的第二显示界面上输出该待推荐业务数据信息。其中,第二分类类型包含M个子分类类型;M为正整数。
为便于理解,进一步地,请参见图5b,是本申请实施例提供的一种确定待推荐业务数据信息的场景示意图。应当理解,用户A所确定的第一业务数据信息可以为文章A,该第一业务数据信息的分类类型(第一分类类型)为公众号文章类。如图5b所示,本申请实施例中在执行完上述步骤S103所确定的第二分类类型可以包括图5b所示的3个子分类类型,即书籍类、视频类以及音频类。业务服务器所确定的满足向量相似条件的第二业务数据信息可以为这3个子分类类型中的每个子分类类型分别对应的第二业务数据信息。比如,该书籍类对应的第二业务数据信息可以为书籍A、书籍B以及书籍C,该视频类对应的第二业务数据信息可以为视频A、视频B以及视频C,该音频类对应的第二业务数据信息可以为音频A、音频B以及音频C。
进一步地,业务服务器可以在每个子分类类型分别对应的第二业务数据信息中,将携带已推荐标识(例如,已推荐)的第二业务数据信息确定为待过滤业务数据信息。如图5b所示,业务服务器可以将书籍类对应的第二业务数据信息书籍A、视频类对应的第二业务数据信息视频B、以及音频类对应的第二业务数据信息音频A和音频C确定为待过滤业务数据信息。
应当理解,业务服务器可以在每个子分类类型对应的第二业务数据信息中,通过内容过滤算法过滤同一子分类类型下的待过滤业务数据信息,以得到待推荐业务数据信息。比如,如图5b所示,可以在书籍这一子分类类型下过滤携带已推荐标识的书籍A,并将该书籍这一子分类类型下的书籍B和书籍C称之为上述书籍类所对应的待推荐业务数据信息。以此类推,可以将视频这一子分类类型下的视频A和视频C称之为上述视频类所对应的待推荐业务数据信息,还可以将音频这一子分类类型下的音频B称之为上述音频类所对应的待推荐业务数据信息。进一步地,业务服务器可以将每个子分类类型分别对应的待推荐业务数据信息发送至所述用户终端,以使所述用户终端可以在与所述第一业务数据信息相关联的第二显示界面上输出该待推荐业务数据信息。
其中,可以理解的是,如图2的目标用户终端的详情页面所示,业务服务器可以根据第一业务数据信息的标签向量从业务数据库中向目标用户终端推荐具有第二分类类型的第二业务数据信息。其中,目标用户终端的详情页面上可以显示多个第二业务数据信息构成的信息数据流,为便于阐述,本申请实施例仅以3个第二业务数据信息构成的信息数据流为例。
此时,业务服务器可以将每个子分类类型中与第一标签向量的相似距离最接近的第二标签向量所对应的待推荐业务数据信息返回给目标用户终端。比如,业务服务器可以将上述图5b所示的书籍B、视频A以及音频B返回给目标用户终端,以使目标用户终端在该详情页面上输出这3个待推荐业务数据信息和文章A(第一业务数据信息)的具体详细内容。
可选的,如上述图2所对应的实施例所示,在目标用户终端的详情页面上可以显示与第一分类类型不同的分类类型(即第二分类类型)所对应的第二业务数据信息。该第二业务数据信息可以优先选取互不相同的子分类类型对应的待推荐业务数据信息,若没有获取到互不相同的子分类类型对应的待推荐业务数据信息,也可以在同一子分类类型中选取一定数量的待推荐业务数据信息。
可以理解的是,业务服务器可以在如图5b所示的第二业务数据信息中,可以将携带已推荐标识的第二业务数据信息确定为待过滤业务数据信息。当业务服务器在音频类对应的第二业务数据信息中确定的待过滤业务分类类型为音频A、音频B和音频C。则业务服务器在音频类这个子分类类型中过滤掉待过滤业务数据信息后,未得到音频类的待推荐业务数据信息。此时,业务服务器可以在书籍类和视频类选取最接近第一标签向量相似距离的3个待推荐业务数据信息。例如,业务服务器可以将书籍B、书籍C和视频A返回给图2所示的目标用户终端,以使该目标用户终端可以在该详情页面上输出这3个待推荐业务数据信息和文章A的具体详细内容。
在本申请实施例中,用户终端响应针对第一显示界面的触发操作,向业务服务器发送第一业务数据信息的辅助信息,该第一业务数据信息的分类类型为第一分类类型;此时,业务服务器可以基于获取到的业务辅助信息、所述第一分类类型,在与业务数据库相关联的相似模型中获取与所述第一业务数据信息相关联的第一标签向量。进一步地,业务服务器可以基于所述第一标签向量从所述业务数据库中获取满足向量相似条件的第二业务数据信息;该第二业务数据信息的分类类别为第二分类类型,且所述第二分类类型不同于所述第一分类类型;并将具有所述第二分类类型的第二业务数据信息发送至所述用户终端,以使所述用户终端在与所述第一业务数据信息相关联的第二显示界面上显示所述第二业务数据信息。由此可见,本申请实施例可以通过第一业务数据信息相关联的第一标签向量,从业务数据库中查找到满足向量相似条件的第二业务数据信息,所推荐的第二业务数据信息与第一业务数据信息的分类类型不同,从而可以丰富业务数据信息推荐的类型。
进一步地,请参见图6,是本申请实施例提供的另一种数据处理方法的流程示意图。该方法涉及业务数据信息推荐系统中的用户终端和业务服务器。如图6所示,所述方法可以包括:
S201,获取业务数据库中的所有业务数据信息,确定每个业务数据信息所属的聚类簇;
具体地,业务服务器可以获取业务数据库中所有的业务数据信息,该业务数据信息可以包含公众号文章类、书籍类、视频类以及音频类等分类类型所对应的业务数据信息,进一步地,业务服务器可以确定出每个业务数据信息所属的聚类簇。
其中,可以理解的是,业务数据库的每个业务数据信息均包含在聚类簇中,一个聚类簇对应一个分类类型。应当理解,该业务数据库中可以包含与公众号文章类相关联的聚类簇、与书籍类相关联的聚类簇、与视频类相关联的聚类簇以及与音频类相关联的聚类簇等。
S202,从所述聚类簇对应的分类类型中获取目标分类类型,从与所述目标分类类型相关联的聚类簇中获取目标业务数据信息;
具体地,业务服务器可以从上述聚类簇对应的分类类型中选取一个分类类型,作为目标分类类型,进而可以从与目标分类类型相关联的聚类簇中获取目标业务数据信息。
应当理解,业务服务器可以在业务数据库中的聚类簇中,选取公众号文章类作为目标分类类型,从与公众号文章类相关联的聚类簇中获取公众号文章A的业务数据信息,进而可以把公众号文章A的业务数据信息作为目标业务数据信息。同理,业务服务器还可以选取书籍类作为目标分类类型,可以从与书籍类相关联的聚类簇中获取书籍A的业务数据信息,进而可以把书籍A的业务数据信息作为目标业务数据信息。业务服务器也可以选取与视频类或音频类等相关联的聚类簇中的业务数据信息作为目标业务数据信息,其中,选取与视频类或音频类等相关联的聚类簇中的业务数据信息作为目标业务数据信息的描述过程可参见选取与公众号文章类相关联的聚类簇中的业务数据信息作为目标业务数据信息的描述过程,在此不再赘述。
S203,获取所述业务数据库相关联的词向量识别模型,基于所述目标业务数据信息、所述词向量识别模型,确定与所述目标业务数据信息相关联的标签向量;
具体地,业务服务器可以获取所述业务数据库相关联的词向量识别模型。业务服务器可以对所述目标业务数据信息进行分词处理,从分词处理后的M个分词中确定N个关键词,将所述N个关键词分别作为所述目标业务数据信息的标签信息;进一步地,业务服务器可以基于N个标签信息分别对应的编码向量、所述词向量识别模型,得到每个标签信息对应的词向量。其中,所述N为小于或者等于所述M的正整数。进一步地,业务服务器可以获取每个标签信息对应的权重值,根据所述每个标签信息对应的权重值以及相应标签信息对应的词向量,确定所述目标业务数据信息对应的标签向量
其中,该词向量识别模型可以用于将目标业务数据信息中的多个标签信息转换为该目标业务数据信息的标签向量。
应当理解,业务服务器可以获取与业务数据库相关联的词向量识别模型,进一步地,可以对目标业务数据信息进行分词处理。可以理解的是,业务服务器在对目标业务数据信息进行分词时,可以对目标业务数据信息的标题进行分词,也可以对目标业务数据信息的简介进行分词,还可以对目标业务数据信息的分类、读者评价以及作者信息等进行分词。
业务服务器可以将分词处理所得到的M个分词按照在目标业务数据信息中出现的次数(即词频)进行排序,选取词频排序靠前的N个分词作为关键词,并将N个关键词作为目标业务数据信息的标签信息。其中,N是小于或等于M的正整数。应当注意的是,在按词频大小选取关键词时,应注意排除非必要词。例如,在一篇文章中,“是”、“的”、“可以”等这种词是逻辑惯用词,并没有特殊的含义,但在一篇文章中,这种逻辑惯用词相对应的词频比较大。
其中,可以理解的是,业务服务器可以将N个标签信息中的每个标签信息转换为编码向量;每个编码向量均具备同一映射空间中的K个维度信息;所述K为大于或者等于N的正整数,且在所述映射空间中的任意两个标签信息所对应的编码向量均不相同;
其中,业务服务器可以对N个标签信息进行词向量编码。换言之,可以将该目标业务数据信息的N个标签信息进行排序,将排序之后每个标签信息映射在同一映射空间的K个维度信息中。即在该映射空间中,不同的标签信息排序不同,所处的位置也就不同。业务服务器可以将某一个标签信息根据排序所处的位置,将K个维度信息中对应的维度值编码为1,而其他维度值都编码为0。例如,在目标业务数据信息中确定出“话筒”是一个标签信息,且排序为4,将其映射在具有200个维度信息的映射空间中,该标签信息的第4维度值编码为1,其他199个维度信息编码为0,则“话筒”的编码向量可以表示为[0 0 0 1 0 0 0 0 0 0 00 0 0 0 0 …],其中,该编码向量中包含199个0。
进一步地,业务服务器可以在所述映射空间中确定所述每个编码向量中非零值所在的目标维度信息。进而业务服务器可以在与所述词向量识别模型相关联的权重矩阵中,分别确定与每个目标维度信息的维度值相同的行数值所关联的权重系数。其中,所述权重矩阵的行数等于所述映射空间中的K个维度信息。业务服务器可以将该权重系数分别作为与所述每个编码向量对应的每个标签信息的词向量。
为便于理解,进一步地,请参见图7,是本申请实施例提供的一种获取标签信息所对应词向量的场景示意图。如图7所示,可以理解的是,业务服务器在一篇文章A中可以确定出该文章A的多个标签信息。为便于阐述,本申请实施例仅以4个标签信息为例,进而可以描述业务服务器获取目标业务数据信息(例如,文章A)的标签信息所对应词向量的具体过程。
应当理解,业务服务器可以获取文章A的4个标签信息,即为股市、股票、股灾、一条龙。其中,该文章A的分类类型可以为公众号文章类。业务服务器可以将这4个标签信息分别映射在一个具有5个维度信息的映射空间中,将该4个标签信息转换成对应的编码向量。换言之,可以将该4个标签信息按照在文章A中的词频进行排序,即股市、股票、股灾、一条龙。进一步地,业务服务器可以将这4个标签信息分别映射在该映射空间中。也就是业务服务器可以基于该4个标签信息根据排序所处的位置,将映射空间的5个维度信息中对应的维度值编码为1,而其他维度值都编码为0,得到这4个标签信息对应的编码向量。即股市对应的编码向量为[1 0 0 0 0],股票对应的编码向量为[0 1 0 0 0],股灾对应的编码向量为[0 01 0 0],一条龙对应的编码向量为[0 0 0 1 0]。
应当理解,业务服务器可以在该业务数据库相关联的词向量识别模型中获取一个如图7所示的权重矩阵,其中,该权重矩阵的行数与映射空间的维度信息数相同,即是一个5行的权重矩阵。在这个具有5个维度信息的映射空间中,可以确定出每个编码向量中非零值所在的目标维度信息。可以理解的是,目标维度信息所在的维度值的相同行数值所关联的权重系数就是所对应编码向量的词向量。业务服务器可以根据该词向量模型得到每个标签信息对应的词向量,即股市的词向量为[1 2 1 0],股票的词向量为[2 1 4 3],股灾的词向量为[3 2 2 1]以及一条龙的词向量为[2 4 1 1]。
进一步地,请参见图8,是本申请实施例提供的一种根据目标维度信息确定词向量的场景示意图。如图8所示的股票这个标签信息的编码向量可以为图7所示的股票的编码向量,即[0 1 0 0 0],根据该编码向量可以确定出非零值所在的目标维度信息的维度值为2。可以理解的是,业务服务器可以根据股票这个标签信息的编码向量确定出非零值所在的目标维度信息的维度值2,也就是说,股票这个标签信息在该词向量模型的权重矩阵中,确定的权重系数是该权重矩阵第2行的权重系数。可以理解的是,该权重矩阵的第2行所关联的权重系数也就是股票这个标签信息所对应的词向量。其中,图8所示的权重矩阵可以为图7所示的从词向量识别模型中获取的权重矩阵。
其中,其他标签信息的标签向量也可以根据对应标签信息所转换的编码向量确定出该标签信息所对应的词向量,具体描述方式可参见获取股票这个标签信息所对应词向量的描述方式,在此不再赘述。
应当理解,业务服务器在对目标业务数据信息进行分词处理,得到标签信息时,根据标签信息的重要程度可以为不同的标签信息赋予不同的权重,以提高标签信息的置信度。所以,业务服务器可以获取每个标签信息对应的权重值,根据所述每个标签信息对应的权重值以及相应标签信息对应的词向量,确定所述目标业务数据信息对应的标签向量。
其中,可以理解的是,当目标业务数据信息为公众号文章A时,业务服务器可以获取该公众号文章A所在业务数据库相关联的词向量模型,对该公众号文章A进行分词处理,进而可以得到该公众号文章A的标签信息,为便于阐述,这里仅以4个标签信息为例,即业务服务器获得的该公众号文章A的标签信息可以为标签信息1、标签信息2、标签信息3以及标签信息4。进一步地,业务服务器可以将该4个标签信息映射在一个具有200个维度信息的映射空间中,得到对应的词向量1(emb1)、词向量2(emb1)、词向量3(emb1)以及词向量4(emb1)。进一步地,业务服务器可以获取每一个标签信息对应的权重值,将其赋予在对应的标签向量上。可以理解的是,该公众号文章A对应的标签向量(embedding1)的如公式(1)所示:
embedding1=w1*emb1+w2*emb2+w3*emb3+w4*emb4, (1)
其中,w1为标签信息1对应的权重值,w2为标签信息2对应的权重值,w3为标签信息3对应的权重值,w4为标签信息4对应的权重值。
可以理解的是,其他分类类型的业务数据信息获取标签向量的描述方式可参见上述公众号文章A的获取标签向量的描述方式,在此不再赘述。
S204,将所述标签向量以及所述标签向量对应的分类类型,存储至与所述业务数据库相关联的相似模型。
具体地,业务服务器可以将所有业务数据信息的标签向量,根据标签向量对应的分类类型存储至与业务数据库相关联的相似模型中。可以理解的是,该相似模型可以如上述图4所示的相似模型,业务数据库中与分类类型相关联的聚类簇中所有业务数据信息的标签向量,均存储在与该业务数据库相关联的相似模型中与该分类类型相关联的标签向量集中。
S205,响应针对第一显示界面的第一业务数据信息触发的触发操作,向业务服务器发送针对所述第一业务数据信息的业务辅助信息;
其中,所述第一业务数据信息的分类类型可以为第一分类类型。
可以理解的是,用户终端在执行步骤S205时,业务服务器可以获取目标用户的历史行为信息,基于所述历史行为信息可以从业务数据库中获取多个业务数据信息,并将多个业务数据信息构成的信息数据流返回给用户终端。进一步地,该用户终端所对应的目标用户可以从信息数据流中确定第一业务数据信息。进而用户终端可以向业务服务器发送目标推荐请求,从该目标推荐请求中获取第一业务数据信息相关联的业务辅助信息。所述目标推荐请求是由所述用户终端响应针对第一显示界面的触发操作所确定的。
S206,基于所述业务辅助信息、所述第一分类类型,在业务数据库相关联的相似模型中获取与所述第一业务数据信息相关联的第一标签向量;
具体地,业务数据库中的每个业务数据信息均包含在聚类簇中,一个聚类簇中可以对应一个分类类型。可以理解的是,业务服务器可以根据第一业务数据信息相关联的业务辅助信息,在业务数据库中获取到第一业务数据信息的第一分类类型所对应的聚类簇。业务服务器可以在与业务数据库相关联的相似模型中,根据该聚类簇对应的分类类型获取与该第一业务数据信息相关联的标签向量。其中,本申请实施例可以将该标签向量称之为第一标签向量。所述相似模型中存储有与所述业务数据库相关联的聚类簇中的每个业务数据信息相关联的标签向量;所述聚类簇对应的分类类型可以包含所述第一分类类型。
S207,基于所述第一标签向量从所述业务数据库中获取满足向量相似条件的第二业务数据信息;
其中,所述第二业务数据信息的分类类别为第二分类类型,且所述第二分类类型不同于所述第一分类类型。
具体地,业务服务器可以从所述相似模型相关联的分类类型中将除所述第一分类类型之外的分类类型确定为待处理分类类型,从而根据所述待处理分类类型确定第二分类类型。进一步地,业务服务器可以在相似模型中,将与该第二分类类型相关联的标签向量分别作为第二标签向量,并可以通过相似模型确定第一标签向量与每一个第二标签向量之间的相似距离。在业务数据库中,业务服务器可以获取满足向量相似条件的第二业务数据信息。其中,所述相似模型中包含与所述业务数据库相关联的聚类簇中的每个业务数据信息相关联的标签向量;所述聚类簇对应的分类类型包含所述第一分类类型。
其中,所述业务服务器根据目标用户选择第二分类类型具体实现方式可以参见上述图5a所对应实施例中确定第二分类类型的描述,这里将不再赘述。
S208,将具有所述第二分类类型的第二业务数据信息发送至所述用户终端;
具体地,业务服务器可以从具有所述第二分类类型的第二业务数据信息中确定所述M个子分类类型中的每个子分类类型分别对应的第二业务数据信息。此时,业务服务器可以在所述每个子分类类型分别对应的第二业务数据信息中,将携带已推荐标识的第二业务数据信息确定为待过滤业务数据信息。进一步地,业务服务器可以在所述每个子分类类型分别对应的第二业务数据信息中过滤所述待过滤业务数据信息,得到所述每个子分类类型分别对应的待推荐业务数据信息,进而可以将所述每个子分类类型分别对应的待推荐业务数据信息发送至所述用户终端。其中,第二分类类型包含M个子分类类型;M为正整数。
其中,所述步骤S205-步骤S208的具体实施方式可参见上述图3所对应实施例中对步骤S101-步骤S104的描述,这里将不再赘述。
在本申请实施例中,用户终端响应针对第一显示界面的触发操作,向业务服务器发送第一业务数据信息的辅助信息,该第一业务数据信息的分类类型为第一分类类型;此时,业务服务器可以基于获取到的业务辅助信息、所述第一分类类型,在与业务数据库相关联的相似模型中获取与所述第一业务数据信息相关联的第一标签向量。进一步地,业务服务器可以基于所述第一标签向量从所述业务数据库中获取满足向量相似条件的第二业务数据信息;该第二业务数据信息的分类类别为第二分类类型,且所述第二分类类型不同于所述第一分类类型;并将具有所述第二分类类型的第二业务数据信息发送至所述用户终端,以使所述用户终端在与所述第一业务数据信息相关联的第二显示界面上显示所述第二业务数据信息。由此可见,本申请实施例可以通过第一业务数据信息相关联的第一标签向量,从业务数据库中查找到满足向量相似条件的第二业务数据信息,所推荐的第二业务数据信息与第一业务数据信息的分类类型不同,从而可以丰富业务数据信息推荐的类型。
进一步地,请参见图9,是本申请实施例提供的一种数据处理装置的结构示意图。该数据处理装置1可以应用于业务服务器,该业务服务器可以为上述图2所对应实施例中的业务服务器。所述数据处理装置1可以包括:第一获取模块10,第二获取模块20,第三获取模块30、发送模块40、聚类簇确定模块50、第四获取模块60、标签向量确定模块70以及存储模块80。
所述第一获取模块10,用于获取用户终端针对第一业务数据信息发送的业务辅助信息;所述第一业务数据信息为所述用户终端响应针对第一显示界面触发的触发操作所确定的;所述第一业务数据信息的分类类型为第一分类类型;
其中,所述第一获取模块10包括:第一获取单元101、信息数据流返回单元102以及第二获取单元103。
所述第一获取单元101,用于获取用户终端对应的目标用户的历史行为信息,基于所述历史行为信息从业务数据库中获取多个业务数据信息;
其中,所述第一获取单元101包括:第一接收子单元1011、第一获取子单元1012以及第二获取子单元1013。
所述第一接收子单元1011,用于接收用户终端发送的首页加载请求;所述首页加载请求中携带所述用户终端的终端标识信息;
所述第一获取子单元1012,用于基于所述终端标识信息从历史行为数据库中获取所述用户终端对应的目标用户的历史行为信息;所述历史行为信息中包含历史电子读物以及所述历史电子读物的阅读进度;
所述第二获取子单元1013,用于基于所述历史电子读物以及所述历史电子读物的阅读进度,从业务数据库中获取多个业务数据信息。
其中,所述第一接收子单元1011、第一获取子单元1012以及第二获取子单元1013的具体实现方式可以参见上述图3所对应实施例中的对第一显示界面的描述,这里将不再继续进行赘述。
所述信息数据流返回单元102,用于将所述多个业务数据信息构成的信息数据流返回给所述用户终端,以使所述用户终端在第一显示界面上显示所述信息数据流中的每个业务数据信息;
所述第二获取单元103,用于获取所述用户终端响应针对所述第一显示界面触发的触发操作所发送的目标推荐请求,从所述目标推荐请求中获取第一业务数据信息相关联的业务辅助信息;所述第一业务数据信息为所述多个业务数据信息中与所述触发操作对应的业务数据信息。
其中,所述第一获取单元101、信息数据流返回单元102以及第二获取单元103的具体实现方式可以参见上述图3所对应实施例中对步骤S101的描述,这里将不再继续进行赘述。
所述第二获取模块20,用于基于所述业务辅助信息、所述第一分类类型,在业务数据库中获取与所述第一业务数据信息相关联的第一标签向量;
所述第三获取模块30,用于基于所述第一标签向量从所述业务数据库中获取满足向量相似条件的第二业务数据信息;所述第二业务数据信息的分类类别为第二分类类型,且所述第二分类类型不同于所述第一分类类型;
其中,所述相似模型中包含与所述业务数据库相关联的聚类簇中的每个业务数据信息相关联的标签向量;所述聚类簇对应的分类类型包含所述第一分类类型;
所述第三获取模块30包括:第一确定单元301、第二确定单元302、第三确定单元303以及第四确定单元304。
所述第一确定单元301,用于从所述相似模型相关联的分类类型中将除所述第一分类类型之外的分类类型确定为待处理分类类型,根据所述待处理分类类型确定第二分类类型;
其中,所述第一确定单元301包括:第一确定子单元3011、返回子单元3012以及第二接收子单元3013。
所述第一确定子单元3011,用于从所述相似模型相关联的分类类型中将除所述第一分类类型之外的分类类型确定为待处理分类类型;
所述返回子单元3012,用于将包含所述待处理分类类型的中转显示界面返回给所述用户终端,以使所述用户终端对应的目标用户在分类选取时长内从所述待处理分类类型中选取第二分类类型;
所述第二接收子单元3013,用于接收所述用户终端在所述分类选取时长内所发送的第二分类类型。
其中,所述第一确定子单元3011、返回子单元3012以及第二接收子单元3013的具体实现方式可以参见上述图3所对应实施例中对第二分类类型的描述,这里将不再继续进行赘述。
所述第二确定单元302,用于在所述相似模型中将与所述第二分类类型相关联的标签向量分别作为第二标签向量;
所述第三确定单元303,用于通过所述相似模型确定所述第一标签向量与每个第二标签向量之间的相似距离;
所述第四确定单元304,用于在业务数据库中将相似距离大于相似距离阈值的第二标签向量所对应的业务数据信息,确定为满足向量相似条件的第二业务数据信息。
其中,第一确定单元301、第二确定单元302、第三确定单元303以及第四确定单元304的具体实现方式可以参见上述图3所对应实施例中对步骤S103的描述,这里将不再继续进行赘述。
所述发送模块40,用于将具有所述第二分类类型的第二业务数据信息发送至所述用户终端,以使所述用户终端在与所述第一业务数据信息相关联的第二显示界面上显示所述第二业务数据信息。
其中,所述发送模块40包括:第五确定单元401,第六确定单元402,过滤单元403以及发送单元404。
所述第五确定单元401,用于从具有所述第二分类类型的第二业务数据信息中确定所述M个子分类类型中的每个子分类类型分别对应的第二业务数据信息;
所述第六确定单元402,用于在所述每个子分类类型分别对应的第二业务数据信息中,将携带已推荐标识的第二业务数据信息确定为待过滤业务数据信息;
所述过滤单元403,用于在所述每个子分类类型分别对应的第二业务数据信息中过滤所述待过滤业务数据信息,得到所述每个子分类类型分别对应的待推荐业务数据信息;
所述发送单元404,用于将所述每个子分类类型分别对应的待推荐业务数据信息发送至所述用户终端。
其中,所述第五确定单元401,第六确定单元402,过滤单元403以及发送单元404的具体实现方式可以参见上述图3所对应实施例中对第二显示界面的描述,这里将不再继续进行赘述。
其中,所述装置1还包括:
所述聚类簇确定模块50,用于获取业务数据库中的所有业务数据信息,确定每个业务数据信息所属的聚类簇;一个聚类簇对应一个分类类型;
所述第四获取模块60,用于从所述聚类簇对应的分类类型中获取目标分类类型,从与所述目标分类类型相关联的聚类簇中获取目标业务数据信息;
所述标签向量确定模块70,用于获取所述业务数据库相关联的词向量识别模型,基于所述目标业务数据信息、所述词向量识别模型,确定与所述目标业务数据信息相关联的标签向量;
其中,所述标签向量确定模块70包括:第三获取单元701、分词单元702、第四获取单元703以及第五获取单元704。
所述第三获取单元701,用于获取所述业务数据库相关联的词向量识别模型;
所述分词单元702,用于对所述目标业务数据信息进行分词处理,从分词处理后的M个分词中确定N个关键词,将所述N个关键词分别作为所述目标业务数据信息的标签信息;所述N为小于或者等于所述M的正整数;
所述第四获取单元703,用于基于N个标签信息分别对应的编码向量、所述词向量识别模型,获取每个标签信息对应的词向量;
其中,所述第四获取单元703包括:转换子单元7031、目标维度确定子单元7032、权重系数确定子单元7033以及词向量确定子单元7034。
所述转换子单元7031,用于将N个标签信息中的每个标签信息转换为编码向量;每个编码向量均具备同一映射空间中的K个维度信息;所述K为大于或者等于N的正整数,且在所述映射空间中的任意两个标签信息所对应的编码向量均不相同;
所述目标维度确定子单元7032,用于在所述映射空间中确定所述每个编码向量中非零值所在的目标维度信息;
所述权重系数确定子单元7033,用于在与所述词向量识别模型相关联的权重矩阵中分别确定与每个目标维度信息的维度值相同的行数值所关联的权重系数;所述权重矩阵的行数等于所述映射空间中的K个维度信息;
所述词向量确定子单元7034,用于将确定的与所述每个目标维度信息的维度值相同的行数值所关联的权重系数分别作为与所述每个编码向量对应的每个标签信息的词向量。
其中,所述转换子单元7031、目标维度确定子单元7032、权重系数确定子单元7033以及词向量确定子单元7034的具体实现方式可以参见上述图6所对应实施例中对词向量的描述,这里将不再继续进行赘述。
所述第五获取单元704,用于获取每个标签信息对应的权重值,根据所述每个标签信息对应的权重值以及相应标签信息对应的词向量,确定所述目标业务数据信息对应的标签向量。
其中,所述第三获取单元701、分词单元702、第四获取单元703以及第五获取单元704的具体实现方式可以参见上述图6所对应实施例中对步骤203的描述,这里将不再继续进行赘述。
所述存储模块80,用于将所述标签向量以及所述标签向量对应的分类类型,存储至与所述业务数据库相关联的相似模型。
其中,所述第一获取模块10,第二获取模块20,第三获取模块30、发送模块40、聚类簇确定模块50、第四获取模块60、标签向量确定模块70以及存储模块80的具体实现方式可以参见上述图6所对应实施例中对步骤S201-S208的描述,这里将不再继续进行赘述。另外,对采用相同方法的有益效果描述,也不再进行赘述。
进一步地,请参见图10,是本申请实施例提供的一种计算机设备的示意图。如图10所示,所述计算机设备1000可以为上述图2对应实施例中的业务服务器,所述计算机设备1000可以包括:至少一个处理器1001,例如CPU,至少一个网络接口1004,用户接口1003,存储器1005,至少一个通信总线1002。其中,通信总线1002用于实现这些组件之间的连接通信。其中,用户接口1003可以包括显示屏(Display)、键盘(Keyboard),网络接口1004可选地可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器1005可以是高速RAM存储器,也可以是非不稳定的存储器(non-volatile memory),例如至少一个磁盘存储器。存储器1005可选地还可以是至少一个位于远离前述处理器1001的存储装置。如图10所示,作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及设备控制应用程序。
在图10所示的计算机设备1000中,网络接口1004主要用于与用户终端进行网络通信;而用户接口1003主要用于为用户提供输入的接口;而处理器1001可以用于调用存储器1005中存储的设备控制应用程序,以实现:
获取用户终端针对第一业务数据信息发送的业务辅助信息;所述第一业务数据信息为所述用户终端响应针对第一显示界面触发的触发操作所确定的;所述第一业务数据信息的分类类型为第一分类类型;
基于所述业务辅助信息、所述第一分类类型,在与业务数据库相关联的相似模型中获取与所述第一业务数据信息相关联的第一标签向量;
基于所述第一标签向量从所述业务数据库中获取满足向量相似条件的第二业务数据信息;所述第二业务数据信息的分类类别为第二分类类型,且所述第二分类类型不同于所述第一分类类型;
将具有所述第二分类类型的第二业务数据信息发送至所述用户终端,以使所述用户终端在与所述第一业务数据信息相关联的第二显示界面上显示所述第二业务数据信息。
应当理解,本申请实施例中所描述的计算机设备1000可执行前文图3和图6所对应实施例中对所述数据处理方法的描述,也可执行前文图9所对应实施例中对所述数据处理装置1的描述,在此不再赘述。另外,对采用相同方法的有益效果描述,也不再进行赘述。
此外,这里需要指出的是:本申请实施例还提供了一种计算机可读存储介质,且所述计算机可读存储介质中存储有前文提及的数据处理装置1所执行的计算机程序,且所述计算机程序包括程序指令,当所述处理器执行所述程序指令时,能够执行前文图3或者图6所对应实施例中对所述数据处理方法的描述,因此,这里将不再进行赘述。另外,对采用相同方法的有益效果描述,也不再进行赘述。对于本申请所涉及的计算机可读存储介质实施例中未披露的技术细节,请参照本申请方法实施例的描述。
进一步地,请参见图11,是本申请提供的另一种数据处理装置的结构示意图。该数据处理装置2可以应用于用户终端,该用户终端可以为上述图2所对应实施例中的目标用户终端,所述数据处理装置2可以包括:响应模块100,接收模块200以及显示模块300。
所述响应模块100,用于响应针对第一显示界面中的第一业务数据信息触发的触发操作,向业务服务器发送针对所述第一业务数据信息的业务辅助信息;所述第一业务数据信息的分类类型为第一分类类型;
所述接收模块200,用于接收所述业务服务器基于所述第一业务数据信息相关联的第一标签向量所确定的第二业务数据信息;所述第二业务数据信息为在业务数据库中所确定的满足向量相似条件的业务数据信息;所述第一标签向量是所述业务服务器基于所述业务辅助信息、所述第一分类类型以及与所述业务数据库相关联的相似模型所确定的;
所述显示模块300,用于在与所述第一业务数据信息相关联的第二显示界面上显示所述第二业务数据信息。
其中,所述响应模块100,接收模块200以及显示模块300的具体实现方式可以参见上述图3和图6所对应实施例中对用户终端的描述,这里将不再继续精赘述。另外,对采用相同方法的有益效果描述,也不再进行赘述。
进一步地,请参见图12,是本申请实施例提供的另一种计算机设备的示意图。如图12所示,所述计算机设备4000可以为上述图2对应实施例中的目标用户终端,所述计算机设备4000可以包括:至少一个处理器4001,例如CPU,至少一个网络接口4004,用户接口4003,存储器4005,至少一个通信总线4002。其中,通信总线4002用于实现这些组件之间的连接通信。其中,用户接口4003可以包括显示屏(Display)、键盘(Keyboard),网络接口4004可选地可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器4005可以是高速RAM存储器,也可以是非不稳定的存储器(non-volatile memory),例如至少一个磁盘存储器。存储器4005可选地还可以是至少一个位于远离前述处理器4001的存储装置。如图12所示,作为一种计算机存储介质的存储器4005中可以包括操作系统、网络通信模块、用户接口模块以及设备控制应用程序。
在图12所示的计算机设备4000中,网络接口4004主要用于与业务服务器进行网络通信;而用户接口4003主要用于为用户提供输入的接口;而处理器4001可以用于调用存储器4005中存储的设备控制应用程序,以实现:
获取用户终端针对第一业务数据信息发送的业务辅助信息;所述第一业务数据信息为所述用户终端响应针对第一显示界面触发的触发操作所确定的;所述第一业务数据信息的分类类型为第一分类类型;
基于所述业务辅助信息、所述第一分类类型,在与业务数据库相关联的相似模型中获取与所述第一业务数据信息相关联的第一标签向量;
基于所述第一标签向量从所述业务数据库中获取满足向量相似条件的第二业务数据信息;所述第二业务数据信息的分类类别为第二分类类型,且所述第二分类类型不同于所述第一分类类型;
将具有所述第二分类类型的第二业务数据信息发送至所述用户终端,以使所述用户终端在与所述第一业务数据信息相关联的第二显示界面上显示所述第二业务数据信息。
应当理解,本申请实施例中所描述的计算机设备4000可执行前文图3和图6所对应实施例中对所述数据处理方法的描述,也可执行前文图11所对应实施例中对所述数据处理装置2的描述,在此不再赘述。另外,对采用相同方法的有益效果描述,也不再进行赘述。
此外,这里需要指出的是:本申请实施例还提供了一种计算机可读存储介质,且所述计算机可读存储介质中存储有前文提及的数据处理装置2所执行的计算机程序,且所述计算机程序包括程序指令,当所述处理器执行所述程序指令时,能够执行前文图3或者图6所对应实施例中对所述数据处理方法的描述,因此,这里将不再进行赘述。另外,对采用相同方法的有益效果描述,也不再进行赘述。对于本申请所涉及的计算机可读存储介质实施例中未披露的技术细节,请参照本申请方法实施例的描述。
进一步的,请参见图13,是本申请实施例提供的一种数据处理系统的结构示意图。该数据处理系统3可以包含数据处理装置1a和数据处理装置2a。其中,所述数据处理装置1a可以为上述图9所对应实施例中的数据处理装置1,可以理解的是,该数据处理装置1a可以集成在上述图2所对应实施例中的业务服务器,因此,这里将不再进行赘述。其中,所述数据处理装置2a可以为上述图11所对应实施例中的数据处理装置2,可以理解的是,该数据处理装置2a可以集成在上述图2所对应实施例中的目标用户终端,因此,这里将不再进行赘述。另外,对采用相同方法的有益效果描述,也不再进行赘述。对于本申请所涉及的数据处理系统实施例中未披露的技术细节,请参照本申请方法实施例的描述。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(Random AccessMemory,RAM)等。
以上所揭露的仅为本申请较佳实施例而已,当然不能以此来限定本申请之权利范围,因此依本申请权利要求所作的等同变化,仍属本申请所涵盖的范围。

Claims (14)

1.一种数据处理的方法,所述方法应用于业务服务器,其特征在于,包括:
获取用户终端针对第一业务数据信息发送的业务辅助信息;所述第一业务数据信息为所述用户终端响应针对第一显示界面触发的触发操作所确定的;所述第一业务数据信息的分类类型为第一分类类型;
基于所述业务辅助信息、所述第一分类类型,在与业务数据库相关联的相似模型中获取与所述第一业务数据信息相关联的第一标签向量;
基于所述第一标签向量从所述业务数据库中获取满足向量相似条件的第二业务数据信息;所述第二业务数据信息的分类类别为第二分类类型,且所述第二分类类型不同于所述第一分类类型;
将具有所述第二分类类型的第二业务数据信息发送至所述用户终端,以使所述用户终端在与所述第一业务数据信息相关联的第二显示界面上显示所述第二业务数据信息。
2.根据权利要求1所述的方法,其特征在于,所述获取用户终端针对第一业务数据信息发送的业务辅助信息,包括:
获取用户终端对应的目标用户的历史行为信息,基于所述历史行为信息从业务数据库中获取多个业务数据信息;
将所述多个业务数据信息构成的信息数据流返回给所述用户终端,以使所述用户终端在第一显示界面上显示所述信息数据流中的每个业务数据信息;
获取所述用户终端响应针对所述第一显示界面触发的触发操作所发送的目标推荐请求,从所述目标推荐请求中获取第一业务数据信息相关联的业务辅助信息;所述第一业务数据信息为所述多个业务数据信息中与所述触发操作对应的业务数据信息。
3.根据权利要求2所述的方法,其特征在于,所述获取用户终端对应的目标用户的历史行为信息,基于所述历史行为信息从业务数据库中获取多个业务数据信息,包括:
接收用户终端发送的首页加载请求;所述首页加载请求中携带所述用户终端的终端标识信息;
基于所述终端标识信息从历史行为数据库中获取所述用户终端对应的目标用户的历史行为信息;所述历史行为信息中包含历史电子读物以及所述历史电子读物的阅读进度;
基于所述历史电子读物以及所述历史电子读物的阅读进度,从业务数据库中获取多个业务数据信息。
4.根据权利要求1所述的方法,其特征在于,还包括:
获取业务数据库中的所有业务数据信息,确定每个业务数据信息所属的聚类簇;一个聚类簇对应一个分类类型;
从所述聚类簇对应的分类类型中获取目标分类类型,从与所述目标分类类型相关联的聚类簇中获取目标业务数据信息;
获取所述业务数据库相关联的词向量识别模型,基于所述目标业务数据信息、所述词向量识别模型,确定与所述目标业务数据信息相关联的标签向量;
将所述标签向量以及所述标签向量对应的分类类型,存储至与所述业务数据库相关联的相似模型。
5.根据权利要求4所述的方法,其特征在于,所述获取所述业务数据库相关联的词向量识别模型,基于所述目标业务数据信息、所述词向量识别模型,确定与所述目标业务数据信息相关联的标签向量,包括:
获取所述业务数据库相关联的词向量识别模型;
对所述目标业务数据信息进行分词处理,从分词处理后的M个分词中确定N个关键词,将所述N个关键词分别作为所述目标业务数据信息的标签信息;所述N为小于或者等于所述M的正整数;
基于N个标签信息分别对应的编码向量、所述词向量识别模型,得到每个标签信息对应的词向量;
获取每个标签信息对应的权重值,根据所述每个标签信息对应的权重值以及相应标签信息对应的词向量,确定所述目标业务数据信息对应的标签向量。
6.根据权利要求5所述的方法,其特征在于,所述基于N个标签信息分别对应的编码向量、所述词向量识别模型,得到每个标签信息对应的词向量;包括:
将N个标签信息中的每个标签信息转换为编码向量;每个编码向量均具备同一映射空间中的K个维度信息;所述K为大于或者等于N的正整数,且在所述映射空间中的任意两个标签信息所对应的编码向量均不相同;
在所述映射空间中确定所述每个编码向量中非零值所在的目标维度信息;
在与所述词向量识别模型相关联的权重矩阵中分别确定与每个目标维度信息的维度值相同的行数值所关联的权重系数;所述权重矩阵的行数等于所述映射空间中的K个维度信息;
将确定的与所述每个目标维度信息的维度值相同的行数值所关联的权重系数分别作为与所述每个编码向量对应的每个标签信息的词向量。
7.根据权利要求1所述的方法,其特征在于,所述相似模型中包含与所述业务数据库相关联的聚类簇中的每个业务数据信息相关联的标签向量;所述聚类簇对应的分类类型包含所述第一分类类型;
所述基于所述第一标签向量从所述业务数据库中获取满足向量相似条件的第二业务数据信息,包括:
从所述相似模型相关联的分类类型中将除所述第一分类类型之外的分类类型确定为待处理分类类型,根据所述待处理分类类型确定第二分类类型;
在所述相似模型中将与所述第二分类类型相关联的标签向量分别作为第二标签向量;
通过所述相似模型确定所述第一标签向量与每个第二标签向量之间的相似距离;
在业务数据库中将相似距离大于相似距离阈值的第二标签向量所对应的业务数据信息,确定为满足向量相似条件的第二业务数据信息。
8.根据权利要求7所述的方法,其特征在于,所述从所述相似模型相关联的分类类型中将除所述第一分类类型之外的分类类型确定为待处理分类类型,根据所述待处理分类类型确定第二分类类型,包括:
从所述相似模型相关联的分类类型中将除所述第一分类类型之外的分类类型确定为待处理分类类型;
将包含所述待处理分类类型的中转显示界面返回给所述用户终端,以使所述用户终端对应的目标用户在分类选取时长内从所述待处理分类类型中选取第二分类类型;
接收所述用户终端在所述分类选取时长内所发送的第二分类类型。
9.根据权利要求1所述的方法,其特征在于,所述第二分类类型包含M个子分类类型;M为正整数;
所述将具有所述第二分类类型的第二业务数据信息发送至所述用户终端,包括:
从具有所述第二分类类型的第二业务数据信息中确定所述M个子分类类型中的每个子分类类型分别对应的第二业务数据信息;
在所述每个子分类类型分别对应的第二业务数据信息中,将携带已推荐标识的第二业务数据信息确定为待过滤业务数据信息;
在所述每个子分类类型分别对应的第二业务数据信息中过滤所述待过滤业务数据信息,得到所述每个子分类类型分别对应的待推荐业务数据信息;
将所述每个子分类类型分别对应的待推荐业务数据信息发送至所述用户终端。
10.一种数据处理方法,所述方法应用于用户终端,其特征在于,包括:
响应针对第一显示界面中的第一业务数据信息触发的触发操作,向业务服务器发送针对所述第一业务数据信息的业务辅助信息;所述第一业务数据信息的分类类型为第一分类类型;
接收所述业务服务器基于所述第一业务数据信息相关联的第一标签向量所确定的第二业务数据信息;所述第二业务数据信息为在业务数据库中所确定的满足向量相似条件的业务数据信息;所述第一标签向量是所述业务服务器基于所述业务辅助信息、所述第一分类类型以及与所述业务数据库相关联的相似模型所确定的;
在与所述第一业务数据信息相关联的第二显示界面上显示所述第二业务数据信息。
11.一种数据处理装置,所述装置应用于业务服务器,其特征在于,包括:
第一获取模块,用于获取用户终端针对第一业务数据信息发送的业务辅助信息;所述第一业务数据信息为所述用户终端响应针对第一显示界面触发的触发操作所确定的;所述第一业务数据信息的分类类型为第一分类类型;
第二获取模块,用于基于所述业务辅助信息、所述第一分类类型,在业务数据库中获取与所述第一业务数据信息相关联的第一标签向量;
第三获取模块,用于基于所述第一标签向量从所述业务数据库中获取满足向量相似条件的第二业务数据信息;所述第二业务数据信息的分类类别为第二分类类型,且所述第二分类类型不同于所述第一分类类型;
发送模块,用于将具有所述第二分类类型的第二业务数据信息发送至所述用户终端,以使所述用户终端在与所述第一业务数据信息相关联的第二显示界面上显示所述第二业务数据信息。
12.一种数据处理装置,所述装置应用于用户终端,其特征在于,包括:
响应模块,用于响应针对第一显示界面中的第一业务数据信息触发的触发操作,向业务服务器发送针对所述第一业务数据信息的业务辅助信息;所述第一业务数据信息的分类类型为第一分类类型;
接收模块,用于接收所述业务服务器基于所述第一业务数据信息相关联的第一标签向量所确定的第二业务数据信息;所述第二业务数据信息为在业务数据库中所确定的满足向量相似条件的业务数据信息;所述第一标签向量是所述业务服务器基于所述业务辅助信息、所述第一分类类型以及与所述业务数据库相关联的相似模型所确定的;
显示模块,用于在与所述第一业务数据信息相关联的第二显示界面上显示所述第二业务数据信息。
13.一种计算机设备,其特征在于,包括:处理器、存储器以及网络接口;
所述处理器与存储器、网络接口相连,其中,网络接口用于提供数据通信功能,所述存储器用于存储程序代码,所述处理器用于调用所述程序代码,以执行如权利要求1-10任一项所述的方法。
14.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被处理器执行时,执行如权利要求1-10任一项所述的方法。
CN201911025235.5A 2019-10-25 2019-10-25 一种数据处理的方法、装置及存储介质 Pending CN110765328A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911025235.5A CN110765328A (zh) 2019-10-25 2019-10-25 一种数据处理的方法、装置及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911025235.5A CN110765328A (zh) 2019-10-25 2019-10-25 一种数据处理的方法、装置及存储介质

Publications (1)

Publication Number Publication Date
CN110765328A true CN110765328A (zh) 2020-02-07

Family

ID=69333800

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911025235.5A Pending CN110765328A (zh) 2019-10-25 2019-10-25 一种数据处理的方法、装置及存储介质

Country Status (1)

Country Link
CN (1) CN110765328A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111611449A (zh) * 2020-05-08 2020-09-01 百度在线网络技术(北京)有限公司 信息编码方法、装置、电子设备及计算机可读存储介质
CN113781235A (zh) * 2021-09-01 2021-12-10 微民保险代理有限公司 一种数据处理方法、装置、计算机设备以及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070250468A1 (en) * 2006-04-24 2007-10-25 Captive Traffic, Llc Relevancy-based domain classification
CN106897067A (zh) * 2017-02-26 2017-06-27 广州衡昊数据科技有限公司 一种基于人机交互技术建模的方法和专家系统
CN107016420A (zh) * 2016-12-08 2017-08-04 阿里巴巴集团控股有限公司 一种业务处理方法及装置
CN108363821A (zh) * 2018-05-09 2018-08-03 深圳壹账通智能科技有限公司 一种信息推送方法、装置、终端设备及存储介质
CN110008226A (zh) * 2019-04-03 2019-07-12 平安信托有限责任公司 数据模型的构建方法、装置、计算机设备和存储介质

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070250468A1 (en) * 2006-04-24 2007-10-25 Captive Traffic, Llc Relevancy-based domain classification
CN107016420A (zh) * 2016-12-08 2017-08-04 阿里巴巴集团控股有限公司 一种业务处理方法及装置
CN106897067A (zh) * 2017-02-26 2017-06-27 广州衡昊数据科技有限公司 一种基于人机交互技术建模的方法和专家系统
CN107844567A (zh) * 2017-02-26 2018-03-27 广州衡昊数据科技有限公司 一种业务经验包推荐系统和方法
CN108363821A (zh) * 2018-05-09 2018-08-03 深圳壹账通智能科技有限公司 一种信息推送方法、装置、终端设备及存储介质
CN110008226A (zh) * 2019-04-03 2019-07-12 平安信托有限责任公司 数据模型的构建方法、装置、计算机设备和存储介质

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111611449A (zh) * 2020-05-08 2020-09-01 百度在线网络技术(北京)有限公司 信息编码方法、装置、电子设备及计算机可读存储介质
CN111611449B (zh) * 2020-05-08 2023-08-29 百度在线网络技术(北京)有限公司 信息编码方法、装置、电子设备及计算机可读存储介质
CN113781235A (zh) * 2021-09-01 2021-12-10 微民保险代理有限公司 一种数据处理方法、装置、计算机设备以及存储介质

Similar Documents

Publication Publication Date Title
CN110825957B (zh) 基于深度学习的信息推荐方法、装置、设备及存储介质
CN110019616B (zh) 一种poi现势状态获取方法及其设备、存储介质、服务器
CN110619076B (zh) 一种搜索词推荐方法、装置、计算机及存储介质
CN111488426A (zh) 一种查询意图确定方法、装置及处理设备
CN104423621A (zh) 拼音字符串处理方法和装置
CN113590850A (zh) 多媒体数据的搜索方法、装置、设备及存储介质
CN107832338B (zh) 一种识别核心产品词的方法和系统
CN112434072B (zh) 搜索方法、装置、电子设备及存储介质
CN104102639A (zh) 基于文本分类的推广触发方法和装置
CN111695345A (zh) 文本中实体识别方法、以及装置
CN111695960A (zh) 一种对象推荐系统、方法、电子设备及存储介质
CN110619051A (zh) 问题语句分类方法、装置、电子设备及存储介质
CN111460290A (zh) 信息的推荐方法、装置、设备和存储介质
CN110765328A (zh) 一种数据处理的方法、装置及存储介质
CN114706987B (zh) 文本类目预测方法、装置、设备、存储介质和程序产品
CN115712657A (zh) 基于元宇宙的用户需求挖掘方法及系统
CN111104572A (zh) 用于模型训练的特征选择方法、装置及电子设备
JP5430960B2 (ja) コンテンツ分類装置、方法及びプログラム
CN111951790A (zh) 一种语音处理方法、装置、终端及存储介质
CN111930891A (zh) 基于知识图谱的检索文本扩展方法及相关装置
CN108595395B (zh) 一种昵称的生成方法、装置及设备
CN113591881B (zh) 基于模型融合的意图识别方法、装置、电子设备及介质
KR20160128591A (ko) 메타 데이터를 이용하는 콘텐츠 추천 방법 및 이를 수행하는 장치
CN114282119A (zh) 一种基于异构信息网络的科技信息资源检索方法及系统
CN111310016B (zh) 标签挖掘方法、装置、服务器和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40021425

Country of ref document: HK

SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination