数据处理方法以及装置
技术领域
本申请涉及互联网技术领域,特别涉及两种数据处理方法。本申请同时涉及两种数据处理装置,两种计算设备,以及一种计算机可读存储介质。
背景技术
随着计算机通信技术以及互联网技术的发展,互联网的信息资源成指数增长,通过互联网产品检索并获取相关信息越来越成为人们生活以及工作中不可或缺的一部分。
目前大多数互联网产品提供的检索能力千篇一律,如歌曲检索、视频检索、网页检索等,即用户输入关于产品内容的关键词后,系统根据输入的关键词呈现给用户相关的产品内容,不同用户输入相同关键词,检索到的内容是相同的。
然而这种检索方式仅能满足表层用户需求,如何针对不同用户的需求,在输入关键词后检索出个性化的内容,是目前需要解决的技术问题。
发明内容
有鉴于此,本申请实施例提供了两种数据处理方法。本申请同时涉及两种数据处理装置,两种计算设备,以及一种计算机可读存储介质,以解决现有技术中存在的技术缺陷。
根据本申请实施例的第一方面,提供了一种数据处理方法,包括:
获取待检索关键词;
在第一数据库中检索所述关键词,获取与所述关键词匹配的第一目标对象,其中,所述第一数据库存储目标对象以及所述目标对象的属性信息;
在第二数据库中检索所述关键词,获取与所述关键词匹配的用户行为关联信息,基于所述用户行为关联信息与所述目标对象的标识之间的关联关系获取第二目标对象的标识,其中,所述第二数据库存储用户行为关联信息与目标对象的标识之间的关联关系,所述用户行为包括用户对所述目标对象的操作行为;
根据所述第二目标对象的标识,在所述第一数据库中获取第二目标对象;
基于所述第一目标对象和所述第二目标对象获取推荐数据。
可选的,在第二数据库中检索所述关键词,获取与所述关键词匹配的用户行为关联信息包括:
对所述关键词进行文本识别和语义分析,提取特征关键词和所述关键词语义;
根据所述关键词语义在所述第二数据库中检索所述特征关键词,获取与所述关键词匹配的用户行为关联信息。
可选的,在第二数据库中检索所述关键词,获取与所述关键词匹配的用户行为关联信息包括:
将所述关键词输入预先训练好的识别模型,所述识别模型被训练为根据所述关键词获取所述用户行为关联信息;
所述识别模型响应于所述关键词作为输入而获取用户行为关联信息。
可选的,所述识别模型经以下步骤训练生成,包括:
获取样本数据以及每个样本数据对应的样本标签,所述样本数据为关键词,所述样本标签为关键词对应的用户行为关联信息;
生成识别模型,所述识别模型使所述样本数据与所述样本标签相关;
储存所述识别模型。
可选的,基于所述第一目标对象和所述第二目标对象获取推荐数据包括:
将所述第一目标对象和所述第二目标对象的共有目标对象确定为推荐数据。
可选的,基于所述第一目标对象和所述第二目标对象获取推荐数据包括:
将所述第一目标对象和所述第二目标对象的共有目标对象确定为第一推荐数据,并将所述第一推荐数据配置为第一优先级;
将存在于所述第二目标对象中但不存在于所述第一目标对象中的目标对象确定为第二推荐数据,并将所述第二推荐数据配置为第二优先级;
将存在于所述第一目标对象中但不存在于所述第二目标对象中的目标对象确定为第三推荐数据,并将所述第三推荐数据配置为第三优先级;
所述第一优先级高于所述第二优先级,所述第二优先级高于所述第三优先级;
将所述第一推荐数据、所述第二推荐数据、所述第三推荐数据按照优先级从高到低的顺序排列组成所述推荐数据。
可选的,在获取待检索关键词之前,还包括:
接收用户对所述目标对象的操作行为,所述操作行为触发预先设定的采集指令;
响应于所述采集指令采集所述操作行为发生时的用户行为关联信息;
将所述用户行为关联信息与所述目标对象的标识的关联关系存储到所述第二数据库中。
可选的,所述用户行为关联信息包括:用户行为的操作信息;
响应于所述采集指令采集所述操作行为发生时的用户行为的操作信息。
可选的,所述用户行为关联信息包括:处理时间、地理位置和/或所述地理位置的天气信息;
响应于所述采集指令采集所述操作行为发生时的处理时间、地理位置和/或所述地理位置的天气信息。
可选的,所述用户行为关联信息包括:用户状态特征信息;
响应于所述采集指令采集所述操作行为发生时的用户状态特征信息。
可选的,还包括显示所述推荐数据。
根据本申请实施例的第二方面,提供了第二种数据处理方法,包括:
接收用户对目标对象的操作行为,所述操作行为触发预先设定的采集指令;
响应于所述采集指令采集所述操作行为发生时的用户行为关联信息;
将所述用户行为关联信息与所述目标对象的标识的关联关系存储到第二数据库中。
可选的,所述用户行为关联信息包括:用户行为的操作信息;
响应于所述采集指令采集所述操作行为发生时的用户行为的操作信息。
可选的,所述用户行为关联信息包括:处理时间、地理位置和/或所述地理位置的天气信息;
响应于所述采集指令采集所述操作行为发生时的处理时间、地理位置和/或所述地理位置的天气信息。
可选的,所述用户行为关联信息包括:用户状态特征信息;
响应于所述采集指令采集所述操作行为发生时的用户状态特征信息。
根据本申请实施例的第三方面,提供了一种数据处理装置,包括:
第一获取模块,被配置为获取待检索关键词;
第一检索模块,被配置为在第一数据库中检索所述关键词,获取与所述关键词匹配的第一目标对象,其中,所述第一数据库存储目标对象以及所述目标对象的属性信息;
第二检索模块,被配置为在第二数据库中检索所述关键词,获取与所述关键词匹配的用户行为关联信息,基于所述用户行为关联信息与所述目标对象的标识之间的关联关系获取第二目标对象的标识,其中,所述第二数据库存储用户行为关联信息与目标对象的标识之间的关联关系,所述用户行为包括用户对所述目标对象的操作行为;
第二获取模块,被配置为根据所述第二目标对象的标识,在所述第一数据库中获取第二目标对象;
第三获取模块,被配置为基于所述第一目标对象和所述第二目标对象获取推荐数据。
可选的,所述第二检索模块,进一步被配置为对所述关键词进行文本识别和语义分析,提取特征关键词和所述关键词语义;根据所述关键词语义在所述第二数据库中检索所述特征关键词,获取与所述关键词匹配的用户行为关联信息。
可选的,所述第二检索模块,进一步被配置为将所述关键词输入预先训练好的识别模型,所述识别模型被训练为根据所述关键词获取所述用户行为关联信息;所述识别模型响应于所述关键词作为输入而获取用户行为关联信息。
可选的,还包括:模型训练生成单元,被配置为经以下步骤训练生成所述识别模型,包括:获取样本数据以及每个样本数据对应的样本标签,所述样本数据为关键词,所述样本标签为关键词对应的用户行为关联信息;生成识别模型,所述识别模型使所述样本数据与所述样本标签相关;储存所述识别模型。
可选的,所述第三获取模块,进一步被配置为将所述第一目标对象和所述第二目标对象的共有目标对象确定为推荐数据。
可选的,所述第三获取模块,进一步被配置为将所述第一目标对象和所述第二目标对象的共有目标对象确定为第一推荐数据,并将所述第一推荐数据配置为第一优先级;将存在于所述第二目标对象中但不存在于所述第一目标对象中的目标对象确定为第二推荐数据,并将所述第二推荐数据配置为第二优先级;将存在于所述第一目标对象中但不存在于所述第二目标对象中的目标对象确定为第三推荐数据,并将所述第三推荐数据配置为第三优先级;所述第一优先级高于所述第二优先级,所述第二优先级高于所述第三优先级;将所述第一推荐数据、所述第二推荐数据、所述第三推荐数据按照优先级从高到低的顺序排列组成所述推荐数据。
可选的,还包括:接收模块,被配置为接收用户对所述目标对象的操作行为,所述操作行为触发预先设定的采集指令;
采集模块,被配置为响应于所述采集指令采集所述操作行为发生时的用户行为关联信息;
存储模块,被配置为将所述用户行为关联信息与所述目标对象的标识的关联关系存储到所述第二数据库中。
可选的,所述用户行为关联信息包括:用户行为的操作信息;
所述采集模块,进一步被配置为响应于所述采集指令采集所述操作行为发生时的用户行为的操作信息。
可选的,所述用户行为关联信息包括:处理时间、地理位置和/或所述地理位置的天气信息;
所述采集模块,进一步被配置为响应于所述采集指令采集所述操作行为发生时的处理时间、地理位置和/或所述地理位置的天气信息。
可选的,所述用户行为关联信息包括:用户状态特征信息;
所述采集模块,进一步被配置为响应于所述采集指令采集所述操作行为发生时的用户状态特征信息。
可选的,还包括:显示模块,被配置为显示所述推荐数据。
根据本申请实施例的第四方面,提供了第二种数据处理装置,包括:
接收模块,被配置为接收用户对目标对象的操作行为,所述操作行为触发预先设定的采集指令;
采集模块,被配置为响应于所述采集指令采集所述操作行为发生时的用户行为关联信息;
存储模块,被配置为将所述用户行为关联信息与所述目标对象的标识的关联关系存储到第二数据库中。
可选的,所述用户行为关联信息包括:用户行为的操作信息;
所述采集模块,进一步被配置为响应于所述采集指令采集所述操作行为发生时的用户行为的操作信息。
可选的,所述用户行为关联信息包括:处理时间、地理位置和/或所述地理位置的天气信息;
所述采集模块,进一步被配置为响应于所述采集指令采集所述操作行为发生时的处理时间、地理位置和/或所述地理位置的天气信息。
可选的,所述用户行为关联信息包括:用户状态特征信息;
所述采集模块,进一步被配置为响应于所述采集指令采集所述操作行为发生时的用户状态特征信息。
根据本申请实施例的第五方面,提供了一种电子设备,包括:
存储器和处理器;
所述存储器用于存储计算机可执行指令,所述处理器用于执行所述计算机可执行指令:
获取待检索关键词;
在第一数据库中检索所述关键词,获取与所述关键词匹配的第一目标对象,其中,所述第一数据库存储目标对象以及所述目标对象的属性信息;
在第二数据库中检索所述关键词,获取与所述关键词匹配的用户行为关联信息,基于所述用户行为关联信息与所述目标对象的标识之间的关联关系获取第二目标对象的标识,其中,所述第二数据库存储用户行为关联信息与目标对象的标识之间的关联关系,所述用户行为包括用户对所述目标对象的操作行为;
根据所述第二目标对象的标识,在所述第一数据库中获取第二目标对象;
基于所述第一目标对象和所述第二目标对象获取推荐数据。
根据本申请实施例的第六方面,提供了第二种电子设备,包括:
存储器和处理器;
所述存储器用于存储计算机可执行指令,所述处理器用于执行所述计算机可执行指令:
接收用户对目标对象的操作行为,所述操作行为触发预先设定的采集指令;
响应于所述采集指令采集所述操作行为发生时的用户行为关联信息;
将所述用户行为关联信息与所述目标对象的标识的关联关系存储到第二数据库中。
根据本申请实施例的第七方面,提供了一种计算机可读存储介质,其存储有计算机可执行指令,该指令被处理器执行时实现任意一项所述数据处理的步骤。
本申请提供一种数据处理方法,包括:获取待检索关键词;在第一数据库中检索所述关键词,获取与所述关键词匹配的第一目标对象,其中,所述第一数据库存储目标对象以及所述目标对象的属性信息;在第二数据库中检索所述关键词,获取与所述关键词匹配的用户行为关联信息,基于所述用户行为关联信息与所述目标对象的标识之间的关联关系获取第二目标对象的标识,其中,所述第二数据库存储用户行为关联信息与目标对象的标识之间的关联关系,所述用户行为包括用户对所述目标对象的操作行为;根据所述第二目标对象的标识,在所述第一数据库中获取第二目标对象;基于所述第一目标对象和所述第二目标对象获取推荐数据。本申请提供的数据处理方法,可以针对用户行为检索出个性化的内容,为用户提供个性化的体验,同时能给用户创造惊喜,提高用户粘性从而提高产品的市场占有率。
附图说明
图1是本申请一实施例提供的一种数据处理方法的流程图;
图2是本申请一实施例提供的一种数据处理装置的结构示意图;
图3是本申请一实施例提供的第二种数据处理方法的流程图;
图4是本申请一实施例提供的第二种数据处理装置的结构示意图;
图5是本申请一实施例提供的一种电子设备的结构框图;
图6是本申请一实施例提供的第二种电子设备的结构框图。
具体实施方式
在下面的描述中阐述了很多具体细节以便于充分理解本申请。但是本申请能够以很多不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本申请内涵的情况下做类似推广,因此本申请不受下面公开的具体实施的限制。
在本申请一个或多个实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本申请一个或多个实施例。在本申请一个或多个实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本申请一个或多个实施例中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
应当理解,尽管在本申请一个或多个实施例中可能采用术语第一、第二等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本申请一个或多个实施例范围的情况下,第一也可以被称为第二,类似地,第二也可以被称为第一。取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。
首先,对本发明一个或多个实施涉及的名词术语进行解释。
检索(Search):用户通过在系统中输入关键字,从而获取目标内容的一种方法。
个性化(Personalization):通过系统对用户行为、喜好及其它数据的分析,从而提供符合用户需求的内容和功能,这些内容或功能千人千面。
产品内容:指的是产品本身的内容。
在本申请中,提供了两种数据处理方法,本申请同时涉及两种数据处理装置,两种计算设备,以及一种计算机可读存储介质,在下面的实施例中逐一进行详细说明。
图1示出了根据本申请一实施例的数据处理方法的流程图,包括步骤102至步骤110。
步骤102:获取待检索关键词。
当用户需要检索自己关心的内容时,需要在检索框中输入自己关心内容的关键词,可以通过所述检索框获取用户输入的关键词。
在本申请提供的一实施例中,以听歌软件为例,当用户希望检索自己上周在杭州听过的歌曲时,可以在听歌软件的检索框中,输入“杭州”、“听过的”、“上周”三个关键词,设备通过听歌软件的检索框获取输入的关键词“杭州”、“听过的”、“上周”。
步骤104:在第一数据库中检索所述关键词,获取与所述关键词匹配的第一目标对象。
第一数据库用来存储目标对象以及目标对象的属性信息,目标对象的具体内容在不同的应用中会有不同的体现,例如:在听歌软件中,目标对象为歌曲;在视频软件中,目标对象为视频;在看书软件中,目标对象为书籍;在图库中,目标对象为图片。在此我们不对目标对象的具体内容做限定。
在第一数据库中遍历所述关键词,将与关键词匹配的目标对象标记为第一目标对象。第一数据库可以存储在服务器中,也可以存储在本地。
在本申请提供的实施例中,在听歌软件的第一数据库中遍历检索“杭州”、“听过的”、“上周”,检索到如表1所示的目标对象。
表1
ID |
歌名 |
歌手 |
专辑 |
风格 |
00001 |
杭州 |
成俊 |
杭州 |
民谣 |
00002 |
杭州 |
姜铭扬 |
一条路理想一条路远方 |
流行 |
00003 |
杭州姑娘 |
韩宝仪 |
酒馆小唱 |
民谣 |
00004 |
杭州有约 |
谭晶 |
情系人民 |
流行 |
00005 |
我听过你的歌 |
何影 |
哪一天能拥有你 |
流行 |
00006 |
爱上周杰伦 |
网络歌手 |
|
流行 |
步骤106:在第二数据库中检索所述关键词,获取与所述关键词匹配的用户行为关联信息,基于所述用户行为关联信息与所述目标对象的标识之间的关联关系获取第二目标对象的标识。
第二数据库用来存储用户行为关联信息与第一数据库中目标对象的标识之间的关联关系。
用户行为关联信息为用户对目标对象的操作行为信息和/或与操作相关的信息,具体包括:用户行为的操作信息、用户状态特征信息、处理时间、地理位置和/或所述地理位置的天气信息等与用户行为有关联的信息。
用户行为的操作信息为用户对目标对象的操作行为信息,针对不同的目标对象也会有不同的操作行为,例如:对于听歌软件中歌曲的操作行为有播放、收藏、购买等,对于看书软件中书籍的操作行为有阅读、购买、批注、分享等;对于图库中图片的操作行为有预览、收藏、下载等;对于购物软件中商品的操作行为有关注、加入购物车、支付、咨询等。
用户状态特征信息为用户操作目标对象时用户自身状态信息,例如:当用户播放某首歌曲的时候正在跑步;当用户浏览某图的时候正在坐车。
处理时间、地理位置和/或所述地理位置的天气信息为用户操作目标对象时的具体时间信息、用户所处地理位置信息、用户所处地理位置的天气信息,例如:用户于2018年11月11日在北京观看一部电影,当时北京的天气为晴;用户于2018年6月1日在石家庄用看书软件购买一部书籍,当时石家庄天气为大风。
目标对象的标识可以根据标识唯一确定第一数据库中的目标对象。
第二数据库可以存储在本地中,当用户连接到服务器时,可以通过同步的方式将第二数据库同步到服务器端,当用户更换设备再次连接到服务器时,可以从服务器端同步历史记录到新设备中,让用户使用时更加方便、快捷的查询到历史记录。
在第二数据库中遍历所述关键词,获取到与关键词匹配的用户行为关联信息,根据第二数据库中记载的用户行为关联信息和目标对象的标识之间的关系,获得目标对象的标识,记为第二目标对象的标识。
在本申请提供的实施例中,在听歌软件的第二数据库中遍历检索“杭州”、“听过的”、“上周”,检索到如表2至表4所示的目标对象的ID。其中表2显示与用户所处地理位置信息为杭州相关的歌曲ID,表3显示用户听过的歌曲ID,表4用于显示与用户操作歌曲的具体时间相关的歌曲ID。
表2
表3
动作 |
ID |
听过 |
00003 |
听过 |
00005 |
听过 |
00006 |
听过 |
00015 |
表4
时间 |
ID |
2018.12.24 |
00003 |
2018.12.25 |
00005 |
2018.12.26 |
00006 |
在本申请提供的另一实施例中,步骤106还可以通过以下方法实现:
对获取到的关键词进行文本识别和语义分析,提取特征关键词和所述关键词语义,根据所述关键词语义在所述第二数据库中检索所述特征关键词,获取与所述关键词匹配的用户行为关联信息,再根据用户行为关联信息获取到和目标对象的标识之间的关系获得第二目标对象的标识。
对获取到的“杭州”、“听过的”、“上周”关键词进行文本识别和语义分析,可以得知,“杭州”为地名,则在记录地名的表中查询得到上述表2;“听过的”为用户的行为动作,则在记录用户行为的表中查询得到上述表3;“上周”为时间,则在记录时间的表中查询得到上述表4。
本实施例提供的数据处理方法,对关键词有针对性的检索,节省了资源,缩短了检索时间,提高了效率。
在本申请提供的另一实施例中,步骤106还可以通过以下方法实现:
将所述关键词输入预先训练好的识别模型,所述识别模型被训练为根据所述关键词获取所述用户行为关联信息;所述识别模型响应于所述关键词作为输入而获取用户行为关联信息,再根据用户行为关联信息获取到和目标对象的标识之间的关系获得第二目标对象的标识。
将“杭州”、“听过的”、“上周”输入到预先训练好的识别模型中,通过所述识别模型,“杭州”为地名,则在记录地名的表中查询得到上述表2;“听过的”为用户的行为动作,则在记录用户行为的表中查询得到上述表3;“上周”为时间,则在记录时间的表中查询得到上述表4。
本实施例提供的数据处理方法,引入了机器学习的方法,对语义分析不是很明确的关键词能更好的获取到用户的关联信息,缩短了检索时间,提高了准确率和效率。
步骤108:根据所述第二目标对象的标识,在所述第一数据库中获取第二目标对象。
根据步骤106中获取的第二目标对象的标识到第一数据库中检索,获取到的目标对象,记为第二目标对象。
根据表2至表4所述的第二目标对象的标识,在第一数据库中获取到第二目标对象,如表5所示。
表5
步骤110:基于所述第一目标对象和所述第二目标对象获取推荐数据。
推荐数据为设备根据用户输入的关键词检索到的用户关心的数据。
取第一目标对象和第二目标对象的共有部分作为推荐数据。
在本申请提供的实施例中,取表1和表5的共有部分作为推荐数据,如表6所示。
表6
ID |
歌名 |
歌手 |
专辑 |
风格 |
00003 |
杭州姑娘 |
韩宝仪 |
酒馆小唱 |
民谣 |
00005 |
我听过你的歌 |
何影 |
哪一天能拥有你 |
流行 |
00006 |
爱上周杰伦 |
网络歌手 |
|
流行 |
在本申请提供的另一实施例中,步骤110还可以通过以下方法实现:
将所述第一目标对象和所述第二目标对象的共有目标对象确定为第一推荐数据,并将所述第一推荐数据配置为第一优先级;
将存在于所述第二目标对象中但不存在于所述第一目标对象中的目标对象确定为第二推荐数据,并将所述第二推荐数据配置为第二优先级;
将存在于所述第一目标对象中但不存在于所述第二目标对象中的目标对象确定为第三推荐数据,并将所述第三推荐数据配置为第三优先级;
所述第一优先级高于所述第二优先级,所述第二优先级高于所述第三优先级;
将所述第一推荐数据、所述第二推荐数据、所述第三推荐数据按照优先级从高到低的顺序排列组成所述推荐数据。
根据本实施例获取的推荐数据如表7所示。
表7
ID |
歌名 |
歌手 |
专辑 |
风格 |
00003 |
杭州姑娘 |
韩宝仪 |
酒馆小唱 |
民谣 |
00005 |
我听过你的歌 |
何影 |
哪一天能拥有你 |
流行 |
00006 |
爱上周杰伦 |
网络歌手 |
|
流行 |
00007 |
北京欢迎你 |
群星 |
北京2008奥运会歌曲专辑 |
流行 |
00015 |
听妈妈的话 |
周杰伦 |
|
流行 |
00001 |
杭州 |
成俊 |
杭州 |
民谣 |
00002 |
杭州 |
姜铭扬 |
一条路理想一条路远方 |
流行 |
00004 |
杭州有约 |
谭晶 |
情系人民 |
流行 |
本实施例提供的数据处理方法,可在获取到不同历史场景下用户处理过的内容,为用户提供个性化的体验,同时能给用户创造惊喜,提高用户粘性从而提高产品的市场占有率。
在本申请的另一实施例提供的数据处理方法中,在步骤102之前,还可以包括:
接收用户对所述目标对象的操作行为,所述操作行为触发预先设定的采集指令;
响应于所述采集指令采集所述操作行为发生时的用户行为关联信息;
所述用户行为关联信息包括:用户行为的操作信息;
响应于所述采集指令采集所述操作行为发生时的用户行为的操作信息。
所述用户行为关联信息包括:处理时间、地理位置和/或所述地理位置的天气信息;
响应于所述采集指令采集所述操作行为发生时的处理时间、地理位置和/或所述地理位置的天气信息。
所述用户行为关联信息包括:用户状态特征信息;
响应于所述采集指令采集所述操作行为发生时的用户状态特征信息。
将所述用户行为关联信息与所述目标对象的标识的关联关系存储到所述第二数据库中。
本实施例提供的数据处理方法,记录用户对目标对象操作时的行为动作,以及发生动作时的时间、位置、天气、用户状态等关联信息。可以从多个维度记录用户的数据信息,便于在之后的检索时能准确的还原行为动作发生时的用户行为。
在本申请的另一实施例提供的数据处理方法中,在步骤110之后,还可以包括:
显示所述推荐数据。
输入关键词后,在检索框的目标对象显示框中实时显示所述推荐数据。
本实施例提供的数据处理方法,实时显示检索到的推荐数据,用户可以更直接便捷的查询到检索结果。
本申请提供的数据处理方法,不仅仅局限于上述实施例所述的听歌软件,还可以应用于视频软件、读书软件、购物软件、图库等软件中。
与上述方法实施例相对应,本申请还提供了数据处理装置实施例,图2示出了本申请一实施例的数据处理装置的结构示意图。如图2所示,该装置包括:
第一获取模块202,被配置为获取待检索关键词。
第一检索模块204,被配置为在第一数据库中检索所述关键词,获取与所述关键词匹配的第一目标对象,其中,所述第一数据库存储目标对象以及所述目标对象的属性信息。
第二检索模块206,被配置为在第二数据库中检索所述关键词,获取与所述关键词匹配的用户行为关联信息,基于所述用户行为关联信息与所述目标对象的标识之间的关联关系获取第二目标对象的标识,其中,所述第二数据库存储用户行为关联信息与目标对象的标识之间的关联关系,所述用户行为包括用户对所述目标对象的操作行为。
可选的,所述第二检索模块206,进一步被配置为对所述关键词进行文本识别和语义分析,提取特征关键词和所述关键词语义;根据所述关键词语义在所述第二数据库中检索所述特征关键词,获取与所述关键词匹配的用户行为关联信息。
可选的,所述第二检索模块206,进一步被配置为将所述关键词输入预先训练好的识别模型,所述识别模型被训练为根据所述关键词获取所述用户行为关联信息;所述识别模型响应于所述关键词作为输入而获取用户行为关联信息。
可选的,还包括:模型训练生成单元,被配置为经以下步骤训练生成所述识别模型,包括:获取样本数据以及每个样本数据对应的样本标签,所述样本数据为关键词,所述样本标签为关键词对应的用户行为关联信息;生成识别模型,所述识别模型使所述样本数据与所述样本标签相关;储存所述识别模型。
第二获取模块208,被配置为根据所述第二目标对象的标识,在所述第一数据库中获取第二目标对象。
第三获取模块210,被配置为基于所述第一目标对象和所述第二目标对象获取推荐数据。
可选的,所述第三获取模块210,进一步被配置为将所述第一目标对象和所述第二目标对象的共有目标对象确定为推荐数据。
可选的,所述第三获取模块210,进一步被配置为将所述第一目标对象和所述第二目标对象的共有目标对象确定为第一推荐数据,并将所述第一推荐数据配置为第一优先级;将存在于所述第二目标对象中但不存在于所述第一目标对象中的目标对象确定为第二推荐数据,并将所述第二推荐数据配置为第二优先级;将存在于所述第一目标对象中但不存在于所述第二目标对象中的目标对象确定为第三推荐数据,并将所述第三推荐数据配置为第三优先级;所述第一优先级高于所述第二优先级,所述第二优先级高于所述第三优先级;将所述第一推荐数据、所述第二推荐数据、所述第三推荐数据按照优先级从高到低的顺序排列组成所述推荐数据。
可选的,还包括:接收模块,被配置为接收用户对所述目标对象的操作行为,所述操作行为触发预先设定的采集指令;
本实施例提供的数据处理装置,运行上述数据处理步骤,可在获取到不同历史场景下用户处理过的内容,为用户提供个性化的体验,同时能给用户创造惊喜,提高用户粘性而提高产品的市场占有率。
在本申请的另一实施例提供的数据处理装置中,还包括:
接收模块,被配置为接收用户对所述目标对象的操作行为,所述操作行为触发预先设定的采集指令。
采集模块,被配置为响应于所述采集指令采集所述操作行为发生时的用户行为关联信息。
可选的,所述用户行为关联信息包括:用户行为的操作信息;
所述采集模块,进一步被配置为响应于所述采集指令采集所述操作行为发生时的用户行为的操作信息。
可选的,所述用户行为关联信息包括:处理时间、地理位置和/或所述地理位置的天气信息;
所述采集模块,进一步被配置为响应于所述采集指令采集所述操作行为发生时的处理时间、地理位置和/或所述地理位置的天气信息。
可选的,所述用户行为关联信息包括:用户状态特征信息;
所述采集模块,进一步被配置为响应于所述采集指令采集所述操作行为发生时的用户状态特征信息。
存储模块,被配置为将所述用户行为关联信息与所述目标对象的标识的关联关系存储到所述第二数据库中。
本实施例提供的数据处理装置,运行上述数据处理步骤,记录用户处理目标对象时的行为动作,以及发生动作时相关的时间、位置、天气、用户状态等关联信息。可以从多个维度记录用户的数据信息,便于在之后的检索时能准确的还原行为动作发生时的用户行为。
上述为本实施例的一种数据处理装置的示意性方案。需要说明的是,该数据处理装置的技术方案与上述的数据处理方法的技术方案属于同一构思,数据处理装置的技术方案未详细描述的细节内容,均可以参见上述数据处理方法的技术方案的描述。
图3示出了根据本申请一实施例的第二种数据处理方法的流程图,包括步骤302至步骤306。
步骤302:接收用户对所述目标对象的操作行为,所述操作行为触发预先设定的采集指令。
在本申请提供的一实施例中,以看视频软件为例,当用户点击播放按钮时,接收用户对视频的播放操作行为,用户的播放操作触发了预先设定的采集指令。
在本申请的另一实施例中,以看书软件为例,用户购买某部小说,当用户购买成功时,接收用户对小说的支付操作行为,用户支付的操作触发了预先设定采集指令。
在本申请的另一实施例中,以图库为例,用户收藏某张图片,当用户点击收藏时,接收用户对图片的收藏操作行为,用户收藏的操作触发了预先设定采集指令。
本申请对采集指令的触发方式不作限定,在所述采集指令被触发后,设备接收所述采集指令。
步骤304:响应于所述采集指令采集所述操作行为发生时的用户行为关联信息。
在本申请提供的一实施例中,设备响应于用户点击播放按钮操作触发的预先设定的采集指令采集用户操作行为关联信息,采集用户操作行为关联信息包括:用户行为的操作信息为播放,此时的时间为2018年12月22日,用户所处地为北京,北京此时的天气为晴天,用户正在跑步。
在本申请的另一实施例中,设备响应于用户支付操作触发的预先设定采集指令采集用户操作行为关联信息,采集用户操作行为关联信息包括:用户行为的操作信息为购买,此时的时间为2018年5月2日,用户所处地为天津,天津此时的天气为多云。
在本申请的另一实施例中,设备响应于用户收藏操作触发的预先设定采集指令采集用户操作行为关联信息,采集用户操作行为关联信息包括:用户行为的操作信息为收藏,此时的时间为2018年11月22日,用户所处地为上海,上海此时的天气为大雨,用户正在坐车。
步骤306:将所述用户行为关联信息与所述目标对象的标识的关联关系存储到第二数据库中。
将步骤304中采集到的用户的播放行为、“2018年12月22日”、“北京”、“晴天”和“跑步”与播放影片的标识的关联关系对应储存到第二数据库中。
在本申请的另一实施例中,将用户的购买行为、“2018年5月2日”、“天津”、“多云”与购买影片的标识的关联关系对应储存到第二数据库中。
在本申请的另一实施例中,将用户的收藏行为、“2018年11月22日”、“上海”、“大雨”与收藏图片的标识的关联关系对应储存到第二数据库中。
本实施例提供的数据处理方法,记录用户处理目标对象时的行为动作,以及发生动作时相关的时间、位置、天气、用户状态等关联信息。可以从多个维度记录用户的数据信息,便于在之后的检索时能准确的还原行为动作发生时的用户行为。
与上述方法实施例相对应,本申请还提供了数据处理装置实施例,图4示出了本申请一实施例的第二种数据处理装置的结构示意图。如图4所示,该装置包括:
接收模块402,被配置为接收用户对目标对象的操作行为,所述操作行为触发预先设定的采集指令。
采集模块404,被配置为响应于所述采集指令采集所述操作行为发生时的用户行为关联信息。
可选的,所述用户行为关联信息包括:用户行为的操作信息;
所述采集模块404,进一步被配置为响应于所述采集指令采集所述操作行为发生时的用户行为的操作信息。
可选的,所述用户行为关联信息包括:处理时间、地理位置和/或所述地理位置的天气信息;
所述采集模块404,进一步被配置为响应于所述采集指令采集所述操作行为发生时的处理时间、地理位置和/或所述地理位置的天气信息。
可选的,所述用户行为关联信息包括:用户状态特征信息;
所述采集模块404,进一步被配置为响应于所述采集指令采集所述操作行为发生时的用户状态特征信息。
存储模块406,被配置为将所述用户行为关联信息与所述目标对象的标识的关联关系存储到第二数据库中。
本实施例提供的数据处理装置,运行上述数据处理步骤,记录用户处理目标对象时的行为动作,以及发生动作时相关的时间、位置、天气、用户状态等关联信息。可以从多个维度记录用户的数据信息,便于在之后的检索时能准确的还原行为动作发生时的用户行为。
上述为本实施例的一种数据处理装置的示意性方案。需要说明的是,该数据处理装置的技术方案与上述的数据处理方法的技术方案属于同一构思,数据处理装置的技术方案未详细描述的细节内容,均可以参见上述数据处理方法的技术方案的描述。
图5示出了根据本申请一实施例的电子设备500的结构框图。该电子设备500的部件包括但不限于存储器510和处理器520。处理器520与存储器510通过总线530相连接,数据库550用于保存数据。
电子设备500还包括接入设备540,接入设备540使得电子设备500能够经由一个或多个网络560通信。这些网络的示例包括公用交换电话网(PSTN)、局域网(LAN)、广域网(WAN)、个域网(PAN)或诸如因特网的通信网络的组合。接入设备540可以包括有线或无线的任何类型的网络接口(例如,网络接口卡(NIC))中的一个或多个,诸如IEEE802.11无线局域网(WLAN)无线接口、全球微波互联接入(Wi-MAX)接口、以太网接口、通用串行总线(USB)接口、蜂窝网络接口、蓝牙接口、近场通信(NFC)接口,等等。
在本申请的一个实施例中,电子设备500的上述以及图5中未示出的其他部件也可以彼此相连接,例如通过总线。应当理解,图5所示的电子设备结构框图仅仅是出于示例的目的,而不是对本申请范围的限制。本领域技术人员可以根据需要,增添或替换其他部件。
电子设备500可以是任何类型的静止或移动电子设备,包括移动计算机或移动电子设备(例如,平板计算机、个人数字助理、膝上型计算机、笔记本计算机、上网本等)、移动电话(例如,智能手机)、可佩戴的电子设备(例如,智能手表、智能眼镜等)或其他类型的移动设备,或者诸如台式计算机或PC的静止电子设备。电子设备500还可以是移动式或静止式的服务器。
其中,处理器520用于执行如下计算机可执行指令:
获取待检索关键词;
在第一数据库中检索所述关键词,获取与所述关键词匹配的第一目标对象,其中,所述第一数据库存储目标对象以及所述目标对象的属性信息;
在第二数据库中检索所述关键词,获取与所述关键词匹配的用户行为关联信息,基于所述用户行为关联信息与所述目标对象的标识之间的关联关系获取第二目标对象的标识,其中,所述第二数据库存储用户行为关联信息与目标对象的标识之间的关联关系,所述用户行为包括用户对所述目标对象的操作行为;
根据所述第二目标对象的标识,在所述第一数据库中获取第二目标对象;
基于所述第一目标对象和所述第二目标对象获取推荐数据。
可选的,在第二数据库中检索所述关键词,获取与所述关键词匹配的用户行为关联信息包括:
对所述关键词进行文本识别和语义分析,提取特征关键词和所述关键词语义;
根据所述关键词语义在所述第二数据库中检索所述特征关键词,获取与所述关键词匹配的用户行为关联信息。
可选的,在第二数据库中检索所述关键词,获取与所述关键词匹配的用户行为关联信息包括:
将所述关键词输入预先训练好的识别模型,所述识别模型被训练为根据所述关键词获取所述用户行为关联信息;
所述识别模型响应于所述关键词作为输入而获取用户行为关联信息。
可选的,所述识别模型经以下步骤训练生成,包括:
获取样本数据以及每个样本数据对应的样本标签,所述样本数据为关键词,所述样本标签为关键词对应的用户行为关联信息;
生成识别模型,所述识别模型使所述样本数据与所述样本标签相关;
储存所述识别模型。
可选的,基于所述第一目标对象和所述第二目标对象获取推荐数据包括:
将所述第一目标对象和所述第二目标对象的共有目标对象确定为推荐数据。
可选的,基于所述第一目标对象和所述第二目标对象获取推荐数据包括:
将所述第一目标对象和所述第二目标对象的共有目标对象确定为第一推荐数据,并将所述第一推荐数据配置为第一优先级;
将存在于所述第二目标对象中但不存在于所述第一目标对象中的目标对象确定为第二推荐数据,并将所述第二推荐数据配置为第二优先级;
将存在于所述第一目标对象中但不存在于所述第二目标对象中的目标对象确定为第三推荐数据,并将所述第三推荐数据配置为第三优先级;
所述第一优先级高于所述第二优先级,所述第二优先级高于所述第三优先级;
将所述第一推荐数据、所述第二推荐数据、所述第三推荐数据按照优先级从高到低的顺序排列组成所述推荐数据。
可选的,在获取待检索关键词之前,还包括:
接收用户对所述目标对象的操作行为,所述操作行为触发预先设定的采集指令;
响应于所述采集指令采集所述操作行为发生时的用户行为关联信息;
将所述用户行为关联信息与所述目标对象的标识的关联关系存储到所述第二数据库中。
可选的,所述用户行为关联信息包括:用户行为的操作信息;
响应于所述采集指令采集所述操作行为发生时的用户行为的操作信息。
可选的,所述用户行为关联信息包括:处理时间、地理位置和/或所述地理位置的天气信息;
响应于所述采集指令采集所述操作行为发生时的处理时间、地理位置和/或所述地理位置的天气信息。
可选的,所述用户行为关联信息包括:用户状态特征信息;
响应于所述采集指令采集所述操作行为发生时的用户状态特征信息。
可选的,还包括显示所述推荐数据。
上述为本实施例的一种电子设备的示意性方案。需要说明的是,该电子设备的技术方案与上述的数据处理方法的技术方案属于同一构思,电子设备的技术方案未详细描述的细节内容,均可以参见上述数据处理方法的技术方案的描述。
图6示出了根据本申请一实施例的电子设备600的结构框图。该电子设备600的部件包括但不限于存储器610和处理器620。处理器620与存储器610通过总线630相连接,数据库650用于保存数据。
电子设备600还包括接入设备640,接入设备640使得电子设备600能够经由一个或多个网络660通信。
电子设备600的接入方式与上述电子设备500相同,在此不再赘述。
其中,处理器620用于执行如下计算机可执行指令:
接收用户对目标对象的操作行为,所述操作行为触发预先设定的采集指令;
响应于所述采集指令采集所述操作行为发生时的用户行为关联信息;
将所述用户行为关联信息与所述目标对象的标识的关联关系存储到第二数据库中。
可选的,所述用户行为关联信息包括:用户行为的操作信息;
响应于所述采集指令采集所述操作行为发生时的用户行为的操作信息。
可选的,所述用户行为关联信息包括:处理时间、地理位置和/或所述地理位置的天气信息;
响应于所述采集指令采集所述操作行为发生时的处理时间、地理位置和/或所述地理位置的天气信息。
可选的,所述用户行为关联信息包括:用户状态特征信息;
响应于所述采集指令采集所述操作行为发生时的用户状态特征信息。
本申请一实施例还提供一种计算机可读存储介质,其存储有计算机指令,该指令被处理器执行时实现如前所述数据处理方法的步骤。
其中,计算机可读存储介质存储如下计算机指令:
获取待检索关键词;
在第一数据库中检索所述关键词,获取与所述关键词匹配的第一目标对象,其中,所述第一数据库存储目标对象以及所述目标对象的属性信息;
在第二数据库中检索所述关键词,获取与所述关键词匹配的用户行为关联信息,基于所述用户行为关联信息与所述目标对象的标识之间的关联关系获取第二目标对象的标识,其中,所述第二数据库存储用户行为关联信息与目标对象的标识之间的关联关系,所述用户行为包括用户对所述目标对象的操作行为;
根据所述第二目标对象的标识,在所述第一数据库中获取第二目标对象;
基于所述第一目标对象和所述第二目标对象获取推荐数据。
上述为本实施例的一种计算机可读存储介质的示意性方案。需要说明的是,该存储介质的技术方案与上述的数据处理方法的技术方案属于同一构思,存储介质的技术方案未详细描述的细节内容,均可以参见上述数据处理方法的技术方案的描述。
本申请一实施例提供的所述计算机可读存储介质,还可以存储如下计算机指令:
接收用户对目标对象的操作行为,所述操作行为触发预先设定的采集指令;
响应于所述采集指令采集所述操作行为发生时的用户行为关联信息;
将所述用户行为关联信息与所述目标对象的标识的关联关系存储到第二数据库中。
上述为本实施例的一种计算机可读存储介质的示意性方案。需要说明的是,该存储介质的技术方案与上述的数据处理方法的技术方案属于同一构思,存储介质的技术方案未详细描述的细节内容,均可以参见上述数据处理方法的技术方案的描述。
上述对本申请特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
所述计算机指令包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。
需要说明的是,对于前述的各方法实施例,为了简便描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可以采用其它顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定都是本申请所必须的。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其它实施例的相关描述。
以上公开的本申请优选实施例只是用于帮助阐述本申请。可选实施例并没有详尽叙述所有的细节,也不限制该发明仅为所述的具体实施方式。显然,根据本申请的内容,可作很多的修改和变化。本申请选取并具体描述这些实施例,是为了更好地解释本申请的原理和实际应用,从而使所属技术领域技术人员能很好地理解和利用本申请。本申请仅受权利要求书及其全部范围和等效物的限制。