CN109784961A - 一种数据处理方法及装置 - Google Patents
一种数据处理方法及装置 Download PDFInfo
- Publication number
- CN109784961A CN109784961A CN201711116057.8A CN201711116057A CN109784961A CN 109784961 A CN109784961 A CN 109784961A CN 201711116057 A CN201711116057 A CN 201711116057A CN 109784961 A CN109784961 A CN 109784961A
- Authority
- CN
- China
- Prior art keywords
- user
- portrait
- data
- draws
- multidimensional data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 32
- 230000003542 behavioural effect Effects 0.000 claims abstract description 32
- 230000006399 behavior Effects 0.000 claims description 47
- 238000000034 method Methods 0.000 claims description 46
- 230000015654 memory Effects 0.000 claims description 31
- 238000012549 training Methods 0.000 claims description 27
- 230000004048 modification Effects 0.000 claims description 21
- 238000012986 modification Methods 0.000 claims description 21
- 238000012545 processing Methods 0.000 claims description 20
- 210000005036 nerve Anatomy 0.000 claims description 13
- 238000001514 detection method Methods 0.000 claims description 10
- 238000004458 analytical method Methods 0.000 claims description 8
- 238000013528 artificial neural network Methods 0.000 claims description 7
- 230000008859 change Effects 0.000 claims description 5
- 238000000151 deposition Methods 0.000 claims description 2
- 230000008569 process Effects 0.000 description 17
- 238000003860 storage Methods 0.000 description 13
- 238000010586 diagram Methods 0.000 description 7
- 241001269238 Data Species 0.000 description 4
- 239000002184 metal Substances 0.000 description 4
- 230000009471 action Effects 0.000 description 3
- 238000000429 assembly Methods 0.000 description 3
- 230000000712 assembly Effects 0.000 description 3
- 238000004891 communication Methods 0.000 description 3
- 238000001914 filtration Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 230000002093 peripheral effect Effects 0.000 description 3
- 230000003068 static effect Effects 0.000 description 3
- 230000002123 temporal effect Effects 0.000 description 3
- 238000013475 authorization Methods 0.000 description 2
- 238000009412 basement excavation Methods 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000012790 confirmation Methods 0.000 description 2
- 238000005065 mining Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000036760 body temperature Effects 0.000 description 1
- 230000002490 cerebral effect Effects 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000036651 mood Effects 0.000 description 1
- 210000003205 muscle Anatomy 0.000 description 1
- 239000011664 nicotinic acid Substances 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 239000011435 rock Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
一种数据处理方法,包括:获取用户的多维数据;通过分析用户的多维数据,创建或更新用户的用户画像集合,并预测用户的动态特征。如此,能够提供个性化的用户画像。
Description
技术领域
本发明涉及但不限于数据处理技术,尤其涉及一种数据处理方法及装置。
背景技术
当前综合的用户画像是基于用户注册信息、用户调研、用户简单点击行为等单一维度的数据构建的,导致实时性和准确性无法保证。由于用户画像构建实时性和准确性的局限,只能做到千人一面而很难做到千人千面,进而也无法对用户未来行为进行准确预测。
发明内容
以下是对本文详细描述的主题的概述。本概述并非是为了限制权利要求的保护范围。
本申请实施例提供一种数据处理方法,能够提供个性化的用户画像。
第一方面,本申请实施例提供一种数据处理方法,包括:
获取用户的多维数据;
通过分析所述用户的多维数据,创建或更新所述用户的用户画像集合,并预测所述用户的动态特征。
在示例性实施方式中,所述通过分析所述用户的多维数据,更新所述用户的用户画像集合,可以包括:
通过分析所述用户的多维数据,确定所述用户在设定时长内的有效行为信息;基于所述有效行为信息,更新所述用户的用户画像集合。
在示例性实施方式中,所述基于所述有效行为信息,更新所述用户的用户画像集合,可以包括:
判断所述用户的用户画像集合内是否存在与所述有效行为信息匹配的用户画像,若存在,则更新在所述用户画像集合中匹配到的用户画像的权重,若不存在,则根据所述有效行为信息确定探测画像,并将所述探测画像增加至所述用户的用户画像集合。
在示例性实施方式中,上述方法还可以包括:通过分析所述用户的多维数据,对用户画像进行模型更新。
在示例性实施方式中,所述通过分析所述用户的多维数据,对用户画像进行模型更新,可以包括:
通过分析所述用户的多维数据,确定所述用户在设定时长内的有效行为信息;
判断所述有效行为信息与所述用户的用户画像集合内的最新探测到的用户画像是否匹配,若两者匹配,则将所述用户的用户画像集合作为正样本更新训练集,若两者不匹配,则将所述用户的用户画像集合作为负样本更新训练集;
利用更新后的所述训练集进行模型训练,对不同类型的用户画像进行模型更新。
在示例性实施方式中,所述获取用户的多维数据,可以包括:
在检测到所述用户对目标对象的操作行为时,获取所述用户的多维数据;或者,周期性获取所述用户的多维数据。
在示例性实施方式中,所述创建或更新所述用户的用户画像集合之后,上述方法还可以包括:根据所述用户的用户画像集合内的一个或多个用户画像的权重,给所述用户提供个性化服务。
在示例性实施方式中,所述多维数据可以包括:用户对应于目标对象的全量数据。
在示例性实施方式中,所述目标对象可以包括音乐系统。
第二方面,本申请实施例提供一种数据处理方法,包括:
获取用户对应于音乐系统的多维数据;
利用人工神经网络模型分析所述用户的多维数据,创建或更新所述用户的用户画像集合,并预测所述用户的动态特征。
在示例性实施方式中,上述方法还可以包括:利用所述人工神经网络模型分析所述用户的多维数据,对用户画像进行模型更新。
第三方面,本申请实施例提供一种数据处理装置,包括:存储器和处理器,所述存储器用于存储数据处理程序,所述数据处理程序被所述处理器执行时,执行以下操作:获取用户的多维数据;通过分析所述用户的多维数据,创建或更新所述用户的用户画像集合,并预测所述用户的动态特征。
第四方面,本申请实施例提供一种计算机可读介质,存储有数据处理程序,所述数据处理程序被处理器执行时实现上述第一方面提供的数据处理方法的步骤。
第五方面,本申请实施例提供一种数据处理方法,包括:
获取账户关联的操作数据,其中,所述操作数据包括对音频或视频数据所做的非播放操作;
基于所述操作数据,获取至少一种音频或视频类型的概率;
基于所述概率,向所述账户提供所述类型的音频或视频数据。
在示例性实施方式中,所述非播放操作可以包括以下一项或多项:添加批注操作、收藏操作、下载、上传、搜索。
在本申请实施例中,获取用户的多维数据,通过分析用户的多维数据,创建或更新用户的用户画像集合,并预测用户的动态特征。如此,给用户提供个性化的用户画像,并实现对动态特征的预测,从而提高对用户的个性化服务质量。示例性地,针对音乐系统(比如音乐类应用或平台),可以帮助音乐系统了解自己的用户,给用户提供个性化的音乐服务,并预先对用户行为做出正确反馈。
在示例性实施方式中,通过分析用户的多维数据,对用户画像进行模型更新,从而保证用户画像的准确性。
当然,实施本申请的任一产品并不一定需要同时达到以上所有优点。
附图说明
图1为本申请实施例提供的数据处理方法的应用示意图;
图2为实施本申请实施例提供的数据处理方法的业务逻辑示例图;
图3为本申请实施例提供的数据处理方法的流程图;
图4为本申请实施例提供的用户画像集合的更新过程的时序图;
图5为本申请实施例提供的用户画像的模型更新过程的时序图;
图6为本申请实施例提供的数据处理装置的示意图;
图7为本申请实施例提供的另一种数据处理方法的流程图。
具体实施方式
以下结合附图对本申请实施例进行详细说明,应当理解,以下所说明的实施例仅用于说明和解释本申请,并不用于限定本申请。
需要说明的是,如果不冲突,本申请实施例以及实施例中的各个特征可以相互结合,均在本申请的保护范围之内。另外,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
一些实施方式中,执行数据处理方法的计算设备可包括一个或多个处理器(CPU,Central Processing Unit)、输入/输出接口、网络接口和内存(memory)。
内存可能包括计算机可读介质中的非永久性存储器、随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。内存可能包括模块1,模块2,……,模块N(N为大于2的整数)。
计算机可读介质包括永久性和非永久性、可移动和非可移动存储介质。存储介质可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM),快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括非暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
下面先对本申请中的概念进行说明。
人工神经网络(Artificial Neural Networks,ANNs):也称为神经网络(NNs),或称为类神经网络,或称为连接模型(Connection Model),它是一种仿生神经网络行为特征,应用类似于大脑神经突触联接的结构进行分布式信息处理的算法数学模型。这种网络依靠系统的复杂程度,通过调整内部大量节点之间相互连接的关系,从而达到处理信息的目的
用户画像(Personas):指真实用户的虚拟代表,是建立在一系列真实数据之上的目标用户模型。
本申请实施例提供一种数据处理方法,通过获取并分析用户的多维数据,挖掘出具有共性的信息,创建或更新用户的用户画像集合,同时可以对用户的动态特征进行预测,比如可以提供下一时刻的用户行为预测结果。
下面参照图1和图2,以本实施例的数据处理方法实施在音乐系统(比如,音乐类应用(APP,Application)或音乐平台)为例进行说明。本实施例中,通过对用户在音乐类应用上的多维数据进行信息分析和挖掘,构建或更新用户在音乐类应用上的用户画像,并对用户的动态特征进行预测。然而,本申请对此并不限定。本实施例的数据处理方法还可以在其他类型的系统(比如,购物类应用或平台、交友类应用或平台等)中实施。
本实施例中,用户可以包括:使用音乐系统的用户,比如,采用注册账户登陆音乐系统进行操作的用户、使用游客账户(即非注册账户)登陆音乐系统进行操行的用户。
图1为本实施例提供的数据处理方法的应用示意图。如图1所示,用户的多维数据可以包括:用户对应于目标对象的全量数据。在本示例中,目标对象可以为音乐类应用,则用户的多维数据可以包括:用户在音乐类应用上的注册数据、搜索数据、试听数据、深度数据、关系数据、点击数据、浏览数据、付费数据、爬虫数据、外围数据等。然而,本申请对此并不限定。示例性地,用户的多维数据可以至少包括试听数据和深度数据。
其中,注册数据可以包括:用户的注册账户名称、用户的性别、年龄、职业、电子邮箱、手机号码、身份证号、所在国家、地区和城市等;搜索数据可以包括:搜索时间信息、搜索关键词、停留时长、搜索结果、点击转化等;试听数据可以包括:试听内容、试听有效时长、试听内容的类型、试听量等;深度数据可以包括用户在音乐类应用上操作(比如,编辑、收藏、下载等)的音乐资料及相关信息,比如,收藏的音乐资料、下载的音乐资源、编辑音乐资料的时间信息、编辑艺人资料、编辑专辑资料、编辑歌曲资料等;关系数据可以包括:用户的分享信息、收藏、关注的信息、用户注册的账户关联的好友信息等;点击数据可以包括:用户在音乐类应用上的点击操作时刻、点击内容等;浏览数据可以包括:用户在音乐类应用上的浏览内容等;付费数据可以包括:用户在音乐类应用上开通的付费服务、付费金额、付费时刻等;爬虫数据可以包括:音乐类应用从其他应用获取的本应用所没有的数据;外围数据可以包括音乐类应用通过用户授权获取的用户在其他应用的数据,比如通过用户授权获取的用户在购物类应用的数据等。
本实施例中,用户的用户画像集合中可以包括一种或多种不同类型的用户画像,比如,偏好画像、行为画像、属性画像以及关系画像。然而,本申请对此并不限定。需要说明的是,针对不同类型的应用或平台,用户画像的侧重点会不同。比如,对于音乐类应用来说,不必强烈关注用户喜不喜欢吃辣;针对同一台设备,使用该设备的用户有可能是不同的,比如一个用户可能自己听摇滚,也可能给宝宝播放儿歌。
其中,不同类型的用户画像对应不同的模型,可以包括不同的描述字段。比如,偏好画像至少可以包括:用户偏好的歌曲类型的描述字段、用户偏好的歌曲试听时间、试听数量的描述字段;行为画像至少可以包括:试听行为的描述字段、音乐资料编辑行为的描述字段,其中,试听行为的描述字段可以包括有效试听时长、试听数量、试听音乐类型等;音乐资料编辑行为的描述字段可以包括编辑的音乐资料类型、音乐资料编辑的时间信息等。然而,本申请对此并不限定。其中,不同类型的用户画像对应的模型可以通过训练集进行模型更新,从而根据用户在音乐系统上的数据变化,适应性调整模型内的描述字段,以提供实时准确的个性化的用户画像。
本实施例中,利用人工神经网络模型分析用户的多维数据,挖掘出具有共性的信息,比如,全景数据、行为数据、偏好数据以及消费数据,然后,创建或更新用户的用户画像集合。其中,全景数据可以包括用户数据中除行为数据、偏好数据以及消费数据外的全部数据。
本实施例中,人工神经网络模型处理的用户特征可以分为静态特征和动态特征。其中,静态特征可以包括:性别、年龄、职业、所在城市等用户基本信息以及其他辅助的外围数据,其中,这些基本信息可以从用户在音乐类应用的注册数据中获取。动态特征可以包括:歌曲风格偏好、艺人偏好、年代偏好、地区偏好、心情、当前位置(比如,咖啡厅或者路上开车)、活动状态(比如,跑步或者工作)、身体状态(比如,心跳频率或体温)、时间信息(比如,睡前或者起床)等。
在本实施例中,每一个用户对音乐类应用的行为、习惯、偏好、甚至听不同风格音乐身体生理的数据细微变化都可能被记录、被挖掘和被分析,然后,利用人工神经网络模型对不同来源的不同类型的数据进行计算,并建立节点和关系,再通过聚类归一化挖掘共性的信息,构建或更新用户画像,而且对被画像用户的行为进行预测。
图2为实施本实施例提供的数据处理方法的业务逻辑示例图。如图2所示,当一个用户采用注册账户登录音乐类应用后,即针对登录态账户,音乐类应用可以根据该账户的本次登录和操作数据,更新该账户对应的原有的用户画像集合,得到最新的用户画像集合,并根据该账户最新的用户画像集合,给使用该账户的用户提供个性化的服务。比如,可以根据用户画像集合中的偏好画像,给使用该账户的用户推荐用户偏好的风格流派的歌曲。如图2所示,该用户偏好的风格流派为金属音乐,则可以给该用户推荐金属音乐。其中,根据用户通过该账户在音乐类应用上选择的电台、专辑、歌单,可以挖掘得到歌曲列表,根据在音乐类应用上的操作,比如,搜索、试听、收藏、分享等,也可以挖掘得到歌曲列表,根据与音乐类应用相关的社会行为,比如,参加的艺人演唱会、观看的艺人评论、艺人综艺节目,也可以挖掘得到歌曲列表;将挖掘得到的歌曲列表转换为标签向量,通过对标签向量进行分类和聚类处理,得到偏好画像。需要说明的是,本实施例中,根据使用该账户的用户的最新操作数据可以实时更新用户画像集合。然而,本申请对此并不限定。比如,可以周期性对用户画像集合进行更新。
如图2所示,当一个用户以游客身份登录音乐类应用后,即用户处于非登录态,或者,一个用户采用全新的账户登录音乐类应用后,可以根据该游客账户或新账户的本次登录和浏览数据,构建该账户的初始用户画像。相较于登录态账户的用户画像,非登录态账户或新账户的用户画像比较简单。如图2所示,非登录态账户的用户画像中的风格流派仅包括五种。同样地,音乐类应用可以基于构造的用户画像,给使用该账户的用户提供个性化的服务,比如,如图2所示,可以给非登录态用户推荐电子音乐。
需要说明的是,在示例性实现方式中,图2中体现用户偏好歌曲的风格流派的网状图可以在音乐类应用的显示界面上提供给用户。然而,本申请对此并不限定。
另外,在本实施例中,举例而言,如果一个用户通过注册账户使用音乐类应用总是听古典音乐,突然间在某个时刻开始试听时间变短且音乐风格杂乱,则可以基于该注册账户的用户画像集合以及该注册账户的最新的用户数据,对使用该注册账户的用户的动态特征进行预测,比如可以预测到下一时刻收听古典音乐的概率变小。然后,根据预测得到的动态特征进行分析可以得出以下两种可能的结果:一是这个用户的家庭发生了重大变故,改变了生活习惯;二是有音乐竞品给该用户提供了更好的古典音乐,该用户准备不再使用本音乐类应用。如此,基于预测得到的结果,该音乐类应用可以针对该用户的改变作为正确反应,比如给该用户提供用户留存转化等个性化、甚至人性化的引导。
基于本实施例可见,通过对用户画像进行持续更新和校准,可以帮助音乐类应用或平台更好地了解自己的用户,并基于用户最新的用户画像集合给用户提供个性化的音乐服务,以及提供下一时刻的用户行为预测,从而预先对用户行为给出反馈和互动。
图3为本申请实施例提供的数据处理方法的流程图。如图3所示,本实施例提供的数据处理方法,包括:
S301、获取用户的多维数据;
S302、通过分析用户的多维数据,创建或更新用户的用户画像集合,并预测用户的动态特征。
本实施例提供的数据处理方法可以由服务端计算设备(比如,服务器)执行,或者,可以由客户端计算设备(比如,智能终端)执行。然而,本申请对此并不限定。
示例性地,客户端计算设备可以采集用户的多维数据,并发送多维数据给服务端计算设备,服务端计算设备通过分析挖掘用户的多维数据,创建或更新用户画像集合,并预测用户的动态特征。或者,客户端计算设备可以在得到用户的多维数据之后,在本地对用户的多维数据进行分析和挖掘,创建或更新用户画像集合,并预测用户的动态特征。然而,本申请对此并不限定。
在示例性实施方式中,在S302中,通过分析用户的多维数据,更新用户的用户画像集合,可以包括:
通过分析用户的多维数据,确定用户在设定时长内的有效行为信息;
基于有效行为信息,更新用户的用户画像集合。
示例性地,基于有效行为信息,更新用户的用户画像集合,可以包括:
判断用户的用户画像集合内是否存在与该有效行为信息匹配的用户画像,若存在,则更新在用户画像集合中匹配到的用户画像的权重,若不存在,则根据该有效行为信息确定探测画像,并将该探测画像增加至用户的用户画像集合。
在示例性实施方式中,本实施例的方法还可以包括:
通过分析用户的多维数据,对用户画像进行模型更新。
示例性地,通过分析用户的多维数据,对用户画像进行模型更新,可以包括:
通过分析用户的多维数据,确定用户在设定时长内的有效行为信息;
判断该有效行为信息与用户的用户画像集合内的最新探测到的用户画像是否匹配,若两者匹配,则将用户的用户画像集合作为正样本更新训练集,若两者不匹配,则将用户的用户画像集合作为负样本更新训练集;
利用更新后的训练集进行模型训练,对不同类型的用户画像进行模型更新。
在示例性实施方式中,在S302之后,本实施例的方法还可以包括:
根据用户的用户画像集合内的一个或多个用户画像的权重,给用户提供个性化服务。
在示例性实施方式中,S301可以包括:
在检测到用户对目标对象的操作行为时,获取用户的多维数据;或者,周期性获取用户的多维数据。
在示例性实施方式中,多维数据可以包括:用户对应于目标对象的全量数据。
示例性地,目标对象可以包括音乐系统,比如,音乐类应用、音乐类平台等。
在本实施例中,S302以及用户画像的模型更新过程是基于人工神经网络模型实现的。下面参照图4和图5,对本实施例的人工神经网络模型的处理过程进行说明。
本实施例中,人工神经网络模型可以包括以下四个部分:画像服务模块、行为链计算模块、行为预测模块以及画像训练模块。其中,上述任一个部分可以包括以下一种或多种算法的组合:聚类算法、挖掘算法、预测算法、反馈算法、机器学习算法以及协同过滤算法。关于每个部分中算法的组合方式可以根据实际业务场景的建模结果确定,本申请对此并不限定。
如图4所示,用户画像集合的更新过程可以包括:
S401、前置模块在用户启动应用(比如,音乐类应用)后,通知画像服务模块;其中,前置模块可以检测用户对应用的操作;前置模块可以为音乐类应用的一部分,运行在客户端计算设备(比如,智能手机等终端)上。
S402、画像服务模块在应用启动后,获取当前用户的用户画像集合;其中,用户画像集合中可以包括一种或多种不同类型的用户画像,比如,偏好画像、行为画像、属性画像、关系画像等。
其中,画像服务模块适于管理用户对应于应用的全量数据以及用户的用户画像集合,示例性地,画像服务模块还可以在用户的授权下获取外围数据。
示例性地,若用户注册该应用后首次启动该应用,则画像服务模块可以根据用户注册数据以及首次登陆数据,进行数据汇总和聚类,基于画像训练模块训练得到的用户画像的模型,构建初始的用户画像,此时,可以获取到初始的用户画像集合;若用户注册该应用后非首次启动该应用,则画像服务模块获取到的用户画像集合可以为用户前一次启动该应用后最后保留的用户画像集合。
S403、前置模块在检测到用户对应用的操作行为后,将用户操作数据发送给行为链计算模块。
S404、行为链计算模块根据用户操作数据过滤出有效操作,得到有效行为信息;其中,有效行为信息可以包括一个或多个行为以及与行为相关的其他维度数据(比如,时间信息等);将通过解析得到的一个或多个行为放入分析队列中,形成有效行为链,与有效行为链中的行为相关的其他维度数据可以放入用户的全量数据中,其中,用户的全量数据可以由画像服务模块提供给行为链计算模块。
其中,有效操作(比如,有效的点击行为)的识别可以根据预设规则来确定,本申请对此并不限定。
S405、行为链计算模块将有效行为信息发送给行为预测模块。其中,行为链计算模块可以将有效行为链以及更新后的用户的全量数据发送给行为预测模块。
S406、行为预测模块根据当前的用户画像集合以及有效行为信息,预测用户的动态特征,比如,预测用户在下一时刻的行为。比如,根据账户对应的用户画像以及使用该账户的用户的最新试听行为,可以预测该账户的用户在下一时刻的试听时长,然后,基于预测得到的试听时长可以给账户推荐满足试听时长要求的音乐等,或者,根据用户的试听时长变化给用户提供个性化的服务引导。
而且,行为预测模块还可以判断有效行为信息与用户画像集合中的用户画像是否匹配;比如,行为预测模块可以根据有效行为信息以及用户的全量数据构建用户最新的探测画像,然后,判断用户画像集合中是否存在与探测画像匹配的用户画像。需要说明的是,由于每个画像会包括多个描述字段,在判断两个画像是否匹配时,可以在满足以下至少之一条件时确认两个画像匹配:两个画像的设定数目的描述字段一致、两个画像的设定描述字段一致。然而,本申请对此并不限定。
S407、如果探测画像和用户画像集合中的某一个用户画像匹配,则行为预测模块向画像服务模块发送确认消息,画像服务模块接收到确认消息后,更新匹配到的用户画像的权重,比如将该用户画像的权重加1;如果探测画像和用户画像集合中的用户画像均不匹配,则行为预测模块将探测画像发送给画像服务模块,画像服务模块将探测画像新增到用户画像集合中。如此,实现用户画像集合的更新和修正。
在本实施例中,在检测到用户在应用上存在有效操作行为时,均会触发进行用户画像集合的更新过程,如此,可以确保用户画像集合的实时性,而且,基于具有实时性的数据进行动态特征预测,可以确保预测准确性。
本实施例中,每种类型的用户画像中包括的描述字段可以通过模型更新过程进行更新。如图5所示,用户画像的模型更新过程可以包括:
S501、前置模块在检测到用户操作行为时,将用户操作数据发送给行为链计算模块。
S502、行为链计算模块可以根据用户操作数据过滤出有效操作,得到有效行为信息,并将有效行为信息发送给行为预测模块。关于有效行为信息的说明可以参照图4中的说明,故于此不再赘述。
示例性地,在S503中,当除用户操作数据之外的数据发生变化时,画像服务模块会将更新后的ID(标识)列表发送给行为预测模块,以便更新最新的用户画像;其中,可以将ID列表作为标签向量,通过对标签向量进行处理,对用户画像进行更新,从而得到最新探测到的用户画像。比如,在音乐类应用中,ID列表可以包括更新的歌曲的风格流派的列表。然而,本申请对此并不限定。在用户数据没有发生变化时,可以不执行本步骤。
S504至S505、行为预测模块对有效行为信息和用户画像集合中的最新探测到的用户画像进行匹配,若有效行为信息和最新探测到的用户画像匹配时,则作为正样本发送给画像训练模块,或者,在两者不一致时,作为负样本发送给画像训练模块。其中,发送给画像训练模块的样本中可以包括用户当前最新的用户画像集合。
S506、画像训练模块接收到样本之后,更新训练集,然后,基于更新后的训练集,进行模型训练,以确定哪些类型的用户画像需要调整描述字段,比如,增加描述字段或改变描述字段等等。其中,在用户画像的模型更新之后,在构建用户画像时可以依据更新后的模型进行操作,从而确保用户画像的准确性。
在本实施例中,不管有效行为信息和最新的用户画像是否匹配,行为预测模块均会采用更新后的用户画像继续探测用户实时的操作行为,以便继续更新训练集。
本实施例中,通过对用户画像的模型进行持续更新,使得最新的用户画像可以准确体现用户的个性化,从而确保用户画像的准确性。
需要说明的是,在用户画像集合的更新过程和模型更新过程均由用户操作行为触发时,则模型更新过程可以在用户画像集合的更新过程之后执行,比如,在图4中,当行为预测模块确定有效行为信息与用户画像集合中的用户画像匹配时,则可以将当前的用户画像集合作为正样本发送给画像训练模块,当两者不匹配时,则可以将当前的用户画像集合作为负样本发送给画像训练模块。示例性地,用户画像集合的更新过程和模型更新过程可以按照设定的周期执行,比如,用户画像集合的更新周期可以为第一周期,模型的更新周期可以为第二周期,若第一周期和第二周期相同,则模型更新过程可以在用户画像集合的更新过程之后执行,若两个周期不同时,则两个过程可以单独执行,即分别按照图4和图5执行。然而,本申请对此并不限定。
如图6所示,本申请实施例还提供一种数据处理装置,包括:
获取模块601,适于获取用户的多维数据;
处理模块602,适于通过分析用户的多维数据,创建或更新用户的用户画像集合,并预测用户的动态特征。
其中,处理模块602可以包括画像服务模块、行为链计算模块、行为预测模块以及画像训练模块。
关于本实施例提供的数据处理装置的说明可以参照上述数据处理方法的相关说明,故于此不再赘述。
此外,本申请实施例还提供一种数据处理方法,包括:
获取用户对应于音乐系统的多维数据;
利用人工神经网络模型分析用户的多维数据,创建或更新用户的用户画像集合,并预测用户的动态特征。
示例性地,本实施例的方法还可以包括:利用人工神经网络模型分析用户的多维数据,对用户画像进行模型更新。
关于人工神经网络模型的说明可以参照上述方法实施例的说明,故于此不再赘述。
此外,如图7所示,本申请实施例还提供一种数据处理方法,包括:
S701、获取账户关联的操作数据,其中,操作数据包括对音频或视频数据所做的非播放操作;
S702、基于该操作数据,获取至少一种音频或视频类型的概率;
S703、基于该概率,向该账户提供该类型的音频或视频数据。
本实施例中,非播放操作可以包括以下一项或多项:添加批注操作、收藏操作、下载、上传、搜索。然而,本申请对此并不限定。在其他实现方式中,非播放操作可以包括除收听之外的其他操作。
在本实施例中,在获取账户关联的操作数据之后,基于操作数据,可以创建或更新账户对应的用户画像(比如,偏好画像、行为画像等),然后,基于账户对应的用户画像,获取至少一种音频或视频类型的概率,比如,基于用户画像,确定该账户偏好的一种或多种音频类型或视频类型的概率,然后,根据得到的概率,向该账户提供该类型的音频或视频数据。示例性地,如图2所示,一个账户偏好金属音乐的概率最高,则可以向该账户提供金属音乐,或者,一个账户偏好电子音乐和流行音乐的概率均较高,则可以向该账户提供电子音乐和流行音乐。
在本实施例中,基于一种或多种音频或视频类型的概率的变化,还可以预测账户在下一时刻的行为。比如,基于该账户的操作数据,监测到对古典音乐的偏好概率发生较大变化,则可以基于上述变化以及其他的辅助数据,分析该账户的操作行为的变化,进而预测该账户的后续操作行为,然后基于预测得到的结果,给该账户提供个性化的服务或引导。
另外,关于本实施例的其他相关说明可以参照上述图3对应的方法实施例的描述,故于此不再赘述。
本申请实施例还提供一种数据处理装置,包括:存储器和处理器,其中,存储器用于存储数据处理程序,该数据处理程序被处理器执行时实现上述图3或图7对应实施例提供的数据处理方法的步骤。
其中,处理器可以包括但不限于微处理器(MCU,Microcontroller Unit)或可编程逻辑器件(FPGA,Field Programmable Gate Array)等的处理装置。存储器可用于存储应用软件的软件程序以及模块,如本实施例中的数据处理方法对应的程序指令或模块,处理器通过运行存储在存储器内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的数据处理方法。存储器可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器可包括相对于处理器远程设置的存储器,这些远程存储器可以通过网络连接至上述数据处理装置。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
此外,本申请实施例还提供一种计算机可读介质,存储有数据处理程序,该数据处理程序被处理器执行时实现上述图3或图7对应实施例提供的数据处理方法的步骤。
本领域普通技术人员可以理解,上文中所公开方法中的全部或某些步骤、系统、装置中的功能模块或单元可以被实施为软件、固件、硬件及其适当的组合。在硬件实施方式中,在以上描述中提及的功能模块或单元之间的划分不一定对应于物理组件的划分;例如,一个物理组件可以具有多个功能,或者一个功能或步骤可以由若干物理组件合作执行。某些组件或所有组件可以被实施为由处理器,如数字信号处理器或微处理器执行的软件,或者被实施为硬件,或者被实施为集成电路,如专用集成电路。这样的软件可以分布在计算机可读介质上,计算机可读介质可以包括计算机存储介质(或非暂时性介质)和通信介质(或暂时性介质)。如本领域普通技术人员公知的,术语计算机存储介质包括在用于存储信息(诸如计算机可读指令、数据结构、程序模块或其他数据)的任何方法或技术中实施的易失性和非易失性、可移除和不可移除介质。计算机存储介质包括但不限于RAM、ROM、EEPROM、闪存或其他存储器技术、CD-ROM、数字多功能盘(DVD)或其他光盘存储、磁盒、磁带、磁盘存储或其他磁存储装置、或者可以用于存储期望的信息并且可以被计算机访问的任何其他的介质。此外,本领域普通技术人员公知的是,通信介质通常包含计算机可读指令、数据结构、程序模块或者诸如载波或其他传输机制之类的调制数据信号中的其他数据,并且可包括任何信息递送介质。
以上显示和描述了本申请的基本原理和主要特征和本申请的优点。本申请不受上述实施例的限制,上述实施例和说明书中描述的只是说明本申请的原理,在不脱离本申请精神和范围的前提下,本申请还会有各种变化和改进,这些变化和改进都落入要求保护的本申请范围内。
Claims (15)
1.一种数据处理方法,其特征在于,包括:
获取用户的多维数据;
通过分析所述用户的多维数据,创建或更新所述用户的用户画像集合,并预测所述用户的动态特征。
2.根据权利要求1所述的方法,其特征在于,所述通过分析所述用户的多维数据,更新所述用户的用户画像集合,包括:
通过分析所述用户的多维数据,确定所述用户在设定时长内的有效行为信息;
基于所述有效行为信息,更新所述用户的用户画像集合。
3.根据权利要求2所述的方法,其特征在于,所述基于所述有效行为信息,更新所述用户的用户画像集合,包括:
判断所述用户的用户画像集合内是否存在与所述有效行为信息匹配的用户画像,若存在,则更新在所述用户画像集合中匹配到的用户画像的权重,若不存在,则根据所述有效行为信息确定探测画像,并将所述探测画像增加至所述用户的用户画像集合。
4.根据权利要求1所述的方法,其特征在于,所述方法还包括:
通过分析所述用户的多维数据,对用户画像进行模型更新。
5.根据权利要求4所述的方法,其特征在于,所述通过分析所述用户的多维数据,对用户画像进行模型更新,包括:
通过分析所述用户的多维数据,确定所述用户在设定时长内的有效行为信息;
判断所述有效行为信息与所述用户的用户画像集合内的最新探测到的用户画像是否匹配,若两者匹配,则将所述用户的用户画像集合作为正样本更新训练集,若两者不匹配,则将所述用户的用户画像集合作为负样本更新训练集;
利用更新后的所述训练集进行模型训练,对不同类型的用户画像进行模型更新。
6.根据权利要求1所述的方法,其特征在于,所述获取用户的多维数据,包括:
在检测到所述用户对目标对象的操作行为时,获取所述用户的多维数据;或者,周期性获取所述用户的多维数据。
7.根据权利要求1所述的方法,其特征在于,所述创建或更新所述用户的用户画像集合之后,所述方法还包括:
根据所述用户的用户画像集合内的一个或多个用户画像的权重,给所述用户提供个性化服务。
8.根据权利要求1所述的方法,其特征在于,所述多维数据包括:用户对应于目标对象的全量数据。
9.根据权利要求6或8所述的方法,其特征在于,所述目标对象包括音乐系统。
10.一种数据处理方法,其特征在于,包括:
获取用户对应于音乐系统的多维数据;
利用人工神经网络模型分析所述用户的多维数据,创建或更新所述用户的用户画像集合,并预测所述用户的动态特征。
11.根据权利要求10所述的方法,其特征在于,所述方法还包括:利用所述人工神经网络模型分析所述用户的多维数据,对用户画像进行模型更新。
12.一种数据处理装置,其特征在于,包括:存储器和处理器,所述存储器用于存储数据处理程序,所述数据处理程序被所述处理器执行时,执行以下操作:获取用户的多维数据;通过分析所述用户的多维数据,创建或更新所述用户的用户画像集合,并预测所述用户的动态特征。
13.一种计算机可读介质,其特征在于,存储有数据处理程序,所述数据处理程序被处理器执行时实现如权利要求1至9中任一项所述的数据处理方法的步骤。
14.一种数据处理方法,其特征在于,包括:
获取账户关联的操作数据,其中,所述操作数据包括对音频或视频数据所做的非播放操作;
基于所述操作数据,获取至少一种音频或视频类型的概率;
基于所述概率,向所述账户提供所述类型的音频或视频数据。
15.根据权利要求14所述的方法,其特征在于,所述非播放操作包括以下一项或多项:添加批注操作、收藏操作、下载、上传、搜索。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711116057.8A CN109784961A (zh) | 2017-11-13 | 2017-11-13 | 一种数据处理方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711116057.8A CN109784961A (zh) | 2017-11-13 | 2017-11-13 | 一种数据处理方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109784961A true CN109784961A (zh) | 2019-05-21 |
Family
ID=66493167
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201711116057.8A Pending CN109784961A (zh) | 2017-11-13 | 2017-11-13 | 一种数据处理方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109784961A (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110275980A (zh) * | 2019-06-26 | 2019-09-24 | 徐州工业职业技术学院 | 一种基于群透视音乐推荐方法 |
CN110956303A (zh) * | 2019-10-12 | 2020-04-03 | 未鲲(上海)科技服务有限公司 | 信息预测方法、装置、终端及可读存储介质 |
CN110992982A (zh) * | 2019-10-28 | 2020-04-10 | 广州荔支网络技术有限公司 | 音频分类方法、装置及可读存储介质 |
CN111079023A (zh) * | 2019-12-30 | 2020-04-28 | Oppo广东移动通信有限公司 | 目标帐户的识别方法、装置、终端及存储介质 |
CN111292849A (zh) * | 2020-01-15 | 2020-06-16 | 浙江连信科技有限公司 | 基于用户行为的心生理特征预测方法及装置 |
WO2021047326A1 (zh) * | 2019-09-09 | 2021-03-18 | 深圳壹账通智能科技有限公司 | 信息推荐方法、装置、计算机设备和存储介质 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20160180183A1 (en) * | 2014-12-17 | 2016-06-23 | Facebook, Inc. | Systems and methods for identifying users in media content based on poselets and neural networks |
CN105930425A (zh) * | 2016-04-18 | 2016-09-07 | 乐视控股(北京)有限公司 | 个性化视频推荐方法及装置 |
CN106504099A (zh) * | 2015-09-07 | 2017-03-15 | 国家计算机网络与信息安全管理中心 | 一种构建用户画像的系统 |
CN106503015A (zh) * | 2015-09-07 | 2017-03-15 | 国家计算机网络与信息安全管理中心 | 一种构建用户画像的方法 |
CN106649491A (zh) * | 2016-09-30 | 2017-05-10 | 广州特道信息科技有限公司 | 一种基于自然语言分析技术的信息推送系统 |
CN106803190A (zh) * | 2017-01-03 | 2017-06-06 | 北京掌阔移动传媒科技有限公司 | 一种广告个性化推送系统及方法 |
-
2017
- 2017-11-13 CN CN201711116057.8A patent/CN109784961A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20160180183A1 (en) * | 2014-12-17 | 2016-06-23 | Facebook, Inc. | Systems and methods for identifying users in media content based on poselets and neural networks |
CN106504099A (zh) * | 2015-09-07 | 2017-03-15 | 国家计算机网络与信息安全管理中心 | 一种构建用户画像的系统 |
CN106503015A (zh) * | 2015-09-07 | 2017-03-15 | 国家计算机网络与信息安全管理中心 | 一种构建用户画像的方法 |
CN105930425A (zh) * | 2016-04-18 | 2016-09-07 | 乐视控股(北京)有限公司 | 个性化视频推荐方法及装置 |
CN106649491A (zh) * | 2016-09-30 | 2017-05-10 | 广州特道信息科技有限公司 | 一种基于自然语言分析技术的信息推送系统 |
CN106803190A (zh) * | 2017-01-03 | 2017-06-06 | 北京掌阔移动传媒科技有限公司 | 一种广告个性化推送系统及方法 |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110275980A (zh) * | 2019-06-26 | 2019-09-24 | 徐州工业职业技术学院 | 一种基于群透视音乐推荐方法 |
WO2021047326A1 (zh) * | 2019-09-09 | 2021-03-18 | 深圳壹账通智能科技有限公司 | 信息推荐方法、装置、计算机设备和存储介质 |
CN110956303A (zh) * | 2019-10-12 | 2020-04-03 | 未鲲(上海)科技服务有限公司 | 信息预测方法、装置、终端及可读存储介质 |
CN110992982A (zh) * | 2019-10-28 | 2020-04-10 | 广州荔支网络技术有限公司 | 音频分类方法、装置及可读存储介质 |
CN111079023A (zh) * | 2019-12-30 | 2020-04-28 | Oppo广东移动通信有限公司 | 目标帐户的识别方法、装置、终端及存储介质 |
CN111292849A (zh) * | 2020-01-15 | 2020-06-16 | 浙江连信科技有限公司 | 基于用户行为的心生理特征预测方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109784961A (zh) | 一种数据处理方法及装置 | |
Seaver | Captivating algorithms: Recommender systems as traps | |
CN108304379B (zh) | 一种文章识别方法、装置及存储介质 | |
Liebman et al. | The right music at the right time: Adaptive personalized playlists based on sequence modeling. | |
Shalizi et al. | Homophily and contagion are generically confounded in observational social network studies | |
Fogues et al. | Open challenges in relationship-based privacy mechanisms for social network services | |
CN110442790A (zh) | 推荐多媒体数据的方法、装置、服务器和存储介质 | |
Tavares et al. | Scaling-laws of human broadcast communication enable distinction between human, corporate and robot twitter users | |
Burgess et al. | Everyday data cultures | |
CN110781321A (zh) | 一种多媒体内容推荐方法及装置 | |
KR20160058895A (ko) | 소셜 커뮤니케이션 데이터의 분석 및 합성을 위한 시스템 및 방법 | |
Couldry et al. | Ontology | |
US20230218214A1 (en) | System and Method for Capturing, Preserving, and Representing Human Experiences and Personality Through a Digital Interface. | |
CN108369715A (zh) | 基于视频内容特性的交互式评述 | |
Hou et al. | Course recommendation of MOOC with big data support: A contextual online learning approach | |
CN106062806A (zh) | 使用交互信号来生成关系并且推广内容 | |
CN105930532B (zh) | 一种向用户推荐多媒体资源的方法和装置 | |
Rosati et al. | Modelling song popularity as a contagious process | |
CN110476162A (zh) | 使用导航助记符控制显示的活动信息 | |
CN112989186A (zh) | 资讯信息推荐模型训练方法、装置、电子设备及存储介质 | |
Ben Sassi et al. | How does context influence music preferences: a user-based study of the effects of contextual information on users’ preferred music | |
Figueroa et al. | Integrating heterogeneous sources for predicting question temporal anchors across Yahoo! Answers | |
Liao et al. | Data mining analytics investigation on TikTok users' behaviors: social media app development | |
CN113573128B (zh) | 一种音频处理方法、装置、终端以及存储介质 | |
Cuomo et al. | Visitor Dynamics in a Cultural Heritage Scenario. |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20190521 |