CN110121088A - 一种用户属性信息确定方法、装置及电子设备 - Google Patents

一种用户属性信息确定方法、装置及电子设备 Download PDF

Info

Publication number
CN110121088A
CN110121088A CN201910310234.9A CN201910310234A CN110121088A CN 110121088 A CN110121088 A CN 110121088A CN 201910310234 A CN201910310234 A CN 201910310234A CN 110121088 A CN110121088 A CN 110121088A
Authority
CN
China
Prior art keywords
attribute information
user
video
information
see
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910310234.9A
Other languages
English (en)
Other versions
CN110121088B (zh
Inventor
胡文
丁浩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing QIYI Century Science and Technology Co Ltd
Original Assignee
Beijing QIYI Century Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing QIYI Century Science and Technology Co Ltd filed Critical Beijing QIYI Century Science and Technology Co Ltd
Priority to CN201910310234.9A priority Critical patent/CN110121088B/zh
Publication of CN110121088A publication Critical patent/CN110121088A/zh
Application granted granted Critical
Publication of CN110121088B publication Critical patent/CN110121088B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • G06V20/46Extracting features or characteristics from the video content, e.g. video fingerprints, representative shots or key frames
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/25Management operations performed by the server for facilitating the content distribution or administrating data related to end-users or client devices, e.g. end-user or client device authentication, learning user preferences for recommending movies
    • H04N21/258Client or end-user data management, e.g. managing client capabilities, user preferences or demographics, processing of multiple end-users preferences to derive collaborative data
    • H04N21/25866Management of end-user data
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/25Management operations performed by the server for facilitating the content distribution or administrating data related to end-users or client devices, e.g. end-user or client device authentication, learning user preferences for recommending movies
    • H04N21/258Client or end-user data management, e.g. managing client capabilities, user preferences or demographics, processing of multiple end-users preferences to derive collaborative data
    • H04N21/25866Management of end-user data
    • H04N21/25891Management of end-user data being end-user preferences
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/442Monitoring of processes or resources, e.g. detecting the failure of a recording device, monitoring the downstream bandwidth, the number of times a movie has been viewed, the storage space available from the internal hard disk
    • H04N21/44213Monitoring of end-user related data
    • H04N21/44222Analytics of user selections, e.g. selection of programs or purchase activity
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/45Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
    • H04N21/466Learning process for intelligent management, e.g. learning user preferences for recommending movies
    • H04N21/4667Processing of monitored end-user data, e.g. trend analysis based on the log file of viewer selections

Abstract

本发明实施例提供了一种用户属性信息确定方法、装置及电子设备,该方法包括:获取用户的视频观看记录;从视频观看记录中提取目标特征,目标特征包括:视频观看行为信息;将目标特征输入预先训练好的模型,得到用户的第一属性信息,预先训练好的模型是:基于从多个样本用户的视频观看记录中提取的目标特征以及多个样本用户的用户属性信息训练得到的,样本用户为:在注册账号时,完整填写用户属性信息的用户;基于第一属性信息和第二属性信息,确定用户的用户属性信息,第二属性信息为:用户注册账号的过程中所填写的属性信息。通过本发明实施例提供的技术方案,在用户所注册的账号的某些字段缺失时,可以较为准确地确定用户的用户属性信息。

Description

一种用户属性信息确定方法、装置及电子设备
技术领域
本发明涉及视频技术领域,特别是涉及一种用户属性信息确定方法、装置及电子设备。
背景技术
用户通过某一客户端观看视频之前,通常会在该客户端注册账号。这样,用户可以通过所注册的账号来登录该客户端,并通过该客户端来观看视频。
然而,发明人在实现本发明的过程中发现,现有技术至少存在如下问题:
在实际应用中,用户在注册账号时,由于注册信息较多或者用户隐私保护等原因,经常会出现某些字段缺失;例如,年龄、性别以及职业等字段可能会缺失。从而导致用户属性信息不完整,进而影响后续针对用户的视频或广告推广等业务。
发明内容
本发明实施例的目的在于提供了一种用户属性信息确定方法、装置及电子设备,以在用户所注册的账号的某些字段缺失时,可以较为准确地确定用户的用户属性信息。具体技术方案如下:
第一方面,本发明实施例提供了一种用户属性确定方法,所述方法包括:
获取用户的视频观看记录;
从所述视频观看记录中提取目标特征,所述目标特征包括:视频观看行为信息;
将所述目标特征输入预先训练好的模型,得到用户的第一属性信息,所述预先训练好的模型是:基于从多个样本用户的视频观看记录中提取的目标特征以及所述多个样本用户的用户属性信息训练得到的,所述样本用户为:在注册账号时,完整填写用户属性信息的用户;
基于所述第一属性信息和第二属性信息,确定所述用户的用户属性信息,所述第二属性信息为:所述用户注册账号的过程中所填写的属性信息。
可选的,所述目标特征还包括以下信息中的至少一种:视频属性信息、客户端属性信息和网络属性信息。
可选的,所述基于所述第一属性信息和第二属性信息,确定所述用户的用户属性信息的步骤,包括:
判断所述第一属性信息和第二属性信息中是否存在属于同一属性的属性信息;
若存在,将所述第二属性信息中属于所述同一属性的属性信息,确定为所述同一属性的目标属性信息;
基于目标属性信息、所述第一属性信息中除所述目标属性信息之外的属性信息和所述第二属性信息中除所述目标属性信息之外的属性信息确定所述用户的用户属性信息。
可选的,在所述基于所述第一属性信息和第二属性信息,确定所述用户的用户属性信息的步骤之前,所述方法还包括:
实时监测所述第二属性信息是否发生更新;
在监测到所述第二属性信息发生更新时,执行所述基于所述第一属性信息和第二属性信息,确定所述用户的用户属性信息的步骤。
可选的,所述方法还包括:
每隔预设时间间隔,重新获取训练样本数据,并根据重新获取的训练样本数据,对所述预先训练好的模型训练;
或者,在监测到有新增的样本用户后,更新训练样本数据,并根据更新后的训练样本数据,对所述预先训练好的模型训练;
其中,训练样本数据包括:从样本用户的视频观看记录中提取的目标特征以及该样本用户的用户属性信息。
第二方面,本发明实施例提供了一种用户属性信息确定装置,所述装置包括:
记录获取模块,用于获取用户的视频观看记录;
特征提取模块,用于从所述视频观看记录中提取目标特征,所述目标特征包括:视频观看行为信息;
第一属性获取模块,用于将所述目标特征输入预先训练好的模型,得到用户的第一属性信息,所述预先训练好的模型是:基于从多个样本用户的视频观看记录中提取的目标特征以及所述多个样本用户的用户属性信息训练得到的,所述样本用户为:在注册账号时,完整填写用户属性信息的用户;
第二属性获取模块,基于所述第一属性信息和第二属性信息,确定所述用户的用户属性信息,所述第二属性信息为:所述用户注册账号的过程中所填写的属性信息。
可选的,所述目标特征还包括以下信息中的至少一种:视频属性信息、客户端属性信息和网络属性信息。
可选的,所述第二属性获取模块,具体包括:
判断所述第一属性信息和第二属性信息中是否存在属于同一属性的属性信息;
若存在,将所述第二属性信息中属于所述同一属性的属性信息,确定为所述同一属性的目标属性信息;
基于目标属性信息、所述第一属性信息中除所述目标属性信息之外的属性信息和所述第二属性信息中除所述目标属性信息之外的属性信息确定所述用户的用户属性信息。
可选的,所述第二属性获取模块,具体包括:
实时监测所述第二属性信息是否发生更新;
在检测到所述第二属性信息发生更新时,基于所述第一属性信息和更新后的第二属性信息,确定所述用户的用户属性信息。
可选的,所述装置还包括:模型更新模块,用于:
每隔预设时间间隔,重新获取训练样本数据,并根据重新获取的训练样本数据,对所述预先训练好的模型训练;
或者,在监测到有新增的样本用户后,更新训练样本数据,并根据更新后的训练样本数据,对所述预先训练好的模型训练;
其中,训练样本数据包括:从样本用户的视频观看记录中提取的目标特征以及该样本用户的用户属性信息。
第三方面,本发明实施例还提供了一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现第一方面所述的一种用户属性信息确定方法。
在本发明实施的又一方面,还提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机程序,计算机程序被处理器执行时实现第一方面所述的一种用户属性信息确定方法。
在本发明实施的又一方面,本发明实施例还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行第一方面所述的一种用户属性信息确定方法。
本发明实施例提供的技术方案,获取用户的视频观看记录;从视频观看记录中提取目标特征,该目标特征包括:视频观看行为信息;并将目标特征输入预先训练好的模型,得到用户的第一属性信息,其中,该预先训练好的模型是基于目标用户的视频观看记录以及目标用户的用户属性信息训练得到的,目标用户为:在注册账号时,完整填写用户属性信息的用户;最终基于第一属性信息和第二属性信息,确定用户的用户属性信息,其中,第二属性信息为:用户注册账号的过程中所填写的属性信息。可见,通过本发明实施例提供的技术方案,可以根据用户的视频观看记录来确定用户的第一属性信息,并基于第一属性信息和用户注册账号的过程中所填写的第二属性信息,来地确定用户的属性信息;从而在用户所注册的账号的某些字段缺失时,可以较为准确地确定用户的用户属性信息。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍。
图1为本发明实施例所提供的一种用户属性信息确定方法的流程图;
图2为本发明实施例所提供的另一种用户属性信息确定方法的流程图;
图3为本发明实施例所提供的一种用户属性信息确定装置的结构示意图;
图4为本发明实施例所提供的一种电子设备的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行描述。
为了解决背景技术记载的技术问题,本发明实施例提供了一种用户属性信息确定方法、装置及电子设备,以在用户所注册的账号的某些字段缺失时,可以较为准确地确定用户的用户属性信息。
第一方面,下面首先对本发明实施例所提供的一种用户属性信息确定方法进行介绍。
如图1所示,本发明实施例所提供的一种用户属性信息确定方法,可以包括如下步骤:
S110,获取用户的视频观看记录。
在一种实施方式中,用户的视频观看记录可以是:从当前时刻记起,当前时刻之前第一时间段内的视频观看记录。该第一时间段可以是一个星期、一个月或者半年等,本发明实施例对该第一时间段不做具体限定。例如,当前时刻为周一,第一时间段为一个星期,那么,用户的视频观看记录可以为:上周一到当前时刻(本周一)的视频观看记录。
在另一种实施方式中,用户的视频观看记录可以是第二时间段内的视频观看记录,该第二时间段可以是当前时刻之前的任意时间段,该第二时间段可以是一个星期、一个月或者半年等,本发明实施例对第二时间段不做具体限定。例如,当前时刻为2019年4月10号,第二时间段为一个星期。用户的视频观看记录可以为:2019年1月1号到2019年1月7号的视频观看记录;还可以是2019年2月15号到2019年2月21号的视频观看记录等,这都是合理的。
S120,从视频观看记录中提取目标特征,目标特征包括:视频观看行为信息。
在获取用户的视频观看记录后,可以从视频观看记录中提取目标特征。其中,从视频观看记录中提取目标特征的方式可以为:采用自然语言模型,从视频观看记录提取目标特征。该自然语言模型可以包括有:word2vec模型,该word2vec模型可以用来将描述视频的词语转换成向量,转换得到的向量即为目标特征,其中,描述视频的词语可以包括描述视频观看行为信息的词语。
具体的,采用自然语言模型从视频观看记录提取目标特征的方式可以为:从视频观看记录中确定描述视频的词语,并针对每一描述视频的词语,可采用word2vec模型,将该描述视频的词语转换为向量,并将转换所得的向量作为目标特征。本发明实施例对从视频观看记录中提取目标特征的方式不做具体限定。
其中,该目标特征可以包括:视频观看行为信息。该视频观看行为信息可以包括:视频观看时间信息、视频观看频率信息、视频观看速率信息及视频观看点击信息。
具体的,视频观看时间信息,可以包括参数a-c:
a、视频观看时间点分布比例,该视频观看时间点分布比例可以为一个四维向量,该向量的第一维度可以用于表征:视频观看时间点为上午所占的比例;该向量的第二维度可以用于表征:视频观看时间点为下午所占的比例;该向量的第三维度可以用于表征:视频观看时间点为晚上所占的比例;该向量的第四维度可以用于表征:视频观看时间点为凌晨所占的比例。
b、视频观看时间分布比例,该视频观看时间分布比例可以为一个七维向量。该向量的第一维度可以用于表征:视频观看时间为周一所占的比例;该向量的第二维度可以用于表征:视频观看时间为周二所占的比例;该向量的第三维度可以用于表征:视频观看时间为周三所占的比例;该向量的第四维度可以用于表征:视频观看时间为周四所占的比例;该向量的第五维度用于表征:视频观看时间为周五所占的比例;该向量的第六维度可以用于表征:视频观看时间为周六所占的比例;该向量的第七维度可以用于表征:视频观看时间为周日所占的比例。
c、视频观看时长,该视频观看时长可以为一个一维向量,该向量可以用于表征:平均每天观看视频的时长。
具体的,视频观看频率信息,可以包括参数d-e:
d、视频观看次数,该视频观看次数可以为一个一维向量,该向量可以用于表征:平均每天观看视频的次数。
e、视频观看时间间隔,该视频观看时间间隔可以为一个一维向量,该向量可以用于表征:相邻两次观看视频之间的时间间隔。
具体的,视频观看速率信息,可以包括参数f:
f、视频倍速观看次数占比,该视频倍速观看次数占比可以为一个一维向量,该向量可以用于表征:平均每天倍速观看视频的次数除以平均每天观看视频的次数。
具体的,视频观看点击信息,可以包括参数g-j:
g、视频拖拽次数占比,该视频拖拽次数占比可以为一个一维向量,该向量可以用于表征:平均每天拖拽视频的次数除以平均每天观看视频的次数。
h、视频跳转次数占比,该视频跳转次数占比可以为一个一维向量,该向量可以用于表征:平均每天跳转视频的次数除以平均每天观看视频的次数。
i、视频暂停次数占比,该视频暂停次数占比可以为一个一维向量,该向量可以用于表征:平均每天暂停视频的次数除以平均每天观看视频的次数。
j、视频完播次数占比,该视频完播次数占比可以为一个一维向量,该向量可以用于表征:平均每天完播视频的次数除以平均每天观看视频的次数。
当然,视频观看行为信息除了可以是上述a~j之外,还可以是其他视频观看行为信息,本发明实施例对视频观看行为信息不做具体限定。
需要强调的是,在一种实施方式中,目标特征除了包括:视频观看行为信息之外,目标特征还包括以下信息中的至少一种:视频属性信息、客户端属性信息和网络属性信息。
首先,视频属性信息可以包括:视频类型,视频标签,视频标题。
具体的,视频类型可以为一个三维向量,该向量的第一维度可以用于表征:视频类型为电视剧;该向量的第二维度可以用于表征:视频类型为电影;该向量的第三维度可以用于表征:视频类型为动漫。
视频标签可以为一个三维向量,该向量的第一维度可以用于表征:视频标签为悬疑片;该向量的第二维度可以用于表征:视频标签为动作片;该向量的第三维度可以用于表征:视频标签为纪录片;
视频标题可以为一个一维向量,例如,该向量可以用于表征视频标题为延禧攻略。
其次,客户端属性信息可以包括:客户端类型,其中,客户端类型可以为一个四维向量,该向量的第一维度可以用于表征:客户端类型为移动端;该向量的第二维度可以用于表征:客户端类型为PC端;该向量的第三维度可以用于表征:客户端类型为TV端;该向量的第四维度可以用于表征:客户端类型为网页端。
再次,网络属性信息可以包括:网络属性类型,其中,网络属性类型可以为一个三维向量,其中,该向量的第一维度可以用于表征:网络属性类型为蜂窝网络;该向量的第二维度可以用于表征:网络属性类型为Wifi网络,该向量的第三维度可以用于表征:网络属性类型为有线网络。
S130,将目标特征输入预先训练好的模型,得到用户的第一属性信息,预先训练好的模型是基于多个样本用户的视频观看行为信息以及多个样本用户的用户属性信息训练得到的,样本用户为:在注册账号时,完整填写用户属性信息的用户。
需要说明的是,训练模型之前,需要确定多个样本用户,样本用户为:在注册账号时,完整填写用户属性信息的用户。其中,确定样本用户的方式可以为:在用户注册系统中,查找完整填写用户属性信息的用户;或者,在用户注册系统中,完整填写用户属性信息的用户数量较少的情况下,确定样本用户的方式还可以为:采取人工标注方式来增加样本用户的数量,具体的,可以人工注册账号,并在注册账号时,完整填写用户属性信息,并将这些注册账号的人确定为样本用户。
在确定多个样本用户之后,获取每个样本用户的视频观看记录,并从每个样本用户的视频观看记录中提取目标特征,并将从每个样本用户的视频观看记录中提取的目标特征输入到预设模型中。针对每一样本用户的视频观看记录,判断从预设模型输出的用户属性信息与该样本用户所填写的用户属性信息是否匹配,如果从预设模型输出的用户属性信息与该样本用户所填写的用户属性信息不匹配,则调整预设模型的参数,直至从预设模型输出的用户属性信息与该样本用户所填写的用户属性信息匹配。此时,调整参数后的预设模型即为训练好的模型。
并且,由于预先训练好的模型是以从样本用户的视频观看记录中提取的目标特征作为输入,根据模型输出的第一属性信息与该样本用户的第二属性信息的差异,对模型的参数不断调优得到的,因此,将从用户的视频观看记录中提取的目标特征输入到预先训练好的模型中,可以较为准确地得到用户的属性信息,为了方便描述,可以把将目标特征输入预先训练好的模型,所得到的用户的属性信息称为第一属性信息。
其中,第一属性信息可以为:性别属性,如男、女;职业属性,如学生、白领或其他;年龄属性,如少年、青年、中年或老年。
并且,为了保证预先训练的模型的实时性,以提高用户的用户属性信息的准确性,可以更新预先训练好的模型。
具体的,更新预先训练好的模型的方式可以有多种更新方式。
其中,第一种更新方式为:每隔预设时间间隔更新一次预先训练好的模型,即将更多样本用户的视频观看记录输入到预先训练好的模型,以优化预先训练好的模型。该预设时间间隔可以为一个月、两个月或者三个月等,这都是合理的,本发明实施例对此不做具体限定。
第二种更新方式为:在监测到有新增的样本用户,即监测到有新用户注册账号,且该新用户完整填写了用户属性信息时,更新预先训练好的模型。即将新增的样本用户的视频观看记录输入到预先训练好的模型,以优化预先训练好的模型。
第三种更新方式为:在检测到实际注册账号的样本用户的数量大于预设数量时,可以从所有样本用户的视频观看记录中,删除通过人工标注方式确定的样本用户的视频观看记录,得到更新后的样本用户的视频观看记录,并利用更新后的样本用户的视频观看记录重新训练预先训练好的模型,以优化预先训练好的模型。可以理解的是,预设数量的大小可以根据实际情况进行确定,本发明实施例对预设数量的大小不做具体限定。
S140,基于第一属性信息和第二属性信息,确定用户的用户属性信息,第二属性信息为:用户注册账号的过程中所填写的属性信息。
用户注册账号的过程中,通常会填写全部属性信息或者部分属性信息,为了方便描述,可以将用户注册账号的过程中所填写的属性信息称为第二属性信息。在得到用户第一属性信息和第二属性信息后,可以基于第一属性信息和第二属性信息来确定用户的用户属性信息。在一种实施方式中,基于第一属性信息和第二属性信息,确定用户的用户属性信息的步骤,可以包括:
判断第一属性信息和第二属性信息中是否存在属于同一属性的属性信息;
若存在,将第二属性信息中属于同一属性的属性信息,确定为同一属性的目标属性信息;
基于目标属性信息、第一属性信息中除目标属性信息之外的属性信息和第二属性信息中除目标属性信息之外的属性信息确定用户的用户属性信息。
在实际应用中,由于第一属性信息与第二属性信息中可能存在属于同一属性的属性信息,例如,第一属性信息中,年龄属性为:少年;而第二属性信息中,年龄属性为:中年。可见,第一属性信息中的“少年”与第二属性信息中的“中年”属于同一属性,该同一属性为:年龄属性。此时,由于第二属性信息为用户在注册账号的过程中所填写的属性信息,因此,第二属性信息中包含的属性信息更加准确,因此,将用户的年龄属性确定为:中年。
当然,在另一种实施方式中,还可以将用户的第一属性信息和第二属性信息均作为用户的属性信息,这都是合理的。
本发明实施例提供的技术方案,获取用户的视频观看记录;从视频观看记录中提取目标特征,该目标特征包括:视频观看行为信息;并将目标特征输入预先训练好的模型,得到用户的第一属性信息,其中,该预先训练好的模型是基于目标用户的视频观看记录以及目标用户的用户属性信息训练得到的,目标用户为:在注册账号时,完整填写用户属性信息的用户;最终基于第一属性信息和第二属性信息,确定用户的用户属性信息,其中,第二属性信息为:用户注册账号的过程中所填写的属性信息。可见,通过本发明实施例提供的技术方案,可以根据用户的视频观看记录来确定用户的第一属性信息,并基于第一属性信息和用户注册账号的过程中所填写的第二属性信息,来地确定用户的属性信息;从而在用户所注册的账号的某些字段缺失时,可以较为准确地确定用户的用户属性信息。
在实际应用中,为了更加准确地确定用户的用户属性信息,本发明实施例还提供了一种用户属性信息确定方法,如图2所示,该用户属性信息确定方法包括如下步骤:
S210,获取用户的视频观看记录。
S220,从视频观看记录中提取目标特征,目标特征包括:视频观看行为信息。
S230,将目标特征输入预先训练好的模型,得到用户的第一属性信息,预先训练好的模型是:基于从多个样本用户的视频观看记录中提取的目标特征以及多个样本用户的用户属性信息训练得到的,样本用户为:在注册账号时,完整填写用户属性信息的用户。
由于图2所示实施例中的S210~S230,与图1所示实施例中的S110~S130相同,因此,在此不再对步骤S210~S230进行赘述。
S240,实时监测第二属性信息是否发生更新;在检测到第二属性信息发生更新时,执行步骤S250。
在实际场景中,用户在注册了账号之后,可能在一段时间后会补充自身的用户属性信息,即填写在注册账号时未填写的用户属性信息。因此,可以实时监测用户自身填写的用户属性信息即第二属性信息是否发生更新。
S250,基于第一属性信息和第二属性信息,确定用户的用户属性信息,第二属性信息为:用户注册账号的过程中所填写的属性信息。
在检测到第二属性信息发生更新时,可以基于第一属性信息和更新后的第二属性信息,确定用户的用户属性信息。这样,所确定的用户的用户属性信息更加准确。
需要说明的是,由于在图1所示实施例中已经详细对基于第一属性信息和第二属性信息,确定用户的用户属性信息的实现方式进行了介绍,在此不再赘述。
可见,通过本发明实施例提供的技术方案,可以根据用户的视频观看记录来确定用户的第一属性信息,并基于第一属性信息和用户注册账号的过程中所填写的第二属性信息,来地确定用户的属性信息;从而在用户所注册的账号的某些字段缺失时,可以较为准确地确定用户的用户属性信息。
第二方面,本发明实施例还提供了一种用户属性信息确定装置,如图3所示,所述装置包括:
记录获取模块310,用于获取用户的视频观看记录;
特征提取模块320,用于从所述视频观看记录中提取目标特征,所述目标特征包括:视频观看行为信息;
第一属性获取模块330,用于将所述目标特征输入预先训练好的模型,得到用户的第一属性信息,所述预先训练好的模型是:基于从多个样本用户的视频观看记录中提取的目标特征以及所述多个样本用户的用户属性信息训练得到的,所述样本用户为:在注册账号时,完整填写用户属性信息的用户;
第二属性获取模块340,基于所述第一属性信息和第二属性信息,确定所述用户的用户属性信息,所述第二属性信息为:所述用户注册账号的过程中所填写的属性信息。
可选的,所述目标特征还包括以下信息中的至少一种:视频属性信息、客户端属性信息和网络属性信息。
可选的,所述第二属性获取模块,具体包括:
判断所述第一属性信息和第二属性信息中是否存在属于同一属性的属性信息;
若存在,将所述第二属性信息中属于所述同一属性的属性信息,确定为所述同一属性的目标属性信息;
基于目标属性信息、所述第一属性信息中除所述目标属性信息之外的属性信息和所述第二属性信息中除所述目标属性信息之外的属性信息确定所述用户的用户属性信息。
可选的,所述第二属性获取模块,具体包括:
实时监测所述第二属性信息是否发生更新;
在检测到所述第二属性信息发生更新时,基于所述第一属性信息和更新后的第二属性信息,确定所述用户的用户属性信息。
所述装置还包括:模型更新模块,用于:
每隔预设时间间隔更新所述预先训练好的模型;
或者,
在监测到有新的样本用户后,更新所述预先训练好的模型。
本发明实施例提供的技术方案,获取用户的视频观看记录;从视频观看记录中提取目标特征,该目标特征包括:视频观看行为信息;并将目标特征输入预先训练好的模型,得到用户的第一属性信息,其中,该预先训练好的模型是基于目标用户的视频观看记录以及目标用户的用户属性信息训练得到的,目标用户为:在注册账号时,完整填写用户属性信息的用户;最终基于第一属性信息和第二属性信息,确定用户的用户属性信息,其中,第二属性信息为:用户注册账号的过程中所填写的属性信息。可见,通过本发明实施例提供的技术方案,可以根据用户的视频观看记录来确定用户的第一属性信息,并基于第一属性信息和用户注册账号的过程中所填写的第二属性信息,来地确定用户的属性信息;从而在用户所注册的账号的某些字段缺失时,可以较为准确地确定用户的用户属性信息。
第三方面,本发明实施例还提供了一种电子设备,如图4所示,包括处理器401、通信接口402、存储器403和通信总线404,其中,处理器401,通信接口402,存储器403通过通信总线404完成相互间的通信,
存储器403,用于存放计算机程序;
处理器401,用于执行存储器403上所存放的程序时,实现第一方面所述的一种用户属性信息确定方法。
上述电子设备提到的通信总线可以是外设部件互连标准(Peripheral ComponentInterconnect,简称PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture,简称EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
通信接口用于上述电子设备与其他设备之间的通信。
存储器可以包括随机存取存储器(Random Access Memory,简称RAM),也可以包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。
上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,简称CPU)、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器(Digital Signal Processing,简称DSP)、专用集成电路(Application SpecificIntegrated Circuit,简称ASIC)、现场可编程门阵列(Field-Programmable Gate Array,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
本发明实施例提供的技术方案,获取用户的视频观看记录;从视频观看记录中提取目标特征,该目标特征包括:视频观看行为信息;并将目标特征输入预先训练好的模型,得到用户的第一属性信息,其中,该预先训练好的模型是基于目标用户的视频观看记录以及目标用户的用户属性信息训练得到的,目标用户为:在注册账号时,完整填写用户属性信息的用户;最终基于第一属性信息和第二属性信息,确定用户的用户属性信息,其中,第二属性信息为:用户注册账号的过程中所填写的属性信息。可见,通过本发明实施例提供的技术方案,可以根据用户的视频观看记录来确定用户的第一属性信息,并基于第一属性信息和用户注册账号的过程中所填写的第二属性信息,来地确定用户的属性信息;从而在用户所注册的账号的某些字段缺失时,可以较为准确地确定用户的用户属性信息。
第四方面,在本发明提供的又一实施例中,还提供了一种计算机可读存储介质,该计算机可读存储介质中存储有计算机程序,计算机程序被处理器执行时实现任一所述的一种用户属性信息确定方法。
本发明实施例提供的技术方案,获取用户的视频观看记录;从视频观看记录中提取目标特征,该目标特征包括:视频观看行为信息;并将目标特征输入预先训练好的模型,得到用户的第一属性信息,其中,该预先训练好的模型是基于目标用户的视频观看记录以及目标用户的用户属性信息训练得到的,目标用户为:在注册账号时,完整填写用户属性信息的用户;最终基于第一属性信息和第二属性信息,确定用户的用户属性信息,其中,第二属性信息为:用户注册账号的过程中所填写的属性信息。可见,通过本发明实施例提供的技术方案,可以根据用户的视频观看记录来确定用户的第一属性信息,并基于第一属性信息和用户注册账号的过程中所填写的第二属性信息,来地确定用户的属性信息;从而在用户所注册的账号的某些字段缺失时,可以较为准确地确定用户的用户属性信息。
第五方面,在本发明提供的又一实施例中,还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述实施例中任一所述的一种用户属性信息确定方法。
本发明实施例提供的技术方案,获取用户的视频观看记录;从视频观看记录中提取目标特征,该目标特征包括:视频观看行为信息;并将目标特征输入预先训练好的模型,得到用户的第一属性信息,其中,该预先训练好的模型是基于目标用户的视频观看记录以及目标用户的用户属性信息训练得到的,目标用户为:在注册账号时,完整填写用户属性信息的用户;最终基于第一属性信息和第二属性信息,确定用户的用户属性信息,其中,第二属性信息为:用户注册账号的过程中所填写的属性信息。可见,通过本发明实施例提供的技术方案,可以根据用户的视频观看记录来确定用户的第一属性信息,并基于第一属性信息和用户注册账号的过程中所填写的第二属性信息,来地确定用户的属性信息;从而在用户所注册的账号的某些字段缺失时,可以较为准确地确定用户的用户属性信息。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘Solid State Disk(SSD))等。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置、电子设备、存储介质及计算机程序产品实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。

Claims (12)

1.一种用户属性信息确定方法,其特征在于,所述方法包括:
获取用户的视频观看记录;
从所述视频观看记录中提取目标特征,所述目标特征包括:视频观看行为信息;
将所述目标特征输入预先训练好的模型,得到用户的第一属性信息,所述预先训练好的模型是:基于从多个样本用户的视频观看记录中提取的目标特征以及所述多个样本用户的用户属性信息训练得到的,所述样本用户为:在注册账号时,完整填写用户属性信息的用户;
基于所述第一属性信息和第二属性信息,确定所述用户的用户属性信息,所述第二属性信息为:所述用户注册账号的过程中所填写的属性信息。
2.根据权利要求1所述的方法,其特征在于,所述目标特征还包括以下信息中的至少一种:视频属性信息、客户端属性信息和网络属性信息。
3.根据权利要求1所述的方法,其特征在于,所述基于所述第一属性信息和第二属性信息,确定所述用户的用户属性信息的步骤,包括:
判断所述第一属性信息和第二属性信息中是否存在属于同一属性的属性信息;
若存在,将所述第二属性信息中属于所述同一属性的属性信息,确定为所述同一属性的目标属性信息;
基于目标属性信息、所述第一属性信息中除所述目标属性信息之外的属性信息和所述第二属性信息中除所述目标属性信息之外的属性信息确定所述用户的用户属性信息。
4.根据权利要求1所述的方法,其特征在于,在所述基于所述第一属性信息和第二属性信息,确定所述用户的用户属性信息的步骤之前,所述方法还包括:
实时监测所述第二属性信息是否发生更新;
在监测到所述第二属性信息发生更新时,执行所述基于所述第一属性信息和第二属性信息,确定所述用户的用户属性信息的步骤。
5.根据权利要求1至4任一项所述的方法,其特征在于,所述方法还包括:
每隔预设时间间隔,重新获取训练样本数据,并根据重新获取的训练样本数据,对所述预先训练好的模型训练;
或者,在监测到有新增的样本用户后,更新训练样本数据,并根据更新后的训练样本数据,对所述预先训练好的模型训练;
其中,训练样本数据包括:从样本用户的视频观看记录中提取的目标特征以及该样本用户的用户属性信息。
6.一种用户属性信息确定装置,其特征在于,所述装置包括:
记录获取模块,用于获取用户的视频观看记录;
特征提取模块,用于从所述视频观看记录中提取目标特征,所述目标特征包括:视频观看行为信息;
第一属性获取模块,用于将所述目标特征输入预先训练好的模型,得到用户的第一属性信息,所述预先训练好的模型是:基于从多个样本用户的视频观看记录中提取的目标特征以及所述多个样本用户的用户属性信息训练得到的,所述样本用户为:在注册账号时,完整填写用户属性信息的用户;
第二属性获取模块,基于所述第一属性信息和第二属性信息,确定所述用户的用户属性信息,所述第二属性信息为:所述用户注册账号的过程中所填写的属性信息。
7.根据权利要求6所述的装置,其特征在于,所述目标特征还包括以下信息中的至少一种:视频属性信息、客户端属性信息和网络属性信息。
8.根据权利要求6所述的装置,其特征在于,所述第二属性获取模块,具体包括:
判断所述第一属性信息和第二属性信息中是否存在属于同一属性的属性信息;
若存在,将所述第二属性信息中属于所述同一属性的属性信息,确定为所述同一属性的目标属性信息;
基于目标属性信息、所述第一属性信息中除所述目标属性信息之外的属性信息和所述第二属性信息中除所述目标属性信息之外的属性信息确定所述用户的用户属性信息。
9.根据权利要求6所述的装置,其特征在于,所述第二属性获取模块,具体包括:
实时监测所述第二属性信息是否发生更新;
在检测到所述第二属性信息发生更新时,基于所述第一属性信息和更新后的第二属性信息,确定所述用户的用户属性信息。
10.根据权利要求6至9任一项所述的装置,其特征在于,所述装置还包括:模型更新模块,用于:
每隔预设时间间隔,重新获取训练样本数据,并根据重新获取的训练样本数据,对所述预先训练好的模型训练;
或者,在监测到有新增的样本用户后,更新训练样本数据,并根据更新后的训练样本数据,对所述预先训练好的模型训练;
其中,训练样本数据包括:从样本用户的视频观看记录中提取的目标特征以及该样本用户的用户属性信息。
11.一种电子设备,其特征在于,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现权利要求1-5任一所述的方法步骤。
12.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1-5任一所述的方法步骤。
CN201910310234.9A 2019-04-17 2019-04-17 一种用户属性信息确定方法、装置及电子设备 Active CN110121088B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910310234.9A CN110121088B (zh) 2019-04-17 2019-04-17 一种用户属性信息确定方法、装置及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910310234.9A CN110121088B (zh) 2019-04-17 2019-04-17 一种用户属性信息确定方法、装置及电子设备

Publications (2)

Publication Number Publication Date
CN110121088A true CN110121088A (zh) 2019-08-13
CN110121088B CN110121088B (zh) 2021-05-25

Family

ID=67521108

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910310234.9A Active CN110121088B (zh) 2019-04-17 2019-04-17 一种用户属性信息确定方法、装置及电子设备

Country Status (1)

Country Link
CN (1) CN110121088B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111008667A (zh) * 2019-12-06 2020-04-14 北京爱奇艺科技有限公司 一种特征提取方法、装置及电子设备
CN111222566A (zh) * 2020-01-02 2020-06-02 平安科技(深圳)有限公司 用户属性识别方法、装置及存储介质
CN111275011A (zh) * 2020-02-25 2020-06-12 北京百度网讯科技有限公司 移动红绿灯检测方法、装置、电子设备和存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130236049A1 (en) * 2012-03-06 2013-09-12 Mogencelab Corporation Indoor user positioning method using motion recognition unit
CN103984741A (zh) * 2014-05-23 2014-08-13 合一信息技术(北京)有限公司 用户属性信息提取方法及其系统
CN106126597A (zh) * 2016-06-20 2016-11-16 乐视控股(北京)有限公司 用户属性预测方法及装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130236049A1 (en) * 2012-03-06 2013-09-12 Mogencelab Corporation Indoor user positioning method using motion recognition unit
CN103984741A (zh) * 2014-05-23 2014-08-13 合一信息技术(北京)有限公司 用户属性信息提取方法及其系统
CN106126597A (zh) * 2016-06-20 2016-11-16 乐视控股(北京)有限公司 用户属性预测方法及装置

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111008667A (zh) * 2019-12-06 2020-04-14 北京爱奇艺科技有限公司 一种特征提取方法、装置及电子设备
CN111008667B (zh) * 2019-12-06 2023-06-02 北京爱奇艺科技有限公司 一种特征提取方法、装置及电子设备
CN111222566A (zh) * 2020-01-02 2020-06-02 平安科技(深圳)有限公司 用户属性识别方法、装置及存储介质
CN111222566B (zh) * 2020-01-02 2020-09-01 平安科技(深圳)有限公司 用户属性识别方法、装置及存储介质
CN111275011A (zh) * 2020-02-25 2020-06-12 北京百度网讯科技有限公司 移动红绿灯检测方法、装置、电子设备和存储介质
CN111275011B (zh) * 2020-02-25 2023-12-19 阿波罗智能技术(北京)有限公司 移动红绿灯检测方法、装置、电子设备和存储介质

Also Published As

Publication number Publication date
CN110121088B (zh) 2021-05-25

Similar Documents

Publication Publication Date Title
US9800910B2 (en) Recommending media items based on take rate signals
CN106331778B (zh) 视频推荐方法和装置
US20210120319A1 (en) Hot video clip extraction method, user equipment, and server
US20200118168A1 (en) Advertising method, device and system, and computer-readable storage medium
CN109495770B (zh) 一种直播间推荐方法、装置、设备及介质
CN110941738B (zh) 推荐方法、装置、电子设备及计算机可读存储介质
CN104537000B (zh) 一种用于推送信息的方法和装置
CN109040157A (zh) 一种基于互联网的录播数据学习监控方法
CN110121088A (zh) 一种用户属性信息确定方法、装置及电子设备
US11636367B2 (en) Systems, apparatus, and methods for generating prediction sets based on a known set of features
US11748646B2 (en) Database query and data mining in intelligent distributed communication networks
CN108965951B (zh) 广告的播放方法及装置
CN103997662A (zh) 节目推送的方法及系统
CN109636479A (zh) 一种广告推荐方法、装置、电子设备及存储介质
CN109299369A (zh) 一种推荐数据的确定方法、装置及服务器
US11257000B2 (en) Systems, apparatus, and methods for generating prediction sets based on a known set of features
CN114747227A (zh) 跨人口统计群体估计普查级受众规模和总印象持续时间的方法、系统和装置
JP6792694B1 (ja) Tvcmの効果を評価するための装置、方法及びそのためのプログラム
CN106534984B (zh) 电视节目推送方法及装置
CN105843876A (zh) 多媒体资源的质量评估方法和装置
CN111090810A (zh) 一种应用消息的推送方法、装置及电子设备
CN107341172B (zh) 视频收益计算建模装置与方法及视频推荐装置与方法
CN110769286B (zh) 一种基于频道的推荐方法及装置、存储介质
CN113627983A (zh) 一种基于视频创意的网络广告推广方法及系统
CN111353052B (zh) 一种多媒体对象推荐方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant