CN109656433B - 类目信息处理方法、装置、计算机设备和存储介质 - Google Patents
类目信息处理方法、装置、计算机设备和存储介质 Download PDFInfo
- Publication number
- CN109656433B CN109656433B CN201710942496.8A CN201710942496A CN109656433B CN 109656433 B CN109656433 B CN 109656433B CN 201710942496 A CN201710942496 A CN 201710942496A CN 109656433 B CN109656433 B CN 109656433B
- Authority
- CN
- China
- Prior art keywords
- category
- behavior
- obtaining
- content entity
- training
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000010365 information processing Effects 0.000 title claims abstract description 40
- 238000003672 processing method Methods 0.000 title claims abstract description 22
- 230000006399 behavior Effects 0.000 claims abstract description 495
- 238000004458 analytical method Methods 0.000 claims abstract description 47
- 238000000034 method Methods 0.000 claims abstract description 33
- 238000012549 training Methods 0.000 claims description 144
- 238000009826 distribution Methods 0.000 claims description 95
- 238000004590 computer program Methods 0.000 claims description 19
- 238000010606 normalization Methods 0.000 claims description 9
- 238000012545 processing Methods 0.000 claims description 9
- 238000010276 construction Methods 0.000 claims description 4
- 238000009795 derivation Methods 0.000 claims description 4
- 238000010586 diagram Methods 0.000 description 20
- 238000013507 mapping Methods 0.000 description 8
- 238000012706 support-vector machine Methods 0.000 description 5
- 230000009471 action Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000003542 behavioural effect Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000012217 deletion Methods 0.000 description 2
- 230000037430 deletion Effects 0.000 description 2
- 238000007477 logistic regression Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/048—Interaction techniques based on graphical user interfaces [GUI]
- G06F3/0481—Interaction techniques based on graphical user interfaces [GUI] based on specific properties of the displayed interaction object or a metaphor-based environment, e.g. interaction with desktop elements like windows or icons, or assisted by a cursor's changing behaviour or appearance
Landscapes
- Engineering & Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明涉及一种类目信息处理方法、装置、计算机设备和存储介质,方法包括:获取第一操作行为集合,第一操作行为集合中的各个操作行为作用于对应的内容实体;将各个操作行为对应的内容实体组成第一目标内容实体集合;根据各个操作行为的操作类型以及第一目标内容实体集合中的各个内容实体的属性信息得到当前用户标识对应的行为特征;将行为特征输入到预先训练的类目倾向分析模型中,得到当前用户标识对应的对各个类目的倾向值;根据各个类目的倾向值得到当前用户标识对应的类目展示参数信息。上述方法可以根据各个用户的个人操作行为调整类目的展示形式,进行个性化的展示,提高类目与用户的匹配度,减少类目查找的难度。
Description
技术领域
本发明涉及信息技术领域,特别是涉及类目信息处理方法、装置、计算机设备和存储介质。
背景技术
随着信息技术的发展,互联网上提供的内容越来越丰富,因此越来越多的用户通过终端设备浏览信息。例如,通过新闻应用程序阅读新闻等。
现有技术中,通常会根据信息所涉及的领域、热度等信息的属性信息对信息进行分类,得到类目,然后在终端上展示该类目,当接收到用户对类目的选择操作时,跳转到对应的类目页面,方便用户阅读该类目下的内容信息。然而,由于终端界面大小的限制,且类目的数量比较多,导致类目查找难度大。
发明内容
基于此,有必要针对上述的问题,提供一种类目信息处理方法、装置、计算机设备和存储介质,可根据各个用户的个人操作行为调整类目的展示形式,进行个性化的展示,提高类目与用户的匹配度,减少类目查找的难度。
一种类目信息处理方法,所述方法包括:获取第一操作行为集合,所述第一操作行为集合中的各个操作行为作用于对应的内容实体,所述第一操作行为集合中的各个操作行为对应当前用户标识;将所述各个操作行为对应的内容实体组成第一目标内容实体集合;根据所述各个操作行为的操作类型以及所述第一目标内容实体集合中的各个内容实体的属性信息得到所述当前用户标识对应的行为特征;将所述行为特征输入到预先训练的类目倾向分析模型中,得到所述当前用户标识对应的对所述各个类目的倾向值;根据所述各个类目的倾向值得到所述当前用户标识对应的类目展示参数信息。
一种类目信息处理装置,所述装置包括:第一操作集和获取模块,用于获取第一操作行为集合,所述第一操作行为集合中的各个操作行为作用于对应的内容实体,所述第一操作行为集合中的各个操作行为对应当前用户标识;第一实体集合组成模块,用于将所述各个操作行为对应的内容实体组成第一目标内容实体集合;行为特征获取模块,用于根据所述各个操作行为的操作类型以及所述第一目标内容实体集合中的各个内容实体的属性信息得到所述当前用户标识对应的行为特征;倾向值得到模块,用于将所述行为特征输入到预先训练的类目倾向分析模型中,得到所述当前用户标识对应的对所述各个类目的倾向值;展示参数得到模块,用于根据所述各个类目的倾向值得到所述当前用户标识对应的类目展示参数信息。
一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行上述类目信息处理方法的步骤。
一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行上述类目信息处理方法的步骤。
上述类目信息处理方法、装置、计算机设备和存储介质,通过获取当前用户标识对应的操作行为组成操作行为集合,然后将各个操作行为对应的内容实体作为第一目标内容实体集合,根据各个操作行为的操作类型以及第一目标内容实体集合中的各个内容实体的属性信息得到当前用户标识对应的行为特征,并将行为特征输入到预先训练的类目倾向分析模型中,得到当前用户标识对应的对各个类目的倾向值,然后根据各个类目的倾向值得到当前用户标识对应的类目展示参数信息。由于通过采用大数据量训练得到的类目倾向分析模型以及用户的操作行为以及操作行为涉及的内容实体的属性信息预测用户倾向选择的类目,得到各个类目的展示参数,因此可以根据各个用户的个人操作行为调整类目的展示形式,进行个性化的展示,提高类目与用户的匹配度,减少类目查找的难度。
附图说明
图1为一个实施例中提供的类目信息处理方法的应用环境图;
图2为一个实施例中类目信息处理方法的流程图;
图3为一个实施例中获取第一操作行为集合的流程图;
图4为一个实施例中根据各个操作行为的操作类型以及第一目标内容实体集合中的各个内容实体的属性信息得到当前用户标识对应的行为特征的流程图;
图5为一个实施例中类目信息处理方法的流程图;
图6为一个实施例中根据各个类目对应的操作类型分布以及预设的评分规则得到当前用户标识对应的对各个类目的画像分值的流程图;
图7为一个实施例中类目信息处理方法的流程图;
图8为一个实施例中类目信息处理方法的流程图;
图9为一个实施例中将行为特征输入到预先训练的类目倾向分析模型中,得到当前用户标识对应的对各个类目的倾向值的流程图;
图10为一个实施例中类目信息处理装置的结构框图;
图11为一个实施例中第一操作集和获取模块的结构框图;
图12为一个实施例中行为特征获取模块的结构框图;
图13为一个实施例中类目信息处理装置的结构框图;
图14为一个实施例中画像分值得到模块的结构框图;
图15为一个实施例中类目信息处理装置的结构框图;
图16为一个实施例中类目信息处理装置的结构框图;
图17为一个实施例中倾向值得到模块的结构框图;
图18A为一个实施例中的类目展示示意图;
图18B为一个实施例中的类目展示示意图;
图19为一个实施例中计算机设备的内部结构框图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
可以理解,本申请所使用的术语“第一”、“第二”等可在本文中用于描述各种元件,但除非特别说明,这些元件不受这些术语限制。这些术语仅用于将第一个元件与另一个元件区分。举例来说,在不脱离本申请的范围的情况下,可以将第一操作行为集合称为第二操作行为集合,且类似地,可将第二操作行为集合称为第一操作行为集合。
图1为一个实施例中提供的类目信息处理方法的应用环境图,参照图1,该类目信息处理方法应用于类目信息处理系统,包括终端110以及计算机设备120,终端110可以接收当前用户标识对应的当前用户作用于终端上展示的内容实体的当前操作行为,将当前操作行为发生给计算机设备120,计算机设备120接收到当前操作行为后获取第一操作行为集合,并根据第一操作行为集合得到当前用户标识对应的类目展示参数信息。可以理解,终端110也可以在接收到当前用户作用于终端上展示的内容实体的当前操作行为时,获取第一操作行为集合,并根据第一操作行为集合得到当前用户标识对应的类目展示参数信息。
计算机设备120可以是独立的物理服务器或终端,也可以是多个物理服务器构成的服务器集群,可以是提供云服务器、云数据库、云存储和CDN等基础云计算服务的云服务器。终端110可以是智能手机、平板电脑、笔记本电脑、台式计算机、智能音箱、智能手表等,但并不局限于此。终端110以及计算机设备120可以通过蓝牙、USB(Universal Serial Bus,通用串行总线)或者网络等通讯连接方式进行连接,本发明在此不做限制。
如图2所示,在一个实施例中,提出了一种类目信息处理方法,本实施例主要以该方法应用于上述图1中的计算机设备120来举例说明,具体可以包括以下步骤:
步骤202,获取第一操作行为集合,第一操作行为集合中的各个操作行为作用于对应的内容实体,第一操作行为集合中的各个操作行为对应当前用户标识。
具体地,内容实体指终端上展示的内容对象,内容对象可以以文字、语音、图像、音频以及视频等不同表现形式单独或者组合展示,例如,内容实体可以是一篇以文字以及图片组合形成的新闻或者一段视频等等。操作行为指接收的作用于操作对象的动作,例如可以包括点击、分享、收藏、购买、删除、置顶、下移以及上移中的一种或多种。操作行为作用于内容实体是指该操作行为是针对该内容实体的,内容实体为操作行为的操作对象。例如,点击一个新闻的链接、分享了一段视频或者收藏了新闻等等。当前用户标识用于标识当前用户。第一操作行为集合中可以包括一个或多个操作行为,各个操作行为与当前用户标识对应指操作行为是当前用户标识对应的当前用户操作的。例如,用户A点击了某一条新闻,则该用户A的用户标识与点击该新闻的操作行为对应。获取第一操作行为集合的时间可以根据需要进行设置,例如可以设置在当接收到当前用户对内容实体的一次操作行为后实时获取第一操作行为集合,也可以设置每隔预设周期例如每两个小时获取一次操作行为集合,或者每隔预设个操作行为获取一次操作行为集合。
步骤204,将各个操作行为对应的内容实体组成第一目标内容实体集合。
具体地,第一目标内容实体集合包括一个或多个内容实体。得到第一操作行为集合后,获取各个操作行为的操作对象,作为对应的内容实体。例如,假设第一操作行为中包括点击A文章的操作行为、分享B视频的操作行为以及收藏C音频的操作行为,则第一内容实体集合包括A文章、B视频以及C音频。
步骤206,根据各个操作行为的操作类型以及第一目标内容实体集合中的各个内容实体的属性信息得到当前用户标识对应的行为特征。
具体地,内容实体的属性信息是指对内容实体的性质或者关系进行描述的信息,可以是内容实体的全部属性信息,也可以是部分属性信息,具体可以根据实际需要进行设置。例如,属性信息可以包括内容实体所属的领域,如体育领域、娱乐领域。操作行为的类型可以包括点击、收藏、购买、分享或者删除中的一个或多个,具体可以根据实际需要进行设置。可以根据各个操作行为的操作类型以及第一目标内容实体集合中的各个内容实体的属性信息构造行为特征。可以将对内容实体的操作,视为对该内容实体的属性信息进行的操作,例如若用户收藏了A内容实体,A内容实体包括F标签词,则视为用户收藏了F标签词。然后对该属性信息进行操作的操作类型的次数进行统计,得到各个属性信息对应的操作类型分布,根据属性信息的操作类型分布得到对应的特征。
根据操作类型分布得到对应的行为特征的规则具体可以根据实际需要进行设置。在一个实施例中,可以为属性的操作类型分布进行编号,如依次为1、2、3等。在一个实施例中,可以将属性的操作类型分布映射到特征向量空间,如第一个属性的操作类型分布映射得到的行为特征可以表示为[10000000],第二个属性的操作类型分布映射得到的行为特征可以表示为[01000000],行为特征的维度具体可以根据实际需要进行设置。例如100维等。
步骤208,将行为特征输入到预先训练的类目倾向分析模型中,得到当前用户标识对应的对各个类目的倾向值。
具体地,类目是指对内容实体进行分类得到的类别目录。分类规则具体可以根据实际需要进行设定,如根据内容实体的内容或者热度、更新时间进行分类。以内容实体为新闻为例,可以将新闻分为体育、娱乐、社会以及热点新闻,则体育、娱乐、社会以及热点为新闻的类目。倾向值用于表示用户查看类目的可能性,类目对应的倾向值越大,则表示用户查看类目的可能性越大。类目倾向分析模型是根据训练数据进行模型训练得到的,用于预测用户对类目的倾向。将行为特征输入类目倾向分析模型之前,需要通过训练数据进行模型训练,确定每个行为特征对应的模型参数,从而根据训练得到的模型参数得到类目倾向分析模型。在进行模型训练时,可以采用有监督的模型训练方式,例如逻辑回归模型、SVM(Support Vector Machine,支持向量机)以及贝叶斯模型等等。训练样本对应的类目是已知的,因此可以进行模型训练学习到将行为特征映射到类目的模型参数,得到类目倾向分析模型。将行为特征输入到预先训练的类目倾向分析模型后,根据行为特征以及对应的模型参数得到当前用户标识对应的对各个类目的倾向值。
在一个实施例中,内容实体的属性信息包括所内容实体所属的类目、领域以及内容实体的标签词中的至少一种。标签词是指对内容实体涉及的内容进行描述的词语,例如,对于一则关于足球明星内马尔个人生活的新闻,标签词可以是足球、明星以及娱乐。内容实体的标签词可以是发布内容实体的用户标注的,也可以是其他用户标注的,也可以通过机器学习的方法学习得到标签词标注模型,然后利用标签词标注模型得到内容实体的标签词,本发明实施例对标签词的获取方法不做限定。
在一个实施例中,还可以根据当前用户标识构造当前用户特征,将当前用户特征以及行为特征输入到预先训练的类目倾向分析模型中,得到当前用户标识对应的对各个类目的倾向值。
在一个实施例中,还可以结合当前用户标识以及内容实体的属性信息构造属性特征,然后将属性特征以及行为特征输入到预先训练的类目倾向分析模型中,得到当前用户标识对应的对各个类目的倾向值。例如,可以结合当前用户标识以及内容实体的标识构造属性特征,或者结合当前用户标识与标签词构造属性特征。
步骤210,根据各个类目的倾向值得到当前用户标识对应的类目展示参数信息。
具体地,类目展示参数信息指类目展示对应的参数,展示参数信息可以是类目排列顺序,也可以是对类目的展示方式,例如类目的展示格式、类目的颜色、大小等信息。可以预先设置各个倾向值对应的展示参数信息,例如可以将倾向值高的类目的排在前面或者将倾向值高的类目加粗显示、加大字号显示、标注颜色或者通过动画进行显示的一种或多种。得到各个类目的倾向值后,根据类目的倾向值得到当前用户标识对应的类目展示参数信息。得到类目展示参数信息后,可以将类目展示参数信息发送给终端,使得终端可以根据展示参数信息对类目进行展示。
上述类目信息处理方法通过获取当前用户标识对应的操作行为组成操作行为集合,然后将各个操作行为对应的内容实体作为第一目标内容实体集合,根据各个操作行为的操作类型以及第一目标内容实体集合中的各个内容实体的属性信息得到当前用户标识对应的行为特征,并将行为特征输入到预先训练的类目倾向分析模型中,得到当前用户标识对应的对各个类目的倾向值,然后根据各个类目的倾向值得到当前用户标识对应的类目展示参数信息。由于通过采用大数据量训练得到的类目倾向分析模型以及用户的操作行为以及操作行为涉及的内容实体的属性信息预测用户倾向选择的类目,得到各个类目的展示参数,因此可以根据各个用户的个人操作行为调整类目的展示形式,进行个性化的展示,提高类目与用户的匹配度,减少类目查找的难度。
在一个实施例中,如图3所示,步骤S202即获取第一操作行为集合,第一操作行为集合中的各个操作行为作用于对应的内容实体,第一操作行为集合中的各个操作行为对应当前用户标识的步骤具体可以包括以下步骤:
步骤S302,获取当前用户标识对应的当前操作行为,当前操作行为作用于当前内容实体。
具体地,当前内容实体是指当前操作行为的操作对象,例如,当用户点击某个视频时,点击的操作动作为当前操作行为,该视频为当前内容实体。
步骤S304,当前操作行为触发获取当前操作行为之前的当前用户标识对应的第一历史操作行为,将第一历史操作行为和当前操作行为组成第一操作行为集合。
具体地,当前用户标识对应的历史操作行为是指在当前操作行为之前发生的,且是当前用户标识对应的当前用户进行操作的操作行为。获取第一历史操作行为的规则可以根据实际需要进行设置。在一个实施例中,可以是当前用户标识对应的全部历史操作行为。在一个实施例中,也可以是部分历史操作行为如预设时间段内或者预设次数的历史操作行为,例如,最近一周的历史操作行为或者最近100次的历史操作行为等等。当得到第一历史操作行为后,将第一历史操作行为以及当前操作行为组成第一操作行为集合。
在一个实施例中,如图4所示,步骤S206即根据各个操作行为的操作类型以及第一目标内容实体集合中的各个内容实体的属性信息得到当前用户标识对应的行为特征的步骤具体可以包括以下步骤:
步骤S402,统计第一目标内容实体集合中的各个内容实体的属性信息,得到属性信息集合。
具体地,属性信息集合可以包括一个或多个属性。得到第一目标内容集合后,获取各个第一目标内容实体中的内容实体的属性信息,得到属性信息集合。例如,若第一目标内容实体包括A内容实体、B内容实体以及C内容实体,其中A内容实体的属性信息为c1领域、t1标签词、t2标签词,B内容实体的属性信息为c2领域、t1标签词、t3标签词,C内容实体的属性信息为c1领域、t5标签词、t6标签词,则以属性信息集合中的属性信包括c1领域、c2领域、t1标签词、t2标签词、t3标签词、t5标签词、t6标签词。
步骤S404,获取与属性信息集合中各个属性信息匹配的第一操作行为集合中的操作行为,根据各个属性信息匹配的操作行为的操作类型和对应的操作次数,得到各个属性信息对应的操作类型分布。
具体地,操作类型分布可以以次数表示也可以以比例表示,具体不做限制。在一个实施例中,操作类型分布可以包括各个属性信息对应的操作类型的操作次数,也可以包括属性信息对应的操作类型的操作次数占全部属性信息对应的操作类型的总操作次数的比例。属性信息匹配的操作行为指对属性信息所属的内容实体进行操作的操作行为。例如,A内容实体的属性信息为c1领域、t1标签词、t2标签词,B内容实体的属性信息为c2领域、t1标签词、t3标签词,对A内容实体以及B内容实体进行过点击操作,对B内容实体进行过收藏,则属性信息c1领域对应的操作类型分布包括点击操作1次,t1标签词对应的操作类型分布包括点击操作2次以及收藏1次等等。
步骤S406,根据各个属性信息对应的操作类型分布得到当前用户标识对应的行为特征。
具体地,可以根据预设的规则得到各个属性信息对应的操作类型分布对应的行为特征。预设的规则可以根据实际需要进行设置。例如可以为属性的操作类型分布进行编号,如依次为1、2、3等。在一个实施例中,可以将属性的操作类型分布映射到特征向量空间,如第一个属性的操作类型分布映射得到的特征可以标表示为[10000000],第二个属性的操作类型分布映射得到的特征可以表示为[01000000],特征的维度具体可以根据实际需要进行设置。例如100维等。
在一个实施例中,根据属性的操作类型分布分到行为特征的规则可以根据实际需要进行设置,在一个实施例中,可以是一个属性的一个操作操作类型分布对应一个行为特征,也可以结合多个属性的操作类型分布得到一个行为特征。例如,对体育新闻点击了10次可以对应一个行为特征,对体育新闻点击了10次以及分享了20次也可以对应一个行为特征。在一个实施例中,可以是每一个操作类型分布数值对应一个行为特征,也可以是一个范围内的操作类型分布数值对应一个特征,例如对属性的点击操作类型,可以设置点击0~2次A标签词对应一个行为特征,点击3~8次A标签词对应一个行为特征等。
在一个实施例中,如图5所示,类目信息处理方法还可以包括以下步骤:
步骤S502,获取各个类目对应的第二操作行为集合,第二操作行为集合中的各个操作行为作用于各个类目对应的内容实体,第二操作行为集合中的各个操作行为对应当前用户标识。
具体地,操作行为作用于内容实体指内容实体为操作行为的操作对象。类目对应的内容实体指类目下的内容实体,例如体育新闻频道下的新闻。第二操作行为集合中的各个操作行为是当前用户标识对应的当前用户对类目下的内容实体进行操作的操作行为。例如,对娱乐类目下的一条娱乐新闻的操作。每一个类目对应有一个第二操作行为集合。在一个实施例中,第二操作行为集合中的操作行为可以是当前用户标识对类目的内容实体的全部操作行为。在一个实施例中,第二操作行为集合中的操作行为也可以是当前用户标识对类目的内容实体的部分操作行为。如预设时间段内或者预设次数的操作行为,例如,最近一周对类目下的内容实体的操作行为或者最近100次的对类目下的内容实体的操作行为等等。
在一个实施例中,获取第二操作行为集合的时间可以根据需要进行设置,例如可以设置在每接收到当前用户对内容实体的当前操作行为后实时获取第二操作行为集合,也可以设置每隔预设周期例如每两个小时获取一次第二操作行为集合,或者每隔预设个操作行为获取一次操作行为集合。
步骤S504,获取各个类目对应的第二操作行为集合中的操作行为的操作类型和对应的操作次数,得到各个类目对应的操作类型分布。
具体地,操作类型可以包括点击、分享、收藏、购买、删除、置顶、下移以及上移等操作类型中的一种或多种,具体可以根据实际需要设置。得到第二操作行为集合后,获取第二操作行为集合中的操作行为的操作类型以及统计各个操作类型对应的操作次数,得到每一个类目对应的操作类型分布。操作类型分布可以用具体的次数也可以用比例系数表示。在一个实施例中,操作类型分布可以是操作类型的操作次数,也可以是操作类型的操作次数占全部操作类型的总次数的比例。例如,操作类型分布标识为点击了3次,收藏了5次。也可以是点击操作类型的比例为30%,删除操作类型的比例为50%等等。
步骤S506,根据各个类目对应的操作类型分布以及预设的评分规则得到当前用户标识对应的对各个类目的画像分值。
具体地,评分规则是预先设置的,评分规则中设置了操作类型分布对应的分数。例如,可以设置收藏1次的分数为60分,删除1次的分数为-20分。或者收藏1~5次的分数为60分,收藏5~10次的分数为80分。评分规则具体可以根据需要进行设置,本发明实施例不做限定。得到类目对应的操作类型分布后,可以将根据各个操作类型分布对应的分数得到的总的分数值作为类目对应的画像分值,也可以结合根据其他方法得到的分值得到类目对应的画像分值。
在一个实施例中,评分规则还可以包括操作类型分布的分数对应的权重。可以根据操作类型分布对应的分数以及权重进行加权求和得到各个类目对应的画像分值。采用公式表示如下:其中wi表示操作类型分布的权重,可以根据需要进行设置。xi表示操作类型分布对应的分数,i表示操作类型分布的数量,score指类目对应的画像分值。
步骤S508,根据各个类目的画像分值得到当前用户标识对应的类目特征。
具体的,得到画像分值后,可以根据类目的画像分值进行排序,将排序在前的类目作为当前用户标识对应的当前类目,根据当前类目构造类目特征。可以理解,也可以根据类目画像分值的排序、或者类目的画像分值构造类目特征。构造类目特征的方法可以参照本发明其他实施提中提供的方法或者采用其他的方法,本发明实施例在此不做限制。
可以理解,当得到类目特征后,步骤S208即将行为特征输入到预先训练的类目倾向分析模型中,得到当前用户标识对各个类目的倾向值的步骤包括:将行为特征以及类目特征输入到预先训练的类目倾向分析模型中,得到当前用户标识对各个类目的倾向值。
在一个实施例中,可以理解,还可以参照上述得到类目的画像分数的方法得到当前用户标识对应的内容实体的属性信息的画像分数,例如当前用户标识对应的对领域的画像分数、对标签词的画像分数,进而分别根据领域的画像分数或者标签词的画像分数中的一个或多个得到当前用户标识对应的领域特征、标签词特征等,然后将领域特征或者标签词特征的一个或多个输入到类目倾向分析模型这中,得到倾向值。
上述计算当前用户标识对类目的画像分数,继而根据画像分数构造类目特征的方法,进一步结合当前用户标识对应的当前用户的个人画像特征得到当前用户对应的对类目的倾向值,因此可以使得得到的展示参数信息更加符合用户的需求,类目查找难度小。
在一个实施例中,如图6所示,步骤S506即根据各个类目对应的操作类型分布以及预设的评分规则得到当前用户标识对应的对各个类目的画像分值具体可以包括以下步骤:
步骤S602,根据各个类目对应的操作类型分布以及预设的评分规则得到各个类目对应的当前画像分值。
具体地,一个类目对应有一个当前画像分值,评分规则是预先设置的,评分规则中设置了操作类型分布对应的分数。例如,可以设置收藏1次的分数为60分,删除1次的分数为-20分。或者收藏1~5次的分数为60分,收藏5~10次的分数为80分。评分规则具体可以根据需要进行设置,本发明实施例不做限定。得到类目对应的操作类型分布后,根据各个操作类型分布对应的分数得到总的分数值,该总的分数值为类目对应的当前画像分值。
在一个实施例中,评分规则还可以包括操作类型分布的分数对应的权重。可以根据操作类型分布对应的分数以及权重得进行加权求和得到各个类目对应的画像分值。采用公式表示如下:其中wi表示操作类型分布的权重,xi表示操作类型分布对应的分数,i表示操作类型分布的数量,score指类目对应的画像分值。
步骤S604,获取当前用户标识对应的对各个类目的历史画像分值。
具体地,历史画像分值是指得到当前画像分值之前得到的当前用户标识对应的对类目的画像分值。例如,当天计算得到的画像分数为当前画像分数,前一天计算得到的画像分数为历史画像分数。历史画像分数的个数具体可以根据实际需要进行设置。例如可以获取前面5天每一天计算得到的画像分数,或者指获取前一天的画像分数。
步骤S606,根据各个类目对应的当前画像分值以及历史画像分值得到各个类目的画像分值。
具体的,可以计算当前画像分值与历史画像分值的和得到各个类目的类目分值,也可以计算当前画像分值与历史画像分值的平均值得到类目的画像分值。在一个实施例中,可以设置历史画像分值的衰减系数,使得时间越远的历史画像分值对画像分值的影响小,用公式表示如下:画像分值=当前画像分值+β*历史画像分值,其中,β即衰减系数的值可以根据需求设置。
在一个实施例中,如图7所示,类目信息处理方法还可以包括以下步骤:
步骤S702,获取用户标识对应的对各个类目的历史选择操作。
具体地,用户标识的数量包括一个或多个,例如可以为一万个用户标识。用户标识对应的对类目的历史选择操作指用户标识对应的用户选择了该类目。选择操作的形式可以为通过点击、手势、语音、眼神进行选择等,具体不做限制。例如,以新闻应用为例,若用户想要看“体育”新闻,点击“体育”类目为对“体育”类目的选择操作。
步骤S704,获取历史选择操作之前作用于内容实体的训练历史操作行为,将训练历史操作行为组成训练操作行为集合,训练历史操作行为为历史选择操作对应的用户标识的操作行为。
具体地,训练历史操作行为是对类目进行了历史选择操作的用户在选择类目之前对内容实体的操作行为。一次历史选择操作对应有一个训练操作行为集合。训练历史操作行为可以是用户在选择类目之前对内容实体的全部操作行为,也可以是部分操作行为。例如,可以是最近一周的操作行为或者最近10次的操作行为。
步骤S706,将训练历史操作行为对应的内容实体组成训练目标内容实体集合。
具体地,训练目标内容实体集合包括一个或多个内容实体。得到训练操作行为集合后,获取各个训练操作行为的操作对象作为对应的内容实体,然后将这些内容实体组成训练目标内容实体集合。
步骤S708,根据各个训练历史操作行为的操作类型以及训练目标内容实体集合中的各个内容实体的属性信息得到当前用户标识对应的行为特征。
具体地,内容实体的属性信息是指对内容实体的特性进行描述的信息,可以是内容实体的全部属性信息,也可以是部分属性信息,具体可以根据实际需要进行设置。例如,属性信息可以包括内容实体所属的领域,如体育领域、娱乐领域。操作行为的类型可以根据实际需要设置,例如可以包括点击、收藏、购买、分享或者删除等。在一个实施例中,可以根据各个操作为的操作类型以及训练目标内容实体集合中的各个内容实体的属性信息构造行为特征。例如将对内容实体的操作,视为对该内容实体的属性信息进行的操作,然后对该属性信息进行操作的操作类型的次数进行统计,得到每个属性的操作类型分布,根据属性信息的操作类型分布得到对应的特征。
根据操作类型分布得到对应的特征的规则具体可以根据实际需要进行设置。在一个实施例中,可以为属性的操作类型分布进行编号,如依次为1、2、3等。在一个实施例中,可以将属性的操作类型分布映射到特征向量空间,如第一个属性的操作类型分布映射得到的特征可以标表示为[10000000],第二个属性的操作类型分布映射得到的特征可以表示为[01000000],特征的维度具体可以根据实际需要进行设置。例如100维。
步骤S710,根据用户标识对应的对类目的历史选择操作以及用户标识对应的行为特征得到训练样本。
具体地,训练样本用于对模型进行训练,以训练得到类目倾向分析模型。在进行模型训练时,可以采用有监督的模型训练方式,例如逻辑回归模型、SVM(Support VectorMachine,支持向量机)以及贝叶斯模型等等。训练样本可以包括正样本以及负样本,在进行有监督的模型训练时,会分别得到每个类目对应的模型参数,正样本是指在训练得到目标类目的模型参数时,选择操作对应的类目与目标类目相同,负样本是指训练得到目标类目的模型参数时,选择操作对应的类目与目标类目不同。正样本的个数以及负样本的个数具体可以需要实际进行设定。例如,以新闻为例,对于“娱乐”这一个类目,若是对“娱乐”类目的模型参数进行训练,则对“娱乐”进行选择操作的样本为正样本,若“娱乐”类目展示在终端上,而用户选择了“体育类目,则根据该选择操作得到的样本为负样本。
在一个实施例中,还可以计算得到各个用户标识对应的类目特征,然后将类目特征以及行为特征作为模型训练的样本特征进行模型训练。类目特征的得到方法可以参照本发明其他实施例提供的方法计算得到,在此不做赘述。
在一个实施例中,还可以结合用户标识以及对应的内容实体的属性信息构造训练属性特征,然后将训练属性特征以及用户标识对应的行为特征进行模型训练,得到类目倾向分析模型。例如,可以结合用户标识以及内容实体的标识构造训练属性特征。或者结合用户标识与标签词构造训练属性特征。这样训练得到的类目倾向分析模型的模型参数中包括训练属性特征对应的模型参数,因此在根据训练得到的类目倾向分析模型进行类目倾向值的预测时,若输入的特征中包括相同的属性特征,则可以根据对应的训练属性特征训练得到的模型参数以及属性特征得到对类目的倾向值,进一步提高了得到的倾向值的准确性。
步骤S712,根据训练样本进行模型训练得到类目倾向分析模型。
具体地,类目倾向分析模型的建立需要进行模型训练,以对模型参数进行学习,直至满足模型参数收敛条件,得到模型参数,使得可以根据模型参数建立起从输入到输出的映射。以SVM为例,可以采用随机梯度算法进行模型训练,,在梯度下降过程中需要使得代价函数J(θ)最小,在一个实施例中,代价函数可以采用表示,其中,m表示样本特征的个数,x(i)为输入,y(i)表示训练样本中的类目的值,正样本可以设为1,负样本可以设为-1,。hθ(x(i))表示每次训练的输出值,其中,其中,即θTx等于特征与参数的乘积的和。
在一个实施例中,如图8所示,类目信息处理方法还可以包括步骤S802:获取目标类目。步骤S710即根据用户标识对应的对类目的选择操作以及用户标识对应的行为特征得到训练样本的步骤包括:若历史选择操作为对目标类目的选择操作,则将行为特征作为目标类目的正训练样本特征,若否,将行为特征作为目标类目的负训练样本特征。
具体地,目标类目是指需要进行模型训练得到对应模型参数的类目。在进行模型训练时,需要获取目标类目对应的行为特征。正样本是指在训练得到目标类目的模型参数时,选择操作对应的类目与目标类目相同,负样本是指训练得到目标类目的模型参数时,选择操作对应的类目与目标类目不同。正样本特征是指正样本对应的特征,负样本特征是指负样本对应的特征。例如,以新闻为例,当用户点击“体育”频道时,对于“体育”这一个目标类目,根据用户点击“体育”频道之前的对新闻的操作行为得到的行为特征为体育类目的正样本特征。但是若将用户点击“体育”频道之前的操作行为得到的行为特征作为训练“娱乐”类目对应的模型参数的行为特征,则为负样本特征。
在一个实施例中,如图9所示,步骤S208即将行为特征输入到预先训练的类目倾向分析模型中,得到当前用户标识对应的对各个类目的倾向值的步骤包括:
步骤S902,根据各个类目对应的行为特征以及各个类目对应的行为特征的模型参数得到各个类目的模型输出值。
具体地,得到行为特征后,计算类目中的各个行为特征与类目对应的行为特征的模型参数的乘积,然后根据乘积的和得到各个类目对应的模型输出值。例如,对于,假设行为特征包括a1、a2以及a3,其中的一个类目对应的模型参数为x1、x2以及x3,则模型输出值可以等于a1*x1+于a2*x2+a3*x3+b。其中b可以是预设的值或者是模型训练得到的值。
步骤S904,对各个类目对应的模型输出值进行归一化处理,得到各个类目对应的倾向值。
应该理解的是,上述流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,步骤也可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
如图10所示,在一个实施例中,提供了一种类目信息处理装置,该类目信息处理装置可以集成于上述的计算机设备120中,具体可以包括:
第一操作集和获取模块1002,用于获取第一操作行为集合,第一操作行为集合中的各个操作行为作用于对应的内容实体,第一操作行为集合中的各个操作行为对应当前用户标识;
第一实体集合组成模块1004,用于将各个操作行为对应的内容实体组成第一目标内容实体集合;
行为特征获取模块1006,用于根据各个操作行为的操作类型以及第一目标内容实体集合中的各个内容实体的属性信息得到当前用户标识对应的行为特征;
倾向值得到模块1008,用于将行为特征输入到预先训练的类目倾向分析模型中,得到当前用户标识对应的对各个类目的倾向值;
展示参数得到模块1010,用于根据各个类目的倾向值得到当前用户标识对应的类目展示参数信息。
在一个实施例中,如图11所示,第一操作集和获取模块1002包括:
当前行为获取单元1002A,用于获取当前用户标识对应的当前操作行为,当前操作行为作用于当前内容实体;
第一操作集合获取单元1002B,用于当前操作行为触发获取当前操作行为之前的当前用户标识对应的第一历史操作行为,将第一历史操作行为和当前操作行为组成第一操作行为集合。
在一个实施例中,如图12所示,行为特征获取模块1006包括:
属性集合得到单元1006A,用于统计第一目标内容实体集合中的各个内容实体的属性信息,得到属性信息集合;
属性操作类型分布得到单元1006B,用于获取与属性信息集合中各个属性信息匹配的第一操作行为集合中的操作行为,根据各个属性信息匹配的操作行为的操作类型和对应的操作次数,得到各个属性信息对应的操作类型分布;
行为特征获取单元1006C,用于根据各个属性信息对应的操作类型分布得到当前用户标识对应的行为特征。
在一个实施例中,如图13所示,装置还包括:
第二操作集合获取模块1302,用于获取各个类目对应的第二操作行为集合,第二操作行为集合中的各个操作行为作用于各个类目对应的内容实体,第二操作行为集合中的各个操作行为对应当前用户标识;
类目操作类型分布得到模块1304,用于获取各个类目对应的第二操作行为集合中的操作行为的操作类型和对应的操作次数,得到各个类目对应的操作类型分布;
画像分值得到模块1306,用于根据各个类目对应的操作类型分布以及预设的评分规则得到当前用户标识对应的对各个类目的画像分值;
特征构造模块1308,用于根据各个类目的画像分值得到当前用户标识对应的类目特征;
倾向值得到模块1008用于:将行为特征以及类目特征输入到预先训练的类目倾向分析模型中,得到当前用户标识对各个类目的倾向值。
在一个实施例中,如图14所示,画像分值得到模块1306用于:
当前画像值得到单元1306A,用于根据各个类目对应的操作类型分布以及预设的评分规则得到各个类目对应的当前画像分值;
历史画像值得到单元1306B,用于获取当前用户标识对应的对各个类目的历史画像分值;
画像分值得到单元1306C,用于根据各个类目对应的当前画像分值以及历史画像分值得到各个类目的画像分值。
在一个实施例中,如图15所示,装置还包括:
选择操作获取模块1502,用于获取用户标识对应的对各个类目的历史选择操作;
训练操作集合获取模块1504,用于获取历史选择操作之前作用于内容实体的训练历史操作行为,将训练历史操作行为组成训练操作行为集合,训练历史操作行为为历史选择操作对应的用户标识对应的操作行为;
训练内容集合获取模块1506,用于将训练历史操作行为对应的内容实体作为训练目标内容实体集合;
训练特征构造模块1508,用于根据各个训练历史操作行为的操作类型以及训练目标内容实体集合中的各个内容实体的属性信息得到当前用户标识对应的行为特征;
样本得到模块1510,用于根据用户标识对应的对类目的历史选择操作以及用户标识对应的行为特征得到训练样本;
模型训练模块1512,用于根据训练样本进行模型训练得到类目倾向分析模型。
在一个实施例中,如图16所示,装置还包括:
目标类目获取模块1602,用于获取目标类目;
样本得到模块1510用于:
若历史选择操作为对目标类目的选择操作,则将行为特征作为目标类目的正训练样本特征;
若否,将行为特征作为目标类目的负训练样本特征。
在一个实施例中,如图17所示,倾向值得到模块1008包括:
模型输出值得到单元1008A,用于根据各个类目对应的行为特征以及各个类目对应的行为特征的模型参数得到各个类目的模型输出值;
归一化处理单元1008B,用于对各个类目对应的模型输出值进行归一化处理,得到各个类目对应的倾向值。
下面新闻应用的类目为例,对本发明实施例提供的方案进行说明。在新闻应用中,通常包括多个主界面,每一个主界面下设有多个类目,首先可以根据新闻应用中一个或多个用户的操作行为的操作类型以及对应内容实体的属性信息进行模型训练,得到类目倾向分析模型。当打开新闻应用后,以图18A为例,新闻应用中包括主页、视频、关注以及我共四个主界面,在主页主界面上,包括推荐、娱乐、公益、体育以及社会共五个类目,当用户点击收藏了新闻1时,终端向计算机设备发送该操作行为并携带当前用户标识,计算机设备接收到收藏新闻1的操作行为时,获取当前用户标识对应的前20次对新闻的操作行为以及收藏新闻1的操作行为组成第一操作行为集合,并将对应的新闻作为第一目标内容实体集合,假设得到的第一内容实体集合的属性信息的操作类型分布包括体育类目点击了25次、娱乐类目收藏了20次、推荐类目点击了15次以及分享了20次,标签词“明星”点击了15次、标签词“科技”删除了5次等等,则可以根据属性信息的操作类型分布构建行为特征,然后将行为特征输入类目倾向分析模型中,得到当前用户标识对应的对各个类目的倾向值,假设推荐、娱乐、公益、体育以及社会的倾向值分别为0.1、0.05、0.2、0.5以及0.02,则可以根据倾向值的大小将倾向值大的排序在前,此外,由于用户对“推荐”进行了置顶设置,因此,如图18B所示,类目的排序更改为推荐、体育、公益、娱乐以及社会。
图19示出了一个实施例中计算机设备的内部结构图。该计算机设备具体可以是图1中服务器120。计算机设备通过系统连接总线连接处理器、非易失性存储介质、内存储器和网络接口。其中,该计算机设备的非易失性存储介质可存储操作系统和计算机程序,该计算机程序被执行时,可使得处理器执行一种类目信息处理方法。该计算机设备的处理器用于提供计算和控制能力,支撑整个计算机设备的运行。该内存储器中可储存有计算机程序,该计算机程序被处理器执行时,可使得处理器执行一种类目信息处理方法。计算机设备的网络接口用于进行网络通信,如发送类目展示参数信息等。本领域技术人员可以理解,图19中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,本申请提供的类目信息处理装置可以实现为一种计算机程序的形式,计算机程序可在如图19所示的计算机设备上运行。计算机设备的存储器中可存储组成该类目信息处理装置的各个程序模块,比如,图10所示的第一操作集和获取模块1002、第一实体集合组成模块1004、行为特征获取模块1006、倾向值得到模块1008和展示参数得到模块1010。各个程序模块构成的计算机程序使得处理器执行本说明书中描述的本申请各个实施例的类目信息处理方法中的步骤。
例如,图19所示的计算机设备可以通过如图10所示的类目信息处理装置中的第一操作集和获取模块1002获取第一操作行为集合,第一操作行为集合中的各个操作行为作用于对应的内容实体,第一操作行为集合中的各个操作行为对应当前用户标识;通过第一实体集合组成模块1004将各个操作行为对应的内容实体组成第一目标内容实体集合;通过行为特征获取模块1006根据各个操作行为的操作类型以及第一目标内容实体集合中的各个内容实体的属性信息得到当前用户标识对应的行为特征;通过倾向值得到模块1008将行为特征输入到预先训练的类目倾向分析模型中,得到当前用户标识对应的对各个类目的倾向值;通过展示参数得到模块1010根据各个类目的倾向值得到当前用户标识对应的类目展示参数信息。
在一个实施例中,提出了一种计算机设备,计算机设备包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现以下步骤:获取第一操作行为集合,第一操作行为集合中的各个操作行为作用于对应的内容实体,第一操作行为集合中的各个操作行为对应当前用户标识;将各个操作行为对应的内容实体组成第一目标内容实体集合;根据各个操作行为的操作类型以及第一目标内容实体集合中的各个内容实体的属性信息得到当前用户标识对应的行为特征;将行为特征输入到预先训练的类目倾向分析模型中,得到当前用户标识对应的对各个类目的倾向值;根据各个类目的倾向值得到当前用户标识对应的类目展示参数信息。
在一个实施例中,处理器所执行的获取第一操作行为集合,第一操作行为集合中的各个操作行为作用于对应的内容实体,第一操作行为集合中的各个操作行为对应当前用户标识的步骤包括:获取当前用户标识对应的当前操作行为,当前操作行为作用于当前内容实体;当前操作行为触发获取当前操作行为之前的当前用户标识对应的第一历史操作行为,将第一历史操作行为和当前操作行为组成第一操作行为集合。
在一个实施例中,处理器所执行的根据各个操作行为的操作类型以及第一目标内容实体集合中的各个内容实体的属性信息得到当前用户标识对应的行为特征的步骤包括:统计第一目标内容实体集合中的各个内容实体的属性信息,得到属性信息集合;获取与属性信息集合中各个属性信息匹配的第一操作行为集合中的操作行为,根据各个属性信息匹配的操作行为的操作类型和对应的操作次数,得到各个属性信息对应的操作类型分布;根据各个属性信息对应的操作类型分布得到当前用户标识对应的行为特征。
在一个实施例中,处理器执行计算机程序时还执行以下步骤:获取各个类目对应的第二操作行为集合,第二操作行为集合中的各个操作行为作用于各个类目对应的内容实体,第二操作行为集合中的各个操作行为对应当前用户标识;获取各个类目对应的第二操作行为集合中的操作行为的操作类型和对应的操作次数,得到各个类目对应的操作类型分布;根据各个类目对应的操作类型分布以及预设的评分规则得到当前用户标识对应的对各个类目的画像分值;根据各个类目的画像分值得到当前用户标识对应的类目特征;将行为特征输入到预先训练的类目倾向分析模型中,得到当前用户标识对各个类目的倾向值的步骤包括:将行为特征以及类目特征输入到预先训练的类目倾向分析模型中,得到当前用户标识对各个类目的倾向值。
在一个实施例中,处理器所执行的根据各个类目对应的操作类型分布以及预设的评分规则得到当前用户标识对应的对各个类目的画像分值的步骤包括:根据各个类目对应的操作类型分布以及预设的评分规则得到各个类目对应的当前画像分值;获取当前用户标识对应的对各个类目的历史画像分值;根据各个类目对应的当前画像分值以及历史画像分值得到各个类目的画像分值。
在一个实施例中,处理器执行计算机程序时还执行以下步骤:获取用户标识对应的对各个类目的历史选择操作;获取历史选择操作之前作用于内容实体的训练历史操作行为,将训练历史操作行为组成训练操作行为集合,训练历史操作行为为历史选择操作对应的用户标识对应的操作行为;将训练历史操作行为对应的内容实体作为训练目标内容实体集合;根据各个训练历史操作行为的操作类型以及训练目标内容实体集合中的各个内容实体的属性信息得到当前用户标识对应的行为特征;根据用户标识对应的对类目的历史选择操作以及用户标识对应的行为特征得到训练样本;根据训练样本进行模型训练得到类目倾向分析模型。
在一个实施例中,处理器执行计算机程序时还执行以下步骤:获取目标类目;根据用户标识对应的对类目的选择操作以及用户标识对应的行为特征得到训练样本的步骤包括:若历史选择操作为对目标类目的选择操作,则将行为特征作为目标类目的正训练样本特征;若否,将行为特征作为目标类目的负训练样本特征。
在一个实施例中,处理器所执行的将行为特征输入到预先训练的类目倾向分析模型中,得到当前用户标识对应的对各个类目的倾向值的步骤包括:根据各个类目对应的行为特征以及各个类目对应的行为特征的模型参数得到各个类目的模型输出值;对各个类目对应的模型输出值进行归一化处理,得到各个类目对应的倾向值。
在一个实施例中,提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,计算机程序被处理器执行时,使得处理器执行以下步骤:获取第一操作行为集合,第一操作行为集合中的各个操作行为作用于对应的内容实体,第一操作行为集合中的各个操作行为对应当前用户标识;将各个操作行为对应的内容实体组成第一目标内容实体集合;根据各个操作行为的操作类型以及第一目标内容实体集合中的各个内容实体的属性信息得到当前用户标识对应的行为特征;将行为特征输入到预先训练的类目倾向分析模型中,得到当前用户标识对应的对各个类目的倾向值;根据各个类目的倾向值得到当前用户标识对应的类目展示参数信息。
在一个实施例中,处理器所执行的获取第一操作行为集合,第一操作行为集合中的各个操作行为作用于对应的内容实体,第一操作行为集合中的各个操作行为对应当前用户标识的步骤包括:获取当前用户标识对应的当前操作行为,当前操作行为作用于当前内容实体;当前操作行为触发获取当前操作行为之前的当前用户标识对应的第一历史操作行为,将第一历史操作行为和当前操作行为组成第一操作行为集合。
在一个实施例中,处理器所执行的根据各个操作行为的操作类型以及第一目标内容实体集合中的各个内容实体的属性信息得到当前用户标识对应的行为特征的步骤包括:统计第一目标内容实体集合中的各个内容实体的属性信息,得到属性信息集合;获取与属性信息集合中各个属性信息匹配的第一操作行为集合中的操作行为,根据各个属性信息匹配的操作行为的操作类型和对应的操作次数,得到各个属性信息对应的操作类型分布;根据各个属性信息对应的操作类型分布得到当前用户标识对应的行为特征。
在一个实施例中,处理器执行计算机程序时还执行以下步骤:获取各个类目对应的第二操作行为集合,第二操作行为集合中的各个操作行为作用于各个类目对应的内容实体,第二操作行为集合中的各个操作行为对应当前用户标识;获取各个类目对应的第二操作行为集合中的操作行为的操作类型和对应的操作次数,得到各个类目对应的操作类型分布;根据各个类目对应的操作类型分布以及预设的评分规则得到当前用户标识对应的对各个类目的画像分值;根据各个类目的画像分值得到当前用户标识对应的类目特征;将行为特征输入到预先训练的类目倾向分析模型中,得到当前用户标识对各个类目的倾向值的步骤包括:将行为特征以及类目特征输入到预先训练的类目倾向分析模型中,得到当前用户标识对各个类目的倾向值。
在一个实施例中,处理器所执行的根据各个类目对应的操作类型分布以及预设的评分规则得到当前用户标识对应的对各个类目的画像分值的步骤包括:根据各个类目对应的操作类型分布以及预设的评分规则得到各个类目对应的当前画像分值;获取当前用户标识对应的对各个类目的历史画像分值;根据各个类目对应的当前画像分值以及历史画像分值得到各个类目的画像分值。
在一个实施例中,处理器执行计算机程序时还执行以下步骤:获取用户标识对应的对各个类目的历史选择操作;获取历史选择操作之前作用于内容实体的训练历史操作行为,将训练历史操作行为组成训练操作行为集合,训练历史操作行为为历史选择操作对应的用户标识对应的操作行为;将训练历史操作行为对应的内容实体作为训练目标内容实体集合;根据各个训练历史操作行为的操作类型以及训练目标内容实体集合中的各个内容实体的属性信息得到当前用户标识对应的行为特征;根据用户标识对应的对类目的历史选择操作以及用户标识对应的行为特征得到训练样本;根据训练样本进行模型训练得到类目倾向分析模型。
在一个实施例中,处理器执行计算机程序时还执行以下步骤:获取目标类目;根据用户标识对应的对类目的选择操作以及用户标识对应的行为特征得到训练样本的步骤包括:若历史选择操作为对目标类目的选择操作,则将行为特征作为目标类目的正训练样本特征;若否,将行为特征作为目标类目的负训练样本特征。
在一个实施例中,处理器所执行的将行为特征输入到预先训练的类目倾向分析模型中,得到当前用户标识对应的对各个类目的倾向值的步骤包括:根据各个类目对应的行为特征以及各个类目对应的行为特征的模型参数得到各个类目的模型输出值;对各个类目对应的模型输出值进行归一化处理,得到各个类目对应的倾向值。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一非易失性计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。
Claims (20)
1.一种类目信息处理方法,所述方法包括:
接收终端发送的当前操作行为以及当前用户标识,所述当前操作行为是所述当前用户标识对应的当前用户作用于所述终端上的内容实体的,在接收到所述当前操作行为时,获取第一操作行为集合,所述第一操作行为集合中的各个操作行为作用于对应的内容实体,所述第一操作行为集合中的各个操作行为对应所述当前用户标识;
将各个所述操作行为对应的内容实体组成第一目标内容实体集合;
根据各个所述操作行为的操作类型以及所述第一目标内容实体集合中的各个内容实体的属性信息得到各个属性信息对应的操作类型分布,根据各个所述属性信息对应的操作类型分布得到所述当前用户标识对应的行为特征;
获取各个类目对应的第二操作行为集合,所述第二操作行为集合中的各个操作行为作用于各个所述类目对应的内容实体,所述第二操作行为集合中的各个操作行为对应所述当前用户标识;
获取各个所述类目对应的第二操作行为集合中的操作行为的操作类型和对应的操作次数,得到各个所述类目对应的操作类型分布;
根据各个所述类目对应的操作类型分布以及预设的评分规则得到所述当前用户标识对应的对各个所述类目的画像分值;
根据各个所述类目的画像分值得到所述当前用户标识对应的类目特征;
将所述行为特征以及所述类目特征输入到预先训练的所述类目倾向分析模型中,得到所述当前用户标识对应的对各个所述类目的倾向值,所述倾向值用于表示所述当前用户标识对应的用户查看类目的可能性;
根据各个所述类目的倾向值得到所述当前用户标识对应的类目展示参数信息;
将所述类目展示参数信息发送给所述终端,以使得所述终端按照所述类目展示参数信息展示类目。
2.根据权利要求1所述的方法,其特征在于,所述获取第一操作行为集合,所述第一操作行为集合中的各个操作行为作用于对应的内容实体,所述第一操作行为集合中的各个操作行为对应当前用户标识的步骤包括:
获取所述当前用户标识对应的当前操作行为,所述当前操作行为作用于当前内容实体;
所述当前操作行为触发获取所述当前操作行为之前的当前用户标识对应的第一历史操作行为,将所述第一历史操作行为和所述当前操作行为组成所述第一操作行为集合。
3.根据权利要求1所述的方法,其特征在于,所述根据各个所述操作行为的操作类型以及所述第一目标内容实体集合中的各个内容实体的属性信息得到各个属性信息对应的操作类型分布,根据各个所述属性信息对应的操作类型分布得到所述当前用户标识对应的行为特征的步骤包括:
统计所述第一目标内容实体集合中的各个内容实体的属性信息,得到属性信息集合;
获取与所述属性信息集合中各个属性信息匹配的第一操作行为集合中的操作行为,根据各个所述属性信息匹配的操作行为的操作类型和对应的操作次数,得到各个所述属性信息对应的操作类型分布;
根据各个所述属性信息对应的操作类型分布得到所述当前用户标识对应的行为特征。
4.根据权利要求1所述的方法,其特征在于,所述根据各个所述类目对应的操作类型分布以及预设的评分规则得到所述当前用户标识对应的对各个所述类目的画像分值的步骤包括:
根据各个所述类目对应的操作类型分布以及预设的评分规则得到各个所述类目对应的当前画像分值;
获取所述当前用户标识对应的对各个所述类目的历史画像分值;
根据各个所述类目对应的当前画像分值以及历史画像分值得到各个所述类目的画像分值。
5.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取用户标识对应的对各个类目的历史选择操作;
获取所述历史选择操作之前作用于内容实体的训练历史操作行为,将所述训练历史操作行为组成训练操作行为集合,所述训练历史操作行为为所述历史选择操作对应的用户标识对应的操作行为;
将所述训练历史操作行为对应的内容实体作为训练目标内容实体集合;
根据各个所述训练历史操作行为的操作类型以及所述训练目标内容实体集合中的各个内容实体的属性信息得到所述用户标识对应的行为特征;
根据所述用户标识对应的对所述类目的历史选择操作以及所述用户标识对应的行为特征得到训练样本;
根据所述训练样本进行模型训练得到类目倾向分析模型。
6.根据权利要求5所述的方法,其特征在于,所述方法还包括:
结合用户标识以及对应的内容实体的属性信息构造训练属性特征;
所述根据所述用户标识对应的对所述类目的历史选择操作以及所述用户标识对应的行为特征得到训练样本包括:
根据所述用户标识对应的对所述类目的历史选择操作、所述训练属性特征以及所述用户标识对应的行为特征得到训练样本。
7.根据权利要求5所述的方法,其特征在于,所述方法还包括:
获取目标类目;
所述根据所述用户标识对应的对所述类目的选择操作以及所述用户标识对应的行为特征得到训练样本的步骤包括:
若所述历史选择操作为对所述目标类目的选择操作,则将所述行为特征作为所述目标类目的正训练样本特征;
若否,将所述行为特征作为所述目标类目的负训练样本特征。
8.根据权利要求1~7任一项所述的方法,其特征在于,所述将所述行为特征输入到预先训练的类目倾向分析模型中,得到所述当前用户标识对应的对各个所述类目的倾向值的步骤包括:
根据各个所述类目对应的行为特征以及各个所述类目对应的行为特征的模型参数得到各个所述类目的模型输出值;
对各个所述类目对应的模型输出值进行归一化处理,得到各个所述类目对应的倾向值。
9.根据权利要求1~7任一项所述的方法,其特征在于,所述第一目标内容实体集合中内容实体的属性信息包括内容实体所属的类目、内容实体的领域以及内容实体的标签词中的至少一种。
10.一种类目信息处理装置,所述装置包括:
第一操作集和获取模块,用于接收终端发送的当前操作行为以及当前用户标识,所述当前操作行为是所述当前用户标识对应的当前用户作用于所述终端上的内容实体的,在接收到所述当前操作行为时,获取第一操作行为集合,所述第一操作行为集合中的各个操作行为作用于对应的内容实体,所述第一操作行为集合中的各个操作行为对应所述当前用户标识;
第一实体集合组成模块,用于将各个所述操作行为对应的内容实体组成第一目标内容实体集合;
行为特征获取模块,用于根据各个所述操作行为的操作类型以及所述第一目标内容实体集合中的各个内容实体的属性信息得到各个属性信息对应的操作类型分布,根据各个所述属性信息对应的操作类型分布得到所述当前用户标识对应的行为特征;
第二操作集合获取模块,用于获取各个类目对应的第二操作行为集合,所述第二操作行为集合中的各个操作行为作用于各个所述类目对应的内容实体,所述第二操作行为集合中的各个操作行为对应所述当前用户标识;
类目操作类型分布得到模块,用于获取各个所述类目对应的第二操作行为集合中的操作行为的操作类型和对应的操作次数,得到各个所述类目对应的操作类型分布;
画像分值得到模块,用于根据各个所述类目对应的操作类型分布以及预设的评分规则得到所述当前用户标识对应的对各个所述类目的画像分值;
特征构造模块,用于根据各个所述类目的画像分值得到所述当前用户标识对应的类目特征;
倾向值得到模块,用于将所述行为特征以及所述类目特征输入到预先训练的类目倾向分析模型中,得到所述当前用户标识对应的对各个所述类目的倾向值,所述倾向值用于表示所述当前用户标识对应的用户查看类目的可能性;
展示参数得到模块,用于根据各个所述类目的倾向值得到所述当前用户标识对应的类目展示参数信息;
所述装置还用于:
将所述类目展示参数信息发送给所述终端,以使得所述终端按照所述类目展示参数信息展示类目。
11.根据权利要求10所述的装置,其特征在于,所述第一操作集和获取模块包括:
当前行为获取单元,用于获取所述当前用户标识对应的当前操作行为,所述当前操作行为作用于当前内容实体;
第一操作集合获取单元,用于所述当前操作行为触发获取所述当前操作行为之前的当前用户标识对应的第一历史操作行为,将所述第一历史操作行为和所述当前操作行为组成所述第一操作行为集合。
12.根据权利要求10所述的装置,其特征在于,所述行为特征获取模块包括:
属性集合得到单元,用于统计所述第一目标内容实体集合中的各个内容实体的属性信息,得到属性信息集合;
属性操作类型分布得到单元,用于获取与所述属性信息集合中各个属性信息匹配的第一操作行为集合中的操作行为,根据各个所述属性信息匹配的操作行为的操作类型和对应的操作次数,得到各个所述属性信息对应的操作类型分布;
行为特征获取单元,用于根据各个所述属性信息对应的操作类型分布得到所述当前用户标识对应的行为特征。
13.根据权利要求10所述的装置,其特征在于,所述画像分值得到模块用于:
当前画像值得到单元,用于根据各个所述类目对应的操作类型分布以及预设的评分规则得到各个所述类目对应的当前画像分值;
历史画像值得到单元,用于获取所述当前用户标识对应的对各个所述类目的历史画像分值;
画像分值得到单元,用于根据各个所述类目对应的当前画像分值以及历史画像分值得到各个所述类目的画像分值。
14.根据权利要求10所述的装置,其特征在于,所述装置还包括:
选择操作获取模块,用于获取用户标识对应的对各个类目的历史选择操作;
训练操作集合获取模块,用于获取所述历史选择操作之前作用于内容实体的训练历史操作行为,将所述训练历史操作行为组成训练操作行为集合,所述训练历史操作行为为所述历史选择操作对应的用户标识对应的操作行为;
训练内容集合获取模块,用于将所述训练历史操作行为对应的内容实体作为训练目标内容实体集合;
训练特征构造模块,用于根据各个所述训练历史操作行为的操作类型以及所述训练目标内容实体集合中的各个内容实体的属性信息得到所述用户标识对应的行为特征;
样本得到模块,用于根据所述用户标识对应的对所述类目的历史选择操作以及所述用户标识对应的行为特征得到训练样本;
模型训练模块,用于根据所述训练样本进行模型训练得到类目倾向分析模型。
15.根据权利要求14所述的装置,其特征在于,所述装置还用于:
结合用户标识以及对应的内容实体的属性信息构造训练属性特征;
所述样本得到模块用于:
根据所述用户标识对应的对所述类目的历史选择操作、所述训练属性特征以及所述用户标识对应的行为特征得到训练样本。
16.根据权利要求14所述的装置,其特征在于,所述装置还包括:
目标类目获取模块,用于获取目标类目;
所述样本得到模块用于:
若所述历史选择操作为对所述目标类目的选择操作,则将所述行为特征作为所述目标类目的正训练样本特征;
若否,将所述行为特征作为所述目标类目的负训练样本特征。
17.根据权利要求10~16任一项所述的装置,其特征在于,所述倾向值得到模块包括:
模型输出值得到单元,用于根据各个所述类目对应的行为特征以及各个所述类目对应的行为特征的模型参数得到各个所述类目的模型输出值;
归一化处理单元,用于对各个所述类目对应的模型输出值进行归一化处理,得到各个所述类目对应的倾向值。
18.根据权利要求10~16任一项所述的装置,其特征在于,所述第一目标内容实体集合中内容实体的属性信息包括内容实体所属的类目、内容实体的领域以及内容实体的标签词中的至少一种。
19.一种计算机设备,其特征在于,包括存储器和处理器,所述存储器中存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行权利要求1至9中任一项所述类目信息处理方法的步骤。
20.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行权利要求1至9中任一项所述类目信息处理方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710942496.8A CN109656433B (zh) | 2017-10-11 | 2017-10-11 | 类目信息处理方法、装置、计算机设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710942496.8A CN109656433B (zh) | 2017-10-11 | 2017-10-11 | 类目信息处理方法、装置、计算机设备和存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109656433A CN109656433A (zh) | 2019-04-19 |
CN109656433B true CN109656433B (zh) | 2021-07-06 |
Family
ID=66108280
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710942496.8A Active CN109656433B (zh) | 2017-10-11 | 2017-10-11 | 类目信息处理方法、装置、计算机设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109656433B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110471735A (zh) * | 2019-08-21 | 2019-11-19 | 中国工商银行股份有限公司 | 操作视图界面推送方法及装置 |
CN110555627B (zh) * | 2019-09-10 | 2022-06-10 | 拉扎斯网络科技(上海)有限公司 | 实体展示方法、装置、存储介质和电子设备 |
CN116776131A (zh) * | 2023-08-23 | 2023-09-19 | 腾讯科技(深圳)有限公司 | 基于图的特征降维方法、意向评级方法及相关设备 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103793388A (zh) * | 2012-10-29 | 2014-05-14 | 阿里巴巴集团控股有限公司 | 搜索结果的排序方法和装置 |
CN105469263A (zh) * | 2014-09-24 | 2016-04-06 | 阿里巴巴集团控股有限公司 | 一种商品推荐方法及装置 |
CN105630880A (zh) * | 2015-12-17 | 2016-06-01 | 东软集团股份有限公司 | 一种评分数据预测方法及装置 |
CN106339393A (zh) * | 2015-07-09 | 2017-01-18 | 阿里巴巴集团控股有限公司 | 信息推送方法及装置 |
CN106547808A (zh) * | 2015-09-23 | 2017-03-29 | 阿里巴巴集团控股有限公司 | 图片更新方法、类目排序方法及装置 |
CN106708817A (zh) * | 2015-07-17 | 2017-05-24 | 腾讯科技(深圳)有限公司 | 信息搜索方法及装置 |
CN107122928A (zh) * | 2016-02-24 | 2017-09-01 | 阿里巴巴集团控股有限公司 | 一种供应链资源需求计划配置方法及装置 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104834933B (zh) * | 2014-02-10 | 2019-02-12 | 华为技术有限公司 | 一种图像显著性区域的检测方法和装置 |
-
2017
- 2017-10-11 CN CN201710942496.8A patent/CN109656433B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103793388A (zh) * | 2012-10-29 | 2014-05-14 | 阿里巴巴集团控股有限公司 | 搜索结果的排序方法和装置 |
CN105469263A (zh) * | 2014-09-24 | 2016-04-06 | 阿里巴巴集团控股有限公司 | 一种商品推荐方法及装置 |
CN106339393A (zh) * | 2015-07-09 | 2017-01-18 | 阿里巴巴集团控股有限公司 | 信息推送方法及装置 |
CN106708817A (zh) * | 2015-07-17 | 2017-05-24 | 腾讯科技(深圳)有限公司 | 信息搜索方法及装置 |
CN106547808A (zh) * | 2015-09-23 | 2017-03-29 | 阿里巴巴集团控股有限公司 | 图片更新方法、类目排序方法及装置 |
CN105630880A (zh) * | 2015-12-17 | 2016-06-01 | 东软集团股份有限公司 | 一种评分数据预测方法及装置 |
CN107122928A (zh) * | 2016-02-24 | 2017-09-01 | 阿里巴巴集团控股有限公司 | 一种供应链资源需求计划配置方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN109656433A (zh) | 2019-04-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110929206B (zh) | 点击率预估方法、装置、计算机可读存储介质和设备 | |
CN108804633B (zh) | 基于行为语义知识网络的内容推荐方法 | |
US10958748B2 (en) | Resource push method and apparatus | |
CN110263265B (zh) | 用户标签生成方法、装置、存储介质和计算机设备 | |
CN109345302B (zh) | 机器学习模型训练方法、装置、存储介质和计算机设备 | |
KR102122373B1 (ko) | 사용자 포트레이트를 획득하는 방법 및 장치 | |
CN110263244B (zh) | 内容推荐方法、装置、存储介质和计算机设备 | |
CN106355449B (zh) | 用户选取方法和装置 | |
WO2021081962A1 (zh) | 推荐模型的训练方法、推荐方法、装置及计算机可读介质 | |
CN107590224B (zh) | 基于大数据的用户偏好分析方法与装置 | |
CN111177473B (zh) | 人员关系分析方法、装置和可读存储介质 | |
CN110008397B (zh) | 一种推荐模型训练方法及装置 | |
CN112328909B (zh) | 信息推荐方法、装置、计算机设备及介质 | |
CN109582876A (zh) | 旅游行业用户画像构造方法、装置和计算机设备 | |
CN107203558B (zh) | 对象推荐方法和装置、推荐信息处理方法和装置 | |
CN108491511A (zh) | 基于图数据的数据挖掘方法和装置、模型训练方法和装置 | |
JP6097126B2 (ja) | レコメンド情報生成装置及びレコメンド情報生成方法 | |
CN112955883A (zh) | 应用推荐方法、装置、服务器和计算机可读存储介质 | |
CN109656433B (zh) | 类目信息处理方法、装置、计算机设备和存储介质 | |
CN113742567B (zh) | 一种多媒体资源的推荐方法、装置、电子设备及存储介质 | |
CN112801425B (zh) | 信息点击率的确定方法、装置、计算机设备和存储介质 | |
CN113656699B (zh) | 用户特征向量确定方法、相关设备及介质 | |
CN109801101A (zh) | 标签确定方法、装置、计算机设备和存储介质 | |
CN112381236A (zh) | 联邦迁移学习的数据处理方法、装置、设备及存储介质 | |
CN113536105A (zh) | 推荐模型训练方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |