CN108694223B - 一种用户画像库的构建方法及装置 - Google Patents

一种用户画像库的构建方法及装置 Download PDF

Info

Publication number
CN108694223B
CN108694223B CN201810254430.4A CN201810254430A CN108694223B CN 108694223 B CN108694223 B CN 108694223B CN 201810254430 A CN201810254430 A CN 201810254430A CN 108694223 B CN108694223 B CN 108694223B
Authority
CN
China
Prior art keywords
information
library
corresponding relation
user
classification
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810254430.4A
Other languages
English (en)
Other versions
CN108694223A (zh
Inventor
毋安安
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing QIYI Century Science and Technology Co Ltd
Original Assignee
Beijing QIYI Century Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing QIYI Century Science and Technology Co Ltd filed Critical Beijing QIYI Century Science and Technology Co Ltd
Priority to CN201810254430.4A priority Critical patent/CN108694223B/zh
Publication of CN108694223A publication Critical patent/CN108694223A/zh
Application granted granted Critical
Publication of CN108694223B publication Critical patent/CN108694223B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

本发明提供了一种用户画像库的构建方法及装置,属于计算机技术领域。包括:获取针对视频对象的用户浏览记录信息;根据用户浏览记录信息,确定用户浏览记录信息所对应的视频对象;提取视频对象的标签信息;将标签信息导入知识图谱库进行关联操作,获取标签信息与关联到的特征信息之间的第一对应关系,和特征信息与对应的分类信息之间的第二对应关系,并将第一对应关系和第二对应关系导入用户画像库,通过依据各个领域的相关知识图谱中数据的关联和分类信息,为用户画像库的构建提供切实的、有价值的数据,构建具有信息关联与信息分类体系的用户画像库。

Description

一种用户画像库的构建方法及装置
技术领域
本发明属于计算机技术领域,特别是涉及一种用户画像库的构建方法及装置。
背景技术
用户画像又称用户角色,作为一种勾画目标用户、联系用户诉求与设计方向的有效工具,用户画像在各领域得到了广泛的应用。在实际操作的过程中,可以将用户的属性、行为与期待联结起来,例如,在视频网站中,可以针对每个用户建立其对应的用户画像数据,为用户提供更优的服务。
现有技术中,视频网站中对于用户画像数据的建立,通常有两种形式,一是对用户本身信息的收集,比如用户注册时填写的个人信息、用户的地理位置等;二是基于用户经常观看的视频的信息对用户画像数据进行构建,例如如果用户观看动作片的频率比较高,会给该用户的画像数据中添加“动作”标签。
但是,在先技术中用户画像的建立所采用的数据都是比较直接、且分散的信息,数据之间无法进行有效的分类,并且数据之间缺乏关联性,导致用户画像数据的内容不够丰富。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的一种用户画像库的构建方法及装置。
依据本发明的第一方面,提供了一种用户画像库的构建方法,该方法包括:
获取针对视频对象的用户浏览记录信息;
根据所述用户浏览记录信息,确定所述用户浏览记录信息所对应的视频对象;
提取所述视频对象的标签信息;
将所述标签信息导入知识图谱库进行关联操作,获取所述标签信息与关联到的特征信息之间的第一对应关系,和所述特征信息与对应的分类信息之间的第二对应关系,所述知识图谱库包括所述特征信息与所述特征信息对应的分类信息;
将所述第一对应关系和所述第二对应关系导入用户画像库。
依据本发明的第二方面,提供了一种用户画像库的构建装置,该装置包括:
获取模块,用于根据所述用户浏览记录信息,确定所述用户浏览记录信息所对应的视频对象;
第一提取模块,用于提取所述视频对象的标签信息;
关联模块,用于将所述标签信息导入知识图谱库进行关联操作,获取所述标签信息与关联到的特征信息之间的第一对应关系,和所述特征信息与对应的分类信息之间的第二对应关系,所述知识图谱库包括所述特征信息与所述特征信息对应的分类信息;
第一导入模块,用于将所述第一对应关系和所述第二对应关系导入用户画像库。
针对在先技术,本发明具备如下优点:本发明实施例提供的用户画像库的方式及装置,可以获取针对视频对象的用户浏览记录信息;根据用户浏览记录信息,确定用户浏览记录信息所对应的视频对象;提取视频对象的标签信息;将标签信息导入知识图谱库进行关联操作,获取标签信息与关联到的特征信息之间的第一对应关系,和特征信息与对应的分类信息之间的第二对应关系,并将第一对应关系和第二对应关系导入用户画像库,通过依据各个领域的相关知识图谱中数据的关联和分类信息,为用户画像库的构建提供切实的、有价值的数据,构建具有信息关联与信息分类体系的用户画像库。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1是本发明实施例提供的一种用户画像库的构建方法的步骤流程图;
图1A是本发明实施例提供的一种知识图谱的局部结构示意图;
图2是本发明实施例提供的一种用户画像库的构建方法的具体步骤流程图;
图2A是本发明实施例提供的另一种知识图谱的局部结构示意图;
图3是本发明实施例提供的一种用户画像库的构建装置的框图;
图4是本发明实施例提供的一种用户画像库的构建装置的具体框图。
具体实施方式
下面将参照附图更详细地描述本发明的示例性实施例。虽然附图中显示了本发明的示例性实施例,然而应当理解,可以以各种形式实现本发明而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本发明,并且能够将本发明的范围完整的传达给本领域的技术人员。
实施例一
图1是本发明实施例一提供的一种用户画像库的构建方法的步骤流程图,如图1所示,该方法可以包括:
步骤101、获取针对视频对象的用户浏览记录信息。
在实际的应用场景中,用户画像是一种勾画目标用户、联系用户诉求与设计方向的有效工具,用户画像可以使应用产品的服务对象更加聚焦,更加的专注,用户画像库建立的数据来源是用户在使用该应用产品时,所产生的与用户行为相关的数据,例如,用户注册账号所填写的姓名、性别、年龄、地理位置等信息,用户在该应用中所产生的浏览记录信息等,通过收集这些信息,可以建立针对该用户的用户画像库。
以视频应用为例,若某一用户在视频应用中观看动作片的频率比较高,则会在该用户对应的用户画像库添加“动作”标签,在之后进行对该用户的个性化推荐时,可以依据用户画像库中的“动作”标签,为该用户推荐其他带有“动作”标签的视频,使得推荐的效果更佳精确。但是,在先技术中用户画像的建立所采用的数据都是比较直接、且分散的信息,数据之间无法进行有效的分类,并且数据之间缺乏关联性,导致用户画像数据的内容不够丰富。
因此,在本发明实施例中,可以利用知识图谱库进行用户数据的关联操作,使得关联到的信息形成相互之间有关联且集中的网状结构,将关联到的信息导入用户画像库,可以构建具有信息关联与信息分类体系的用户画像库。
本发明实施例的应用场景主要针对于视频应用,具体在该步骤中,用户在视频应用中建立有自己的用户账号,该用户账号会记录该用户在视频应用中的用户浏览记录信息,用户浏览记录信息可以为预设时间范围内所记录的,如最近三个月内该用户所浏览视频的信息。
步骤102、根据所述用户浏览记录信息,确定所述用户浏览记录信息所对应的视频对象。
本发明实施例中,还可以根据用户浏览记录信息,统计用户观看各个类型视频的次数,以确定用户与该类型视频之间的亲密度。
步骤103、提取所述视频对象的标签信息。
本发明实施例中,针对视频应用中的每一个视频对象,都可以添加有对应的标签信息,该标签信息可以为meta信息(视频元素可提供相关页面的元信息),比如针对搜索引擎和更新频度的描述和关键词。meta信息位于视频对象的头部,meta信息的属性定义了与文档相关联的名称/值对。
在视频应用中,标签信息可以为视频对象的相关描述信息,例如:对于电影“变形金刚1”,其标签信息可以包括“动作”,“科幻”,“冒险”,“史蒂文·斯皮尔伯格”,“派拉蒙影业公司”等,这些标签信息涵盖了这部影片的类型、主演、导演等描述信息。
通过提取用户浏览记录信息中对应视频对象的标签信息,可以确定用户对于视频对象的偏好,以便构建针对该用户的用户画像库。
步骤104、将所述标签信息导入知识图谱库进行关联操作,获取所述标签信息与关联到的特征信息之间的第一对应关系,和所述特征信息与对应的分类信息之间的第二对应关系,所述知识图谱库包括所述特征信息与所述特征信息对应的分类信息。
本发明实施例中,知识图谱(Knowledge Graph/Vault)是显示知识发展进程与结构关系的一系列各种不同的图形,通过可视化技术描述知识资源对应的特征信息,挖掘、分析、构建、绘制和显示特征信息及它们之间的相互联系,知识图谱中,各个特征信息与特征信息对应的分类信息形成网状结构,以清楚表达各个领域中对应实体之间的关联和实体所对应分类之间的关联。
参照图1A,其示出了一种知识图谱的局部结构示意图,其中实体对应的特征信息为“蛇”和“鳄鱼”,“蛇”和“鳄鱼”对应的分类信息为“爬行动物”,“爬行动物”对应的更高一层的分类信息为“动物”,因此,通过数据挖掘、信息处理、知识计量和图形绘制等技术,可以绘制出各个领域的相关知识图谱,以揭示各个知识领域的动态规律,为用户画像库的构建提供切实的、有价值的数据。
具体的,在视频应用中,通过与视频对象的标签信息的匹配,知识图谱中的相关特征信息都可以匹配到对应的视频对象,如在图1A中,实体“蛇”可以关联到“纪录片:蛇之美”和“狂蟒之灾”,实体“鳄鱼”可以关联到“天生杀手”和“惊世巨鳄”,而在于另一实体分类下,影片“狂蟒之灾”还会被关联到“恐怖片”所对应的特征信息下。
因此,通过步骤103中提取到的视频对象的标签信息,将标签信息导入知识图谱库进行关联操作,可以获取标签信息与关联到的特征信息之间的第一对应关系,和特征信息与对应的分类信息之间的第二对应关系。
例如,在用户浏览记录信息中显示,某一用户经常重复观看电影“狂蟒之灾”,则通过提取“狂蟒之灾”的标签信息“蟒蛇”和“惊悚”,将两个标签信息导入知识图谱库进行关联操作,得到“蟒蛇”—“蛇”、“惊悚”—“恐怖片”的第一对应关系,和“蛇”—“爬行动物”—“动物”、“恐怖片”—“电影”—“艺术”的第二对应关系,将第一对应关系和第二对应关系导入用户画像库构建用户画像,构建好的用户画像显示该用户喜欢观看恐怖片和与蛇相关的内容,因此在之后的视频推荐中,可以优先推荐特征信息“蛇”分类下的“纪录片:蛇之美”和与“蛇”处于同一分类下的“鳄鱼”对应的“天生杀手”和“惊世巨鳄”给用户,以为用户提供更加精准的推送或者更加丰富的相关推荐。
步骤105、将所述第一对应关系和所述第二对应关系导入用户画像库。
在本发明实施例中,通过将第一对应关系和第二对应关系导入用户画像库,可以依据各个领域的相关知识图谱,揭示各个知识领域的动态规律,为用户画像库的构建提供切实的、有价值的数据,构建具有信息关联与信息分类体系的用户画像库。
另外,用户画像库还存储有基础用户画像数据,如,用户注册账号所填写的姓名、性别、年龄、地理位置等信息,用户在该应用中所产生的浏览记录信息等,通过这些数据,可以对用户画像进行初步构建。
综上所述,本发明实施例提供的一种用户画像库的构建方法,可以获取针对视频对象的用户浏览记录信息;根据用户浏览记录信息,确定用户浏览记录信息所对应的视频对象;提取视频对象的标签信息;将标签信息导入知识图谱库进行关联操作,获取标签信息与关联到的特征信息之间的第一对应关系,和特征信息与对应的分类信息之间的第二对应关系,并将第一对应关系和第二对应关系导入用户画像库,通过依据各个领域的相关知识图谱中数据的关联和分类信息,为用户画像库的构建提供切实的、有价值的数据,构建具有信息关联与信息分类体系的用户画像库。
实施例二
图2是本发明实施例二提供的一种用户画像库的构建方法的具体步骤流程图,如图2所示,该方法可以包括:
步骤201、获取针对视频对象的用户浏览记录信息。
该步骤具体可以参照上述步骤101,此处不再赘述。
步骤202、根据所述用户浏览记录信息,确定所述用户浏览记录信息所对应的视频对象。
该步骤具体可以参照上述步骤102,此处不再赘述。
步骤203、提取所述视频对象的标签信息。
该步骤具体可以参照上述步骤103,此处不再赘述。
步骤204、将所述标签信息导入知识图谱库进行关联操作,获取所述标签信息与关联到的特征信息之间的第一对应关系,和所述特征信息与对应的分类信息之间的第二对应关系,所述知识图谱库包括所述特征信息与所述特征信息对应的分类信息。
可选的,步骤204还可以包括子步骤2041,子步骤2042,子步骤2043,子步骤2044。
子步骤2041,提取所述标签信息中的关键字。
子步骤2042,将所述关键字与所述知识图谱库中的特征信息进行匹配,得到所述标签信息与关联到的特征信息之间的第一对应关系,和所述特征信息与对应的分类信息之间的第二对应关系。
在本发明实施例中,针对标签信息导入知识图谱库进行的关联操作,具有两种实现方式,第一种实现方式为非结构化匹配,具体为提取标签信息中的关键字,以对视频对象的标题、描述等标签信息进行分词与语义分析后,再将关键字与知识图谱库中的特征信息进行匹配,得到标签信息与关联到的特征信息之间的第一对应关系,和特征信息与对应的分类信息之间的第二对应关系。
通过第一种实现方式,可以精确找到某一视频对象在知识图谱中的相关关联数据。
例如,电影“狂蟒之灾”的一个标签信息为电影名称“狂蟒之灾”,进行分词后得到“狂蟒”,对“狂蟒”进行语义分析进一步得到关键字“蛇”,将关键字“蛇”导入图1A的知识图谱中进行关联,可以得到相关的第一对应关系和第二对应关系。
子步骤2043,按照第二预设规则,从所述知识图谱库中选取所述特征信息。
在本发明实施例中,对于标签信息导入知识图谱库进行的关联操作的第二种实现方式,可以为结构化匹配,结构化匹配是将知识图谱中特定的特征信息与视频对象的特定标签信息进行匹配,如语言类型的实体,需要考虑视频信息中的语言字段,媒体类型的实体,需要考虑视频信息中的媒体字段等,其中,特定的特征信息与特定的标签信息的选取可以依赖大量的历史数据分析获得,也可以依赖经验等人工判断的方式得出。
通过第二种实现方式,可以通过较热门的领域对应的知识图谱,快速匹配出视频相关的第一对应关系和第二对应关系,其效率较高。
子步骤2044,将选取的所述特征信息与所述标签信息进匹配,得到所述标签信息与关联到的特征信息之间的第一对应关系,和所述特征信息与对应的分类信息之间的第二对应关系。
在本发明实施例中,按照第二预设规则,从知识图谱库中选取所述特征信息,第二预设规则可以依赖大量的历史数据分析获得,也可以依赖经验等人工判断的方式得出,例如,对于视频应用,比较热门的领域为明星、八卦,因此可以通过从知识图谱库中选取明星、八卦对应的特征信息,快速为视频对象匹配到相关的第一对应关系和第二对应关系。
步骤205、将所述第一对应关系和所述第二对应关系导入用户画像库。
该步骤具体可以参照上述步骤105,此处不再赘述。
步骤206、根据所述第一对应关系,提取所述知识图谱库中,相邻所述特征信息之间的第三对应关系。
本步骤中,参照图2A,其示出了另一种知识图谱的局部结构示意图,其中,对于实体“鹿晗”和“关晓彤”,这两个实体作为特征信息,其二者之间存在关联,即“鹿晗”和“关晓彤”为“男女朋友”关系,因此根据知识图谱中,“鹿晗”和“关晓彤”有“男女朋友”这条亲密度比较高的关系存在,则可以在为该用户推荐“鹿晗”的视频时加入一些“关晓彤”的相关视频。而虽然“关晓彤”与“张嘉译”存在“朋友”这条关系,但因为“朋友”关系的亲密度相对较低,所以可以不推荐“张嘉译”的相关视频。
步骤207、将所述第三对应关系导入所述用户画像库。
本步骤中,将第三对应关系导入用户画像库,完善了各个特征信息之间的关联,提高了用户画像库的精确性。
步骤208、根据所述第三对应关系,对所述特征信息进行分类,得到多个分类集合。
参照图2A,根据各个特征信息之间的第三对应关系,可以将特征信息分为两类,一类为:“鹿晗”—男女朋友—“关晓彤”,另一类为“关晓彤”—朋友—“张嘉译”,其分类的依据是根据特征信息之间的第三对应关系的不同进行划分的。
步骤209、按照第一预设规则,对各个所述分类集合添加对应的权重标签,以供在进行视频对象推荐时,根据所述权重标签包括的权重值的大小,将所述分类集合中所述特征信息对应的视频对象进行推荐。
在本发明实施例中,按照第一预设规则,对各个分类集合添加对应的权重标签,其中,第一预设规则可以依赖大量的历史数据分析获得,也可以依赖经验等人工判断的方式得出。
例如,根据图2A中,两个分类集合“鹿晗”—男女朋友—“关晓彤”,和“关晓彤”—朋友—“张嘉译”,根据判断,男女朋友的关系亲密度要大于朋友的关系亲密度,因此可以为“鹿晗”—男女朋友—“关晓彤”设定一个大于“关晓彤”—朋友—“张嘉译”的权重标签,如,“鹿晗”—男女朋友—“关晓彤”设定权重标签的权重值可以设定为2,“关晓彤”—朋友—“张嘉译”的权重标签可以设定为1。
因此,在进行视频对象的推荐时,可以根据权重标签的权重值的大小,将权重值大的分类集合中的视频对象进行优先推荐或展示在推荐栏中的醒目位置,将权重值小的分类集合中的视频对象不进行推荐或展示在推荐栏中的次醒目位置,达到优化视频推荐的目的,使得推荐过程更加人性化。
步骤210、根据所述用户浏览记录信息,统计所述视频对象的被点击次数。
在本发明实施例中,可以根据用户浏览记录信息,统计视频对象的被点击次数,以确定该视频对象的受欢迎程度,假设在一定时间范围内,“关晓彤”—朋友—“张嘉译”的分类集合对应的视频对象“一主二仆”的点击数量较大,则可以认为“一主二仆”的视频较为火热,可以相对提高“关晓彤”—朋友—“张嘉译”的分类集合对应的权重,以进行优选推荐。
步骤211、若所述视频对象的被点击次数大于或等于预设阈值,则提高所述视频对象对应的分类集合所对应的权重标签的权重值。
在该步骤中,假设“一主二仆”的被点击次数大于或等于预设阈值,则可以认为“一主二仆”的视频较为火热,可以将“关晓彤”—朋友—“张嘉译”的分类集合对应的权重值由1提高为2,在为用户推荐“鹿晗”的视频时加入一些“关晓彤”的视频,同时推荐一些“张嘉译”的相关视频。
步骤212、当触发推荐工作指令时,根据所述第一对应关系和所述第二对应关系,将所述用户画像库中分类信息所对应的标签信息对应的视频对象进行推荐。其中,所述触发推荐工作指令包括:所述用户画像库对应的账户进行登录,或,所述用户画像库对应的账户观看所述视频对象。
在本发明实施例中,根据用户使用习惯,视频推荐的动作常发生于用户画像库对应的账户进行登录,或,用户画像库对应的账户观看视频对象时,例如,用户登录账号后,视频应用可以推送一个推荐页面,推荐页面中可以包括用户画像库中权重值较大的几个分类集合对应的视频对象。另外,当用户观看完某一类型的电影后,可以依据第一对应关系和第二对应关系,为用户推荐同类型的其他电影。使得视频应用提供更加精准的推送或者更加丰富的相关推荐,从而更好得服务于视频个性化搜索与推荐等业务。
综上所述,本发明实施例提供的一种用户画像库的构建方法,可以获取针对视频对象的用户浏览记录信息;根据用户浏览记录信息,确定用户浏览记录信息所对应的视频对象;提取视频对象的标签信息;将标签信息导入知识图谱库进行关联操作,获取标签信息与关联到的特征信息之间的第一对应关系,和特征信息与对应的分类信息之间的第二对应关系,并将第一对应关系和第二对应关系导入用户画像库,之后提取所述知识图谱库中,相邻所述特征信息之间的第三对应关系并导入用户画像库,完善了各个特征信息之间的关联,提高了用户画像库的精确性,通过依据各个领域的相关知识图谱中数据的关联和分类信息,为用户画像库的构建提供切实的、有价值的数据,构建具有信息关联与信息分类体系的用户画像库。
实施例三
图3是本发明实施例三提供的一种用户画像库的构建装置的框图,如图3所示,该装置30可以包括:
获取模块301,用于获取针对视频对象的用户浏览记录信息。
确定模块302,用于根据所述用户浏览记录信息,确定所述用户浏览记录信息所对应的视频对象。
第一提取模块303,用于提取所述视频对象的标签信息。
关联模块304,用于将所述标签信息导入知识图谱库进行关联操作,获取所述标签信息与关联到的特征信息之间的第一对应关系,和所述特征信息与对应的分类信息之间的第二对应关系,所述知识图谱库包括所述特征信息与所述特征信息对应的分类信息。
第一导入模块305,用于将所述第一对应关系和所述第二对应关系导入用户画像库。
综上所述,本发明实施例三中的用户画像库的构建装置,通过获取针对视频对象的用户浏览记录信息;根据用户浏览记录信息,确定用户浏览记录信息所对应的视频对象;提取视频对象的标签信息;将标签信息导入知识图谱库进行关联操作,获取标签信息与关联到的特征信息之间的第一对应关系,和特征信息与对应的分类信息之间的第二对应关系,并将第一对应关系和第二对应关系导入用户画像库,通过依据各个领域的相关知识图谱中数据的关联和分类信息,为用户画像库的构建提供切实的、有价值的数据,构建具有信息关联与信息分类体系的用户画像库。
实施例四
图4是本发明实施例四提供的一种用户画像库的构建装置的框图,如图4所示,该装置40可以包括:
获取模块401,用于获取针对视频对象的用户浏览记录信息。
确定模块402,根据所述用户浏览记录信息,确定所述用户浏览记录信息所对应的视频对象。
第一提取模块403,用于提取所述视频对象的标签信息。
关联模块404,用于将所述标签信息导入知识图谱库进行关联操作,获取所述标签信息与关联到的特征信息之间的第一对应关系,和所述特征信息与对应的分类信息之间的第二对应关系,所述知识图谱库包括所述特征信息与所述特征信息对应的分类信息。
可选的,关联模块404还可以包括:
提取子模块,用于提取所述标签信息中的关键字。
第一匹配子模块,用于将所述关键字与所述知识图谱库中的特征信息进行匹配,得到所述标签信息与关联到的特征信息之间的第一对应关系,和所述特征信息与对应的分类信息之间的第二对应关系。
选取子模块,用于按照第二预设规则,从所述知识图谱库中选取所述特征信息。
第二匹配子模块,用于将选取的所述特征信息与所述标签信息进匹配,得到所述标签信息与关联到的特征信息之间的第一对应关系,和所述特征信息与对应的分类信息之间的第二对应关系。
第一导入模块405,用于将所述第一对应关系和所述第二对应关系导入用户画像库。
第二提取模块406,用于根据所述第一对应关系,提取所述知识图谱库中,相邻所述特征信息之间的第三对应关系。
第二导入模块407,用于将所述第三对应关系导入所述用户画像库。
分类模块408,用于根据所述第三对应关系,对所述特征信息进行分类,得到多个分类集合。
权重添加模块409,用于按照第一预设规则,对各个所述分类集合添加对应的权重标签,以供在进行视频对象推荐时,根据所述权重标签包括的权重值的大小,将所述分类集合中所述特征信息对应的视频对象进行推荐。
统计模块410,用于根据所述用户浏览记录信息,统计所述视频对象的被点击次数。
权重修改模块411,用于若所述视频对象的被点击次数大于或等于预设阈值,则提高所述视频对象对应的分类集合所对应的权重标签的权重值。
推荐模块412,用于当触发推荐工作指令时,根据所述第一对应关系和所述第二对应关系,将所述用户画像库中分类信息所对应的标签信息对应的视频对象进行推荐;其中,所述触发推荐工作指令包括:所述用户画像库对应的账户进行登录,或,所述用户画像库对应的账户观看所述视频对象。
综上所述,本发明实施例四中的用户画像库的构建装置,可以获取针对视频对象的用户浏览记录信息;根据用户浏览记录信息,确定用户浏览记录信息所对应的视频对象;提取视频对象的标签信息;将标签信息导入知识图谱库进行关联操作,获取标签信息与关联到的特征信息之间的第一对应关系,和特征信息与对应的分类信息之间的第二对应关系,并将第一对应关系和第二对应关系导入用户画像库,之后提取所述知识图谱库中,相邻所述特征信息之间的第三对应关系并导入用户画像库,完善了各个特征信息之间的关联,提高了用户画像库的精确性,通过依据各个领域的相关知识图谱中数据的关联和分类信息,为用户画像库的构建提供切实的、有价值的数据,构建具有信息关联与信息分类体系的用户画像库。
对于上述装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
本领域技术人员易于想到的是:上述各个实施例的任意组合应用都是可行的,故上述各个实施例之间的任意组合都是本发明的实施方案,但是由于篇幅限制,本说明书在此就不一一详述了。
在此提供的用户画像库的构建方法不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述,构造具有本发明方案的系统所要求的结构是显而易见的。此外,本发明也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本发明并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例的用户画像库的构建方法中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。

Claims (10)

1.一种用户画像库的构建方法,其特征在于,所述方法包括:
获取针对视频对象的用户浏览记录信息;
根据所述用户浏览记录信息,确定所述用户浏览记录信息所对应的视频对象;
提取所述视频对象的标签信息;
将所述标签信息导入知识图谱库进行关联操作,获取所述标签信息与关联到的特征信息之间的第一对应关系,和所述特征信息与对应的分类信息之间的第二对应关系,所述知识图谱库包括所述特征信息与所述特征信息对应的分类信息;
将所述第一对应关系和所述第二对应关系导入用户画像库;
根据所述第一对应关系,提取所述知识图谱库中,相邻所述特征信息之间的第三对应关系;
将所述第三对应关系导入所述用户画像库;
根据所述第三对应关系,对所述特征信息进行分类,得到多个分类集合;
按照第一预设规则,对各个所述分类集合添加对应的权重标签,以供在进行视频对象推荐时,根据所述权重标签包括的权重值的大小,将所述分类集合中所述特征信息对应的视频对象进行推荐。
2.根据权利要求1所述的方法,其特征在于,在所述按照第一预设规则,对各个所述分类集合添加对应的权重标签的步骤之后,所述方法还包括:
根据所述用户浏览记录信息,统计所述视频对象的被点击次数;
若所述视频对象的被点击次数大于或等于预设阈值,则提高所述视频对象对应的分类集合所对应的权重标签的权重值。
3.根据权利要求1所述的方法,其特征在于,所述将所述标签信息导入知识图谱库进行关联操作,获取所述标签信息与关联到的特征信息之间的第一对应关系,和所述特征信息与对应的分类信息之间的第二对应关系的步骤包括:
提取所述标签信息中的关键字;
将所述关键字与所述知识图谱库中的特征信息进行匹配,得到所述标签信息与关联到的特征信息之间的第一对应关系,和所述特征信息与对应的分类信息之间的第二对应关系。
4.根据权利要求1所述的方法,其特征在于,所述将所述标签信息导入知识图谱库进行关联操作,获取所述标签信息与关联到的特征信息之间的第一对应关系,和所述特征信息与对应的分类信息之间的第二对应关系的步骤包括:
按照第二预设规则,从所述知识图谱库中选取所述特征信息;
将选取的所述特征信息与所述标签信息进匹配,得到所述标签信息与关联到的特征信息之间的第一对应关系,和所述特征信息与对应的分类信息之间的第二对应关系。
5.根据权利要求1所述的方法,其特征在于,所述方法还包括:
当触发推荐工作指令时,根据所述第一对应关系和所述第二对应关系,将所述用户画像库中分类信息所对应的标签信息对应的视频对象进行推荐;
其中,所述触发推荐工作指令包括:所述用户画像库对应的账户进行登录,或,所述用户画像库对应的账户观看所述视频对象。
6.一种用户画像库的构建装置,其特征在于,所述装置包括:
获取模块,用于获取针对视频对象的用户浏览记录信息;
确定模块,用于根据所述用户浏览记录信息,确定所述用户浏览记录信息所对应的视频对象;
第一提取模块,用于提取所述视频对象的标签信息;
关联模块,用于将所述标签信息导入知识图谱库进行关联操作,获取所述标签信息与关联到的特征信息之间的第一对应关系,和所述特征信息与对应的分类信息之间的第二对应关系,所述知识图谱库包括所述特征信息与所述特征信息对应的分类信息;
第一导入模块,用于将所述第一对应关系和所述第二对应关系导入用户画像库;
第二提取模块,用于根据所述第一对应关系,提取所述知识图谱库中,相邻所述特征信息之间的第三对应关系;
第二导入模块,用于将所述第三对应关系导入所述用户画像库;
分类模块,用于根据所述第三对应关系,对所述特征信息进行分类,得到多个分类集合;
权重添加模块,用于按照第一预设规则,对各个所述分类集合添加对应的权重标签,以供在进行视频对象推荐时,根据所述权重标签包括的权重值的大小,将所述分类集合中所述特征信息对应的视频对象进行推荐。
7.根据权利要求6所述的装置,其特征在于,所述装置还包括:
统计模块,用于根据所述用户浏览记录信息,统计所述视频对象的被点击次数;
权重修改模块,用于若所述视频对象的被点击次数大于或等于预设阈值,则提高所述视频对象对应的分类集合所对应的权重标签的权重值。
8.根据权利要求6所述的装置,其特征在于,所述关联模块,包括:
提取子模块,用于提取所述标签信息中的关键字;
第一匹配子模块,用于将所述关键字与所述知识图谱库中的特征信息进行匹配,得到所述标签信息与关联到的特征信息之间的第一对应关系,和所述特征信息与对应的分类信息之间的第二对应关系。
9.根据权利要求6所述的装置,其特征在于,所述关联模块,包括:
选取子模块,用于按照第二预设规则,从所述知识图谱库中选取所述特征信息;
第二匹配子模块,用于将选取的所述特征信息与所述标签信息进匹配,得到所述标签信息与关联到的特征信息之间的第一对应关系,和所述特征信息与对应的分类信息之间的第二对应关系。
10.根据权利要求6所述的装置,其特征在于,所述装置还包括:
推荐模块,用于当触发推荐工作指令时,根据所述第一对应关系和所述第二对应关系,将所述用户画像库中分类信息所对应的标签信息对应的视频对象进行推荐;
其中,所述触发推荐工作指令包括:所述用户画像库对应的账户进行登录,或,所述用户画像库对应的账户观看所述视频对象。
CN201810254430.4A 2018-03-26 2018-03-26 一种用户画像库的构建方法及装置 Active CN108694223B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810254430.4A CN108694223B (zh) 2018-03-26 2018-03-26 一种用户画像库的构建方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810254430.4A CN108694223B (zh) 2018-03-26 2018-03-26 一种用户画像库的构建方法及装置

Publications (2)

Publication Number Publication Date
CN108694223A CN108694223A (zh) 2018-10-23
CN108694223B true CN108694223B (zh) 2021-07-16

Family

ID=63844587

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810254430.4A Active CN108694223B (zh) 2018-03-26 2018-03-26 一种用户画像库的构建方法及装置

Country Status (1)

Country Link
CN (1) CN108694223B (zh)

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109582876B (zh) * 2018-12-19 2021-05-11 广州易起行信息技术有限公司 旅游行业用户画像构造方法、装置和计算机设备
CN111353089A (zh) * 2018-12-24 2020-06-30 阿里巴巴集团控股有限公司 信息推荐方法、装置、电子设备及计算机存储介质
CN111753142B (zh) * 2019-03-28 2023-08-01 北京百度网讯科技有限公司 基于标签的检索方法及装置
CN110175264A (zh) * 2019-04-23 2019-08-27 深圳市傲天科技股份有限公司 视频用户画像的构建方法、服务器及计算机可读存储介质
CN110781378B (zh) * 2019-09-06 2023-09-22 中国平安财产保险股份有限公司 数据图形化处理方法、装置、计算机设备及存储介质
CN110737779B (zh) * 2019-09-18 2021-05-04 北京三快在线科技有限公司 知识图谱的构建方法、装置、存储介质和电子设备
CN111709843B (zh) * 2020-05-09 2023-07-28 中国人民财产保险股份有限公司 一种客户画像的生成方法、装置及电子设备
CN112131472A (zh) * 2020-09-24 2020-12-25 腾讯科技(深圳)有限公司 信息推荐方法、装置、电子设备和存储介质
CN112468853B (zh) * 2020-11-26 2023-01-03 未来电视有限公司 电视资源推荐方法、装置、计算机设备及存储介质
CN112364180A (zh) * 2020-11-26 2021-02-12 上海天旦网络科技发展有限公司 基于知识图谱的标签定义和计算的方法及系统
CN112380462A (zh) * 2020-11-29 2021-02-19 龙马智芯(珠海横琴)科技有限公司 参展路径规划方法、装置、服务器及计算机可读存储介质
CN113204636B (zh) * 2021-01-08 2023-12-05 北京欧拉认知智能科技有限公司 基于知识图谱的用户动态个性化画像方法
CN113434704A (zh) * 2021-03-23 2021-09-24 汪威 基于大数据的知识图谱处理方法和云计算系统
CN115248890B (zh) * 2021-04-27 2024-04-05 百度国际科技(深圳)有限公司 用户兴趣画像的生成方法、装置、电子设备以及存储介质
CN113569136B (zh) * 2021-07-02 2024-03-05 北京达佳互联信息技术有限公司 视频推荐方法、装置、电子设备及存储介质
CN116109355B (zh) * 2023-04-12 2023-06-16 广东玄润数字信息科技股份有限公司 基于偏好数据的广告投放分析方法、系统及存储介质

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030084066A1 (en) * 2001-10-31 2003-05-01 Waterman Scott A. Device and method for assisting knowledge engineer in associating intelligence with content
CN104537065A (zh) * 2014-12-29 2015-04-22 北京奇虎科技有限公司 一种搜索结果的推送方法及系统
CN106504099A (zh) * 2015-09-07 2017-03-15 国家计算机网络与信息安全管理中心 一种构建用户画像的系统
CN105068661B (zh) * 2015-09-07 2018-09-07 百度在线网络技术(北京)有限公司 基于人工智能的人机交互方法和系统
CN106055617A (zh) * 2016-05-26 2016-10-26 乐视控股(北京)有限公司 一种数据推送方法及装置
CN107066621B (zh) * 2017-05-11 2022-11-08 腾讯科技(深圳)有限公司 一种相似视频的检索方法、装置和存储介质
CN107341215B (zh) * 2017-06-07 2020-05-12 北京航空航天大学 一种基于分布式计算平台的多源垂直知识图谱分类集成查询系统
CN107229878B (zh) * 2017-06-28 2019-09-24 海南大学 一种投入决定的安全性可定义的基于数据图谱、信息图谱和知识图谱的资源安全保护方法

Also Published As

Publication number Publication date
CN108694223A (zh) 2018-10-23

Similar Documents

Publication Publication Date Title
CN108694223B (zh) 一种用户画像库的构建方法及装置
US11921805B2 (en) Web document enhancement
CN109189951B (zh) 一种多媒体资源推荐方法、设备及存储介质
US8909617B2 (en) Semantic matching by content analysis
US10032081B2 (en) Content-based video representation
CN109871464B (zh) 一种基于ucl语义标引的视频推荐方法与装置
CN108038161A (zh) 基于相册的信息推荐方法、装置及计算设备
Awad et al. Trecvid semantic indexing of video: A 6-year retrospective
CN112364204B (zh) 视频搜索方法、装置、计算机设备及存储介质
Abbasi et al. Exploiting flickr tags and groups for finding landmark photos
CN111008321A (zh) 基于逻辑回归推荐方法、装置、计算设备、可读存储介质
CN109408672B (zh) 一种文章生成方法、装置、服务器及存储介质
KR20130045282A (ko) 비디오 콘텐츠를 관리하기 위한 방법 및 장치
WO2015188719A1 (zh) 结构化数据与图片的关联方法与关联装置
Yamasaki et al. Social popularity score: Predicting numbers of views, comments, and favorites of social photos using only annotations
US20150356191A1 (en) Web document enhancement
Liu et al. Event analysis in social multimedia: a survey
KR100876214B1 (ko) 문맥기반 광고 장치와 그 방법 및 이를 구현할 수 있는컴퓨터로 읽을 수 있는 기록 매체
Rudinac et al. Multimodal classification of violent online political extremism content with graph convolutional networks
CN113220974A (zh) 点击率预测模型训练、搜索召回方法、装置、设备及介质
Hashemzadeh et al. Using a data mining tool and fp-growth algorithm application for extraction of the rules in two different dataset
CN108460131B (zh) 一种分类标签处理方法及装置
KR102170535B1 (ko) 감성 분석을 통한 사용자 선호 기반의 검색 장치 및 방법
US20210342393A1 (en) Artificial intelligence for content discovery
Gligorov User-generated metadata in audio-visual collections

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant