CN112637684B - 智能电视端探测用户画像标签的方法 - Google Patents
智能电视端探测用户画像标签的方法 Download PDFInfo
- Publication number
- CN112637684B CN112637684B CN202011567942.XA CN202011567942A CN112637684B CN 112637684 B CN112637684 B CN 112637684B CN 202011567942 A CN202011567942 A CN 202011567942A CN 112637684 B CN112637684 B CN 112637684B
- Authority
- CN
- China
- Prior art keywords
- user
- topic
- label
- tags
- topics
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/45—Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
- H04N21/4508—Management of client data or end-user data
- H04N21/4532—Management of client data or end-user data involving end-user characteristics, e.g. viewer profile, preferences
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种智能电视端探测用户画像标签的方法,包括:构建用户生活消费及兴趣侧标签规范;运营方制作相应的有探测倾向的专题并赋予所述专题相应的标签,形成相应的专题及标签数据库;构建探测专题内容矩阵;记录用户对智能电视上每个内容的历史行为记录,并根据所述探测专题内容矩阵得到观看专题的用户集;计算并验证所述用户集,得到用户画像标签;本发明能够有效提高智能电视端用户画像标签的全面性,同时缩短用户画像标签的时间。
Description
技术领域
本发明涉及智能电视技术领域,特别是一种智能电视端探测用户画像标签的方法。
背景技术
随着影视产业的迅猛发展,智能电视已经成为每个家庭重要的组成部分。但对影视内容提供平台或者电视运营方来说,由于智能电视与智能手机等设备的不同,通过历史观影行为或者传统用户画像系统得到的基本是用户对影视类的画像标签,对用户生活消费类标签及个人属性标签是难以获得且不准确的,一般电视厂商或者内容提供平台想要获得此类不公开的数据,必须通过异业合作数据交换等方式,不光需要付出一定的额外价值进行交换,甚至有可能在不经意间侵犯用户隐私数据。
发明内容
为解决现有技术中存在的问题,本发明的目的是提供一种智能电视端探测用户画像标签的方法,本发明能够有效提高智能电视端用户画像标签的全面性,同时缩短用户画像标签的时间。
为实现上述目的,本发明采用的技术方案是:一种智能电视端探测用户画像标签的方法,包括以下步骤:
步骤1、构建用户生活消费及兴趣侧标签规范;
步骤2、运营方制作相应的有探测倾向的专题并赋予所述专题相应的标签,形成相应的专题及标签数据库;
步骤3、构建探测专题内容矩阵;
步骤4、记录用户对智能电视上每个内容的历史行为记录,并根据所述探测专题内容矩阵得到观看专题的用户集;
步骤5、计算并验证所述用户集,得到用户画像标签。
作为本发明的进一步改进,步骤1中,所述标签规范具体包括:专题属性、电视属性和家庭属性。
作为本发明的进一步改进,在步骤3中,根据专题排期及时间轴构建探测专题内容矩阵,设智能电视一屏垂直方向有M个专题位置,记N为一个专题探测周期所需的专题数量,将该探测周期在智能设备上推出的专题内容形成一个M*N矩阵,并将专题及对应的专题标签存储。
作为本发明的进一步改进,N大于等于3。
作为本发明的进一步改进,在步骤5中,通过对步骤4得到的用户集进行取交集或取差集的方式计算并验证所述用户集。
作为本发明的进一步改进,取交集时,同分类下冲突标签舍弃,不冲突标签取出现频次最高的,其余标签合并,取差集时,同分类下冲突标签取较小值,其余标签合并。
本发明的有益效果是:
1、本发明针对智能电视端影视内容提供领域用户画像标签全面性的问题,通过一种计算方法利用主动构建有兴趣探测意图的专题及赋予专题相关标签,结合电视上的内容矩阵及用户历史观影行为,在无需额外进行可能侵犯用户隐私行为的条件下,快速获取用户生活消费/兴趣测标签。
2、本发明结合电视上的内容矩阵及用户历史观影行为,在无需额外进行可能侵犯用户隐私行为的条件下,快速获取用户生活消费/兴趣测标签,为某一用户集进行统一标记,较之传统方法,能够有效提高智能电视端用户画像标签的全面性,同时缩短用户画像标签的时间。
附图说明
图1为本发明实施例的流程框图;
图2为本发明实施例中用户生活消费/兴趣侧标签规范示意图;
图3为本发明实施例中一个具体的“M*N”矩阵示意图及标签推导示意图;
图4为本发明实施例中两种运算方式及标签推导的示意图;
图5为本发明实施例中连续计算模式下标签推导的示意图;
图6为本发明实施例中的标签推导示意图;
图7为本发明实施例中专题数据库构成及标签说明示意图。
具体实施方式
下面结合附图对本发明的实施例进行详细说明。
实施例1
如图1所示,一种智能电视端探测用户画像标签的方法,包括:
(1)构建相应用户生活消费/兴趣侧标签规范,其中主要包含三层属性即专题标签属性、电视属性及家庭属性,其标签涵盖上述基本属性、生活消费等类目各属性,详细标签范围如图2所示;
(2)运营人员制作相应有探测倾向的专题及赋予专题相应标签,特别是用户生活消费类及个人属性类标签,形成相应的专题及标签数据库;
(3)根据智能电视的内容栏目,将相应专题排期推出内容,根据电视屏幕播放栏位及时间序列构建相应的探测专题内容矩阵,假设智能电视一屏垂直方向有M个专题位置,记N为一个专题探测周期所需的专题数量(即若7天更换一次同位置的专题内容,则探测周期为N*7个自然日),则这个探测周期将要在智能设备上推出的专题内容形成一个M*N矩阵,并将专题及对应的专题标签存储,如以A1代表一个专题,A1.tags存储A1所代表的标签,则某时期内所构成的矩阵X在数据存储上如下表示:
其中矩阵可以是任意方向及任意个数的专题组成,所以上述矩阵在某时刻也可以简化为如下两种形式:
见图3示例;
(4)记录用户对智能电视上每个内容的历史行为记录,特别是用户是否观看相应专题的动作;
(5)通过用户历史行为记录计算并得到观看专题的用户集,以A1.clickuser来记录点击A1矩阵的用户信息,里面包含用户在数据库里的唯一标识,则得到A1.clickusers是一个包含点击该专题用户信息的集合,拥有唯一标识openid,;
(6)通过公式计算并验证用户集,记观看了A1专题的用户集为A1,观看了B1专题的用户集为B1,以此类推,此处计算验证用户集的运算方式有两种,以计算表达分别是A1与B1取交集,即A1∩B1以及A1与B1取差集,即A1-B1,在推断和验证计算过程中,可能同时存在或包含多个用户集合的两种连续计算,及可能存在A1∩B1∩C1……∩N1等运算,得到最终用户集记为S1,交集和差集的计算及标签推导示意见图4,连续计算的具体示意图见图5;
额外的,N如上文所述,即一个探测周期之内的所需专题数量,众所周知,一个用户在完全自主能力情况下,对同一类内容播放的越多,则表示兴趣越大,因此取交集操作时N的值越高,则准确度越高,但由于N值越大代表生成最终用户集的所需等待的时间复杂度O(N)越长(本文内为N*7),所以需要为了兼顾准确度和时间成本,在验证结果时,本实施例遵循N不得小于3的原则;记另一个探测周期所需的专题个数为K,生成的用户集为K1,进行N+K操作;
所以,本实施例在初期时,专题构建时采用“2+2”模式,即,两个标签较少及属性相同的专题集A1、B1,两个标签属性较多且与A1、1B差异较大的专题集C1、D1,采用(A1∩B1)∩(C1∩D1)模式,得到用户集与相应的标签集,并把相应标签赋值给用户,在中后期,专题构建采用“4+1”模式,及4个标签内容属性相同的专题集A1、B1、C1、D1,与一个标签较多且差异较大的专题集E1,采用(A1∩B1∩C1∩D1)∩E1的模式获得用户集与标签集,并把相应标签赋值给用户,在得到了系统内50%以上用户标签后,需要精确用户标签集时,需要用到差集计算,原则是当两个专题集有相同属性标签,但其中一个有互斥标签(如性别,即为互斥标签)的用户集进行差集计算,即可得到另一半互斥结果标签的用户集,如图6所示;
(7)根据记录预先定义好的A1与An之间的关系,系统将A1.tags里同一维度的tag根据需要进行进行交并差等逻辑计算,得到最终标签值,具体的示例为A1.tags.age具体值为“25-32”,A2.tags.age为“22-28”,A1.clickusers共有300人,A2.clickusers有657人,则取交集计算后得到年龄标签为“25-28”,用户群交集300人,最后,系统将该300人的年龄标签openid.tags.age设置为“25-28”。取交集时,同分类下冲突标签舍弃,不冲突标签取出现频次最高的,其余标签合并,取差集时,同分类下冲突标签取较小值,其余标签合并。
(8)根据以上规则,可以计算专题矩阵X的人群和相应标签信息存储在相应字段中,同样的,X1与Xn之间也可以进行逻辑计算以达到精确化标签的目的,计算实现方法与上述完全相同,以此类推,在预先设计好的情况下,电视用户的标签会随着时间的推移逐渐缩小范围且达到一个阈值,完成我们推测用户标签的目的,丰富用户生活画像类的标签,从而提升用户画像的准确率。
实施例2
如图1所示,影片标签关联用户个性化标签计算方法的具体工作流程如下:
(1)构建相应用户生活消费/兴趣侧标签规范,其中主要包含三层属性即专题标签属性、电视属性及家庭属性,详见图7;
(2)运营人员根据需要探测的主题人群制作相应专题,部分专题内容及专题标签如图7所示,将此专题及相应标签保存至专题数据库,此处实例构建名为“【胎教小课堂】宝爸宝妈的偷懒神技”、“无私母爱”、“父爱如山”、“父母与孩子之间,隔着什么?”等5个专题,并赋予相应标签,如图3、5中部分所示即专题属性中用户基础属性中的年龄标签“25-32”,家庭属性中“家有萌宝”“有孩一族”两个标签;
(3)在目前的电视上,一屏有5个专题位置,在第一个位置从2019年4月28日起更换第一个专题即“【胎教小课堂】宝爸宝妈的偷懒神技”,7天后更换内容为“无私母爱”专题系列内容,本例中一个探测周期需要4个专题,则形成具体的“5*4”矩阵以及探测意如图2所示;
(4)在探测周期35个自然日(5*7)结束时,即2019年5月6日,根据智能电视上每个专题内容的用户历史行为记录,分别得到每个专题的用户集A(292037人)、B(438812人)、C(336134人)、D(152323人)、E(76457人);
(5)通过公式计算并验证用户集;
如图5所示,将上述A、B、C、D、E取交集,最终得到用户集S1,共64823人。
(6)按照标签计算规则为验证的用户集生成较为准确的生活消费/兴趣类标签;
在取交集时,由于年龄标签“25-32”及“35-45”为冲突标签舍弃,“叛逆期”与“家有萌宝”“有孩一族”为不冲突标签,取频次最高者“有孩一族”为最终用户集标签,为64823人关联上“有孩一族”的标签。
以上所述实施例仅表达了本发明的具体实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。
Claims (4)
1.一种智能电视端探测用户画像标签的方法,其特征在于,包括以下步骤:
步骤1、构建用户生活消费及兴趣侧标签规范;
步骤2、运营方制作相应的有探测倾向的专题并赋予所述专题相应的标签,形成相应的专题及标签数据库;
步骤3、构建探测专题内容矩阵;
步骤4、记录用户对智能电视上每个内容的历史行为记录,并根据所述探测专题内容矩阵得到观看专题的用户集;
步骤5、计算并验证所述用户集,得到用户画像标签,具体包括:
通过对步骤4得到的用户集进行取交集或取差集的方式计算并验证所述用户集;取交集时,同分类下冲突标签舍弃,不冲突标签取出现频次最高的,其余标签合并,取差集时,同分类下冲突标签取较小值,其余标签合并;取交集计算后得到标签及其对应的用户集,并将取交集计算后得到的用户集的标签设置为取交集计算后得到的标签。
2.根据权利要求1所述的智能电视端探测用户画像标签的方法,其特征在于,步骤1中,所述标签规范具体包括:专题属性、电视属性和家庭属性。
3.根据权利要求1所述的智能电视端探测用户画像标签的方法,其特征在于,在步骤3中,根据专题排期及时间轴构建探测专题内容矩阵,设智能电视一屏垂直方向有M个专题位置,记N为一个专题探测周期所需的专题数量,将该探测周期在智能设备上推出的专题内容形成一个M*N矩阵,并将专题及对应的专题标签存储。
4.根据权利要求3所述的智能电视端探测用户画像标签的方法,其特征在于,N大于等于3。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011567942.XA CN112637684B (zh) | 2020-12-25 | 2020-12-25 | 智能电视端探测用户画像标签的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011567942.XA CN112637684B (zh) | 2020-12-25 | 2020-12-25 | 智能电视端探测用户画像标签的方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112637684A CN112637684A (zh) | 2021-04-09 |
CN112637684B true CN112637684B (zh) | 2022-02-01 |
Family
ID=75325412
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011567942.XA Active CN112637684B (zh) | 2020-12-25 | 2020-12-25 | 智能电视端探测用户画像标签的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112637684B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116017070B (zh) * | 2022-12-01 | 2024-04-12 | 四川长虹电器股份有限公司 | 基于运营策略提升电视主页点击率的方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112035742A (zh) * | 2020-08-28 | 2020-12-04 | 康键信息技术(深圳)有限公司 | 用户画像生成方法、装置、设备及存储介质 |
CN112040318A (zh) * | 2020-08-21 | 2020-12-04 | 广州欢网科技有限责任公司 | 个性化节目单推荐方法、装置、存储介质和电子设备 |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8387094B1 (en) * | 2009-04-09 | 2013-02-26 | Tp Lab, Inc. | Method and system to automatically select data network videos as television shows based on a persona |
EP2718890A4 (en) * | 2011-06-06 | 2014-11-05 | Nfluence Media Inc | CONSUMER-CONTROLLED ADVERTISING SYSTEM |
CN108269107B (zh) * | 2016-12-30 | 2021-12-14 | 阿里巴巴集团控股有限公司 | 用户信息处理方法及装置 |
CN109429103B (zh) * | 2017-08-25 | 2021-08-13 | Tcl科技集团股份有限公司 | 推荐信息的方法、装置及计算机可读存储介质、终端设备 |
CN109874032B (zh) * | 2019-03-07 | 2021-06-22 | 四川长虹电器股份有限公司 | 智能电视的节目专题个性化推荐系统与方法 |
CN110351580B (zh) * | 2019-07-12 | 2021-07-13 | 四川长虹电器股份有限公司 | 基于非负矩阵分解的电视节目专题推荐方法及系统 |
CN111178950B (zh) * | 2019-12-19 | 2023-08-29 | 车智互联(北京)科技有限公司 | 一种用户画像构建方法、装置及计算设备 |
CN111400599A (zh) * | 2020-03-17 | 2020-07-10 | 苏宁金融科技(南京)有限公司 | 一种用户群画像生成方法、装置及系统 |
CN111861550B (zh) * | 2020-07-08 | 2023-09-08 | 上海视九信息科技有限公司 | 一种基于ott设备的家庭画像构建方法及系统 |
-
2020
- 2020-12-25 CN CN202011567942.XA patent/CN112637684B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112040318A (zh) * | 2020-08-21 | 2020-12-04 | 广州欢网科技有限责任公司 | 个性化节目单推荐方法、装置、存储介质和电子设备 |
CN112035742A (zh) * | 2020-08-28 | 2020-12-04 | 康键信息技术(深圳)有限公司 | 用户画像生成方法、装置、设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN112637684A (zh) | 2021-04-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Gaw | Algorithmic logics and the construction of cultural taste of the Netflix Recommender System | |
Kim et al. | The influence of authenticity of online reviews on trust formation among travelers | |
Hayward et al. | Neither/nor: The rejection of unionist and nationalist identities in post-agreement Northern Ireland | |
Brady et al. | Hierarchical encoding in visual working memory: Ensemble statistics bias memory for individual items | |
Hussain et al. | Exploring the dominant features of social media for depression detection | |
Yuan et al. | Analyzing of user attitudes toward intention to use social media for learning | |
Goldberg | Mapping shared understandings using relational class analysis: The case of the cultural omnivore reexamined | |
Owens et al. | Black and Hispanic immigrants’ resilience against negative-ability racial stereotypes at selective colleges and universities in the United States | |
Beer | Genre, boundary drawing and the classificatory imagination | |
Zhao et al. | The rise of fashion informatics: A case of data-mining-based social network analysis in fashion | |
O’Halloran et al. | Interactive software for multimodal analysis | |
Lobinger et al. | Likable, funny or ridiculous? A Q-sort study on audience perceptions of visual portrayals of politicians | |
Willson | Raising the ideal child? Algorithms, quantification and prediction | |
Kodagoda et al. | Using machine learning to infer reasoning provenance from user interaction log data: based on the data/frame theory of sensemaking | |
Birkelund | Stratification and segregation | |
Soriano et al. | Platforms, alternative influence, and networked political brokerage on YouTube | |
CN112637684B (zh) | 智能电视端探测用户画像标签的方法 | |
Lotfi et al. | Storytelling with image data: A systematic review and comparative analysis of methods and tools | |
Chaudhury et al. | Multimedia ontology: representation and applications | |
Clay et al. | Young children make their gestural communication systems more language-like: Segmentation and linearization of semantic elements in motion events | |
Roshchina | TWIN: Personality-based Recommender System | |
Coletti et al. | Science communication on social media: Examining cross-platform behavioral engagement | |
Psallidas et al. | Video summarization based on feature fusion and data augmentation | |
Mahalle et al. | Foundations of data science for engineering problem solving | |
Jang et al. | Knowledge of automated journalism moderates evaluations of algorithmically generated news |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |