CN105045859A - 一种智能设备的用户特征分析方法及装置 - Google Patents

一种智能设备的用户特征分析方法及装置 Download PDF

Info

Publication number
CN105045859A
CN105045859A CN201510404809.5A CN201510404809A CN105045859A CN 105045859 A CN105045859 A CN 105045859A CN 201510404809 A CN201510404809 A CN 201510404809A CN 105045859 A CN105045859 A CN 105045859A
Authority
CN
China
Prior art keywords
content
user
time period
topic
smart machine
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201510404809.5A
Other languages
English (en)
Inventor
雷鹏
曹叶文
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hisense Group Co Ltd
Original Assignee
Hisense Group Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hisense Group Co Ltd filed Critical Hisense Group Co Ltd
Priority to CN201510404809.5A priority Critical patent/CN105045859A/zh
Publication of CN105045859A publication Critical patent/CN105045859A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明实施例公开了一种智能设备的用户特征分析方法及装置。该方法包括:根据至少一天的同一时间段内智能设备提供的针对各个内容的执行动作的次数,以及各个内容在多个内容主题上的分布概率,得到用户在所述时间段对多个内容主题的兴趣程度的量化值;将满足预设条件的量化值对应的内容主题作为用户特征保存。不同用户感兴趣的内容不同,且一天中不同的时间段,使用智能设备的用户也不同。本发明实施例提供了分时间段分析用户特征的技术方案,即分析某时间段中,用户对哪些内容主题感兴趣。根据本发明实施例提供的分析结果,根据某时间段内用户特征,为用户推荐感兴趣的内容,提高了推荐的准确性,且还可以为用户提供其它个性化服务。

Description

一种智能设备的用户特征分析方法及装置
技术领域
本发明涉及用户特征分析技术领域,尤其涉及一种智能设备的用户特征分析方法及装置。
背景技术
大数据时代,人们可以获得和接触的内容(例如影片、应用软件、游戏、广告等等)越来越多,但找到自己需要的内容所花费的时间也越来越多。互联网规模的迅速增长带来了内容超载的问题,过量内容同时呈现使得用户无法便捷快速地获取自己感兴趣的内容,使其使用效率降低。现在的互联网应用中,越来越多的智能推荐系统被开发出来并获得广大用户的信赖和使用。
现在的一种推荐内容的方式是将浏览历史记录作为推荐依据。但对于多个用户共用的智能设备,不同的用户感兴趣的内容也不同。如果根据浏览历史记录中的内容推荐,可能会出现当一个用户使用智能设备时推荐的内容是上一个用户感兴趣的内容。
发明内容
本发明实施例的目的是提供一种智能设备的用户特征分析方法及装置,用于解决为用户推荐的内容不是该用户感兴趣的内容的需求的问题。
本发明实施例的目的是通过以下技术方案实现的:
一种智能设备的用户特征分析方法,包括:
根据至少一天的同一时间段内智能设备上的针对各个内容的执行动作的次数,以及所述各个内容在多个内容主题上的分布概率,得到用户在所述时间段对多个内容主题的兴趣程度的量化值;
将满足预设条件的量化值对应的内容主题作为用户特征保存。
一种智能设备的用户特征分析装置,包括:
量化值获取模块,用于:根据至少一天的同一时间段内智能设备提供的针对各个内容的执行动作的次数,以及所述各个内容在多个内容主题上的分布概率,得到用户在所述时间段对多个内容主题的兴趣程度的量化值;
用户特征确定模块,用于:将满足预设条件的量化值对应的内容主题作为用户特征保存。
不同用户感兴趣的内容不同,且一天中的不同的时间段,使用智能设备的用户也不同。本发明实施例提供了分时间段分析用户特征的技术方案,即分析某时间段中,用户对哪些内容主题感兴趣。那么,在后续应用(例如智能推荐)中,就可以根据本发明实施例提供的分析结果,根据某时间段内用户特征,为用户推荐感兴趣的内容,提高了推荐的准确性。应当指出的是,本发明实施例得到的分析结果还可以用于为用户提供其它个性化的服务。进一步的,发明人在实现本发明的过程中发现,内容的执行动作次数(例如,节目的播放次数、游戏被打开的次数等等),以及内容在内容主题上的分布概率,都能够反映用户对内容主题感兴趣的程度。因此,本发明实施例提供的技术方案,根据至少一天的同一时间段内智能设备提供的针对各个内容的执行动作的次数,以及各个内容在多个内容主题上的分布概率,得到用户在时间段对多个内容主题的兴趣程度的量化值,并将其中满足预设条件的量化值对应的内容主题作为用户特征保存,提高用户特征分析的准确性。
附图说明
图1为本发明实施例提供的一种智能设备的用户特征分析方法流程图;
图2为本发明实施例提供的另一种智能设备的用户特征分析方法流程图;
图3为本发明实施例提供的一种智能设备的用户特征分析装置示意图;
图4为本发明实施例提供的另一种智能设备的用户特征分析装置示意图。
具体实施方式
本发明实施例中,基于时间段进行用户特征分析,即分析具体某个时间段内的用户特征。首先,对时间段的划分进行说明:
一天当中,不同用户对智能设备的使用是分时段的。本发明实施例中,对一天当中的时间段的划分可以采用人为划分的方式,也可以采用基于算法的自动划分方式。无论采用人为还是自动划分,对时间段的划分依据可以是不同用户的作息习惯的差别。例如,可以按照作息时间进行划分,将一天24时进行如下的时间段划分:6点~11点,11点~14点,14点~17点,17点~19点,19点~21点,21点~23点,23点~6点;或者也可以按照上午、下午两个时间段对一天24小时进行时间段划分。本发明实施例中,根据不同需求,可以关注一天当中的所有时间段,也可以仅关注目标时间段,例如仅关注晚上19点~21点这一黄金时间段。
由于周一~周五通常为工作日,对智能设备的使用时间具有相同或相似的规律。那么,本发明实施例中,可以是对工作日的一天中的时间段进行用户特征分析,相应的,可以利用一周当中周一~周五至少一天的同一时间段的数据进行分析,也可以利用至少两周当中周一~周五至少一天的同一时间段的数据进行分析,还可以利用至少两周当中同一天(例如周一)的同一时间段的数据进行分析。对于周六和周日,如果也存在智能设备使用时间的规律,也可以参照上述时间划分方式。
本发明实施例中,用户特征可以通过用户感兴趣的内容主题表示,而用户感兴趣的内容主题与智能设备在所针对的时间段内的提供的内容有关。以下对内容及内容主题进行说明:
智能设备中提供的一个内容可以是一部影片,可以是一个电视剧,可以是一档综艺节目,可以是一款游戏,可以是一个应用软件,可以是一个广告,可以是一件商品,等等。
对内容按照不同的分类标准进行划分得到的内容主题。例如,电视剧、影片、综艺节目等视频相关的内容为同一类型的内容,对视频相关的内容按照电视剧、影片、综艺节目等划分得到的内容主题为同一类内容主题。例如,视频相关的内容、游戏相关的内容、购物相关的内容等为不同类的内容,对内容按照视频、游戏、购物等进行划分得到的内容主题为不同类的内容主题。在对用户特征进行分析的过程中,可以仅对某一类的内容主题进行用户特征分析,也可以对某几类的内容主题进行用户特征分析,并且,可以不关注是否为同一类的内容主题,可以对电视剧、游戏、购物这几个内容主题进行用户分析。
下面结合附图和实施例对本发明提供的一种智能设备的用户特征分析方法及装置进行更详细地说明。
如图1所示,本发明实施例提供一种智能设备的用户特征分析方法,其具体实现方式如下:
步骤110:根据至少一天的同一时间段内智能设备上的针对各个内容的执行动作的次数,以及各个内容在多个内容主题上的分布概率,得到用户在该时间段对多个内容主题的兴趣程度的量化值。
其中,针对内容的执行动作可以是打开内容、下载内容、收藏内容等。
步骤120:将满足预设条件的量化值对应的内容主题作为用户特征保存。
其中,预设条件可以是大于一个预设量化值,预设量化值可以根据经验值设定;预设条件也可以设置量化值大小排名在预设名次内,例如可以设置量化值大小排名在前3名的满足预设条件。
不同用户感兴趣的内容不同,且一天中的不同的时间段,使用智能设备的用户也不同。本发明实施例提供了分时间段分析用户特征的技术方案,即分析某时间段中,用户对哪些内容主题感兴趣。那么,在后续应用(例如智能推荐)中,就可以根据本发明实施例提供的分析结果,根据某时间段内用户特征,为用户推荐感兴趣的内容,提高了推荐的准确性。应当指出的是,本发明实施例得到的分析结果还可以用于为用户提供其它个性化的服务。进一步的,发明人在实现本发明的过程中发现,内容的执行动作次数(例如,节目的播放次数、游戏被打开的次数等等),以及内容在内容主题上的分布概率,都能够反映用户对内容主题感兴趣的程度。因此,本发明实施例提供的技术方案,根据至少一天的同一时间段内智能设备提供的针对各个内容的执行动作的次数,以及各个内容在多个内容主题上的分布概率,得到用户在时间段对多个内容主题的兴趣程度的量化值,并将其中满足预设条件的量化值对应的内容主题作为用户特征保存,提高用户特征分析的准确性。
可选的,步骤110中,用户在该时间段对每个内容主题的兴趣程度的量化值如以下公式所示:
Σ n = 1 n = N c n C × p n , m - - - ( 1 )
其中,N表示至少一天的同一时间段内智能设备提供的内容的总个数,N为正整数;n表示N个内容中的一个;C表示至少一天的同一时间段内智能设备提供的针对各个内容的执行动作的总次数;cn表示至少一天的同一时间段内智能设备提供的其中一个内容的执行动作的次数;pn,m表示其中一个内容n在内容主题m上的分布概率,m表示多个内容主题中的一个。
针对一个内容的执行动作的次数越多,说明用户对该内容越感兴趣。由于每个内容中包含的具体信息可能与多个主题内容相关,只是相关程度不同,因此,每个内容在多个内容主题上有不同的分布概率,与内容主题相关程度较大的分布概率较大。因此,以各个内容在内容主题上的分布概率pn,m为基础,结合该内容的执行动作次数cn在该时间段内针对各个内容的执行动作的总次数C中的比例,按照上述公式(1)就可以反映用户对一个内容主题的兴趣程度。
通过上述公式(1)可以看,在分析过程中,由于C表示至少一天的同一时间段内智能设备提供的针对各个内容的执行动作的总次数,计算每个内容主题的兴趣程度的量化值时,该时间段内针对各个内容的执行动作的总次数C是一样的,因此,公式(1)中C的取值并不会影响最后的分析结果,为了提高处理效率,用户在时间段对每个内容主题的兴趣程度的量化值如以下公式所示:
Σ n = 1 n = N c n × p n , m - - - ( 2 )
其中,N表示至少一天的同一时间段内智能设备提供的内容的总个数,N为正整数;n表示N个内容中的一个;cn表示至少一天的同一时间段内智能设备提供的其中一个内容的执行动作的次数;pn,m表示其中一个内容n在内容主题m上的分布概率,m表示多个内容主题中的一个。
可选的,上述各个实施例中,每个内容在每个内容主题上的分布概率是通过主题模型计算得到的。例如,可以通过潜在狄利克雷分布(LatentDirichletAllocation,LDA)主题模型计算得到。
应当指出的是,上述各个实施例中,可以定期对用户特征进行分析,例如,可以每周分析一次,也可以固定几周分析一次,等等,保证用户特征的实时性和有效性。每个内容在每个内容主题上的分布概率可以是预先计算好的,每次分析时,都直接去获取即可。或者,每次分析时,都重新计算每个内容在每个内容主题上的分布概率。
按照上述实施例分析出用户特征后,可以根据不同的用户特征在用户活跃的时间段为用户提供更贴切的服务。例如,对用户特征为电视剧、影片、购物、美容内容的用户提供相关的推荐服务,等等。当然也可以按照各个内容主题的量化值的大小在用户活跃的时间段为用户提供相应的服务。例如,可以对各个内容主题的量化值进行排序,对排名靠前的内容主题中的内容向用户推荐,等等。
不同的用户感兴趣的内容主题不同,例如幼儿对动漫等相关的内容主题感兴趣,老人对养生、抗战等相关的内容主题感兴趣,成人对时尚、健身等相关的内容主题感兴趣,等等。
可选的,上述各个实施例中,分析出用户特征后,还可以根据用户特征确定用户类型,并保存确定的用户类型。例如,用户类型可以按照不同的年龄段划分为幼儿、少年、成人、老人,进一步的,还可以按照性别不同对成人进一步划分为成年男性和成年女性,或者可以按照生活习惯划分为运动型、居家型等等。
例如,用户特征为电视剧、古装剧和明星类的划分为成年女性。用户特征为电视剧、动漫、幼儿教育的划分为幼儿。
对用户分类后,除了为用户推荐内容主题相关的内容外,还可以根据用户类型提供更多其它的服务。例如,可以用于智能推荐,假设最终分析得到的用户特征由电视剧、古装剧和明星类构成,相应的用户类型为成年女性。则可以针对成年女性的特征,进一步为其推荐符合其年龄、身份特点的广告商品等。又例如,根据分析得到的用户特征确定用户类型为成年女性,那么,可以将这一用户类型样本作为其他大数据分析的依据,例如医疗分析、性格分析、心理分析等等。
上述各个实施例中,步骤110具体实现时,还可以根据至少一天的同一时间段内智能设备上的针对同一类内容主题的各个内容的执行动作的次数,以及各个内容在同一类的多个内容主题上的分布概率,得到用户在该时间段对同一类的多个内容主题的兴趣程度的量化值。
例如,按照上述方式,在一次用户特征分析中,仅针对视频这一类的内容主题进行用户特征分析。当然,也可以针对不是同一类的内容主题进行分析,如对包括视频、游戏这两类的内容主题进行分析。
应当指出的是,上述各个实施例中,不仅可以针对电视的用户特征进行分析,也可以对计算机等其它智能设备的用户进行特征分析。
下面以对电视的用户特征进行分析为例,对本发明实施例提供的一种智能设备的用户特征分析方法进行更加详细地说明,如图2所示。
本发明实施例中,可以利用LDA主题模型得到每个内容在每个内容主题上的分布概率。下面举例对其具体实现方式进行说明。
对多个内容分别进行分词,得到关键词,根据得到的关键词利用LDA主题模型生成内容主题。并得到每个内容在每个内容主题上的分布概率。
以一个内容为一部影片为例,对内容分词得到关键词的过程进行说明。
影片的名称为聪明的一休,获取该影片的信息如下:
标题(title):聪明的一休。
简介(Summary):本片讲述一休用自己的机智和勇气帮助那些贫困的人,教训那些仗势欺人的人,给人留下了很深的印象。
标签(Tag):[日本,动漫,日韩动画,幼儿,矢吹公郎,石黒育,一休,藤田淑子,山田俊司,野田圭一,桂玲子,吉田理保子,聪明,益智,情感,励志]。
对获取的影片信息中的标题和简介进行分词,可以得到其中的动词、名词、形容词、副词、时间词和地点词等等。分词的目的是将分词结果作为LDA的输入,作为LDA主题模型的的训练输入向量。分词后得到如下影片信息:
title:聪明/
Summary:讲述/机智/勇气/帮助/贫困/教训/仗势欺人/留下/印象/
Tag:[日本,动漫,日韩动画,幼儿,矢吹公郎,石黒育,一休,藤田淑子,山田俊司,野田圭一,桂玲子,吉田理保子,聪明,益智,情感,励志]。
将分词后得到的关键词转化为LDA主题模型的学习输入格式:
[日本][动漫][日韩动画][幼儿][矢吹公郎][石黒育][一休][藤田淑子][山田俊司][野田圭一][桂玲子][吉田理保子][聪明][益智][情感][励志][聪明][讲述][机智][勇气][贫困][教训][仗势欺人][留下][印象]
对其它的内容也按照上述方式分词得到关键词。
将上述得到的多个内容的关键词作为LDA主题模型的输入向量,LDA根据学习输入向量,进行迭代运算,生成内容主题。这一过程中,主要是对输入向量进行分类,每个分类结果作为一个内容主题。以动漫主题为例,分类后,以下关键词被分为一类,构成动漫主题:动漫、动画、国产动画、故事、冒险、中国大陆、朋友、大陆、世界、动画电影、讲述、一起、宝贝、幼儿、童话、生活、快乐、动画片、益智和亲子。仍以“聪明的一休”这一内容为例,LDA主题模型计算该内容在动漫这一主题上的分布概率的原理如下:得到这一内容包含的关键词属于动漫这一内容主题的数量,具体的,这一内容包含的动漫、幼儿、讲述和益智这4个关键词属于动漫主题,并分别得到这一内容包含的关键词属于其他各内容主题的数量;根据得到的数量信息计算内容在内容主题上的分布概率。
最后,得到上述影片在战争、新闻、电视剧、青春爱情、纪实片、惊悚、文艺生活、古装剧、体育、动漫、小品相声、日韩、科幻、记录片、晚会、家庭生活剧、幼儿教育、欧美电影、明星类这些内容主题上的分布概率如下:0.0145,0.0145,0.1014,0.0145,0.0145,0.0145,0.0145,0.0145,0.0435,0.3333,0.0435,0.1594,0.0145,0.0145,0.0145,0.0435,0.1014,0.0145,0.0145。可以看出,第3个概率值0.1014、第10个概率值0.3333、第12个概率值0.1594和第17个概率值0.1014相对较大,相对应的内容主题分别是电视剧、动漫、日韩和幼儿教育,说明该影片与这些概率值对应的内容主题的相关联程度较大。
按照上述方式对电视上的各个内容计算在各个内容主题上的分布概率,以供后续用户特征分析中使用。
本实施例中的内容主题为同一类,多个内容主题为电视剧、动漫、古装剧、明星类等等。将一天24时进行如下的时间段划分:6点~11点,11点~14点,14点~17点,17点~19点,19点~21点,21点~23点,23点~6点,分别针对这些时段进行分析。
下面以19点~21点为例,对用户特征分析方法进行详细说明:
步骤210:根据一周的周一~周五的19点~21点这一时间段内电视上的针对各个电视节目的播放次数,以及电视节目在多个内容主题上的分布概率,按照上述公式(1)计算电视用户在周一~周五的19点~21点这一时间段对每个内容主题的兴趣程度的量化值。
例如,按照该步骤得到的电视用户对战争、新闻、电视剧、青春爱情、纪实片、惊悚、文艺生活、古装剧、体育、动漫、小品相声、日韩、科幻、记录片、晚会、家庭生活剧、幼儿教育、欧美电影、明星类这些内容主题的兴趣程度的量化值为:
0.01369,0.01369,0.19333,0.04014,0.02864,0.01369,0.01369,0.26823,0.01369,0.04590,0.013690,0.02289,0.01369,0.02059,0.01369,0.01369,0.02289,0.01369,0.22091。
步骤220:将大于或者等于预设量化值的量化值对应的内容主题作为用户特征保存。
对于上述步骤210中的举例,可以设置预设量化值为0.1。那么,将0.19333,0.26823和0.22091对应的内容主题作为用户特征保存。如果这三个内容主题分别为电视剧、古装剧和明星类,可以分析该用户类别为成年女性。
根据按照上述步骤得到的用户特征为用户提供相关的服务,例如,电视节目推荐,具体的,如果电视在20点被打开,可以根据上述分析结果,将符合用户特征的内容主题中的电视节目向用户推荐。
基于同样的发明构思,本发明实施例提供一种智能设备的用户特征分析装置,如图3所示,包括量化值获取模块301和用户特征确定模块302。
量化值获取模块301,用于:根据至少一天的同一时间段内智能设备上的针对各个内容的执行动作的次数,以及各个内容在多个内容主题上的分布概率,得到用户在该时间段对多个内容主题的兴趣程度的量化值;
用户特征确定模块302,用于:将满足预设条件的量化值对应的内容主题作为用户特征保存。
可选的,量化值获取模块301具体用于:
用户在该时间段对每个内容主题的兴趣程度的量化值如以下公式所示:
Σ n = 1 n = N c n C × p n , m ; - - - ( 1 ) 或者
Σ n = 1 n = N c n × p n , m - - - ( 2 ) ;
其中,N表示至少一天的同一时间段内智能设备提供的内容的总个数,N为正整数;n表示N个内容中的一个;C表示至少一天的同一时间段内智能设备提供的针对各个内容的执行动作的总次数;cn表示至少一天的同一时间段内智能设备提供的其中一个内容的执行动作的次数;pn,m表示其中一个内容n在内容主题m上的分布概率,m表示多个内容主题中的一个。
可选的,每个内容在每个内容主题上的分布概率是通过主题模型计算得到的。
可选的,如图4所示,该装置还包括:
用户分类模块303,用于:根据用户特征确定用户类型,并保存确定的用户类型。
可选的,量化值获取模块301,具体用于:
根据至少一天的同一时间段内智能设备上的针对同一类内容主题的各个内容的执行动作的次数,以及各个内容在同一类的多个内容主题上的分布概率,得到用户在该时间段对同一类的多个内容主题的兴趣程度的量化值。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (10)

1.一种智能设备的用户特征分析方法,其特征在于,包括:
根据至少一天的同一时间段内智能设备上的针对各个内容的执行动作的次数,以及所述各个内容在多个内容主题上的分布概率,得到用户在所述时间段对多个内容主题的兴趣程度的量化值;
将满足预设条件的量化值对应的内容主题作为用户特征保存。
2.根据权利要求1所述的方法,其特征在于,所述用户在所述时间段对每个内容主题的兴趣程度的量化值如以下公式所示:
Σ n = 1 n = N c n C × p n , m ; 或者
Σ n = 1 n = N c n × p n , m ;
其中,N表示至少一天的同一时间段内智能设备提供的内容的总个数,N为正整数;n表示所述N个内容中的一个;C表示至少一天的同一时间段内智能设备提供的针对各个内容的执行动作的总次数;cn表示至少一天的同一时间段内智能设备提供的其中一个内容的执行动作的次数;pn,m表示其中一个内容n在内容主题m上的分布概率,m表示多个内容主题中的一个。
3.根据权利要求1或2所述的方法,其特征在于,每个内容在每个内容主题上的分布概率是通过主题模型计算得到的。
4.根据权利要求1或2所述的方法,其特征在于,还包括:
根据用户特征确定用户类型,并保存确定的用户类型。
5.根据权利要求1或2所述的方法,其特征在于,根据至少一天的同一时间段内智能设备上的针对各个内容的执行动作的次数,以及所述各个内容在多个内容主题上的分布概率,得到用户在所述时间段对多个内容主题的兴趣程度的量化值,包括:
根据至少一天的同一时间段内智能设备上的针对同一类内容主题的各个内容的执行动作的次数,以及所述各个内容在同一类的多个内容主题上的分布概率,得到用户在所述时间段对同一类的多个内容主题的兴趣程度的量化值。
6.一种智能设备的用户特征分析装置,其特征在于,包括:
量化值获取模块,用于:根据至少一天的同一时间段内智能设备提供的针对各个内容的执行动作的次数,以及所述各个内容在多个内容主题上的分布概率,得到用户在所述时间段对多个内容主题的兴趣程度的量化值;
用户特征确定模块,用于:将满足预设条件的量化值对应的内容主题作为用户特征保存。
7.根据权利要求6所述的装置,其特征在于,所述用户在所述时间段对每个内容主题的兴趣程度的量化值如以下公式所示:
Σ n = 1 n = N c n C × p n , m ; 或者
Σ n = 1 n = N c n × p n , m ;
其中,N表示至少一天的同一时间段内智能设备提供的内容的总个数,N为正整数;n表示所述N个内容中的一个;C表示至少一天的同一时间段内智能设备提供的针对各个内容的执行动作的总次数;cn表示至少一天的同一时间段内智能设备提供的其中一个内容的执行动作的次数;pn,m表示其中一个内容n在内容主题m上的分布概率,m表示多个内容主题中的一个。
8.根据权利要求6或7所述的装置,其特征在于,每个内容在每个内容主题上的分布概率是通过主题模型计算得到的。
9.根据权利要求6或7所述的装置,其特征在于,还包括:
用户分类模块,用于:根据用户特征确定用户类型,并保存确定的用户类型。
10.根据权利要求6或7所述的装置,其特征在于,所述量化值获取模块,具体用于:
根据至少一天的同一时间段内智能设备上的针对同一类内容主题的各个内容的执行动作的次数,以及所述各个内容在同一类的多个内容主题上的分布概率,得到用户在所述时间段对同一类的多个内容主题的兴趣程度的量化值。
CN201510404809.5A 2015-07-10 2015-07-10 一种智能设备的用户特征分析方法及装置 Pending CN105045859A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510404809.5A CN105045859A (zh) 2015-07-10 2015-07-10 一种智能设备的用户特征分析方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510404809.5A CN105045859A (zh) 2015-07-10 2015-07-10 一种智能设备的用户特征分析方法及装置

Publications (1)

Publication Number Publication Date
CN105045859A true CN105045859A (zh) 2015-11-11

Family

ID=54452406

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510404809.5A Pending CN105045859A (zh) 2015-07-10 2015-07-10 一种智能设备的用户特征分析方法及装置

Country Status (1)

Country Link
CN (1) CN105045859A (zh)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105516810A (zh) * 2015-12-04 2016-04-20 山东大学 一种基于lda模型的电视用户家庭成员分析方法
CN106649267A (zh) * 2016-11-30 2017-05-10 北京邮电大学 一种通过文本主题挖掘推测用户大五人格的方法及系统
WO2017162070A1 (zh) * 2016-03-25 2017-09-28 阿里巴巴集团控股有限公司 一种业务对象的分时推荐方法和系统
WO2018023671A1 (zh) * 2016-08-05 2018-02-08 吴晓敏 兴趣识别技术的使用数据采集方法和识别系统
WO2018023672A1 (zh) * 2016-08-05 2018-02-08 吴晓敏 地点匹配用户兴趣时的信息推送方法和识别系统
WO2018023685A1 (zh) * 2016-08-05 2018-02-08 吴晓敏 一种识别用户兴趣的方法和识别系统
WO2018023674A1 (zh) * 2016-08-05 2018-02-08 吴晓敏 根据地点推送内容技术的数据采集方法和推荐系统
WO2018023673A1 (zh) * 2016-08-05 2018-02-08 吴晓敏 一种根据地点识别用户兴趣的方法和识别系统
CN109408670A (zh) * 2018-10-23 2019-03-01 聚好看科技股份有限公司 基于主题模型的家庭成员属性预测方法、装置及智能终端
CN109636481A (zh) * 2018-12-19 2019-04-16 未来电视有限公司 面向家庭用户的用户画像构建方法及装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103297853A (zh) * 2013-06-07 2013-09-11 华东师范大学 一种基于多用户上下文识别的iptv节目推荐方法
CN103313108A (zh) * 2013-06-14 2013-09-18 山东科技大学 一种基于情景感知的智能电视节目推荐方法
CN104050298A (zh) * 2014-07-04 2014-09-17 成都品果科技有限公司 一种基于lda主题模型算法的用户细分方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103297853A (zh) * 2013-06-07 2013-09-11 华东师范大学 一种基于多用户上下文识别的iptv节目推荐方法
CN103313108A (zh) * 2013-06-14 2013-09-18 山东科技大学 一种基于情景感知的智能电视节目推荐方法
CN104050298A (zh) * 2014-07-04 2014-09-17 成都品果科技有限公司 一种基于lda主题模型算法的用户细分方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
孙雨生等: "国内用户兴趣建模研究进展", 《情报杂志》 *
阮光册: "基于LDA的网络评论主题发现研究", 《情报杂志》 *

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105516810A (zh) * 2015-12-04 2016-04-20 山东大学 一种基于lda模型的电视用户家庭成员分析方法
WO2017162070A1 (zh) * 2016-03-25 2017-09-28 阿里巴巴集团控股有限公司 一种业务对象的分时推荐方法和系统
WO2018023671A1 (zh) * 2016-08-05 2018-02-08 吴晓敏 兴趣识别技术的使用数据采集方法和识别系统
WO2018023672A1 (zh) * 2016-08-05 2018-02-08 吴晓敏 地点匹配用户兴趣时的信息推送方法和识别系统
WO2018023685A1 (zh) * 2016-08-05 2018-02-08 吴晓敏 一种识别用户兴趣的方法和识别系统
WO2018023674A1 (zh) * 2016-08-05 2018-02-08 吴晓敏 根据地点推送内容技术的数据采集方法和推荐系统
WO2018023673A1 (zh) * 2016-08-05 2018-02-08 吴晓敏 一种根据地点识别用户兴趣的方法和识别系统
CN106649267A (zh) * 2016-11-30 2017-05-10 北京邮电大学 一种通过文本主题挖掘推测用户大五人格的方法及系统
CN109408670A (zh) * 2018-10-23 2019-03-01 聚好看科技股份有限公司 基于主题模型的家庭成员属性预测方法、装置及智能终端
CN109636481A (zh) * 2018-12-19 2019-04-16 未来电视有限公司 面向家庭用户的用户画像构建方法及装置

Similar Documents

Publication Publication Date Title
CN105045859A (zh) 一种智能设备的用户特征分析方法及装置
CN103338403B (zh) 广播电视系统及该系统中的个性节目推荐方法
CN111784455A (zh) 一种物品推荐方法及推荐设备
CN110532479A (zh) 一种信息推荐方法、装置及设备
CN109376844A (zh) 基于云平台和模型推荐的神经网络自动训练方法和装置
CN111178970B (zh) 广告投放的方法及装置、电子设备和计算机可读存储介质
CN104991966A (zh) 媒体内容排序方法及系统
CN107341272A (zh) 一种推送方法、装置和电子设备
CN106851349A (zh) 基于海量跨屏收视行为数据的直播推荐方法
CN113742567B (zh) 一种多媒体资源的推荐方法、装置、电子设备及存储介质
CN112100221B (zh) 一种资讯推荐方法、装置、推荐服务器及存储介质
CN104423945A (zh) 一种信息处理方法及电子设备
CN111597446B (zh) 基于人工智能的内容推送方法、装置、服务器和存储介质
Aryal et al. MoocRec: Learning styles-oriented MOOC recommender and search engine
CN111612588A (zh) 商品呈现方法及装置、计算设备、计算机可读存储介质
CN110321483A (zh) 一种基于用户序列性行为的在线课程平台内容推荐方法、装置、系统及存储介质
CN112269943B (zh) 一种信息推荐系统及方法
CN116821516B (zh) 资源推荐方法、装置、设备及存储介质
CN116089745A (zh) 信息推荐方法、装置、电子设备及计算机可读存储介质
Zhang et al. Implementing fuzzy logic to generate user profile in decisional DNA television: The concept and initial case study
CN111460267B (zh) 对象识别方法、装置和系统
CN111242239B (zh) 一种训练样本选取方法、装置、以及计算机存储介质
CN112016962A (zh) 推送方法、装置、电子设备和计算机可读存储介质
CN112989174A (zh) 信息推荐方法及装置、介质和设备
KR102559449B1 (ko) 무료 학습 큐레이션 서비스를 제공하는 서버 및 방법

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20151111

RJ01 Rejection of invention patent application after publication