CN104933134A - 一种用户特征的分析方法及装置 - Google Patents
一种用户特征的分析方法及装置 Download PDFInfo
- Publication number
- CN104933134A CN104933134A CN201510325790.5A CN201510325790A CN104933134A CN 104933134 A CN104933134 A CN 104933134A CN 201510325790 A CN201510325790 A CN 201510325790A CN 104933134 A CN104933134 A CN 104933134A
- Authority
- CN
- China
- Prior art keywords
- action
- interest tags
- update cycle
- time
- user
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/955—Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
Abstract
本发明公开了一种用户特征的分析方法及装置。其方法包括:周期性地确定用户的执行动作的执行时间到当前时间的时间长度;在每个兴趣标签更新周期,根据时间长度与时间衰减因子的对应关系,确定本兴趣标签更新周期内确定的所述时间长度对应的时间衰减因子;根据本兴趣标签更新周期内确定的所述时间衰减因子,确定所述执行动作的对象的兴趣标签,对象的兴趣标签反映了用户对该对象的兴趣程度;并保存本兴趣标签更新周期内确定的所述兴趣标签作为用户特征。本发明实施例提供的技术方案,作为用户特性的兴趣标签体现出用户对某对象的兴趣随时间的变化,使得分析得到的用户特性更准确、真实,提高了用户特性的可靠性。
Description
技术领域
本发明涉及数据处理技术领域,尤其涉及一种用户特征的分析方法及装置。
背景技术
随着智能化产品的推广以及海量数据的涌现,智能设备不断进军传统视听行业,提高着传统用户的使用体验,智能应用的关键是抓住用户的个性化偏好为用户带来更人性化的服务。
而如何抓住用户的个性化偏好,分析用户特征,目前还没有较好的解决方案。
发明内容
本发明的目的是提供一种用户特征的分析方法及装置,以实现对用户特性的分析,体现用户的个性化偏好。
本发明的目的是通过以下技术方案实现的:
本发明实施例的提供了一种用户特征的分析方法,包括:
周期性地确定用户的执行动作的执行时间到当前时间的时间长度;
在每个兴趣标签更新周期,根据时间长度与时间衰减因子的对应关系,确定本兴趣标签更新周期内确定的所述时间长度对应的时间衰减因子;
在每个兴趣标签更新周期,根据本兴趣标签更新周期内确定的所述时间衰减因子,确定所述执行动作的对象的兴趣标签,对象的兴趣标签反映了用户对该对象的兴趣程度;
在每个兴趣标签更新周期,保存本兴趣标签更新周期内确定的所述兴趣标签作为用户特征。
基于与方法同样的发明构思,本发明实施例还提供一种用户特征的分析装置,包括:
时间衰减因子确定模块,用于周期性地确定用户的执行动作的执行时间到当前时间的时间长度;在每个兴趣标签更新周期,根据时间长度与时间衰减因子的对应关系,确定本兴趣标签更新周期内确定的所述时间长度对应的时间衰减因子;
兴趣标签确定模块,用于在每个兴趣标签更新周期,根据本兴趣标签更新周期内确定的所述时间衰减因子,确定所述执行动作的对象的兴趣标签,对象的兴趣标签反映了用户对该对象的兴趣程度;
用户特征保存模块,用于在每个兴趣标签更新周期,保存本兴趣标签更新周期内确定的所述兴趣标签作为用户特征。
本发明实施例提供的技术方案,能够实现对用户特性的分析,体现出用户的个性化偏好。进一步的,由于周期性地确定时间衰减因子并根据时间衰减因子确定对象的兴趣标签,其中,时间衰减因子与时间长度存在对应关系,因此,确定的兴趣标签能够随时间变化,进而,作为用户特性的兴趣标签体现出用户对某对象的兴趣随时间的变化,使得分析得到的用户特性更准确、真实,提高了用户特性的可靠性。
附图说明
图1为本发明实施例提供的方法流程图;
图2为本发明实施例提供的用户特征的示意图;
图3为本发明实施提供的装置示意图。
具体实施方式
本发明实施例提供的技术方案适用于各种智能化产品,例如智能耳机设备、智能语音设备、智能电视设备等等。采用本发明实施例提供的技术方案分析出用户特性后,可以在多种智能应用中使用该用户特性。例如,可以应用于智能推荐算法,作为用户喜好规则的输入。
在对本发明实施例提供的技术方案进行详细说明之前,首先对本发明实施例中涉及到的部分概念进行说明:
用户的执行动作,是指用户对智能化产品中的应用的操作,例如收听、搜索、分享、收藏、取消收藏、删除等等;
执行动作的对象,是指用户对智能化产品中的应用的操作的作用对象,以“搜索”这一执行动作为例,其对象是搜索的具体内容;
对象的兴趣标签,反映了用户对该对象的兴趣程度,以“歌曲《默》”这一对象为例,其兴趣标签反映了用户对歌曲《默》的兴趣的程度;
执行动作的行为标签,反映了该执行动作的频度;
正反馈执行动作,表征用户对其对象感兴趣的执行动作,例如收听、搜索、分享、收藏、等等;
负反馈执行动作,表征用户对其对象不感兴趣的执行动作,例如取消收藏、删除等等;
用户特性,反映了用户在使用智能化产品时的特性,用户特性至少包括对象的兴趣标签,可选的,还包括执行动作的行为标签和/或用户的静态信息等等。
下面将结合附图,对本发明实施例提供的技术方案进行详细说明。
本发明实施例提供了一种用户特征的分析方法,如图1所示,包括如下操作:
步骤100、周期性地确定用户的执行动作的执行时间到当前时间的时间长度。
其中,步骤100的周期称作兴趣标签更新周期。
步骤110、在每个兴趣标签更新周期,根据时间长度与时间衰减因子的对应关系,确定本兴趣标签更新周期内确定的上述时间长度对应的时间衰减因子。
本发明实施例中,时间衰减因子反映了用户对执行动作的对象的兴趣随时间变化的量化值。
步骤120、在每个兴趣标签更新周期,根据本兴趣标签更新周期内确定的上述时间衰减因子,确定上述执行动作的对象的兴趣标签。
步骤130、在每个兴趣标签更新周期,保存本兴趣标签更新周期内确定的上述兴趣标签作为用户特征。
本发明实施例提供的技术方案,能够实现对用户特性的分析,体现出用户的个性化偏好。进一步的,由于周期性地确定时间衰减因子并根据时间衰减因子确定对象的兴趣标签,其中,时间衰减因子与时间长度存在对应关系,因此,确定的兴趣标签能够随时间变化,进而,作为用户特性的兴趣标签体现出用户对某对象的兴趣随时间的变化,使得分析得到的用户特性更准确、真实,提高了用户特性的可靠性。
本发明实施中,每个对象分别对应一个兴趣标签。如果在本兴趣标签更新周期之前已经保存了同一对象的兴趣标签,则可以使用本兴趣标签更新周期内确定的同一对象的兴趣标签替换掉以保存的兴趣标签,或者将本兴趣标签更新周期内确定的同一对象的兴趣标签的取值与以保存的兴趣标签的取值累加后作为该对象更新后的兴趣标签保存。
本发明实施例,预先确定了时间长度与时间衰减因子的对应关系。本发明不对该对应关系的具体确定方式进行限定,可以在实际应用时,根据经验或统计确定。例如,设定如下5个时间长度与时间衰减因子的对应关系:一周,对应时间衰减因子ε1;一个月,对应时间衰减因子ε2;三个月,对应时间衰减因子ε3;半年,对应时间衰减因子ε4;一年,对应时间衰减因子ε5。如果上述确定的时间长度在一周内,则时间衰减因子为ε1,以此类推。假设时间衰减因子的取值越小,表示该执行动作对兴趣权重的影响越小,那么,在其他条件相同的情况下,时间衰减因子取值越大,确定出的对象的兴趣权重越高;相应的,上述时间衰减因子的默认值是比上述对应关系中最小的时间衰减因子更小的取值。
本发明实施例中,上述步骤100的实现方式有多种,下面例举其中几种:
步骤100的实现方式一:
周期性地确定用户针对的上述对象的最晚的执行动作的执行时间到当前时间的时间长度。
其中,对象的最晚的执行动作,可以是保存的该对象的所有执行动作中、最后一次的执行动作;
对象的最晚的执行动作,也可以是该对象的执行时间在预定时间段内的执行动作中、最后一次的执行动作。这种情况下,如果预定时间段内没有该对象的执行动作,可以将时间衰减因子确定为默认值,也可以扩大时间范围查找用于确定时间衰减因子的执行动作。
本发明不对上述预定时间段进行限定,该时间段可以在实际应用中,根据经验或统计确定。
步骤100的实现方式二:周期性地确定用户针对上述对象的行为权重最高的执行动作的执行时间到当前时间的时间长度。
其中,执行动作的行为权重反映了该执行动作对其对象的兴趣标签的影响程度。
其中,对象的行为权重最高的执行动作,可以是保存的该对象的所有执行动作中、行为权重最高的执行动作;
对象的行为权重最高的执行动作,也可以是该对象的执行时间在预定时间段内的执行动作中、行为权重最高的执行动作。这种情况下,如果预定时间段内没有该对象的执行动作,可以将时间衰减因子确定为默认值,也可以扩大时间范围查找用于确定时间衰减因子的执行动作。
本发明不对上述预定时间段进行限定,该时间段可以在实际应用中,根据经验或统计确定。
应当指出的是,还可以结合上述两种实现方式来确定上述时间长度。
例如,判断执行时间在预定时间段内,是否有针对某对象的执行动作,如果有,确定该对象的执行时间在预定时间段内最后一次的执行动作的执行时间到当前时间的时间长度,如果没有,确定保存的该对象的所有执行动作中、行为权重最高的执行动作的执行时间到当前时间的时间长度。
应当指出的是,还有其他将上述两种实现方式结合确定上述时间长度的实现方式,本发明不再一一说明。
本发明实施例中,步骤120的实现方式也有多种,下面例举其中几种:
步骤120的实现方式一:
在每个兴趣标签更新周期,仅根据本兴趣标签更新周期内确定的上述时间衰减因子,确定该对象的兴趣标签。
该实现方式一可以与上述步骤100的任意实现方式配合实施。如果与上述步骤100的实现方式二配合实施,对象的执行动作的行为权重对该对象的兴趣标签的影响仅体现在:根据行为权重最高的执行动作的执行时间,确定时间衰减因子。
步骤120的实现方式二:
在每个兴趣标签更新周期,根据本兴趣标签更新周期内确定的上述时间衰减因子和上述对象的内容权重,确定该对象的兴趣标签。
本发明实施例中,具体如何根据时间衰减因子和对象的内容权重,确定对象的兴趣权重,其实现方式有多种。例如,将上述时间衰减因子与对象的内容权重的乘积,作为该对象的兴趣标签的取值。
其中,对象的内容权重至少是根据针对该对象的执行动作的频度确定的。
本发明并不对确定针对该对象的执行动作的频度的时间范围进行限定。该时间范围可以在实际应用中,根据经验或统计设定。例如,该时间范围是保存的所有执行动作对应的时间跨度,假设总共保存了3万条执行动作的记录,其中“搜索”的记录为2000条,搜索的对象是歌曲《默》的记录为100条,那么,针对歌曲《默》的执行动作“搜索”的频度可以表示为1/300。
本发明实施例中,对象的内容权重可以仅根据针对该对象的执行动作的频度确定,还可以根据针对该对象的执行动作的频度、以及针对该对象的相关对象的执行动作的频度确定。
其中,存在关联的对象之间,互为相关对象。本发明不对“关联”进行限定,可以在实际应用中,根据实际需要确定哪些对象之间存在关联。例如,歌曲《默》,其演唱者是A,其作为影视剧B的主题曲,那么,可以规定A和B均为歌曲《默》的相关对象,在确定歌曲《默》的内容权重时,是根据针对歌曲《默》、演唱者A和影视剧B的执行动作的频度确定的。
该实现方式二可以与上述步骤100的任意实现方式配合实施。
步骤120的实现方式三:
根据本兴趣标签更新周期内确定的上述时间衰减因子和上述执行动作的行为权重,确定该对象的兴趣标签。
其中,对执行动作的行为权重的定义,可以参照上述实施例的描述,此处不再赘述。
本发明实施例中,具体如何根据时间衰减因子和执行动作的行为权重,确定对象的兴趣标签,其实现方式有多种。例如,将上述时间衰减因子与上述执行动作的行为权重的乘积,作为该对象的兴趣标签的取值。
该实现方式三可以与上述步骤100的任意实现方式配合实施。如果与上述步骤100的实现方式二配合实施,对象的执行动作的行为权重对该对象的兴趣标签的影响不仅体现在:根据行为权重最高的执行动作的执行时间,确定时间衰减因子;还体现在:行为权重会影响兴趣标签的取值。
步骤120的实现方式四:
在每个兴趣标签更新周期,根据本兴趣标签更新周期内确定的上述时间衰减因子、上述对象的内容权重和上述执行动作的行为权重,确定该对象的兴趣标签。
其中,对执行动作的行为权重的定义,可以参照上述实施例的描述,此处不再赘述。
本发明实施例中,具体如何根据时间衰减因子、对象的内容权重和执行动作的行为权重,确定对象的兴趣标签,其实现方式有多种。例如,将上述时间衰减因子与上述对象的内容权重与上述执行动作的行为权重的乘积,作为该对象的兴趣标签的取值。又例如,确定上述时间衰减因子与上述对象的内容权重的乘积,以及上述时间衰减因子与上述执行动作的行为权重的乘积,将这两个乘积之和作为该对象的兴趣标签的取值。
该实现方式四可以与上述步骤100的任意实现方式配合实施。
发明人在实现本发明的过程中发现,并不是所有的执行动作都表示用户对该执行动作的对象感兴趣。例如,“取消收藏”、“删除”等等动作,代表了用户对这些执行动作的对象失去兴趣。那么,在确定对象的兴趣标签时,要区分正反馈执行动作和负反馈执行动作。相应的,本发明实施例中,获取执行动作后,确定该执行动作是正反馈执行动作还是负反馈执行动作。基于执行动作的分类,确定兴趣标签的实现方式又有多种,下面例举几种。
基于执行动作的分类,确定兴趣标签的实现方式一:
如果上述执行动作是正反馈执行动作,根据本兴趣标签更新周期内确定的上述时间衰减因子,确定该执行动作的对象的正反馈兴趣标签;如果上述执行动作是负反馈执行动作,根据本兴趣标签更新周期内确定的上述时间衰减因子,确定上述执行动作的对象的负反馈兴趣标签。
其中,对象的正反馈兴趣标签,体现了用户对该对象感兴趣的程度;对象的负反馈兴趣标签,体现了用户对该对象不感兴趣的程度。
其中,可以结合上述步骤120的各种实现方式确定兴趣权重。
基于执行动作的分类,确定兴趣标签的实现方式二:
正反馈执行动作和负反馈执行动作对应不同的时间衰减因子,对应不同的行为权重、和/或对应不同的内容权重。相应的,不区分正反馈兴趣标签、负反馈兴趣标签。
本发明实施例中,用户特性不仅包括对象的兴趣标签,还可以包括执行动作的行为标签,通过行为标签表现用户对不同服务的喜好。相应的,基于上述任意方法实施例,还可以周期性地根据用户的执行动作的频度,确定该执行动作的行为标签;在每个行为标签更新周期,保存本行为标签更新周期内确定的上述行为标签作为用户特征。
本发明并不对确定执行动作的频度的时间范围进行限定。该时间范围可以在实际应用中,根据经验或统计设定。例如,该时间范围是保存的所有执行动作对应的时间跨度,假设总共保存了3万条执行动作的记录,其中“搜索”的记录为2000条,那么,执行动作“搜索”的频度可以表示为1/15。
本发明实施例中,可以仅根据用户的执行动作的频度,确定该执行动作的行为标签,也可以结合执行动作的行为权重,确定该执行动作的行为标签。例如,将执行动作的频度与该执行动作的行为权重的乘积,作为该执行动作的行为标签的取值。
本发明实施例中,可以规定每个执行动作分别对应一个行为标签。即,行为标签不区分具体的对象。相应的,如果在本行为标签更新周期之前已经保存了同一执行动作的行为标签,则可以使用本行为标签更新周期内确定的同一执行动作的行为标签替换掉以保存的行为标签,或者将本行为标签更新周期内确定的同一执行动作的行为标签的取值与以保存的行为标签的取值累加后作为该执行动作更新后的行为标签保存。
本发明实施例中,也可以规定针对每个对象的每个执行动作分别对应一个行为标签。即,行为标签区分具体的对象,例如:对歌曲《默》的搜索,与对歌曲《小乌龟》的搜索,对应不同的行为标签。相应的,如果在本行为标签更新周期之前已经保存了针对同一对象的同一执行动作的行为标签,则可以使用本行为标签更新周期内确定的针对同一对象的同一执行动作的行为标签替换掉以保存的行为标签,或者将本行为标签更新周期内确定的针对同一对象的同一执行动作的行为标签的取值与以保存的行为标签的取值累加后作为针对该对象的该执行动作更新后的行为标签保存。
发明人在实现本发明的过程中还发现,不仅对象的兴趣标签、执行动作的行为标签等等这些动态信息反映了用户特性,用户的静态信息也能反映用户特性。相应的,基于上述任意方法实施例,还周期性地确定用户的以下至少一个静态信息:地域、年龄、性别、职业等等;在每个静态信息更新周期,保存本静态信息更新周期内确定的上述静态信息作为用户特征。
其中,各个静态信息的确定方式有多种,下面举例说明。
地域:确定地域的一种方式是获取用户在各种应用的注册信息中的地域信息,根据地域信息确定用户所在地域;另一种方式是获取用户所使用的智能设备的IP地址,根据该IP地址确定用户所在地域。
年龄:确定年龄的一种方式是获取用户在各种应用的注册信息中的年龄信息,根据年龄信息确定用户的年龄;另外,大多数情况下,用户对自己的同龄人更感兴趣,例如钟情于同龄的歌手,钟情于同龄的作者等等,相应的,另一种方式是根据保存的所有正反馈执行动作中,针对的对象是人物的人物年龄确定用户的年龄,例如将所有这些任务的年龄作为样本,去除离散点后,取年龄的平均值作为用户的年龄;又一种实现方式也可以通过面部识别、语音识别等方式确定用户的年龄。
性别:确定性别的一种方式是获取用户在各种应用的注册信息中的性别信息,根据年龄信息确定性别的年龄;另一种方式是利用面部识别或语音识别的方式确定用户的年龄。
职业:确定职业的一种方式是获取用户在各种应用的注册信息中的职业信息,根据年龄信息确定用户的职业;另一种实现方式是根据用户使用智能化设备的时间分布规律,将用户划分为时间无规律人群和时间有规律人群两类职业。
下面结合具体应用场景,对本发明实施例提供的技术方案进行详细说明。
以智能电视设备为例,为智能电视设备进行用户特性分析时,如图2所示,定义用户特性分为动态属性和静态属性。其中,动态属性进一步包括三种标签:行为标签、正反馈兴趣标签和负反馈兴趣标签。
如图2所示,行为标签不区分具体对象,每个行为标签由两部分组成:标签对应的执行动作,该行为标签的取值(图中以v表示);
如图2所示,正反馈兴趣标签由两部分组成:该正反馈兴趣标签对应的对象,该正反馈兴趣标签的取值(图中以v表示);
如图2所示,负反馈兴趣标签由两部分组成:该负反馈兴趣标签对应的对象,该负反馈兴趣标签的取值(图中以v表示);
如图2所示,静态属性包括性别标签,年龄标签,地域标签和职业标签;其中,性别标签中保存性别信息,年龄标签中保存年龄信息,地域标签中保存地域信息,职业标签中保存职业信息。
基于上述应用场景,本发明实施例提供的方法流程如下:
一、实时获取用户的执行动作。
并不是用户对智能电视设备的所有操作都是分析用户特性所需的,因此,还需要对获取的执行动作进行去噪,仅保存需要的执行动作。
本实施例中,保存的执行动作包括如下信息:用户标识、执行时间、动作名称、对象。例如,用户小王在2015年6月1日下载了歌曲《默》,那么,执行动作保存如下:小王、2015年6月1日、下载、歌曲《默》。
二、将获取的执行动作进行分类,包括正反馈执行动作和负反馈执行动作两类。
本实施例中,可以每获取到一个执行动作,就将该执行动作进行分类;也可以设定分类周期,按照固定周期对执行动作进行分类。
本实施例中,所有的正反馈执行动作属于正反馈集,所有的负反馈动作属于负反馈集。
三、分别根据正反馈集、负反馈集中的执行动作,确定相应的行为标签、正反馈兴趣标签和负反馈兴趣标签。
本实施例中,行为标签更新周期可以是固定的周期。对于固定周期,一种实现方式是:查找预定时间段内(可以但不仅限于是本周期内)是否有新获取的执行动作,如果有新获取的执行动作,分别对这些新获取的执行动作确定行为标签,如果没有新获取的执行动作,则本周期内不为任何执行动作确定行为标签。另一种实现方式是:每个周期内,均为保存的所有执行动作确定行为标签。例如,当前周期内,保存的所有执行动作中,总共分为“搜索”“下载”“删除”这三种执行动作,则分别为这三种执行动作确定行为标签。当然,还可能有其他实现方式,而这些实现方式都是本领域技术人员不需要付出创造性劳动即可获知的,此处不再赘述。行为标签更新周期也可以是不固定的周期,例如,每获取一个执行动作并对其进行分类后,就进入一个行为标签更新周期。这种情况下,可以仅对本次获取的执行动作确定行为标签,也可以对所有的执行动作确定行为标签,本发明对此不作限定。
本实施例中,对象的正反馈兴趣标签的取值是时间衰减因子、内容权重与行为权重的乘积。应当指出的是,正反馈兴趣标签的取值还可以有其他确定方式,具体可以参照上述实施例的描述,此处不再赘述。
本实施例中,对象的负反馈兴趣标签的取值是时间衰减因子与内容权重的乘积。应当指出的是,负反馈兴趣标签的取值还可以有其他确定方式,具体可以参照上述实施例的描述,此处不再赘述。
本实施例中,规定行为权重由高到低的顺序分别如下:搜索(权重值t1)、收藏(权重值t2)、分享(权重值t3)、收听(权重值t4)、删除(权重值t5)、取消收藏(权重值t6)、切换(权重值t7)。
本实施例中,负反馈执行动作确定的时间衰减因子与正反馈执行动作确定时间衰减因子的方式相同。应当指出的是,正负反馈执行动作确定时间衰减因子的方式也可以不同,此处不再赘述。
本实施例中,正反馈兴趣标签与负反馈兴趣标签的兴趣标签更新周期可以相同,也可以不同,具体根据经验或统计确定。
本实施例中,兴趣标签更新周期可以是固定的周期。对于固定周期,一种实现方式是:在每个周期内,对于保存所有执行动作中记录的各个对象,查找预定时间段内(可以但不仅限于是本周期内,或者所有保存的执行动作对应的时间跨度)针对该对象的最后一次的执行动作,根据每个对象查找到的执行动作,分别确定时间衰减因子及行为权重,并分别确定每个对象的内容权重,最终确定每个对象的兴趣标签。例如,对于歌曲《默》,预定时间段内最后一次的执行动作是“搜索”,该执行动作的执行时间是2015年6月1日,则根据该日期距离当前时间的时间长度,确定时间衰减因子为ε1,“搜索”这一执行动作的行为权重为t1,确定歌曲《搜索》的内容权重为n,则歌曲《搜索》的兴趣标签的取值为ε1×t1×n。另一种实现方式是:对于保存所有执行动作中记录的各个对象,查找预定时间段内(可以但不仅限于是本周期内,或者所有保存的执行动作对应的时间跨度)针对该对象的行为权重最高的执行动作,根据每个对象查找到的执行动作,分别确定时间衰减因子及行为权重,并分别确定每个对象的内容权重,最终确定每个对象的兴趣标签。例如,对于歌曲《默》,预定时间段内行为权重最高的执行动作是“收藏”,该执行动作的执行时间是2015年4月1日,则根据该日期距离当前时间的时间长度,确定时间衰减因子为ε3,“收藏”这一执行动作的行为权重为t2,确定歌曲《搜索》的内容权重为n,则歌曲《搜索》的兴趣标签的取值为ε3×t2×n。当然,还可能有其他实现方式,而这些实现方式都是本领域技术人员不需要付出创造性劳动即可获知的,此处不再赘述。兴趣标签更新周期也可以是不固定的周期,例如,每获取一个执行动作并对其进行分类后,就进入一个兴趣标签更新周期。这种情况下,兴趣标签的确定方式可以参照固定周期的描述,此处不再赘述。
四、周期性地获取用户的地域信息、年龄信息、性别信息和职业信息,并根据这些信息确定静态属性。
本实施例中,这四种静态信息可以对应同一个静态信息更新周期,也可以对应不同的静态信息更新周期。静态属性的具体确定方式可以参照上述实施例的描述,此处不再赘述。
按照上述处理流程分析得到图2所示的用户特性后,可以将该用户特性应用于智能电视设备的多种智能应用。例如,可以根据用户特性进行智能电视内容推荐。以电影推荐为例,将用户特性中的静态信息,以及与电影相关的正反馈兴趣标签和负反馈兴趣标签作为用户对电影喜好规则的输入,来推荐用户喜欢的电影,其中,由于引入了负反馈兴趣标签,则在推荐时,可以尽量避免推荐用户不感兴趣的内容。又例如,可以根据用户特性中的行为标签,分析用户对不同服务的喜好,从而提供智能化服务。
对于其他智能产品的用户特性分析,可以参照上述智能电视设备的用户特性分析的实现方式,此处不再赘述。
基于与方法同样的发明构思,本发明实施例还提供一种用户特征的分析装置,如图3所示,包括:
时间衰减因子确定模块301,用于周期性地确定用户的执行动作的执行时间到当前时间的时间长度;在每个兴趣标签更新周期,根据时间长度与时间衰减因子的对应关系,确定本兴趣标签更新周期内确定的所述时间长度对应的时间衰减因子;
兴趣标签确定模块302,用于在每个兴趣标签更新周期,根据本兴趣标签更新周期内确定的所述时间衰减因子,确定所述执行动作的对象的兴趣标签,对象的兴趣标签反映了用户对该对象的兴趣程度;
用户特征保存模块303,用于在每个兴趣标签更新周期,保存本兴趣标签更新周期内确定的所述兴趣标签作为用户特征。
可选的,周期性地确定用户的执行动作的执行时间到当前时间的时间长度时,所述时间衰减因子确定模块用于:
周期性地确定用户针对所述对象的最晚的执行动作的执行时间到当前时间的时间长度;或者,
周期性地确定用户针对所述对象的行为权重最高的执行动作的执行时间到当前时间的时间长度,执行动作的行为权重反映了该执行动作对其对象的兴趣标签的影响程度。
基于上述任意装置实施例,可选的,在每个兴趣标签更新周期,所述兴趣标签确定模块用于:
根据本兴趣标签更新周期内确定的所述时间衰减因子和所述对象的内容权重,确定所述对象的兴趣标签,所述对象的内容权重至少是根据针对所述对象的执行动作的频度确定的;或者,
根据本兴趣标签更新周期内确定的所述时间衰减因子和所述执行动作的行为权重,确定所述对象的兴趣标签;或者,
根据本兴趣标签更新周期内确定的所述时间衰减因子、所述对象的内容权重和所述执行动作的行为权重,确定所述对象的兴趣标签。
基于上述任意装置实施例,可选的,还包括执行动作获取模块和执行动作分类模块:
所述执行动作获取模块用于获取所述执行动作;
所述执行动作分类模块用于确定所述执行动作是正反馈执行动作还是负反馈执行动作;
在每个兴趣标签更新周期,所述兴趣标签确定模块用于:
如果所述执行动作是正反馈执行动作,根据本兴趣标签更新周期内确定的所述时间衰减因子,确定所述执行动作的对象的正反馈兴趣标签;
如果所述执行动作是负反馈执行动作,根据本兴趣标签更新周期内确定的所述时间衰减因子,确定所述执行动作的对象的负反馈兴趣标签。
基于上述任意装置实施例,可选的,还包括静态信息确定模块,用于周期性地确定所述用户的以下至少一个静态信息:地域、年龄、性别、职业;
所述用户特征保存模块还用于:在每个静态信息更新周期,保存本静态信息更新周期内确定的所述静态信息作为用户特征。
基于上述任意装置实施例,可选的,还包括行为标签确定模块,用于周期性地根据用户的执行动作的频度,确定所述执行动作的行为标签;在每个行为标签更新周期,保存本行为标签更新周期内确定的所述行为标签作为用户特征。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
Claims (12)
1.一种用户特征的分析方法,其特征在于,包括:
周期性地确定用户的执行动作的执行时间到当前时间的时间长度;
在每个兴趣标签更新周期,根据时间长度与时间衰减因子的对应关系,确定本兴趣标签更新周期内确定的所述时间长度对应的时间衰减因子;
在每个兴趣标签更新周期,根据本兴趣标签更新周期内确定的所述时间衰减因子,确定所述执行动作的对象的兴趣标签,对象的兴趣标签反映了用户对该对象的兴趣程度;
在每个兴趣标签更新周期,保存本兴趣标签更新周期内确定的所述兴趣标签作为用户特征。
2.根据权利要求1所述的方法,其特征在于,所述周期性地确定用户的执行动作的执行时间到当前时间的时间长度,包括:
周期性地确定用户针对所述对象的最晚的执行动作的执行时间到当前时间的时间长度;或者,
周期性地确定用户针对所述对象的行为权重最高的执行动作的执行时间到当前时间的时间长度,执行动作的行为权重反映了该执行动作对其对象的兴趣标签的影响程度。
3.根据权利要求1或2所述的方法,其特征在于,所述根据本兴趣标签更新周期内确定的所述时间衰减因子,确定所述执行动作的对象的兴趣标签,包括:
根据本兴趣标签更新周期内确定的所述时间衰减因子和所述对象的内容权重,确定所述对象的兴趣标签,所述对象的内容权重至少是根据针对所述对象的执行动作的频度确定的;或者,
根据本兴趣标签更新周期内确定的所述时间衰减因子和所述执行动作的行为权重,确定所述对象的兴趣标签;或者,
根据本兴趣标签更新周期内确定的所述时间衰减因子、所述对象的内容权重和所述执行动作的行为权重,确定所述对象的兴趣标签。
4.根据权利要求1或2所述的方法,其特征在于,该方法还包括:
获取所述执行动作,确定所述执行动作是正反馈执行动作还是负反馈执行动作;
所述根据本兴趣标签更新周期内确定的所述时间衰减因子,确定所述执行动作的对象的兴趣标签,包括:
如果所述执行动作是正反馈执行动作,根据本兴趣标签更新周期内确定的所述时间衰减因子,确定所述执行动作的对象的正反馈兴趣标签;
如果所述执行动作是负反馈执行动作,根据本兴趣标签更新周期内确定的所述时间衰减因子,确定所述执行动作的对象的负反馈兴趣标签。
5.根据权利要求1或2所述的方法,其特征在于,该方法还包括:
周期性地确定所述用户的以下至少一个静态信息:地域、年龄、性别、职业;
在每个静态信息更新周期,保存本静态信息更新周期内确定的所述静态信息作为用户特征。
6.根据权利要求1或2所述的方法,其特征在于,该方法还包括:
周期性地根据用户的执行动作的频度,确定所述执行动作的行为标签;
在每个行为标签更新周期,保存本行为标签更新周期内确定的所述行为标签作为用户特征。
7.一种用户特征的分析装置,其特征在于,包括:
时间衰减因子确定模块,用于周期性地确定用户的执行动作的执行时间到当前时间的时间长度;在每个兴趣标签更新周期,根据时间长度与时间衰减因子的对应关系,确定本兴趣标签更新周期内确定的所述时间长度对应的时间衰减因子;
兴趣标签确定模块,用于在每个兴趣标签更新周期,根据本兴趣标签更新周期内确定的所述时间衰减因子,确定所述执行动作的对象的兴趣标签,对象的兴趣标签反映了用户对该对象的兴趣程度;
用户特征保存模块,用于在每个兴趣标签更新周期,保存本兴趣标签更新周期内确定的所述兴趣标签作为用户特征。
8.根据权利要求7所述的装置,其特征在于,周期性地确定用户的执行动作的执行时间到当前时间的时间长度时,所述时间衰减因子确定模块用于:
周期性地确定用户针对所述对象的最晚的执行动作的执行时间到当前时间的时间长度;或者,
周期性地确定用户针对所述对象的行为权重最高的执行动作的执行时间到当前时间的时间长度,执行动作的行为权重反映了该执行动作对其对象的兴趣标签的影响程度。
9.根据权利要求7或8所述的装置,其特征在于,在每个兴趣标签更新周期,所述兴趣标签确定模块用于:
根据本兴趣标签更新周期内确定的所述时间衰减因子和所述对象的内容权重,确定所述对象的兴趣标签,所述对象的内容权重至少是根据针对所述对象的执行动作的频度确定的;或者,
根据本兴趣标签更新周期内确定的所述时间衰减因子和所述执行动作的行为权重,确定所述对象的兴趣标签;或者,
根据本兴趣标签更新周期内确定的所述时间衰减因子、所述对象的内容权重和所述执行动作的行为权重,确定所述对象的兴趣标签。
10.根据权利要求7或8所述的装置,其特征在于,还包括执行动作获取模块和执行动作分类模块:
所述执行动作获取模块用于获取所述执行动作;
所述执行动作分类模块用于确定所述执行动作是正反馈执行动作还是负反馈执行动作;
在每个兴趣标签更新周期,所述兴趣标签确定模块用于:
如果所述执行动作是正反馈执行动作,根据本兴趣标签更新周期内确定的所述时间衰减因子,确定所述执行动作的对象的正反馈兴趣标签;
如果所述执行动作是负反馈执行动作,根据本兴趣标签更新周期内确定的所述时间衰减因子,确定所述执行动作的对象的负反馈兴趣标签。
11.根据权利要求7或8所述的装置,其特征在于,还包括静态信息确定模块,用于周期性地确定所述用户的以下至少一个静态信息:地域、年龄、性别、职业;
所述用户特征保存模块还用于:在每个静态信息更新周期,保存本静态信息更新周期内确定的所述静态信息作为用户特征。
12.根据权利要求7或8所述的装置,其特征在于,还包括行为标签确定模块,用于周期性地根据用户的执行动作的频度,确定所述执行动作的行为标签;在每个行为标签更新周期,保存本行为标签更新周期内确定的所述行为标签作为用户特征。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510325790.5A CN104933134A (zh) | 2015-06-12 | 2015-06-12 | 一种用户特征的分析方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510325790.5A CN104933134A (zh) | 2015-06-12 | 2015-06-12 | 一种用户特征的分析方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN104933134A true CN104933134A (zh) | 2015-09-23 |
Family
ID=54120301
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510325790.5A Pending CN104933134A (zh) | 2015-06-12 | 2015-06-12 | 一种用户特征的分析方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104933134A (zh) |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105979331A (zh) * | 2015-12-01 | 2016-09-28 | 乐视致新电子科技(天津)有限公司 | 一种智能电视的数据推荐方法和装置 |
CN107015973A (zh) * | 2016-01-27 | 2017-08-04 | 腾讯科技(深圳)有限公司 | 一种应用排序方法、装置及服务器 |
CN107203602A (zh) * | 2017-05-15 | 2017-09-26 | 竹间智能科技(上海)有限公司 | 基于聊天记忆的用户模型信任值更新方法及装置 |
CN108021673A (zh) * | 2017-12-06 | 2018-05-11 | 北京拉勾科技有限公司 | 一种用户兴趣模型生成方法、职位推荐方法及计算设备 |
CN108133036A (zh) * | 2018-01-09 | 2018-06-08 | 北京奇艺世纪科技有限公司 | 一种用户兴趣点的权重值确定方法、装置及电子设备 |
CN109241417A (zh) * | 2018-08-22 | 2019-01-18 | 中国平安人寿保险股份有限公司 | 用户唤醒方法与装置、计算设备和存储介质 |
CN109657138A (zh) * | 2018-12-10 | 2019-04-19 | 深圳墨世科技有限公司 | 一种视频推荐方法、装置、电子设备及存储介质 |
CN111125514A (zh) * | 2019-11-20 | 2020-05-08 | 泰康保险集团股份有限公司 | 用户行为分析的方法、装置、电子设备和存储介质 |
CN112135193A (zh) * | 2020-09-24 | 2020-12-25 | 湖南快乐阳光互动娱乐传媒有限公司 | 视频推荐方法及装置 |
CN112989166A (zh) * | 2021-03-26 | 2021-06-18 | 杭州有数金融信息服务有限公司 | 一种计算企业实际经营地的方法 |
CN113518263A (zh) * | 2021-07-23 | 2021-10-19 | 南京炫佳网络科技有限公司 | 交互式网络电视的视频推荐方法、装置、电视及存储介质 |
US20240020115A1 (en) * | 2022-07-14 | 2024-01-18 | Dell Products L.P. | Smart online documentation |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104102648A (zh) * | 2013-04-07 | 2014-10-15 | 腾讯科技(深圳)有限公司 | 基于用户行为数据的兴趣推荐方法及装置 |
CN104216884A (zh) * | 2013-05-29 | 2014-12-17 | 酷盛(天津)科技有限公司 | 一种基于时间衰减的协同过滤系统及方法 |
CN104602042A (zh) * | 2014-12-31 | 2015-05-06 | 合一网络技术(北京)有限公司 | 基于用户行为的标签设置方法 |
-
2015
- 2015-06-12 CN CN201510325790.5A patent/CN104933134A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104102648A (zh) * | 2013-04-07 | 2014-10-15 | 腾讯科技(深圳)有限公司 | 基于用户行为数据的兴趣推荐方法及装置 |
CN104216884A (zh) * | 2013-05-29 | 2014-12-17 | 酷盛(天津)科技有限公司 | 一种基于时间衰减的协同过滤系统及方法 |
CN104602042A (zh) * | 2014-12-31 | 2015-05-06 | 合一网络技术(北京)有限公司 | 基于用户行为的标签设置方法 |
Non-Patent Citations (1)
Title |
---|
缪平: "基于微博用户兴趣模型的信息推送技术的研究", 《中国优秀硕士学位论文全文数据库》 * |
Cited By (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105979331A (zh) * | 2015-12-01 | 2016-09-28 | 乐视致新电子科技(天津)有限公司 | 一种智能电视的数据推荐方法和装置 |
CN107015973A (zh) * | 2016-01-27 | 2017-08-04 | 腾讯科技(深圳)有限公司 | 一种应用排序方法、装置及服务器 |
CN107015973B (zh) * | 2016-01-27 | 2020-12-29 | 腾讯科技(深圳)有限公司 | 一种应用排序方法、装置及服务器 |
CN107203602A (zh) * | 2017-05-15 | 2017-09-26 | 竹间智能科技(上海)有限公司 | 基于聊天记忆的用户模型信任值更新方法及装置 |
CN108021673A (zh) * | 2017-12-06 | 2018-05-11 | 北京拉勾科技有限公司 | 一种用户兴趣模型生成方法、职位推荐方法及计算设备 |
CN108133036A (zh) * | 2018-01-09 | 2018-06-08 | 北京奇艺世纪科技有限公司 | 一种用户兴趣点的权重值确定方法、装置及电子设备 |
CN109241417B (zh) * | 2018-08-22 | 2023-07-25 | 中国平安人寿保险股份有限公司 | 用户唤醒方法与装置、计算设备和存储介质 |
CN109241417A (zh) * | 2018-08-22 | 2019-01-18 | 中国平安人寿保险股份有限公司 | 用户唤醒方法与装置、计算设备和存储介质 |
CN109657138A (zh) * | 2018-12-10 | 2019-04-19 | 深圳墨世科技有限公司 | 一种视频推荐方法、装置、电子设备及存储介质 |
CN109657138B (zh) * | 2018-12-10 | 2021-02-26 | 深圳大宇无限科技有限公司 | 一种视频推荐方法、装置、电子设备及存储介质 |
CN111125514A (zh) * | 2019-11-20 | 2020-05-08 | 泰康保险集团股份有限公司 | 用户行为分析的方法、装置、电子设备和存储介质 |
CN111125514B (zh) * | 2019-11-20 | 2023-08-22 | 泰康保险集团股份有限公司 | 用户行为分析的方法、装置、电子设备和存储介质 |
CN112135193A (zh) * | 2020-09-24 | 2020-12-25 | 湖南快乐阳光互动娱乐传媒有限公司 | 视频推荐方法及装置 |
CN112989166A (zh) * | 2021-03-26 | 2021-06-18 | 杭州有数金融信息服务有限公司 | 一种计算企业实际经营地的方法 |
CN113518263A (zh) * | 2021-07-23 | 2021-10-19 | 南京炫佳网络科技有限公司 | 交互式网络电视的视频推荐方法、装置、电视及存储介质 |
US20240020115A1 (en) * | 2022-07-14 | 2024-01-18 | Dell Products L.P. | Smart online documentation |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104933134A (zh) | 一种用户特征的分析方法及装置 | |
JP6676167B2 (ja) | 情報推薦方法及び装置 | |
CN107358247B (zh) | 一种确定流失用户的方法及装置 | |
CN110019823B (zh) | 更新知识图谱的方法及装置 | |
CN105556516A (zh) | 个性化的内容加标签 | |
CN107092609B (zh) | 一种信息推送方法及装置 | |
US11297027B1 (en) | Automated image processing and insight presentation | |
CN109977135A (zh) | 一种数据查询方法、装置及服务器 | |
CN110322281A (zh) | 相似用户的挖掘方法及装置 | |
CN110119401A (zh) | 用户画像的处理方法、装置、服务器及存储介质 | |
CN106708871A (zh) | 一种社交业务特征用户的识别方法和装置 | |
CN110046100B (zh) | 一种分组测试的方法、电子设备及介质 | |
CN112966577B (zh) | 一种模型训练以及信息提供的方法及装置 | |
CN111177562B (zh) | 一种目标对象的推荐排序处理方法、装置及服务器 | |
CN107577660B (zh) | 类目信息识别方法、装置及服务器 | |
CN109656946A (zh) | 一种多表关联查询方法、装置及设备 | |
CN107562703B (zh) | 字典树重构方法及系统 | |
CN109471639A (zh) | 一种应用下载来源的监测方法及装置 | |
CN109582834B (zh) | 数据风险预测方法及装置 | |
CN110019783B (zh) | 属性词聚类方法及装置 | |
US9747325B2 (en) | Duplicate station detection system | |
CN110019295B (zh) | 数据库检索方法、装置、系统以及存储介质 | |
CN111142990A (zh) | 一种微信小程序页面展示方法、装置、及存储介质 | |
CN110704742B (zh) | 一种特征提取方法及装置 | |
CN109213541A (zh) | App应用展示界面的方法、装置和电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20150923 |
|
RJ01 | Rejection of invention patent application after publication |