CN115309974A - 一种基于大数据的用户管理方法及系统 - Google Patents

一种基于大数据的用户管理方法及系统 Download PDF

Info

Publication number
CN115309974A
CN115309974A CN202210556736.1A CN202210556736A CN115309974A CN 115309974 A CN115309974 A CN 115309974A CN 202210556736 A CN202210556736 A CN 202210556736A CN 115309974 A CN115309974 A CN 115309974A
Authority
CN
China
Prior art keywords
behavior
user
tags
big data
module
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN202210556736.1A
Other languages
English (en)
Inventor
王建军
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Anhui Hesi Network Technology Co ltd
Original Assignee
Anhui Hesi Network Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Anhui Hesi Network Technology Co ltd filed Critical Anhui Hesi Network Technology Co ltd
Priority to CN202210556736.1A priority Critical patent/CN115309974A/zh
Publication of CN115309974A publication Critical patent/CN115309974A/zh
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/906Clustering; Classification

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本说明书一个或多个实施例提供一种基于大数据的用户管理方法及系统,通过基于大数据得出多个用户行为模板,获取用户的行为,根据预先定义的行为标签,为用户行为涉及的各行为标签进行分别计分;并得出核心行为标签,进一步选取对照行为标签,进行大数据匹配,得出在对照行为标签上相似度最高的用户行为模板;进而得出扩展行为标签,并基于扩展行为标签为用户推荐相关内容,可以扩展用户接触到的内容的类型,起到打破信息茧房的效果。

Description

一种基于大数据的用户管理方法及系统
技术领域
本说明书一个或多个实施例涉及数据分析技术领域,尤其涉及一种基于大数据的用户管理方法及系统。
背景技术
随着互联网技术的发展,人们对互联网平台的使用越来越普遍,如何提高用户黏性,提供用户感兴趣的内容一直是各大内容平台研究的课题,但目前的内容推送算法,多是根据用户的历史行为提取特征,再根据特征进行内容匹配推送,容易导致用户接触的内容覆盖面狭窄,也就是陷入信息茧房的困扰。
发明内容
有鉴于此,本说明书一个或多个实施例的目的在于提出一种基于大数据的用户管理方法及系统,以解决目前的推荐算法容易造成信息茧房的问题。
基于上述目的,本说明书一个或多个实施例提供了一种基于大数据的用户管理方法,包括以下步骤:
基于大数据得出多个用户行为模板;
预先定义用户的行为对应的行为标签和各行为标签对应的分值;
获取用户的行为,根据预先定义的行为标签,为用户行为涉及的各行为标签进行分别计分;
对用户在各行为标签上的计分结果进行排名,得出排名靠前的n个核心行为标签;
从核心行为标签中随机选取m个对照行为标签,进行大数据匹配,得出在该m个对照行为标签上相似度最高的用户行为模板;
对于该用户行为模板中排名靠前的k个行为标签,从中删除选取的对照行为标签,得出剩余的扩展行为标签;
基于扩展行为标签,为用户添加标记,并推荐相关内容。
优选地,本方法还包括:
对于扩展行为标签,记录推送相关内容后设定时间内用户在该扩展行为标签上的计分情况,若计分低于设定值,停止对扩展行为标签相关内容的推送。
优选地,基于大数据得出多个用户行为模板包括:
使任意两个用户行为模板中重复的行为标签数量不超过设定个数。
优选地,用户的行为包括但不限于头像的设置、个人信息的填写、使用平台的时间段、所处的地区、点击行为、观看行为、停留时长。
优选地,为用户行为涉及的各行为标签进行分别计分包括:
若某一行为标签的计分值超过设定值,则降低对应的用户行为中该行为标签的权重。
优选地,本方法还包括:获取用户的行为特征,并将用户的行为特征进行特征变换,得到行为标签。
优选地,本方法还包括:获取用户的行为特征,并将用户的行为特征进行特征交叉,得到行为标签。
本说明书还提供一种基于大数据的用户管理系统,包括:
行为模板模块:用于基于大数据得出多个用户行为模板;
预设模块,用于预先定义用户的行为对应的行为标签和各行为标签对应的分值;
计分模块,用于获取用户的行为,根据预先定义的行为标签,为用户行为涉及的各行为标签进行分别计分;
排名模块,用于对用户在各行为标签上的计分结果进行排名,得出排名靠前的n个核心行为标签;
匹配模块,用于从核心行为标签中随机选取m个对照行为标签,进行大数据匹配,得出在该m个对照行为标签上相似度最高的用户行为模板;
扩展模块,用于对于该用户行为模板中排名靠前的k个行为标签,从中删除选取的对照行为标签,得出剩余的扩展行为标签;
内容推荐模块,用于基于所述扩展行为标签,为用户添加标记,并推荐相关内容。
从上面所述可以看出,本说明书一个或多个实施例提供的基于大数据的用户管理方法及系统,通过基于大数据得出多个用户行为模板,获取用户的行为,根据预先定义的行为标签,为用户行为涉及的各行为标签进行分别计分;并得出核心行为标签,进一步选取对照行为标签,进行大数据匹配,得出在对照行为标签上相似度最高的用户行为模板;进而得出扩展行为标签,并基于扩展行为标签为用户推荐相关内容,可以扩展用户接触到的内容的类型,起到打破信息茧房的效果。
附图说明
为了更清楚地说明本说明书一个或多个实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本说明书一个或多个实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本说明书一个或多个实施例的用户管理方法流程示意图。
具体实施方式
为使本公开的目的、技术方案和优点更加清楚明白,以下结合具体实施例,对本公开进一步详细说明。
需要说明的是,除非另外定义,本说明书一个或多个实施例使用的技术术语或者科学术语应当为本公开所属领域内具有一般技能的人士所理解的通常意义。本说明书一个或多个实施例中使用的“第一”、“第二”以及类似的词语并不表示任何顺序、数量或者重要性,而只是用来区分不同的组成部分。“包括”或者“包含”等类似的词语意指出现该词前面的元件或者物件涵盖出现在该词后面列举的元件或者物件及其等同,而不排除其他元件或者物件。“连接”或者“相连”等类似的词语并非限定于物理的或者机械的连接,而是可以包括电性的连接,不管是直接的还是间接的。“上”、“下”、“左”、“右”等仅用于表示相对位置关系,当被描述对象的绝对位置改变后,则该相对位置关系也可能相应地改变。
本说明书实施例提供一种基于大数据的用户管理方法,包括以下步骤:
S01.基于大数据得出多个用户行为模板。
举例来说,在得出多个用户行为模板时,应当使任意两个用户行为模板中重复的行为标签数量不超过设定个数,以保证各用户行为模板的差异性,以及使其具有代表性。
S02.预先定义用户的行为对应的行为标签和各行为标签对应的分值。
举例来说,上述用户的行为包括但不限于头像的设置、个人信息的填写、使用平台的时间段、所处的地区、点击行为、观看行为、停留时长等。
举例来说,用户头像的设置也能反映用户一部分的偏好,如当用户设置头像后,可以对用户的图像通过图像搜索引擎进行检索,即以图搜图,若能检索到匹配的图像,即可以通过匹配到的图像的信息得出用户头像的信息,如用户设置的头像为游戏相关人物的头像,则可以在与游戏相关的行为标签上为用户计分。
上述个人信息可包括用户的年龄段、性别等,点击行为、观看行为、停留时长即为用户在某一类别的内容上作出的操作,如某一视频包含的行为标签为美食和旅游,则用户通过点击和观看该视频,即会在对应的行为标签上计分。
S03.获取用户的行为、根据预先定义的行为标签,为用户行为涉及的各行为标签进行分别计分。
举例来说,若某一行为标签的计分值超过设定值,则降低对应的用户行为中该行为标签的权重,如用户观看美食类视频较多,则在美食相关的行为标签上的计分值较高,为了不使各行为标签计分值产生过大的差异,以及考虑到边际效应,则包含有美食类行为标签的内容,在该行为标签上的权重应当降低。
S04.对用户在各行为标签上的计分结果进行排名,得出排名靠前的n个核心行为标签。
S05.从核心行为标签中随机选取m个对照行为标签,进行大数据匹配,得出在该m个对照行为标签上相似度最高的用户行为模板。
S06.对于该用户行为模板中排名靠前的k个行为标签,从中删除选取的对照行为标签,得出剩余的扩展行为标签。
S07.基于所述扩展行为标签,为用户添加标记,并推荐相关内容。
举例来说,为了避免用户在推荐算法中进入信息茧房,但又尽量能够向用户推荐用户感兴趣的内容,本实施例提供的方式就是找到与用户的行为特征存在部分相近的用户行为模板,再从该用户行为模板中提取出与用户不同的扩展行为标签,基于该扩展行为标签,为用户推荐相关内容,如用户在一段时间内观看了大量的美食视频,现有的推荐算法会根据用户的喜好一直推荐美食相关内容,就可能造成信息茧房的情况,而本实施例提供的方法,会进一步分析用户的行为标签,如用户使用平台的时间多为深夜,所处地区为北京,头像使用的是自拍,根据这些行为标签找到匹配的用户行为模板,再从该用户行为模板中找到排名靠前但不与用户重复的扩展行为标签,该一个或多个扩展行为标签即为用户可能有兴趣的,但按传统推荐算法不会推荐给用户的内容,以此能够扩展用户接触到的内容的类型,起到打破信息茧房的效果。
作为一种实施方式,本方法还包括:对于扩展行为标签,记录推送相关内容后设定时间内用户在该扩展行为标签上的计分情况,若计分低于设定值,停止对扩展行为标签相关内容的推送,举例来说,本实施例虽然通过匹配用户行为模板的方式,得出用户可能感兴趣的行为标签,但也可能会遇到判断错误,用户并不感兴趣的情况,因此通过上述设置,如在10小时的使用时间内获取用户在该行为标签上的计分值,若计分值较低,则不再进行推送,提高用户的使用体验。
作为一种实施方式,本方法还包括,获取用户的行为特征,并将用户的行为特征进行特征变换,得到行为标签,举例来说,若用户头像设置为动漫人物,则可以将该行为特征变换为对应“动漫”的行为标签,若用户输入个人信息的年龄为35岁,则可以将该行为特征变换为对应“中年人”的行为标签。
作为一种实施方式,本方法还包括,获取用户的行为特征,并将用户的行为特征进行特征交叉,得到行为标签,举例来说,用户填写的年龄为40岁,性别为女性,则可以将两个行为特征交叉,得到行为标签为中年女性。
本说明书实施例还提供一种基于大数据的用户管理系统,包括:
行为模板模块:用于基于大数据得出多个用户行为模板;
预设模块,用于预先定义用户的行为对应的行为标签和各行为标签对应的分值;
计分模块,用于获取用户的行为,根据预先定义的行为标签,为用户行为涉及的各行为标签进行分别计分;
排名模块,用于对用户在各行为标签上的计分结果进行排名,得出排名靠前的n个核心行为标签;
匹配模块,用于从核心行为标签中随机选取m个对照行为标签,进行大数据匹配,得出在该m个对照行为标签上相似度最高的用户行为模板;
扩展模块,用于对于该用户行为模板中排名靠前的k个行为标签,从中删除选取的对照行为标签,得出剩余的扩展行为标签;
内容推荐模块,用于基于所述扩展行为标签,为用户添加标记,并推荐相关内容。
本说明书实施例提供的基于大数据的用户管理方法及系统,通过基于大数据得出多个用户行为模板;获取用户的行为,根据预先定义的行为标签,为用户行为涉及的各行为标签进行分别计分;并得出核心行为标签,进一步选取对照行为标签,进行大数据匹配,得出在对照行为标签上相似度最高的用户行为模板;进而得出扩展行为标签,并基于扩展行为标签为用户推荐相关内容,可以扩展用户接触到的内容的类型,起到打破信息茧房的效果。
所属领域的普通技术人员应当理解:以上任何实施例的讨论仅为示例性的,并非旨在暗示本公开的范围(包括权利要求)被限于这些例子;在本公开的思路下,以上实施例或者不同实施例中的技术特征之间也可以进行组合,并存在如上所述的本说明书一个或多个实施例的不同方面的许多其它变化,为了简明它们没有在细节中提供。
本说明书一个或多个实施例旨在涵盖落入所附权利要求的宽泛范围之内的所有这样的替换、修改和变型。因此,凡在本说明书一个或多个实施例的精神和原则之内,所做的任何省略、修改、等同替换、改进等,均应包含在本公开的保护范围之内。

Claims (8)

1.一种基于大数据的用户管理方法,其特征在于,包括以下步骤:
基于大数据得出多个用户行为模板;
预先定义用户的行为对应的行为标签和各行为标签对应的分值;
获取用户的行为,根据预先定义的行为标签,为用户行为涉及的各行为标签进行分别计分;
对用户在各行为标签上的计分结果进行排名,得出排名靠前的n个核心行为标签;
从核心行为标签中随机选取m个对照行为标签,进行大数据匹配,得出在该m个对照行为标签上相似度最高的用户行为模板;
对于该用户行为模板中排名靠前的k个行为标签,从中删除选取的对照行为标签,得出剩余的扩展行为标签;
基于所述扩展行为标签,为用户添加标记,并推荐相关内容。
2.根据权利要求1所述的基于大数据的用户管理方法,其特征在于,所述方法还包括:
对于所述扩展行为标签,记录推送相关内容后设定时间内用户在该扩展行为标签上的计分情况,若计分低于设定值,停止对扩展行为标签相关内容的推送。
3.根据权利要求1所述的基于大数据的用户管理方法,其特征在于,所述基于大数据得出多个用户行为模板包括:
使任意两个用户行为模板中重复的行为标签数量不超过设定个数。
4.根据权利要求1所述的基于大数据的用户管理方法,其特征在于,所述用户的行为包括但不限于头像的设置、个人信息的填写、使用平台的时间段、所处的地区、点击行为、观看行为、停留时长。
5.根据权利要求1所述的基于大数据的用户管理方法,其特征在于,所述为用户行为涉及的各行为标签进行分别计分包括:
若某一行为标签的计分值超过设定值,则降低对应的用户行为中该行为标签的权重。
6.根据权利要求1所述的基于大数据的用户管理方法,其特征在于,所述方法还包括:获取用户的行为特征,并将用户的行为特征进行特征变换,得到行为标签。
7.根据权利要求1所述的基于大数据的用户管理方法,其特征在于,所述方法还包括:获取用户的行为特征,并将用户的行为特征进行特征交叉,得到行为标签。
8.一种基于大数据的用户管理系统,其特征在于,包括:
行为模板模块:用于基于大数据得出多个用户行为模板;
预设模块,用于预先定义用户的行为对应的行为标签和各行为标签对应的分值;
计分模块,用于获取用户的行为,根据预先定义的行为标签,为用户行为涉及的各行为标签进行分别计分;
排名模块,用于对用户在各行为标签上的计分结果进行排名,得出排名靠前的n个核心行为标签;
匹配模块,用于从核心行为标签中随机选取m个对照行为标签,进行大数据匹配,得出在该m个对照行为标签上相似度最高的用户行为模板;
扩展模块,用于对于该用户行为模板中排名靠前的k个行为标签,从中删除选取的对照行为标签,得出剩余的扩展行为标签;
内容推荐模块,用于基于所述扩展行为标签,为用户添加标记,并推荐相关内容。
CN202210556736.1A 2022-05-19 2022-05-19 一种基于大数据的用户管理方法及系统 Withdrawn CN115309974A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210556736.1A CN115309974A (zh) 2022-05-19 2022-05-19 一种基于大数据的用户管理方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210556736.1A CN115309974A (zh) 2022-05-19 2022-05-19 一种基于大数据的用户管理方法及系统

Publications (1)

Publication Number Publication Date
CN115309974A true CN115309974A (zh) 2022-11-08

Family

ID=83854355

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210556736.1A Withdrawn CN115309974A (zh) 2022-05-19 2022-05-19 一种基于大数据的用户管理方法及系统

Country Status (1)

Country Link
CN (1) CN115309974A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117641004A (zh) * 2023-11-22 2024-03-01 北京风平智能科技有限公司 一种短视频推荐方法、装置、电子设备及存储介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117641004A (zh) * 2023-11-22 2024-03-01 北京风平智能科技有限公司 一种短视频推荐方法、装置、电子设备及存储介质
CN117641004B (zh) * 2023-11-22 2024-05-14 北京风平智能科技有限公司 一种短视频推荐方法、装置、电子设备及存储介质

Similar Documents

Publication Publication Date Title
CN111143610B (zh) 一种内容推荐方法、装置、电子设备和存储介质
US10728203B2 (en) Method and system for classifying a question
US20230306052A1 (en) Method and system for entity extraction and disambiguation
US10180979B2 (en) System and method for generating suggestions by a search engine in response to search queries
US8682739B1 (en) Identifying objects in video
US11042590B2 (en) Methods, systems and techniques for personalized search query suggestions
CN103339646B (zh) 信息提供装置
US10621220B2 (en) Method and system for providing a personalized snippet
US20170097984A1 (en) Method and system for generating a knowledge representation
US20080059897A1 (en) Method and system of social networking through a cloud
CN104395901B (zh) 用于促进用户获得内容的方法和系统
CN104021150A (zh) 带有社交网络辅助的面部识别
US11899728B2 (en) Methods, systems and techniques for ranking personalized and generic search query suggestions
US20180089156A1 (en) Systems and methods for constructing presentations
CN112507163B (zh) 时长预测模型训练方法、推荐方法、装置、设备及介质
US11836169B2 (en) Methods, systems and techniques for providing search query suggestions based on non-personal data and user personal data according to availability of user personal data
CN102662972A (zh) 一种面向视力残疾人网页内容无障碍访问的图片自动描述方法
CN115309974A (zh) 一种基于大数据的用户管理方法及系统
US9767400B2 (en) Method and system for generating a card based on intent
CN111428120B (zh) 一种信息确定方法、装置、电子设备及存储介质
CN111400609A (zh) 用户推荐方法、装置、存储介质及服务器
US20170099242A1 (en) Method and system for dynamically generating a card
Kim et al. Toward a conceptual framework of key‐frame extraction and storyboard display for video summarization
US20220222432A1 (en) Recommending theme patterns of a document
US20230254521A1 (en) Video distribution device, video distribution method, and recording media

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication

Application publication date: 20221108

WW01 Invention patent application withdrawn after publication