CN111737588A - 用户画像知识相似度计算方法 - Google Patents
用户画像知识相似度计算方法 Download PDFInfo
- Publication number
- CN111737588A CN111737588A CN202010856930.2A CN202010856930A CN111737588A CN 111737588 A CN111737588 A CN 111737588A CN 202010856930 A CN202010856930 A CN 202010856930A CN 111737588 A CN111737588 A CN 111737588A
- Authority
- CN
- China
- Prior art keywords
- label
- matrix
- user
- knowledge
- weight
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/16—Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Mathematical Physics (AREA)
- General Engineering & Computer Science (AREA)
- Pure & Applied Mathematics (AREA)
- Mathematical Optimization (AREA)
- Mathematical Analysis (AREA)
- Computational Mathematics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Computation (AREA)
- Evolutionary Biology (AREA)
- Computing Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Algebra (AREA)
- Software Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了用户画像知识相似度计算方法,属于智能分析技术领域,首先,规定用户的重要行为及个人基础属性选取个数及以及具体行为操作和属性内容。其次,对每项用户行为及用户属性的进行参数赋权,决定用户行为和用户属性在整体知识相似度计算中的比重值。抽取用户的行为记录和属性,统计用户行为访问过知识关联的标签,并对标签一一赋权。最后,汇集用户知识标签的总体权重值,根据权重高低排序,得出用户知识画像。本发明基于用户行为操作及个人基础属性的参数权重计算知识相似度,通过用户的具体行为操作绘制用户画像,并相应地返回适配的相似知识。该方法的知识推荐准确度高,推荐比例可以动态调整,操作便捷。
Description
技术领域
本发明涉及一种用户画像知识相似度计算方法,属于智能分析技术领域。
背景技术
当今是一个海量数据的时代,用户在各网站都能接收到大量信息。这其中有很大一部分都是无效、重复、或者用户不感兴趣的垃圾流量。用户在查询知识时需要花费大量的时间、精力来遍历搜索结果,或在茫茫知识库中打捞。为了向用户精准投放符合用户行为习惯及个人特征的相似知识,需要一种能够动态调整权重比例,并按照单篇知识的标签进行统计,得出用户知识画像和个人知识标签,进行动态知识相似推荐。
发明内容
为了解决上述技术问题,本发明提供一种用户画像知识相似度计算方法,其具体技术方案如下:
用户画像知识相似度计算方法,其特征在于:包括以下步骤
步骤一:统计影响用户画像的标准行为及基础属性,所述标准行为包括查看、点赞、分享、收藏、下载、评论和提问,所述基础属性包括部门、岗位、角色和专业;
所述标准行为选取下载、提问、收藏、分享、评论5种行为操作,所述基础属性选取部门和岗位,合计7个参数;
步骤三:抽取标准行为记录及基础属性标签,记录用户行为日志表,记录用户标准行为所关联的行为标签,记录用户基础属性关联的属性标签,行为标签和属性标签合并称为知识标签;
步骤六:汇集知识标签,分析并合并所有加权矩阵,统一标签计量维度,得到用户画像并推荐相似知识,具体过程为:
统计矩阵内的标签权重,矩阵内最多有个标签,其中对象出现次,对象出现次,……,对象出现次,推算出对象的权重为,整个矩阵内所有标签的权重之和为,保证权重的总和始终是对该操作预设的权重值,标准行为A对应的标签数组对应权重,这是一个1的矩阵,其和为;
本发明的有益效果是:
本发明通过对用户的行为操作及个人属性进行分析,记录操作相关知识的标签,并动态赋权,得到实时更新的用户知识画像。通过用户画像知识相似度的计算方法,量化用户对知识的关注度,明确用户的知识标签占比,为精准投放符合用户行为习惯及个人特征的相似知识提供了方法论。
附图说明
图1是本发明的流程图。
具体实施方式
如图1所示,本发明的用户画像知识相似度计算方法,包括以下步骤:
步骤一:统计影响用户画像的标准行为及基础属性,标准行为包括查看、点赞、分享、收藏、下载、评论、提问,所述基础属性包括部门、岗位、角色、专业;本发明选取了用户的下载、提问、收藏、分享、评论5种标准行为(行为操作)及部门、岗位两种用户基础属性,合计7个参数。
步骤三:抽取标准行为记录及基础属性标签,记录用户行为日志表,记录用户标准行为所关联的行为标签,记录用户基础属性关联的属性标签,行为标签和属性标签合并称为知识标签;
以用户的标准行为(行为操作)A为例(下载操作),用户行为操作A的对象有个(下载篇知识),每篇知识有个标签,那么可以得到一个知识相关联的标签矩阵:,将其记为矩阵()(每项知识最多关联5个标签)。其中,为操作A的第篇知识的第个标签。如果知识只有3个标签,则,都为空值。
步骤六:汇集知识标签,分析并合并所有加权矩阵,统一标签计量维度,得到用户画像并推荐相似知识:
步骤a:记录标签为对象,记录标签对象,以此类推。当遇到重复标签时,仅增加对象权重,不新增标签对象。首先统计矩阵内的标签权重。矩阵内最多有个标签,其中标签出现次,标签出现次……我们可以推算出,标签的权重为。整个矩阵内所有标签的权重之和为
下面以用户张三为例:
用户张三在管理员设定的30天里。
…
部门标签中,权重为10,
根据得出的标签权重,系统进行赋权搜索,得出基于用户画像的知识相似推荐。
以上述依据本发明的理想实施例为启示,通过上述的说明内容,相关工作人员完全可以在不偏离本项发明技术思想的范围内,进行多样的变更以及修改。本项发明的技术性范围并不局限于说明书上的内容,必须要根据权利要求范围来确定其技术性范围。
Claims (1)
1.用户画像知识相似度计算方法,其特征在于:包括以下步骤
步骤一:统计影响用户画像的标准行为及基础属性,所述标准行为包括查看、点赞、分享、收藏、下载、评论和提问,所述基础属性包括部门、岗位、角色和专业;
所述标准行为选取下载、提问、收藏、分享、评论5种行为操作,所述基础属性选取部门和岗位,合计7个参数;
步骤三:抽取标准行为记录及基础属性标签,记录用户行为日志表,记录用户标准行为所关联的行为标签,记录用户基础属性关联的属性标签,行为标签和属性标签合并称为知识标签;
步骤六:汇集知识标签,分析并合并所有加权矩阵,统一标签计量维度,得到用户画像并推荐相似知识,具体过程为:
统计矩阵内的标签权重,矩阵内最多有个标签,其中对象出现次,对象出现次,……,对象出现次,推算出对象的权重为,整个矩阵内所有标签的权重之和为,保证权重的总和始终是对该操作预设的权重值,标准行为A对应的标签数组对应权重,这是一个1的矩阵,其和为;
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010856930.2A CN111737588B (zh) | 2020-08-24 | 2020-08-24 | 用户画像知识相似度计算方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010856930.2A CN111737588B (zh) | 2020-08-24 | 2020-08-24 | 用户画像知识相似度计算方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111737588A true CN111737588A (zh) | 2020-10-02 |
CN111737588B CN111737588B (zh) | 2021-01-08 |
Family
ID=72658767
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010856930.2A Active CN111737588B (zh) | 2020-08-24 | 2020-08-24 | 用户画像知识相似度计算方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111737588B (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102867016A (zh) * | 2012-07-18 | 2013-01-09 | 北京开心人信息技术有限公司 | 一种基于标签的社交网络用户兴趣挖掘方法与装置 |
CN107590675A (zh) * | 2017-07-25 | 2018-01-16 | 广州智选网络科技有限公司 | 一种基于大数据的用户购物行为识别方法、储存设备及移动终端 |
CN108256119A (zh) * | 2018-02-14 | 2018-07-06 | 北京方正阿帕比技术有限公司 | 一种资源推荐模型的构建方法及基于该模型的资源推荐方法 |
CN111538751A (zh) * | 2020-03-23 | 2020-08-14 | 重庆特斯联智慧科技股份有限公司 | 物联网数据的标签化用户画像生成系统及方法 |
-
2020
- 2020-08-24 CN CN202010856930.2A patent/CN111737588B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102867016A (zh) * | 2012-07-18 | 2013-01-09 | 北京开心人信息技术有限公司 | 一种基于标签的社交网络用户兴趣挖掘方法与装置 |
CN107590675A (zh) * | 2017-07-25 | 2018-01-16 | 广州智选网络科技有限公司 | 一种基于大数据的用户购物行为识别方法、储存设备及移动终端 |
CN108256119A (zh) * | 2018-02-14 | 2018-07-06 | 北京方正阿帕比技术有限公司 | 一种资源推荐模型的构建方法及基于该模型的资源推荐方法 |
CN111538751A (zh) * | 2020-03-23 | 2020-08-14 | 重庆特斯联智慧科技股份有限公司 | 物联网数据的标签化用户画像生成系统及方法 |
Also Published As
Publication number | Publication date |
---|---|
CN111737588B (zh) | 2021-01-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Kershaw Jr et al. | Forest mensuration | |
Gardener | Statistics for ecologists using R and Excel: data collection, exploration, analysis and presentation | |
Cook et al. | Applied regression including computing and graphics | |
US10191968B2 (en) | Automated data analysis | |
Goldberg et al. | On phylogenetic tests of irreversible evolution | |
US10503756B2 (en) | Cluster processing and ranking methods including methods applicable to clusters developed through density based merging | |
WO2000010103A1 (fr) | Procede et dispositif de recuperation, de stockage et de triage de donnees formatees en tableaux | |
CN110222331B (zh) | 谎言识别方法及装置、存储介质、计算机设备 | |
CN110929203A (zh) | 异常用户的识别方法、装置、设备及存储介质 | |
CN111581486B (zh) | 一种信息分配方法及装置 | |
Kang | Efficient SAS programs for computing path coefficients and index weights for selection indices | |
CN112347352A (zh) | 一种课程推荐方法、装置及存储介质 | |
Fennell et al. | Predicting and explaining behavioral data with structured feature space decomposition | |
Jain et al. | AgriBot: agriculture-specific question answer system | |
CN115345530A (zh) | 商场地址推荐方法、装置、设备及计算机可读存储介质 | |
CN115101160A (zh) | 药品销售数据挖掘和检索方法及装置 | |
Møller et al. | Mechanistic spatio-temporal point process models for marked point processes, with a view to forest stand data | |
CN116703328B (zh) | 一种项目评审方法及系统 | |
CN111737588B (zh) | 用户画像知识相似度计算方法 | |
CN111767474A (zh) | 一种基于用户操作行为构建用户画像的方法及设备 | |
Upton et al. | Introducing statistics | |
Sinha | Uses of multivariate methods in the study of stored-grain ecosystems | |
CN115375484A (zh) | 基于矩阵分解的保险产品提取方法和装置、设备及介质 | |
Feoli et al. | Validation of phytosociological classifications based on a fuzzy set approach | |
JP2000148770A (ja) | 問合せ文書の分類装置および方法ならびに当該方法を記述したプログラムを記録した記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |