CN111737588B - 用户画像知识相似度计算方法 - Google Patents
用户画像知识相似度计算方法 Download PDFInfo
- Publication number
- CN111737588B CN111737588B CN202010856930.2A CN202010856930A CN111737588B CN 111737588 B CN111737588 B CN 111737588B CN 202010856930 A CN202010856930 A CN 202010856930A CN 111737588 B CN111737588 B CN 111737588B
- Authority
- CN
- China
- Prior art keywords
- label
- knowledge
- user
- matrix
- labels
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000004364 calculation method Methods 0.000 title claims abstract description 8
- 238000000034 method Methods 0.000 claims abstract description 16
- 230000006399 behavior Effects 0.000 claims description 50
- 239000011159 matrix material Substances 0.000 claims description 50
- 238000003491 array Methods 0.000 claims description 5
- 238000005259 measurement Methods 0.000 claims description 3
- 238000004458 analytical method Methods 0.000 abstract description 2
- 230000003044 adaptive effect Effects 0.000 abstract 1
- 230000005484 gravity Effects 0.000 abstract 1
- 238000012163 sequencing technique Methods 0.000 abstract 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/16—Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Mathematical Physics (AREA)
- General Engineering & Computer Science (AREA)
- Pure & Applied Mathematics (AREA)
- Mathematical Optimization (AREA)
- Mathematical Analysis (AREA)
- Computational Mathematics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Computation (AREA)
- Evolutionary Biology (AREA)
- Computing Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Algebra (AREA)
- Software Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了用户画像知识相似度计算方法,属于智能分析技术领域,首先,规定用户的重要行为及个人基础属性选取个数及以及具体行为操作和属性内容。其次,对每项用户行为及用户属性的进行参数赋权,决定用户行为和用户属性在整体知识相似度计算中的比重值。抽取用户的行为记录和属性,统计用户行为访问过知识关联的标签,并对标签一一赋权。最后,汇集用户知识标签的总体权重值,根据权重高低排序,得出用户知识画像。本发明基于用户行为操作及个人基础属性的参数权重计算知识相似度,通过用户的具体行为操作绘制用户画像,并相应地返回适配的相似知识。该方法的知识推荐准确度高,推荐比例可以动态调整,操作便捷。
Description
技术领域
本发明涉及一种用户画像知识相似度计算方法,属于智能分析技术领域。
背景技术
当今是一个海量数据的时代,用户在各网站都能接收到大量信息。这其中有很大一部分都是无效、重复、或者用户不感兴趣的垃圾流量。用户在查询知识时需要花费大量的时间、精力来遍历搜索结果,或在茫茫知识库中打捞。为了向用户精准投放符合用户行为习惯及个人特征的相似知识,需要一种能够动态调整权重比例,并按照单篇知识的标签进行统计,得出用户知识画像和个人知识标签,进行动态知识相似推荐。
发明内容
为了解决上述技术问题,本发明提供一种用户画像知识相似度计算方法,其具体技术方案如下:
用户画像知识相似度计算方法,其特征在于:包括以下步骤
步骤一:统计影响用户画像的标准行为及基础属性,所述标准行为包括查看、点赞、分享、收藏、下载、评论和提问,所述基础属性包括部门、岗位、角色和专业;
所述标准行为选取下载、提问、收藏、分享、评论5种行为操作,所述基础属性选取部门和岗位,合计7个参数;
步骤三:抽取标准行为记录及基础属性标签,记录用户行为日志表,记录用户标准行为所关联的行为标签,记录用户基础属性关联的属性标签,行为标签和属性标签合并称为知识标签;
步骤六:汇集知识标签,分析并合并所有加权矩阵,统一标签计量维度,得到用户画像并推荐相似知识,具体过程为:
统计矩阵内的标签权重,矩阵内最多有个标签,其中对象出现次,对象出现次,……,对象出现次,推算出对象的权重为,整个矩阵内所有标签的权重之和为,保证权重的总和始终是对该操作预设的权重值,标准行为A对应的标签数组对应权重,这是一个1的矩阵,其和为;
本发明的有益效果是:
本发明通过对用户的行为操作及个人属性进行分析,记录操作相关知识的标签,并动态赋权,得到实时更新的用户知识画像。通过用户画像知识相似度的计算方法,量化用户对知识的关注度,明确用户的知识标签占比,为精准投放符合用户行为习惯及个人特征的相似知识提供了方法论。
附图说明
图1是本发明的流程图。
具体实施方式
如图1所示,本发明的用户画像知识相似度计算方法,包括以下步骤:
步骤一:统计影响用户画像的标准行为及基础属性,标准行为包括查看、点赞、分享、收藏、下载、评论、提问,所述基础属性包括部门、岗位、角色、专业;本发明选取了用户的下载、提问、收藏、分享、评论5种标准行为(行为操作)及部门、岗位两种用户基础属性,合计7个参数。
步骤三:抽取标准行为记录及基础属性标签,记录用户行为日志表,记录用户标准行为所关联的行为标签,记录用户基础属性关联的属性标签,行为标签和属性标签合并称为知识标签;
以用户的标准行为(行为操作)A为例(下载操作),用户行为操作A的对象有个(下载篇知识),每篇知识有个标签,那么可以得到一个知识相关联的标签矩阵:,将其记为矩阵()(每项知识最多关联5个标签)。其中,为操作A的第篇知识的第个标签。如果知识只有3个标签,则,都为空值。
步骤六:汇集知识标签,分析并合并所有加权矩阵,统一标签计量维度,得到用户画像并推荐相似知识:
步骤a:记录标签为对象,记录标签对象,以此类推。当遇到重复标签时,仅增加对象权重,不新增标签对象。首先统计矩阵内的标签权重。矩阵内最多有个标签,其中标签出现次,标签出现次……我们可以推算出,标签的权重为。整个矩阵内所有标签的权重之和为:
这组标签数组就是用户行为及基础信息综合权重得到的用户画像标签。
下面以用户张三为例:
用户张三在管理员设定的30天里。
…
部门标签中,权重为10,
根据得出的标签权重,系统进行赋权搜索,得出基于用户画像的知识相似推荐。
以上述依据本发明的理想实施例为启示,通过上述的说明内容,相关工作人员完全可以在不偏离本项发明技术思想的范围内,进行多样的变更以及修改。本项发明的技术性范围并不局限于说明书上的内容,必须要根据权利要求范围来确定其技术性范围。
Claims (1)
1.用户画像知识相似度计算方法,其特征在于:包括以下步骤:
步骤一:统计影响用户画像的标准行为及基础属性;
步骤三:抽取标准行为记录及基础属性标签,记录用户行为日志表,记录用户标准行为所关联的行为标签,记录用户基础属性关联的属性标签,行为标签和属性标签合并称为知识标签;
步骤六:汇集知识标签,分析并合并所有加权矩阵,统一标签计量维度,得到用户画像并推荐相似知识,具体过程为:
统计标签矩阵内的标签权重,标签矩阵内最多有个标签,其中标签出现次,标签出现次,……,标签出现次,推算出,标签的权重为 ,整个标签矩阵内所有标签的权重之和为 ,保证权重的总和始终是对该操作预设的权重值,标准行为A对应的标签数组中的各个标签对应的权重为,这是一个1的一维矩阵记为,其权重和为;
得到一系列按照权重高低排列的标签数组,标签数组就是用户行为及基础信息综合权重得到的用户画像标签。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010856930.2A CN111737588B (zh) | 2020-08-24 | 2020-08-24 | 用户画像知识相似度计算方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010856930.2A CN111737588B (zh) | 2020-08-24 | 2020-08-24 | 用户画像知识相似度计算方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111737588A CN111737588A (zh) | 2020-10-02 |
CN111737588B true CN111737588B (zh) | 2021-01-08 |
Family
ID=72658767
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010856930.2A Active CN111737588B (zh) | 2020-08-24 | 2020-08-24 | 用户画像知识相似度计算方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111737588B (zh) |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102867016A (zh) * | 2012-07-18 | 2013-01-09 | 北京开心人信息技术有限公司 | 一种基于标签的社交网络用户兴趣挖掘方法与装置 |
CN107590675B (zh) * | 2017-07-25 | 2021-01-08 | 广州智选网络科技有限公司 | 一种基于大数据的用户购物行为识别方法、储存设备及移动终端 |
CN108256119B (zh) * | 2018-02-14 | 2021-12-28 | 北京方正阿帕比技术有限公司 | 一种资源推荐模型的构建方法及基于该模型的资源推荐方法 |
CN111538751B (zh) * | 2020-03-23 | 2021-05-04 | 重庆特斯联智慧科技股份有限公司 | 物联网数据的标签化用户画像生成系统及方法 |
-
2020
- 2020-08-24 CN CN202010856930.2A patent/CN111737588B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN111737588A (zh) | 2020-10-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10191968B2 (en) | Automated data analysis | |
Schumacker et al. | Understanding statistics using R | |
CN109408665A (zh) | 一种信息推荐方法及装置、存储介质 | |
CN110008399A (zh) | 一种推荐模型的训练方法及装置、一种推荐方法及装置 | |
US10503756B2 (en) | Cluster processing and ranking methods including methods applicable to clusters developed through density based merging | |
CN109299344A (zh) | 排序模型的生成方法、搜索结果的排序方法、装置及设备 | |
Jain et al. | AgriBot: agriculture-specific question answer system | |
CN111581486B (zh) | 一种信息分配方法及装置 | |
CN112347352A (zh) | 一种课程推荐方法、装置及存储介质 | |
Caruana et al. | Mining citizen science data to predict orevalence of wild bird species | |
CN116703328A (zh) | 一种项目评审方法及系统 | |
CN115101160A (zh) | 药品销售数据挖掘和检索方法及装置 | |
Rastogi | Fundamentals Of Biostatistics 2Nd Ed | |
CN110263207A (zh) | 图像搜索方法、装置、设备及计算机可读存储介质 | |
Møller et al. | Mechanistic spatio-temporal point process models for marked point processes, with a view to forest stand data | |
CN111737588B (zh) | 用户画像知识相似度计算方法 | |
Xie et al. | A combination of boosting and bagging for kdd cup 2009-fast scoring on a large database | |
Upton et al. | Introducing statistics | |
CN113962335B (zh) | 一种可灵活配置的数据全过程处理方法 | |
CN110096708A (zh) | 一种定标集确定方法及装置 | |
CN110851661B (zh) | 用户id映射关系的确定方法及装置、电子设备 | |
Feoli et al. | Validation of phytosociological classifications based on a fuzzy set approach | |
JP2000148770A (ja) | 問合せ文書の分類装置および方法ならびに当該方法を記述したプログラムを記録した記録媒体 | |
Charest et al. | Using balanced iterative reducing and clustering hierarchies to compute approximate rank statistics on massive datasets | |
US20050033723A1 (en) | Method, system, and computer program product for sorting data |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |