CN113032441A - 一种基于大数据技术的用户画像分析系统 - Google Patents
一种基于大数据技术的用户画像分析系统 Download PDFInfo
- Publication number
- CN113032441A CN113032441A CN202110315419.6A CN202110315419A CN113032441A CN 113032441 A CN113032441 A CN 113032441A CN 202110315419 A CN202110315419 A CN 202110315419A CN 113032441 A CN113032441 A CN 113032441A
- Authority
- CN
- China
- Prior art keywords
- user
- label
- data
- module
- tag
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000004458 analytical method Methods 0.000 title claims abstract description 17
- 238000005516 engineering process Methods 0.000 title claims abstract description 15
- 238000013500 data storage Methods 0.000 claims abstract description 39
- 238000007726 management method Methods 0.000 claims abstract description 26
- 230000000737 periodic effect Effects 0.000 claims 1
- 238000010586 diagram Methods 0.000 description 3
- 238000000034 method Methods 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 230000004075 alteration Effects 0.000 description 1
- 238000010191 image analysis Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2457—Query processing with adaptation to user needs
- G06F16/24573—Query processing with adaptation to user needs using data annotations, e.g. user-defined metadata
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/23—Updating
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Library & Information Science (AREA)
- Computational Linguistics (AREA)
- Processing Or Creating Images (AREA)
Abstract
本发明提供了一种基于大数据技术的用户画像分析系统,其包括数据存储模块、标签管理模块、画像生成模块和控制模块;所述数据存储模块用于存储企业用工匹配系统的用户的标签数据;所述标签管理模块用于定期对所述数据存储模块中存储的标签数据进行更新;所述画像生成模块用于基于所述数据存储模块中存储的标签数据得到用户标签,并使用所述用户标签对所述用户进行分析,生成用户画像;所述控制模块用于对所述数据存储模块、标签管理模块和画像生成模块进行控制。本发明对数据存储模块中存储的用户标签数据进行定期更新,在用户标签生成时,不仅考虑了用户的关键字,而且还考虑了用户的浏览记录等动态变化的数据,因此,能够准确地得到用户的画像。
Description
技术领域
本发明涉及分析领域,尤其涉及一种基于大数据技术的用户画像分析系统。
背景技术
用户画像,即用户标签化,即通过收集与分析用户的社会属性、网络行为习惯等主要信息后,完美地抽象出一个用户的全貌的方式。现有的企业用工匹配系统,一般仅会根据用户搜索的关键字生成用户画像,并根据用户画像向用户进行岗位信息推送,但是关键字往往并不能很好地反应用户的综合情况,因此,容易导致推送的岗位不够精准,这是用户画像不准确导致的。因此我们需要一种能够准确分析出用户画像的系统。
发明内容
鉴于上述问题,本发明的目的在于提供一种基于大数据技术的用户画像分析系统。
本发明提供了一种基于大数据技术的用户画像分析系统,其包括数据存储模块、标签管理模块、画像生成模块和控制模块;
所述数据存储模块用于存储企业用工匹配系统的用户的标签数据;
所述标签管理模块用于定期对所述数据存储模块中存储的标签数据进行更新;
所述画像生成模块用于基于所述数据存储模块中存储的标签数据得到用户标签,并使用所述用户标签对所述用户进行分析,生成用户画像;
所述控制模块用于对所述数据存储模块、标签管理模块和画像生成模块进行控制。
优选地,所述用户的标签数据包括:
用户的年龄、学历、工作经历、搜索关键字、求职岗位、浏览记录。
优选地,所述标签数据从用户的求职简历获取以及定期从服务器日志获取。
优选地,所述定期对所述标签数据进行更新,包括:
判断当前时刻与前一次对所述标签数据进行更新的时刻之间间隔时长是否小于预设的标签数据更新的时间周期T,若否,则对所述标签数据进行更新;若是,则不对所述标签数据进行更新。
优选地,所述基于所述数据存储模块中存储的标签数据得到用户标签,包括:
确定待判断标签的集合;
对于所述集合中的待判断标签,确定所述待判断标签对应的判断条件;
判断所述标签数据是否满足所述判断条件,若是,则将所述待判断标签作为所述用户的用户标签。
优选地,所述使用所述用户标签对所述用户进行分析,生成用户画像,包括:
对意义相近的用户标签进行上位合并,得到上位标签;
使用所述上位标签表征所述用户画像。
优选地,所述对所述数据存储模块、标签管理模块和画像生成模块进行控制,包括:
对所述数据存储模块中存储的标签数据进行修改;
对标签管理模块进行标签数据更新的时间周期T进行设置;
对所述画像生成模块设置上位合并规则,所述上位合并规则用于对意义相近的用户标签进行上位合并。
与现有技术相比,本发明的优点在于:
本发明设置了标签管理模块对数据存储模块中存储的用户标签数据进行定期更新,从而能够将所述数据存储模块中的标签数据始终维持在一个比较新的状态,而且,用户标签生成时,不仅考虑了用户的关键字,而且还考虑了用户的浏览记录等动态变化的数据,有利于为用户生成相应的标签,因此,在对用户进行画像分析时,能够准确地得到用户的画像。
附图说明
利用附图对本发明作进一步说明,但附图中的实施例不构成对本发明的任何限制,对于本领域的普通技术人员,在不付出创造性劳动的前提下,还可以根据以下附图获得其它的附图。
图1,为本发明一种基于大数据技术的用户画像分析系统的一种示例性实施例图。
图2,为本发明控制模块的一种示例性实施例图。
图3,为本发明权限判断单元的一种示例性实施例图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能理解为对本发明的限制。
如图1所示的一种实施例,本发明提供了一种基于大数据技术的用户画像分析系统,其包括数据存储模块、标签管理模块、画像生成模块和控制模块;
所述数据存储模块用于存储企业用工匹配系统的用户的标签数据;
所述标签管理模块用于定期对所述数据存储模块中存储的标签数据进行更新;
所述画像生成模块用于基于所述数据存储模块中存储的标签数据得到用户标签,并使用所述用户标签对所述用户进行分析,生成用户画像;
所述控制模块用于对所述数据存储模块、标签管理模块和画像生成模块进行控制。
优选地,所述用户的标签数据包括:
用户的年龄、学历、工作经历、搜索关键字、求职岗位、浏览记录。
所述浏览记录,指的是用户在使用企业用工匹配系统时,操作的记录,例如对企业用工匹配系统内某个板块的持续浏览时长、浏览频率等,若用户在一个很短的时间周期内多次浏览企业用工匹配系统的某个板块,且每次的浏览时长均大于所有用户的浏览时长的平均值,则表明该用户对该板块特别感兴趣,因此,可以将该板块对应的待招聘岗位结合用户的求职意向向用户进行推送。
优选地,所述标签数据从用户的求职简历获取以及定期从服务器日志获取。
优选地,所述定期对所述标签数据进行更新,包括:
判断当前时刻与前一次对所述标签数据进行更新的时刻之间间隔时长是否小于预设的标签数据更新的时间周期T,若否,则对所述标签数据进行更新;若是,则不对所述标签数据进行更新。
对标签数据的更新包括:对用户的年龄、浏览记录、搜索关键字等随着时间变化而变化的标签数据进行更新。
优选地,所述基于所述数据存储模块中存储的标签数据得到用户标签,包括:
确定待判断标签的集合;
对于所述集合中的待判断标签,确定所述待判断标签对应的判断条件;
判断所述标签数据是否满足所述判断条件,若是,则将所述待判断标签作为所述用户的用户标签。
例如,若当前的待判断标签为“青年”,判断条件:为年龄处于15-34岁之间,
如果用户的年龄处于15-34岁之间,则将“青年”作为用户的用户标签。
优选地,所述使用所述用户标签对所述用户进行分析,生成用户画像,包括:
对意义相近的用户标签进行上位合并,得到上位标签;
使用所述上位标签表征所述用户画像。
意义相近的用户标签,例如“年龄小”、“学生党”,如果用户的年龄在15-34岁之间,则这两个用户标签可以上位合并得到上位标签“青年”。
优选地,所述对所述数据存储模块、标签管理模块和画像生成模块进行控制,包括:
对所述数据存储模块中存储的标签数据进行修改;
对标签管理模块进行标签数据更新的时间周期T进行设置;
对所述画像生成模块设置上位合并规则,所述上位合并规则用于对意义相近的用户标签进行上位合并。
优选地,如图2所示,所述控制模块包括数据存储模块控制单元、标签管理模块控制单元、画像生成模块控制单元和权限判断单元;
所述数据存储模块控制单元用于对所述数据存储模块中存储的标签数据进行修改;
所述标签管理模块控制单元用于对标签管理模块进行标签数据更新的时间周期T进行设置;
所述画像生成模块控制单元用于设置所述画像生成模块中的上位合并规则;
所述权限判断单元用于对用户画像分析系统的使用者是否具有操作所述数据存储模块控制单元、标签管理模块控制单元和画像生成模块控制单元的权限进行判断,
若所述使用者具有操作权限,则向所述使用这开放操作所述数据存储模块控制单元、标签管理模块控制单元和画像生成模块控制单元的权限。
进行权限管理,主要是为了防止不具备操作权限的人员使用本发明的用户画像分析系统,造成用户的隐私数据泄露,以及防止不具备操作权限的人员对存储模块中存储的标签数据进行非法修改,导致得到错误的用户画像。
优选地,如图3所示,所述权限判断单元包括图像处理子单元和图像匹配子单元;
所述图像处理子单元用于获取所述使用者的脸部图像,并将所述脸部图像转换为灰度图像;
所述图像匹配子单元用于将所述灰度图像与预先存储的具有操作权限的人员的脸部图像对应的灰度图像进行匹配,若匹配成功,则判定所述使用者具有操作权限,否则,判定所述使用者不具有操作权限。
优选地,所述将所述脸部图像转换为灰度图像,包括:
使用加权平均值算法对所述脸部图像进行灰度化处理,获得第一图像;
对所述第一图像进行调节处理,获得灰度图像。
优选地,所述对所述第一图像进行调节处理,获得灰度图像,包括:
分别计算所述脸部图像中的每个像素点的像素值:
式中,xsva(i)表示所述脸部图像中的像素点i的像素值,Ui表示i的h×h大小的邻域的像素点的集合,dist(i,j)表示i和Ui中的元素j之间的空间距离,h(i)和h(j)分别表示i和j在hsv颜色模型中的h分量的分量值;distf表示Ui中的元素与i之间的空间距离的标准差,numui表示Ui中包含的元素的总数;
获取所述第一图像中灰度值最大的像素点,将其记为nodmax,将nodmax的灰度值表示为f(nodmax),对于nodmax的4邻域中的像素值小于f(nodmax)的像素点b,使用下述方式确定其调节后的灰度值:
式中,af(b)表示b调节后的灰度值,xsva(b)和xsva(nodmax)分别表示b和nodmax在所述脸部图像中对应的像素点的像素值;
对于像素点b,其调节后的灰度值为af(b),对于像素点b的4邻域中的像素值小于f(nodmax)的像素点c,使用下述方式确定其调节后的灰度值:
式中,af(c)表示c调节后的灰度值,xsva(b)和xsva(c)分别表示b和c在所述脸部图像中对应的像素点的像素值;
以此类推,直到第一图像中所有的像素值小于f(nodmax)的像素点均进行了调节处理后,才结束调节处理,从而得到灰度图像。
传统的灰度化方式,例如最大值法,加权平均值法等,在对图像进行灰度化后,图像中相邻的像素点之间的区别程度被改变,即灰度图像不能够很好地保留原来的彩色图像所携带的信息,因此,本身在进行了灰度化之后,通过计算原来的彩色图像,即脸部图像中各个像素点的像素值,然后根据相邻的像素点之间的像素值来还原原来的细节信息,从而有效地减少信息的丢失程度。
对于上述调节过程,因为灰度值最高的点在脸部图像的hsv模型中的h分量的分量值一般也是最大值,因此,以灰度值最高的点为基准进行调节,能够有效地保留像素点之间的区别程度。
与现有技术相比,本发明的优点在于:
本发明设置了标签管理模块对数据存储模块中存储的用户标签数据进行定期更新,从而能够将所述数据存储模块中的标签数据始终维持在一个比较新的状态,而且,用户标签生成时,不仅考虑了用户的关键字,而且还考虑了用户的浏览记录等动态变化的数据,有利于为用户生成相应的标签,因此,在对用户进行画像分析时,能够准确地得到用户的画像。
尽管已经示出和描述了本发明的实施例,本领域技术人员可以理解:在不脱离本发明的原理和宗旨的情况下可以对这些实施例进行多种变化、修改、替换和变形,本发明的范围由权利要求及其等同物限定。
Claims (7)
1.一种基于大数据技术的用户画像分析系统,其特征在于,其包括数据存储模块、标签管理模块、画像生成模块和控制模块;
所述数据存储模块用于存储企业用工匹配系统的用户的标签数据;
所述标签管理模块用于定期对所述数据存储模块中存储的标签数据进行更新;
所述画像生成模块用于基于所述数据存储模块中存储的标签数据得到用户标签,并使用所述用户标签对所述用户进行分析,生成用户画像;
所述控制模块用于对所述数据存储模块、标签管理模块和画像生成模块进行控制。
2.根据权利要求1所述的一种基于大数据技术的用户画像分析系统,其特征在于,所述用户的标签数据包括:
用户的年龄、学历、工作经历、搜索关键字、求职岗位、浏览记录。
3.根据权利要求1所述的一种基于大数据技术的用户画像分析系统,其特征在于,所述标签数据从用户的求职简历获取以及定期从服务器日志获取。
4.根据权利要求1所述的一种基于大数据技术的用户画像分析系统,其特征在于,所述定期对所述标签数据进行更新,包括:
判断当前时刻与前一次对所述标签数据进行更新的时刻之间间隔时长是否小于预设的标签数据更新的时间周期T,若否,则对所述标签数据进行更新;若是,则不对所述标签数据进行更新。
5.根据权利要求1所述的一种基于大数据技术的用户画像分析系统,其特征在于,所述基于所述数据存储模块中存储的标签数据得到用户标签,包括:
确定待判断标签的集合;
对于所述集合中的待判断标签,确定所述待判断标签对应的判断条件;
判断所述标签数据是否满足所述判断条件,若是,则将所述待判断标签作为所述用户的用户标签。
6.根据权利要求4所述的一种基于大数据技术的用户画像分析系统,其特征在于,所述使用所述用户标签对所述用户进行分析,生成用户画像,包括:
对意义相近的用户标签进行上位合并,得到上位标签;
使用所述上位标签表征所述用户画像。
7.根据权利要求6所述的一种基于大数据技术的用户画像分析系统,其特征在于,所述对所述数据存储模块、标签管理模块和画像生成模块进行控制,包括:
对所述数据存储模块中存储的标签数据进行修改;
对标签管理模块进行标签数据更新的时间周期T进行设置;
对所述画像生成模块设置上位合并规则,所述上位合并规则用于对意义相近的用户标签进行上位合并。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110315419.6A CN113032441A (zh) | 2021-03-24 | 2021-03-24 | 一种基于大数据技术的用户画像分析系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110315419.6A CN113032441A (zh) | 2021-03-24 | 2021-03-24 | 一种基于大数据技术的用户画像分析系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113032441A true CN113032441A (zh) | 2021-06-25 |
Family
ID=76473909
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110315419.6A Pending CN113032441A (zh) | 2021-03-24 | 2021-03-24 | 一种基于大数据技术的用户画像分析系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113032441A (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018078541A1 (en) * | 2016-10-27 | 2018-05-03 | Reliance Industries Limited | An integrated pre-assessment and recruitment system and a method thereof |
CN109615432A (zh) * | 2018-12-14 | 2019-04-12 | 成都德迈安科技有限公司 | 基于大数据的消费者行为画像工具 |
CN110008292A (zh) * | 2019-04-11 | 2019-07-12 | 北京妙医佳信息技术有限公司 | 数据融合方法、装置、电子设备及可读存储介质 |
CN110135504A (zh) * | 2019-05-20 | 2019-08-16 | 杭州弧途科技有限公司 | 一种基于人工智能的大学生兼职精确匹配方法 |
CN110399476A (zh) * | 2019-06-18 | 2019-11-01 | 平安科技(深圳)有限公司 | 人才画像的生成方法、装置、设备及存储介质 |
CN111192025A (zh) * | 2019-12-31 | 2020-05-22 | 广东德诚科教有限公司 | 职业信息匹配方法、装置、计算机设备和存储介质 |
-
2021
- 2021-03-24 CN CN202110315419.6A patent/CN113032441A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018078541A1 (en) * | 2016-10-27 | 2018-05-03 | Reliance Industries Limited | An integrated pre-assessment and recruitment system and a method thereof |
CN109615432A (zh) * | 2018-12-14 | 2019-04-12 | 成都德迈安科技有限公司 | 基于大数据的消费者行为画像工具 |
CN110008292A (zh) * | 2019-04-11 | 2019-07-12 | 北京妙医佳信息技术有限公司 | 数据融合方法、装置、电子设备及可读存储介质 |
CN110135504A (zh) * | 2019-05-20 | 2019-08-16 | 杭州弧途科技有限公司 | 一种基于人工智能的大学生兼职精确匹配方法 |
CN110399476A (zh) * | 2019-06-18 | 2019-11-01 | 平安科技(深圳)有限公司 | 人才画像的生成方法、装置、设备及存储介质 |
CN111192025A (zh) * | 2019-12-31 | 2020-05-22 | 广东德诚科教有限公司 | 职业信息匹配方法、装置、计算机设备和存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10943497B2 (en) | Personalized e-learning using a deep-learning-based knowledge tracing and hint-taking propensity model | |
US20230222341A1 (en) | Targeted crowd sourcing for metadata management across data sets | |
US8385660B2 (en) | Mixed media reality indexing and retrieval for repeated content | |
US11381651B2 (en) | Interpretable user modeling from unstructured user data | |
US11080376B2 (en) | Anonymous cross-device, cross-channel, and cross-venue user identification using adaptive deep learning | |
CN102483745A (zh) | 共同选择图像分类 | |
US10977484B2 (en) | System and method for smart presentation system | |
US20200184425A1 (en) | System and method for screening candidates and including a process for autobucketing candidate roles | |
US20200111046A1 (en) | Automated and intelligent time reallocation for agenda items | |
CN114722281B (zh) | 基于用户画像及用户选课行为的培训课程配置方法、装置 | |
US20240104159A1 (en) | Creating an effective product using an attribute solver | |
CN113449698A (zh) | 纸质文档的自动化录入方法、系统、装置及存储介质 | |
WO2021248132A1 (en) | Machine learning systems for collaboration prediction and methods for using same | |
CN112328905A (zh) | 线上营销内容推送方法、装置、计算机设备及存储介质 | |
CN112115264A (zh) | 面向数据分布变化的文本分类模型调整方法 | |
CN113032441A (zh) | 一种基于大数据技术的用户画像分析系统 | |
CN105162931A (zh) | 一种通信号码的分类方法及装置 | |
Vijayalakshmi | Centralized attendance monitoring system | |
Watson | Applying knowledge management: Techniques for building organisational memories | |
KR20010028739A (ko) | 사용자 피드백 변화를 반영한 멀티미디어 데이타 구조 및 멀티미디어 데이타의 특징소 가중치 결정방법 | |
CN115221307A (zh) | 一种文章识别方法、装置、计算机设备及存储介质 | |
CN109145308B (zh) | 一种基于改进朴素贝叶斯的涉密文本识别方法 | |
CN115344774A (zh) | 用户账号的筛选方法、装置及服务器 | |
US11893401B1 (en) | Real-time event status via an enhanced graphical user interface | |
CN115720148B (zh) | 一种工业物联网信息可视化方法、服务器和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20210625 |
|
RJ01 | Rejection of invention patent application after publication |