CN107633036A - 一种微博用户画像方法、电子设备、存储介质、系统 - Google Patents
一种微博用户画像方法、电子设备、存储介质、系统 Download PDFInfo
- Publication number
- CN107633036A CN107633036A CN201710807779.1A CN201710807779A CN107633036A CN 107633036 A CN107633036 A CN 107633036A CN 201710807779 A CN201710807779 A CN 201710807779A CN 107633036 A CN107633036 A CN 107633036A
- Authority
- CN
- China
- Prior art keywords
- data
- user
- user base
- base data
- portrait
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种微博用户画像方法,该方法包括:获取用户基础数据;将用户基础数据进行数据处理;对已处理过的用户基础数据进行标注处理;创建强分类器,将标注后的用户基础数据作为强分类器的输入进行训练生成分类模型;将待判定用户数据输入到分类模型中,得到用户画像。本申请中的一种微博用户画像方法,通过获取用户基础数据,对用户基础数据进行标注处理,将SVM分类器、K‑NN分类器以及GBDT分类器进行融合生成强分类器,将标注后的用户基础数据放入强分类器进行训练,得到分类模型,将待判定的用户数据输入到分类模型中,得到更加精准的用户画像,减少了用户画像的偏差。
Description
技术领域
本发明涉及数据处理分析领域,尤其涉及一种微博用户画像方法电子设备、存储介质、系统。
背景技术
微博平台是人们记录日常生活,表达情感和观点的重要平台,基于情感分类技术对微博用户进行用户画像具有很大的意义,例如分析用户对一种商品的情感,可以辅助该商品营销方案的制定。情感分类问题本质上是一个分类问题,通过标记好的训练数据训练分类器,得到评估模型。情感分类问题本质上是一个分类问题,但传统的文本分类问题是根据文本的话题进行分类,例如判断一篇文档是关于政治的还是关于体育的,而文本情感分类是对文本表达的情感进行极性的判断,例如判断一条电影评论表达的观点是积极的还是消极的。相对于传统的基于主题的分类,情感分类更具挑战性的一个方面表现在主题可以单独根据关键词来进行判别,例如,例如一篇文档出现了“足球”、“进球”等词语,则有很大的可能是属于体育类的。而情感的表达方式更微妙,例如,“这场电影大家怎么能够坚持坐着看完的?”这个句子没有包含一个明显具有消极情感倾向的词语,但整个句子表达的是情感倾向是消极的。可见,情感分类对于通常的基于话题的分类需要更深层次的理解。微博文本与普通文本具有很多的区别,例如微博数据集主题不统一、微博用语不规范、微博文本形式复杂,噪音多。目前的对于微博的情感分类只是简单的基于话题的分类,因此目前得到的用户画像不够准确,具有很大偏差。
发明内容
为了克服现有技术的不足,本发明的目的之一在于提供一种微博用户画像方法,其能解决目前得到的用户画像不够准确,具有很大偏差的问题。
本发明的目的之二在于提供一种电子设备,其能解决目前得到的用户画像不够准确,具有很大偏差的问题。
本发明的目的之三在于提供一种计算机可读存储介质,其能解决目前得到的用户画像不够准确,具有很大偏差的问题。
本发明的目的之四在于提供一种微博用户画像系统,其能解决目前得到的用户画像不够准确,具有很大偏差的问题。
本发明的目的之一采用以下技术方案实现:
一种微博用户画像方法,该方法包括:
数据获取,获取微博平台上的用户基础数据;
标注数据,对所述用户基础数据进行标注处理,得到标注用户基础数据;
生成分类模型,创建强分类器,所述强分类器用于训练所述用户基础数据;将所述标注用户基础数据作为所述强分类器的输入进行训练生成分类模型;
生成用户画像,将待判定用户数据输入到所述分类模型中,得到用户画像。
进一步地,还包括数据处理,将所述用户基础数据进行数据清理、预处理以及特征选择,所述数据清理包括对所述用户基础数据进行去噪处理;所述预处理包括对所述用户基础数据进行分词处理、取出停止词处理、向量化处理;所述特征选择包括使用信息增益的特征选择方法选择所述用户基础数据中特征用于控制特征空间的维度。
进一步地,在所述将待判定用户数据输入到所述分类模型中之前,还包括验证所述分类模型,输入用于验证的验证数据至所述分类模型,得到验证结果,并对所述验证结果进行评估。
进一步地,所述创建强分类器具体为:
根据Bagging算法、Stacking算法对SVM分类器、K-NN分类器以及GBDT分类器进行融合,得Bagging算法融合模型和Stacking算法融合模型;
根据Boosting算法将所述Bagging算法融合模型和所述Stacking算法融合模型融为一体,得到强分类器。
进一步地,所述根据Bagging算法对所述SVM分类器、K-NN分类器以及GBDT分类器进行融合具体为:在原始训练集中每次有放回地选出子训练集,得到新训练集,根据所述SVM分类器、K-NN分类器以及GBDT分类器分别对所述新训练集进行训练,得到Bagging算法融合模型。
进一步地,所述根据Stacking算法对所述SVM分类器、K-NN分类器以及GBDT分类器进行融合具体为:分别将原始训练集输入到所述SVM分类器、K-NN分类器以及GBDT分类器中进行训练,得到训练结果,将所述训练结果输入到所述SVM分类器中,得到Stacking算法融合模型。
进一步地,所述根据Boosting算法将所述Bagging算法融合模型和所述Stacking算法融合模型融为一体具体为通过将所述Bagging算法融合模型和所述Stacking算法融合模型迭代产生新的强分类器。
本发明的目的之二采用以下技术方案实现:
一种电子设备,该设备包括:处理器;
存储器;以及程序,其中所述程序被存储在所述存储器中,并且被配置成由处理器执行,所述程序包括用于执行本申请中的一种微博用户画像方法。
本发明的目的之三采用以下技术方案实现:
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行本申请中的一种微博用户画像方法。
本发明的目的之四采用以下技术方案实现:
数据获取模块:用于获取微博平台上的用户基础数据;
标注数据模块:用于对所述已处理用户数据进行标注处理,得到标注用户基础数据;
分类模型生成模块:创建强分类器,所述强分类器用于训练所述用户基础数据;将所述标注用户基础数据作为所述强分类器的输入进行训练生成分类模型;
用户画像生成模块:用于将待判定用户数据输入到所述分类模型生成模块中的所述分类模型中,得到用户画像;
数据处理模块,所述数据处理模块用于将所述用户基础数据进行数据清理、预处理以及特征选择;所述数据处理模块包括数据清理单元、预处理单元以及特征选择单元,所述数据清理单元用于将所述用户基础数据进行去噪处理,所述预处理单元用于将所述用户基础数据进行分词处理、取出停止词处理、向量化处理,所述特征选取单元用于使用信息增益的特征选择方法选择所述用户基础数据中特征用于控制特征空间的维度。
验证模块,所述验证模块用于验证所述分类模型,输入用于验证的验证数据至所述分类模型,得到验证结果,并对所述验证结果进行评估。
相比现有技术,本发明的有益效果在于:本申请中的一种微博用户画像方法,通过获取微博平台上的用户基础数据,并对用户基础数据进行标注处理,得到标注用户基础数据,将SVM分类器、K-NN分类器以及GBDT分类器进行融合生成强分类器,并将标注用户基础数据作为强分类器的输入进行训练,得到分类模型,将待判定的用户数据输入到分类模型中,得到更加精准的用户画像,减少了用户画像的偏差。
附图说明
图1为本发明中一种微博用户画像方法的流程图;
图2为本发明中一种微博用户画像系统的模块框图;
图3为本发明中一种微博用户画像方法中的Bagging算法融合过程示意图;
图4为本发明中一种微博用户画像方法中的Stacking算法融合过程示意图。
具体实施方式
下面,结合附图以及具体实施方式,对本发明做进一步描述,需要说明的是,在不相冲突的前提下,以下描述的各实施例之间或各技术特征之间可以任意组合形成新的实施例:
如图1所示的一种微博用户画像方法,该方法包括以下步骤:
步骤S10:数据获取,获取微博平台上的用户基础数据;使用网络爬虫工具抓取微博平台上的网页,再根据提取算法将抓取的网页中的用户基础数据信息提取出来,从而获取微博平台上的用户基础数据。
步骤S20:数据处理,将用户基础数据进行数据清理、预处理以及特征选择。对用户基础数据进行数据清理处理,因为用户基础数据存在噪音,数据处理包括对用户基础数据进行去噪处理,提升用户基础数据的质量;进而继续对用户基础数据进行预处理,预处理具体包括对用户基础数据进行分词处理、取出停止词处理、向量化处理,经过预处理的用户基础数据中的文本被转化为分类器输入的向量表示,最后对用户基础数据进行特征处理,预处理包括使用基于卡方验证或信息增益等特征选择方法选择用户基础数据中重要的特征,控制特征空间的维度,避免维度灾难。
步骤S30:标注数据,对用户基础数据进行标注处理,得到标注用户基础数据;此处即可直接对用户基础数据进行标注处理,也可对经过数据清理、预处理以及特征选择处理后的用户基础数据进行标记,本申请中是对经过步骤S20中数据处理过的用户基础数据进行标注;将用户基础数据标注为积极情感数据和消极情感数据,本申请中使用基于表情符号和关键词的远程监督方法来自动标注数据,以人工标记作为辅助,减少了人力成本。
步骤S40:创建强分类器,强分类器用于训练用户基础数据,对SVM分类器、k-NN分类器以及GBDT分类器进行融合生成强分类器,强分类器用于训练用户基础数据。具体为:
根据Bagging算法对SVM分类器、k-NN分类器以及GBDT分类器进行融合,得到Bagging算法融合模型;即在原始训练集中每次有放回地随机抽样的选出子训练集,将子训练集作为新训练集,根据SVM分类器、k-NN分类器以及GBDT分类器分别对新训练集进行训练,得到Bagging算法融合模型。如图3所示,Bagging算法为将原始训练集有放回的随机抽样的选出子训练集1、子训练集2、子训练集3、……、子训练集m,将上述子训练集再次作为新的训练集,在将新训练集输入到分类器1、分类器2、分类器3、……、分类器m中训练,最后得到汇集结果,图1中的分类器1、分类器2、等即代表本申请中SVM分类器、k-NN分类器以及GBDT分类器,最终得到Bagging算法融合模型;
根据Stacking算法对SVM分类器、k-NN分类器以及GBDT分类器进行融合,得到Stacking算法融合模型,分别将原始训练集输入到SVM分类器、K-NN分类器以及GBDT分类器中进行训练,得到训练结果,将训练结果输入到SVM分类器中,得到Stacking算法融合模型。如图4所示,Stacking算法融合过程为将原始训练集分别输入SVM分类器、K-NN分类器以及GBDT分类器中进行训练,将训练得到的训练结果输出,并将输出值作为输入值再次输入到SVM分类器进行训练,得到Stacking算法融合模型;
通过将Bagging算法融合模型和Stacking算法融合模型迭代产生新的强分类器,每次迭代更新样本权重,增大错误分类的数据权重并降低正确分类的数据权重。
步骤S50:将标注用户基础数据作为强分类器的输入进行训练生成分类模型。
步骤S60:验证分类模型,输入用于验证的验证数据至分类模型,得到验证结果,根据验证结果验证分类模型的准确性;使用步骤S50得到的分类模型对验证数据进行分类,验证数据为收集到的用于验证模型的数据,得到验证结果后,对验证结果评估,通过分析该模型的准确性、偏差/方差情况、学习曲线等数据,判断是否有过拟合等情况,进行如调节参数、更改算法、调整训练数据等操作,再次训练并优化模型。
步骤S70:生成用户画像,将待判定用户数据输入到分类模型中,得到用户画像;将待判定的用户数据输入到分类模型中,得到用户化像。
本申请中还包括一种电子设备,该设备包括:处理器;
存储器;以及程序,其中程序被存储在存储器中,并且被配置成由处理器执行,程序包括用于执行本申请中的一种微博用户画像方法。
本申请中还包括一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行本申请中的一种微博用户画像方法。
如图2所示为本申请的一种微博用户画像系统,该系统包括:数据获取模块:用于获取微博平台上的用户基础数据;标注数据模块:用于对用户基础数据进行标注处理,得到标注用户基础数据;分类模型生成模块:创建强分类器,强分类器用于训练用户基础数据;将标注用户基础数据作为强分类器的输入进行训练生成分类模型;用户画像生成模块:用于将待判定用户数据输入到分类模型生成模块中的分类模型中,得到用户画像。
还包括数据处理模块,数据处理模块用于将用户基础数据进行数据清理、预处理以及特征选择;数据处理模块包括数据清理单元、预处理单元以及特征选择单元,数据清理单元用于将用户基础数据进行去噪处理,预处理单元用于将用户基础数据进行分词处理、取出停止词处理、向量化处理,特征选取单元用于使用信息增益的特征选择方法选择用户基础数据中特征用于控制特征空间的维度。
还包括验证模块,验证模块用于验证分类模型,输入用于验证的验证数据至分类模型得到验证结果,并对验证结果进行评估。
本申请中的一种微博用户画像方法,通过获取微博平台上的用户基础数据,并对用户基础数据进行数据处理、预处理以及特征提取得到已经经过数据处理过的用户基础数据,继续对已经处理过的用户基础数据进行标注处理,得到标注用户基础数据,将SVM分类器、K-NN分类器以及GBDT分类器进行融合生成强分类器,并将标注用户基础数据作为强分类器的输入进行训练,得到分类模型,将待判定的用户数据输入到分类模型中,得到更加精准的用户画像,减少了用户画像的偏差。
对本领域的技术人员来说,可根据以上描述的技术方案以及构思,做出其它各种相应的改变以及形变,而所有的这些改变以及形变都应该属于本发明权利要求的保护范围之内。
Claims (10)
1.一种微博用户画像方法,其特征在于包括:
数据获取,获取微博平台上的用户基础数据;
标注数据,对所述用户基础数据进行标注处理,得到标注用户基础数据;
生成分类模型,创建强分类器,所述强分类器用于训练所述用户基础数据,将所述标注用户基础数据作为所述强分类器的输入进行训练生成分类模型;
生成用户画像,将待判定用户数据输入到所述分类模型中,得到用户画像。
2.根据权利要求1所述的一种微博用户画像方法,其特征在于:还包括数据处理,将所述用户基础数据进行数据清理、预处理以及特征选择,所述数据清理包括对所述用户基础数据进行去噪处理;所述预处理包括对所述用户基础数据进行分词处理、取出停止词处理、向量化处理;所述特征选择包括使用信息增益的特征选择方法选择所述用户基础数据中特征用于控制特征空间的维度。
3.根据权利要求1所述的一种微博用户画像方法,其特征在于:在所述将待判定用户数据输入到所述分类模型中之前,还包括验证所述分类模型,输入用于验证的验证数据至所述分类模型,得到验证结果,并对所述验证结果进行评估。
4.根据权利要求1所述的一种微博用户画像方法,其特征在于:所述创建强分类器具体为:
根据Bagging算法、Stacking算法对SVM分类器、K-NN分类器以及GBDT分类器进行融合,得Bagging算法融合模型和Stacking算法融合模型;
根据Boosting算法将所述Bagging算法融合模型和所述Stacking算法融合模型融为一体,得到强分类器。
5.根据权利要求4所述的一种微博用户画像方法,其特征在于:所述根据Bagging算法对所述SVM分类器、K-NN分类器以及GBDT分类器进行融合具体为:在原始训练集中每次有放回地选出子训练集,得到新训练集,根据所述SVM分类器、K-NN分类器以及GBDT分类器分别对所述新训练集进行训练,得到Bagging算法融合模型。
6.根据权利要求4所述的一种微博用户画像方法,其特征在于:所述根据Stacking算法对所述SVM分类器、K-NN分类器以及GBDT分类器进行融合具体为:分别将原始训练集输入到所述SVM分类器、K-NN分类器以及GBDT分类器中进行训练,得到训练结果,将所述训练结果输入到所述SVM分类器中,得到Stacking算法融合模型。
7.根据权利要求4所述的一种微博用户画像方法,其特征在于:所述根据Boosting算法将所述Bagging算法融合模型和所述Stacking算法融合模型融为一体具体为通过将所述Bagging算法融合模型和所述Stacking算法融合模型迭代产生新的强分类器。
8.一种电子设备,其特征在于包括:处理器;
存储器;以及程序,其中所述程序被存储在所述存储器中,并且被配置成由处理器执行,所述程序包括用于执行权利要求1-7任意一项所述的方法。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于:所述计算机程序被处理器执行如权利要求1-7任意一项所述的方法。
10.一种微博用户画像系统,其特征在于包括:
数据获取模块:用于获取微博平台上的用户基础数据;
标注数据模块:用于对所述用户基础数据进行标注处理,得到标注用户基础数据;
分类模型生成模块:创建强分类器,所述强分类器用于训练所述用户基础数据;将所述标注用户基础数据作为所述强分类器的输入进行训练生成分类模型;
用户画像生成模块:用于将待判定用户数据输入到所述分类模型生成模块中的所述分类模型中,得到用户画像;
数据处理模块,所述数据处理模块用于将所述用户基础数据进行数据清理、预处理以及特征选择;所述数据处理模块包括数据清理单元、预处理单元以及特征选择单元,所述数据清理单元用于将所述用户基础数据进行去噪处理,所述预处理单元用于将所述用户基础数据进行分词处理、取出停止词处理、向量化处理,所述特征选取单元用于使用信息增益的特征选择方法选择所述用户基础数据中特征用于控制特征空间的维度;
验证模块,所述验证模块用于验证所述分类模型,输入用于验证的验证数据至所述分类模型,得到验证结果,并对所述验证结果进行评估。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710807779.1A CN107633036A (zh) | 2017-09-08 | 2017-09-08 | 一种微博用户画像方法、电子设备、存储介质、系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710807779.1A CN107633036A (zh) | 2017-09-08 | 2017-09-08 | 一种微博用户画像方法、电子设备、存储介质、系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN107633036A true CN107633036A (zh) | 2018-01-26 |
Family
ID=61101924
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710807779.1A Pending CN107633036A (zh) | 2017-09-08 | 2017-09-08 | 一种微博用户画像方法、电子设备、存储介质、系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107633036A (zh) |
Cited By (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108629633A (zh) * | 2018-05-09 | 2018-10-09 | 浪潮软件股份有限公司 | 一种基于大数据建立用户画像的方法及系统 |
CN108898429A (zh) * | 2018-06-19 | 2018-11-27 | 平安科技(深圳)有限公司 | 电子装置、偏好倾向预测方法和计算机可读存储介质 |
CN109242537A (zh) * | 2018-08-14 | 2019-01-18 | 平安普惠企业管理有限公司 | 广告投放方法、装置、计算机设备及存储介质 |
CN109274439A (zh) * | 2018-09-30 | 2019-01-25 | 南昌航空大学 | 无线传感器网络链路质量评估方法 |
CN109359137A (zh) * | 2018-10-16 | 2019-02-19 | 大连理工大学 | 基于特征筛选与半监督学习的用户成长性画像构建方法 |
CN109635110A (zh) * | 2018-11-30 | 2019-04-16 | 北京百度网讯科技有限公司 | 数据处理方法、装置、设备以及计算机可读存储介质 |
CN109657147A (zh) * | 2018-12-21 | 2019-04-19 | 岭南师范学院 | 基于萤火虫和加权极限学习机的微博异常用户检测方法 |
WO2020147259A1 (zh) * | 2019-01-16 | 2020-07-23 | 平安科技(深圳)有限公司 | 一种用户画像方法、装置、可读存储介质及终端设备 |
CN112598090A (zh) * | 2021-03-08 | 2021-04-02 | 北京冠新医卫软件科技有限公司 | 健康画像的方法、装置、设备和系统 |
CN112906383A (zh) * | 2021-02-05 | 2021-06-04 | 成都信息工程大学 | 一种基于增量学习的集成式自适应水军识别方法 |
CN113537332A (zh) * | 2021-07-09 | 2021-10-22 | 浙江御安信息技术有限公司 | 基于大数据的物联网设备信息采集方法 |
CN113609851A (zh) * | 2021-07-09 | 2021-11-05 | 浙江连信科技有限公司 | 心理学上想法认知偏差的识别方法、装置及电子设备 |
CN113763093A (zh) * | 2020-11-12 | 2021-12-07 | 北京沃东天骏信息技术有限公司 | 一种基于用户画像的物品推荐方法和装置 |
CN115660695A (zh) * | 2022-11-21 | 2023-01-31 | 浪潮通信信息系统有限公司 | 客服人员标签画像构建方法、装置、电子设备及存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20110307466A1 (en) * | 2009-12-01 | 2011-12-15 | Vipul Ved Prakash | System and method for determining quality of cited objects in search results based on the influence of citing subjects |
CN105608171A (zh) * | 2015-12-22 | 2016-05-25 | 青岛海贝易通信息技术有限公司 | 用户画像构建方法 |
CN106484764A (zh) * | 2016-08-30 | 2017-03-08 | 江苏名通信息科技有限公司 | 基于人群画像技术的用户相似度计算方法 |
CN106599022A (zh) * | 2016-11-01 | 2017-04-26 | 中山大学 | 基于用户访问数据的用户画像形成方法 |
-
2017
- 2017-09-08 CN CN201710807779.1A patent/CN107633036A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20110307466A1 (en) * | 2009-12-01 | 2011-12-15 | Vipul Ved Prakash | System and method for determining quality of cited objects in search results based on the influence of citing subjects |
CN105608171A (zh) * | 2015-12-22 | 2016-05-25 | 青岛海贝易通信息技术有限公司 | 用户画像构建方法 |
CN106484764A (zh) * | 2016-08-30 | 2017-03-08 | 江苏名通信息科技有限公司 | 基于人群画像技术的用户相似度计算方法 |
CN106599022A (zh) * | 2016-11-01 | 2017-04-26 | 中山大学 | 基于用户访问数据的用户画像形成方法 |
Non-Patent Citations (4)
Title |
---|
RAPHAEL CAMPOS 等: "Stacking Bagged and Boosted Forests for Effective Automated Classification", 《SIGIR’17》 * |
YAO YU 等: "Gender Classification of Chinese Weibo Users", 《ICEEG "17》 * |
李国秋: "《工商情报实务》", 31 January 2015, 世界图书上海出版公司 * |
贺超波 等: "《在线社交网络挖掘典型问题研究》", 31 August 2017, 中山大学出版社 * |
Cited By (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108629633A (zh) * | 2018-05-09 | 2018-10-09 | 浪潮软件股份有限公司 | 一种基于大数据建立用户画像的方法及系统 |
CN108898429A (zh) * | 2018-06-19 | 2018-11-27 | 平安科技(深圳)有限公司 | 电子装置、偏好倾向预测方法和计算机可读存储介质 |
CN108898429B (zh) * | 2018-06-19 | 2023-04-18 | 平安科技(深圳)有限公司 | 电子装置、偏好倾向预测方法和计算机可读存储介质 |
CN109242537A (zh) * | 2018-08-14 | 2019-01-18 | 平安普惠企业管理有限公司 | 广告投放方法、装置、计算机设备及存储介质 |
CN109274439A (zh) * | 2018-09-30 | 2019-01-25 | 南昌航空大学 | 无线传感器网络链路质量评估方法 |
CN109359137B (zh) * | 2018-10-16 | 2021-03-26 | 大连理工大学 | 基于特征筛选与半监督学习的用户成长性画像构建方法 |
CN109359137A (zh) * | 2018-10-16 | 2019-02-19 | 大连理工大学 | 基于特征筛选与半监督学习的用户成长性画像构建方法 |
CN109635110A (zh) * | 2018-11-30 | 2019-04-16 | 北京百度网讯科技有限公司 | 数据处理方法、装置、设备以及计算机可读存储介质 |
CN109657147A (zh) * | 2018-12-21 | 2019-04-19 | 岭南师范学院 | 基于萤火虫和加权极限学习机的微博异常用户检测方法 |
CN109657147B (zh) * | 2018-12-21 | 2022-11-11 | 岭南师范学院 | 基于萤火虫和加权极限学习机的微博异常用户检测方法 |
WO2020147259A1 (zh) * | 2019-01-16 | 2020-07-23 | 平安科技(深圳)有限公司 | 一种用户画像方法、装置、可读存储介质及终端设备 |
CN113763093A (zh) * | 2020-11-12 | 2021-12-07 | 北京沃东天骏信息技术有限公司 | 一种基于用户画像的物品推荐方法和装置 |
CN112906383A (zh) * | 2021-02-05 | 2021-06-04 | 成都信息工程大学 | 一种基于增量学习的集成式自适应水军识别方法 |
CN112598090A (zh) * | 2021-03-08 | 2021-04-02 | 北京冠新医卫软件科技有限公司 | 健康画像的方法、装置、设备和系统 |
CN112598090B (zh) * | 2021-03-08 | 2021-05-18 | 北京冠新医卫软件科技有限公司 | 健康画像的方法、装置、设备和系统 |
CN113609851A (zh) * | 2021-07-09 | 2021-11-05 | 浙江连信科技有限公司 | 心理学上想法认知偏差的识别方法、装置及电子设备 |
CN113537332A (zh) * | 2021-07-09 | 2021-10-22 | 浙江御安信息技术有限公司 | 基于大数据的物联网设备信息采集方法 |
CN113537332B (zh) * | 2021-07-09 | 2023-02-24 | 浙江御安信息技术有限公司 | 基于大数据的物联网设备信息采集方法 |
CN115660695A (zh) * | 2022-11-21 | 2023-01-31 | 浪潮通信信息系统有限公司 | 客服人员标签画像构建方法、装置、电子设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107633036A (zh) | 一种微博用户画像方法、电子设备、存储介质、系统 | |
CN106649603B (zh) | 一种基于网页文本数据情感分类的指定信息推送方法 | |
CN112560495B (zh) | 一种基于情感分析的微博谣言检测方法 | |
CN108229293A (zh) | 人脸图像处理方法、装置和电子设备 | |
CN106778506A (zh) | 一种融合深度图像和多通道特征的表情识别方法 | |
CN111985532B (zh) | 一种场景级上下文感知的情感识别深度网络方法 | |
CN106708802A (zh) | 一种信息推荐的方法及系统 | |
CN109409433B (zh) | 一种社交网络用户的人格识别系统和方法 | |
CN104376010A (zh) | 用户推荐方法和装置 | |
CN105205043A (zh) | 一种新闻读者情绪的分类方法与系统 | |
CN113886567A (zh) | 一种基于知识图谱的教学方法及系统 | |
CN106203296B (zh) | 一种属性辅助的视频动作识别方法 | |
CN108664932A (zh) | 一种基于多源信息融合的学习情感状态识别方法 | |
CN112948575B (zh) | 文本数据处理方法、装置和计算机可读存储介质 | |
Gao et al. | Self-attention driven adversarial similarity learning network | |
CN103440352B (zh) | 基于深度学习的对象间的关联分析方法及其装置 | |
CN107480688A (zh) | 基于零样本学习的细粒度图像识别方法 | |
CN106778878A (zh) | 一种人物关系分类方法及装置 | |
CN113010657A (zh) | 基于解答文本的答案处理方法和答案推荐方法 | |
CN113435335A (zh) | 微观表情识别方法、装置、电子设备及存储介质 | |
CN106445914A (zh) | 微博情感分类器的构建方法及构建装置 | |
CN113360659A (zh) | 一种基于半监督学习的跨领域情感分类方法及系统 | |
CN113987188A (zh) | 一种短文本分类方法、装置及电子设备 | |
Kallimani et al. | Extraction and interpretation of charts in technical documents | |
CN111159411B (zh) | 一种融合知识图谱的文本立场分析方法、系统及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20180126 |
|
RJ01 | Rejection of invention patent application after publication |