CN110489660A - 一种社交媒体公开数据的用户经济状况画像方法 - Google Patents

一种社交媒体公开数据的用户经济状况画像方法 Download PDF

Info

Publication number
CN110489660A
CN110489660A CN201910661633.XA CN201910661633A CN110489660A CN 110489660 A CN110489660 A CN 110489660A CN 201910661633 A CN201910661633 A CN 201910661633A CN 110489660 A CN110489660 A CN 110489660A
Authority
CN
China
Prior art keywords
user
identity characteristic
regression tree
characteristic attribute
economic situation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910661633.XA
Other languages
English (en)
Other versions
CN110489660B (zh
Inventor
王中元
陈皓
许强
何政
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuhan University WHU
Original Assignee
Wuhan University WHU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuhan University WHU filed Critical Wuhan University WHU
Priority to CN201910661633.XA priority Critical patent/CN110489660B/zh
Publication of CN110489660A publication Critical patent/CN110489660A/zh
Application granted granted Critical
Publication of CN110489660B publication Critical patent/CN110489660B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9536Search customisation based on social or collaborative filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/24323Tree-organised classifiers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Health & Medical Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Computing Systems (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Economics (AREA)
  • Evolutionary Computation (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种社交媒体公开数据的用户经济状况画像方法,通过使用用户自行公开的基础身份特征属性信息,利用同一类型收入群体的身份特征属性一致性,挖掘分析用户的经济状况信息。主要步骤为:从社交媒体中搜集大量的同一用户的多组公开身份特征属性信息,例如年龄、性别、职业和学历等;将搜集得到的数据用来构建数据挖掘模型,从中确定不同收入用户群体的特性,得到用户属性分布规律;使用预测用户的身份信息来对比不同收入群体分布规律,得到预测用户的经济状况结果。本发明具有实用性强、准确率高、计算简单等优点。

Description

一种社交媒体公开数据的用户经济状况画像方法
技术领域
本发明属于数据挖掘技术领域,涉及一种用户经济状况画像方法,具体涉及一种社交媒体数据的用户经济状况画像方法。
技术背景
得益于移动互联网的发展,社交媒体逐渐成为了人们分享信息的平台,自由、开放、即时、共享等特点使得社交媒体被越来越多的人使用。用户画像是对用户一种抽象化的描绘,将海量用户信息简化成几条标签或是几句话,从而将用户的“形象”展现出来,使得能够针对不同用户提供个性化的服务。
越来越多的人通过社交媒体公布和分享关于自己本人的身份信息,一来是为了充分展现自己,让别人能够更加了解自己;另一方面,可以创造一个和现实世界中与本人相匹配的网络形象,使得现实世界中的好友能够更快的认出自己。社交媒体是一个公开的交友平台,人们在其中发布的信息是可见的,因此大多数个人信息资料都可以直接从其社交媒体资料中获得。但考虑到自身信息的安全性和隐秘性,有些私密信息用户是不会对外公开的,例如用户的经济收入情况,关于这种类型的用户属性信息无法直接从个人身份资料获得,从而为进一步了解用户带来了困难。
目前分析用户的经济状况的方法主要是,通过得到用户的消费记录,从用户的购买能力和消费水平来进一步推测用户的经济能力。然而,这样的消费信息很难直接获得,并且需要用户大量的消费数据才能更为准确的进行用户分析。在实际情况下,大多数可获得的信息都是简单的基础身份信息,因而运用这些信息来进行经济状况分析非常必要。
发明内容
为了解决上述技术问题,本发明提供了一种社交媒体公开数据的用户经济状况画像方法。
本发明所采用的技术方案是:一种社交媒体公开数据的用户经济状况画像方法,其特征在于,包括以下步骤:
步骤1:搜集若干组来自社交媒体中同一用户公开的基础身份特征属性信息;如果身份特征属性数量小于预设阈值T,则进入下述步骤2,否则进入下述步骤3;
步骤2:通过不同社交媒体继续搜集同一用户的其他身份特征属性信息,若身份特征属性数量达到预设阈值T,进入步骤3,否则继续返回执行步骤2;
步骤3:筛选得到的若干条用户身份特征属性信息,确保每一条身份特征属性信息完整且真实合理;若用户身份特征属性信息缺失或不符合实际情况,则去除掉该条用户信息;最终若筛选完的用户数据总条数小于预设值N,则返回执行步骤1,否则进入下述步骤4;
步骤4:将步骤3中筛选得到的若干条用户身份特征属性数据用来进行训练,先构建回归决策树,以预设的初始身份特征属性作为初始回归树的根节点,子树的每个节点代表的是分属于不同经济类型人群的预测概率;
步骤5:遍历其他身份特征属性,在初始回归树的基础上,继续构建多棵回归树;后续回归树以一种身份特征属性作为根节点,叶子节点代表的是对应分类概率的增益;遍历一组数据中的所有身份特征属性,若未遍历完,则重复步骤5,否则进入步骤6;
步骤6:进行经济状况分类预测,对于一条新的用户身份特征属性信息,按照训练生成的顺序依次访问多组回归树;
步骤7:在每一棵回归树中,叶子节点会得到一个概率估值,即一组数据属于不同经济状况类别的概率(包括高收入、中等收入或低收入),将所有回归树对应位置子树的概率估值累加后便得到不同经济状况分类下的概率总值,取最大概率分类结果作为最终预测结果;
步骤8:根据分类结果,一条数据信息能得到一个用户的经济状况,将结果输出,得到对应的画像标签,即用户为高收入、中等收入还是低收入人群。
作为优选,步骤5中所述在初始回归树的基础上继续构建多棵回归树,具体实现包括以下子步骤:
步骤5.1:在建立的前回归树的基础上,继续建立新回归树,新回归树的分割属性为未使用过的新身份特征属性,叶子节点的结果为新的预测增益值;
步骤5.2:新回归树待学习的信息为真实标签值减去前面多组回归树预测值之和得到的差值,为了更快速训练回归树,使用损失函数的负梯度值代替前面多组回归树预测值之和,负梯度值与真实标签值的差值作为残差值来学习;
步骤5.3:遍历每一种属性并生成一棵回归树,循环迭代M轮之后,加上初始树可得到M+1棵回归树,最后迭代结束后得到的所有回归树构成一个最终分类学习模型。
作为优选,步骤5.2中所述的负梯度,计算公式如下:
定义第t轮得到的回归树为为ft(x),对应的损失函数为L(y,ft(x)),其中y为真实标签值;损失函数采用对数似然函数:
L(y,ft(x))=log(1+exp(-yft(x)))
则第t轮的第i个样本的负梯度为:
本发明使用社交网络中用户的多元属性联立分析出用户的经济状况,直观表现为该用户的年收入数字。通俗来说,一个人不会在社交网络上直接表达自己的经济状况,包括自己的年收入情况,但是在社交网络上用户总会分享出自己的一些基本属性,例如年龄、教育背景、家庭环境、兴趣爱好和居住地点等。本发明提供了一种有效的间接手段,通过这些可以搜集到的和用户愿意分享的属性来判断一个人的经济状况。
附图说明
图1本发明实施例的流程图。
具体实施方式
为了便于本领域普通技术人员理解和实施本发明,下面结合附图及实施例对本发明作进一步的详细描述,应当理解,此处所描述的实施示例仅用于说明和解释本发明,并不用于限定本发明。
本发明采用了一种基于样本决策树的算法,决策树的起点是用户的年龄,随后还会根据其年龄划分不同的子树,例如资金支出、收益与最高学历等。每个相应的数据点都会被分配到一定的概率,最终计算出该用户进入高收入的概率大小。算法的思路简单来说就是通过拟合高收入人群与低收入人群的不同属性特征,从而达到判别各种人群的具体年收入数字。例如分析高收入人群的基本资料信息时会发现,这一类人群的年龄通常会在30岁以上,定居在一线城市,教育背景也比较优秀。因此可以推测一个满足上述属性的人更大概率属于高收入人群。
为了能够更好地建立模型拟合特征,本发明采用梯度迭代决策树(GBDT)的方法。与传统决策树算法不同,GBDT并非将所有属性都用来构建同一棵决策树,而是分别取出不同组属性来构建多棵决策树,再结合多棵树的结果来决定最终结果。本质是集成学习思想,即多组弱分类器来共同构建一个强分类器,强分类器的性能优于每一个组成的弱分类器。除了集成思想,不同决策树之间也需要建立联系,GBDT算法通过残差来建立多组决策树之间的关联。残差可以理解为上一组决策树未学习到的特征,交由下一组决策树再来学习,多组决策树共同完成特征信息的学习,这样得到的模型能够更加准确反映细节特征。这两种处理手段使得GBDT的性能优于传统决策树算法。
基于上述思想,本发明提供了一种社交媒体公开数据的用户经济状况画像方法,请见图1,本发明的具体实现包括以下步骤:
步骤1:搜集若干组来自社交媒体中同一用户公开的基础身份特征属性信息(如年龄、学历、性别、职业等);如果身份特征属性数量小于预设阈值T,则进入下述步骤2,否则进入下述步骤3;
步骤2:通过不同社交媒体继续搜集同一用户的其他身份特征属性信息,若身份特征属性数量达到预设阈值T,进入步骤3,否则继续返回执行步骤2;
步骤3:筛选得到的若干条用户身份特征属性信息,确保每一条身份特征属性信息完整且真实合理;若用户身份特征属性信息缺失(如缺失年龄信息)或不符合实际情况(如年龄大于200岁),则去除掉该条用户信息;最终若筛选完的用户数据总条数小于预设值N,则返回执行步骤1,否则进入下述步骤4;
步骤4:将步骤3中筛选得到的若干条用户身份特征属性数据用来进行训练,先构建回归决策树,以年龄(初始身份特征属性)作为初始回归树的根节点,子树的每个节点代表的是分属于不同经济类型人群的预测概率;
步骤5:遍历其他身份特征属性,在初始回归树的基础上,继续构建多棵回归树;后续回归树以一种身份特征属性作为根节点,叶子节点代表的是对应分类概率的增益;遍历一组数据中的所有身份特征属性,若未遍历完,则重复步骤5,否则进入步骤6;
本实施例在初始回归树的基础上继续构建多棵回归树,具体实现包括以下子步骤:
步骤5.1:在建立的前回归树的基础上,继续建立新回归树,新回归树的分割属性为未使用过的新身份特征属性,叶子节点的结果为新的预测增益值;
步骤5.2:新回归树待学习的信息为真实标签值减去前面多组回归树预测值之和得到的差值,为了更快速训练回归树,使用损失函数的负梯度值代替前面多组回归树预测值之和,负梯度值与真实标签值的差值作为残差值来学习;
本实施的负梯度值定义如下:
定义第t轮得到的回归树为为ft(x),对应的损失函数为L(y,ft(x))(y为真实标签值),损失函数采用对数似然函数:
L(y,ft(x))=log(1+exp(-yft(x)))
则第t轮的第i个样本的负梯度为:
步骤5.3:遍历每一种属性并生成一棵回归树,循环迭代M轮之后,加上初始树可得到M+1棵回归树,最后迭代结束后得到的所有回归树构成一个最终分类学习模型。
步骤6:进行经济状况分类预测,对于一条新的用户身份特征属性信息,按照训练生成的顺序依次访问多组回归树;
步骤7:在每一棵回归树中,叶子节点会得到一个概率估值,即一组数据属于不同经济状况类别的概率(包括高收入、中等收入或低收入),将所有回归树对应位置子树的概率估值累加后便得到不同经济状况分类下的概率总值,取最大概率分类结果作为最终预测结果;
步骤8:根据分类结果,一条数据信息能得到一个用户的经济状况,将结果输出,得到对应的画像标签,即用户为高收入、中等收入还是低收入人群。
应当理解的是,本说明书未详细阐述的部分均属于现有技术。
应当理解的是,上述针对较佳实施例的描述较为详细,并不能因此而认为是对本发明专利保护范围的限制,本领域的普通技术人员在本发明的启示下,在不脱离本发明权利要求所保护的范围情况下,还可以做出替换或变形,均落入本发明的保护范围之内,本发明的请求保护范围应以所附权利要求为准。

Claims (3)

1.一种社交媒体公开数据的用户经济状况画像方法,其特征在于,包括以下步骤:
步骤1:搜集若干组来自社交媒体中同一用户公开的基础身份特征属性信息;如果身份特征属性数量小于预设阈值T,则进入下述步骤2,否则进入下述步骤3;
步骤2:通过不同社交媒体继续搜集同一用户的其他身份特征属性信息,若身份特征属性数量达到预设阈值T,进入步骤3,否则继续返回执行步骤2;
步骤3:筛选得到的若干条用户身份特征属性信息,确保每一条身份特征属性信息完整且真实合理;若用户身份特征属性信息缺失或不符合实际情况,则去除掉该条用户信息;最终若筛选完的用户数据总条数小于预设值N,则返回执行步骤1,否则进入下述步骤4;
步骤4:将步骤3中筛选得到的若干条用户身份特征属性数据用来进行训练,先构建回归决策树,以预设的初始身份特征属性作为初始回归树的根节点,子树的每个节点代表的是分属于不同经济类型人群的预测概率;
步骤5:遍历其他身份特征属性,在初始回归树的基础上,继续构建多棵回归树;后续回归树以一种身份特征属性作为根节点,叶子节点代表的是对应分类概率的增益;遍历一组数据中的所有身份特征属性,若未遍历完,则重复步骤5,否则进入步骤6;
步骤6:进行经济状况分类预测,对于一条新的用户身份特征属性信息,按照训练生成的顺序依次访问多组回归树;
步骤7:在每一棵回归树中,叶子节点会得到一组概率估值,即一组数据属于不同经济状况类别的概率,将所有回归树对应位置子树的概率估值累加后便得到不同经济状况分类下的概率总值,取最大概率分类结果作为最终预测结果;所述经济状况类别包括高收入、中等收入或低收入;
步骤8:根据分类结果,一条数据信息能得到一个用户的经济状况,将结果输出,得到对应的画像标签,即用户为高收入、中等收入还是低收入人群。
2.根据权利要求1所述的社交媒体公开数据的用户经济状况画像方法,其特征在于,步骤5中所述在初始回归树的基础上继续构建多棵回归树,具体实现包括以下子步骤:
步骤5.1:在建立的前回归树的基础上,继续建立新回归树,新回归树的分割属性为未使用过的新身份特征属性,叶子节点的结果为新的预测增益值;
步骤5.2:新回归树待学习的信息为真实标签值减去前面多组回归树预测值之和得到的差值,为了更快速训练回归树,使用损失函数的负梯度值代替前面多组回归树预测值之和,负梯度值与真实标签值的差值作为残差值来学习;
步骤5.3:遍历每一种属性并生成一棵回归树,循环迭代M轮之后,加上初始树可得到M+1棵回归树,最后迭代结束后得到的所有回归树构成一个最终分类学习模型。
3.根据权利要求2所述的社交媒体公开数据的用户经济状况画像方法,其特征在于,步骤5.2中所述的负梯度,计算公式如下:
定义第t轮得到的回归树为为ft(x),对应的损失函数为L(y,ft(x)),其中y为真实标签值;损失函数采用对数似然函数:
L(y,ft(x))=log(1+exp(-yft(x)))
则第t轮的第i个样本的负梯度为:
CN201910661633.XA 2019-07-22 2019-07-22 一种社交媒体公开数据的用户经济状况画像方法 Active CN110489660B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910661633.XA CN110489660B (zh) 2019-07-22 2019-07-22 一种社交媒体公开数据的用户经济状况画像方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910661633.XA CN110489660B (zh) 2019-07-22 2019-07-22 一种社交媒体公开数据的用户经济状况画像方法

Publications (2)

Publication Number Publication Date
CN110489660A true CN110489660A (zh) 2019-11-22
CN110489660B CN110489660B (zh) 2020-12-18

Family

ID=68547668

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910661633.XA Active CN110489660B (zh) 2019-07-22 2019-07-22 一种社交媒体公开数据的用户经济状况画像方法

Country Status (1)

Country Link
CN (1) CN110489660B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113033854A (zh) * 2019-12-09 2021-06-25 天津光电通信技术有限公司 个人事务管理方法、装置、终端及存储介质
CN113672818A (zh) * 2020-05-13 2021-11-19 中南大学 一种获取社交媒体用户画像的方法及系统

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002008260A2 (en) * 2000-07-26 2002-01-31 Stanford University Bstp-ecg1 protein and related reagents and methods of use thereof
US20020123670A1 (en) * 2000-12-29 2002-09-05 Goetzke Gary A. Chronic pain patient diagnostic system
WO2009067655A2 (en) * 2007-11-21 2009-05-28 University Of Florida Research Foundation, Inc. Methods of feature selection through local learning; breast and prostate cancer prognostic markers
CN106407455A (zh) * 2016-09-30 2017-02-15 深圳市华傲数据技术有限公司 基于图数据挖掘的数据处理方法及装置
CN106503015A (zh) * 2015-09-07 2017-03-15 国家计算机网络与信息安全管理中心 一种构建用户画像的方法
CN107066458A (zh) * 2016-08-26 2017-08-18 北京车网互联科技有限公司 一种基于车联网数据的时空维度用户画像分析方法
CN107908740A (zh) * 2017-11-15 2018-04-13 百度在线网络技术(北京)有限公司 信息输出方法和装置
CN108205766A (zh) * 2016-12-19 2018-06-26 阿里巴巴集团控股有限公司 信息推送方法、装置及系统
CN108416620A (zh) * 2018-02-08 2018-08-17 杭州浮云网络科技有限公司 一种基于大数据的画像数据的智能社交广告投放平台

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002008260A2 (en) * 2000-07-26 2002-01-31 Stanford University Bstp-ecg1 protein and related reagents and methods of use thereof
WO2002008260A3 (en) * 2000-07-26 2002-10-17 Univ Stanford Bstp-ecg1 protein and related reagents and methods of use thereof
US20020123670A1 (en) * 2000-12-29 2002-09-05 Goetzke Gary A. Chronic pain patient diagnostic system
WO2009067655A2 (en) * 2007-11-21 2009-05-28 University Of Florida Research Foundation, Inc. Methods of feature selection through local learning; breast and prostate cancer prognostic markers
CN106503015A (zh) * 2015-09-07 2017-03-15 国家计算机网络与信息安全管理中心 一种构建用户画像的方法
CN107066458A (zh) * 2016-08-26 2017-08-18 北京车网互联科技有限公司 一种基于车联网数据的时空维度用户画像分析方法
CN106407455A (zh) * 2016-09-30 2017-02-15 深圳市华傲数据技术有限公司 基于图数据挖掘的数据处理方法及装置
CN108205766A (zh) * 2016-12-19 2018-06-26 阿里巴巴集团控股有限公司 信息推送方法、装置及系统
CN107908740A (zh) * 2017-11-15 2018-04-13 百度在线网络技术(北京)有限公司 信息输出方法和装置
CN108416620A (zh) * 2018-02-08 2018-08-17 杭州浮云网络科技有限公司 一种基于大数据的画像数据的智能社交广告投放平台

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
BENJAMIN HEITMANN ET.AL: ""An architecture for privacy-enabled user profile portability"", 《PROCEEDINGS OF THE 1ST INTERNATIONAL WORKSHOP ON INFORMATION HETEROGENEITY AND FUSION IN RECOMMENDER SYSTEMS》 *
冯娟娟等: ""基于客户画像和 GBDT 算法的客户价值预测方法"", 《洛阳理工学院学报(自然科学版)》 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113033854A (zh) * 2019-12-09 2021-06-25 天津光电通信技术有限公司 个人事务管理方法、装置、终端及存储介质
CN113672818A (zh) * 2020-05-13 2021-11-19 中南大学 一种获取社交媒体用户画像的方法及系统
CN113672818B (zh) * 2020-05-13 2023-11-14 中南大学 一种获取社交媒体用户画像的方法及系统

Also Published As

Publication number Publication date
CN110489660B (zh) 2020-12-18

Similar Documents

Publication Publication Date Title
CN108363804B (zh) 基于用户聚类的局部模型加权融合Top-N电影推荐方法
CN108492200B (zh) 一种基于卷积神经网络的用户属性推断方法和装置
CN109960763B (zh) 基于用户细粒度摄影偏好的摄影社区个性化好友推荐方法
CN108920544A (zh) 一种基于知识图谱的个性化职位推荐方法
CN107357793A (zh) 信息推荐方法和装置
CN106294590A (zh) 一种基于半监督学习的社交网络垃圾用户过滤方法
CN111858940A (zh) 一种基于多头注意力的法律案例相似度计算方法及系统
CN114998602B (zh) 基于低置信度样本对比损失的域适应学习方法及系统
CN110096575A (zh) 面向微博用户的心理画像方法
CN113656699B (zh) 用户特征向量确定方法、相关设备及介质
Guo et al. Multi-label classification methods for green computing and application for mobile medical recommendations
CN108875034A (zh) 一种基于层次化长短期记忆网络的中文文本分类方法
CN110727864A (zh) 一种基于手机App安装列表的用户画像方法
CN113239159A (zh) 基于关系推理网络的视频和文本的跨模态检索方法
CN110489660A (zh) 一种社交媒体公开数据的用户经济状况画像方法
Yang et al. Place deduplication with embeddings
CN113934835B (zh) 结合关键词和语义理解表征的检索式回复对话方法及系统
CN103136309A (zh) 通过基于核的学习对社交强度进行建模
Tekin et al. Customer lifetime value prediction for gaming industry: fuzzy clustering based approach
CN113032567B (zh) 位置嵌入解释方法、装置、计算机设备及存储介质
CN107908999A (zh) 一种结构特征层次化的疲劳表情识别方法
Niu et al. Tourism event knowledge graph for attractions recommendation
CN112507185A (zh) 用户肖像的确定方法和装置
CN110119465A (zh) 融合lfm潜在因子与svd的手机应用用户喜好检索方法
Qin et al. Recommender resources based on acquiring user's requirement and exploring user's preference with Word2Vec model in web service

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant