CN111667374A - 一种构建用户画像的方法、装置、存储介质和电子设备 - Google Patents
一种构建用户画像的方法、装置、存储介质和电子设备 Download PDFInfo
- Publication number
- CN111667374A CN111667374A CN202010520922.0A CN202010520922A CN111667374A CN 111667374 A CN111667374 A CN 111667374A CN 202010520922 A CN202010520922 A CN 202010520922A CN 111667374 A CN111667374 A CN 111667374A
- Authority
- CN
- China
- Prior art keywords
- information
- target user
- social media
- user
- media information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 86
- 238000004458 analytical method Methods 0.000 claims abstract description 83
- 230000008451 emotion Effects 0.000 claims abstract description 58
- 238000012549 training Methods 0.000 claims description 16
- 238000005065 mining Methods 0.000 claims description 10
- 238000004590 computer program Methods 0.000 claims description 8
- 239000008280 blood Substances 0.000 claims description 7
- 210000004369 blood Anatomy 0.000 claims description 7
- 238000005516 engineering process Methods 0.000 claims description 6
- 238000010276 construction Methods 0.000 claims description 3
- 230000008569 process Effects 0.000 description 19
- 238000010586 diagram Methods 0.000 description 8
- 238000004891 communication Methods 0.000 description 6
- 230000006870 function Effects 0.000 description 6
- 230000002996 emotional effect Effects 0.000 description 4
- 230000009471 action Effects 0.000 description 3
- 230000003993 interaction Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 230000001502 supplementing effect Effects 0.000 description 3
- 238000013461 design Methods 0.000 description 2
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 2
- 239000010931 gold Substances 0.000 description 2
- 229910052737 gold Inorganic materials 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 206010054196 Affect lability Diseases 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 230000009193 crawling Effects 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000007477 logistic regression Methods 0.000 description 1
- 230000007935 neutral effect Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 230000011664 signaling Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000009469 supplementation Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/01—Social networking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9536—Search customisation based on social or collaborative filtering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/958—Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Health & Medical Sciences (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Computing Systems (AREA)
- Artificial Intelligence (AREA)
- Health & Medical Sciences (AREA)
- Economics (AREA)
- Evolutionary Computation (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Life Sciences & Earth Sciences (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请实施例提供一种构建用户画像的方法、装置、存储介质和电子设备,该方法包括:分别获取目标用户的社交媒体信息和目标用户的社交媒体信息下的评论信息;确定目标用户的社交媒体信息的类别;对目标用户的社交媒体信息下的评论信息进行情感分析,获得第一情感分析结果;将目标用户的社交媒体信息、目标用户的社交媒体信息的类别和第一情感分析结果输入到预先训练好的属性预测模型中,获得目标用户的预测属性信息;利用预测属性信息和目标用户的社会关系信息,构建目标用户的画像。借助于上述技术方案,本申请实施例能够提高潜在用户的分析效率。
Description
技术领域
本申请涉及计算机技术领域,尤其涉及一种构建用户画像的方法、装置、存储介质和电子设备。
背景技术
用户画像,是一种勾画目标用户、联系用户诉求与设计方向的有效工具。用户画像在智能推荐和智能投研等方面都取得了令人满意的效果。
现有的用户画像往往是针对某种特定产品的使用用户来进行画像的。例如,智能投研针对的是股民。再例如,新闻推荐类的产品推荐更多的是上班族和喜欢看新闻的用户。
但是,由于不同业务之间的用户画像往往是不能复用的,这就需要在更换了新业务的情况下,重新进行用户画像。从而,这就导致了分析效率比较低的问题。
发明内容
本申请实施例的目的在于提供一种构建用户画像的方法、装置、存储介质和电子设备,以解决现有技术中存在着的分析效率比较低的问题。
第一方面,本申请实施例提供了一种构建用户画像的方法,该方法包括:分别获取目标用户的社交媒体信息和目标用户的社交媒体信息下的评论信息;确定目标用户的社交媒体信息的类别;对目标用户的社交媒体信息下的评论信息进行情感分析,获得第一情感分析结果;将目标用户的社交媒体信息、目标用户的社交媒体信息的类别和第一情感分析结果输入到预先训练好的属性预测模型中,获得目标用户的预测属性信息,其中,预先训练好的属性预测模型是通过对样本集进行训练得到的,样本集包括样本用户的社交媒体信息、样本用户的社交媒体信息的类别、样本用户的社交媒体信息下的评论信息对应的第二情感分析结果和样本用户的属性信息;利用预测属性信息和目标用户的社会关系信息,构建目标用户的画像。
因此,本申请实施例通过结合目标用户的预测属性信息和目标用户的社交关系信息来进行画像,从而通过上述方法得到的用户画像更具一般性、更全面和更具有深度,进而可满足多种业务场景的需求。
此外,对于通过本申请实施例得到的用户画像来说,在更换新业务场景的情况下,无需再次进行用户的画像,从而能够提高潜在用户的分析效率。
在一个可能的实施例中,在将目标用户的社交媒体信息、目标用户的社交媒体信息的类别和第一情感分析结果输入到预先训练好的属性预测模型中,获得目标用户的预测属性信息之前,方法还包括:获取样本集,其中,样本集中的属性信息是通过调查问卷和/或目标用户的注册信息获得的;利用样本集对初始属性预测模型进行训练,获得预先训练好的属性预测模型。
因此,本申请实施例通过调查问卷或者目标用户的注册信息获得的属性信息保障了属性预测模型的预测结果的精准性。
在一个可能的实施例中,预测属性信息包括以下信息中的至少一种信息:预测性别信息、预测年龄信息、预测血型信息、预测学历信息、预测性格信息、预测爱好信息和预测工作信息。
因此,本申请实施例中的预测属性信息可以是多个维度的信息,从而能够实现用户的全面画像。
在一个可能的实施例中,社交媒体信息的类别包括以下类别中的至少一种类别:政治、经济、军事、科技、娱乐、社会、历史和旅游。
因此,本申请实施例可通过上述社交媒体信息的类别的划分来保证预测结果的精准性。
在一个可能的实施例中,对目标用户的社交媒体信息下的评论信息进行情感分析,获得第一情感分析结果,包括:从目标用户的社交媒体信息中提取目标用户的社交媒体信息中所包含的事件;对目标用户的社交媒体信息中所包含的事件和目标用户的社交媒体信息下的评论信息进行情感分析,获得第一情感分析结果。
因此,本申请实施例可通过目标用户的社交媒体信息中所包含的事件和目标用户的社交媒体信息下的评论信息进行情感分析,从而使得第一情感分析结果更新精准,进而保证了属性预测结果的精准性。
在一个可能的实施例中,在利用预测属性信息和目标用户的社会关系信息,构建目标用户的画像之前,方法还包括:利用目标用户的社交媒体信息下的评论信息对目标用户进行关系挖掘,获得目标用户的社交关系信息。
因此,本申请实施例可通过利用目标用户的社交媒体信息下的评论信息进行关系挖掘,从而使得社会关系信息的获取变得很便捷。
在一个可能的实施例中,在确定目标用户对目标产品的兴趣度的情况下,方法还包括:从目标用户的画像对应的预测属性信息中选取出目标预测属性信息,其中,目标预测属性信息是用于确定目标用户对目标产品的兴趣度的预测属性信息;利用目标预测属性信息和社会关系信息,确定目标用户对目标产品的兴趣度。
因此,由于本申请实施例中的用户画像可对应多个维度的信息,从而在更换新业务场景的情况下,可以从预测属性信息和/或社会关系信息中选取出分析新业务场景所需的信息,进而也能够提高潜在用户的分析效率。
第二方面,本申请实施例提供了一种构建用户画像的装置,该装置包括:获取模块,用于分别获取目标用户的社交媒体信息和目标用户的社交媒体信息下的评论信息;确定模块,用于确定目标用户的社交媒体信息的类别;情感分析模块,用于对目标用户的社交媒体信息下的评论信息进行情感分析,获得第一情感分析结果;输入模块,用于将目标用户的社交媒体信息、目标用户的社交媒体信息的类别和第一情感分析结果输入到预先训练好的属性预测模型中,获得目标用户的预测属性信息,其中,预先训练好的属性预测模型是通过对样本集进行训练得到的,样本集包括样本用户的社交媒体信息、样本用户的社交媒体信息的类别、样本用户的社交媒体信息下的评论信息对应的第二情感分析结果和样本用户的属性信息;构建模块,用于利用预测属性信息和目标用户的社会关系信息,构建目标用户的画像。
第三方面,本申请实施例提供了一种存储介质,该存储介质上存储有计算机程序,该计算机程序被处理器运行时执行第一方面或第一方面的任一可选的实现方式所述的方法。
第四方面,本申请实施例提供了一种电子设备,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当所述电子设备运行时,所述处理器与所述存储器之间通过总线通信,所述机器可读指令被所述处理器执行时执行第一方面或第一方面的任一可选的实现方式所述的方法。
第五方面,本申请提供一种计算机程序产品,所述计算机程序产品在计算机上运行时,使得计算机执行第一方面或第一方面的任意可能的实现方式中的方法。
为使本申请实施例所要实现的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对本申请实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1示出了本申请实施例提供的一种构建用户画像的方法的流程图;
图2示出了本申请实施例提供的一种构建用户画像的具体流程图;
图3示出了本申请实施例提供的一种构建用户画像的装置的结构框图;
图4是本申请实施例提供的一种电子设备的结构框图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行描述。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。同时,在本申请的描述中,术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
目前,用户画像往往只需要满足产品设计的需求即可。也就是说,只需要了解用户的部分属性即可。
例如,对于新闻推荐来说,将所有的新闻进行分类,然后通过对用户的浏览记录进行分析,找出符合用户浏览喜好的候选新闻进行推荐。但是,当今一些产品推出了奖励政策,能够通过阅读新闻来赚金币。为了赚取金币,用户更愿意选择篇幅较短的新闻,而这些新闻很可能不符合该用户的真实喜好,这就使得很大一部人的浏览记录出现大量的噪音。因此,仅靠浏览记录是无法真正体现用户的喜好的。
基于此,本申请实施例巧妙地提供了一种构建用户画像的方案,通过分别获取目标用户的社交媒体信息和目标用户的社交媒体信息下的评论信息,以及确定目标用户的社交媒体信息的类别,以及对目标用户的社交媒体信息下的评论信息进行情感分析,获得第一情感分析结果,以及将目标用户的社交媒体信息、目标用户的社交媒体信息的类别和第一情感分析结果输入到预先训练好的属性预测模型中,获得目标用户的预测属性信息,其中,预先训练好的属性预测模型是通过对样本集进行训练得到的,样本集包括样本用户的社交媒体信息、样本用户的社交媒体信息的类别、样本用户的社交媒体信息下的评论信息对应的第二情感分析结果和样本用户的属性信息,最后利用预测属性信息和目标用户的社会关系信息,构建目标用户的画像。
从而,本申请实施例可通过结合目标用户的预测属性信息和目标用户的社交关系信息来进行画像,从而通过上述方法得到的用户画像更具一般性、更全面和更具有深度,进而可满足多种业务场景的需求,进而即便是在更换了新业务场景的情况下,也无需再次进行用户的画像,从而能够提高潜在用户的分析效率。
另外,由于本申请实施例中的用户画像可对应多个维度的信息(包括预测属性信息和社会关系信息),从而在更换新业务场景的情况下,可以从预测属性信息和/或社会关系信息中选取出分析新业务场景所需的信息,进而能够提高潜在用户的分析效率。
请参见图1,图1示出了本申请实施例提供的一种构建用户画像的方法的流程图。应理解,图1所示的方法可以由构建用户画像的装置执行,该装置可以与下文中的图3所示的装置对应,该装置可以是能够执行该方法的各种设备,例如,个人计算机、服务器或网络设备等,本申请实施例并不限于此。如图1所示的方法包括:
步骤S110,分别获取样本用户的社交媒体信息、样本用户的社交媒体信息下的评论信息和样本用户的属性信息。
应理解,样本用户可以称为训练用户,也可以称为预测候选用户等,本申请实施例并不局限于此。
还应理解,社交媒体信息对于的具体信息也可以根据实际需求来进行设置,只要保证社交媒体信息是与样本用户(或者样本用户的社交媒体账号)相关的信息即可,本申请实施例并不局限于此。
例如,社交媒体信息可以是转发帖,也可以是点赞贴,也可以是评论帖,也可以是样本用户自己发表的原创帖,也可以是样本用户自己发表的朋友圈等。
还应理解,样本用户的社交媒体信息下的评论信息既可以包括样本用户自己发表的评论信息,又包括其他用户对样本用户的评论信息,本申请实施例并不局限于此。
还应理解,属性信息所包含的信息也可根据实际需求来进行设置,本申请实施例并不局限于此。
例如,属性信息可包括以下信息中的至少一种信息:性别信息、年龄信息、血型信息、党派信息、学历信息、工作信息、性格信息和爱好信息。
其中,年龄信息可以是具体的年龄信息,也可以是年龄段信息;工作信息可以是工作职位,也可以工作单位的性质(例如,私企、国企或者外企等);性格信息可以是坦率、认真、外向、和善以及情绪不稳定中的一种;爱好信息可以是政治、经济、军事、科技、娱乐、社会、历史、旅游和其他中的至少一种。
还应理解,样本用户的具体数量可至少大于等于预设值。其中,预设值的大小可根据实际需求来进行设置,本申请实施例并不局限于此。
为了便于理解步骤S110,下面通过具体的实施例来进行描述。
具体地,可通过数据爬取等方式获取样本用户在媒体平台上的社交媒体信息,该社交媒体信息可以包括原创帖、转发帖、点赞贴和评论帖。以及,还可获取原创帖和转发帖等社交媒体信息下方的评论信息。
以及,还可在媒体平台上发布调查问卷,该调查问卷的内容可包括两部分:其中一部分可以填写样本用户的年龄、性别、学历、工作经历、血型、党派、爱好等真实信息;另一部分可以是性格测试题。从而,后续可通过样本用户对调查问卷的填写结果来确定样本用户的性格倾向概率,并根据性格倾向概率确定样本用户的性格(例如,可将性格倾向概率最大的性格作为样本用户的性格)。
应理解,虽然上面以通过调查问卷的方式获取样本用户的属性信息为例来进行了描述,但本领域的技术人员应当理解,还可通过其它的方式来获取,本申请实施例并不局限于此。
例如,还可通过获取样本用户在媒体平台上的注册信息来获取样本用户的属性信息。
还应理解,媒体平台对应的具体平台可根据实际需求来进行设置,本申请实施例并不局限于此。
例如,媒体平台可以是微博,也可以是贴吧,也可以至少包括微博和贴吧等。
此外,需要说明的是,在媒体平台包括至少两个媒体平台的情况下,在获取到至少两个媒体平台中每个媒体平台的数据后,需要对不同媒体平台的数据进行实体对齐。也就是说,由于同一用户可能会使用至少两个媒体平台,且该用户的属性信息是固定的,从而为了减少工作量以及提高预测的精准度,所以,这里可将同一用户对应的不同媒体平台的数据对应到该用户上。
其中,实体对齐的过程不仅需要将不同媒体平台的用户信息进行比对,还需要看是否有转载信息,且转载信息的准确率要高于信息的比对。
例如,第一社交平台上的第一用户,经常将第二社交平台上的第二用户发布的贴文和消息转载到第一社交平台上,那么第一用户和第二用户对应同一用户的几率很大。从而,通过不同平台之间的相互转载可以增加用户对应的数据集,进一步保证了预测结果的精准度。
另外,在获取不同媒体平台的数据的情况下,由于增加了使用不同平台的用户的数据,从而也能够增加可分析的用户,进而也能够保证预测结果的精准性。
另外,需要说明的是,由于可能存在部分样本用户填写的调查问卷信息不完整或者注册信息不完整的情况,从而在获取到多个样本用户的属性信息之后,可对多个样本用户的属性信息进行挑选,将比较完整的样本用户的属性信息挑选出来。以及,还可利用挑选出的比较完整的样本用户的属性信息,对剩余的不完整的样本用户的属性信息进行补充。其中,比较完整的样本用户的属性信息可以包含有性别信息、年龄信息、血型信息、党派信息、学历信息、工作信息、性格信息和爱好信息。
应理解,利用挑选出的比较完整的样本用户的属性信息,对剩余的不完整的样本用户的属性信息进行补充的方法可根据实际需求来进行设置,本申请实施例并不局限于此。
可选地,在对数据集中属性信息不完整的第一用户进行属性补充的情况下,可筛选出所有符合预设条件的第二用户。以及,可利用第一用户的不完整的属性信息和所有符合要求的第二用户的属性信息以及点赞、踩等信息组成一个矩阵,利用矩阵奇异值分解和逻辑回归从而推测出第一用户的属性,并对第一用户的属性信息进行补充,从而完善整个数据集。其中,点赞、踩等信息可以包括通过步骤S130转换后的信息,也可以包括帖子对应的点赞、踩等信息,本申请实施例并不局限于此。
应理解,预设条件的具体内容可根据实际需求来进行设置,本申请实施例并不局限于此。
例如,预设条件可以是与第一用户有共同点赞、共同踩以及给第一用户的原创帖点赞的第二用户,且第二用户的属性信息是完整的,并且与第一用户的交集个数要大于第一预设值。此外,对于第二用户的个数也是有限制的,第二用户的个数也需要小于第二预设值。
应理解,第一预设值的具体大小和第二预设值的具体大小均可根据实际需求来进行设置,本申请实施例并不局限于此。
例如,在第一预设值为200的情况下,第二用户与第一用户的共同点赞、共同踩以及第二用户给第一用户的原创帖点赞的总和要大于200,且不允许只有第二用户给第一用户但咱的数据,并且该数据不能超过50%。
再例如,第二预设值的具体值可以为500。
步骤S120,确定样本用户的社交媒体信息的类别。
应理解,样本用户的社交媒体信息的具体类别可根据实际需求来进行设置,本申请实施例并不局限于此。
例如,样本用户的社交媒体信息的类别包括以下类别中的至少一种类别:政治、经济、军事、科技、娱乐、社会、历史、旅游和其他。
为了便于理解步骤S120,下面通过具体的实施例来进行描述。
具体地,可将新闻媒体平台上的网站数据作为训练数据,并且由于这些网站数据都有着明确的标签,从而标签可以用作标注数据。其中,网站数据的标签可对应有政治、经济、军事、科技、娱乐、社会、历史、旅游以及其他。
以及,在获取到网站数据以及网站数据的标签之后,可以利用网站数据和网站数据的标签来训练分类器,从而获得训练好的分类器。
以及,在获取到样本用户的社交媒体信息之后,可以利用训练好的分类器对样本用户的社交媒体信息的类别进行识别,从而确定出样本用户的社交媒体信息的类别。
此外,在确定出样本用户的社交媒体信息的类别之后,还可利用样本用户的社交媒体信息的类别对调查问卷的结果进行补充和判断。
例如,在调查问卷的内容中包含有爱好这一项的情况下,如果调查问卷中填写了第一爱好,但是在社交媒体信息的类别中没有符合第一爱好的数据,则可将第一爱好删除。
步骤S130,对样本用户的社交媒体信息下的评论信息进行情感分析,获得第二情感分析结果。
应理解,由于样本用户的社交媒体信息下的评论信息表达了样本用户的各种情感色彩和情感倾向性,从而第二情感分析结果可以是样本用户对社交媒体信息的看法。
其中,样本用户对社交媒体信息的看法可以是支持,也可以是不支持,也可以是中立,也可以是正面评论,也可以是负面评论等。
为了便于理解步骤S130,下面通过具体的实施例来进行描述。
具体地,从样本用户的社交媒体信息中提取出样本用户的社交媒体信息中所包含的事件,并利用情感分析方法,对样本用户的社交媒体信息中所包含的事件和样本用户的社交媒体信息下的评论信息进行情感分析,从而可获得样本用户对样本用户的社交媒体信息中所包含的事件的情感倾向和所有对样本用户的社交媒体信息中所包含的事件进行评论的用户的情感倾向。其中,情感分析方法可以是现有的任意一种情感分析方法,本申请实施例并不局限于此。
以及,根据所有对样本用户的社交媒体信息中所包含的事件进行评论的用户的情感倾向,确定出样本用户是符合大众意见,还是持少数意见,从而获得第二情感分析结果。具体地:
在样本用户是符合大众意见的情况下,确定样本用户为正面评论,进而可将样本用户进行正面评论的社交媒体信息视为点赞;在样本用户是持少数意见的情况下,确定样本用户为负面评论,进而可将样本用户进行负面评论的社交媒体信息视为踩。
此外,需要说明的是,对于目标用户的点赞或者踩的帖子来说,其既可按照上述方法来确定目标用户是正面评论还是负面评论,又可以根据用户的点赞或者踩的相关数据来确定目标用户是正面评论还是负面评论(例如,在点赞数量远大于踩且目标用户进行了点赞的情况下,可确定目标用户发表了正面的评论)。
另外,还可将样本用户对样本用户的社交媒体信息中所包含的事件的情感倾向和所有对样本用户的社交媒体信息中所包含的事件进行评论的用户的情感倾向进行保存。
此外,需要说明的是,虽然步骤S110至步骤S130是分开描述的,但本领域的技术人员应当理解,步骤S110和步骤S130还可合并成一个步骤,该合并步骤为获取样本集。其中,样本集包括样本用户的社交媒体信息、样本用户的社交媒体信息的类别、样本用户的社交媒体信息下的评论信息对应的第二情感分析结果和样本用户的属性信息。
步骤S140,利用样本集对初始属性预测模型进行训练,获得训练好的属性预测模型。
具体地,可将样本集中的样本用户的社交媒体信息、样本用户的社交媒体信息的类别和样本用户的社交媒体信息下的评论信息对应的第二情感分析结果作为输入,将样本集中的样本用户的属性信息作为输出对初始属性预测模型进行训练,获得训练好的属性预测模型。
应理解,属性预测模型的具体模型类型可根据实际需求来进行设置,本申请实施例并不局限于此。
例如,属性预测模型可以是卷积神经网络模型。
另外,需要说明的是,对于第二情感分析结果来说,既可将第二情感分析结果直接输入到初始属性预测模型中,也可将通过第二情感分析结果得到的转化得到的状态信息(例如,在确定第二情感分析结果是正面评论的情况下,可将第二情感分析结果转换为点赞信息等)输入到初始属性预测模型中,本申请实施例并不局限于此。
对应地,第一情感分析结果和第二情感分析结果的情况类似,后续不再详细描述,具体可参见上述描述。
此外,需要说明的是,虽然步骤S110至步骤S140示出了本申请实施例中的属性预测模型的训练过程,但本领域的技术人员应当理解,在属性预测模型是预先训练好的属性预测模型的情况下,可直接执行步骤S150,无需再执行前面的步骤S110至步骤S140。
步骤S150,分别获取目标用户的社交媒体信息和目标用户的社交媒体信息下的评论信息。
应理解,步骤S150的过程和步骤S110的过程类似,不同的地方在于处理的数据不同,步骤S150的具体过程在此不再详细描述,具体可参见步骤S110的相关描述。
步骤S160,确定目标用户的社交媒体信息的类别。
应理解,步骤S160的过程和步骤S120的过程类似,不同的地方在于处理的数据不同,步骤S160的具体过程在此不再详细描述,具体可参见步骤S120的相关描述。
步骤S170,对目标用户的社交媒体信息下的评论信息进行情感分析,获得第一情感分析结果。
应理解,步骤S170的过程和步骤S130的过程类型,不同的地方在于处理的数据不同,步骤S170的具体过程在此不再详细描述,具体可参见步骤S130的相关描述。
步骤S180,将目标用户的社交媒体信息、目标用户的社交媒体信息的类别和第一情感分析结果输入到预先训练好的属性预测模型中,获得目标用户的预测属性信息。
应理解,预测属性信息所包含的信息也可根据实际需求来进行设置,本申请实施例并不局限于此。
例如,预测属性信息可包括以下信息中的至少一种信息:预测性别信息、预测年龄信息、预测血型信息、预测学历信息、预测性格信息、预测爱好信息和预测工作信息。
为了便于理解步骤S180,下面通过具体的实施例来进行描述。
具体地,将目标用户的社交媒体信息、目标用户的社交媒体信息的类别和第一情感分析结果作为输入信息,并将输入信息输入到预先训练好的属性预测模型中。由于预先训练好的属性预测模型能够预测用户的属性,从而该预先训练好的属性预测模型能够输出目标用户的预测属性信息。
步骤S190,利用预测属性信息和目标用户的社会关系信息,构建目标用户的画像。
应理解,目标用户的社会关系信息的获取方式可根据实际需求来进行设置,本申请实施例并不局限于此。
可选地,目标用户的社会关系信息可以是预先获取的。
可选地,目标用户的社会关系可以是利用目标用户的社交媒体信息下的评论信息对目标用户进行关系挖掘后获得的。
应理解,利用目标用户的社交媒体信息下的评论信息对目标用户进行关系挖掘的具体方法可以根据实际需求来进行设置,本申请实施例并不局限于此。
例如,本申请实施例中关系挖掘方法可以是公开号CN110688407A公开的一种社会关系挖掘的方法,通过获取目标用户的社交媒体信息下的评论信息,随后对目标用户的社交媒体信息下的评论信息进行实体链接,以及利用语义相似度判断疑似账号和疑似信息与目标实体的符合程度,以将目标用户和目标实体进行对应,随后再通过自助法bootstrapping进行关系判断和关系挖掘,给出好友账号、以及和目标实体共现在同一个文本信息的实体与目标实体的关系,随后可利用情感分析对文本数据进行情感极性判断,并结合互动和共现的频次、地理和工作信息,算出与目标实体的关系程度。此外,除了获取目标实体的关系和关系程度之外,还可获取通过元搜索获取的账号对应的用户的关系及关系程度等。从而,本申请能够将目标用户的好友、关注用户、同学、校友、同事、雇佣(实体也有可能是公司)、领导、股东、投资等社会关系进行深度挖掘。
还应理解,相比于现有技术中通过一个维度或者少量维度的属性信息来进行产品的推荐,本申请实施例中的目标用户的画像可以是对目标用户的多个维度的信息进行画像得到的,所以,本申请实施例中的用户的画像也可称为目标用户的深度画像,本申请实施例并不局限于此。
为了便于理解步骤S190,下面通过具体的实施例来进行描述。
具体地,在获取到目标用户的预测属性信息和目标用户的社会关系信息之后,可将目标用户的预测属性信息和目标用户的社会关系信息进行结合,从而得到目标用户的画像。
此外,还需要说明的是,由于本申请实施例中的目标用户的画像对应多个维度的信息,从而在确定目标用户对目标产品的兴趣度的情况下,无需再进行新一轮的画像。其可从本申请实施例中的目标用户的画像对应的预测属性信息中选取出目标预测属性信息,其中,目标预测属性信息是用于确定目标用户对目标产品的兴趣度的预测属性信息,随后利用目标预测属性信息和社会关系信息,确定目标用户对目标产品的兴趣度,从而不仅能够提高分析效率,还能够提高预测的精准度。
例如,在目标产品为新闻类产品的情况下,其可通过将工作信息、社会关系和目标用户的浏览记录等进行结合,从而获得更加全面的目标用户的画像,进而能够更加准确的确定出目标用户的喜好,进而后续进行更加准确和合理的推荐。
此外,需要说明的是,除了通过预测属性信息和社会关系信息来确定目标产品的兴趣度之外,还可只通过预测属性信息或者社会关系信息来确定目标产品的兴趣度,本申请实施例并不局限于此。
因此,本申请实施例通过结合目标用户的预测属性信息和目标用户的社交关系信息来进行画像,从而通过上述方法得到的用户画像更具一般性、更全面和更具有深度,进而可满足多种业务场景的需求,进而在更换新业务场景的情况下,无需再次进行用户的画像,从而能够提高潜在用户的分析效率。
为了便于理解本申请实施例,下面通过具体的实施例来进行描述。
请参见图2,图2示出了本申请实施例提供的一种构建用户画像的具体流程图。如图2所示的方法包括:
步骤S210,分别获取目标用户的社交媒体信息和目标用户的社交媒体信息下的评论信息。
步骤S220,对目标用户的社交媒体信息的类别进行数据分类,以确定目标用户的社交媒体信息的类别。
步骤S230,对目标用户的社交媒体信息下的评论信息进行情感分析,并将情感分析结果转换为点赞和踩等状态信息。
步骤S240,汇总状态信息,并将目标用户的社交媒体信息、目标用户的社交媒体信息的类别和汇总后的状态信息输入到预先训练好的属性预测模型中,获得目标用户的预测属性信息。
步骤S250,利用预测属性信息和目标用户的社会关系信息,构建目标用户的画像。
应理解,上述构建用户画像的方法仅是示例性的,本领域技术人员根据上述的方法可以进行各种变形,修改或变形之后的内容也在本申请保护范围内。
例如,尽管在附图中以特定顺序描述了本申请方法的操作,但是,这并非要求或者暗示必须按照该特定顺序来执行这些操作,或是必须执行全部所示的操作才能实现期望的结果。相反,流程图中描绘的步骤可以改变执行顺序。附加地或备选地,可以省略某些步骤,将多个步骤合并为一个步骤执行,和/或将一个步骤分解为多个步骤执行。
请参见图3,图3示出了本申请实施例提供的一种构建用户画像的装置300的结构框图,应理解,该装置300与上述方法实施例对应,能够执行上述方法实施例涉及的各个步骤,该装置300具体的功能可以参见上文中的描述,为避免重复,此处适当省略详细描述。该装置300包括至少一个能以软件或固件(firmware)的形式存储于存储器中或固化在装置300的操作系统(operating system,OS)中的软件功能模块。具体地,该装置300包括:
获取模块310,用于分别获取目标用户的社交媒体信息和目标用户的社交媒体信息下的评论信息;确定模块320,用于确定目标用户的社交媒体信息的类别;情感分析模块330,用于对目标用户的社交媒体信息下的评论信息进行情感分析,获得第一情感分析结果;输入模块340,用于将目标用户的社交媒体信息、目标用户的社交媒体信息的类别和第一情感分析结果输入到预先训练好的属性预测模型中,获得目标用户的预测属性信息,其中,预先训练好的属性预测模型是通过对样本集进行训练得到的,样本集包括样本用户的社交媒体信息、样本用户的社交媒体信息的类别、样本用户的社交媒体信息下的评论信息对应的第二情感分析结果和样本用户的属性信息;构建模块350,用于利用预测属性信息和目标用户的社会关系信息,构建目标用户的画像。
在一个可能的实施例中,获取模块310,还用于获取样本集,其中,样本集中的属性信息是通过调查问卷和/或目标用户的注册信息获得的;训练模块(未示出),用于利用样本集对初始属性预测模型进行训练,获得预先训练好的属性预测模型。
在一个可能的实施例中,预测属性信息包括以下信息中的至少一种信息:预测性别信息、预测年龄信息、预测血型信息、预测学历信息、预测性格信息、预测爱好信息和预测工作信息。
在一个可能的实施例中,社交媒体信息的类别包括以下类别中的至少一种类别:政治、经济、军事、科技、娱乐、社会、历史和旅游。
在一个可能的实施例中,情感分析模块330包括:提取模块(未示出),用于从目标用户的社交媒体信息中提取目标用户的社交媒体信息中所包含的事件;情感分析子模块(未示出),用于对目标用户的社交媒体信息中所包含的事件和目标用户的社交媒体信息下的评论信息进行情感分析,获得第一情感分析结果。
在一个可能的实施例中,该装置300包括:关系挖掘模块(未示出),用于利用目标用户的社交媒体信息下的评论信息对目标用户进行关系挖掘,获得目标用户的社交关系信息。
在一个可能的实施例中,该装置300包括:选取模块(未示出),用于从目标用户的画像对应的预测属性信息中选取出目标预测属性信息,其中,目标预测属性信息是用于确定目标用户对目标产品的兴趣度的预测属性信息;确定模块320,还用于利用目标预测属性信息和社会关系信息,确定目标用户对目标产品的兴趣度。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的装置的具体工作过程,可以参考前述方法中的对应过程,在此不再过多赘述。
本申请实施例还提供一种电子设备,请参见图4,图4是本申请实施例提供的一种电子设备400的结构框图。电子设备400可以包括处理器410、通信接口420、存储器430和至少一个通信总线440。其中,通信总线440用于实现这些组件直接的连接通信。其中,本申请实施例中的通信接口420用于与其他设备进行信令或数据的通信。处理器410可以是一种集成电路芯片,具有信号的处理能力。上述的处理器410可以是通用处理器,包括中央处理器(Central Processing Unit,简称CPU)、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器(DSP)、专用集成电路(ASIC)、现成可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器410也可以是任何常规的处理器等。
存储器430可以是,但不限于,随机存取存储器(Random Access Memory,RAM),只读存储器(Read Only Memory,ROM),可编程只读存储器(Programmable Read-OnlyMemory,PROM),可擦除只读存储器(Erasable Programmable Read-Only Memory,EPROM),电可擦除只读存储器(Electric Erasable Programmable Read-Only Memory,EEPROM)等。存储器430中存储有计算机可读取指令,当所述计算机可读取指令由所述处理器410执行时,电子设备400可以执行上述方法实施例中的各个步骤。
电子设备400还可以包括存储控制器、输入输出单元、音频单元、显示单元。
所述存储器430、存储控制器、处理器410、外设接口、输入输出单元、音频单元、显示单元各元件相互之间直接或间接地电性连接,以实现数据的传输或交互。例如,这些元件相互之间可通过一条或多条通信总线440实现电性连接。所述处理器410用于执行存储器430中存储的可执行模块。并且,电子设备400用于执行下述方法:分别获取目标用户的社交媒体信息和目标用户的社交媒体信息下的评论信息;确定目标用户的社交媒体信息的类别;对目标用户的社交媒体信息下的评论信息进行情感分析,获得第一情感分析结果;将目标用户的社交媒体信息、目标用户的社交媒体信息的类别和第一情感分析结果输入到预先训练好的属性预测模型中,获得目标用户的预测属性信息,其中,预先训练好的属性预测模型是通过对样本集进行训练得到的,样本集包括样本用户的社交媒体信息、样本用户的社交媒体信息的类别、样本用户的社交媒体信息下的评论信息对应的第二情感分析结果和样本用户的属性信息;利用预测属性信息和目标用户的社会关系信息,构建目标用户的画像。
输入输出单元用于提供给用户输入数据实现用户与所述服务器(或本地终端)的交互。所述输入输出单元可以是,但不限于,鼠标和键盘等。
音频单元向用户提供音频接口,其可包括一个或多个麦克风、一个或者多个扬声器以及音频电路。
显示单元在所述电子设备与用户之间提供一个交互界面(例如用户操作界面)或用于显示图像数据给用户参考。在本实施例中,所述显示单元可以是液晶显示器或触控显示器。若为触控显示器,其可为支持单点和多点触控操作的电容式触控屏或电阻式触控屏等。支持单点和多点触控操作是指触控显示器能感应到来自该触控显示器上一个或多个位置处同时产生的触控操作,并将该感应到的触控操作交由处理器进行计算和处理。
可以理解,图4所示的结构仅为示意,所述电子设备400还可包括比图4中所示更多或者更少的组件,或者具有与图4所示不同的配置。图4中所示的各组件可以采用硬件、软件或其组合实现。
本申请还提供一种存储介质,该存储介质上存储有计算机程序,该计算机程序被处理器运行时执行方法实施例所述的方法。
本申请还提供一种计算机程序产品,所述计算机程序产品在计算机上运行时,使得计算机执行方法实施例所述的方法。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统的具体工作过程,可以参考前述方法中的对应过程,在此不再过多赘述。
需要说明的是,本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。对于装置类实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,也可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本申请的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
另外,在本申请各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上所述仅为本申请的优选实施例而已,并不用于限制本申请,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应所述以权利要求的保护范围为准。
Claims (10)
1.一种构建用户画像的方法,其特征在于,包括:
分别获取目标用户的社交媒体信息和所述目标用户的社交媒体信息下的评论信息;
确定所述目标用户的社交媒体信息的类别;
对所述目标用户的社交媒体信息下的评论信息进行情感分析,获得第一情感分析结果;
将所述目标用户的社交媒体信息、所述目标用户的社交媒体信息的类别和所述第一情感分析结果输入到预先训练好的属性预测模型中,获得所述目标用户的预测属性信息,其中,所述预先训练好的属性预测模型是通过对样本集进行训练得到的,所述样本集包括样本用户的社交媒体信息、所述样本用户的社交媒体信息的类别、所述样本用户的社交媒体信息下的评论信息对应的第二情感分析结果和所述样本用户的属性信息;
利用所述预测属性信息和所述目标用户的社会关系信息,构建所述目标用户的画像。
2.根据权利要求1所述的方法,其特征在于,在所述将所述目标用户的社交媒体信息、所述目标用户的社交媒体信息的类别和所述第一情感分析结果输入到预先训练好的属性预测模型中,获得所述目标用户的预测属性信息之前,所述方法还包括:
获取所述样本集,其中,所述样本集中的属性信息是通过调查问卷和/或所述目标用户的注册信息获得的;
利用所述样本集对初始属性预测模型进行训练,获得所述预先训练好的属性预测模型。
3.根据权利要求1所述的方法,其特征在于,所述预测属性信息包括以下信息中的至少一种信息:预测性别信息、预测年龄信息、预测血型信息、预测学历信息、预测性格信息、预测爱好信息和预测工作信息。
4.根据权利要求1所述的方法,其特征在于,所述社交媒体信息的类别包括以下类别中的至少一种类别:政治、经济、军事、科技、娱乐、社会、历史和旅游。
5.根据权利要求1所述的方法,其特征在于,所述对所述目标用户的社交媒体信息下的评论信息进行情感分析,获得第一情感分析结果,包括:
从所述目标用户的社交媒体信息中提取所述目标用户的社交媒体信息中所包含的事件;
对所述目标用户的社交媒体信息中所包含的事件和所述目标用户的社交媒体信息下的评论信息进行情感分析,获得所述第一情感分析结果。
6.根据权利要求1所述的方法,其特征在于,在利用所述预测属性信息和所述目标用户的社会关系信息,构建所述目标用户的画像之前,所述方法还包括:
利用所述目标用户的社交媒体信息下的评论信息对所述目标用户进行关系挖掘,获得所述目标用户的社交关系信息。
7.根据权利要求1所述的方法,其特征在于,在确定所述目标用户对目标产品的兴趣度的情况下,所述方法还包括:
从所述目标用户的画像对应的预测属性信息中选取出目标预测属性信息,其中,所述目标预测属性信息是用于确定所述目标用户对所述目标产品的兴趣度的预测属性信息;
利用所述目标预测属性信息和所述社会关系信息,确定所述目标用户对所述目标产品的兴趣度。
8.一种构建用户画像的装置,其特征在于,包括:
获取模块,用于分别获取目标用户的社交媒体信息和所述目标用户的社交媒体信息下的评论信息;
确定模块,用于确定所述目标用户的社交媒体信息的类别;
情感分析模块,用于对所述目标用户的社交媒体信息下的评论信息进行情感分析,获得第一情感分析结果;
输入模块,用于将所述目标用户的社交媒体信息、所述目标用户的社交媒体信息的类别和所述第一情感分析结果输入到预先训练好的属性预测模型中,获得所述目标用户的预测属性信息,其中,所述预先训练好的属性预测模型是通过对样本集进行训练得到的,所述样本集包括样本用户的社交媒体信息、所述样本用户的社交媒体信息的类别、所述样本用户的社交媒体信息下的评论信息对应的第二情感分析结果和所述样本用户的属性信息;
构建模块,用于利用所述预测属性信息和所述目标用户的社会关系信息,构建所述目标用户的画像。
9.一种存储介质,其特征在于,所述存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行如权利要求1-7任一所述的构建用户画像的方法。
10.一种电子设备,其特征在于,所述电子设备包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当所述电子设备运行时,所述处理器与所述存储器之间通过总线通信,所述机器可读指令被所述处理器执行时执行如权利要求1-7任一所述的构建用户画像的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010520922.0A CN111667374B (zh) | 2020-06-10 | 2020-06-10 | 一种构建用户画像的方法、装置、存储介质和电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010520922.0A CN111667374B (zh) | 2020-06-10 | 2020-06-10 | 一种构建用户画像的方法、装置、存储介质和电子设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111667374A true CN111667374A (zh) | 2020-09-15 |
CN111667374B CN111667374B (zh) | 2023-07-18 |
Family
ID=72386791
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010520922.0A Active CN111667374B (zh) | 2020-06-10 | 2020-06-10 | 一种构建用户画像的方法、装置、存储介质和电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111667374B (zh) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112380104A (zh) * | 2020-11-19 | 2021-02-19 | 北京百度网讯科技有限公司 | 用户属性识别方法、装置、电子设备及存储介质 |
CN112507185A (zh) * | 2020-10-22 | 2021-03-16 | 复旦大学 | 用户肖像的确定方法和装置 |
CN112668703A (zh) * | 2021-01-19 | 2021-04-16 | 上海优扬新媒信息技术有限公司 | 一种用户收入确定方法及装置 |
CN113111187A (zh) * | 2021-04-07 | 2021-07-13 | 河北冀联人力资源服务集团有限公司 | 一种用工平台评论挖掘的方法及系统 |
CN113628012A (zh) * | 2021-08-17 | 2021-11-09 | 广州美思生物技术有限公司 | 一种生活用品的定制方法及装置 |
CN114445146A (zh) * | 2022-01-30 | 2022-05-06 | 北京火山引擎科技有限公司 | 一种标签填充方法及其相关设备 |
CN114827227A (zh) * | 2022-06-09 | 2022-07-29 | 深圳福恋智能信息科技有限公司 | 一种家庭虚拟映像社交方法、装置、设备及可读存储介质 |
CN118013022A (zh) * | 2024-02-19 | 2024-05-10 | 深圳振华数据信息技术有限公司 | 一种社交媒体数据聚合分析系统及方法 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080249764A1 (en) * | 2007-03-01 | 2008-10-09 | Microsoft Corporation | Smart Sentiment Classifier for Product Reviews |
US20130325704A1 (en) * | 2012-05-30 | 2013-12-05 | Ut-Battelle, Llc | Social media and social networks for event credentialing |
US20150161606A1 (en) * | 2013-12-11 | 2015-06-11 | Mastercard International Incorporated | Method and system for assessing financial condition of a merchant |
CN106504099A (zh) * | 2015-09-07 | 2017-03-15 | 国家计算机网络与信息安全管理中心 | 一种构建用户画像的系统 |
US20180314915A1 (en) * | 2017-04-26 | 2018-11-01 | Facebook, Inc. | Image based prediction of user demographics |
CN109033441A (zh) * | 2018-08-16 | 2018-12-18 | 安徽大尺度网络传媒有限公司 | 一种基于大数据分析的推送方法及装置 |
CN109359137A (zh) * | 2018-10-16 | 2019-02-19 | 大连理工大学 | 基于特征筛选与半监督学习的用户成长性画像构建方法 |
CN110688407A (zh) * | 2019-09-09 | 2020-01-14 | 创新奇智(南京)科技有限公司 | 一种社会关系挖掘的方法 |
CN110796232A (zh) * | 2019-10-12 | 2020-02-14 | 腾讯科技(深圳)有限公司 | 属性预测模型训练方法、属性预测方法及电子设备 |
-
2020
- 2020-06-10 CN CN202010520922.0A patent/CN111667374B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080249764A1 (en) * | 2007-03-01 | 2008-10-09 | Microsoft Corporation | Smart Sentiment Classifier for Product Reviews |
US20130325704A1 (en) * | 2012-05-30 | 2013-12-05 | Ut-Battelle, Llc | Social media and social networks for event credentialing |
US20150161606A1 (en) * | 2013-12-11 | 2015-06-11 | Mastercard International Incorporated | Method and system for assessing financial condition of a merchant |
CN106504099A (zh) * | 2015-09-07 | 2017-03-15 | 国家计算机网络与信息安全管理中心 | 一种构建用户画像的系统 |
US20180314915A1 (en) * | 2017-04-26 | 2018-11-01 | Facebook, Inc. | Image based prediction of user demographics |
CN109033441A (zh) * | 2018-08-16 | 2018-12-18 | 安徽大尺度网络传媒有限公司 | 一种基于大数据分析的推送方法及装置 |
CN109359137A (zh) * | 2018-10-16 | 2019-02-19 | 大连理工大学 | 基于特征筛选与半监督学习的用户成长性画像构建方法 |
CN110688407A (zh) * | 2019-09-09 | 2020-01-14 | 创新奇智(南京)科技有限公司 | 一种社会关系挖掘的方法 |
CN110796232A (zh) * | 2019-10-12 | 2020-02-14 | 腾讯科技(深圳)有限公司 | 属性预测模型训练方法、属性预测方法及电子设备 |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112507185A (zh) * | 2020-10-22 | 2021-03-16 | 复旦大学 | 用户肖像的确定方法和装置 |
CN112380104A (zh) * | 2020-11-19 | 2021-02-19 | 北京百度网讯科技有限公司 | 用户属性识别方法、装置、电子设备及存储介质 |
CN112668703A (zh) * | 2021-01-19 | 2021-04-16 | 上海优扬新媒信息技术有限公司 | 一种用户收入确定方法及装置 |
CN113111187A (zh) * | 2021-04-07 | 2021-07-13 | 河北冀联人力资源服务集团有限公司 | 一种用工平台评论挖掘的方法及系统 |
CN113628012A (zh) * | 2021-08-17 | 2021-11-09 | 广州美思生物技术有限公司 | 一种生活用品的定制方法及装置 |
CN114445146A (zh) * | 2022-01-30 | 2022-05-06 | 北京火山引擎科技有限公司 | 一种标签填充方法及其相关设备 |
CN114827227A (zh) * | 2022-06-09 | 2022-07-29 | 深圳福恋智能信息科技有限公司 | 一种家庭虚拟映像社交方法、装置、设备及可读存储介质 |
CN114827227B (zh) * | 2022-06-09 | 2024-04-26 | 深圳福恋智能信息科技有限公司 | 一种家庭虚拟映像社交方法、装置、设备及可读存储介质 |
CN118013022A (zh) * | 2024-02-19 | 2024-05-10 | 深圳振华数据信息技术有限公司 | 一种社交媒体数据聚合分析系统及方法 |
Also Published As
Publication number | Publication date |
---|---|
CN111667374B (zh) | 2023-07-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111667374B (zh) | 一种构建用户画像的方法、装置、存储介质和电子设备 | |
McIntyre et al. | The contextualist function: US newspaper journalists value social responsibility | |
Sen et al. | A total error framework for digital traces of human behavior on online platforms | |
Fussey et al. | Digitizing sociology: Continuity and change in the internet era | |
US11164105B2 (en) | Intelligent recommendations implemented by modelling user profile through deep learning of multimodal user data | |
Welbers et al. | Social media gatekeeping: An analysis of the gatekeeping influence of newspapers’ public Facebook pages | |
Steinert-Threlkeld | Twitter as data | |
US10380249B2 (en) | Predicting future trending topics | |
Sloan et al. | Knowing the Tweeters: Deriving sociologically relevant demographics from Twitter | |
US8856229B2 (en) | System and method for social networking | |
Lewis | Three fallacies of digital footprints | |
US20160292583A1 (en) | Analyzing distributed group discussions | |
Furini et al. | Sentiment analysis and twitter: a game proposal | |
US20170214646A1 (en) | Systems and methods for providing social media location information | |
US20150149539A1 (en) | Trending Data Demographics | |
US11615485B2 (en) | System and method for predicting engagement on social media | |
Krisna et al. | The antecedents of hashtag and geotag use in smart tourism: case study in Indonesia | |
Baumgartner et al. | A novel iOS data donation approach: Automatic processing, compliance, and reactivity in a longitudinal study | |
Højlund et al. | The current use of big data in evaluation | |
WO2020033117A1 (en) | Dynamic and continous onboarding of service providers in an online expert marketplace | |
US20210357440A1 (en) | Context-based Recommendation System for Feature Search | |
US11061975B2 (en) | Cognitive content suggestive sharing and display decay | |
Iwasa et al. | Identity development and online and offline prosocial behaviors among early and middle adolescents | |
Klotz et al. | Literary sketches in information systems research: conceptualization and guidance for using vignettes as a narrative form | |
CN113870998A (zh) | 问诊方法、装置、电子设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |