CN110969473A - 一种用户标签生成方法及装置 - Google Patents
一种用户标签生成方法及装置 Download PDFInfo
- Publication number
- CN110969473A CN110969473A CN201811162340.9A CN201811162340A CN110969473A CN 110969473 A CN110969473 A CN 110969473A CN 201811162340 A CN201811162340 A CN 201811162340A CN 110969473 A CN110969473 A CN 110969473A
- Authority
- CN
- China
- Prior art keywords
- user
- personal information
- account
- information table
- concerned
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 46
- 230000003993 interaction Effects 0.000 claims abstract description 46
- 238000007405 data analysis Methods 0.000 claims abstract description 9
- 230000002452 interceptive effect Effects 0.000 claims description 68
- 238000004458 analytical method Methods 0.000 claims description 26
- 238000001914 filtration Methods 0.000 claims description 16
- 238000013507 mapping Methods 0.000 claims description 11
- 230000000694 effects Effects 0.000 description 13
- 238000010586 diagram Methods 0.000 description 10
- 238000004590 computer program Methods 0.000 description 9
- 230000008569 process Effects 0.000 description 7
- 238000005516 engineering process Methods 0.000 description 5
- 235000013305 food Nutrition 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- 238000007621 cluster analysis Methods 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 3
- 238000000605 extraction Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 230000008030 elimination Effects 0.000 description 2
- 238000003379 elimination reaction Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 238000005354 coacervation Methods 0.000 description 1
- 230000009193 crawling Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0241—Advertisements
- G06Q30/0251—Targeted advertisements
- G06Q30/0255—Targeted advertisements based on user history
Landscapes
- Business, Economics & Management (AREA)
- Strategic Management (AREA)
- Engineering & Computer Science (AREA)
- Accounting & Taxation (AREA)
- Development Economics (AREA)
- Finance (AREA)
- Entrepreneurship & Innovation (AREA)
- Game Theory and Decision Science (AREA)
- Economics (AREA)
- Marketing (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种用户标签生成方法、装置、存储介质和处理器,包括:确定用户群体,获取用户群体中各用户的个人信息,根据获取的个人信息生成每个用户的个人信息表;获取用户群体中的每个用户的关注账号和关注账号对应的信息数据;根据关注账号对应的信息数据,提取获得与关注账号匹配的兴趣标签;将兴趣标签添加至个人信息表中,并在个人信息表中添加用户的互动程度数据,获得每个用户的目标个人信息表;对目标个人信息表进行数据分析,获得用户的目标标签。本发明基于网络公开数据降低了数据购买的成本,且由于对符合业务需求的用户群体及相关账号信息进行分析,使得获得的用户标签更加匹配业务需求,数据准确性更高。
Description
技术领域
本发明涉及信息处理技术领域,更具体的说,涉及一种用户标签生成方法及装置。
背景技术
在广告定向投放过程中,广告主会在广告平台上设置若干个定向用户标签,比如年龄、性别、学历、地域和兴趣中的至少一种。广告平台根据若干个定向用户标签确定与广告对应的目标用户群,向目标用户群投放广告。
目前针对用户标签的获取,由于大多数企业或者广告主不具备建立平台手机用户标签的能力和资源,一般采用购买数据的方式实现。目前市场上的大部分用户标签数据被少数供应商控制,数据的价格较高。除此之外,由于数据供应商提供的用户标签数据是基于自身用户收集得到的,数据供应商的行业和受众群体可能与购买方不匹配,导致用户匹配率交底,而用户标签需要与企业或广告主本身的数据进行关联,才能够作为后续的营销活动所使用。
因此,企业和广告主通过购买数据的方式获取用户标签,存在成本高、用户匹配度低和数据准确性差的问题。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的一种用户标签生成方法及装置。
具体技术方案如下:
一种用户标签生成方法,包括:
确定用户群体,获取所述用户群体中各用户的个人信息,根据获取的个人信息生成所述用户群体中的每个用户的个人信息表;
根据所述个人信息表,获取所述用户群体中的每个用户的关注账号和所述关注账号对应的信息数据;
根据所述关注账号对应的信息数据,提取获得与所述关注账号匹配的兴趣标签;
将所述兴趣标签添加至所述个人信息表中,并在所述个人信息表中添加用户的互动程度数据,获得每个用户的目标个人信息表;
对所述目标个人信息表进行数据分析,获得用户的目标标签。
可选地,所述确定用户群体,获取所述用户群体中各用户的个人信息,根据获取的个人信息生成所述用户群体中的每个用户的个人信息表,包括:
确定目标账号的关注用户;
根据所述关注用户的用户标识,提取获得与所述关注用户匹配的个人信息,并将所述关注用户匹配的个人信息储存至关注用户个人信息表;
确定目标账号的互动用户;
提取获得与所述互动用户匹配的个人信息,并将所述互动用户匹配的个人信息存储至互动用户个人信息表;
根据用户标识,对所述关注用户个人信息表和所述互动用户个人信息表进行去重处理,获得每个用户的个人信息表。
可选地,所述根据所述个人信息表,获取所述用户群体中的每个用户的关注账号和所述关注账号对应的信息数据,包括:
根据所述个人信息表,获取所述用户群体中的每个用户的关注账号;
提取获得每个用户的关注账号对应的初始信息数据;
根据预设过滤条件对所述初始信息数据进行过滤,获得过滤后的信息数据;
获取用户与所述用户对应的关注账号之间的互动数据,将所述互动数据添加至所述过滤后的信息数据,获得所述关注账号对应的信息数据。
可选地,所述根据所述关注账号对应的信息数据,提取获得与所述关注账号匹配的兴趣标签,包括:
根据所述关注账号对应的信息数据,对所述关注账号进行分类处理,获得目标关注账号;
根据所述目标关注账号的信息数据,生成每个所述目标关注账号的兴趣标签。
可选地,该方法还包括:
对所述目标关注账号的兴趣标签进行分级,获得目标关注账号与兴趣标签之间的分级映射关系;
将目标关注账号与兴趣标签之间的分级映射关系与用户进行匹配,获得用户关注账号的兴趣标签。
可选地,所述将所述兴趣标签添加至所述个人信息表中,并在所述个人信息表中添加用户的互动程度数据获得每个用户的目标个人信息表,包括:
将所述兴趣标签添加至所述个人信息表中;
判断所述个人信息表中的关注用户是否能够匹配互动用户,若否,则将所述关注用户确定为仅关注用户,并对所述仅关注用户设置互动程度分值;
根据互动次数和频率,对互动用户进行分类,并设置分类后的互动用户的互动程度分值;
将所述互动程度分值添加至所述个人信息表中,获得每个用户的目标个人信息表。
可选地,所述对所述目标个人信息表进行数据分析,获得用户的目标标签,包括:
根据所述目标个人信息表,确定聚类特征值;
依据所述聚类特征值,对所述目标个人信息表进行聚类分析,获得分析维度;
根据所述分析维度对应的互动程度信息,确定用户的目标标签。
一种用户标签生成装置,包括:
群体确定单元,用于确定用户群体,获取所述用户群体中各用户的个人信息,根据获取的个人信息生成所述用户群体中的每个用户的个人信息表;
信息获取单元,用于根据所述个人信息表,获取所述用户群体中的每个用户的关注账号和所述关注账号对应的信息数据;
提取单元,用于根据所述关注账号对应的信息数据,提取获得与所述关注账号匹配的兴趣标签;
信息添加单元,用于将所述兴趣标签添加至所述个人信息表中,并在所述个人信息表中添加用户的互动程度数据,获得每个用户的目标个人信息表;
分析单元,用于对所述目标个人信息表进行数据分析,获得用户的目标标签。
一种存储介质,所述存储介质包括存储的程序,其中,所述程序执行上述的用户标签生成方法。
一种处理器,所述处理器用于运行程序,其中,所述程序运行时执行上述的用户标签生成方法。
借由上述技术方案,本发明提供的用户标签生成方法、装置、存储介质和处理器,充分利用了社交网站用户信息的大数据,选择与业务需求相关的用户全群体作为分析对象,并获得该用户对应的关注账号,生成关注账号的兴趣标签,同时对用户的个人信息和互动数据进行聚类分析,获得目标标签,使得获得的用户标签具有统计学意义,并且基于网络公开数据降低了数据购买的成本,且由于对符合业务需求的用户群体及相关账号信息进行分析,使得获得的用户标签更加匹配业务需求,数据准确性更高,有助于企业或广告主通过目标标签提升营销活动的宣传和转化效果。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1示出了本发明实施例提供的一种用户标签生成方法的流程示意图;
图2示出了本发明实施例提供的一种确定关注账号及其信息的方法的流程示意图;
图3示出了本发明实施例提供的一种关注账号与兴趣标签的层级关系的示意图;
图4示出了本发明实施例提供的一种用户标签生成装置的结构示意图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
在本发明实施例中提供了一种用户标签生成方法,参见图1,包括:
S101、确定用户群体,获取所述用户群体中各用户的个人信息,根据获取的个人信息生成所述用户群体中的每个用户的个人信息表。
用户群体是表征企业或者广告主对应的用户群体,主要包括了关注该企业或者广告主的用户和与其进行互动的用户,具体的S101可以包括以下步骤:
确定目标账号的关注用户;
根据所述关注用户的用户标识,提取获得与所述关注用户匹配的个人信息,并将所述关注用户匹配的个人信息储存至关注用户个人信息表;
确定目标账号的互动用户;
提取获得与所述互动用户匹配的个人信息,并将所述互动用户匹配的个人信息存储至互动用户个人信息表;
根据用户标识,对所述关注用户个人信息表和所述互动用户个人信息表进行去重处理,获得每个用户的个人信息表。
需要说明的是,为了降低数据的使用成本,在本发明实施例中选择的数据均来自各社交网站的公开数据,例如微博、微信公众号、网购平台等等,大多数的企业和广告主也都在这些平台上建立有自己的官方账号,将企业或者广告主的官方账号确定为目标账号。该目标账号的体现形式本发明并不做限制,例如可以为官方微博,也可以为官方微信公众号等,确定与目标账号相关的用户时,可以选取该企业所有目标账号对应的用户,也可以根据企业的营销重点选取某个平台上的目标账号对应的用户,例如,某个企业在下半年的营销策略主要集中在微博平台上,则主要获取该微博平台上企业目标账号的用户,同样若该企业在该微博平台上有多个官方账号,最优方式是获取所有账号对应的用户,当然可以根据需求不同获取部分账号对应的用户,本发明对此不做限制。
为了能够使得获得的信息更加匹配需求,将用户分为了关注用户和互动中户。其中,关注用户为对目标账户进行关注的账户,然后需要获取关注用户的个人信息,具体的,利用网络爬虫技术通过用户ID(即用户在某个社交网站或平台上唯一的用户标识)提取个人信息,其中个人信息主要包括用户名称、性别、年龄、所在地、注册时间、发文数、粉丝数、关注数、是否是官方认证、是否是达人、等级、兴趣标签、人群标签等信息,存入关注用户个人信息表。
对于在目标账号(例如广告主的官方账号)营销活动中产生转发、评论、点赞等互动的用户作为互动用户,通过爬虫技术爬取活动页url(如活动文章、活动视频)、和用户ID,获取个人信息,其中,个人信息包括但不局限于用户名称、性别、年龄、所在地、注册时间、发文量、粉丝量、关注量、是否是官方认证、是否是达人、等级、兴趣标签、个人介绍、工作信息、互动时间(包括转发时间、评论时间)等,存入互动用户的个人信息表。
在关注用户个人信息表和互动用户个人信息表中获取用户ID并整体去除,得到去重后的完整用户群体列表,由于去重后的每个用户都对应各自的个人信息表,因此可以获得每个用户的个人信息表。
S102、根据个人信息表,获取所述用户群体中的每个用户的关注账号和所述关注账号对应的信息数据。
在本发明实施例中提供了一种确定关注账号及其信息的方法,参见图2,包括:
S201、根据个人信息表,获取所述用户群体中的每个用户的关注账号。
利用爬虫工具,获取用户群体中的每个用户的关注账号信息,其中,所述关注账号主要是指用户关注的企业用户、官方用户,对于其关注的个人账号不具备分析价值,以微博账号为例,用户关注的个人账号多为用户的朋友、同学或者明星等,其能够代表的相关业务需求信息较少,因此,不具备分析价值。当然有的企业的官方账号是以个人账号的形式存在的,例如代言人的账号或者公司高管的账号,这样的个人账号也是本发明实施例中需要分析的关注账号,所以需要根据实际情况进行灵活区分。
S202、提取获得每个用户的关注账号对应的初始信息数据。
其中,初始信息数据包括但不局限于每个关注账号的用户名称、性别、年龄、所在地、注册时间、发文量、粉丝量、关注量、是否是官方认证、是否是达人、等级、兴趣标签、个人介绍、工作信息等。
S203、根据预设过滤条件对所述初始信息数据进行过滤,获得过滤后的信息数据。
其中,所述预设过滤条件包括非官方认证账号、粉丝量少的账号,或者去除与业务需求目的不相关的数据,该预设过滤条件可以分为两部分,一部分为必要条件,例如,对关注账号的硬性要求,如粉丝数量、更新频率等,另一部分可以为非必要条件,由企业或者广告主灵活设置,这样通过过滤条件过滤获得的信息数据更加精准和具有代表意义。
S204、获取用户与所述用户对应的关注账号之间的互动数据,将所述互动数据添加至所述过滤后的信息数据,获得所述关注账号对应的信息数据。
需要将用户与关注账号之间的互动数据也加入存储过滤后的信息数据的表中,例如加入到用户关注账号信息表中,用于区分关注账号对用户的重要程度。
S103、根据所述关注账号对应的信息数据,提取获得与所述关注账号匹配的兴趣标签;
具体的,可以包括:
根据所述关注账号对应的信息数据,对所述关注账号进行分类处理,获得目标关注账号;
根据所述目标关注账号的信息数据,生成每个所述目标关注账号的兴趣标签。
以用户关注账号信息中的年龄、所在地、工作信息、兴趣字段、使用设备、个人介绍等信息为基础,根据企业或广告主的实际需求,对关注账号类别进行细分和调整,获得目标关注账号;然后,从中提取出目标账号的兴趣标签,例如,标签为美食、时尚、育儿、教育等。
S104、将所述兴趣标签添加至所述个人信息表中,并在所述个人信息表中添加用户的互动程度数据,获得每个用户的目标个人信息表;
S105、对所述目标个人信息表进行数据分析,获得用户的目标标签。
将提取到的兴趣标签添加至个人信息表中,即使得个人信息表中获得与用户间接相关的关注账号的兴趣标签,然后将互动程度数据也添加到个人信息表中,其中,互动程度数据主要表征用户与目标账号或者关注用户的一些表征互动的数据信息,能够反映用户对某个事件的关注程度,最终使得目标个人信息表中的信息更能表征该用户的实际情况,尤其是与对应事件的反映情况。然后对目标个人信息表进行信息聚类分析,获得与用户匹配目标标签,便于广告主使用该目标标签确定营销用户。
本发明提供的用户标签生成方法,充分利用了社交网站用户信息的大数据,选择与业务需求相关的用户全群体作为分析对象,并获得该用户对应的关注账号,生成关注账号的兴趣标签,同时对用户的个人信息和互动数据进行聚类分析,获得目标标签,使得获得的用户标签具有统计学意义,并且基于网络公开数据降低了数据购买的成本,且由于对符合业务需求的用户群体及相关账号信息进行分析,使得获得的用户标签更加匹配业务需求,数据准确性更高,有助于企业或广告主通过目标标签提升营销活动的宣传和转化效果。
对应的,兴趣标签可以存在多级关系,在本发明实施例中还包括:
对所述目标关注账号的兴趣标签进行分级,获得目标关注账号与兴趣标签之间的分级映射关系;
将目标关注账号与兴趣标签之间的分级映射关系与用户进行匹配,获得用户关注账号的兴趣标签。
具体的,根据用户关注账号信息,并基于企业或者广告主的实际需求,对关注账号类别进行细分和调整后,从中提取出账号兴趣标签,可以设置为一级标签、二级标签和三级标签,若无法进行细分,则二级或三级标签为空,其中标签类型可以为美食、时尚、育儿、教育等,标签也可以是明星类别、明星等,形成账号与兴趣标签间的分级映射关系。参见图3,为本发明实施例提供的一种关注账号与兴趣标签的层级关系,其中,关注账号包括第一账号和第二账号,第一账号对应的一级标签为美食,二级标签为川菜,三级标签为空白;第二账号对应的一级标签为教育,二级标签为小学教育,三级标签为语文。
当在个人信息表中添加互动程度数据时,具体包括:
将所述兴趣标签添加至所述个人信息表中;
判断所述个人信息表中的关注用户是否能够匹配互动用户,若否,则将所述关注用户确定为仅关注用户,并对所述仅关注用户设置互动程度分值;
根据互动次数和频率,对互动用户进行分类,并设置分类后的互动用户的互动程度分值;
将所述互动程度分值添加至所述个人信息表中,获得每个用户的目标个人信息表。
例如,在关注用户个人信息表中匹配互动用户个人信息表中的用户ID,将未匹配到的数据记为仅关注用户个人信息表,设置互动程度分值,此时仅关注用户的互动程度分值较低,将这部分信息补充到用户个人信息表中。
根据互动次数和频率对互动用户进行分类。依据用户对广告主所有活动页点赞次数、评论次数,转发次数给用户的互动程度打分,互动次数多的分值高,互动次数少的分值低,将这部分信息也补充到用户个人信息表中。
在补充了个人信息表中,对数据进行分析,获得用户的目标标签的过程可以包括以下步骤:
根据所述目标个人信息表,确定聚类特征值;
依据所述聚类特征值,对所述目标个人信息表进行聚类分析,获得分析维度;
根据所述分析维度对应的互动程度信息,确定用户的目标标签。
例如,对目标个人信息表进行聚类分析时,需要先确定聚类选择的特征值,该特征值可以包括性别、年龄、所在地、受教育程度、兴趣标签、额外的兴趣标签、互动程度等维度指标。对所选数据进行向量化,使用凝聚层次聚类方法进行聚类。然后,从聚类结果中发掘有价值的信息。比如可以分析各个维度对互动程度的影响,再如互动人群都集中在哪些兴趣标签或者维度指标上,这样就可以确定用户的目标标签,其中,目标标签表征了用户感兴趣的相关信息,可以有针对性的进行社交网站甚至其他网站及线下的广告投放和营销,提高营销的精准度。具体的例如,若用户的关注账号多为美食账号,或者用户最多互动的数据也来源于与美食产品相关的广告账号的互动,可以将该用户的目标标签确定为美食或者食品,当广告主需要推广食物产品的广告时,可以优先推送至这部分用户,以提高相应产品的销售份额。
通过本发明实施例提供的技术方案同分利用了社交网站用户信息的大数据,选择关注官方账号或活动过的潜在营销对象,通过分析爬取的公开数据可以实现低成本获取兴趣标签,获得的用户兴趣标签数据具有统计学意义。从数据中获取定制化的用户兴趣的相关信息,能够帮助企业或广告主提升营销活动的宣传和转化效果。
对应的,在本发明实施例中还提供了一种用户标签生成装置,参见图4,包括:
群体确定单元401,用于确定用户群体,获取所述用户群体中各用户的个人信息,根据获取的个人信息生成所述用户群体中的每个用户的个人信息表;
信息获取单元402,用于根据所述个人信息表,获取所述用户群体中的每个用户的关注账号和所述关注账号对应的信息数据;
提取单元403,用于根据所述关注账号对应的信息数据,提取获得与所述关注账号匹配的兴趣标签;
信息添加单元404,用于将所述兴趣标签添加至所述个人信息表中,并在所述个人信息表中添加用户的互动程度数据,获得每个用户的目标个人信息表;
分析单元405,用于对所述目标个人信息表进行数据分析,获得用户的目标标签。
进一步的,所述群体确定单元包括:
第一用户确定子单元,用于确定目标账号的关注用户;
第一信息获取子单元,用于根据所述关注用户的用户标识,提取获得与所述关注用户匹配的个人信息,并将所述关注用户匹配的个人信息储存至关注用户个人信息表;
第二用户确定子单元,用于确定目标账号的互动用户;
第二信息获取子单元,用于提取获得与所述互动用户匹配的个人信息,并将所述互动用户匹配的个人信息存储至互动用户个人信息表;
去重子单元,用于根据用户标识,对所述关注用户个人信息表和所述互动用户个人信息表进行去重处理,获得每个用户的个人信息表。
进一步的,所述信息获取单元包括:
关注账号获取子单元,用于根据所述个人信息表,获取所述用户群体中的每个用户的关注账号;
信息提取子单元,用于提取获得每个用户的关注账号对应的初始信息数据;
信息过滤子单元,用于根据预设过滤条件对所述初始信息数据进行过滤,获得过滤后的信息数据;
数据添加子单元,用于获取用户与所述用户对应的关注账号之间的互动数据,将所述互动数据添加至所述过滤后的信息数据,获得所述关注账号对应的信息数据。
进一步的,所述提取单元包括:
分类子单元,用于根据所述关注账号对应的信息数据,对所述关注账号进行分类处理,获得目标关注账号;
生成子单元,用于根据所述目标关注账号的信息数据,生成每个所述目标关注账号的兴趣标签。
进一步的,该装置还包括:
分级子单元,用于对所述目标关注账号的兴趣标签进行分级,获得目标关注账号与兴趣标签之间的分级映射关系;
匹配子单元,用于将目标关注账号与兴趣标签之间的分级映射关系与用户进行匹配,获得用户关注账号的兴趣标签。
进一步的,所述信息添加单元包括:
第一添加子单元,用于将所述兴趣标签添加至所述个人信息表中;
判断子单元,用于判断所述个人信息表中的关注用户是否能够匹配互动用户,若否,则将所述关注用户确定为仅关注用户,并对所述仅关注用户设置互动程度分值;
设置子单元,用于根据互动次数和频率,对互动用户进行分类,并设置分类后的互动用户的互动程度分值;
第二添加子单元,用于将所述互动程度分值添加至所述个人信息表中,获得每个用户的目标个人信息表。
进一步的,所述分析单元包括:
特征值确定子单元,用于根据所述目标个人信息表,确定聚类特征值;
聚类子单元,用于依据所述聚类特征值,对所述目标个人信息表进行聚类分析,获得分析维度;
标签确定子单元,用于根据所述分析维度对应的互动程度信息,确定用户的目标标签。
本发明提供的用户标签装置,充分利用了社交网站用户信息的大数据,在群体确定单元中选择与业务需求相关的用户全群体作为分析对象,并通过信息获取单元获得该用户对应的关注账号,在提取单元中生成关注账号的兴趣标签,同时通过信息添加单元和分析单元对用户的个人信息和互动数据进行聚类分析,获得目标标签,使得获得的用户标签具有统计学意义,并且基于网络公开数据降低了数据购买的成本,且由于对符合业务需求的用户群体及相关账号信息进行分析,使得获得的用户标签更加匹配业务需求,数据准确性更高,有助于企业或广告主通过目标标签提升营销活动的宣传和转化效果。
需要说明的是,本实施例中的各个模块、子模块和单元的工作过程,请参照上述实施例中的相应说明,在此不再赘述。
可选的,本发明的实施例还提供了一种电子装置,所述群体确定单元、信息获取单元、提取单元、信息添加单元和分析单元均作为程序单元存储在存储器中,由处理器执行存储在存储器中的上述程序单元来实现相应的功能。
处理器中包含内核,由内核去存储器中调取相应的程序单元。内核可以设置一个或以上,通过调整内核参数来确定用户的相关个人信息,使得获得的用户兴趣标签数据具有统计学意义,降低数据成本提高数据准确性。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flashRAM),存储器包括至少一个存储芯片。
本发明实施例提供了一种存储介质,其上存储有程序,该程序被处理器执行时实现用户标签生成方法。
本发明实施例提供了一种处理器,所述处理器用于运行程序,其中,所述程序运行时执行所述用户标签生成方法。
本发明实施例提供了一种设备,设备包括处理器、存储器及存储在存储器上并可在处理器上运行的程序,处理器执行程序时实现以下步骤:
确定用户群体,获取所述用户群体中各用户的个人信息,根据获取的个人信息生成所述用户群体中的每个用户的个人信息表;
根据所述个人信息表,获取所述用户群体中的每个用户的关注账号和所述关注账号对应的信息数据;
根据所述关注账号对应的信息数据,提取获得与所述关注账号匹配的兴趣标签;
将所述兴趣标签添加至所述个人信息表中,并在所述个人信息表中添加用户的互动程度数据,获得每个用户的目标个人信息表;
对所述目标个人信息表进行数据分析,获得用户的目标标签。
进一步的,所述确定用户群体,获取所述用户群体中各用户的个人信息,根据获取的个人信息生成所述用户群体中的每个用户的个人信息表,包括:
确定目标账号的关注用户;
根据所述关注用户的用户标识,提取获得与所述关注用户匹配的个人信息,并将所述关注用户匹配的个人信息储存至关注用户个人信息表;
确定目标账号的互动用户;
提取获得与所述互动用户匹配的个人信息,并将所述互动用户匹配的个人信息存储至互动用户个人信息表;
根据用户标识,对所述关注用户个人信息表和所述互动用户个人信息表进行去重处理,获得每个用户的个人信息表。
进一步的,所述根据所述个人信息表,获取所述用户群体中的每个用户的关注账号和所述关注账号对应的信息数据,包括:
获取所述用户群体中的每个用户的关注账号;
提取获得每个用户的关注账号对应的初始信息数据;
根据预设过滤条件对所述初始信息数据进行过滤,获得过滤后的信息数据;
获取用户与所述用户对应的关注账号之间的互动数据,将所述互动数据添加至所述过滤后的信息数据,获得所述关注账号对应的信息数据。
进一步的,所述根据所述关注账号对应的信息数据,提取获得与所述关注账号匹配的兴趣标签,包括:
根据所述关注账号对应的信息数据,对所述关注账号进行分类处理,获得目标关注账号;
根据所述目标关注账号的信息数据,生成每个所述目标关注账号的兴趣标签。
进一步的,该方法还包括:
对所述目标关注账号的兴趣标签进行分级,获得目标关注账号与兴趣标签之间的分级映射关系;
将目标关注账号与兴趣标签之间的分级映射关系与用户进行匹配,获得用户关注账号的兴趣标签。
进一步的,所述将所述兴趣标签添加至所述个人信息表中,并在所述个人信息表中添加用户的互动程度数据获得每个用户的目标个人信息表,包括:
将所述兴趣标签添加至所述个人信息表中;
判断所述个人信息表中的关注用户是否能够匹配互动用户,若否,则将所述关注用户确定为仅关注用户,并对所述仅关注用户设置互动程度分值;
根据互动次数和频率,对互动用户进行分类,并设置分类后的互动用户的互动程度分值;
将所述互动程度分值添加至所述个人信息表中,获得每个用户的目标个人信息表。
进一步的,所述对所述目标个人信息表进行数据分析,获得用户的目标标签,包括:
根据所述目标个人信息表,确定聚类特征值;
依据所述聚类特征值,对所述目标个人信息表进行聚类分析,获得分析维度;
根据所述分析维度对应的互动程度信息,确定用户的目标标签。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flashRAM)。存储器是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域技术人员应明白,本申请的实施例可提供为方法、系统或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
以上仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。
Claims (10)
1.一种用户标签生成方法,其特征在于,包括:
确定用户群体,获取所述用户群体中各用户的个人信息,根据获取的个人信息生成所述用户群体中的每个用户的个人信息表;
根据所述个人信息表,获取所述用户群体中的每个用户的关注账号和所述关注账号对应的信息数据;
根据所述关注账号对应的信息数据,提取获得与所述关注账号匹配的兴趣标签;
将所述兴趣标签添加至所述个人信息表中,并在所述个人信息表中添加用户的互动程度数据,获得每个用户的目标个人信息表;
对所述目标个人信息表进行数据分析,获得用户的目标标签。
2.根据权利要求1所述的方法,其特征在于,所述确定用户群体,获取所述用户群体中各用户的个人信息,根据获取的个人信息生成所述用户群体中的每个用户的个人信息表,包括:
确定目标账号的关注用户;
根据所述关注用户的用户标识,提取获得与所述关注用户匹配的个人信息,并将所述关注用户匹配的个人信息储存至关注用户个人信息表;
确定目标账号的互动用户;
提取获得与所述互动用户匹配的个人信息,并将所述互动用户匹配的个人信息存储至互动用户个人信息表;
根据用户标识,对所述关注用户个人信息表和所述互动用户个人信息表进行去重处理,获得每个用户的个人信息表。
3.根据权利要求1所述的方法,其特征在于,所述根据所述个人信息表,获取所述用户群体中的每个用户的关注账号和所述关注账号对应的信息数据,包括:
根据所述个人信息表,获取所述用户群体中的每个用户的关注账号;
提取获得每个用户的关注账号对应的初始信息数据;
根据预设过滤条件对所述初始信息数据进行过滤,获得过滤后的信息数据;
获取用户与所述用户对应的关注账号之间的互动数据,将所述互动数据添加至所述过滤后的信息数据,获得所述关注账号对应的信息数据。
4.根据权利要求3所述的方法,其特征在于,所述根据所述关注账号对应的信息数据,提取获得与所述关注账号匹配的兴趣标签,包括:
根据所述关注账号对应的信息数据,对所述关注账号进行分类处理,获得目标关注账号;
根据所述目标关注账号的信息数据,生成每个所述目标关注账号的兴趣标签。
5.根据权利要求4所述的方法,其特征在于,该方法还包括:
对所述目标关注账号的兴趣标签进行分级,获得目标关注账号与兴趣标签之间的分级映射关系;
将目标关注账号与兴趣标签之间的分级映射关系与用户进行匹配,获得用户关注账号的兴趣标签。
6.根据权利要求2所述的方法,其特征在于,所述将所述兴趣标签添加至所述个人信息表中,并在所述个人信息表中添加用户的互动程度数据获得每个用户的目标个人信息表,包括:
将所述兴趣标签添加至所述个人信息表中;
判断所述个人信息表中的关注用户是否能够匹配互动用户,若否,则将所述关注用户确定为仅关注用户,并对所述仅关注用户设置互动程度分值;
根据互动次数和频率,对互动用户进行分类,并设置分类后的互动用户的互动程度分值;
将所述互动程度分值添加至所述个人信息表中,获得每个用户的目标个人信息表。
7.根据权利要求6所述的方法,其特征在于,所述对所述目标个人信息表进行数据分析,获得用户的目标标签,包括:
根据所述目标个人信息表,确定聚类特征值;
依据所述聚类特征值,对所述目标个人信息表进行聚类分析,获得分析维度;
根据所述分析维度对应的互动程度信息,确定用户的目标标签。
8.一种用户标签生成装置,其特征在于,包括:
群体确定单元,用于确定用户群体,获取所述用户群体中各用户的个人信息,根据获取的个人信息生成所述用户群体中的每个用户的个人信息表;
信息获取单元,用于根据所述个人信息表,获取所述用户群体中的每个用户的关注账号和所述关注账号对应的信息数据;
提取单元,用于根据所述关注账号对应的信息数据,提取获得与所述关注账号匹配的兴趣标签;
信息添加单元,用于将所述兴趣标签添加至所述个人信息表中,并在所述个人信息表中添加用户的互动程度数据,获得每个用户的目标个人信息表;
分析单元,用于对所述目标个人信息表进行数据分析,获得用户的目标标签。
9.一种存储介质,其特征在于,所述存储介质包括存储的程序,其中,所述程序执行权利要求1至7中任意一项所述的用户标签生成方法。
10.一种处理器,其特征在于,所述处理器用于运行程序,其中,所述程序运行时执行权利要求1至7中任意一项所述的用户标签生成方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811162340.9A CN110969473B (zh) | 2018-09-30 | 2018-09-30 | 一种用户标签生成方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811162340.9A CN110969473B (zh) | 2018-09-30 | 2018-09-30 | 一种用户标签生成方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110969473A true CN110969473A (zh) | 2020-04-07 |
CN110969473B CN110969473B (zh) | 2023-10-31 |
Family
ID=70029393
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811162340.9A Active CN110969473B (zh) | 2018-09-30 | 2018-09-30 | 一种用户标签生成方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110969473B (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112270008A (zh) * | 2020-11-16 | 2021-01-26 | 加和(北京)信息科技有限公司 | 一种精准计算群体特征的方法及系统 |
CN113450132A (zh) * | 2020-12-30 | 2021-09-28 | 北京新氧科技有限公司 | 广告投放方法、装置、设备及系统 |
CN113609153A (zh) * | 2021-07-19 | 2021-11-05 | 用友网络科技股份有限公司 | 人才信息处理方法、装置、计算机设备和可读存储介质 |
CN117590951A (zh) * | 2024-01-18 | 2024-02-23 | 江西科技学院 | 一种多场景vr互动方法、系统及存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105989004A (zh) * | 2015-01-27 | 2016-10-05 | 阿里巴巴集团控股有限公司 | 一种信息投放的预处理方法和装置 |
US20160379268A1 (en) * | 2013-12-10 | 2016-12-29 | Tencent Technology (Shenzhen) Company Limited | User behavior data analysis method and device |
CN106357517A (zh) * | 2016-09-27 | 2017-01-25 | 腾讯科技(北京)有限公司 | 定向标签生成方法及装置 |
CN108062385A (zh) * | 2017-12-14 | 2018-05-22 | 微梦创科网络科技(中国)有限公司 | 用户兴趣挖掘的方法及系统 |
-
2018
- 2018-09-30 CN CN201811162340.9A patent/CN110969473B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20160379268A1 (en) * | 2013-12-10 | 2016-12-29 | Tencent Technology (Shenzhen) Company Limited | User behavior data analysis method and device |
CN105989004A (zh) * | 2015-01-27 | 2016-10-05 | 阿里巴巴集团控股有限公司 | 一种信息投放的预处理方法和装置 |
CN106357517A (zh) * | 2016-09-27 | 2017-01-25 | 腾讯科技(北京)有限公司 | 定向标签生成方法及装置 |
CN108062385A (zh) * | 2017-12-14 | 2018-05-22 | 微梦创科网络科技(中国)有限公司 | 用户兴趣挖掘的方法及系统 |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112270008A (zh) * | 2020-11-16 | 2021-01-26 | 加和(北京)信息科技有限公司 | 一种精准计算群体特征的方法及系统 |
CN113450132A (zh) * | 2020-12-30 | 2021-09-28 | 北京新氧科技有限公司 | 广告投放方法、装置、设备及系统 |
CN113609153A (zh) * | 2021-07-19 | 2021-11-05 | 用友网络科技股份有限公司 | 人才信息处理方法、装置、计算机设备和可读存储介质 |
CN117590951A (zh) * | 2024-01-18 | 2024-02-23 | 江西科技学院 | 一种多场景vr互动方法、系统及存储介质 |
CN117590951B (zh) * | 2024-01-18 | 2024-04-05 | 江西科技学院 | 一种多场景vr互动方法、系统及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN110969473B (zh) | 2023-10-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108121737B (zh) | 一种业务对象属性标识的生成方法、装置和系统 | |
CN110969473B (zh) | 一种用户标签生成方法及装置 | |
CN105989004B (zh) | 一种信息投放的预处理方法和装置 | |
US20160379268A1 (en) | User behavior data analysis method and device | |
CN106940705A (zh) | 一种用于构建用户画像的方法与设备 | |
Wang et al. | Database submission—market dynamics and user-generated content about tablet computers | |
CN104951468A (zh) | 数据搜索处理方法和系统 | |
CN107180064A (zh) | 一种物流信息处理方法、装置及物流信息系统 | |
CN103246980A (zh) | 信息输出方法及服务器 | |
CN107633416B (zh) | 一种业务对象的推荐方法、装置和系统 | |
KR20180052489A (ko) | 사용자 경험분석 및 환경요인에 기초한 크로스보더 전자상거래 상품 추천 방법 | |
CN106708871B (zh) | 一种社交业务特征用户的识别方法和装置 | |
CN112418932A (zh) | 一种基于用户标签的营销信息推送方法及装置 | |
JP6731826B2 (ja) | 抽出装置、抽出方法、及び抽出プログラム | |
CN106909567B (zh) | 数据处理方法及装置 | |
CN115775163A (zh) | 一种基于大数据的程序化广告投放方法、设备及介质 | |
KR20190081671A (ko) | 온라인 쇼핑몰 통합 관리 시스템에서의 유사상품을 검색하는 방법 및 그 서버 | |
Munnia et al. | Big data, predictive marketing and churn management in the IoT era | |
KR20180062629A (ko) | 사용자 맞춤형 광고 장치 | |
JP2018041314A (ja) | 分類装置、分類方法、及び分類プログラム | |
CN110020118B (zh) | 一种计算用户之间相似度的方法及装置 | |
CN111582901A (zh) | 一种展示链接效果的量化方法、装置、系统及存储介质 | |
Cherednichenko et al. | Information technology for intellectual analysis of item descriptions in e-commerce | |
CN110969400A (zh) | 一种供应链上下游数据关联方法和装置 | |
CN115018576A (zh) | 金融数据处理方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |