CN109359236A - 基于大数据分析的目标用户挖掘方法及装置 - Google Patents

基于大数据分析的目标用户挖掘方法及装置 Download PDF

Info

Publication number
CN109359236A
CN109359236A CN201810961835.1A CN201810961835A CN109359236A CN 109359236 A CN109359236 A CN 109359236A CN 201810961835 A CN201810961835 A CN 201810961835A CN 109359236 A CN109359236 A CN 109359236A
Authority
CN
China
Prior art keywords
users
user
seed
seed user
relationship
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810961835.1A
Other languages
English (en)
Inventor
张尚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Life Insurance Company of China Ltd
Original Assignee
Ping An Life Insurance Company of China Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Life Insurance Company of China Ltd filed Critical Ping An Life Insurance Company of China Ltd
Priority to CN201810961835.1A priority Critical patent/CN109359236A/zh
Publication of CN109359236A publication Critical patent/CN109359236A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请揭示了一种基于大数据分析的目标用户挖掘方法及装置,该方法应用于互联网应用平台所进行的目标用户获取。所述方法包括:获取与预设投放条件相匹配的种子用户群以及所述种子用户群中每一种子用户对应的画像标签,所述预设投放条件为用于描述特定资源的受众群体的特征;通过所述画像标签,构建所述种子用户面向于其他用户的关系网络;从所述关系网络中获得所述其他用户与所述种子用户之间的关系程度信息;根据所述关系程度信息从所述关系网络中提取与指定目标用户数量相同的其他用户作为与所述预投放条件相匹配的目标用户。本申请解决了现有技术无法对确定数量级的用户群进行互联网信息投放的问题。

Description

基于大数据分析的目标用户挖掘方法及装置
技术领域
本申请涉及互联网应用技术领域,特别涉及一种基于大数据分析的目标用户挖掘方法及装置、电子设备、计算机可读存储介质。
背景技术
互联网信息的投放一般是针对用户群进行投放的,将互联网信息投放至某一用户群,使得该用户群中的所有用户能够接收到此投放的互联网信息。
在当前的用户群创建中,只能通过选择用户属性标签或者导入用户包的形式创建用户群,得到的用户数量往往是不理想的。例如,预投放的目标用户数量为100万,但通过选择用户属性标签或者导入数据包的形式得到的用户数量只有10万,远不能达到目标用户数量。
因此,现有技术的缺陷在于,无法解决对某个确定数量级的用户群进行互联网信息投放的问题。
发明内容
基于上述技术问题,本申请提供了一种基于大数据分析的目标用户挖掘方法、装置、电子设备以及计算机可读存储介质。
一种基于大数据分析的目标用户挖掘方法,所述方法包括:
获取与预设投放条件相匹配的种子用户群以及所述种子用户群中每一种子用户对应的画像标签,所述预设投放条件为用于描述特定资源的受众群体的特征;
通过所述画像标签,构建所述种子用户面向于其他用户的关系网络;
从所述关系网络中获得所述其他用户与所述种子用户之间的关系程度信息;
根据所述关系程度信息从所述关系网络中提取与指定目标用户数量相同的其他用户作为与所述预投放条件相匹配的目标用户。
在一示例性实施例中,所述获取与预设投放条件相匹配的种子用户群以及所述种子用户群中每一种子用户对应的画像标签包括:
获取与预设投放条件相匹配的种子用户群中每一种子用户对应的用户数据;
对所述种子用户群中每一种子用户对应的用户数据进行画像分析,获得每一种子用户对应的画像标签。
在一示例性实施例中,所述通过所述画像标签,构建所述种子用户面向于其他用户的关系网络,包括:
从所对应的画像标签中获取每一所述种子用户的固定属性标签和/或行为属性标签;
根据所述固定属性标签和/或行为属性标签构建每一所述种子用户面向其他用户的关系网络。
在一示例性实施例中,所述从所述关系网络获得所述其他用户相对所述种子用户的关系程度信息,包括:
按照预设的种子用户与其他用户之间的关系程度划分所述其他用户在所述关系网络中的层级;
获取所述其他用户所在关系网络中的层级,所述其他用户所在所述关系网络中的层级表示所述其他用户相对所述种子用户的关系程度。
在一示例性实施例中,所述根据所述关系程度信息从所述关系网络中提取与指定目标用户数量相同的其他用户作为与所述预投放条件相匹配的目标用户包括:
对所述关系网络中的全部其他用户按照与对应种子用户之间关系的远近程度进行排序;
按照所述关系网络中全部其他用户的排序,依次从所述关系网络中提取与所述指定的目标用户数量相同的其他用户作为所述目标用户。
在一示例性实施例中,在所述根据所述关系程度信息从所述关系网络中提取与指定目标用户数量相同的其他用户作为与所述预投放条件相匹配的目标用户之前,所述方法还包括:
分析所述特定资源的受众群体的特征与所述关系网络中所述其他用户的画像标签之间的相似程度;
根据所述相似程度对所述关系网络中其他用户相对所述种子用户的关系程度信息更新。
在一示例性实施例中,所述方法还包括:
对适应所述目标用户提取的提取操作,按照所提取的目标用户进行个性化信息投放。
一种基于大数据分析的目标用户挖掘装置,所述装置包括:
种子用户获取模块,获取与预设投放条件相匹配的种子用户群以及所述种子用户群中每一种子用户对应的画像标签,所述预设投放条件为用于描述特定资源的受众群体的特征;
关系网络构建模块,用于通过所对应的画像标签,构建所述种子用户面向于其他用户的关系网络;
关系程度信息获取模块,用于从所述关系网络获得所述其他用户相对所述种子用户的关系程度信息;
目标用户提取模块,用于根据所述关系程度信息从所述关系网络中提取与指定目标用户数量相同的其他用户作为与所述预投放条件相匹配的目标用户。
在一示例性实施例中,所述种子用户获取模块包括:
用户数据获取单元,用于获取与所述个性化内容投放所匹配的种子用户群中每一种子用户对应的用户数据;
画像分析单元,用于对所述种子用户群中每一种子用户对应的用户数据进行画像分析,获得每一种子用户对应的画像标签。
在一示例性实施例中,所述关系网络构建模块包括:
画像标签获取单元,用于从所对应的画像标签中获取每一所述种子用户的固定属性标签和/或行为属性标签;
关系网络构建单元,用于根据所述固定属性标签和/或行为属性标签构建每一所述种子用户面向其他用户的关系网络。
在一示例性实施例中,所述关系程度信息获取模块包括:
层级划分单元,按照预设的种子用户与其他用户之间的关系程度划分所述其他用户在所述关系网络中的层级;
层级获取单元,获取所述其他用户所在关系网络中的层级,所述其他用户所在所述关系网络中的层级表示所述其他用户相对所述种子用户的关系程度。
在一示例性实施例中,所述目标用户提取模块包括:
用户排序单元,对所述关系网络中的全部其他用户按照所述关系程度信息进行排序;
用户提取单元,用于按照所述关系网络中全部其他用户的排序,依次从所述关系网络中提取与所述指定的目标用户数量相同的其他用户作为所述目标用户。
在一示例性实施例中,所述装置还包括:
相似程度分析模块,用于分析所述特定资源的受众群体的特征与所述关系网络中所述其他用户的画像标签之间的相似程度;
关系程度信息更新模块,用于根据所述相关程度对所述关系网络中其他用户相对所述种子用户的关系程度信息更新。
在一示例性实施例中,所述装置还包括:
个性化投放模块,用于对适应所述目标用户提取的提取操作,按照所提取的目标用户进行个性化信息投放。
一种电子设备,所述电子设备包括:
处理器;
存储器,所述存储器上存储有计算机可读指令,所述计算机可读指令被所述处理器执行时,实现如前所述的方法。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时,实现如前所述的方法。
本申请的实施例提供的技术方案可以包括以下有益效果:
在本申请中,先通过获取种子用户群中种子用户对应的画像标签构建种子与其他用户之间的关系网络,然后从关系网络中获取其他用户相对种子用户的关系程度信息,以按照对应的关系程度信息从关系网络中提取指定的目标用户数量下的其他用户作为目标用户,从而获取与指定的目标用户数量对应的目标用户群,解决了现有技术无法对确定数量级的用户群进行互联网信息投放的问题。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性的,并不能限制本申请。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并于说明书一起用于解释本申请的原理。
图1是根据一示例性实施例示出的一种计算机设备的框图;
图2是根据一示例性实施例示出的一种基于大数据分析的目标用户挖掘方法的流程图;
图3是根据一示例性实施例示出的一种对应图2中种子用户面向其他用户的关系网络的示意图;
图4是根据图2对应实施例示出的步骤210的细节的流程图;
图5是根据图2对应实施例示出的步骤230的细节的流程图;
图6是根据图2对应实施例示出的步骤250的细节的流程图;
图7是根据图2对应实施例示出的步骤270的细节的流程图;
图8是根据另一示例性实施例示出的一种基于大数据分析的目标用户挖掘方法的流程图;
图9是根据另一示例性实施例示出的一种基于大数据分析的目标用户挖掘方法的流程图;
图10是根据一示例性实施例示出的一种基于大数据分析的目标用户挖掘装置的框图;
图11是根据图10对应实施例示出的种子用户获取模块的框图;
图12是根据图10对应实施例示出的关系网络构建模块的框图;
图13是根据图10对应实施例示出的关系程度信息获取模块的框图;
图14是根据图10对应实施例示出的目标用户提取模块的框图;
图15是根据另一示例性实施例示出的一种基于大数据分析的目标用户挖掘装置的框图;
图16是根据另一示例性实施例示出的一种基于大数据分析的目标用户挖掘装置的框图。
具体实施方式
这里将详细地对示例性实施例执行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。
图1是根据一示例性实施例示出的一种计算机设备的框图。如图1所示,计算机设备可以包括以下一个或者多个组件:处理组件101,存储器102,电源组件103,多媒体组件104,音频组件105,传感器组件107以及通信组件108。其中,上述组件并不全是必须的,计算机设备可以根据自身功能需求增加其他组件或减少某些组件,本实施例不作限定。
处理组件101通常控制计算机设备的整体操作,诸如与显示,电话呼叫,数据通信,相机操作以及日志数据处理相关联的操作等。处理组件101可以包括一个或多个处理器109来执行指令,以完成上述操作的全部或部分步骤。此外,处理组件101可以包括一个或多个模块,便于处理组件101和其他组件之间的交互。例如,处理组件101可以包括多媒体模块,以方便多媒体组件104和处理组件101之间的交互。
存储器102被配置为存储各种类型的数据以支持在计算机设备的操作。这些数据的示例包括用于在计算机设备上操作的任何应用程序或方法的指令。存储器102可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如SRAM(Static RandomAccess Memory,静态随机存取存储器),EEPROM(Electrically Erasable ProgrammableRead-Only Memory,电可擦除可编程只读存储器),EPROM(Erasable Programmable ReadOnly Memory,可擦除可编程只读存储器),PROM(Programmable Read-Only Memory,可编程只读存储器),ROM(Read-Only Memory,只读存储器),磁存储器,快闪存储器,磁盘或光盘。存储器102中还存储有一个或多个模块,该一个或多个模块被配置成由该一个或多个处理器109执行,以完成以下任一所示基于大数据分析的目标用户挖掘方法中的全部或者部分步骤。
电源组件103为计算机设备的各种组件提供电力。电源组件103可以包括电源管理系统,一个或多个电源,及其他与为计算机设备生成、管理和分配电力相关联的组件。
多媒体组件104包括在所述计算机设备和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括LCD(Liquid Crystal Display,液晶显示器)和TP(TouchPanel,触摸面板)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。
音频组件105被配置为输出和/或输入音频信号。例如,音频组件105包括一个麦克风,当计算机设备处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器102或经由通信组件108发送。在一些实施例中,音频组件105还包括一个扬声器,用于输出音频信号。
传感器组件107包括一个或多个传感器,用于为计算机设备提供各个方面的状态评估。例如,传感器组件107可以检测到计算机设备的打开/关闭状态,组件的相对定位,传感器组件107还可以检测计算机设备或计算机设备一个组件的坐标改变以及计算机设备的温度变化。在一些实施例中,该传感器组件107还可以包括磁传感器,压力传感器或温度传感器。
通信组件108被配置为便于计算机设备和其他设备之间有线或无线方式的通信。计算机设备可以接入基于通信标准的无线网络,如WiFi(WIreless-Fidelity,无线网络),2G或3G,或它们的组合。在一个示例性实施例中,通信组件108经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,所述通信组件108还包括NFC(Near Field Communication,近场通信)模块,以促进短程通信。例如,在NFC模块可基于RFID(Radio Frequency Identification,射频识别)技术,IrDA(Infrared DataAssociation,红外数据协会)技术,UWB(Ultra-Wideband,超宽带)技术,BT(Bluetooth,蓝牙)技术和其他技术来实现。
在示例性实施例中,计算机设备可以被一个或多个ASIC(Application SpecificIntegrated Circuit,应用专用集成电路)、DSP(Digital Signal Processing,数字信号处理器)、PLD(Programmable Logic Device,可编程逻辑器件)、FPGA(Field-ProgrammableGate Array,现场可编程门阵列)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述方法。
本实施例中的计算机设备中处理器执行操作的具体方式将在有关基于大数据分析的目标用户挖掘方法的实施例中进行详细描述,此处将不做详细阐述说明。
图2是根据一示例性实施例示出的一种基于大数据分析的目标用户挖掘方法的流程图。该方法适用于图1所示的计算机设备。如图2所示,基于大数据分析的目标用户挖掘方法包括以下步骤:
在步骤210中,获取与预设投放条件相匹配的种子用户群以及所述种子用户群中每一种子用户对应的画像标签,所述预设投放条件为用于描述特定资源的受众群体的特征。
其中,特定资源表示预备投放的互联网信息,在不同的应用场景中,预备投放的互联网信息不同,例如,广告投放场景中互联网信息为广告信息,新闻推送场景中互联网信息为新闻消息。
预设投放条件是预设的用于描述与预备投放的互联网信息内容相适应的受众群体的特征,例如,预备投放的互联网信息为一汽车广告,与汽车广告内容下你给适应的受众群体可以包括用户的性别、收入、消费能力等特征。
种子用户群是由投放方所提供的与预备投放的互联网信息内容相适应的用户群,以通过所提供的种子用户群挖掘更多数量的其他用户,以将预备投放的互联网信息投放给这些其他用户。因此,种子用户群中的每一种子用户均能与预设投放条件所描述的受众群体的特征相匹配。
需要说明的是,投放方所提供的种子用户群是以若干种子用户对应的用户数据存在的,从这些用户数据中能够获得种子用户相应的画像标签。
在一实施例中,投放方在提供的种子用户群时相应提供每一种子用户对应的画像数据,可通过所提供的画像数据获得每一种子用户的画像标签,以便于直接获取每一种子用户的画像标签。
而在另外的实施例中,在获取到投放方提供的每一种子用户的用户数据后,通过对用户数据进行画像分析得到每一种子用户对应的画像标签,本实施例不对种子用户的画像标签来源进行限制。
在步骤230中,通过所述画像标签,构建所述种子用户面向于其他用户的关系网络。
其中,其他用户是互联网应用平台中的海量用户,通过从互联网应用平台的海量用户中获取与种子用户相关的目标用户,以将预备投放的互联网信息投放给互联网应用平台中的目标用户。
其他用户所对应的用户数据从互联网应用平台的数据库中获取,互联网应用平台的数据库中将每一其他用户对应的用户数据进行分析和整合,将每一其他用户对应的画像标签数据分别与每一其他用户关联存储。在一种示例性实施例中,其他用户所对应的画像标签包括与固定属性标签和行为属性标签,其中固定属性标签用于标记其他用户的固定属性信息,行为属性标签用于标记其他用户的行为属性信息。因此,可以从互联网应用平台获取其他用户对应的画像标签。
从互联网应用平台的海量用户中获取与种子用户相关的目标用户具体是通过所构建的关系网络获取的。种子用户通过其对应的画像标签分别构建种子用户与其他用户之间的关系网络,以使得其他用户根据此关系网络与种子用户建立关联。
具体地,从种子用户群获取每一用户对应的画像标签后,根据其他用户所对应的画像标签与每一种子用户对应的画像标签相匹配,从而构建其他用户与种子用户群中每一种子用户之间的关系网络,即,种子用户面向与其他用户的关系网络。
为了便于理解,举例来说,假设种子用户A为种子用户群中的任一用户,通过种子用户A与其他用户的画像标签进行匹配,可得到如图3所示的种子用户A面向其他用户的关系网络。其中,其他用户B、C和D分别为与种子用户A直接相关的其他用户,其他用户B1、B2和B3分别为通过其他用户B与种子用户A间接相关的其他用户,其他用户C1、C2、C3,以及其他用户D1、D2、D3同理。
可以通过上述方法分别到种子用户群中的每一种子用户面向其他用户的关系网络,然后由每一种子用户对应的关系网络构成种子用户群面向其他用户的关系网络。
由此,通过所构建的关系网络,可根据投放方提供的数量十分有限的种子用户得到数量更多的其他用户。
在步骤250中,从所述关系网络获得所述其他用户相对所述种子用户的关系程度信息。
其中,其他用户相对种子用户的关系程度信息包括关系网络构建中其他用户与种子用户进行匹配的画像标签信息,以通过画像标签信息获得其他用户与对应种子用户之间的关系的远近程度。
其他用户与种子用户进行匹配的画像标签信息展示了其他用户是通过哪种关系与种子用户匹配的,例如,某一其他用户的家庭住址标签与对应种子用户相同,则该用户为对应种子用户的直系亲属,与对应种子用户之间的关系较近;若另一其他用户为该直系亲属的同学,则该用户与该对应种子用户之间的关系较远。
因此,可以从所构建的关系网络中可以获取每一其他用户与其对应种子用户的之间关系的远近程度。
在步骤270中,按照对应的所述关系程度信息以及指定的目标用户数量提取其他用户为个性化内容投放的目标用户。
如前所述,可根据其他用户相对所述种子用户的关系程度信息获取每一其他用户与对应种子用户之间关系的远近程度,因此,可按照对应关系的远近程度从关系网络中的全部其他用户提取目标用户。
由于关系网络中的其他用户的数量往往多余投放方指定投放的目标用户数量,需从关系网络中提取与指定的目标用户数量相同的其他用户作为目标用户,从而获得确认数量级的目标用户。
在本申请中,先通过获取种子用户群中种子用户对应的画像标签构建种子与其他用户之间的关系网络,然后从关系网络中获取其他用户相对种子用户的关系程度信息,以按照对应的关系程度信息从关系网络中提取指定的目标用户数量下的其他用户作为目标用户,从而获取与指定的目标用户数量对应的目标用户群,解决了现有技术无法对确定数量级的用户群进行互联网信息投放的问题。
此外,种子用户群是由投放方提供的与预备投放的互联网信息内容相适应的用户群,使得通过种子用户对应的画像标签所构建关系网络中的其他用户也能够与预备投放的互联网信息相适应,因此,获取到的确定数量级的用户群中的目标用户也与待投放信息相适应,进一步保证了互联网信息的投放能够具备较好的回报率。
如图4所示,在一示例性实施例中,为个性化内容投放获取所匹配的种子用户群以及所述种子用户群中每一种子用户对应画像标签可以包括以下步骤:
在步骤211中,获取与预设投放条件相匹配的种子用户群中每一种子用户对应的用户数据。
在步骤213中,对所述种子用户群中种子用户对应的用户数据进行画像分析,获得每一种子用户对应的画像标签。
其中,对种子用户群中每一种子用户对应的用户数据进行画像分析包括分别对每一种子用户对应的固定属性和行为属性添加上画像标签的过程,以通过画像标签对每一种子用户进行标识。
具体地,在一种示例性实施例中,在获取每一种子用户对应的用户数据后,需要对获取的用户数据进行数据分析,以分析每一种子用户相关的用户属性。种子用户相关的用户属性包括用户固定属性、用户行为属性或者其他属性,其中,固定属性为种子用户相对稳定的信息,如用户姓名、年龄、地域、职业、婚姻状况等信息,行为属性为种子用户不断变化的行为信息,例如与用户注册行为、银行卡绑定行为、广告点击行为、付费行为等信息。
分析获得种子用户对应的用户属性后,根据种子用户对应的用户属性分别与预设画像标签数据库中存储的画像标签进行匹配,以将相匹配的画像标签添加为对应种子用户的画像标签。由此,可获得种子用户群中每一种子用户对应的画像标签。
上述对种子用户的用户数据进行画像分析的过程只是本实施例给出的一种示例性实现方法,并不代表本实施例对其进行限定。
因此,在本实施例中,通过对投放方提供的种子用户群中的种子用户进行画像分析,能够得到与每一种子用户的用户属性相对应的画像标签。
如图5所示,在一示例性实施例中,通过所述画像标签,构建所述种子用户面向于其他用户的关系网络可以包括以下步骤:
在步骤231中,从所对应的画像标签中获取每一所述种子用户的固定属性标签和/或行为属性标签。
如上所述,通过对种子用户的固定属性和行为属性进行分析可获得种子用户对应的固定属性标签和行为属性标签,其中固定属性标签标记了种子用户相对稳定的信息,行为属性标签标记了种子用户不断变化的行为信息。
在步骤233中,根据所述固定属性标签和/或行为属性标签构建每一所述种子用户面向其他用户的关系网络。
其中,仅对种子用户的固定属性标签来说,通过种子用户的固定属性标签面向其他用户构建关系网络是通过将互联网应用平台上其他用户对应的固定属性标签与种子用户的固定属性标签进行匹配得到的。通过固定属性标签相匹配后,可以得到与种子用户的固定属性相关联的其他用户。
同理,仅对种子用户的行为属性标签来说,通过将互联网应用平台上其他用户对应的行为属性标签与种子用户的行为属性标签进行匹配得到相应的关系网络,从而得到与种子用户的行为属性相关联的其他用户。
但是,在投放方指定的目标用户数量较大的情况下,从上述两种通过单一画像标签所构建的关系网络中获得的其他用户数量往往是不能达到指定的目标用户数量的。
因此,可将种子用户的固定属性标签和行为属性相结合共同构建面向其他用户的关系网络。具体地,先通过种子用户的固定属性标签构建与其他用户的关系网络,得到与种子用户的固定属性相关的其他用户,然后将种子用户的行为属性标签添加至此关系网络中,以在得到与种子用户的固定属性相关的其他用户的基础上,进一步得到与种子用户的行为属性相关的其他用户。
因此,通过本实施例提供的方法,能够从互联网应用平台中获取到超过指定目标用户数量的其他用户。
如图6所示,在一示例性实施例中,从所述关系网络获得所述其他用户相对所述种子用户的关系程度信息可以包括以下步骤:
在步骤251中,按照预设的种子用户与其他用户之间的关系程度划分所述其他用户在所述关系网络中的层级。
其中,预设的种子用户与其他用户之间的关系程度预先存储于图1所示计算机设备的存储器中,用于按照预设的关系程度分析关系网络中的每一其他用户分别与此预设的关系程度的对应关系,从而获得关系网络中每一其他用户对应的层级。
举例来说,根据其他用户与种子用户之间的人际交往关系程度,可预设种子用户与其他用户之间的关系程度包括“直系亲属”、“旁系亲属”、“同事”、“同学”、“同事的同事”、“同学的同学”、“陌生人”7个层级,按照上述预设关系程度可获得关系网络中每一其他用户所对应的层级,从而实现对其他用户进行层级划分。
需要说明的是,上述预设的种子用户与其他用户之间的关系程度只是本实施例给出的一种示例性举例,并不表示对此进行了限定。
在步骤253中,获取所述其他用户所在关系网络中的层级,所述其他用户所在所述关系网络中的层级表示所述其他用户相对所述种子用户的关系程度。
其中,关系网络中的每一其他用户分别与预设关系的层级对应,每一其他用户所对应的层级则表示其相对种子用户的关系远近程度,例如,与“直系亲属”相对应的其他用户与种子用户的关系最亲近,与“陌生人”相对应的其他用户与种子用户的关系最疏远。
举例来说,在如图3所示的种子用户A所在的关系网络中,可假设其他用户C对应预设关系程度的层级为第4级“同学”,假设其他用户C2对应关系网络中的层级为第6级“同学的同学”。
由此,可以通过关系网络中其他用户所对应的层级获得其他用户相对种子用户的关系程度。
如图7所示,在一示例性实施例中,按照对应的所述关系程度信息以及指定的目标用户数量提取其他用户为个性化内容投放的目标用户可以包括以下步骤:
在步骤271中,对所述关系网络中的全部其他用户按照所述关系程度信息进行排序。
其中,由于通过上述实施例所构建的关系网络中的其他用户数量较大,为了便于从中提取于指定的目标用户数量相同的其他用户,需先对关系网络中的全部其他用户按照与种子用户之间对应关系的远近程度进行排序,排序越靠前则表示其他用户为与种子用户关系更加亲近,也更能与预备投放的互联网信息相适应。
在一种示例性实施例中,如上所述,可按照其他用户所对应的层级对关系网络中的全部其他用户进行排序,具体地,先将对应同一层级的其他用户进行划分,然后按照层级由高至低地对其他用户进行排序。其中,对应同一层级的其他用户在该层级中随机排序。
在步骤273中,按照所述关系网络中全部其他用户的排序,依次从所述关系网络中提取与所述指定的目标用户数量相同的其他用户作为所述目标用户。
其中,在将关系网络中全部的其他用户进行相应排序后,只需选择与指定的目标用户数量对应排序中的其他用户即可得到目标用户。
具体地,在对关系网络中全部其他用户进行的排序中,由高至低地依次提取每一层级对应的其他用户,直至所提取的其他用户数量满足指定的目标用户数量。若所提取的某一层级对应的其他用户数量大于剩余指定的目标用户数量,则随机从该层级中提取剩余指定的目标用户数量的其他用户。
因此,在本实施例中,所提取的目标用户是按照与种子用户之间的关系程度排序越靠前的,使得所提取的目标用户能够最大程度与预备投放的互联网信息相适应。
如图8所示,在一示例性实施例中,在根据所述关系程度信息从所述关系网络中提取与指定目标用户数量相同的其他用户作为与所述预投放条件相匹配的目标用户之前,该基于大数据分析的目标用户挖掘方法还包括以下步骤:
在步骤311中,分析所述特定资源的受众群体的特征与所述关系网络中其他用户对应的画像标签的相似程度。
由于按照上述实施例从关系网络中获得的其他用户相对种子用户的关系程度信息的精确度不够,导致相对同一关系程度信息下的其他用户的数量较多,不便于从该关系程度信息下提取对应的目标用户。
例如,在上述实施例中,若所提取的某一层级对应的其他用户数量大于剩余指定的目标用户数量,随机从该层级中提取剩余指定的目标用户数量的其他用户在目标用户的精确度上有所欠缺。
因此,在本实施例中,通过对关系网络进一步处理,以对关系网络中的其他用户进行更加精确地提取。
其中,如前所述,特定资源的受众群体的特征是预设的用于描述与投放方预备投放的互联网信息内容相适应的受众群体的特征,通过将预备投放的互联网信息内容相适应的受众群体的特征与关系网络中其他用户对应的画像标签进行相似度匹配,以获得其他用户对应的画像标签与预备投放的互联网信息的内容之间的关联程度,所得相似度度越高,则与预备投放的互联网信息的内容之间的关联程度越高。
具体地,在一种示例性实施例中,可通过SVR(Support Vector Regression,支持向量回归)模型学习其他用户的画像标签和预备投放的互联网信息内容之间的相似程度,由于SVR模型的具体学习过程是本领域的普通技术人员能够掌握以及实施的现有技术,本处不对该模型的具体实现过程进行赘述。
在步骤313中,根据所述相似程度对所述关系网络中其他用户相对所述种子用户的关系程度信息更新。
其中,在获得到其他用户的画像标签(尤其是行为属性标签)与预备投放的互联网信息内容之间的相似程度后,根据获得的相似程度对关系网络中其他用户相对所述种子用户的关系程度信息更新。
相应的,举例来说,在关系网络所分的层级中,对每一层级对应的其他用户的行为属性标签与预备投放的互联网信息的内容进行相似程度计算,由此,更新后的关系程度信息包括每一其他用户所对应关系网络的层级及其与预备投放的互联网信息的内容之间的相似程度。
由此,可将关系网络中同一层级对应的所有其他用户按照相似程度大小依次排序,在对目标用户进行提取时,按照每一层级中其他用户的相似程度大小依次提取对应的其他用户。
因此,本实施例并不改变关系网络中其他用户的数量,只是对关系网络中其他用户相对种子用户的关系程度信息进一步细化。相比从某一层级中随机提取剩余指定的目标用户数量的其他用户,本实施例能够在更大程度上精准提取目标用户。
如图9所示,在一示例性实施例中,该基于大数据分析的目标用户挖掘方法还可以包括以下步骤:
在步骤410中,对适应所述目标用户提取的提取操作,按照所提取的目标用户进行个性化信息投放。
其中,个性化内容投放是将投放方预备投放的互联网信息投放给与互联网信息的内容相适应的用户,以实现互联网信息的个性化投放。
在本实施例中,适应目标用户提取的提取操作表示计算机设备按照上述方法提取到确定数量级的目用户,计算机设备提取目标用户后,将预备投放的互联网信息投放至所提取的确定数量级的目标用户。
因此,通过本实施例可以实现互联网信息的个性化投放。
以下是本申请的装置实施例。
图10是根据一示例性实施例示出的一种基于大数据分析的目标用户挖掘装置的框图。如图10所示,该装置包括:
种子用户获取模块510,用于获取与预设投放条件相匹配的种子用户群以及所述种子用户群中每一种子用户对应的画像标签,所述预设投放条件为用于描述特定资源的受众群体的特征;
关系网络构建模块530,用于通过所述画像标签,构建所述种子用户面向于其他用户的关系网络;
关系程度信息获取模块550,用于从所述关系网络获得所述其他用户相对所述种子用户的关系程度信息;
目标用户提取模块570,用于根据所述关系程度信息从所述关系网络中提取与指定目标用户数量相同的其他用户作为与所述预投放条件相匹配的目标用户。
图11是根据图10对应实施例示出的种子用户获取模块510的框图。如图11所示,种子用户获取模块510包括:
用户数据获取单元511,用于获取与所述个性化内容投放所匹配的种子用户群中每一种子用户对应的用户数据;
画像分析单元513,用于对所述种子用户群中种子用户对应的用户数据进行画像分析,获得每一种子用户对应的画像标签。
图12是根据图10对应实施例示出的关系网络构建模块530的框图。如图12所示,关系网络构建模块530包括:
画像标签获取单元531,用于从所对应的画像标签中获取每一所述种子用户的固定属性标签和/或行为属性标签;
关系网络构建单元533,用于根据所述固定属性标签和/或行为属性标签构建每一所述种子用户面向其他用户的关系网络。
图13是根据图10对应实施例示出的关系程度信息获取模块550的框图。如图13所示,关系程度信息获取模块550包括:
层级划分单元551,用于按照预设的种子用户与其他用户之间的关系程度对所述关系网络进行分级;
层级获取单元553,用于获取所述其他用户所在关系网络中的层级,所述其他用户所在所述关系网络中的层级为所述其他用户相对所述种子用户的关系程度信息。
图14是根据图10对应实施例示出的目标用户提取模块570的框图。如图14所示,目标用户提取模块570包括:
用户排序单元571,用于对所述关系网络中的全部其他用户按照所述关系程度信息进行排序;
用户提取单元573,用于按照所述关系网络中全部其他用户的排序,依次从所述关系网络中提取与所述指定的目标用户数量相同的其他用户作为所述目标用户。
图15是根据另一示例性实施例示出的一种基于大数据分析的目标用户挖掘装置的框图。如图15所示,该装置还包括:
相似程度分析模块610,用于分析所述特定资源的受众群体的特征与所述关系网络中所述其他用户的画像标签之间的相似程度;
关系程度信息更新模块630,用于根据所述相关程度对所述关系网络中其他用户相对所述种子用户的关系程度信息更新。
图16是根据另一示例性实施例示出的一种基于大数据分析的目标用户挖掘装置的框图。如图16所示,该装置还包括:
个性化投放模块710,用于对适应所述目标用户提取的提取操作,按照所提取的目标用户进行个性化信息投放。
需要说明的是,上述实施例所提供的装置与上述实施例所提供的方法属于同一构思,其中各个模块执行操作的具体方式已经在方法实施例中进行了详细描述,此处不再赘述。
本申请还提供一种电子设备,该电子设备包括:
处理器;
存储器,该存储器上存储有计算机可读指令,该计算机可读指令被处理器执行时,实现如前所示的基于大数据分析的目标用户挖掘方法。
该电子设备可以是图1所示的计算机设备。
在一示例性实施例中,本申请还提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时,实现如前所示的基于大数据分析的目标用户挖掘方法。
应当理解的是,本申请并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围执行各种修改和改变。本申请的范围仅由所附的权利要求来限制。

Claims (10)

1.一种基于大数据分析的目标用户挖掘方法,其特征在于,所述方法包括:
获取与预设投放条件相匹配的种子用户群以及所述种子用户群中每一种子用户对应的画像标签,所述预设投放条件为用于描述特定资源的受众群体的特征;
通过所述画像标签,构建所述种子用户面向于其他用户的关系网络;
从所述关系网络中获得所述其他用户与所述种子用户之间的关系程度信息;
根据所述关系程度信息从所述关系网络中提取与指定目标用户数量相同的其他用户作为与所述预投放条件相匹配的目标用户。
2.根据权利要求1所述的方法,其特征在于,所述获取与预设投放条件相匹配的种子用户群以及所述种子用户群中每一种子用户对应的画像标签包括:
获取与预设投放条件相匹配的种子用户群中每一种子用户对应的用户数据;
对所述种子用户群中每一种子用户对应的用户数据进行画像分析,获得每一种子用户对应的画像标签。
3.根据权利要求1所述的方法,其特征在于,所述通过所述画像标签,构建所述种子用户面向于其他用户的关系网络包括:
从所对应的画像标签中获取每一所述种子用户的固定属性标签和/或行为属性标签;
根据所述固定属性标签和/或行为属性标签构建每一所述种子用户面向其他用户的关系网络。
4.根据权利要求1所述的方法,其特征在于,所述从所述关系网络中获得所述其他用户与所述种子用户之间的关系程度信息包括:
按照预设的种子用户与其他用户之间的关系程度划分所述其他用户在所述关系网络中的层级;
获取所述其他用户所在关系网络中的层级,所述其他用户所在所述关系网络中的层级表示所述其他用户相对所述种子用户的关系程度。
5.根据权利要求1所述的方法,其特征在于,所述根据所述关系程度信息从所述关系网络中提取与指定目标用户数量相同的其他用户作为与所述预投放条件相匹配的目标用户包括:
对所述关系网络中的全部其他用户按照与对应种子用户之间关系的远近程度进行排序;
按照所述关系网络中全部其他用户的排序,依次从所述关系网络中提取与所述指定的目标用户数量相同的其他用户作为所述目标用户。
6.根据权利要求1所述的方法,其特征在于,在所述根据所述关系程度信息从所述关系网络中提取与指定目标用户数量相同的其他用户作为与所述预投放条件相匹配的目标用户之前,所述方法还包括:
分析所述特定资源的受众群体的特征与所述关系网络中所述其他用户的画像标签之间的相似程度;
根据所述相似程度对所述关系网络中其他用户相对所述种子用户的关系程度信息更新。
7.根据权利要求1所述的方法,其特征在于,所述方法还包括:
对适应所述目标用户提取的提取操作,按照所提取的目标用户进行个性化信息投放。
8.一种基于大数据分析的目标用户挖掘装置,其特征在于,所述装置包括:
种子用户获取模块,用于获取与预设投放条件相匹配的种子用户群以及所述种子用户群中每一种子用户对应的画像标签,所述预设投放条件为用于描述特定资源的受众群体的特征;
关系网络构建模块,用于通过所述画像标签,构建所述种子用户面向于其他用户的关系网络;
关系程度信息获取模块,用于从所述关系网络获得所述其他用户相对所述种子用户的关系程度信息;
目标用户提取模块,用于根据所述关系程度信息从所述关系网络中提取与指定目标用户数量相同的其他用户作为与所述预投放条件相匹配的目标用户。
9.一种电子设备,其特征在于,所述电子设备包括:
处理器;
存储器,所述存储器上存储有计算机可读指令,所述计算机可读指令被所述处理器执行时,实现如权利要求1至7任一项所述的方法。
10.一种计算机可读存储介质,其特征在于,其上存储有计算机程序,所述计算机程序被处理器执行时,实现如权利要求1至7任一项所述的方法。
CN201810961835.1A 2018-08-22 2018-08-22 基于大数据分析的目标用户挖掘方法及装置 Pending CN109359236A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810961835.1A CN109359236A (zh) 2018-08-22 2018-08-22 基于大数据分析的目标用户挖掘方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810961835.1A CN109359236A (zh) 2018-08-22 2018-08-22 基于大数据分析的目标用户挖掘方法及装置

Publications (1)

Publication Number Publication Date
CN109359236A true CN109359236A (zh) 2019-02-19

Family

ID=65349872

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810961835.1A Pending CN109359236A (zh) 2018-08-22 2018-08-22 基于大数据分析的目标用户挖掘方法及装置

Country Status (1)

Country Link
CN (1) CN109359236A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109977308A (zh) * 2019-03-20 2019-07-05 北京字节跳动网络技术有限公司 用户群体画像的构建方法、装置、存储介质及电子设备
CN109978608A (zh) * 2019-03-05 2019-07-05 广州海晟科技有限公司 目标用户画像的营销标签分析提取方法及系统
CN110266756A (zh) * 2019-05-10 2019-09-20 秒针信息技术有限公司 一种资讯推送方法及装置
CN112311719A (zh) * 2019-07-24 2021-02-02 阿里巴巴集团控股有限公司 数据处理方法、设备、系统及存储介质
CN113366523A (zh) * 2019-06-20 2021-09-07 深圳市欢太科技有限公司 资源推送方法及相关产品

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103177380A (zh) * 2013-02-26 2013-06-26 北京集奥聚合科技有限公司 结合用户群与预投放的广告投放效果的优化方法和装置
CN104428805A (zh) * 2012-07-13 2015-03-18 脸谱公司 强化搜索的连接目标锁定
CN105427129A (zh) * 2015-11-12 2016-03-23 腾讯科技(深圳)有限公司 一种信息的投放方法及系统
CN105869021A (zh) * 2016-04-05 2016-08-17 乐视控股(北京)有限公司 互联网广告投放方法、装置
US20170178197A1 (en) * 2015-12-16 2017-06-22 Facebook, Inc. Grouping users into tiers based on similarity to a group of seed users
CN107330798A (zh) * 2017-06-05 2017-11-07 大连理工大学 一种基于种子节点传播的社交网络间用户身份识别方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104428805A (zh) * 2012-07-13 2015-03-18 脸谱公司 强化搜索的连接目标锁定
CN103177380A (zh) * 2013-02-26 2013-06-26 北京集奥聚合科技有限公司 结合用户群与预投放的广告投放效果的优化方法和装置
CN105427129A (zh) * 2015-11-12 2016-03-23 腾讯科技(深圳)有限公司 一种信息的投放方法及系统
US20170178197A1 (en) * 2015-12-16 2017-06-22 Facebook, Inc. Grouping users into tiers based on similarity to a group of seed users
CN105869021A (zh) * 2016-04-05 2016-08-17 乐视控股(北京)有限公司 互联网广告投放方法、装置
CN107330798A (zh) * 2017-06-05 2017-11-07 大连理工大学 一种基于种子节点传播的社交网络间用户身份识别方法

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109978608A (zh) * 2019-03-05 2019-07-05 广州海晟科技有限公司 目标用户画像的营销标签分析提取方法及系统
CN109977308A (zh) * 2019-03-20 2019-07-05 北京字节跳动网络技术有限公司 用户群体画像的构建方法、装置、存储介质及电子设备
CN110266756A (zh) * 2019-05-10 2019-09-20 秒针信息技术有限公司 一种资讯推送方法及装置
CN110266756B (zh) * 2019-05-10 2021-12-28 秒针信息技术有限公司 一种资讯推送方法及装置
CN113366523A (zh) * 2019-06-20 2021-09-07 深圳市欢太科技有限公司 资源推送方法及相关产品
CN113366523B (zh) * 2019-06-20 2024-05-07 深圳市欢太科技有限公司 资源推送方法及相关产品
CN112311719A (zh) * 2019-07-24 2021-02-02 阿里巴巴集团控股有限公司 数据处理方法、设备、系统及存储介质

Similar Documents

Publication Publication Date Title
CN109359236A (zh) 基于大数据分析的目标用户挖掘方法及装置
CN109034864A (zh) 提高广告投放精准度的方法、装置、电子设备及存储介质
US10095380B2 (en) Method for providing information based on contents and electronic device thereof
CN109118288B (zh) 基于大数据分析的目标用户获取方法及装置
CN108416003A (zh) 一种图片分类方法和装置、终端、存储介质
CN109471657A (zh) 灰度发布方法、装置、计算机设备及计算机存储介质
CN108595497B (zh) 数据筛选方法、装置及终端
WO2019080662A1 (zh) 信息推荐方法及装置、设备
CN106779810A (zh) 广告展现方法、装置和终端设备
CN105488154A (zh) 主题应用推荐方法及装置
CN104395882A (zh) 定制的表情符号项集的建立和上下文感知呈现
CN105528403B (zh) 目标数据识别方法及装置
CN109951512B (zh) 用户偏好确定方法、系统、电子设备及存储介质
CN107368550A (zh) 信息获取方法、装置、介质、电子设备、服务器及系统
CN113220563B (zh) 一种测试用例生成方法、系统、存储介质及计算机设备
CN110020156A (zh) 信息推荐方法、前端实现方法、装置、设备和存储介质
CN110134592A (zh) 一种补充数据字段的方法及装置、电子设备
CN102385619A (zh) 一种根据语音输入信息提供访问建议的方法与设备
CN105324787A (zh) 用户的基于手势的广告简档
CN105096162B (zh) 内容项显示方法及装置
CN109857967A (zh) 基于大数据的报表订阅方法及系统
US20160321229A1 (en) Technique for clipping and aggregating content items
CN111382281A (zh) 基于媒体对象的内容的推荐方法、装置、设备和存储介质
CN112000876A (zh) 一种信息显示的方法、终端、服务器
US11244019B2 (en) Enrichment of user specific information

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination