发明内容
基于此,有必要针对上述技术问题,提供一种能够提高群体画像生成效率的群体画像生成方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。
第一方面,本申请提供了一种群体画像生成方法。所述方法包括:
获取群体画像生成请求,群体画像生成请求携带目标群体标识;
基于目标群体标识按照预设关联关系查找目标群体标识对应的目标群体数据源信息和目标群体数据存储地址;
使用目标群体数据存储地址从目前群体数据源信息对应的目标数据源中获取目标群体属性信息;
获取目标群体标识对应的预设画像标签集,从目标群体属性信息中查找预设画像标签集中目标画像标签对应的标签属性信息;
基于标签属性信息查找目标画像标签对应的子标签和子标签对应的子标签属性信息,将目标画像标签对应的子标签和子标签属性信息作为目标群体标识对应的目标群体标签画像。
第二方面,本申请还提供了一种群体画像生成装置。所述装置包括:
接收模块,用于获取群体画像生成请求,群体画像生成请求携带目标群体标识;
地址查找模块,用于基于目标群体标识按照预设关联关系查找目标群体标识对应的目标群体数据源信息和目标群体数据存储地址;
信息获取模块,用于使用目标群体数据存储地址从目前群体数据源信息对应的目标数据源中获取目标群体属性信息;
标签对应模块,用于获取目标群体标识对应的预设画像标签集,从目标群体属性信息中查找预设画像标签集中目标画像标签对应的标签属性信息;
画像生成模块,用于基于标签属性信息查找目标画像标签对应的子标签和子标签对应的子标签属性信息,将目标画像标签对应的子标签和子标签属性信息作为目标群体标识对应的目标群体标签画像。
第三方面,本申请还提供了一种计算机设备。所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
获取群体画像生成请求,群体画像生成请求携带目标群体标识;
基于目标群体标识按照预设关联关系查找目标群体标识对应的目标群体数据源信息和目标群体数据存储地址;
使用目标群体数据存储地址从目前群体数据源信息对应的目标数据源中获取目标群体属性信息;
获取目标群体标识对应的预设画像标签集,从目标群体属性信息中查找预设画像标签集中目标画像标签对应的标签属性信息;
基于标签属性信息查找目标画像标签对应的子标签和子标签对应的子标签属性信息,将目标画像标签对应的子标签和子标签属性信息作为目标群体标识对应的目标群体标签画像。
第四方面,本申请还提供了一种计算机可读存储介质。所述计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
获取群体画像生成请求,群体画像生成请求携带目标群体标识;
基于目标群体标识按照预设关联关系查找目标群体标识对应的目标群体数据源信息和目标群体数据存储地址;
使用目标群体数据存储地址从目前群体数据源信息对应的目标数据源中获取目标群体属性信息;
获取目标群体标识对应的预设画像标签集,从目标群体属性信息中查找预设画像标签集中目标画像标签对应的标签属性信息;
基于标签属性信息查找目标画像标签对应的子标签和子标签对应的子标签属性信息,将目标画像标签对应的子标签和子标签属性信息作为目标群体标识对应的目标群体标签画像。
第五方面,本申请还提供了一种计算机程序产品。所述计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现以下步骤:
获取群体画像生成请求,群体画像生成请求携带目标群体标识;
基于目标群体标识按照预设关联关系查找目标群体标识对应的目标群体数据源信息和目标群体数据存储地址;
使用目标群体数据存储地址从目前群体数据源信息对应的目标数据源中获取目标群体属性信息;
获取目标群体标识对应的预设画像标签集,从目标群体属性信息中查找预设画像标签集中目标画像标签对应的标签属性信息;
基于标签属性信息查找目标画像标签对应的子标签和子标签对应的子标签属性信息,将目标画像标签对应的子标签和子标签属性信息作为目标群体标识对应的目标群体标签画像。
上述群体画像生成方法、装置、计算机设备、存储介质和计算机程序产品,通过按照预设关联关系查找到目标群体标识对应的目标群体数据源信息和目标群体数据存储地址,并按照目标群体数据存储地址从目前群体数据源信息对应的目标数据源中获取目标群体属性信息,能够快速获取目标群体标识对应的目标群体属性信息,从而提高了获取目标群体属性信息的效率。然后获取目标群体标识对应的预设画像标签集,能够根据预设画像标签集直接确定目标群体标识对应的目标画像标签,并根据目标画像标签在目标群体属性信息中获取对应的标签属性信息,以及可以直接使用标签属性信息中目标画像标签对应的子标签和子标签属性信息作为目标群体标识对应的目标群体标签画像,使用目标群体属性信息来生成群体标签画像,可以避免获取大量用户数据,从而提高了群体画像的生成效率。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请实施例提供的群体画像生成方法,可以应用于如图1所示的应用环境中。其中,终端102通过网络与服务器104进行通信。数据存储系统106可以存储服务器104需要处理的数据,可以包括至少一个数据源。数据存储系统106可以集成在服务器104上,也可以放在云上或其他网络服务器上。服务器104获取终端102发送的群体画像生成请求,群体画像生成请求携带目标群体标识;服务器104基于目标群体标识按照预设关联关系查找目标群体标识对应的目标群体数据源信息和目标群体数据存储地址;服务器104可以通过数据存储系统106使用目标群体数据存储地址从目前群体数据源信息对应的目标数据源中获取目标群体属性信息;服务器104获取目标群体标识对应的预设画像标签集,从目标群体属性信息中查找预设画像标签集中目标画像标签对应的标签属性信息;服务器104基于标签属性信息查找目标画像标签对应的子标签和子标签对应的子标签属性信息,将目标画像标签对应的子标签和子标签属性信息作为目标群体标识对应的目标群体标签画像。服务器104将目标群体标识对应的目标群体标签画像返回给终端102。其中,终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑等。服务器104可以用独立的服务器或者是多个服务器组成的服务器群体来实现。
在一个实施例中,如图2所示,提供了一种群体画像生成方法,本实施例以该方法应用于服务器进行举例说明,可以理解的是,该方法也可以应用于终端,还可以应用于包括终端和服务器的系统,并通过终端和服务器的交互实现。本实施例中,该方法包括以下步骤:
步骤202,获取群体画像生成请求,群体画像生成请求携带目标群体标识。
步骤204,基于目标群体标识按照预设关联关系查找目标群体标识对应的目标群体数据源信息和目标群体数据存储地址。
其中,群体画像是指对群体进行特征描述的画像信息,群体可以是用户群体。目标群体标识是指待生成群体画像的目标群体的标识信息。预设关联关系是指预先设置的群体标识、群体数据源信息和群体数据存储地址之间的关联关系。目标群体数据源信息是指目标群体标识对应的目标数据源的信息。数据源可以是数据库。目标群体数据存储地址是指目标群体标识对应的群体数据的存储地址。目标群体数据源中存储了目标群体中各个用户的数据。
具体地,服务器获取各个群体标识对应的群体数据源信息和群体数据存储地址。服务器根据各个群体标识、群体标识对应的群体数据源信息和群体数据存储地址建立预设关联关系,并将该预设关联关系进行存储。
服务器获取终端发送的群体画像生成请求,群体画像生成请求携带目标群体标识。服务器根据目标群体标识按照预设关联关系查找对应的目标群体数据源信息和目标群体数据存储地址。
步骤206,使用目标群体数据存储地址从目前群体数据源信息对应的目标数据源中获取目标群体属性信息。
其中,目标群体属性信息是指目标群体对应的特征信息。群体特征属性信息包括群体对应的特征标签和特征标签对应的群体分布信息。目标数据源是指存储目标群体属性信息的数据源。
具体地,服务器可以将目标群体数据源信息和目标群体数据存储地址发送到数据存储系统,数据存储系统可以是外部存储系统。数据存储系统根据目标群体数据源信息确定目标数据源,然后根据目标群体数据存储地址在目标数据源中确定目标群体标识对应的目标群体数据属性信息。服务器获取数据存储系统返回的目标群体标识对应的目标群体数据属性信息。
步骤208,获取目标群体标识对应的预设画像标签集,从目标群体属性信息中查找预设画像标签集中目标画像标签对应的标签属性信息。
其中,预设画像标签集是指预先设置的目标画像标签的集合。目标画像标签是指目标群体标识对应的群体画像中的特征标签。标签属性信息是指目标群体属性信息中与目标画像标签对应的群体分布信息。
具体地,服务器获取终端发送的目标群体标识对应的预设画像标签集,服务器根据预设画像标签集中的目标画像标签在目标群体属性信息中查找对应的标签属性信息。目标群体属性信息包括特征标签和特征标签对应的特征分布信息,服务器可以在目标群体属性信息中查找与目标画像标签匹配一致的特征标签,获取该特征标签对应的群体分布信息,作为目标画像标签对应的标签属性信息。
步骤210,基于标签属性信息查找目标画像标签对应的子标签和子标签对应的子标签属性信息,将目标画像标签对应的子标签和子标签属性信息作为目标群体标识对应的目标群体标签画像。
其中,子标签是指标签属性信息中的群体分布标签,可以是群体分布信息中的特征分布标签。子标签属性信息是指群体分布信息中群体分布标签对应的群体分布数量信息。目标群体标签画像是指目标群体标识对应的群体画像。
具体地,服务器获取各个目标画像标签对应的标签属性信息,根据标签属性信息得到各个目标画像标签分别对应的各个子标签和子标签对应的子标签属性信息。服务器根据目标画像标签对应的各个子标签和子标签属性信息生成该目标画像标签对应的标签画像,然后服务器遍历各个目标画像标签,得到各个目标画像标签对应的标签画像。服务器根据各个目标画像标签对应的标签画像得到目标群体标识对应的目标群体标签画像。
上述群体画像生成方法中,通过按照预设关联关系查找到目标群体标识对应的目标群体数据源信息和目标群体数据存储地址,并按照目标群体数据存储地址从目前群体数据源信息对应的目标数据源中获取目标群体属性信息,能够快速获取目标群体标识对应的目标群体属性信息,从而提高了获取目标群体属性信息的效率。然后获取目标群体标识对应的预设画像标签集,能够根据预设画像标签集直接确定目标群体标识对应的目标画像标签,并根据目标画像标签在目标群体属性信息中获取对应的标签属性信息,以及可以直接使用标签属性信息中目标画像标签对应的子标签和子标签属性信息作为目标群体标识对应的目标群体标签画像,通过使用目标群体属性信息来生成群体标签画像,可以避免获取大量用户数据,从而提高了群体画像的生成效率。
在一个实施例中,如图3所示,步骤206,使用所述目标群体数据存储地址从所述目前群体数据源信息对应的目标数据源中获取目标群体属性信息,包括:
步骤302,使用目前群体数据源信息与目前群体数据源信息对应的目标数据源建立通信连接;
步骤304,基于通信连接向目标数据源发送信息获取请求,信息获取请求携带目标群体数据存储地址和预设标准格式信息,通过目标数据源根据信息获取请求从目标群体数据存储地址获取到目标原始群体数据,并按照预设标准格式信息将目标原始群体数据进行数据转换,得到目标群体属性信息;
步骤306,获取目标数据源返回的目标群体属性信息。
其中,预设标准格式信息是指预先设置的数据格式信息,用于在数据源中根据预设数据格式信息对群体数据转换成对应的数据格式。目标原始群体数据是指未进行数据转换的目标群体标识对应的群体数据,可以是目标群体对应的特征信息。
具体地,服务器根据预设关联关系获取到目标群体标识对应的目标群体数据源信息和目标群体数据存储地址后,根据目标群体数据源信息中的接口信息与目标群体数据源信息对应的目标数据源建立通信连接。然后服务器获取预设标准格式信息,服务器根据预设标准格式信息和目标群体数据存储地址生成信息获取请求。服务器通过通信连接将信息获取请求发送到目标数据源。
目标数据源接收信息获取请求,根据信息获取请求中的目标群体数据存储地址获取目标原始群体数据,然后按照预设标准格式信息对目标原始群体数据进行数据转换,得到目标群体属性信息。然后服务器获取目标数据源返回的目标群体属性信息。
目标原始群体数据比如表1所示:
表1
用户姓名 |
年龄 |
性别 |
消费金额 |
家庭人数 |
小李 |
25 |
男 |
600 |
2 |
小王 |
36 |
男 |
3000 |
4 |
小陈 |
47 |
女 |
1500 |
3 |
小张 |
59 |
未知 |
200 |
3 |
在一个具体实施例中,由于不同数据源类型的数据源的数据存储方式不同,可以预先在服务器中根据各个数据源对应的数据源类型、数据源信息、数据存储地址和预设标准格式信息设置各个数据源对应的适配程序。不同的群体标识对应不同的群体数据,各个群体数据分别存储在对应的数据源中。适配程序用于指示数据源对群体数据进行数据转换并获取目标群体属性信息。
服务器获取到终端发送的群体画像生成请求,根据群体画像生成请求中的目标群体标识确定对应的适配程序,运行该适配程序。服务器通过适配程序与目标数据进行通信,指示目标数据源根据预设标准格式信息对目标原始群体数据进行数据转换,得到目标群体属性信息。服务器通过适配程序获取目标群体标识对应的目标群体属性信息。
本实施例中,服务器通过通信连接向目标数据源发送信息获取请求,以使目标数据源根据信息获取请求中的目标群体数据存储地址和预设标准格式信息,查找目标原始群体数据并进行数据转换,从而使服务器可以直接通过目标数据源获取到标准格式的目标群体属性信息,并通过目标群体属性信息生成群体画像,避免获取大量用户数据,从而节省了服务器资源,进一步地提高了群体画像的生成效率。
在一个实施例中,步骤304,按照所述预设标准格式信息将所述目标群体原始数据进行数据转换,包括:
从目标原始群体数据中确定数值型数据,并从数值型数据中确定最大值和最小值;
计算最大值和最小值之间的差值,并计算差值与预设区间数量的比重,得到区间间隔;
基于区间间隔、最大值和最小值确定各个区间范围,统计各个区间范围中数值型数据的数量,得到各个区间范围对应的区间数据数量;
将各个区间范围和区间数量作为数值型数据对应的目标群体属性信息。
其中,数值型数据是指目标原始群体数据中数值形式的数据。预设区间数量是指预先设置的数值型数据分布的区间数量。区间数据数量是指数值型数据分布在各个区间中的数据数量。
具体地,服务器向目标数据源发送信息获取请求,目标数据源根据信息获取请求中的目标群体数据存储地址获取目标原始群体数据,然后在目标数据源中根据预设标准格式信息从目标原始群体数据中确定数值型特征标签和数值型特征标签对应的数值型数据。数值型特征标签比如是年龄标签、收入标签等。预设标准格式信息中可以预先存储有各个数值型特征标签和各个非数值型特征标签,可以通过将目标原始群体数据中的特征标签与各个数值型特征标签和各个非数值型特征标签进行匹配,确定目标原始群体数据中各个特征标签对应的标签类型。
在目标数据源中从数值型数据中确定最大值和最小值,并计算最大值和最小值之间的差值。然后通过目标数据源计算差值与预设区间数量的比重,得到区间间隔,并根据区间间隔、最大值和最小值确定各个区间范围。然后在目标数据源中匹配各个数值型数据对应的区间范围,并统计各个区间范围中数值型数据的数量,得到各个区间范围对应的区间数据数量。目标数据源将各个区间范围和区间数量作为数值型数据对应的目标群体属性信息。服务器通过目标数据源获取数值型数据对应的目标群体属性信息。
当数值型特征标签为目标画像标签时,则数值型特征标签对应的目标群体属性信息为标签属性信息,将标签属性信息中各个区间范围作为子标签,将各个区间范围对应的区间数据数量作为各个子标签对应的子标签属性信息。
比如,数值型特征标签为年龄标签,年龄标签对应的数值型数据为:30、36、35、39、48、75、61、80,最大值为80,最小值是30,预设区间数量是5,区间间隔为(80-30)/5=10,得到各个区间范围为:(30,40)、(40,50)、(50,60)、(60,70)、(70,80),得到各个区间范围对应的区间数据数量为:4、1、0、1、2。则将“(30,40):4、(40,50):1、(50,60):0、(60,70):1、(70,80):2”作为年龄标签对应的目标群体属性信息。年龄标签为目标画像标签时,年龄标签对应的子标签为“(30,40)”、“(40,50)”、“(50,60)”、“(60,70)”、“(70,80)”,子标签对应的子标签属性信息分别为“4”、“1”、“0”、“1”、“2”。
本实施例中,通过在目标数据源中检测到数值型数据时,对数值型数据进行区间划分,得到数值型数据对应的各个区间范围和区间数据数量,根据各个区间范围和区间数据数量得到数值型数据对应的目标群体属性信息,以使后续服务器可以直接获取目标群体属性信息生成数值型数据对应的标签画像,从而提高了群体画像的生成效率。
在一个实施例中,步骤304,按照所述预设标准格式信息将所述目标原始群体数据进行数据转换,包括:
从目标原始群体数据中确定非数值型数据,并获取非数值性数据的数据类型;
从非数值性数据中统计数据类型对应的数据数量,将数据类型和数据数量作为非数值型数据对应的目标群体属性信息。
其中,非数值型数据是指目标原始群体数据中非数值形式的数据,可以是文字形式的数据。数据类型是指非数值数据中不相同的数据表征的类型。
具体地,服务器通过目标数据源根据预设标准格式信息从目标原始群体数据中确定非数值型特征标签和非数值型特征标签对应的非数值型数据。非数值型特征标签比如是性别标签、爱好标签等。目标数据源根据非数值特征标签对应的非数值型数据确定各个数据类型,比如,性别标签对应的非数值型数据中的男性数据类型和女性数据类型。
然后目标数据源在非数据值型数据中统计各个数据类型对应的数据数量,将数据类型和数据数量作为非数值型数据对应的目标群体属性信息。服务器通过目标数据源获取非数值型数据对应的目标群体属性信息。
当非数值型特征标签为目标画像标签时,则非数值型特征标签对应的目标群体属性信息为标签属性信息,将标签属性信息中各个数据类型作为子标签,将各个数据类型对应的数据数量作为各个子标签对应的子标签属性信息。
比如,非数据型特征标签为性别标签,性别标签对应的非数值型数据为:男、男、女、未知、男、女。目标数据源根据性别标签对应的非数值型数据确定男性、女性和未知分别对应的数据类型,并统计各个数据类型对应的数据数量为:3、2、1。则将“男:3、女:2、未知:1”作为性别标签对应的目标群体属性信息。性别标签为目标画像标签时,性别标签对应的子标签为“男”、“女”、“未知”,子标签对应的子标签属性信息分别为“3”、“2”、“1”。
本实施例中,通过在目标数据源中检测到非数值型数据时,根据非数值型数据的数据类型和数据类型的数据数量得到非数值型数据对应的目标群体属性信息,以使后续服务器可以直接获取目标群体属性信息生成非数值型数据对应的标签画像,从而提高了群体画像的生成效率。
在一个实施例中,步骤208,获取所述目标群体标识对应的预设画像标签集,包括:
获取各个画像标签,并获取各个业务场景信息;
基于各个业务场景信息将各个画像标签进行划分,得到各个业务场景信息分别对应的画像标签集;
从各个业务场景信息分别对应的画像标签集中确定目标群体标识对应的预设画像标签集。
其中,业务场景信息是指用户群体通过终端申请的业务信息。画像标签集是指业务场景对应的画像标签的集合。
具体地,服务器获取各个画像标签,并获取各个业务场景信息,业务场景信息比如是贷款业务、存储业务等申请需求信息。服务器根据各个业务场景信息将各个画像标签进行划分,得到各个业务场景信息分别对应的画像标签集。比如,存储业务对应的申请需求信息包括用户基础信息和用户存储信息,基础信息比如是性别、年龄等,用户存储信息比如是存储金额、存储金额来源等,则在各个画像标签中划分出存储业务的业务场景信息对应的画像标签为性别标签、年龄标签、存储金额标签、存储金额来源标签等。
服务器获取目标群体标识对应的业务场景信息,根据该业务场景信息获取目标群体标识对应的预设画像标签集。
在一个具体实施例中,如图4所示,提供一种画像标签集的示意图。服务器根据各个业务场景信息将各个画像标签进行划分,得到各个业务场景信息分别对应的画像标签集作为画像标签模板。服务器也可以根据各个业务场景信息对各个画像标签进行组合,得到各个画像标签模板。图中,服务器获取画像标签a至画像标签f,根据各个业务场景信息将各个画像标签组合为画像标签模板1、画像标签模板2和画像标签模板3。
本实施例中,通过根据业务场景信息将各个画像标签划分各个业务场景对应的画像标签集,以使后续在生成目标群体标识对应的群体画像时可以直接使用预设画像标签集进行画像生成,从而提高了群体画像的生成效率。
在一个实施例中,目标群体标识包括至少两个;群体画像生成方法,还包括:
按照预设关联关系查找至少两个目标群体标识分别对应的目标群体数据源信息和目标群体数据存储地址;
使用目标群体数据存储地址从目前群体数据源信息对应的目标数据源中获取目标群体属性信息;
获取至少两个目标群体标识分别对应的预设画像标签集,从目标群体属性信息中查找预设画像标签集中目标画像标签对应的标签属性信息;
基于标签属性信息查找目标画像标签对应的子标签和子标签对应的子标签属性信息,将目标画像标签对应的子标签和子标签属性信息作为至少两个目标群体标识对应的目标群体标签画像。
具体地,服务器获取到至少两个目标群体标识时,根据各个目标群体标识按照预设关联关系查找对应的目标群体数据源信息和目标群体数据存储地址。服务器根据各个目标群体标识对应的目标群体数据源信息确定各个目标群体标识对应的目标数据源,并分别与各个目标数据源建立通信连接,将预设标准格式信息和目标群体数据存储地址发送到对应的目标数据源。
服务器通过目标数据源根据预设标准格式信息对目标原始群体数据进行数据转换,得到各个目标群体标识对应的目标群体属性信息。然后服务器通过通信连接获取各个目标群体标识对应的目标群体属性信息。
服务器根据各个目标群体标识对应的业务场景信息,获取各个目标群体标识对应的预设画像标签集,根据预设画像标签集中的目标画像标签在目标群体属性信息中查找对应的标签属性信息,得到各个目标群体标识对应的目标画像标签和标签属性信息。
服务器根据标签属性信息查找目标画像标签对应的子标签和子标签对应的子标签属性信息,将目标画像标签对应的子标签和子标签属性信息作为至少两个目标群体标识对应的目标群体标签画像。
在一个具体实施例中,如图5所示,提供一种标签画像示意图。服务器根据目标画像标签、子标签和子标签属性信息生成目标画像标签对应的标签画像。图中“近90天借款次数”为目标画像标签,各个区间范围为目标画像标签对应的子标签,各个区间范围对应的用户数量为子标签属性信息。
在一个具体实施例中,如图6所示,提供一种群体画像生成的流程示意图。服务器获取终端发送的至少两个群体画像生成请求,根据群体画像生成请求中的目标群体标识调用对应的适配程序。服务器通过各个适配程序连接对应的目标数据源,获取目标数据源中数据转换后的标准格式的目标群体属性信息,得到各个目标群体标识对应的目标群体属性信息。服务器获取各个目标群体标识对应预设画像标签集和预设画像标签集中的目标画像标签,服务器从目标群体属性信息中获取目标画像标签对应的标签属性信息,将目标画像标签对应的子标签和子标签属性信息作为各个目标群体标识对应的目标群体标签画像。
应该理解的是,虽然如上所述的各实施例所涉及的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,如上所述的各实施例所涉及的流程图中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
基于同样的发明构思,本申请实施例还提供了一种用于实现上述所涉及的群体画像生成方法的群体画像生成装置。该装置所提供的解决问题的实现方案与上述方法中所记载的实现方案相似,故下面所提供的一个或多个群体画像生成装置实施例中的具体限定可以参见上文中对于群体画像生成方法的限定,在此不再赘述。
在一个实施例中,如图7所示,提供了一种群体画像生成装置700,包括:接收模块702、地址查找模块704、信息获取模块706、标签对应模块708和画像生成模块710,其中:
接收模块702,用于获取群体画像生成请求,群体画像生成请求携带目标群体标识;
地址查找模块704,用于基于目标群体标识按照预设关联关系查找目标群体标识对应的目标群体数据源信息和目标群体数据存储地址;
信息获取模块706,用于使用目标群体数据存储地址从目前群体数据源信息对应的目标数据源中获取目标群体属性信息;
标签对应模块708,用于获取目标群体标识对应的预设画像标签集,从目标群体属性信息中查找预设画像标签集中目标画像标签对应的标签属性信息;
画像生成模块710,用于基于标签属性信息查找目标画像标签对应的子标签和子标签对应的子标签属性信息,将目标画像标签对应的子标签和子标签属性信息作为目标群体标识对应的目标群体标签画像。
在一个实施例中,信息获取模块706,包括:
通信单元,用于使用目前群体数据源信息与目前群体数据源信息对应的目标数据源建立通信连接;基于通信连接向目标数据源发送信息获取请求,信息获取请求携带目标群体数据存储地址和预设标准格式信息,通过目标数据源根据信息获取请求从目标群体数据存储地址获取到目标原始群体数据,并按照预设标准格式信息将目标原始群体数据进行数据转换,得到目标群体属性信息;获取目标数据源返回的目标群体属性信息。
在一个实施例中,信息获取模块706,包括:
第一数据转换单元,用于从目标原始群体数据中确定数值型数据,并从数值型数据中确定最大值和最小值;计算最大值和最小值之间的差值,并计算差值与预设区间数量的比重,得到区间间隔;基于区间间隔、最大值和最小值确定各个区间范围,统计各个区间范围中数值型数据的数量,得到各个区间范围对应的区间数据数量;将各个区间范围和区间数量作为数值型数据对应的目标群体属性信息。
在一个实施例中,信息获取模块706,包括:
第二数据转换单元,用于从目标原始群体数据中确定非数值型数据,并获取非数值性数据的数据类型;从非数值性数据中统计数据类型对应的数据数量,将数据类型和数据数量作为非数值型数据对应的目标群体属性信息。
在一个实施例中,标签对应模块708,包括:
标签划分单元,用于获取各个画像标签,并获取各个业务场景信息;基于各个业务场景信息将各个画像标签进行划分,得到各个业务场景信息分别对应的画像标签集;从各个业务场景信息分别对应的画像标签集中确定目标群体标识对应的预设画像标签集。
在一个实施例中,群体画像生成装置700,还包括:
画像生成单元,用于按照预设关联关系查找至少两个目标群体标识分别对应的目标群体数据源信息和目标群体数据存储地址;使用目标群体数据存储地址从目前群体数据源信息对应的目标数据源中获取目标群体属性信息,获取至少两个目标群体标识分别对应的预设画像标签集,从目标群体属性信息中查找预设画像标签集中目标画像标签对应的标签属性信息;基于标签属性信息查找目标画像标签对应的子标签和子标签对应的子标签属性信息,将目标画像标签对应的子标签和子标签属性信息作为至少两个目标群体标识对应的目标群体标签画像。
上述群体画像生成装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图8所示。该计算机设备包括处理器、存储器、输入/输出接口(Input/Output,简称I/O)和通信接口。其中,处理器、存储器和输入/输出接口通过系统总线连接,通信接口通过输入/输出接口连接到系统总线。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质和内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储预设关联关系、目标群体属性信息。该计算机设备的输入/输出接口用于处理器与外部设备之间交换信息。该计算机设备的通信接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种群体画像生成方法。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是终端,其内部结构图可以如图9所示。该计算机设备包括处理器、存储器、输入/输出接口、通信接口、显示单元和输入装置。其中,处理器、存储器和输入/输出接口通过系统总线连接,通信接口、显示单元和输入装置通过输入/输出接口连接到系统总线。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的输入/输出接口用于处理器与外部设备之间交换信息。该计算机设备的通信接口用于与外部的终端进行有线或无线方式的通信,无线方式可通过WIFI、移动蜂窝网络、NFC(近场通信)或其他技术实现。该计算机程序被处理器执行时以实现一种群体画像生成方法。该计算机设备的显示单元用于形成视觉可见的画面,可以是显示屏、投影装置或虚拟现实成像装置,显示屏可以是液晶显示屏或电子墨水显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
本领域技术人员可以理解,图8-9中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,还提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现上述各方法实施例中的步骤。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述各方法实施例中的步骤。
在一个实施例中,提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述各方法实施例中的步骤。
需要说明的是,本申请所涉及的用户信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于分析的数据、存储的数据、展示的数据等),均为经用户授权或者经过各方充分授权的信息和数据,且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-OnlyMemory,ROM)、磁带、软盘、闪存、光存储器、高密度嵌入式非易失性存储器、阻变存储器(ReRAM)、磁变存储器(Magnetoresistive Random Access Memory,MRAM)、铁电存储器(Ferroelectric Random Access Memory,FRAM)、相变存储器(Phase Change Memory,PCM)、石墨烯存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器等。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存储器(Dynamic RandomAccess Memory,DRAM)等。本申请所提供的各实施例中所涉及的数据库可包括关系型数据库和非关系型数据库中至少一种。非关系型数据库可包括基于区块链的分布式数据库等,不限于此。本申请所提供的各实施例中所涉及的处理器可为通用处理器、中央处理器、图形处理器、数字信号处理器、可编程逻辑器、基于量子计算的数据处理逻辑器等,不限于此。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请的保护范围应以所附权利要求为准。