CN110148013B - 一种用户标签分布预测方法、装置及系统 - Google Patents

一种用户标签分布预测方法、装置及系统 Download PDF

Info

Publication number
CN110148013B
CN110148013B CN201910323814.1A CN201910323814A CN110148013B CN 110148013 B CN110148013 B CN 110148013B CN 201910323814 A CN201910323814 A CN 201910323814A CN 110148013 B CN110148013 B CN 110148013B
Authority
CN
China
Prior art keywords
user
distribution data
time period
sample
determining
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910323814.1A
Other languages
English (en)
Other versions
CN110148013A (zh
Inventor
黄凯明
蔡鸿博
曾晓东
林锋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Advanced New Technologies Co Ltd
Advantageous New Technologies Co Ltd
Original Assignee
Advanced New Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Advanced New Technologies Co Ltd filed Critical Advanced New Technologies Co Ltd
Priority to CN201910323814.1A priority Critical patent/CN110148013B/zh
Publication of CN110148013A publication Critical patent/CN110148013A/zh
Application granted granted Critical
Publication of CN110148013B publication Critical patent/CN110148013B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0251Targeted advertisements
    • G06Q30/0252Targeted advertisements based on events or environment, e.g. weather or festivals
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0251Targeted advertisements
    • G06Q30/0268Targeted advertisements at point-of-sale [POS]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/10Terrestrial scenes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Physics & Mathematics (AREA)
  • Development Economics (AREA)
  • Theoretical Computer Science (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • General Physics & Mathematics (AREA)
  • Game Theory and Decision Science (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • General Business, Economics & Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Multimedia (AREA)
  • Environmental & Geological Engineering (AREA)
  • Human Computer Interaction (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)

Abstract

本说明书一个或多个实施例提供了一种用户标签分布预测方法、装置及系统,该方法包括:预先基于样本数据训练得到用户标签预测模型,其中,该样本数据是基于采集到的样本用户的图像信息和终端标识信息生成的,该样本数据包括样本用户的视觉属性分布与高维标签分布之间的对应关系;进而在用户标签分布预测阶段,基于现场采集到的途经用户的图像信息确定用户视觉属性分布数据,再将该用户视觉属性分布数据作为该用户标签预测模型的输入数据,预测得到目标区域的用户标签分布数据,这样在标签分布预测阶段只需实时采集用户的图像信息即可,既能够避免因随意探测用户的终端标识信息而侵犯用户隐私的问题,还能够准确地预测出用户标签分布数据。

Description

一种用户标签分布预测方法、装置及系统
技术领域
本说明书一个或多个涉及互联网技术领域,尤其涉及一种用户标签分布预测方法、装置及系统。
背景技术
目前,随着生活水平的变化与提高,人们的户外活动增多,等车、堵车、等电梯、进入地铁站的时候都能够频繁的接触到各类户外媒体。基于此,线下广告系统成为向用户进行资源推广的方式之一,通过在人流量比较大的目标区域设置广告投放屏幕,以达到对推广资源进行宣传,提高经过该目标区域的用户对广告投放屏幕上播放的推广资源的关注度和购买欲。
其中,为了提高推广资源的投放准确地,起到更好地对推广资源进行精准推送的作用,考虑到途经目标区域的人群的用户标签分布对资源投放具有有效地指导性作用。当前,主要通过实时采集经过目标区域的用户的终端mac地址,再获取与该终端mac地址对应的用户线上消费数据,进而基于该用户线上消费数据确定目标区域的人群标签分布,在此过程中,由于需要探测所有途经用户的终端mac地址,存在侵犯用户隐私的问题。
由此可知,需要提高一种准确度高且不侵犯用户隐私的用户标签分布预测方法。
发明内容
本说明书一个或多个实施例的目的是提供一种用户标签分布预测方法、装置及系统,在标签分布预测阶段只需实时采集用户的图像信息即可,既能够避免因随意探测用户的终端标识信息而侵犯用户隐私的问题,还能够准确地预测出用户标签分布数据。
为解决上述技术问题,本说明书一个或多个实施例是这样实现的:
本说明书一个或多个实施例提供了一种用户标签分布预测方法,包括:
获取预测时间段内途经目标区域的用户的图像信息,其中,所述图像信息是设置于所述目标区域的摄像装置采集得到的;
根据获取到的所述图像信息,确定在所述预测时间段内途经所述目标区域的用户的视觉属性分布数据;
利用预先训练好的用户标签预测模型并基于所述视觉属性分布数据,确定在所述预测时间段内途经所述目标区域的用户的高维标签分布数据。
本说明书一个或多个实施例提供了一种用户标签分布预测装置,包括:
图像信息获取模块,用于获取预测时间段内途经目标区域的用户的图像信息,其中,所述图像信息是设置于所述目标区域的摄像装置采集得到的;
视觉属性确定模块,用于根据获取到的所述图像信息,确定在所述预测时间段内途经所述目标区域的用户的视觉属性分布数据;
用户标签预测模块,用于利用预先训练好的用户标签预测模型并基于所述视觉属性分布数据,确定在所述预测时间段内途经所述目标区域的用户的高维标签分布数据。
本说明书一个或多个实施例提供了一种用户标签分布预测系统,包括:信息采集设备和上述用户标签分布预测装置,其中,所述信息采集设备与所述用户标签分布预测装置相连接;
所述信息采集设备,用于采集预测时间段内途经目标区域的用户的图像信息,并将采集到的所述图像信息传输至所述用户标签分布预测装置;
所述用户标签分布预测装置,用于获取预测时间段内途经目标区域的用户的图像信息,其中,所述图像信息是设置于所述目标区域的摄像装置采集得到的;根据获取到的所述图像信息,确定在所述预测时间段内途经所述目标区域的用户的视觉属性分布数据;以及利用预先训练好的用户标签预测模型并基于所述视觉属性分布数据,确定在所述预测时间段内途经所述目标区域的用户的高维标签分布数据。
本说明书一个或多个实施例提供了一种用户标签分布预测设备,包括:处理器;以及
被安排成存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器:
获取预测时间段内途经目标区域的用户的图像信息,其中,所述图像信息是设置于所述目标区域的摄像装置采集得到的;
根据获取到的所述图像信息,确定在所述预测时间段内途经所述目标区域的用户的视觉属性分布数据;
利用预先训练好的用户标签预测模型并基于所述视觉属性分布数据,确定在所述预测时间段内途经所述目标区域的用户的高维标签分布数据。
本说明书一个或多个实施例提供了一种存储介质,用于存储计算机可执行指令,所述可执行指令在被执行时实现以下流程:
获取预测时间段内途经目标区域的用户的图像信息,其中,所述图像信息是设置于所述目标区域的摄像装置采集得到的;
根据获取到的所述图像信息,确定在所述预测时间段内途经所述目标区域的用户的视觉属性分布数据;
利用预先训练好的用户标签预测模型并基于所述视觉属性分布数据,确定在所述预测时间段内途经所述目标区域的用户的高维标签分布数据。
本说明书一个或多个实施例中的用户标签分布预测方法、装置及系统,预先基于样本数据训练得到用户标签预测模型,其中,该样本数据是基于采集到的样本用户的图像信息和终端标识信息生成的,该样本数据包括样本用户的视觉属性分布与高维标签分布之间的对应关系;进而在用户标签分布预测阶段,基于现场采集到的途经用户的图像信息确定用户视觉属性分布数据,再将该用户视觉属性分布数据作为该用户标签预测模型的输入数据,预测得到目标区域的用户标签分布数据,这样在标签分布预测阶段只需实时采集用户的图像信息即可,既能够避免因随意探测用户的终端标识信息而侵犯用户隐私的问题,还能够准确地预测出用户标签分布数据。
附图说明
为了更清楚地说明本说明书一个或多个实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本说明书一个或多个中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本说明书一个或多个实施例提供的用户标签分布预测系统的应用场景示意图;
图2为本说明书一个或多个实施例提供的用户标签分布预测方法的第一种流程示意图;
图3为本说明书一个或多个实施例提供的用户标签分布预测方法的第二种流程示意图;
图4为本说明书一个或多个实施例提供的用户标签分布预测方法中利用第一信息采集设备采集途经样本区域的用户的基础数据的实现原理示意图;
图5为本说明书一个或多个实施例提供的用户标签分布预测方法中基于采集到的基础数据训练得到用户标签预测模型的实现原理示意图;
图6为本说明书一个或多个实施例提供的用户标签分布预测方法中利用用户标签预测模型进行标签分布预测的实现原理示意图;
图7为本说明书一个或多个实施例提供的用户标签分布预测方法的第三种流程示意图;
图8为本说明书一个或多个实施例提供的用户标签分布预测装置的第一种模块组成示意图;
图9为本说明书一个或多个实施例提供的用户标签分布预测装置的第二种模块组成示意图;
图10为本说明书一个或多个实施例提供的用户标签分布预测系统的结构组成示意图;
图11为本说明书一个或多个实施例提供的用户标签分布预测设备的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本说明书一个或多个中的技术方案,下面将结合本说明书一个或多个实施例中的附图,对本说明书一个或多个实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本说明书一个或多个一部分实施例,而不是全部的实施例。基于本说明书一个或多个中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都应当属于本说明书一个或多个保护的范围。
本说明书一个或多个实施例提供了一种用户标签分布预测方法、装置及系统,在用户标签分布预测阶段,基于现场采集到的途经用户的图像信息确定用户视觉属性分布数据,再将该用户视觉属性分布数据作为预先训练好的用户标签预测模型的输入数据,预测得到目标区域的用户标签分布数据,这样在标签分布预测阶段只需实时采集用户的图像信息即可,既能够避免因随意探测用户的终端标识信息而侵犯用户隐私的问题,还能够准确地预测出用户标签分布数据。
图1为本说明书一个或多个实施例提供的用户标签分布预测系统的应用场景示意图,如图1所示,该系统包括:第一信息采集设备、模型训练装置、第二信息采集设备、标签识别装置,该模型训练装置与标签识别装置可以是同一装置,也可以是不同装置,若属于不同装置,则需要将模型训练装置基于样本数据训练得到的用户标签预测模型保存至标签识别装置中;
其中,上述第一信息采集设备用于在模型训练阶段采集样本用户的基础数据,该第一信息采集设备包括:摄像装置和无线通信装置,该无线通信装置包括wifi模块和/或BLE模块(Bluetooth Low Energy,低功耗蓝牙);上述第二信息采集设备用于在标签预测阶段采集目标用户的基础数据,该第二信息采集设备包括:摄像装置;
上述模型训练装置,用于基于第一信息采集设备采集到的样本用户的基础数据,训练得到用户标签预测模型,其中,该预先训练好的用户标签预测模型可以部署在云端的标签识别装置中,也可以部署在本地的标签识别装置中;上述标签识别装置,用于利用预先训练好的用户标签预测模型,并基于第二信息采集设备采集到的目标用户的基础数据,确定用户标签分布数据;
具体的,主要包括两个过程:模型训练阶段和标签预测阶段,其中,(1)针对模型训练阶段,具体实现过程为:
选取预设数量个样本区域,在各样本区域的实体点位分别部署第一信息采集设备,通过摄像装置采集途经样本区域的用户的图像信息,并将该图像信息传输至模型训练装置;以及通过无线通信装置探测途经样本区域的用户的终端标识信息,即感知用户ID数据,并将该终端标识信息传输至模型训练装置;
上述模型训练装置根据接收到的图像信息和终端标识信息,确定各单位时间段内视觉属性分布数据与高维标签分布数据之间的映射关系;具体的,基于现场点位信息和时间信息,将基于图像信息确定的视觉属性分布数据和基于终端标识信息确定的高维标签分布数据进行关联;
上述模型训练装置将各样本区域的每个单位时间段下视觉属性分布数据与高维标签分布数据之间的映射关系作为样本数据,利用机器学习方法基于该样本数据训练得到用户标签预测模型。
(2)在得到用户标签预测模型后,利用该用户标签预测模型进行标签预测阶段,具体实现过程为:
在需要进行用户标签分布预测的各目标区域分别设置第二信息采集设备,通过摄像装置采集预测时间段内途经目标区域的用户的图像信息,并将该图像信息传输至标签识别装置;
上述标签识别装置根据接收到的图像信息,确定在预设时间段内途经该目标区域的用户的视觉属性分布数据;
上述标签识别装置利用预先训练好的用户标签预测模型并基于确定出的视觉属性分布数据,确定在预测时间段内途经该目标区域的用户的高维标签分布数据。
在上述具体实现过程中,预先基于样本数据训练得到用户标签预测模型,其中,该样本数据是基于采集到的样本用户的图像信息和终端标识信息生成的,该样本数据包括样本用户的视觉属性分布与高维标签分布之间的对应关系;进而在用户标签分布预测阶段,基于现场采集到的途经用户的图像信息确定用户视觉属性分布数据,再将该用户视觉属性分布数据作为该用户标签预测模型的输入数据,预测得到目标区域的用户标签分布数据,这样在标签分布预测阶段只需实时采集用户的图像信息即可,既能够避免因随意探测用户的终端标识信息而侵犯用户隐私的问题,还能够准确地预测出用户标签分布数据。
图2为本说明书一个或多个实施例提供的用户标签分布预测方法的第一种流程示意图,图2中的方法能够由图1中的标签识别装置执行,如图2所示,该方法至少包括以下步骤:
S201,获取预测时间段内途经目标区域的用户的图像信息,其中,该图像信息是设置于目标区域的摄像装置采集得到的;
其中,该目标区域是指设置有推广资源展示屏的区域,可以是设置有线下广告推广设备的区域,例如,设置有广告投放系统的公交点处、地铁站内、办公楼内、商场内等等;
具体的,用户标签分布数据的预测过程可以是周期性的,也可以是非周期性的,以周期性进行用户标签预测为例,可以隔一周预测一次用户标签分布,也可以隔一个月预测一个用户标签分布数据,根据实际需求设定预测周期,若预测周期为一周,则预测时间段可以为周一至周日,通过摄像装置采集周一至周日时间段内途经目标区域的用户的图像信息,并将采集到的图像信息传输至标签识别装置;
S202,根据获取到的图像信息,确定在预测时间段内途经目标区域的用户的视觉属性分布数据;
具体的,在获取到摄像装置传输的途经目标区域的用户的图像信息后,利用图像识别算法对预测时间段相关的图像信息进行识别分析,得到目标用户的视觉属性信息,其中,该视觉属性信息包括:年龄、性别、着装类型、身高信息中至少一项;再根据识别出的用户视觉属性信息,确定视觉属性分布数据,该视觉属性分布数据可以包括:年龄分布数据、性别分布数据、着装类型分布数据、身高分布数据中至少一项,其中,该年龄分布分布数据可以是各划分年龄段下用户数量或比例,该性别分布数据可以是男性比例和女性比例,该着装类型分布数据可以是商务装、休闲装、工装等各分类类别所占比例;
另外,如果设置于不同目标区域的摄像装置均与同一个标签识别装置通信连接,即设置于多个目标区域的摄像装置均向同一个标签识别装置上传采集到的图像信息,那么该标签识别装置需要根据摄像装置的标识信息,对接收到的图像信息进行区分,以便分别确定各目标区域对应的视觉属性分布数据;
S203,利用预先训练好的用户标签预测模型并基于视觉属性分布数据,确定在预测时间段内途经目标区域的用户的高维标签分布数据,其中,该用户标签预测模型是利用机器学习方法并基于目标样本数据训练得到的,该目标样本数据是基于采集到的样本用户的图像信息和终端标识信息生成的,该样本数据包括样本用户的视觉属性分布与高维标签分布之间的对应关系;
其中,上述高维标签分布数据包括;职业类型分布数据、消费水平分布数据、消费偏好分布数据、消费需求分布数据中至少一项,其中,该职业类型分布数据可以是各职业类别所占比例,该消费水平分布数据可以是高消费、中等消费、低消费等各分类类别所占比例,该消费需求分布数据可以是生活用品、办公用品、学习用品、餐饮需求、住宿需求、购车需求等各分类类别所占比例;
具体的,将步骤S203确定出的视觉属性分布数据作为用户标签预测模型的输入数据,该用户标签预测模型的输出数据即为预测得到的高维标签分布数据,其中,以用户标签预测模型为线性回归模型为例,根据确定出的视觉属性分布数据和公式y=ax确定高维标签分布数据,a是模型训练阶段确定出的模型参数,x表示模型输入数据即视觉属性分布数据,y表示模型输出数据即高维标签分布数据。
其中,考虑到视觉属性信息可以基于实时采集到的途经目标区域的用户的图像信息获取到,但实时探测途经目标区域的用户所携带的移动终端的标识信息将存在侵犯用户隐私的问题,也就是说,采用对目标区域进行现场信息采集的方式,在确保不侵犯用户隐私的情况下,只能够获取对资源投放的指导作用比较小的用户视觉属性信息,而无法获取对资源投放具有有效指导作用的用户高维标签信息;又考虑到用户视觉属性信息与用户高维标签信息之间具有一定关联关系,因此,可以预先通过获取样本用户的用户视觉属性信息与用户高维标签信息之间的对应关系,将该对应关系作为样本数据,训练得到用于从视觉属性预测高维标签的模型,这样只有在模型训练阶段,需要获取用户ID数据并根据该用户ID数据获取用户高维标签信息,而在分布数据预测阶段,无需实时获取用户ID数据,而是利用预先训练好的用户标签预测模型并基于可以实时获取到的用户视觉属性分布情况,预测出用户高维标签分布情况。
本说明书一个或多个实施例中,预先基于样本数据训练得到用户标签预测模型,其中,该样本数据是基于采集到的样本用户的图像信息和终端标识信息生成的,该样本数据包括样本用户的视觉属性分布与高维标签分布之间的对应关系;进而在用户标签分布预测阶段,基于现场采集到的途经用户的图像信息确定用户视觉属性分布数据,再将该用户视觉属性分布数据作为该用户标签预测模型的输入数据,预测得到目标区域的用户标签分布数据,这样在标签分布预测阶段只需实时采集用户的图像信息即可,既能够避免因随意探测用户的终端标识信息而侵犯用户隐私的问题,还能够准确地预测出用户标签分布数据。
其中,上述用户标签预测模型是在进行用户标签分布预测之前,基于样本数据训练得到的,预测模型训练过程能够由图1中的模型训练装置执行,如图3所示,该用户标签预测模型的训练过程具体包括:
S204,获取样本用户的样本图像信息,其中,该样本图像信息是设置于样本区域的摄像装置采集得到的,该样本用户是指途经选取的样本区域的用户;
具体的,选取预设数量个样本区域,在各样本区域分别设置第一信息采集设备,通过摄像装置采集途经样本区域的用户的图像信息,并将该图像信息传输至模型训练装置;
S205,获取样本用户的终端标识信息,其中,该终端标识信息是基于设置于样本区域的无线通信装置获取到的;
具体的,在获取样本用户的图像信息的同时还获取样本用户所携带的移动终端的标识信息,即通过第一信息采集设备中的无线通信装置探测途经样本区域的用户的终端标识信息,并将该终端标识信息传输至模型训练装置;另外,还可以采用被动式方式,将无线通信装置设置为监听模式,触发样本用户所携带的移动终端将各自的标识信息传输至模型训练装置,即样本用户所携带的移动终端探测到该无线通信装置后将各自的标识信息传输至模型训练装置;
其中,上述无线通信装置可以是wifi模块或BLE模块,该终端标识信息可以是样本用户携带的移动终端的mac地址;
S206,根据获取到的样本图像信息和终端标识信息,确定各单位时间段内视觉属性分布数据与高维标签分布数据之间的映射关系;
具体的,在接收到样本图像信息和终端标识信息后,可以利用图像识别算法对该图像信息进行识别分析,得到样本用户的视觉属性信息,例如,该视觉属性信息包括:年龄、性别、着装类型、身高信息中至少一项,即获取样本用户的基础属性信息;并基于该视觉属性信息,确定各单位时间段内的视觉属性分布数据;
以及,确定各终端标识信息对应的用户画像数据,其中,该用户画像数据即为用户高维标签数据,例如,该用户画像数据包括:职业类型、消费水平、消费偏好、消费需求、收入情况中至少一项,针对线上消费系统已基于线上消费数据对用户画像进行识别的情况,该用户画像数据可以是直接从线上消费系统获取到的;对应的,针对线上消费系统不进行用户画像识别的情况,需要先从线上消费系统获取与各终端标识信息对应的线上消费数据,即结合探测到的样本用户的ID数据,获取样本用户的线上消费数据,再基于该线上消费数据确定样本用户的用户画像数据;并基于该用户画像数据,确定各单位时间段内的高维标签分布数据;
基于现场点位信息和时间信息,将确定出的样本用户的视觉属性分布数据和高维标签分布数据进行关联,即分布确定同一样本区域的同一单位时间段下视觉属性分布数据与高维标签分布数据之间的映射关系,并将该映射关系作为样本数据;
S207,利用机器学习方法并基于各单位时间段对应的映射关系,训练得到用户标签预测模型。
其中,上述用户标签预测模型可以是传统机器学习模型,例如,线性回归模型、或逻辑回归LR模型等,还可以是深度学习模型,例如,GBDT模型、或DNN模型等;具体的,将视觉属性分布数据作为模型特征,将高维标签分布数据作为模型目标,训练确定模型涉及的各特征权重系数;
仍以用户标签预测模型为线性回归模型为例,基于确定出的样本数据和公式y=ax,确定模型特征权重系数,具体的,将视觉属性分布数据作为模型特征x,将同一样本区域同一单位时间段的高维标签分布数据作为模型目标y,进行机器学习训练得到模型特征权重系数a;
其中,同一单位时间段是指采集日期相同且采集起始时刻和终止时刻均相同的时间段,例如,以单位时间的时长为1小时为例,3月9日11点至12点作为一个单位时间段,将同一样本区域下3月9日11点至12点对应的视觉属性分布数据作为模型特征,将同一样本区域下3月9日11点至12点对应的高维标签分布数据作为模型目标。
具体的,针对视觉属性分布数据与高维标签分布数据之间的映射关系的确定过程,上述S206根据获取到的样本图像信息和终端标识信息,确定各单位时间段内视觉属性分布数据与高维标签分布数据之间的映射关系,具体包括:
步骤一,根据获取到的样本图像信息,确定各单位时间段下的视觉属性分布数据,其中,该样本图像信息是样本用户的图像信息,该视觉属性分布数据可以包括:年龄分布数据、性别分布数据、着装类型分布数据、身高分布数据中至少一项;
步骤二,根据获取到的终端标识信息,确定各单位时间段下的高维标签分布数据,其中,该终端标识信息是样本用户所携带的移动终端的标识信息,该高维标签分布数据可以包括;职业类型分布数据、消费水平分布数据、消费偏好分布数据、消费需求分布数据中至少一项;
步骤三,针对每个单位时间段,确定在该单位时间段下视觉属性分布数据与高维标签分布数据之间的映射关系,该单位时间段的时长可以是一小时、一天或一周,基于现场点位信息和时间信息,将确定出的样本用户的视觉属性分布数据和高维标签分布数据进行关联,即分别确定同一样本区域的同一单位时间段下视觉属性分布数据与高维标签分布数据之间的映射关系,并将该映射关系作为样本数据。
具体的,针对样本用户的高维标签分布数据的确定过程,需要先确定接收到的各终端标识信息分别对应的用户画像数据;再结合终端标识信息的采集时间信息并根据确定出的用户画像数据,确定各单位时间段下的高维标签分布数据。
其中,可以通过下述两种方式基于样本用户的终端标识信息,确定对应的用户画像数据,具体为:
第一种实现方式:针对线上消费系统已基于线上消费数据确定出用户画像数据,并将各用户画像数据存入预设用户画像存储数据库中,基于此,在预设用户画像存储数据库中,分别查询与各单位时间段内探测到的终端标识信息对应的用户画像数据。
第二种实现方式:针对线上消费系统并未确定出用户画像数据的情况,基于此,在预设消费记录数据库中,分别查询与各单位时间段内探测到的终端标识信息对应的线上消费数据;
根据查询到的线上消费数据,确定与各单位时间段对应的用户画像数据,具体的,基于各样本用户的线上消费数据,对该样本用户进行用户画像分析,生成各样本用户对应的用户画像数据。
在一个具体实施例中,如图4所示,给出了利用第一信息采集设备采集途经样本区域的用户的基础数据的实现原理示意图,具体为:
(1)通过第一信息采集设备中的摄像装置采集途经样本区域的用户的图像信息,并将该图像信息传输至模型训练装置;
(2)通过第一信息采集设备中的无线通信装置探测用户的终端标识信息,并将该终端标识信息传输至模型训练装置;
对应的,如图5所示,给出了基于采集到的基础数据训练得到用户标签预测模型的实现原理示意图,具体为:
(1)利用图像识别算法对接收到的图像信息进行识别分析,得到样本用户的视觉属性信息;并基于该视觉属性信息,确定各单位时间段内的视觉属性分布数据;
(2)利用终端标识筛选算法对接收到的终端标识信息进行筛选,得到途经样本区域的样本用户的终端标识信息,并获取筛选出的各终端标识信息对应的线上消费数据,基于该线上消费数据确定各样本用户的用户画像数据,并基于该用户画像数据,确定各单位时间段对应的高维标签分布数据;
其中,考虑到通过无线通信装置探测到的终端标识信息可能是途经其他区域的非样本用户的终端标识信息,即不在样本区域的行人也被探测到,由于摄像装置采集到的图像信息不包含此部分非样本用户的图像信息,因此,需要将该非样本用户的终端标识信息剔除,以保证最终训练得到的用户标签预测模型的预测准确度,基于此,上述S205获取样本用户的终端标识信息,具体包括:
接收设置于样本区域的无线通信装置传输的终端标识信息和相应的终端发射信号强度,具体的,无线通信装置不仅探测移动终端的标识信息,还采集移动终端的发射信号强度;
将终端发射信号强度大于预设强度阈值的终端标识信息,确定为样本用户的终端标识信息,具体的,基于用户携带的移动终端发出的信号强度可以识别用户是否途经目标区域,将终端发射信号强度小于或等于预设强度阈值的终端标识信息剔除,即将终端发射信号强度比较弱的移动终端对应的用户确定为未途经样本区域的非样本用户。
(3)基于现场点位信息和时间信息,将确定出的样本用户的视觉属性分布数据和高维标签分布数据进行关联,即确定同一样本区域的各单位时间段下视觉属性分布数据与高维标签分布数据之间的映射关系,并将该映射关系作为样本数据;
(4)将视觉属性分布数据作为模型特征,将高维标签分布数据作为模型目标,训练确定模型涉及的各特征权重系数,并基于确定出的各特征权重系数得到用户标签预测模型。
对应的,如图6所示,给出了利用用户标签预测模型进行标签分布预测的实现原理示意图,具体为:
(1)通过第二信息采集设备中的摄像装置采集预测时间段内途经目标区域的用户的图像信息,并将该图像信息传输至标签识别装置,其中,该标签识别装置可以是本地识别装置,即将用户标签预测模型部署在本地识别装置,也可以是云端识别装置,即将用户标签预测模型部署在云端识别装置;
(2)上述标签识别装置利用图像识别算法对接收到的图像信息进行识别分析,得到途经目标区域的用户的视觉属性信息;并基于该视觉属性信息,确定在预设时间段内途经该目标区域的用户的视觉属性分布数据;
(3)上述标签识别装置利用预先训练好的用户标签预测模型并基于确定出的视觉属性分布数据,确定在预测时间段内途经该目标区域的用户的高维标签分布数据。
进一步的,在预测出目标区域的途经用户的高维标签分布数据后,可以基于该高维标签分布数据为目标区域精准地进行推广资源匹配,进而降低资源投放成本,提高资源投放的回报率,基于此,如图7所示,在上述S203利用预先训练好的用户标签预测模型并基于视觉属性分布数据,确定在预测时间段内途经目标区域的用户的高维标签分布数据之后,还包括:
S208,基于预测得到途经目标区域的用户的高维标签分布数据,确定该目标区域内待投放的目标推广资源。
具体的,针对确定目标区域内待投放的目标推广资源的过程,具体包括:
步骤一,针对每个备选推广资源,将预测得到的高维标签分布数据与该备选推广资源所面向用户的标签信息进行匹配,确定该备选推广资源对应的投放匹配度;
步骤二,将投放匹配度满足预设条件的备选推广资源,确定为目标区域内待投放的目标推广资源,其中,该预设条件可以是投放匹配度大于预设匹配度阈值,即将投放匹配度比较高的推广资源确定为目标推广资源,实现有针对性且精准地向途经目标区域的用户进行资源推广。
本说明书一个或多个实施例中的用户标签分布预测方法,预先基于样本数据训练得到用户标签预测模型,其中,该样本数据是基于采集到的样本用户的图像信息和终端标识信息生成的,该样本数据包括样本用户的视觉属性分布与高维标签分布之间的对应关系;进而在用户标签分布预测阶段,基于现场采集到的途经用户的图像信息确定用户视觉属性分布数据,再将该用户视觉属性分布数据作为该用户标签预测模型的输入数据,预测得到目标区域的用户标签分布数据,这样在标签分布预测阶段只需实时采集用户的图像信息即可,既能够避免因随意探测用户的终端标识信息而侵犯用户隐私的问题,还能够准确地预测出用户标签分布数据。
对应上述图2至图7描述的用户标签分布预测方法,基于相同的技术构思,本说明书一个或多个实施例还提供了一种用户标签分布预测装置,图8为本说明书一个或多个实施例提供的用户标签分布预测装置的第一种模块组成示意图,该装置用于执行图2至图7描述的用户标签分布预测方法,如图8所示,该装置包括:
图像信息获取模块801,用于获取预测时间段内途经目标区域的用户的图像信息,其中,所述图像信息是设置于所述目标区域的摄像装置采集得到的;
视觉属性确定模块802,用于根据获取到的所述图像信息,确定在所述预测时间段内途经所述目标区域的用户的视觉属性分布数据;
用户标签预测模块803,用于利用预先训练好的用户标签预测模型并基于所述视觉属性分布数据,确定在所述预测时间段内途经所述目标区域的用户的高维标签分布数据。
其中,考虑到视觉属性信息可以基于实时采集到的途经目标区域的用户的图像信息获取到,但实时探测途经目标区域的用户所携带的移动终端的标识信息将存在侵犯用户隐私的问题,也就是说,采用对目标区域进行现场信息采集的方式,在确保不侵犯用户隐私的情况下,只能够获取对资源投放的指导作用比较小的用户视觉属性信息,而无法获取对资源投放具有有效指导作用的用户高维标签信息;又考虑到用户视觉属性信息与用户高维标签信息之间具有一定关联关系,因此,可以预先通过获取样本用户的用户视觉属性信息与用户高维标签信息之间的对应关系,将该对应关系作为样本数据,训练得到用于从视觉属性预测高维标签的模型,这样只有在模型训练阶段,需要获取用户ID数据并根据该用户ID数据获取用户高维标签信息,而在分布数据预测阶段,无需实时获取用户ID数据,而是利用预先训练好的用户标签预测模型并基于可以实时获取到的用户视觉属性分布情况,预测出用户高维标签分布情况。
本说明书一个或多个实施例中,预先基于样本数据训练得到用户标签预测模型,其中,该样本数据是基于采集到的样本用户的图像信息和终端标识信息生成的,该样本数据包括样本用户的视觉属性分布与高维标签分布之间的对应关系;进而在用户标签分布预测阶段,基于现场采集到的途经用户的图像信息确定用户视觉属性分布数据,再将该用户视觉属性分布数据作为该用户标签预测模型的输入数据,预测得到目标区域的用户标签分布数据,这样在标签分布预测阶段只需实时采集用户的图像信息即可,既能够避免因随意探测用户的终端标识信息而侵犯用户隐私的问题,还能够准确地预测出用户标签分布数据。
可选地,如图9所示,所述装置还包括:模型训练模块804,所述模型训练模块804,用于:
获取样本用户的样本图像信息,其中,所述样本图像信息是设置于样本区域的摄像装置采集得到的;
获取所述样本用户的终端标识信息,其中,所述终端标识信息是基于设置于所述样本区域的无线通信装置获取到的;
根据所述样本图像信息和所述终端标识信息,确定各单位时间段内视觉属性分布数据与高维标签分布数据之间的映射关系;
利用机器学习方法并基于各所述单位时间段对应的所述映射关系,训练得到用户标签预测模型。
可选地,所述模型训练模块804,具体用于:
根据所述样本图像信息,确定各单位时间段下的视觉属性分布数据;以及,
根据所述终端标识信息,确定各单位时间段下的高维标签分布数据;
针对每个单位时间段,确定在该单位时间段下所述视觉属性分布数据与所述高维标签分布数据之间的映射关系。
可选地,所述模型训练模块804,进一步具体用于:
在预设用户画像存储数据库中,分别查询与各单位时间段内探测到的所述终端标识信息对应的用户画像数据;
根据所述用户画像数据,生成各所述单位时间段对应的高维标签分布数据。
可选地,所述模型训练模块804,进一步具体用于:
在预设消费记录数据库中,分别查询与各单位时间段内探测到的所述终端标识信息对应的线上消费数据;
根据所述线上消费数据,确定与各所述单位时间段对应的用户画像数据;
根据所述用户画像数据,生成各所述单位时间段对应的高维标签分布数据。
可选地,所述装置还包括:推广资源确定模块805,所述推广资源确定模块805,用于:
基于所述高维标签分布数据,确定所述目标区域内待投放的目标推广资源。
可选地,所述推广资源确定模块805,具体用于:
针对每个备选推广资源,将所述高维标签分布数据与所述备选推广资源所面向用户的标签信息进行匹配,确定所述备选推广资源的投放匹配度;
将所述投放匹配度满足预设条件的备选推广资源,确定为所述目标区域内待投放的目标推广资源。
可选地,所述模型训练模块804,还具体用于:
接收设置于样本区域的无线通信装置传输的终端标识信息和相应的终端发射信号强度;
将所述终端发射信号强度大于预设强度阈值的终端标识信息,确定为所述样本用户的终端标识信息。
本说明书一个或多个实施例中的用户标签分布预测装置,预先基于样本数据训练得到用户标签预测模型,其中,该样本数据是基于采集到的样本用户的图像信息和终端标识信息生成的,该样本数据包括样本用户的视觉属性分布与高维标签分布之间的对应关系;进而在用户标签分布预测阶段,基于现场采集到的途经用户的图像信息确定用户视觉属性分布数据,再将该用户视觉属性分布数据作为该用户标签预测模型的输入数据,预测得到目标区域的用户标签分布数据,这样在标签分布预测阶段只需实时采集用户的图像信息即可,既能够避免因随意探测用户的终端标识信息而侵犯用户隐私的问题,还能够准确地预测出用户标签分布数据。
需要说明的是,本说明书中关于用户标签分布预测装置的实施例与本说明书中关于用户标签分布预测方法的实施例基于同一发明构思,因此该实施例的具体实施可以参见前述对应的用户标签分布预测方法的实施,重复之处不再赘述。
对应上述图2至图7描述的用户标签分布预测方法,基于相同的技术构思,本说明书一个或多个实施例还提供了一种用户标签分布预测系统,图10为本说明书一个或多个实施例提供的用户标签分布预测系统的结构组成示意图,该系统用于执行图2至图7描述的用户标签分布预测方法,如图10所示,该系统包括:信息采集设备10和上述用户标签分布预测装置20,其中,该信息采集设备与该用户标签分布预测装置相连接;
针对标签预测阶段,上述信息采集设备10为图1中第二信息采集设备,上述用户标签分布预测装置20为图1中标签识别装置;
上述第二信息采集设备,用于采集预测时间段内途经目标区域的用户的图像信息,并将采集到的图像信息传输至上述标签识别装置;
上述标签识别装置,用于获取预测时间段内途经目标区域的用户的图像信息,其中,该图像信息是设置于目标区域的摄像装置采集得到的;
其中,该目标区域是指设置有推广资源展示屏的区域,可以是设置有线下广告推广设备的区域,例如,设置有广告投放系统的公交点处、地铁站内、办公楼内、商场内等等;
具体的,用户标签分布数据的预测过程可以是周期性的,也可以是非周期性的,以周期性进行用户标签预测为例,可以隔一周预测一次用户标签分布,也可以隔一个月预测一个用户标签分布数据,根据实际需求设定预测周期,若预测周期为一周,则预测时间段可以为周一至周日,通过摄像装置采集周一至周日时间段内途经目标区域的用户的图像信息,并将采集到的图像信息传输至标签识别装置;
以及上述标签识别装置,还用于根据获取到的图像信息,确定在预测时间段内途经目标区域的用户的视觉属性分布数据;
具体的,在获取到摄像装置传输的途经目标区域的用户的图像信息后,利用图像识别算法对预测时间段相关的图像信息进行识别分析,得到目标用户的视觉属性信息,其中,该视觉属性信息包括:年龄、性别、着装类型、身高信息中至少一项;再根据识别出的用户视觉属性信息,确定视觉属性分布数据,该视觉属性分布数据可以包括:年龄分布数据、性别分布数据、着装类型分布数据、身高分布数据中至少一项,其中,该年龄分布分布数据可以是各划分年龄段下用户数量或比例,该性别分布数据可以是男性比例和女性比例,该着装类型分布数据可以是商务装、休闲装、工装等各分类类别所占比例;
另外,如果设置于不同目标区域的摄像装置均与同一个标签识别装置通信连接,即设置于多个目标区域的摄像装置均向同一个标签识别装置上传采集到的图像信息,那么该标签识别装置需要根据摄像装置的标识信息,对接收到的图像信息进行区分,以便分别确定各目标区域对应的视觉属性分布数据;
以及上述标签识别装置,还用于利用预先训练好的用户标签预测模型并基于视觉属性分布数据,确定在预测时间段内途经目标区域的用户的高维标签分布数据,其中,该用户标签预测模型是利用机器学习方法并基于目标样本数据训练得到的,该目标样本数据是基于采集到的样本用户的图像信息和终端标识信息生成的,该样本数据包括样本用户的视觉属性分布与高维标签分布之间的对应关系;
其中,上述高维标签分布数据包括;职业类型分布数据、消费水平分布数据、消费偏好分布数据、消费需求分布数据中至少一项,其中,该职业类型分布数据可以是各职业类别所占比例,该消费水平分布数据可以是高消费、中等消费、低消费等各分类类别所占比例,该消费需求分布数据可以是生活用品、办公用品、学习用品、餐饮需求、住宿需求、购车需求等各分类类别所占比例;
具体的,将确定出的视觉属性分布数据作为用户标签预测模型的输入数据,该用户标签预测模型的输出数据即为预测得到的高维标签分布数据,其中,以用户标签预测模型为线性回归模型为例,根据确定出的视觉属性分布数据和公式y=ax确定高维标签分布数据,a是模型训练阶段确定出的模型参数,x表示模型输入数据即视觉属性分布数据,y表示模型输出数据即高维标签分布数据。
其中,考虑到视觉属性信息可以基于实时采集到的途经目标区域的用户的图像信息获取到,但实时探测途经目标区域的用户所携带的移动终端的标识信息将存在侵犯用户隐私的问题,也就是说,采用对目标区域进行现场信息采集的方式,只能够获取对资源投放的指导作用比较小的用户视觉属性信息,而无法获取对资源投放具有有效指导作用的用户高维标签信息;又考虑到用户视觉属性信息与用户高维标签信息之间具有一定关联关系,因此,可以预先通过获取样本用户的用户视觉属性信息与用户高维标签信息之间的对应关系,将该对应关系作为样本数据,训练得到用于从视觉属性预测高维标签的模型,这样只有在模型训练阶段,需要获取用户ID数据并根据该用户ID数据获取用户高维标签信息,而在分布数据预测阶段,无需实时获取用户ID数据,而是利用预先训练好的用户标签预测模型并基于可以实时获取到的用户视觉属性分布情况,预测出用户高维标签分布情况。
本说明书一个或多个实施例中,预先基于样本数据训练得到用户标签预测模型,其中,该样本数据是基于采集到的样本用户的图像信息和终端标识信息生成的,该样本数据包括样本用户的视觉属性分布与高维标签分布之间的对应关系;进而在用户标签分布预测阶段,基于现场采集到的途经用户的图像信息确定用户视觉属性分布数据,再将该用户视觉属性分布数据作为该用户标签预测模型的输入数据,预测得到目标区域的用户标签分布数据,这样在标签分布预测阶段只需实时采集用户的图像信息即可,既能够避免因随意探测用户的终端标识信息而侵犯用户隐私的问题,还能够准确地预测出用户标签分布数据。
进一步的,针对模型训练阶段,上述信息采集设备10为图1中第一信息采集设备,上述用户标签分布预测装置20为图1中模型训练装置;
上述第一信息采集设备,用于采集途经样本区域的用户的图像信息和终端标识信息,并将采集到的图像信息和终端标识信息传输至上述模型训练装置;
上述模型训练装置,用于获取样本用户的样本图像信息,其中,该样本图像信息是设置于样本区域的摄像装置采集得到的,该样本用户是指途经选取的样本区域的用户;
具体的,选取预设数量个样本区域,在各样本区域分别设置第一信息采集设备,通过摄像装置采集途经样本区域的用户的图像信息,并将该图像信息传输至模型训练装置;
上述模型训练装置,还用于获取样本用户的终端标识信息,其中,该终端标识信息是基于设置于样本区域的无线通信装置获取到的;
具体的,在获取样本用户的图像信息的同时还获取样本用户所携带的移动终端的标识信息,即通过第一信息采集设备中的无线通信装置探测途经样本区域的用户的终端标识信息,并将该终端标识信息传输至模型训练装置;另外,还可以采用被动式方式,将无线通信装置设置为监听模式,触发样本用户所携带的移动终端将各自的标识信息传输至模型训练装置,即样本用户所携带的移动终端探测到该无线通信装置后将各自的标识信息传输至模型训练装置;
其中,上述无线通信装置可以是wifi模块或BLE模块,该终端标识信息可以是样本用户携带的移动终端的mac地址;
上述模型训练装置,还用于根据获取到的样本图像信息和终端标识信息,确定各单位时间段内视觉属性分布数据与高维标签分布数据之间的映射关系;
具体的,在接收到样本图像信息和终端标识信息后,可以利用图像识别算法对该图像信息进行识别分析,得到样本用户的视觉属性信息,例如,该视觉属性信息包括:年龄、性别、着装类型、身高信息中至少一项,即获取样本用户的基础属性信息;并基于该视觉属性信息,确定各单位时间段内的视觉属性分布数据;
以及,确定各终端标识信息对应的用户画像数据,其中,该用户画像数据即为用户高维标签数据,例如,该用户画像数据包括:职业类型、消费水平、消费偏好、消费需求、收入情况中至少一项,针对线上消费系统已基于线上消费数据对用户画像进行识别的情况,该用户画像数据可以是直接从线上消费系统获取到的;对应的,针对线上消费系统不进行用户画像识别的情况,需要先从线上消费系统获取与各终端标识信息对应的线上消费数据,即结合探测到的样本用户的ID数据,获取样本用户的线上消费数据,再基于该线上消费数据确定样本用户的用户画像数据;并基于该用户画像数据,确定各单位时间段内的高维标签分布数据;
基于现场点位信息和时间信息,将确定出的样本用户的视觉属性分布数据和高维标签分布数据进行关联,即分布确定同一样本区域的同一单位时间段下视觉属性分布数据与高维标签分布数据之间的映射关系,并将该映射关系作为样本数据;
上述模型训练装置,还用于利用机器学习方法并基于各单位时间段对应的映射关系,训练得到用户标签预测模型。
其中,上述用户标签预测模型可以是传统机器学习模型,例如线性回归模型、或逻辑回归LR模型等,还可以是深度学习模型,例如GBDT模型、或DNN模型等;具体的,将视觉属性分布数据作为模型特征,将高维标签分布数据作为模型目标,训练确定模型涉及的各特征权重系数,基于该特征权重系数得到用户标签预测模型;
仍以用户标签预测模型为线性回归模型为例,基于确定出的样本数据和公式y=ax,确定模型特征权重系数,具体的,将视觉属性分布数据作为模型特征x,将同一样本区域同一单位时间段的高维标签分布数据作为模型目标y,进行机器学习训练得到模型特征权重系数a,基于该特征权重系数a得到用户标签预测模型。
本说明书一个或多个实施例中的用户标签分布预测系统,预先基于样本数据训练得到用户标签预测模型,其中,该样本数据是基于采集到的样本用户的图像信息和终端标识信息生成的,该样本数据包括样本用户的视觉属性分布与高维标签分布之间的对应关系;进而在用户标签分布预测阶段,基于现场采集到的途经用户的图像信息确定用户视觉属性分布数据,再将该用户视觉属性分布数据作为该用户标签预测模型的输入数据,预测得到目标区域的用户标签分布数据,这样在标签分布预测阶段只需实时采集用户的图像信息即可,既能够避免因随意探测用户的终端标识信息而侵犯用户隐私的问题,还能够准确地预测出用户标签分布数据。
需要说明的是,本说明书中关于用户标签分布预测系统的实施例与本说明书中关于用户标签分布预测方法的实施例基于同一发明构思,因此该实施例的具体实施可以参见前述对应的用户标签分布预测方法的实施,重复之处不再赘述。
进一步地,对应上述图2至图7所示的方法,基于相同的技术构思,本说明书一个或多个实施例还提供了一种用户标签分布预测设备,该设备用于执行上述的用户标签分布预测方法,如图11所示。
用户标签分布预测设备可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上的处理器1101和存储器1102,存储器1102中可以存储有一个或一个以上存储应用程序或数据。其中,存储器1102可以是短暂存储或持久存储。存储在存储器1102的应用程序可以包括一个或一个以上模块(图示未示出),每个模块可以包括对用户标签分布预测设备中的一系列计算机可执行指令。更进一步地,处理器1101可以设置为与存储器1102通信,在用户标签分布预测设备上执行存储器1102中的一系列计算机可执行指令。用户标签分布预测设备还可以包括一个或一个以上电源1103,一个或一个以上有线或无线网络接口1104,一个或一个以上输入输出接口1105,一个或一个以上键盘1106等。
在一个具体的实施例中,用户标签分布预测设备包括有存储器,以及一个或一个以上的程序,其中一个或者一个以上程序存储于存储器中,且一个或者一个以上程序可以包括一个或一个以上模块,且每个模块可以包括对用户标签分布预测设备中的一系列计算机可执行指令,且经配置以由一个或者一个以上处理器执行该一个或者一个以上程序包含用于进行以下计算机可执行指令:
获取预测时间段内途经目标区域的用户的图像信息,其中,所述图像信息是设置于所述目标区域的摄像装置采集得到的;
根据获取到的所述图像信息,确定在所述预测时间段内途经所述目标区域的用户的视觉属性分布数据;
利用预先训练好的用户标签预测模型并基于所述视觉属性分布数据,确定在所述预测时间段内途经所述目标区域的用户的高维标签分布数据。
本说明书一个或多个实施例中,预先基于样本数据训练得到用户标签预测模型,其中,该样本数据是基于采集到的样本用户的图像信息和终端标识信息生成的,该样本数据包括样本用户的视觉属性分布与高维标签分布之间的对应关系;进而在用户标签分布预测阶段,基于现场采集到的途经用户的图像信息确定用户视觉属性分布数据,再将该用户视觉属性分布数据作为该用户标签预测模型的输入数据,预测得到目标区域的用户标签分布数据,这样在标签分布预测阶段只需实时采集用户的图像信息即可,既能够避免因随意探测用户的终端标识信息而侵犯用户隐私的问题,还能够准确地预测出用户标签分布数据。
可选地,计算机可执行指令在被执行时,还包含用于进行以下计算机可执行指令:
获取样本用户的样本图像信息,其中,所述样本图像信息是设置于样本区域的摄像装置采集得到的;
获取所述样本用户的终端标识信息,其中,所述终端标识信息是基于设置于所述样本区域的无线通信装置获取到的;
根据所述样本图像信息和所述终端标识信息,确定各单位时间段内视觉属性分布数据与高维标签分布数据之间的映射关系;
利用机器学习方法并基于各所述单位时间段对应的所述映射关系,训练得到用户标签预测模型。
可选地,计算机可执行指令在被执行时,所述根据所述样本图像信息和所述终端标识信息,确定各单位时间段内视觉属性分布数据与高维标签分布数据之间的映射关系,包括:
根据所述样本图像信息,确定各单位时间段下的视觉属性分布数据;以及,
根据所述终端标识信息,确定各单位时间段下的高维标签分布数据;
针对每个单位时间段,确定在该单位时间段下所述视觉属性分布数据与所述高维标签分布数据之间的映射关系。
可选地,计算机可执行指令在被执行时,所述根据所述终端标识信息,确定各单位时间段下的高维标签分布数据,包括:
在预设用户画像存储数据库中,分别查询与各单位时间段内探测到的所述终端标识信息对应的用户画像数据;
根据所述用户画像数据,生成各所述单位时间段对应的高维标签分布数据。
可选地,计算机可执行指令在被执行时,所述根据所述终端标识信息,确定各单位时间段下的高维标签分布数据,包括:
在预设消费记录数据库中,分别查询与各单位时间段内探测到的所述终端标识信息对应的线上消费数据;
根据所述线上消费数据,确定与各所述单位时间段对应的用户画像数据;
根据所述用户画像数据,生成各所述单位时间段对应的高维标签分布数据。
可选地,计算机可执行指令在被执行时,在确定在所述预测时间段内途经所述目标区域的用户的高维标签分布数据之后,还包括:
基于所述高维标签分布数据,确定所述目标区域内待投放的目标推广资源。
可选地,计算机可执行指令在被执行时,所述基于所述高维标签分布数据,确定所述目标区域内待投放的目标推广资源,包括:
针对每个备选推广资源,将所述高维标签分布数据与所述备选推广资源所面向用户的标签信息进行匹配,确定所述备选推广资源的投放匹配度;
将所述投放匹配度满足预设条件的备选推广资源,确定为所述目标区域内待投放的目标推广资源。
可选地,计算机可执行指令在被执行时,所述获取所述样本用户的终端标识信息,包括:
接收设置于样本区域的无线通信装置传输的终端标识信息和相应的终端发射信号强度;
将所述终端发射信号强度大于预设强度阈值的终端标识信息,确定为所述样本用户的终端标识信息。
本说明书一个或多个实施例中的用户标签分布预测设备,预先基于样本数据训练得到用户标签预测模型,其中,该样本数据是基于采集到的样本用户的图像信息和终端标识信息生成的,该样本数据包括样本用户的视觉属性分布与高维标签分布之间的对应关系;进而在用户标签分布预测阶段,基于现场采集到的途经用户的图像信息确定用户视觉属性分布数据,再将该用户视觉属性分布数据作为该用户标签预测模型的输入数据,预测得到目标区域的用户标签分布数据,这样在标签分布预测阶段只需实时采集用户的图像信息即可,既能够避免因随意探测用户的终端标识信息而侵犯用户隐私的问题,还能够准确地预测出用户标签分布数据。
需要说明的是,本说明书中关于用户标签分布预测设备的实施例与本说明书中关于用户标签分布预测方法的实施例基于同一发明构思,因此该实施例的具体实施可以参见前述对应的用户标签分布预测方法的实施,重复之处不再赘述。
进一步地,对应上述图2至图7所示的方法,基于相同的技术构思,本说明书一个或多个实施例还提供了一种存储介质,用于存储计算机可执行指令,一种具体的实施例中,该存储介质可以为U盘、光盘、硬盘等,该存储介质存储的计算机可执行指令在被处理器执行时,能实现以下流程:
获取预测时间段内途经目标区域的用户的图像信息,其中,所述图像信息是设置于所述目标区域的摄像装置采集得到的;
根据获取到的所述图像信息,确定在所述预测时间段内途经所述目标区域的用户的视觉属性分布数据;
利用预先训练好的用户标签预测模型并基于所述视觉属性分布数据,确定在所述预测时间段内途经所述目标区域的用户的高维标签分布数据。
本说明书一个或多个实施例中,预先基于样本数据训练得到用户标签预测模型,其中,该样本数据是基于采集到的样本用户的图像信息和终端标识信息生成的,该样本数据包括样本用户的视觉属性分布与高维标签分布之间的对应关系;进而在用户标签分布预测阶段,基于现场采集到的途经用户的图像信息确定用户视觉属性分布数据,再将该用户视觉属性分布数据作为该用户标签预测模型的输入数据,预测得到目标区域的用户标签分布数据,这样在标签分布预测阶段只需实时采集用户的图像信息即可,既能够避免因随意探测用户的终端标识信息而侵犯用户隐私的问题,还能够准确地预测出用户标签分布数据。
可选地,该存储介质存储的计算机可执行指令在被处理器执行时,还实现以下流程:
获取样本用户的样本图像信息,其中,所述样本图像信息是设置于样本区域的摄像装置采集得到的;
获取所述样本用户的终端标识信息,其中,所述终端标识信息是基于设置于所述样本区域的无线通信装置获取到的;
根据所述样本图像信息和所述终端标识信息,确定各单位时间段内视觉属性分布数据与高维标签分布数据之间的映射关系;
利用机器学习方法并基于各所述单位时间段对应的所述映射关系,训练得到用户标签预测模型。
可选地,该存储介质存储的计算机可执行指令在被处理器执行时,所述根据所述样本图像信息和所述终端标识信息,确定各单位时间段内视觉属性分布数据与高维标签分布数据之间的映射关系,包括:
根据所述样本图像信息,确定各单位时间段下的视觉属性分布数据;以及,
根据所述终端标识信息,确定各单位时间段下的高维标签分布数据;
针对每个单位时间段,确定在该单位时间段下所述视觉属性分布数据与所述高维标签分布数据之间的映射关系。
可选地,该存储介质存储的计算机可执行指令在被处理器执行时,所述根据所述终端标识信息,确定各单位时间段下的高维标签分布数据,包括:
在预设用户画像存储数据库中,分别查询与各单位时间段内探测到的所述终端标识信息对应的用户画像数据;
根据所述用户画像数据,生成各所述单位时间段对应的高维标签分布数据。
可选地,该存储介质存储的计算机可执行指令在被处理器执行时,所述根据所述终端标识信息,确定各单位时间段下的高维标签分布数据,包括:
在预设消费记录数据库中,分别查询与各单位时间段内探测到的所述终端标识信息对应的线上消费数据;
根据所述线上消费数据,确定与各所述单位时间段对应的用户画像数据;
根据所述用户画像数据,生成各所述单位时间段对应的高维标签分布数据。
可选地,该存储介质存储的计算机可执行指令在被处理器执行时,在确定在所述预测时间段内途经所述目标区域的用户的高维标签分布数据之后,还包括:
基于所述高维标签分布数据,确定所述目标区域内待投放的目标推广资源。
可选地,该存储介质存储的计算机可执行指令在被处理器执行时,所述基于所述高维标签分布数据,确定所述目标区域内待投放的目标推广资源,包括:
针对每个备选推广资源,将所述高维标签分布数据与所述备选推广资源所面向用户的标签信息进行匹配,确定所述备选推广资源的投放匹配度;
将所述投放匹配度满足预设条件的备选推广资源,确定为所述目标区域内待投放的目标推广资源。
可选地,该存储介质存储的计算机可执行指令在被处理器执行时,所述获取所述样本用户的终端标识信息,包括:
接收设置于样本区域的无线通信装置传输的终端标识信息和相应的终端发射信号强度;
将所述终端发射信号强度大于预设强度阈值的终端标识信息,确定为所述样本用户的终端标识信息。
本说明书一个或多个实施例中的存储介质存储的计算机可执行指令在被处理器执行时,预先基于样本数据训练得到用户标签预测模型,其中,该样本数据是基于采集到的样本用户的图像信息和终端标识信息生成的,该样本数据包括样本用户的视觉属性分布与高维标签分布之间的对应关系;进而在用户标签分布预测阶段,基于现场采集到的途经用户的图像信息确定用户视觉属性分布数据,再将该用户视觉属性分布数据作为该用户标签预测模型的输入数据,预测得到目标区域的用户标签分布数据,这样在标签分布预测阶段只需实时采集用户的图像信息即可,既能够避免因随意探测用户的终端标识信息而侵犯用户隐私的问题,还能够准确地预测出用户标签分布数据。
需要说明的是,本说明书中关于存储介质的实施例与本说明书中关于用户标签分布预测方法的实施例基于同一发明构思,因此该实施例的具体实施可以参见前述对应的用户标签分布预测方法的实施,重复之处不再赘述。
在20世纪90年代,对于一个技术的改进可以很明显地区分是硬件上的改进(例如,对二极管、晶体管、开关等电路结构的改进)还是软件上的改进(对于方法流程的改进)。然而,随着技术的发展,当今的很多方法流程的改进已经可以视为硬件电路结构的直接改进。设计人员几乎都通过将改进的方法流程编程到硬件电路中来得到相应的硬件电路结构。因此,不能说一个方法流程的改进就不能用硬件实体模块来实现。例如,可编程逻辑器件(Programmable Logic Device,PLD)(例如现场可编程门阵列(Field Programmable GateArray,FPGA))就是这样一种集成电路,其逻辑功能由用户对器件编程来确定。由设计人员自行编程来把一个数字系统“集成”在一片PLD上,而不需要请芯片制造厂商来设计和制作专用的集成电路芯片。而且,如今,取代手工地制作集成电路芯片,这种编程也多半改用“逻辑编译器(logic compiler)”软件来实现,它与程序开发撰写时所用的软件编译器相类似,而要编译之前的原始代码也得用特定的编程语言来撰写,此称之为硬件描述语言(Hardware Description Language,HDL),而HDL也并非仅有一种,而是有许多种,如ABEL(Advanced Boolean Expression Language)、AHDL(Altera Hardware DescriptionLanguage)、Confluence、CUPL(Cornell University Programming Language)、HD Cal、JHDL(Java Hardware Description Language)、Lava、Lola、My HDL、PALASM、RHDL(RubyHardware Description Language)等,目前最普遍使用的是VHDL(Very-High-SpeedIntegrated Circuit Hardware Description Language)与Verilog。本领域技术人员也应该清楚,只需要将方法流程用上述几种硬件描述语言稍作逻辑编程并编程到集成电路中,就可以很容易得到实现该逻辑方法流程的硬件电路。
控制器可以按任何适当的方式实现,例如,控制器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(Application Specific Integrated Circuit,ASIC)、可编程逻辑控制器和嵌入微控制器的形式,控制器的例子包括但不限于以下微控制器:ARC 625D、Atmel AT91SAM、Microchip PIC18F26K20以及Silicone Labs C8051F320,存储器控制器还可以被实现为存储器的控制逻辑的一部分。本领域技术人员也知道,除了以纯计算机可读程序代码方式实现控制器以外,完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件,而对其内包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至,可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。
上述实施例阐明的系统、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的,计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。
为了描述的方便,描述以上装置时以功能分为各种单元分别描述。当然,在实施本说明书一个或多个时可以把各单元的功能在同一个或多个软件和/或硬件中实现。
本领域内的技术人员应明白,本说明书一个或多个的实施例可提供为方法、系统、或计算机程序产品。因此,本说明书一个或多个可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本说明书一个或多个可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本说明书一个或多个是参照根据本说明书一个或多个实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域技术人员应明白,本说明书一个或多个的实施例可提供为方法、系统或计算机程序产品。因此,本说明书一个或多个可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本说明书一个或多个可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本说明书一个或多个可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本说明书一个或多个,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本说明书一个或多个的实施例而已,并不用于限制本说明书一个或多个。对于本领域技术人员来说,本说明书一个或多个可以有各种更改和变化。凡在本说明书一个或多个的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本说明书一个或多个的权利要求范围之内。

Claims (19)

1.一种用户标签分布预测方法,包括:
获取预测时间段内途经目标区域的用户的图像信息,其中,所述图像信息是设置于所述目标区域的摄像装置采集得到的;
根据获取到的所述图像信息,确定在所述预测时间段内途经所述目标区域的用户的视觉属性分布数据;
利用预先训练好的用户标签预测模型并基于所述视觉属性分布数据,确定在所述预测时间段内途经所述目标区域的用户的高维标签分布数据。
2.根据权利要求1所述的方法,其中,所述方法还包括:
获取样本用户的样本图像信息,其中,所述样本图像信息是设置于样本区域的摄像装置采集得到的;
获取所述样本用户的终端标识信息,其中,所述终端标识信息是基于设置于所述样本区域的无线通信装置获取到的;
根据所述样本图像信息和所述终端标识信息,确定各单位时间段内视觉属性分布数据与高维标签分布数据之间的映射关系;
利用机器学习方法并基于各所述单位时间段对应的所述映射关系,训练得到用户标签预测模型。
3.根据权利要求2所述的方法,其中,所述根据所述样本图像信息和所述终端标识信息,确定各单位时间段内视觉属性分布数据与高维标签分布数据之间的映射关系,包括:
根据所述样本图像信息,确定各单位时间段下的视觉属性分布数据;以及,
根据所述终端标识信息,确定各单位时间段下的高维标签分布数据;
针对每个单位时间段,确定在该单位时间段下所述视觉属性分布数据与所述高维标签分布数据之间的映射关系。
4.根据权利要求3所述的方法,其中,所述根据所述终端标识信息,确定各单位时间段下的高维标签分布数据,包括:
在预设用户画像存储数据库中,分别查询与各单位时间段内探测到的所述终端标识信息对应的用户画像数据;
根据所述用户画像数据,生成各所述单位时间段对应的高维标签分布数据。
5.根据权利要求3所述的方法,其中,所述根据所述终端标识信息,确定各单位时间段下的高维标签分布数据,包括:
在预设消费记录数据库中,分别查询与各单位时间段内探测到的所述终端标识信息对应的线上消费数据;
根据所述线上消费数据,确定与各所述单位时间段对应的用户画像数据;
根据所述用户画像数据,生成各所述单位时间段对应的高维标签分布数据。
6.根据权利要求1所述的方法,其中,在确定在所述预测时间段内途经所述目标区域的用户的高维标签分布数据之后,还包括:
基于所述高维标签分布数据,确定所述目标区域内待投放的目标推广资源。
7.根据权利要求6所述的方法,其中,所述基于所述高维标签分布数据,确定所述目标区域内待投放的目标推广资源,包括:
针对每个备选推广资源,将所述高维标签分布数据与所述备选推广资源所面向用户的标签信息进行匹配,确定所述备选推广资源的投放匹配度;
将所述投放匹配度满足预设条件的备选推广资源,确定为所述目标区域内待投放的目标推广资源。
8.根据权利要求2所述的方法,其中,所述获取所述样本用户的终端标识信息,包括:
接收设置于样本区域的无线通信装置传输的终端标识信息和相应的终端发射信号强度;
将所述终端发射信号强度大于预设强度阈值的终端标识信息,确定为所述样本用户的终端标识信息。
9.一种用户标签分布预测装置,包括:
图像信息获取模块,用于获取预测时间段内途经目标区域的用户的图像信息,其中,所述图像信息是设置于所述目标区域的摄像装置采集得到的;
视觉属性确定模块,用于根据获取到的所述图像信息,确定在所述预测时间段内途经所述目标区域的用户的视觉属性分布数据;
用户标签预测模块,用于利用预先训练好的用户标签预测模型并基于所述视觉属性分布数据,确定在所述预测时间段内途经所述目标区域的用户的高维标签分布数据。
10.根据权利要求9所述的装置,其中,所述装置还包括:模型训练模块,所述模型训练模块,用于:
获取样本用户的样本图像信息,其中,所述样本图像信息是设置于样本区域的摄像装置采集得到的;
获取所述样本用户的终端标识信息,其中,所述终端标识信息是基于设置于所述样本区域的无线通信装置获取到的;
根据所述样本图像信息和所述终端标识信息,确定各单位时间段内视觉属性分布数据与高维标签分布数据之间的映射关系;
利用机器学习方法并基于各所述单位时间段对应的所述映射关系,训练得到用户标签预测模型。
11.根据权利要求10所述的装置,其中,所述模型训练模块,具体用于:
根据所述样本图像信息,确定各单位时间段下的视觉属性分布数据;以及,
根据所述终端标识信息,确定各单位时间段下的高维标签分布数据;
针对每个单位时间段,确定在该单位时间段下所述视觉属性分布数据与所述高维标签分布数据之间的映射关系。
12.根据权利要求11所述的装置,其中,所述模型训练模块,进一步具体用于:
在预设用户画像存储数据库中,分别查询与各单位时间段内探测到的所述终端标识信息对应的用户画像数据;
根据所述用户画像数据,生成各所述单位时间段对应的高维标签分布数据。
13.根据权利要求11所述的装置,其中,所述模型训练模块,进一步具体用于:
在预设消费记录数据库中,分别查询与各单位时间段内探测到的所述终端标识信息对应的线上消费数据;
根据所述线上消费数据,确定与各所述单位时间段对应的用户画像数据;
根据所述用户画像数据,生成各所述单位时间段对应的高维标签分布数据。
14.根据权利要求9所述的装置,其中,所述装置还包括:推广资源确定模块,所述推广资源确定模块,用于:
基于所述高维标签分布数据,确定所述目标区域内待投放的目标推广资源。
15.根据权利要求14所述的装置,其中,所述推广资源确定模块,具体用于:
针对每个备选推广资源,将所述高维标签分布数据与所述备选推广资源所面向用户的标签信息进行匹配,确定所述备选推广资源的投放匹配度;
将所述投放匹配度满足预设条件的备选推广资源,确定为所述目标区域内待投放的目标推广资源。
16.根据权利要求10所述的装置,其中,所述模型训练模块,还具体用于:
接收设置于样本区域的无线通信装置传输的终端标识信息和相应的终端发射信号强度;
将所述终端发射信号强度大于预设强度阈值的终端标识信息,确定为所述样本用户的终端标识信息。
17.一种用户标签分布预测系统,包括:信息采集设备和如权利要求9至16任一项所述的用户标签分布预测装置,其中,所述信息采集设备与所述用户标签分布预测装置相连接;
所述信息采集设备,用于采集预测时间段内途经目标区域的用户的图像信息,并将采集到的所述图像信息传输至所述用户标签分布预测装置。
18.一种用户标签分布预测设备,包括:
处理器;以及
被安排成存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器:
获取预测时间段内途经目标区域的用户的图像信息,其中,所述图像信息是设置于所述目标区域的摄像装置采集得到的;
根据获取到的所述图像信息,确定在所述预测时间段内途经所述目标区域的用户的视觉属性分布数据;
利用预先训练好的用户标签预测模型并基于所述视觉属性分布数据,确定在所述预测时间段内途经所述目标区域的用户的高维标签分布数据。
19.一种存储介质,用于存储计算机可执行指令,所述可执行指令在被执行时实现以下流程:
获取预测时间段内途经目标区域的用户的图像信息,其中,所述图像信息是设置于所述目标区域的摄像装置采集得到的;
根据获取到的所述图像信息,确定在所述预测时间段内途经所述目标区域的用户的视觉属性分布数据;
利用预先训练好的用户标签预测模型并基于所述视觉属性分布数据,确定在所述预测时间段内途经所述目标区域的用户的高维标签分布数据。
CN201910323814.1A 2019-04-22 2019-04-22 一种用户标签分布预测方法、装置及系统 Active CN110148013B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910323814.1A CN110148013B (zh) 2019-04-22 2019-04-22 一种用户标签分布预测方法、装置及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910323814.1A CN110148013B (zh) 2019-04-22 2019-04-22 一种用户标签分布预测方法、装置及系统

Publications (2)

Publication Number Publication Date
CN110148013A CN110148013A (zh) 2019-08-20
CN110148013B true CN110148013B (zh) 2023-01-24

Family

ID=67593802

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910323814.1A Active CN110148013B (zh) 2019-04-22 2019-04-22 一种用户标签分布预测方法、装置及系统

Country Status (1)

Country Link
CN (1) CN110148013B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112749292B (zh) * 2019-10-31 2024-05-03 深圳云天励飞技术有限公司 用户标签生成方法及装置、计算机装置和存储介质
CN112288455B (zh) * 2020-01-09 2024-07-19 北京沃东天骏信息技术有限公司 标签生成方法及装置、计算机可读存储介质、电子设备
CN111353825B (zh) * 2020-03-10 2024-01-12 北京爱笔科技有限公司 一种消息传输方法及装置
CN111325186B (zh) * 2020-03-23 2023-05-05 上海依图网络科技有限公司 视频处理方法、装置、介质及系统
CN112464041A (zh) * 2020-06-06 2021-03-09 谢国柱 基于人工智能的互联网大数据处理方法及系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108108715A (zh) * 2017-12-31 2018-06-01 厦门大学 基于生物启发和深度属性学习相结合的人脸美感预测方法
GB201809254D0 (en) * 2018-06-06 2018-07-25 Mansoor Feroz Systems and method for automated boxing data collection and analytics platform
CN109615649A (zh) * 2018-10-31 2019-04-12 阿里巴巴集团控股有限公司 一种图像标注方法、装置及系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108108715A (zh) * 2017-12-31 2018-06-01 厦门大学 基于生物启发和深度属性学习相结合的人脸美感预测方法
GB201809254D0 (en) * 2018-06-06 2018-07-25 Mansoor Feroz Systems and method for automated boxing data collection and analytics platform
CN109615649A (zh) * 2018-10-31 2019-04-12 阿里巴巴集团控股有限公司 一种图像标注方法、装置及系统

Also Published As

Publication number Publication date
CN110148013A (zh) 2019-08-20

Similar Documents

Publication Publication Date Title
CN110148013B (zh) 一种用户标签分布预测方法、装置及系统
US10991248B2 (en) Parking identification and availability prediction
EP2915319B1 (en) Managing a context model in a mobile device by assigning context labels for data clusters
US9183497B2 (en) Performance-efficient system for predicting user activities based on time-related features
CN108733825B (zh) 一种对象触发事件预测方法及装置
US9008688B2 (en) Calendar matching of inferred contexts and label propagation
US10902445B2 (en) Location evaluation
CN104704863A (zh) 用于智能移动伴侣的用户行为建模
US20160050536A1 (en) Identifying personalized meaningful locations
CN104285427A (zh) 根据通过使不同数据源相关确定的上下文配置终端装置
US10699575B2 (en) Parking availability monitor for a non-demarcated parking zone
CN105023020A (zh) 语义标注设备及其方法
US20140379431A1 (en) Application of mobile devices for event data
CN104574146A (zh) 一种业务推荐的方法和系统
KR102073696B1 (ko) 사용자 단말 및 사용자 활동 예측 방법
CN110866178B (zh) 一种数据处理方法、装置和机器可读介质
CN110458651A (zh) 商户识别方法、装置、设备及存储介质
CN111489208A (zh) 业务推广信息的匹配管理方法、装置及处理设备
Liao et al. Location prediction through activity purpose: integrating temporal and sequential models
CN114239944A (zh) 真实人群数量预测方法及装置
CN112862133A (zh) 订单处理的方法、装置、可读存储介质及电子设备
US20230093267A1 (en) Distributed Content Serving
KR20220131069A (ko) 언어 모델을 이용한 사용자 프로파일 검색 시스템 및 이의 운용 방법
KR20220046997A (ko) 언어 모델을 이용한 사용자 행동 예측 시스템 및 이의 운용 방법
KR20240000282A (ko) 업종별 비교분석 서비스를 제공하는 방법 및 그 서버

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20200923

Address after: Cayman Enterprise Centre, 27 Hospital Road, George Town, Grand Cayman, British Islands

Applicant after: Advanced innovation technology Co.,Ltd.

Address before: A four-storey 847 mailbox in Grand Cayman Capital Building, British Cayman Islands

Applicant before: Alibaba Group Holding Ltd.

Effective date of registration: 20200923

Address after: Cayman Enterprise Centre, 27 Hospital Road, George Town, Grand Cayman, British Islands

Applicant after: Innovative advanced technology Co.,Ltd.

Address before: Cayman Enterprise Centre, 27 Hospital Road, George Town, Grand Cayman, British Islands

Applicant before: Advanced innovation technology Co.,Ltd.

GR01 Patent grant
GR01 Patent grant