CN112396441A - 一种数据处理方法、装置以及可读存储介质 - Google Patents

一种数据处理方法、装置以及可读存储介质 Download PDF

Info

Publication number
CN112396441A
CN112396441A CN201910749875.4A CN201910749875A CN112396441A CN 112396441 A CN112396441 A CN 112396441A CN 201910749875 A CN201910749875 A CN 201910749875A CN 112396441 A CN112396441 A CN 112396441A
Authority
CN
China
Prior art keywords
position information
service
information
determining
cluster
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910749875.4A
Other languages
English (en)
Other versions
CN112396441B (zh
Inventor
刘江冬
凌国惠
余传伟
叶佳木
李追日
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201910749875.4A priority Critical patent/CN112396441B/zh
Publication of CN112396441A publication Critical patent/CN112396441A/zh
Application granted granted Critical
Publication of CN112396441B publication Critical patent/CN112396441B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0251Targeted advertisements
    • G06Q30/0259Targeted advertisements based on store location
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0251Targeted advertisements
    • G06Q30/0261Targeted advertisements based on user location

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Strategic Management (AREA)
  • Finance (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请实施例公开了一种数据处理方法、装置以及可读存储介质,该数据处理方法包括:获取业务交互数据,确定与业务交互数据相关联的业务位置信息;业务交互数据包括用户与业务交互对象之间的交互数据;将业务位置信息划分为多个位置信息簇,基于业务交互数据确定每个位置信息簇分别对应的业务交互对象;确定所述每个位置信息簇分别对应的目标位置信息,将所述目标位置信息确定为所属业务交互对象的对象位置信息。采用本申请实施例,可以提高对象位置信息的准确性。

Description

一种数据处理方法、装置以及可读存储介质
技术领域
本申请涉及互联网技术领域,尤其涉及一种数据处理方法、装置以及可读存储介质。
背景技术
随着互联网技术的发展,媒体广告的投放形式越来越趋向多样化,广告投放的主要目的在于向海量的用户推广商户或者商户的商品信息,为节省广告费用,商户对于广告投放的用户群提出了更高的要求。
现有技术中,可以在信息发布平台中通过商户主动上传的区域位置向用户投放广告,由于商户主动上传的区域位置存在区域范围太大,区域位置有误等问题,造成获取到的商户位置信息与商户实际位置信息并不匹配,进而导致商户位置信息的准确性低下。
发明内容
本申请实施例提供一种数据处理方法、装置以及可读存储介质,可以提高对象位置信息的准确性。
本申请实施例一方面提供了一种数据处理方法,包括:
获取业务交互数据,确定与所述业务交互数据相关联的业务位置信息;所述业务交互数据包括用户与业务交互对象之间的交互数据;
将所述业务位置信息划分为多个位置信息簇,基于所述业务交互数据确定每个位置信息簇分别对应的业务交互对象;
确定所述每个位置信息簇分别对应的目标位置信息,将所述目标位置信息确定为所属业务交互对象的对象位置信息。
其中,所述获取业务交互数据,确定与所述业务交互数据相关联的业务位置信息,包括:
获取用户与所述业务交互对象之间的业务交互数据,确定所述业务交互数据对应的记录时间戳;
从信息发布平台中获取所述用户对应的发布信息;所述发布信息携带用户位置信息;
根据所述记录时间戳确定时间范围,从所述发布信息中,获取在所述时间范围内的用户位置信息,作为与所述业务交互数据相关联的业务位置信息。
其中,所述将所述业务位置信息划分为多个位置信息簇,包括:
获取所述业务位置信息对应的标签信息,基于所述标签信息,将所述业务位置信息划分为多个预划分集合;每个预划分集合中所包含的业务位置信息具有相同的标签信息;
分别对所述每个预划分集合中所包含的业务位置信息进行聚类,得到所述每个预划分集合分别对应的位置信息簇。
其中,所述将所述业务位置信息划分为多个位置信息簇,包括:
获取密度选择参数;所述密度选择参数包括距离参数和数量参数;
从所述业务位置信息中选择位置信息Pi,根据所述距离参数,生成所述位置信息Pi对应的邻域Ni;i小于或等于n,i和n均为自然数,所述n为所述业务位置信息的数量;
若所述邻域Ni中所包含的业务位置信息的数量大于或等于所述数量参数,则确定所述位置信息Pi满足核心点条件,并将所述邻域Ni中所包含的业务位置信息确定为待处理簇Ck;k为自然数,所述k为待处理簇的数量;
若所述邻域Ni中存在满足核心点条件的位置信息Pi+1,确定所述位置信息Pi+1对应的待处理簇Ck+1,将所述待处理簇Ck+1与所述待处理簇Ck进行合并,直至不存在与合并后的待处理簇进行合并的待处理簇时,将所述合并后的待处理簇确定为位置信息簇。
其中,所述方法还包括:
从所述邻域Ni中选择位置信息Pi+1,若检测到所述位置信息Pi+1对应的状态信息为未访问状态,则基于所述距离参数生成所述位置信息Pi+1对应的邻域Ni+1
若所述邻域Ni+1中所包含的业务位置信息的数量大于或等于所述数量参数,则确定所述位置信息Pi+1满足核心点条件。
其中,所述方法还包括:
从所述邻域Ni中选择位置信息Pi+1,若检测到所述位置信息Pi+1对应的状态信息为已访问状态,且所述位置信息Pi+1具有所属的位置信息簇,则将所述位置信息Pi+1从所述待处理簇Ck中删除。
其中,所述确定所述每个位置信息簇分别对应的目标位置信息,将所述目标位置信息确定为所属业务交互对象的对象位置信息,包括:
确定所述每个位置信息簇分别对应的目标位置信息,将所述目标位置信息确定为所述每个位置信息簇所属业务交互对象的待选位置信息;
获取所述业务交互对象对应的上传位置信息,基于所述待选位置信息,对所述上传位置信息进行更新,得到对象位置信息。
其中,所述方法还包括:
根据所述对象位置信息,确定与所述业务交互对象相匹配的目标用户,将所述业务交互对象对应的推广信息发送至所述目标用户对应的信息发布平台。
其中,所述根据所述对象位置信息,确定与所述业务交互对象相匹配的目标用户,包括:
在所述信息发布平台中,获取所有用户的实时位置信息;
基于所述实时位置信息与所述对象位置信息,确定与所述业务交互对象相匹配的目标用户。
本申请实施例一方面提供了一种数据处理装置,包括:
获取模块,用于获取业务交互数据,确定与所述业务交互数据相关联的业务位置信息;所述业务交互数据包括用户与业务交互对象之间的交互数据;
划分模块,用于将所述业务位置信息划分为多个位置信息簇,基于所述业务交互数据确定每个位置信息簇分别对应的业务交互对象;
确定模块,用于确定所述每个位置信息簇分别对应的目标位置信息,将所述目标位置信息确定为所属业务交互对象的对象位置信息。
其中,所述获取模块包括:
交互数据获取单元,用于获取用户与所述业务交互对象之间的业务交互数据,确定所述业务交互数据对应的记录时间戳;
发布信息获取单元,用于从信息发布平台中获取所述用户对应的发布信息;所述发布信息携带用户位置信息;
位置信息获取单元,用于根据所述记录时间戳确定时间范围,从所述发布信息中,获取在所述时间范围内的用户位置信息,作为与所述业务交互数据相关联的业务位置信息。
其中,所述划分模块包括:
集合划分单元,用于获取所述业务位置信息对应的标签信息,基于所述标签信息,将所述业务位置信息划分为多个预划分集合;每个预划分集合中所包含的业务位置信息具有相同的标签信息;
聚类单元,用于分别对所述每个预划分集合中所包含的业务位置信息进行聚类,得到所述每个预划分集合分别对应的位置信息簇。
其中,所述划分模块包括:
参数获取单元,用于获取密度选择参数;所述密度选择参数包括距离参数和数量参数;
邻域生成单元,用于从所述业务位置信息中选择位置信息Pi,根据所述距离参数,生成所述位置信息Pi对应的邻域Ni;i小于或等于n,i和n均为自然数,所述n为所述业务位置信息的数量;
核心点判断单元,用于若所述邻域Ni中所包含的业务位置信息的数量大于或等于所述数量参数,则确定所述位置信息Pi满足核心点条件,并将所述邻域Ni中所包含的业务位置信息确定为待处理簇Ck;k为自然数,所述k为待处理簇的数量;
合并单元,用于若所述邻域Ni中存在满足核心点条件的位置信息Pi+1,确定所述位置信息Pi+1对应的待处理簇Ck+1,将所述待处理簇Ck+1与所述待处理簇Ck进行合并,直至不存在与合并后的待处理簇进行合并的待处理簇时,将所述合并后的待处理簇确定为位置信息簇。
其中,所述装置还包括:
生成模块,用于从所述邻域Ni中选择位置信息Pi+1,若检测到所述位置信息Pi+1对应的状态信息为未访问状态,则基于所述距离参数生成所述位置信息Pi+1对应的邻域Ni+1
判断模块,用于若所述邻域Ni+1中所包含的业务位置信息的数量大于或等于所述数量参数,则确定所述位置信息Pi+1满足核心点条件。
其中,所述装置还包括:
删除模块,用于从所述邻域Ni中选择位置信息Pi+1,若检测到所述位置信息Pi+1对应的状态信息为已访问状态,且所述位置信息Pi+1具有所属的位置信息簇,则将所述位置信息Pi+1从所述待处理簇Ck中删除。
其中,所述确定模块包括:
中心位置确定单元,用于确定所述每个位置信息簇分别对应的目标位置信息,将所述目标位置信息确定为所述每个位置信息簇所属业务交互对象的待选位置信息;
更新单元,用于获取所述业务交互对象对应的上传位置信息,基于所述待选位置信息,对所述上传位置信息进行更新,得到对象位置信息。
其中,所述装置还包括:
发送模块,用于根据所述对象位置信息,确定与所述业务交互对象相匹配的目标用户,将所述业务交互对象对应的推广信息发送至所述目标用户对应的信息发布平台。
其中,所述发送模块包括:
实时位置获取单元,用于在所述信息发布平台中,获取所有用户的实时位置信息;
目标用户确定单元,用于基于所述实时位置信息与所述对象位置信息,确定与所述业务交互对象相匹配的目标用户。
本申请实施例一方面提供了一种数据处理装置,包括:处理器和存储器;
所述处理器和存储器相连,其中,所述存储器用于存储计算机程序,所述处理器用于调用所述计算机程序,以执行如本申请实施例中一方面中的方法。
本申请实施例一方面提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被处理器执行时,执行如本申请实施例中一方面中的方法。
本申请实施例可以通过获取业务交互数据,并确定与业务交互数据相关联的业务位置信息,通过将业务位置信息划分为多个位置信息簇,并基于业务交互数据确定每个位置信息簇分别对应的业务交互对象,进而可以将每个位置信息簇的目标位置信息确定为所属业务交互对象的对象位置信息。可见,通过获取用户与业务交互对象之间的交互数据,以及与该交互数据相关联的多个业务位置信息,并基于多个业务位置信息计算出业务交互对象对应的对象位置信息,可以提高对象位置信息的准确性。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的一种网络架构示意图;
图2a和图2b是本申请实施例提供的一种数据处理方法的场景示意图;
图3是本申请实施例提供的一种数据处理方法的流程示意图;
图4是本申请实施例提供的另一种数据处理方法的流程示意图;
图5是本申请实施例提供的一种基于密度的聚类算法的流程示意图;
图6是本申请实施例提供的一种商户广告投放的结构示意图;
图7a和图7b是本申请实施例提供的一种推广信息投放的界面示意图;
图8是本申请实施例提供的一种数据处理装置的结构示意图;
图9是本申请实施例提供的另一种数据处理装置的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
媒体广告的普及带动信息发布平台商户广告的发展,信息发布平台商户广告是基于商户区域投放的广告,信息发布平台中的用户可以点击终端设备中显示的商户广告,以查看商户广告的具体内容,用户还可以对商户广告进行点赞或评论。当然,信息发布平台上还可以投放景点宣传、机构宣传等,在此不做限制。
请参见图1,是本申请实施例提供的一种网络架构示意图。该网络架构可以包括服务器200以及多个终端设备(如图1所示,具体包括终端设备100a、终端设备100b以及终端设备100c),服务器200a可以通过网络与每个终端设备进行数据传输。
当用户通过终端设备100a与业务交互对象(如商户)产生交互数据,且该用户在交互数据产生的前后一段时间内(如10分钟),在信息发布平台中发布了携带用户位置信息的发布信息时,服务器200可以获取该用户的发布信息中所携带的用户位置信息。例如,用户在商户购买了商品后,使用终端设备100a进行线下支付,可以产生支付交易数据(即用户与商户之间的交互数据),若用户在支付的前后10分钟内,发表了带有位置的朋友圈(即携带用户位置信息的发布信息),则服务器200可以获取上述用户位置信息。服务器200通过获取与多个商户进行支付交易且在支付的前后10分钟内发表带有位置的朋友圈的所有用户位置信息,确定多个商户分别对应的位置信息。其中,终端设备100a、终端设备100b以及终端设备100c等可以包括手机、平板电脑、笔记本电脑、掌上电脑、移动互联网设备(mobileintemet device,MID)、可穿戴设备(例如智能手表、智能手环等)等。
请参见图2a和图2b,是本申请实施例提供的一种数据处理方法的场景示意图。如图2a所示,以扫码支付场景为例,用户在商户A处购买了商品,或者产生了消费后,用户可以使用终端设备100a中的支付应用,扫描商户A提供的二维码,以向商户A支付该用户本次消费的金额。在用户使用终端设备100a完成支付后,可以产生用户与商户A之间的支付交易数据20a(也可以称为用户与商户A之间的交互数据),并在终端设备100a的终端界面中显示支付交易数据20a。支付交易数据20a可以包括:支付的当前状态(如支付成功的状态)、商品(如商户A订单号:111100)、商户名称(如“商户A”)、支付时间(如“2019-03-0111:09:53”)、支付方式(如储蓄卡)、交易单号(如“4200011401”)以及商户单号(如“0002019203”)等。
服务器200可以从终端设备100a中获取支付交易数据20a,并从支付交易数据20a中确定商户名称和支付时间,基于预先设置的时长(如5分钟等),可以确定与支付时间相关联的时间范围,如预设时长为5分钟,支付时间为2019-03-01 11:09:53,则与支付时间相关联的时间范围为2019-03-01 11:04:53至2019-03-01 11:14:53。服务器200可以从信息发布平台中获取2019-03-01 11:04:53至2019-03-01 11:14:53时间段内,用户发布的带有位置的发布信息20b,该发布信息20b中可以包括:用户名称(如“小A”)、发布内容(如“今天是开心的一天!”和图片信息)、位置信息(如“深圳市南山区华侨城西路侨城西街欢乐谷”或者“经度:113.986511,纬度:22.544577”)以及发布时间(如“2019年3月1日11:07:03”)等。服务器200可以将发布信息20b中携带的位置信息作为业务位置信息进行存储。其中,发布信息20b中所携带的位置信息在终端设备100a的终端界面中可以采用具体地点名称的方式进行显示,在服务器200中存储的形式可以为具体地点名称表示形式,也可以为经纬度的坐标表示形式,在此不做限定。
可以理解的是,对于商户A而言,可以存在多个用户在商户A处购买商品后,使用终端设备中的支付应用进行支付,进而在多个用户与商户A之间产生支付交易数据,因此,服务器可以从信息发布平台中,获取多个用户所发布的带有位置的发布信息,并从发布信息中确定与支付交易数据有关联的业务位置信息。对于多个商户而言,每个商户均可以与上述商户A一样,获取相对应的业务位置信息,进而可以得到与多个商户相关联的业务位置信息。
服务器200可以对获取到的所有业务位置信息进行聚类,得到多个位置信息簇,每个位置信息簇中所包含的业务位置信息可以理解为与某商户相对应的位置信息,即通过计算每个位置信息簇的中心位置,可以确定商户的具体位置信息,如通过对业务位置信息进行聚类,可以得到多个商户对应的位置信息列表20c,如商户A对应的具体位置信息为:经度为113.986511,纬度为22.544577;商户B对应的具体位置信息为:经度为113.436511,纬度为23.344577,商户C对应的具体位置信息为:经度为112.586511,纬度为22.844577等。对所有业务位置信息进行聚类后,可以将属于同一商户的业务位置信息聚类成同一个位置信息簇,并将位置信息簇所对应的中心位置确定为该商户的具体位置信息,如图2b所示,可以将所有业务位置信息聚类为n个位置信息簇,分别表示为位置信息簇1、位置信息簇2、...、位置信息簇n。根据支付交易数据中的商户名称,可以将位置信息簇1所对应的中心位置确定为商户A的具体位置信息,将位置信息簇2所对应的中心位置确定为商户B的具体位置信息,将位置信息簇3所对应的中心位置确定为商户C的具体位置信息等。每个位置信息簇中所包含的所有业务位置信息均可以是与所属商户相关联的位置信息。换言之,每个位置信息簇中所包含的业务位置信息可以理解为以商户所在区域为中心的一系列分散的位置信息。
请参见图3,是本申请实施例提供的一种数据处理方法的流程示意图。如图3所示,该数据处理方法可以包括以下步骤:
步骤S101,获取业务交互数据,确定与所述业务交互数据相关联的业务位置信息;所述业务交互数据包括用户与业务交互对象之间的交互数据;
具体的,服务器(对应于上述图2a所对应实施例中的服务器200)可以获取多个用户与多个业务交互对象之间的交互数据,也可以称为业务交互对象,并从信息发布平台所包含的发布信息中,确定与业务交互数据相关联的业务位置信息。其中,业务交互数据可以包括用户与业务交互对象之间的线下交易数据、聊天数据等,业务交互数据具体可以包括交互双方的名称、交互时间、交互类型等信息,发布信息是指用户在信息发布平台上发布的可供其余终端进行查看阅读的信息,如用户用于分享心情的一段文字、图片等信息,每个发布信息均对应有发布时间。
服务器获取到用户与业务交互对象之间的业务交互数据后,可以确定业务交互数据对应的记录时间戳,服务器还可以从信息发布平台中获取用户对应的发布信息,该发布信息携带用户位置信息,根据记录时间戳确定时间范围,从上述发布信息中,获取上述时间范围内的用户位置信息,作为与业务交互数数相关联的业务位置信息。换言之,服务器通过交互业务数据中的记录时间戳与预设的时长(如5分钟等),可以确定出时间范围,并从用户对应的携带位置信息的发布信息中,获取上述时间范围内的所有用户位置信息,作为业务位置信息。可以理解的是,每个用户与单个业务交互对象所对应的业务交互数据均具有记录时间戳,即可以确定出一个时间范围,因此业务交互数据的记录时间戳是获取业务位置信息的重要考虑因素。
举例来说,假设业务交互对象为商户,业务交互数据为支付交易数据。业务交互数据包括用户1与商户1之间的支付交易数据1,用户2与商户1之间的支付交易数据2,用户3与商户2之间的支付交易数据3,用户4与商户3之间的支付交易数据4,用户5与商户2之间的支付交易数据5等,预设的时长为5分钟,当支付交易数据1对应的记录时间戳为2019年1月20日11:20:00时,支付交易数据1对应的时间范围为2019年1月20日11:15:00至2019年1月20日11:25:00,因此服务器可以在用户1对应的发布信息中,将2019年1月20日11:15:00至2019年1月20日11:25:00时间范围内,该用户1的发布信息中所携带的用户位置信息作为业务位置信息;当支付交易数据2对应的记录时间戳为2019年1月20日17:25:00时,支付交易数据2对应的时间范围为2019年1月20日17:20:00至2019年1月20日17:30:00,因此服务器可以在用户2对应的发布信息中,将2019年1月20日17:20:00至2019年1月20日17:30:00时间范围内,该用户2的发布信息中所携带的用户位置信息作为业务位置信息,以此类推,可以获取业务交互数据中,与每个支付交易数据相关联的业务位置信息。
需要说明的是,同一用户可以与不同的商户产生支付交易数据,同一商户同样也可以与不同的用户产生支付交易数据,每个支付交易数据均对应一个时间范围,该时间范围可以是指支付交易数据的记录时间戳之后的一段时间范围,或者是记录时间戳之前的一段时间范围,或者是记录时间戳前后的一段时间范围,这里不做限定。如支付交易数据1对应的记录时间戳为2019年1月20日11:20:00,且预设时长为5分钟时,支付交易数据1对应的时间范围可以为2019年1月20日11:20:00至2019年1月20日11:25:00,或者为2019年1月20日11:15:00至2019年1月20日11:20:00,或者是2019年1月20日17:20:00至2019年1月20日17:30:00。当然,若服务器在时间范围内未获取到用户携带位置信息的发布信息,则移除该时间范围内的业务位置信息为0,即将该时间范围对应的支付交易数据进行移除。
步骤S102,将所述业务位置信息划分为多个位置信息簇,基于所述业务交互数据确定每个位置信息簇分别对应的业务交互对象;
具体的,服务器在确定了与业务交互数据相关联的所有业务位置信息后,可以将每个业务位置信息表示为经纬度的表示形式,即每个业务位置信息均可以看成是一个数值型的二维数据(包括经度和纬度)。可以基于聚类分析,将所有业务位置信息聚类成多个位置信息簇,即基于每个业务位置信息之间的相似性(可以为欧几里得距离、曼哈顿距离、兰氏距离、切比雪夫距离等),将相似性高的业务位置信息聚类为一个位置信息簇。基于业务交互数据可以确定每个位置信息簇分别对应的业务交互对象,即每个位置信息簇中所包含的业务位置信息可以理解为与同一业务交互对象相关联的位置信息。由于无法预先确定所有业务位置信息对应的位置信息簇的数量,因此可以采用基于密度的聚类算法,对业务位置信息进行聚类。
可以理解的是,业务位置信息是基于业务交互数据所确定的,因此服务器可以建立业务位置信息与业务交互数据之间的联系,因此基于业务交互数据与业务位置信息之间的联系,可以确定每个位置信息簇分别对应的业务交互对象。为保护用户的隐私数据,服务器在使用业务交互数据与发布信息的过程中,可以对业务交互数据与发布信息进行脱敏处理,即将用户个人隐私数据(如银行卡号、身份证号、手机号等)进行数据变形,以确保数据安全。
步骤S103,确定所述每个位置信息簇分别对应的目标位置信息,将所述目标位置信息确定为所属业务交互对象的对象位置信息。
具体的,服务器可以计算每个位置信息簇分别对应的目标位置信息,可以将目标位置信息(目标位置信息可以是指一个位置点,包括经度和纬度,也可以是指一个区域范围)确定为每个位置信息簇所对应的业务交互对象的对象位置信息,即通过对业务位置信息进行聚类,可以将分散的用户位置信息聚类出业务交互对象的对象位置信息。
其中,目标位置信息的确定过程可以包括以下实现方式:
分别计算每个位置信息簇所包含的所有业务位置信息的均值,即计算每个位置信息簇所包含的所有业务位置信息中经度的平均值以及纬度的平均值,并将计算得到的经度平均值和维度平均值作为目标位置信息。当然,若业务位置信息携带权重(如某业务交互数据对应的时间信息为2019年1月20日9:00,与该业务交互数据相关联的发布信息的发布时间同样为2019年1月20日9:00,则该业务位置信息对应的权重可以比较大,即表示该发布信息中携带的业务位置信息对所生成的目标位置信息的影响比较大),则可以基于每个业务位置信息以及每个业务位置信息所携带的权重,确定目标位置信息,使得目标位置信息偏向于权重较大的业务位置信息。或者,
以每个位置信息簇中相隔最远的两个业务位置信息之间的距离为直径,确定每个位置信息簇对应的圆区域,并将圆区域的圆心作为目标位置信息。或者,
基于每个位置信息簇中所包含的业务位置信息之间的距离,确定每个位置信息簇分别对应的范围区间,该范围区间中所包含的业务位置信息可以满足如下条件:每两个业务位置信息之间的距离小于距离阈值(如50米),该范围区间中的业务位置信息的数量大于数量阈值(如10个),可以将该范围区间确定为位置信息簇所对应的目标位置信息,如业务交互对象为一个商场时,则可以将每个位置信息簇分别对应的范围区间确定为商场的对象位置信息。或者,
还可以通过获取上述范围区间内的POI(Point of Interest)数据,将POI数据确定为目标位置信息,此时的目标位置信息可以确定为单个具体商户对应的对象位置信息。其中,POI数据可以是指地理信息系统中的一栋房子,一个商铺等。
为增强业务交互对象的对象位置信息的准确性,服务器可以将每个位置信息簇的目标位置信息确定为所属业务交互对象的待选位置信息,并获取业务交互对象的上传位置信息,基于上述待选位置信息对上传位置信息进行更新,得到对象位置信息。上传位置信息可以是指业务交互对象主动输入的位置信息,可能存在输入错误、输入范围过大的问题,因此可以将聚类得到的待选位置信息对业务交互对象主动输入的上传位置信息进行修改或补充,得到业务交互对象最终的对象位置信息,即有效的位置信息。
本申请实施例可以通过获取业务交互数据,并确定与业务交互数据相关联的业务位置信息,通过将业务位置信息划分为多个位置信息簇,并基于业务交互数据确定每个位置信息簇分别对应的业务交互对象,进而可以将每个位置信息簇的目标位置信息确定为所属业务交互对象的对象位置信息。可见,通过获取用户与业务交互对象之间的交互数据,以及与该交互数据相关联的多个业务位置信息,并基于多个业务位置信息计算出业务交互对象对应的对象位置信息,可以提高对象位置信息的准确性。
请参见图4,是本申请实施例提供的另一种数据处理方法的流程示意图。如图4所示,该数据处理方法可以包括以下步骤:
步骤S201,获取业务交互数据,确定与所述业务交互数据相关联的业务位置信息;所述业务交互数据包括用户与业务交互对象之间的交互数据;
其中,步骤S201的具体实现方式可以参见上述图3所对应实施例中对步骤S101的描述,这里不再进行赘述。
步骤S202,获取密度选择参数;所述密度选择参数包括距离参数和数量参数;
为了将业务位置信息聚类为多个位置信息簇,可以采用基于密度的聚类算法对业务位置信息进行聚类,下述步骤S202-步骤S205将以DBSCAN(Density-Based SpatialClustering of Applications with Noise,具有噪声的基于密度的聚类方法)为例,对业务位置信息的聚类过程进行具体说明。其中,DBSCAN是一种基于密度的空间聚类算法,该DBSCAN算法可以将具有足够密度的区域划分为簇,并在具有噪声的空间数据库中发现任意形状的簇,在该算法中,可以将簇定义为密度相连的点的最大集合。
具体的,采用DBSCAN算法对业务位置信息进行聚类,服务器首先需要获取密度选择参数,即获取距离参数和数量参数。距离参数可以用于约束每个业务位置信息的邻域范围,数量参数可以用于约束邻域中所包含的业务位置信息的数量。
步骤S203,从所述业务位置信息中选择位置信息Pi,根据所述距离参数,生成所述位置信息Pi对应的邻域Ni
具体的,服务器可以将所有业务位置信息标记为未访问状态,也可以称为未处理状态,从所有业务位置信息中选择任意一个位置信息Pi,并根据距离参数,生成位置信息Pi所对应的邻域Ni。其中,i小于或等于n,i和n均为自然数,n为业务位置信息的总数量;邻域Ni可以理解为以位置信息Pi为圆心,距离参数为半径的圆所在的区域。
步骤S204,若所述邻域Ni中所包含的业务位置信息的数量大于或等于所述数量参数,则确定所述位置信息Pi满足核心点条件,并将所述邻域Ni中所包含的业务位置信息确定为待处理簇Ck
具体的,若邻域Ni中所包含的业务位置信息的数量大于或等于数量参数,则可以确定位置信息Pi满足核心点(Core point)条件,即可以将位置信息Pi确定为核心点,并将领域Ni中所包含的所有业务位置信息确定为待处理簇Ck,k为自然数,可以表示为待处理簇的数量。
若邻域Ni中所包含的业务位置信息的数量小于数量参数,则可以确定位置信息Pi不满足核心点条件,即可以将位置信息Pi标记为边界点(Border point)或者噪声点(Noise),并重新从业务位置信息中选择一个位置信息Pj(位置信息Pj可以理解为所有业务位置信息中除位置信息Pi之外的任意一个位置信息,j为自然数,且j不等于i),并生成位置信息Pj对应的邻域,以此来判断位置信息Pj是否满足核心点条件,若位置信息Pj仍不满足核心点条件,则再次从业务位置信息中选择位置信息,直至选择的位置信息满足核心点条件,确定出待处理簇Ck
举例来说,距离参数为3,数量参数为5,若位置信息Pi对应的邻域Ni中所包含的业务位置信息的数量为6,则位置信息Pi为核心点;若位置信息Pi对应的邻域Ni中所包含的业务位置信息的数量为3,则位置信息Pi不满足核心点条件,位置信息Pi可能为边界点,也可能为噪音点。
可选的,服务器可以先基于距离参数和数量参数,将所有业务位置信息分为核心点、边界点以及噪声点三类。换言之,可以根据距离参数生成每个业务位置信息分别对应的邻域,即以每个业务位置信息为圆心,距离参数为半径,生成大小一样的圆。将每个邻域所包含的业务位置信息的数量与数量参数进行比较,以判断业务位置信息是否为核心点。例如,距离参数为m,数量参数为n,当业务位置信息x的邻域内至少包含了n个业务位置信息,即Nm(x)≥n时,将业务位置信息x标记为核心点;当业务位置信息x的邻域内包含的业务位置信息的数量小于n,但业务位置信息x在其他核心点的邻域内,即Nm(x)<n且x∈Nm(y)时,将业务位置信息x标记为边界点;将既不是核心点也不是边界点的业务位置信息标记为噪音点,噪音点在聚类过程中可以进行舍弃,即可以将噪音点理解为没有任何参考价值的位置信息。其中,Nm(x)表示以业务位置信息x为圆心,m为半径的圆所在区域中所包含的业务位置信息的数量,Nm(y)表示以业务位置信息y为圆心,m为半径的圆所在区域中所包含的业务位置信息的数量。
将所有业务位置信息划分为核心点、边界点以及噪音点后,从所有核心点中选择任意未访问的核心点,并将该核心点的邻域中所包含的所有业务位置信息作为待处理簇Ck
步骤S205,若所述邻域Ni中存在满足核心点条件的位置信息Pi+1,确定所述位置信息Pi+1对应的待处理簇Ck+1,将所述待处理簇Ck+1与所述待处理簇Ck进行合并,直至不存在与合并后的待处理簇进行合并的待处理簇时,将所述合并后的待处理簇确定为位置信息簇;
具体的,服务器可以从待处理簇Ck中选择任意一个除位置信息Pi之外的位置信息Pi+1,若检测到位置信息Pi+1对应的状态信息为未访问状态,则基于距离参数生成位置信息Pi+1对应的邻域Ni+1;若邻域Ni+1中所包含的业务位置信息的数量大于或等于数量参数,则确定位置信息Pi+1满足核心点条件,即位置信息Pi+1为核心点,可以将邻域Ni+1中所包含的业务位置信息确定为待处理簇Ck+1,并将待处理簇Ck+1与待处理簇Ck进行合并,得到合并后的待处理簇C’k。此时,合并后的待处理簇C’k所包含的业务位置信息即为位置信息Pj和位置信息Pi+1对应邻域中所包含的业务位置信息。
若检测到位置信息Pi+1对应的状态信息为已访问状态,且位置信息Pi+1已经具有所属的位置信息簇,则将位置信息Pi+1从待处理簇Ck中删除,得到更新后的待处理簇C’k
服务器可以从合并后的待处理簇C’k中,选择任意一个除位置信息Pi和位置信息Pi+1之外的位置信息,并重复执行上述过程,直至不存在与合并后的待处理簇C’k进行合并的待处理簇时,可以将最终得到的合并后的待处理簇确定为位置信息簇。可以理解的是,所有业务位置信息中,除了属于噪音点的业务位置信息之外,剩余的每个业务位置信息均有唯一对应的位置信息簇。
可选的,在实际应用中,业务位置信息的数量可能是非常庞大的,甚至是上亿的数据量,而使用DBSCAN算法,需要计算每两个业务位置信息之间的相似性(即距离),计算量是非常巨大的。因此,可以引入数据先验信息,对业务位置信息进行预划分,在预划分的集合中再使用DBSCAN算法进行聚类。
服务器可以获取每个业务位置信息对应的标签信息,基于标签信息,将所有业务位置信息划分为多个预划分集合,每个预划分集合中所包含的业务位置信息具有相同的标签信息;分别对每个预划分集合中所包含的业务位置信息进行聚类,得到每个预划分集合分别对应的位置信息簇。将所有预划分集合对应的位置信息簇确定为所有业务位置信息对应的位置信息簇。
其中,标签信息可以是指人为根据数据先验信息为业务位置信息打上的标签,数据先验信息可以是指在获取业务位置信息之前,获得的经验和历史资料,数据先验信息需要满足以下条件:数据先验信息所对应维度的每一种取值,能够唯一确定一个预划分集合;数据先验信息所对应维度的不同取值,划分的不同预划分集合之间没有交集;数据先验信息所对应维度的所有取值划分的所有预划分集合,能覆盖所有数据;数据先验信息所对应维度的不同取值,能基本保持数据均衡,不会使得数据过于倾斜。以位置信息聚类为例,位置信息的先验信息可以包括国家、省份以及城市等,若以城市作为先验信息对应的维度,则每一个不同的城市值,能够唯一确定一个预划分集合,不同的城市值对应预划分集合之间不会存在交集,根据城市值划分的所有预划分集合,能够覆盖所有的位置信息,以城市作为粒度,数据的分布是基本均衡的,不会造成数据倾斜。因此,以城市作为先验信息的情形下,可以为每个业务位置信息设置不同城市值对应的标签信息,如使用数值“1”作为深圳的标签,则可以为深圳区域内的所有业务位置信息均打上数值“1”作为标签信息。
在为每个业务位置信息设置了标签信息后,服务器可以通过获取每个业务位置信息分别对应的标签信息,将具有同样标签信息的业务位置信息划分为同一个预划分集合,进而将所有业务位置信息划分为多个预划分集合。在每个预划分集合中,采用DBSCAN算法分别进行聚类,具体的聚类过程可以参见上述步骤S202-步骤S205,这里不再进行赘述。例如,业务位置信息的数量为100000,通过标签信息将100000个业务位置信息划分为10个预划分集合,在上述10个预划分集合中分别使用DBSCAN算法进行聚类,得到10个预划分集合分别对应的位置信息簇。
请一并参见图5,是本申请实施例提供的一种基于密度的聚类算法的流程示意图。整个DBSCAN算法的具体流程如图5所示:
S301,输入数据集X;
具体的,服务器可以将获取到的所有业务位置信息作为数据集X,由于业务位置信息可以用经度和纬度来表示,因此每个业务位置信息可以看成是一个具有坐标信息的点(下述业务位置信息均以点进行描述)。
S302,选择未访问点p,并生成领域N;
具体的,可以从数据集X中任意选择一个未访问的点p,即还没有进行分类的业务位置信息,并基于距离参数,生成点p对应的邻域N。
S303,判断点p是否为核心点;
具体的,确定邻域N中所包含的点的数量,并与数量参数进行比较,以判断点p是否为核心点。若邻域N中所包含的点的数量大于或等于数量参数,则执行步骤S305;否则,执行步骤S304。
S304,标记为噪音点或者边界点;
具体的,当点p不是核心点时,可以将点p标记为噪音点或者边界点,点p为噪音点时,表示点p在聚类过程中是一个无效的数据。
S305,点p加入新簇C;
具体的,当点p为核心点时,可以将点p添加至新的簇C(对应于上述待处理簇Ck)中。
S306,N中任意选一未分类的点q;
具体的,从邻域N中任意选择一个未分类的点q。
S307,判断点q是否被访问过;
具体的,选择出点q后,可以判断点q是否被访问过,即判断点q是否为未处理的点。若检测到点q已经被访问过,则执行步骤S308;否则,执行步骤S311。
S308,判断点q是否无类别;
具体的,当检测到点q已经被访问过时,可以进一步判断点q是否已经具有所属的类别。若点q已经具有所属的类别,即点q属于某一个簇,则执行步骤S309,否则,执行步骤S310。
S309,点q不再加入簇C;
具体的,当检测到点q已经具有所属的类别时,则点q不再添加至簇C。
S310,点q为边界点,加入簇C;
具体的,当检测到点q还没有所属的类别,即点q还没有被划分到其他的簇中时,可以确定点q为边界点,并将点q添加至簇C。
S311,计算点q的邻域Q;
具体的,当检测到点q没有被访问过时,可以基于距离参数生成点q对应的邻域Q。
S312,判断点q是否为核心点;
具体的,确定邻域Q中所包含的点的数量,并与数量参数进行比较,以判断点q是否为核心点。若邻域Q中所包含的点的数量大于或等于数量参数,则执行步骤S313;否则,执行步骤S308。
S313,N=N+Q,点q加入簇C;
具体的,当点q为核心点时,可以基于N=N+Q(这里的“=”表示赋值符号),将邻域N与邻域Q进行合并,并将合并后的邻域对初始的邻域N进行替换,并将点q添加至簇C中。
S314,判断N中是否有未分类点;
具体的,完成点q的分类后,可以执行一次判断,判断替换后的邻域N中是否存在未分类的点,若存在,则继续执行步骤S306-步骤S313,直至不断替换后的邻域N中不存在未分类的点。此时的簇C即为聚类完成后得到的位置信息簇。
S315,判断X中是否有未分类点;
具体的,当最终检测到邻域N中不存在未分类的点时,可以判断数据集X中是否存在未分类的点,若存在,则继续执行步骤S302-步骤S314,即开始下一个新簇的聚类过程;若不存在,则表示已经完成数据集X中所有数据的聚类过程,可以输出最终的聚类结果,该聚类结果包括数据集X对应的簇的个数,以及每个簇所包含的点。
步骤S206,基于所述业务交互数据确定每个位置信息簇分别对应的业务交互对象;
步骤S207,确定所述每个位置信息簇分别对应的目标位置信息,将所述目标位置信息确定为所属业务交互对象的对象位置信息;
其中,步骤S207-步骤S207的具体实现方式可以参见上述图3所对应实施例中对步骤S102-步骤S103的描述,这里不再进行赘述。
步骤S208,根据所述对象位置信息,确定与所述业务交互对象相匹配的目标用户,将所述业务交互对象对应的推广信息发送至所述目标用户对应的信息发布平台。
具体的,在信息发布平台中,服务器获取所有用户的实时位置信息,基于实时位置信息与对象位置信息,确定与业务交互对象相匹配的目标用户。换言之,可以通过用户与业务交互对象之间的距离,确定与业务交互对象相匹配的目标用户,当获取到某用户的终端设备的实时位置信息与对象位置信息之间的距离小于距离阈值(如1千米)时,将该用户确定为与该对象位置信息所属业务交互对象相匹配的目标用户,并将该业务交互对象对应的推广信息发送至该目标用户对应的信息发布平台。
可选的,服务器还可以从信息发布平台中获取用户的历史发布信息,并基于历史发布信息确定用户的兴趣爱好,进而兴趣爱好与业务交互对象相匹配的用户确定为该业务交互对象对应的目标用户,并将该业务交互对象对应的推广信息发送至目标用户对应的信息发布平台。例如,用户A经常在信息发布平台中分享美食,则服务器基于用户A的历史发布信息,可以确定用户A对美食感兴趣,因此,服务器可以将该用户A确定为关于美食的业务交互对象(如餐馆)的目标用户,并将业务交互对象的美食推广信息发送至用户A的信息发布平台。当然,服务器还可以结合用户与业务交互对象之间的距离,以及用户的兴趣爱好,确定与业务交互对象相匹配的目标用户,即当用户的兴趣爱好与用户的实时位置信息均与业务交互对象相匹配时,将该用户确定为业务交互对象的目标用户。可以理解的是,同一用户可以作为不同业务交互对象对应的目标用户。
请一并参见图6,是本申请实施例提供的一种商户广告投放的结构示意图。以业务交互对象为商户为例,对信息发布平台中的商户广告(也可以称为推广信息)的投放过程进行具体说明。如图6所示,商户广告的可以包括以下交互过程:
数据预处理模块60a可以用于对获取到的业务交互数据与发布信息进行预处理,得到业务位置信息。通过用户与商户之间的业务交互数据中的记录时间戳,获取与业务交互数据相关联的业务位置信息,具体实现过程可以参见上述图3所对应实施例中的步骤S101,这里不再进行赘述。服务器还可以将明显存在异常的位置信息进行排除,如业务交互数据中的商户为商户1深圳店,而与该商店相关联的业务位置信息对应的经纬度在美国地区,则可以将该业务位置信息确定为异常位置信息,并将该业务位置信息删除。因此,经过数据预处理模块60a后,可以得到有效的业务位置信息。
商户位置聚类模块60b可以采用DBSCAN算法对数据预处理模块60a得到的业务位置信息进行聚类,进而确定出商户的门店位置(也可以称为对象位置信息)。具体的聚类过程可以参见上述图4所对应实施例中的步骤S202-步骤S205,或者上述图5所对应的实施例,这里不再进行赘述。服务器可以将聚类得到的每个位置信息簇的中心位置确定为商户门店位置。
商户填写位置信息60c是指商户若与信息发布平台签订协议(即信息发布平台允许商户在该平台上投放广告的协议)后,商户可以在信息发布平台提供的信息输入页面中主动填写商户的位置信息,在商户完成商户位置的填写后,服务器可以获取商户填写的位置信息(也可以称为上传位置信息)。商户填写的位置信息可能存在区域范围过大,或者填写不准确的问题。
有效商户位置数据60d是指采用DBSCAN算法聚类得到的商户门店位置对商户填写的位置信息进行补充和修正,得到的有效商户位置信息。
广告投放模块60e用于根据有效商户位置信息和广告推荐模型,得到与商户相匹配的目标用户,并将商户的广告投放到目标用户的信息发布平台中。
请一并参见图7a-图7b,是本申请实施例提供的一种推广信息投放的界面示意图。当确定了商户的对象位置信息,即商户位置信息后,服务器可以基于用户的兴趣爱好或者距离,确定与商户相匹配的目标用户。若服务器通过对信息发布平台(如朋友圈)中获取的用户历史发布信息进行统计分析,得到某用户偏爱各种乐器(如该用户经常在朋友圈分享乐器的知识,或者学习乐器的心得),且获取到该用户的实时位置信息与“乐器俱乐部”的商户位置信息的距离处于某设定范围之内(如2千米)时,可以将该用户确定为“乐器俱乐部”的目标用户,并在该用户的朋友圈中投放“乐器俱乐部”的推广信息,也可以称为商业广告信息。如图7a所示,“乐器俱乐部”的推广信息70b可以在该用户对应的终端设备70a的朋友圈中进行显示,该推广信息根据投放的时间,在该用户的朋友圈中进行排列显示。“乐器俱乐部”的推广信息70b可以包括:商户名称(即“乐器俱乐部”)、地点(如深圳)、推广口号(如“业务时间,学习一项才艺”)以及宣传图片等信息。该用户可以通过点击推广信息70b,查看“乐器俱乐部”的详情信息,用户还可以对“乐器俱乐部”进行评论或点赞。
以业务交互对象为景点为例,服务器通过获取各个景点的对象位置信息,基于用户的实时位置信息,可以为景点确定相匹配的目标用户。如图7b所示,当用户为景点“圆明园”对应的目标用户时,可以在该用户对应的终端设备70c的朋友圈中显示景点推广信息70d,在推广信息70d中可以包括景点名称(如“圆明园”)、景点地点(如北京)、推广口号(如“铭记圆明历史,展望未来!”)以及景点宣传图片等信息。该用户可以通过点击推广信息70d,查看“圆明园”的详情介绍信息。
本申请实施例可以通过获取业务交互数据,并确定与业务交互数据相关联的业务位置信息,通过将业务位置信息划分为多个位置信息簇,并基于业务交互数据确定每个位置信息簇分别对应的业务交互对象,进而可以将每个位置信息簇的目标位置信息确定为所属业务交互对象的对象位置信息。可见,通过获取用户与业务交互对象之间的交互数据,以及与该交互数据相关联的多个业务位置信息,并基于多个业务位置信息计算出业务交互对象对应的对象位置信息,可以提高对象位置信息的准确性,进而提高商户推广信息投放的准确率。
请参见图8,是本申请实施例提供的一种数据处理装置的结构示意图。如图8所示,该数据处理装置1可以包括获取模块11,划分模块12,确定模块13;
获取模块11,用于获取业务交互数据,确定与所述业务交互数据相关联的业务位置信息;所述业务交互数据包括用户与业务交互对象之间的交互数据;
划分模块12,用于将所述业务位置信息划分为多个位置信息簇,基于所述业务交互数据确定每个位置信息簇分别对应的业务交互对象;
确定模块13,用于确定所述每个位置信息簇分别对应的目标位置信息,将所述目标位置信息确定为所属业务交互对象的对象位置信息。
其中,获取模块11,划分模块12,确定模块13的具体功能实现方式可以参见上述图3所对应实施例中的步骤S101-步骤S103,这里不再进行赘述。
请一并参见图8,该数据处理装置1还可以包括:生成模块14,判断模块15,删除模块16,发送模块17;
生成模块14,用于从所述邻域Ni中选择位置信息Pi+1,若检测到所述位置信息Pi+1对应的状态信息为未访问状态,则基于所述距离参数生成所述位置信息Pi+1对应的邻域Ni+1
判断模块15,用于若所述邻域Ni+1中所包含的业务位置信息的数量大于或等于所述数量参数,则确定所述位置信息Pi+1满足核心点条件
删除模块16,用于从所述邻域Ni中选择位置信息Pi+1,若检测到所述位置信息Pi+1对应的状态信息为已访问状态,且所述位置信息Pi+1具有所属的位置信息簇,则将所述位置信息Pi+1从所述待处理簇Ck中删除;
发送模块17,用于根据所述对象位置信息,确定与所述业务交互对象相匹配的目标用户,将所述业务交互对象对应的推广信息发送至所述目标用户对应的信息发布平台。
其中,生成模块14,判断模块15,删除模块16的具体功能实现方式可以参见上述图4所对应实施例中的步骤S205,第二响应模块16,发送模块17的具体功能实现方式可以参见上述图4所对应实施例中的步骤S208,这里不再进行赘述。
请一并参见图8,获取模块11可以包括:交互数据获取单元111,发布信息获取单元112,位置信息获取单元113;
交互数据获取单元111,用于获取用户与所述业务交互对象之间的业务交互数据,确定所述业务交互数据对应的记录时间戳;
发布信息获取单元112,用于从信息发布平台中获取所述用户对应的发布信息;所述发布信息携带用户位置信息;
位置信息获取单元113,用于根据所述记录时间戳确定时间范围,从所述发布信息中,获取在所述时间范围内的用户位置信息,作为与所述业务交互数据相关联的业务位置信息。
其中,交互数据获取单元111,发布信息获取单元112,位置信息获取单元113的具体功能实现方式可以参见上述图3所对应实施例中的步骤S101,这里不再进行赘述。
请一并参见图8,划分模块12可以包括:集合划分单元121,聚类单元122,参数获取单元123,邻域生成单元124,核心点判断单元125,合并单元126;
集合划分单元121,用于获取所述业务位置信息对应的标签信息,基于所述标签信息,将所述业务位置信息划分为多个预划分集合;每个预划分集合中所包含的业务位置信息具有相同的标签信息;
聚类单元122,用于分别对所述每个预划分集合中所包含的业务位置信息进行聚类,得到所述每个预划分集合分别对应的位置信息簇;
参数获取单元123,用于获取密度选择参数;所述密度选择参数包括距离参数和数量参数;
邻域生成单元124,用于从所述业务位置信息中选择位置信息Pi,根据所述距离参数,生成所述位置信息Pi对应的邻域Ni;i小于或等于n,i和n均为自然数,所述n为所述业务位置信息的数量;
核心点判断单元125,用于若所述邻域Ni中所包含的业务位置信息的数量大于或等于所述数量参数,则确定所述位置信息Pi满足核心点条件,并将所述邻域Ni中所包含的业务位置信息确定为待处理簇Ck;k为自然数,所述k为待处理簇的数量;
合并单元126,用于若所述邻域Ni中存在满足核心点条件的位置信息Pi+1,确定所述位置信息Pi+1对应的待处理簇Ck+1,将所述待处理簇Ck+1与所述待处理簇Ck进行合并,直至不存在与合并后的待处理簇进行合并的待处理簇时,将所述合并后的待处理簇确定为位置信息簇。
其中,集合划分单元121,聚类单元122,参数获取单元123,邻域生成单元124,核心点判断单元125,合并单元126的具体功能实现方式可以参见上述图4所对应实施例中的步骤S202-步骤S205,这里不再进行赘述。
请一并参见图8,确定模块13可以包括:中心位置确定单元131,更新单元132;
中心位置确定单元131,用于确定所述每个位置信息簇分别对应的目标位置信息,将所述目标位置信息确定为所述每个位置信息簇所属业务交互对象的待选位置信息;
更新单元132,用于获取所述业务交互对象对应的上传位置信息,基于所述待选位置信息,对所述上传位置信息进行更新,得到对象位置信息。
其中,中心位置确定单元131,更新单元132的具体功能实现方式可以参见上述图3所对应实施例中的步骤S103,这里不再进行赘述。
请一并参见图8,发送模块17可以包括:实时位置获取单元171,目标用户确定单元172;
实时位置获取单元171,用于在所述信息发布平台中,获取所有用户的实时位置信息;
目标用户确定单元172,用于基于所述实时位置信息与所述对象位置信息,确定与所述业务交互对象相匹配的目标用户。
其中,实时位置获取单元171,目标用户确定单元172的具体功能实现方式可以参见上述图4所对应实施例中的步骤S208,这里不再进行赘述。
本申请实施例可以通过获取业务交互数据,并确定与业务交互数据相关联的业务位置信息,通过将业务位置信息划分为多个位置信息簇,并基于业务交互数据确定每个位置信息簇分别对应的业务交互对象,进而可以将每个位置信息簇的目标位置信息确定为所属业务交互对象的对象位置信息。可见,通过获取用户与业务交互对象之间的交互数据,以及与该交互数据相关联的多个业务位置信息,并基于多个业务位置信息计算出业务交互对象对应的对象位置信息,可以提高对象位置信息的准确性,进而提高商户推广信息投放的准确率。
请参见图9,是本申请实施例提供的另一种数据处理装置的结构示意图。如图9所示,该数据处理装置1000可以包括:处理器1001,网络接口1004和存储器1005,此外,上述数据处理装置1000还可以包括:用户接口1003,和至少一个通信总线1002。其中,通信总线1002用于实现这些组件之间的连接通信。其中,用户接口1003可以包括显示屏(Display)、键盘(Keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器1004可以是高速RAM存储器,也可以是非不稳定的存储器(non-volatile memory),例如至少一个磁盘存储器。存储器1005可选的还可以是至少一个位于远离前述处理器1001的存储装置。如图9所示,作为一种计算机可读存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及设备控制应用程序。
在如图9所示的数据处理装置1000中,网络接口1004可提供网络通讯功能;而用户接口1003主要用于为用户提供输入的接口;而处理器1001可以用于调用存储器1005中存储的设备控制应用程序,以实现:
获取业务交互数据,确定与所述业务交互数据相关联的业务位置信息;所述业务交互数据包括用户与业务交互对象之间的交互数据;
将所述业务位置信息划分为多个位置信息簇,基于所述业务交互数据确定每个位置信息簇分别对应的业务交互对象;
确定所述每个位置信息簇分别对应的目标位置信息,将所述目标位置信息确定为所属业务交互对象的对象位置信息。
应当理解,本申请实施例中所描述的数据处理装置1000可执行前文图3、图4任一个所对应实施例中对所述数据处理方法的描述,也可执行前文图8所对应实施例中对所述数据处理装置1的描述,在此不再赘述。另外,对采用相同方法的有益效果描述,也不再进行赘述。
此外,这里需要指出的是:本申请实施例还提供了一种计算机可读存储介质,且所述计算机可读存储介质中存储有前文提及的数据处理装置1所执行的计算机程序,且所述计算机程序包括程序指令,当所述处理器执行所述程序指令时,能够执行前文图3、图4任一个所对应实施例中对所述数据处理方法的描述,因此,这里将不再进行赘述。另外,对采用相同方法的有益效果描述,也不再进行赘述。对于本申请所涉及的计算机可读存储介质实施例中未披露的技术细节,请参照本申请方法实施例的描述。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储存储器(Read-Only Memory,ROM)或随机存储存储器(RandomAccessMemory,RAM)等。
以上所揭露的仅为本申请较佳实施例而已,当然不能以此来限定本申请之权利范围,因此依本申请权利要求所作的等同变化,仍属本申请所涵盖的范围。

Claims (15)

1.一种数据处理方法,其特征在于,包括:
获取业务交互数据,确定与所述业务交互数据相关联的业务位置信息;所述业务交互数据包括用户与业务交互对象之间的交互数据;
将所述业务位置信息划分为多个位置信息簇,基于所述业务交互数据确定每个位置信息簇分别对应的业务交互对象;
确定所述每个位置信息簇分别对应的目标位置信息,将所述目标位置信息确定为所属业务交互对象的对象位置信息。
2.根据权利要求1所述的方法,其特征在于,所述获取业务交互数据,确定与所述业务交互数据相关联的业务位置信息,包括:
获取用户与所述业务交互对象之间的业务交互数据,确定所述业务交互数据对应的记录时间戳;
从信息发布平台中获取所述用户对应的发布信息;所述发布信息携带用户位置信息;
根据所述记录时间戳确定时间范围,从所述发布信息中,获取在所述时间范围内的用户位置信息,作为与所述业务交互数据相关联的业务位置信息。
3.根据权利要求1所述的方法,其特征在于,所述将所述业务位置信息划分为多个位置信息簇,包括:
获取所述业务位置信息对应的标签信息,基于所述标签信息,将所述业务位置信息划分为多个预划分集合;每个预划分集合中所包含的业务位置信息具有相同的标签信息;
分别对所述每个预划分集合中所包含的业务位置信息进行聚类,得到所述每个预划分集合分别对应的位置信息簇。
4.根据权利要求1所述的方法,其特征在于,所述将所述业务位置信息划分为多个位置信息簇,包括:
获取密度选择参数;所述密度选择参数包括距离参数和数量参数;
从所述业务位置信息中选择位置信息Pi,根据所述距离参数,生成所述位置信息Pi对应的邻域Ni;i小于或等于n,i和n均为自然数,所述n为所述业务位置信息的数量;
若所述邻域Ni中所包含的业务位置信息的数量大于或等于所述数量参数,则确定所述位置信息Pi满足核心点条件,并将所述邻域Ni中所包含的业务位置信息确定为待处理簇Ck;k为自然数,所述k为待处理簇的数量;
若所述邻域Ni中存在满足核心点条件的位置信息Pi+1,确定所述位置信息Pi+1对应的待处理簇Ck+1,将所述待处理簇Ck+1与所述待处理簇Ck进行合并,直至不存在与合并后的待处理簇进行合并的待处理簇时,将所述合并后的待处理簇确定为位置信息簇。
5.根据权利要4所述的方法,其特征在于,还包括:
从所述邻域Ni中选择位置信息Pi+1,若检测到所述位置信息Pi+1对应的状态信息为未访问状态,则基于所述距离参数生成所述位置信息Pi+1对应的邻域Ni+1
若所述邻域Ni+1中所包含的业务位置信息的数量大于或等于所述数量参数,则确定所述位置信息Pi+1满足核心点条件。
6.根据所述权利要求4所述的方法,其特征在于,还包括:
从所述邻域Ni中选择位置信息Pi+1,若检测到所述位置信息Pi+1对应的状态信息为已访问状态,且所述位置信息Pi+1具有所属的位置信息簇,则将所述位置信息Pi+1从所述待处理簇Ck中删除。
7.根据权利要求1所述的方法,其特征在于,所述确定所述每个位置信息簇分别对应的目标位置信息,将所述目标位置信息确定为所属业务交互对象的对象位置信息,包括:
确定所述每个位置信息簇分别对应的目标位置信息,将所述目标位置信息确定为所述每个位置信息簇所属业务交互对象的待选位置信息;
获取所述业务交互对象对应的上传位置信息,基于所述待选位置信息,对所述上传位置信息进行更新,得到对象位置信息。
8.根据权利要求1所述的方法,其特征在于,还包括:
根据所述对象位置信息,确定与所述业务交互对象相匹配的目标用户,将所述业务交互对象对应的推广信息发送至所述目标用户对应的信息发布平台。
9.根据权利要求8所述的方法,其特征在于,所述根据所述对象位置信息,确定与所述业务交互对象相匹配的目标用户,包括:
在所述信息发布平台中,获取所有用户的实时位置信息;
基于所述实时位置信息与所述对象位置信息,确定与所述业务交互对象相匹配的目标用户。
10.一种数据处理装置,其特征在于,包括:
获取模块,用于获取业务交互数据,确定与所述业务交互数据相关联的业务位置信息;所述业务交互数据包括用户与业务交互对象之间的交互数据;
划分模块,用于将所述业务位置信息划分为多个位置信息簇,基于所述业务交互数据确定每个位置信息簇分别对应的业务交互对象;
确定模块,用于确定所述每个位置信息簇分别对应的目标位置信息,将所述目标位置信息确定为所属业务交互对象的对象位置信息。
11.根据权利要求10所述的装置,其特征在于,所述获取模块包括:
交互数据获取单元,用于获取用户与所述业务交互对象之间的业务交互数据,确定所述业务交互数据对应的记录时间戳;
发布信息获取单元,用于从信息发布平台中获取所述用户对应的发布信息;所述发布信息携带用户位置信息;
位置信息获取单元,用于根据所述记录时间戳确定时间范围,从所述发布信息中,获取在所述时间范围内的用户位置信息,作为与所述业务交互数据相关联的业务位置信息。
12.根据权利要求10所述的装置,其特征在于,所述划分模块包括:
集合划分单元,用于获取所述业务位置信息对应的标签信息,基于所述标签信息,将所述业务位置信息划分为多个预划分集合;每个预划分集合中所包含的业务位置信息具有相同的标签信息;
聚类单元,用于分别对所述每个预划分集合中所包含的业务位置信息进行聚类,得到所述每个预划分集合分别对应的位置信息簇。
13.根据权利要求10所述的装置,其特征在于,所述确定模块包括:
中心位置确定单元,用于确定所述每个位置信息簇分别对应的目标位置信息,将所述目标位置信息确定为所述每个位置信息簇所属业务交互对象的待选位置信息;
更新单元,用于获取所述业务交互对象对应的上传位置信息,基于所述待选位置信息,对所述上传位置信息进行更新,得到对象位置信息。
14.一种数据处理装置,其特征在于,包括:处理器和存储器;
所述处理器和存储器相连,其中,所述存储器用于存储计算机程序,所述处理器用于调用所述计算机程序,以执行如权利要求1-9任一项所述的方法。
15.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被处理器执行时,执行如权利要求1-9任一项所述的方法。
CN201910749875.4A 2019-08-14 2019-08-14 一种数据处理方法、装置以及可读存储介质 Active CN112396441B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910749875.4A CN112396441B (zh) 2019-08-14 2019-08-14 一种数据处理方法、装置以及可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910749875.4A CN112396441B (zh) 2019-08-14 2019-08-14 一种数据处理方法、装置以及可读存储介质

Publications (2)

Publication Number Publication Date
CN112396441A true CN112396441A (zh) 2021-02-23
CN112396441B CN112396441B (zh) 2023-08-22

Family

ID=74601426

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910749875.4A Active CN112396441B (zh) 2019-08-14 2019-08-14 一种数据处理方法、装置以及可读存储介质

Country Status (1)

Country Link
CN (1) CN112396441B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023070423A1 (zh) * 2021-10-28 2023-05-04 京东方科技集团股份有限公司 数据同步方法和电子设备

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120233000A1 (en) * 2011-03-07 2012-09-13 Jon Fisher Systems and methods for analytic data gathering from image providers at an event or geographic location
EP2575085A1 (en) * 2011-09-30 2013-04-03 Fundacion Universidad San Jorge System, method and product for managing interactions of a person with objects
CN103198135A (zh) * 2013-04-12 2013-07-10 武汉大学 一种地理区域格网划分的微博签到数据在线获取方法
CN105183870A (zh) * 2015-09-17 2015-12-23 武汉大学 一种利用微博位置信息的城市功能区探测方法及系统
CN106021508A (zh) * 2016-05-23 2016-10-12 武汉大学 基于社交媒体的突发事件应急信息挖掘方法
CN106547894A (zh) * 2016-11-03 2017-03-29 浙江夏农信息技术有限公司 基于移动通信信令大数据挖掘职住位置标签的系统及方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120233000A1 (en) * 2011-03-07 2012-09-13 Jon Fisher Systems and methods for analytic data gathering from image providers at an event or geographic location
EP2575085A1 (en) * 2011-09-30 2013-04-03 Fundacion Universidad San Jorge System, method and product for managing interactions of a person with objects
CN103198135A (zh) * 2013-04-12 2013-07-10 武汉大学 一种地理区域格网划分的微博签到数据在线获取方法
CN105183870A (zh) * 2015-09-17 2015-12-23 武汉大学 一种利用微博位置信息的城市功能区探测方法及系统
CN106021508A (zh) * 2016-05-23 2016-10-12 武汉大学 基于社交媒体的突发事件应急信息挖掘方法
CN106547894A (zh) * 2016-11-03 2017-03-29 浙江夏农信息技术有限公司 基于移动通信信令大数据挖掘职住位置标签的系统及方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023070423A1 (zh) * 2021-10-28 2023-05-04 京东方科技集团股份有限公司 数据同步方法和电子设备

Also Published As

Publication number Publication date
CN112396441B (zh) 2023-08-22

Similar Documents

Publication Publication Date Title
US20220148037A1 (en) Systems and methods for presenting and delivering content
US9436965B2 (en) Interactive map for grouped activities within a financial and social management system
US9710821B2 (en) Systems and methods for mobile and online payment systems for purchases related to mobile and online promotions or offers provided using impressions tracking and analysis, location information, 2D and 3D mapping, mobile mapping, social media, and user behavior and
US10127564B2 (en) System and method for using impressions tracking and analysis, location information, 2D and 3D mapping, mobile mapping, social media, and user behavior and information for generating mobile and internet posted promotions or offers for, and/or sales of, products and/or services
US20120089461A1 (en) Method for improved advertising on a mobile device
US11798023B2 (en) Systems and methods to determine tax classification of benefits offered to subscribers of a membership platform
US9934536B2 (en) Interactive map for grouped activities within a financial and social management system
US20130226711A1 (en) Monetizing images in publishing networks
US10949897B2 (en) System and method for receiving promotional sample product
CN108460632A (zh) 消费者驱动广告系统
CN103106598A (zh) 宣传分配系统、商店终端
CN105593841A (zh) 自动为网页的内容项确定大小
AU2020286259A1 (en) Finding objects or services utilizing a communication link to enlist the help of and reward third parties to help locate the desired object or service
US10424029B2 (en) Method and system for providing a housing recommendation
US10002395B2 (en) Interactive mapping system for user experience augmentation
KR102422410B1 (ko) 클라이언트와 인플루언서의 매칭 시스템 및 방법
CN112396441A (zh) 一种数据处理方法、装置以及可读存储介质
CN110796465A (zh) 资源展示设备确定方法、广告展示屏幕确定方法及装置
KR102260176B1 (ko) 콘텐츠의 광고 성과에 따른 인센티브 제공 시스템 및 그 방법
KR20120022445A (ko) 모바일을 이용한 실시간 매칭 거래 시스템 및 그 서비스 방법
JP7434190B2 (ja) 画像セマンティックコンテンツを使用したブランド浸透度決定システム
KR102515539B1 (ko) 여행지 공유 기반 연계할인 시스템 및 방법
EP4283552A1 (en) Learning engine-based navigation system
KR102477197B1 (ko) 게임 형식 이벤트를 이용한 연계할인 시스템 및 방법
WO2024096104A1 (ja) Nft発行システム、nft発行方法、およびプログラム

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40038373

Country of ref document: HK

SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant