CN107133289A - 一种确定商圈的方法和装置 - Google Patents
一种确定商圈的方法和装置 Download PDFInfo
- Publication number
- CN107133289A CN107133289A CN201710256888.9A CN201710256888A CN107133289A CN 107133289 A CN107133289 A CN 107133289A CN 201710256888 A CN201710256888 A CN 201710256888A CN 107133289 A CN107133289 A CN 107133289A
- Authority
- CN
- China
- Prior art keywords
- merchant tenninal
- seed
- commercial circle
- data
- seed merchant
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/242—Query formulation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
- G06Q30/0204—Market segmentation
- G06Q30/0205—Location or geographical consideration
Abstract
本发明实施例涉及数据领域,尤其涉及一种确定商圈的方法和装置,用于确定商户终端所属的商圈。本发明实施例中,确定商圈的种子商户终端;从线下交易数据中确定出种子商户终端的消费交易数据;将与消费交易数据的账户相同且交易时间满足时间阈值的交易数据,确定为种子商户终端的邻近交易数据;将邻近交易数据涉及的商户终端确定为商圈的种子商户终端,从而根据所有种子商户终端所在区域更新商圈范围,实现商圈范围的确定。
Description
技术领域
本发明实施例涉及数据领域,尤其涉及一种确定商圈的方法和装置。
背景技术
当前,在大数据产业中,实际交易信息被普遍认为是最具商业价值的数据。根据交易数据中所蕴含的大量信息,结合数据分析和建模方法,可以对商户终端所属的商圈进行精准定位,从而实现精准营销、市场推广、热点追踪等商业手段,实现商业价值。
现有技术中,例如在专利CN104462059A中,该专利提供一种通过识别商户地址信息的方法来实现商户的定位,但是这种方法存在着以下问题:适用于处理含有商户地址的数据;即使对于已经含有地址的商户,其地址文本信息往往也过于模糊;存在大量商户注册地址与实际经营地址不一致的情况,会导致商户定位错误;在该专利中关于商户商圈归并环节,简单使用两个商户间交易卡量在总卡量的占比作为归并依据,并未充分考虑时间因素。另外,在使用交易信息判断商户终端所属的商圈的过程中,现有大数据算法如聚类需要衡量样本点即商户终端之间的距离,该距离的定义需要满足三角准则,但是通过交易信息无法定义该距离。
综上所述,现有技术在对商户终端所属的商圈的定位过程中,存在需要依赖商户地址文本信息而带来的一系列问题以及通过交易数据无法定义商户终端之间的距离的缺点,因此,需要提出有效的方法来解决上述问题。
发明内容
本发明实施例提供一种确定商圈的方法和装置,用以解决现有技术在对商户终端所属的商圈的定位过程中,存在需要依赖商户地址文本信息而带来的一系列问题以及通过交易数据无法定义商户终端之间的距离的缺点。
本发明实施例提供一种确定商圈的方法,包括:
确定商圈的种子商户终端;
从线下交易数据中确定出种子商户终端的消费交易数据;
将与消费交易数据的账户相同且交易时间满足时间阈值的交易数据,确定为种子商户终端的邻近交易数据;
将邻近交易数据涉及的商户终端确定为商圈的种子商户终端,从而根据所有种子商户终端所在区域更新商圈范围。
可选地,将邻近交易数据涉及的商户终端确定为商圈的种子商户终端,包括:
将邻近交易数据涉及的商户终端确定为待选种子商户终端;
针对每个待选种子商户终端,获取待选种子商户终端的邻近交易数据;根据待选种子商户终端的邻近交易数据,统计各项评估指标;在各项评估指标满足预设条件时,确定待选种子商户终端为商圈的种子商户终端。
可选地,根据待选种子商户终端的邻近交易数据,统计各项评估指标,包括:
统计待选种子商户终端的邻近交易数据的个数;
统计待选种子商户终端的邻近交易数据与种子商户终端的消费交易数据中的交易时间的时间差值,并根据各时间差值确定出最小时间差值和平均时间差值;
确定个数、最小时间差值和平均时间差值是否满足预设条件。
可选地,确定商圈的种子商户终端,包括:
查找商户名中包含地址信息的商户终端;
根据地址信息确定商户终端与商圈的距离;
将满足距离阈值的商户终端确定为种子商户终端。
可选地,将邻近交易数据涉及的商户终端确定为商圈的种子商户终端之后,还包括:
返回从线下交易数据中确定出种子商户终端的消费交易数据的步骤,直至满足收敛条件为止;收敛条件为循环次数大于次数阈值;或每次循环的新增种子商户终端的个数与已有种子商户终端的个数比值小于比例阈值。
本发明实施例提供一种确定商圈的装置,包括:
第一确定单元:用于确定商圈的种子商户终端;
第二确定单元:用于从线下交易数据中确定出种子商户终端的消费交易数据;
第三确定单元:用于将与消费交易数据的账户相同且交易时间满足时间阈值的交易数据,确定为种子商户终端的邻近交易数据;
第四确定单元:用于将邻近交易数据涉及的商户终端确定为商圈的种子商户终端,从而根据所有种子商户终端所在区域更新商圈范围。
可选地,第四确定单元具体用于:
将邻近交易数据涉及的商户终端确定为待选种子商户终端;
针对每个待选种子商户终端,获取待选种子商户终端的邻近交易数据;根据待选种子商户终端的邻近交易数据,统计各项评估指标;在各项评估指标满足预设条件时,确定待选种子商户终端为商圈的种子商户终端。
可选地,第四确定单元具体还用于:
统计待选种子商户终端的邻近交易数据的个数;
统计待选种子商户终端的邻近交易数据与种子商户终端的消费交易数据中的交易时间的时间差值,并根据各时间差值确定出最小时间差值和平均时间差值;
确定个数、最小时间差值和平均时间差值是否满足预设条件。
可选地,第一确定单元具体用于:
查找商户名中包含地址信息的商户终端;
根据地址信息确定商户终端与商圈的距离;
将满足距离阈值的商户终端确定为种子商户终端。
可选地,第四确定单元还用于:
返回从线下交易数据中确定出种子商户终端的消费交易数据的步骤,直至满足收敛条件为止;收敛条件为循环次数大于次数阈值;或每次循环的新增种子商户终端的个数与已有种子商户终端的个数比值小于比例阈值。
本发明实施例中提供了一种确定商圈的方法和装置,确定商圈的种子商户终端;从线下交易数据中确定出种子商户终端的消费交易数据;将与消费交易数据的账户相同且交易时间满足时间阈值的交易数据,确定为种子商户终端的邻近交易数据;将邻近交易数据涉及的商户终端确定为商圈的种子商户终端,从而根据所有种子商户终端所在区域更新商圈范围。本发明实施例中首先确定商圈的种子商户终端;然后基于线下交易数据确定出种子商户终端的消费交易数据,将同一个账户在时间阈值内进行的消费交易数据,确定为商圈种子商户终端的邻近交易数据;最后将邻近交易数据涉及到的商户终端确定为商圈的种子商户终端,从而根据所有种子商户终端所在区域更新商圈范围。可以看出,一方面,本发明的技术方案是基于线下交易数据的,而并不像现有技术依赖商户地址文本信息;另一方面,现有技术在大数据算法如聚类算法中利用交易数据无法定义商户终端之间的距离,而本发明的技术方案利用交易数据可以确定商户终端的临近交易数据,从而可以避免利用交易数据无法定义商户终端之间的距离的缺点,此外,通过交易数据划定的商圈是动态的,使用不同时间段的交易数据能刻画出不同商业场景下的商圈动态。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简要介绍。
图1为本发明实施例提供的一种确定商圈的方法流程示意图;
图2为本发明实施例提供的一种确定商圈的整体方法流程示意图;
图3为本发明实施例提供的一种确定商圈的装置结构示意图。
具体实施方式
为了使本发明的目的、技术方案及有益效果更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
应理解,本发明实施例的技术方案可以应用于实现各个城市的商圈的定位。
图1示例性示出了本发明实施例提供的一种确定商圈的方法流程示意图,如图1所示,包括以下步骤:
S101:确定商圈的种子商户终端;
S102:从线下交易数据中确定出种子商户终端的消费交易数据;
S103:将与消费交易数据的账户相同且交易时间满足时间阈值的交易数据,确定为种子商户终端的邻近交易数据;
S104:将邻近交易数据涉及的商户终端确定为商圈的种子商户终端,从而根据所有种子商户终端所在区域更新商圈范围。
S101中,确定商圈的种子商户终端,包括:查找商户名中包含地址信息的商户终端;根据地址信息确定商户终端与商圈的距离;将满足距离阈值的商户终端确定为种子商户终端。在具体实施中,可以从交易商户库中选取一部分商户终端作为每个商圈的种子商户终端,选取商户终端作为商圈的种子商户终端可以采用以下渠道:第一种渠道:从交易商户库提取少量商户名中含有商户地址的终端,比如上海世纪公园等,使用该地址信息作为输入,与外部互联网匹配其地理坐标,若地理坐标距离某个商圈中心最近,则记该商户终端为该商圈的种子商户终端;第二种渠道:是对于交易量特别大且商户名中含有能够标识商户所属地理位置特征词的终端,通过人工数据验证确定其为某个商圈的种子商户终端。一般而言,初始阶段,每个商圈的种子商户终端数量在20个以上50个以下。其中,商户终端可以是POS(point of sale,销售终端)机、ATM(Automatic Teller Machine,自动取款机)机。首先确定出商圈的一小部分种子商户终端,为后续扩展商圈的范围提供了前提保证,如果不选定一小部分商户终端作为商圈的种子商户终端,后续是没法继续计算与该商圈内种子商户终端有交易关联的商户终端。
S102中,从线下交易数据中确定出种子商户终端的消费交易数据,具体来说,本发明的技术方案是基于海量的交易数据,而海量的交易数据中包括线上和线下交易,要把交易数据中所有的线上交易数据剔除,因为线上交易数据不能反映商户终端的地理位置信息,若保留会对数据结果造成错误的影响。其中,剔除线上交易的方法可以是:根据交易数据中的交易要素来剔除,其中,交易要素包括买方和卖方的信息、银行卡信息、交易时间、交易地点、交易方式,比如交易方式是通过电脑、移动终端等、商户终端名称、商户类型和行业等,可以根据识别出的交易要素中的关键信息来确定该条交易数据是否为线上交易,比如识别出交易要素中含有移动终端等的关键信息,则可以确定出该条交易为线上交易,那么就可以将这条线上交易剔除。剔除线上的交易数据之后,从线下交易数据中可以确定商圈中种子商户终端的消费交易数据。从线下交易数据中确定种子商户终端的消费交易数据,可以看出,实用范围更广泛,而不仅仅局限于含有地址文本信息的交易,因此,本发明的技术方案对原始交易数据的要求更低,通过交易数据中的交易要素即可得到是否是线下交易。
S103中,将与消费交易数据的账户相同且交易时间满足时间阈值的交易数据,确定为种子商户终端的邻近交易数据,包括:将邻近交易数据涉及的商户终端确定为待选种子商户终端;针对每个待选种子商户终端,获取待选种子商户终端的邻近交易数据;根据待选种子商户终端的邻近交易数据,统计各项评估指标;在各项评估指标满足预设条件时,确定待选种子商户终端为商圈的种子商户终端。具体来说,同一个账户在预设时间间隔阈值内在不同的两个商户终端进行的消费交易数据,确定为种子商户终端的邻近交易数据,其中,具体实施中,预设时间间隔一般取3小时,例如,账户1在10点在种子商户终端a进行了一笔消费交易,到10点50在种子商户终端b进行了另一笔消费交易,那么,将账户1先后在两个不同种子商户终端进行消费交易的记录作为种子商户终端a,b的邻近交易数据。如果种子商户终端a,b的邻近交易数据还与商户终端d,e,f有关,比如,账户1在10点在种子商户终端a进行了一笔消费交易,到11点在种子商户终端d进行了另一笔消费交易,那么种子商户终端d为种子商户终端a邻近交易数据中涉及的商户终端,把商户终端d确定为该商圈的待选种子商户终端,依次类推,商户终端e,f也类似。针对每个待选种子商户终端,获取待选种子商户终端的邻近交易数据,这里获取待选种子商户终端的邻近交易数据的方法和上面举得例子类似,这里就不再赘述。
可选地,根据待选种子商户终端的邻近交易数据,统计各项评估指标,包括:统计待选种子商户终端的邻近交易数据的个数;统计待选种子商户终端的邻近交易数据与种子商户终端的消费交易数据中的交易时间的时间差值,并根据各时间差值确定出最小时间差值和平均时间差值;具体来说,待选种子商户终端d与商圈内的种子商户终端a,b发生过交易关联,那么,统计待选种子商户终端d与商圈内种子商户终端a,b之间的各项评估指标,其中,各项评估指标包括邻近交易数据的个数、最小时间差值和平均时间差值。比如,待选种子商户终端d与商圈内种子商户终端a之间有账户2和账户3满足时间阈值条件下发生过交易,那么,待选种子商户终端d与商圈内种子商户终端a之间的邻近交易数据的个数是2,而待选种子商户终端d与商圈内种子商户终端b之间有账户1、账户3、账户4满足时间阈值条件下发生过交易,那么,待选种子商户终端d与商圈内种子商户终端b之间的邻近交易数据的个数是3,因此,待选种子商户终端d的邻近交易数据的个数是5,也可以说是待选种子商户终端与该商圈的邻近交易数据的个数是5;最小时间差值的统计方法为:待选种子商户终端d与商圈内种子商户终端a之间的交易时间的差值、待选种子商户终端d与商圈内种子商户终端b之间的交易时间的差值中交易时间的差值最小的,比如,账户2在10点在待选种子商户终端d在种子商户终端a发生过一笔交易,在10点20分在种子商户终端b发生过一笔交易,那么这时的交易时间差值为20分钟,其它的也类似,这里不再赘述,假如通过统计,统计出待选种子商户终端d与商圈内的种子终端a,b中所有的时间差值中最小时间差值为15分钟;平均时间差值的统计方法:所有时间的差值相加除以邻近交易数据的个数,例如,账户2在待选种子终端d与种子终端a交易的时间差值为1小时,账户3在待选种子终端d与种子终端a交易的时间差值为1.5小时,账户1在待选种子终端d与种子终端b交易的时间差值为2小时、账户3在待选种子终端d与种子终端b交易的时间差值为2.5小时、账户4在待选种子终端d与种子终端b交易的时间差值为1.5小时,将所有的时间差值加起来为8.5小时,待选种子终端d的邻近交易数据的个数为5,所以平均时间差值为8.5除以5为1.7小时。通过统计各项评估指标的方法作为商圈更新范围的限制条件,可以看出商圈范围更新的过程具有很好的稳定性和更高的可信度。
确定个数、最小时间差值和平均时间差值是否满足预设条件。具体来说,判断个数是否大于第一设定的阈值,最小时间差值和平均时间差值是否小于第二设定的阈值,其中,第一设定的阈值和第二设定的阈值可以相同也可以不相同,视具体的情况而定,第一设定的阈值和第二设定的阈值可以为5%~10%,如果个数、最小时间差值和平均时间差值都满足预设条件,那么可以将该待选种子终端纳入到该商圈中,作为该商圈新增的种子商户终端。需要说明的是,具体实施中,如果确定出一个待选种子商户终端的个数、最小时间差值和平均时间差值满足预设条件之后,确定出这个待选种子商户终端既属于商圈1,又属于商圈2,那么,接着再比较这个待选种子商户终端与商圈1和商圈2的邻近交易数据的个数,看谁的多,就将其纳入该商圈中,比如,这个待选种子商户终端与商圈1的邻近交易数据的个数为9,这个待选种子商户终端与商圈1的邻近交易数据的个数为5,那么,就将这个待选种子商户终端纳入到商圈1中。不仅仅统计各项评估指标,各项评估指标还要满足预设条件,才可以作为商圈更新范围的商户终端,这样更加提高了商圈更新过程的稳定性和可信度。
S104中,将邻近交易数据涉及的商户终端确定为商圈的种子商户终端,从而根据所有种子商户终端所在区域更新商圈范围,比如,商圈内的种子商户终端a,b之间的邻近交易数据涉及的待选种子商户终端d确定为商圈的种子商户终端,根据种子商户终端d所在的区域来更新商圈的范围,具体实施中,可以通过画圆或者椭圆或者不规则的近似圆的形状的方式来更新商圈的范围。
可选地,将邻近交易数据涉及的商户终端确定为商圈的种子商户终端之后,还包括:返回从线下交易数据中确定出种子商户终端的消费交易数据的步骤,直至满足收敛条件为止;收敛条件为循环次数大于次数阈值;或每次循环的新增种子商户终端的个数与已有种子商户终端的个数比值小于比例阈值。具体来说,将待选种子商户终端d纳入到商圈中之后,于是,第一轮商圈更新范围完成,接着返回从线下交易数据中确定出种子商户终端的消费交易数据的步骤,重新计算待选商户终端e,f是否属于商圈1,直到满足收敛条件为止,其中收敛条件为循环次数小于次数阈值;或每次循环的新增种子商户终端的个数与所有种子商户终端的个数比值小于比例阈值,比如,次数阈值设为11次,那么,当前循环次数为10,那么,不满足次数阈值,或者,商圈内的种子商户终端有两个,分别为a,b,而待选种子商户终端d,e,f假如都满足设定条件,可以将d,e,f纳入到商圈中,那么,新增的种子商户终端d,e,f的个数与已有种子商户终端a,b的个数的比例为1.5,而比例阈值如果设为1,那么,不满足收敛条件,直到满足任一收敛条件为止。通过多次循环或者每次循环的新增种子商户终端的个数与已有种子商户终端的个数比值小于比例阈值,可以看出基于交易数据而更新的商圈的范围是动态的,这样能够刻画出不同商业场景下的商圈动态。
为了更好地理解本发明的技术方案,那么,下面介绍一下确定商圈的整体思路,图2示例性地示出了一种确定商圈的整体方法流程图,如图2所示,包括以下步骤:
S201:开始;
S202:确定商圈的种子商户终端;
S203:从线下交易数据中确定出种子商户终端的消费交易数据;
S204:将与消费交易数据的账户相同且交易时间满足时间阈值的交易数据,确定为种子商户终端的邻近交易数据;
S205:将邻近交易数据涉及的商户终端确定为商圈的待选种子商户终端;
S206:针对每个待选种子商户终端,获取待选种子商户终端的邻近交易数据;
S207:根据待选种子商户终端的邻近交易数据,统计各项评估指标;
S208:判断各项评估指标是否满足预设条件,若是,则执行S209,若否,则执行S210;
S209:根据该待选种子商户终端所在区域更新商圈范围;
S210:不更新商圈范围;
S211:判断是否满足收敛条件,若是,则执行S212,若否,则执行S203;
S212:结束。
进一步地,为了更好地理解本发明的技术方案,下面举一个具体的实施例:
以上海为例,为了计算方便和便于理解方案,假设上海有1个商圈(商圈1),通过S101确定商圈1中包含2个种子商户终端,分别为(a,b),表1示例性地示出了确定商圈的种子商户终端,如表1所示:
表1:确定商圈的种子商户终端
商圈1 | |
种子商户终端 | a,b |
假设交易商户库中总共有10个商户终端,为商户终端a,b,c,d,e,f,g,h,i,j。
从这10个商户终端中找到关于同一个账户在时间阈值(一般为3小时)内在两个不同商户终端进行交易的记录,这个交易记录作为一个交易对,这个交易对称为邻近交易数据,其中,具体实施中账户也可以称之为客户。例如,表2中客户1在满足时间阈值(1小时)内先后在商户终端a,b发生过一笔交易,那么,这个交易为一个交易对,具体如下表2所示,表2示例性地示出了确定种子商户终端的邻近交易数据:
表2:确定种子商户终端的邻近交易数据
需要说明一点的是,在具体实施中,表1中的任何两个商户终端之间所涉及的客户不仅仅如表中所列的几个,两个商户终端之间会涉及到很多客户,这里两个商户终端之间仅列了几个是为了便于计算。
基于表2,计算关于商户终端a,b,c,d,e,f中任意两个商户终端之间的邻近交易数据的个数、交易最小时间差值和交易平均时间差值,那么,通过计算,形成表3,表3示例性地示出了任意两个商户终端之间的邻近交易数据的个数、交易最小时间差值、交易平均时间差值的关系表,如表3所示:
计算待选商户终端与发生交易关联的商圈1之间的邻近交易数据的个数、交易最小时间差值、交易平均时间差值,由上表可知商户终端c,d,e,f分别与商圈1发生了交易关联。它们与商圈1之间的邻近交易数据的个数、交易最小时间差值、交易平均时间差值的计算结果如下表4所示,表4示例性地示出了待选商户终端与商圈之间的邻近交易数据的个数、交易最小时间差值、交易平均时间差值的计算结果:
表4:待选商户终端与商圈之间的邻近交易数据的个数、交易最小时间差值、交易平均时间差值的计算结果
根据表4,可以计算出商圈1的各项评估指标如邻近交易数据的个数、交易最小时间差值和交易平均时间差值的分布以及百分位数。如:邻近交易数据的个数的50%分位数是5,交易最小时间差值25%分位数是0.4,交易平均时间差值25%分位数是1.14。
设定以上分位数为商圈的更新范围的阈值,只有当商户终端的各项评估指标同时满足预设条件,才将根据该商户终端所在区域更新该商圈范围,此例中,商户终端c属于商圈1,商户终端d,e,f均不属于商圈1。
此处需要说明两点:首先是在实际运算过程中,分位数的选取一般在5%分位数到10%分位数之间,此处仅仅为了展示需要选取了50%和25%分位数;其次,若存在同一商户终端同时满足作为多个商圈的更新范围的条件,则取最大邻近交易数据的个数所对应的商圈。
至此,第一轮商圈更新范围完成,更新商圈1表格为下表5,表5示例性地示出了第一轮商圈更新范围后的种子商户终端的结果,如表5所示:
表5:第一轮商圈更新范围后的种子商户终端的结果
商圈1 | |
种子商户终端 | a,b,c |
然后继续重复以上步骤,重新计算商户终端d,e,f等是否属于商圈1,直至达到以下两个收敛条件中的任何一个:
1)商圈中新增的种子商户终端的个数与已有种子商户终端的个数比值小于比例阈值,比例阈值可以设为如百分之一,视具体情况而定;
2)循环次数大于次数阈值,次数阈值如10次或者更多次,视具体情况而定。
在上例中,第一次将商户终端c加入商圈1,新增的种子商户终端的个数与已有种子商户终端的个数比值为1/3=33%>1%,不满足收敛条件1,且循环次数=1<10,不满足收敛条件2,故第一次更新商圈1范围后需要继续进行第二次更新,直至任一收敛条件满足。
当计算完成后,最终确定商圈1中最终包含商户终端a,b,c……,即完成了商户终端a,b,c……i的商圈定位。
本发明实施例中提供了一种确定商圈的方法,确定商圈的种子商户终端;从线下交易数据中确定出种子商户终端的消费交易数据;将与消费交易数据的账户相同且交易时间满足时间阈值的交易数据,确定为种子商户终端的邻近交易数据;将邻近交易数据涉及的商户终端确定为商圈的种子商户终端,从而根据所有种子商户终端所在区域更新商圈范围。本发明实施例中首先确定商圈的种子商户终端;然后基于线下交易数据确定出种子商户终端的消费交易数据,将同一个账户在时间阈值内进行的消费交易数据,确定为商圈种子商户终端的邻近交易数据;最后将邻近交易数据涉及到的商户终端确定为商圈的种子商户终端,从而根据所有种子商户终端所在区域更新商圈范围。可以看出,一方面,本发明的技术方案是基于线下交易数据的,而并不像现有技术依赖商户地址文本信息;另一方面,现有技术在大数据算法如聚类算法中利用交易数据无法定义商户终端之间的距离,而本发明的技术方案利用交易数据可以确定商户终端的临近交易数据,从而可以避免利用交易数据无法定义商户终端之间的距离的缺点,此外,通过交易数据划定的商圈是动态的,使用不同时间段的交易数据能刻画出不同商业场景下的商圈动态。
基于相同构思,本发明实施例提供的一种确定商圈的装置,如图3所示,该装置包括第一确定单元301、第二确定单元302、第三确定单元303、第四确定单元304。其中:
第一确定单元301:用于确定商圈的种子商户终端;
第二确定单元302:用于从线下交易数据中确定出种子商户终端的消费交易数据;
第三确定单元303:用于将与消费交易数据的账户相同且交易时间满足时间阈值的交易数据,确定为种子商户终端的邻近交易数据;
第四确定单元304:用于将邻近交易数据涉及的商户终端确定为商圈的种子商户终端,从而根据所有种子商户终端所在区域更新商圈范围。
可选地,第四确定单元304具体用于:
将邻近交易数据涉及的商户终端确定为待选种子商户终端;
针对每个待选种子商户终端,获取待选种子商户终端的邻近交易数据;根据待选种子商户终端的邻近交易数据,统计各项评估指标;在各项评估指标满足预设条件时,确定待选种子商户终端为商圈的种子商户终端。
可选地,第四确定单元304具体还用于:
统计待选种子商户终端的邻近交易数据的个数;
统计待选种子商户终端的邻近交易数据与种子商户终端的消费交易数据中的交易时间的时间差值,并根据各时间差值确定出最小时间差值和平均时间差值;
确定个数、最小时间差值和平均时间差值是否满足预设条件。
可选地,第一确定单元301具体用于:
查找商户名中包含地址信息的商户终端;
根据地址信息确定商户终端与商圈的距离;
将满足距离阈值的商户终端确定为种子商户终端。
可选地,第四确定单元304还用于:
返回从线下交易数据中确定出种子商户终端的消费交易数据的步骤,直至满足收敛条件为止;收敛条件为循环次数大于次数阈值;或每次循环的新增种子商户终端的个数与已有种子商户终端的个数比值小于比例阈值。
本发明实施例中提供了一种确定商圈的装置,从上述内容可看出:确定商圈的种子商户终端;从线下交易数据中确定出种子商户终端的消费交易数据;将与消费交易数据的账户相同且交易时间满足时间阈值的交易数据,确定为种子商户终端的邻近交易数据;将邻近交易数据涉及的商户终端确定为商圈的种子商户终端,从而根据所有种子商户终端所在区域更新商圈范围。本发明实施例中首先确定商圈的种子商户终端;然后基于线下交易数据确定出种子商户终端的消费交易数据,将同一个账户在时间阈值内进行的消费交易数据,确定为商圈种子商户终端的邻近交易数据;最后将邻近交易数据涉及到的商户终端确定为商圈的种子商户终端,从而根据所有种子商户终端所在区域更新商圈范围。可以看出,一方面,本发明的技术方案是基于线下交易数据的,而并不像现有技术依赖商户地址文本信息;另一方面,现有技术在大数据算法如聚类算法中利用交易数据无法定义商户终端之间的距离,而本发明的技术方案利用交易数据可以确定商户终端的临近交易数据,从而可以避免利用交易数据无法定义商户终端之间的距离的缺点,此外,通过交易数据划定的商圈是动态的,使用不同时间段的交易数据能刻画出不同商业场景下的商圈动态。
本领域内的技术人员应明白,本发明的实施例可提供为方法、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
Claims (10)
1.一种确定商圈的方法,其特征在于,包括:
确定商圈的种子商户终端;
从线下交易数据中确定出所述种子商户终端的消费交易数据;
将与所述消费交易数据的账户相同且交易时间满足时间阈值的交易数据,确定为所述种子商户终端的邻近交易数据;
将所述邻近交易数据涉及的商户终端确定为所述商圈的种子商户终端,从而根据所有种子商户终端所在区域更新所述商圈范围。
2.如权利要求1所述的方法,其特征在于,所述将所述邻近交易数据涉及的商户终端确定为所述商圈的种子商户终端,包括:
将所述邻近交易数据涉及的商户终端确定为待选种子商户终端;
针对每个待选种子商户终端,获取所述待选种子商户终端的邻近交易数据;根据所述待选种子商户终端的邻近交易数据,统计各项评估指标;在所述各项评估指标满足预设条件时,确定所述待选种子商户终端为所述商圈的种子商户终端。
3.如权利要求2所述的方法,其特征在于,所述根据所述待选种子商户终端的邻近交易数据,统计各项评估指标,包括:
统计所述待选种子商户终端的邻近交易数据的个数;
统计所述待选种子商户终端的邻近交易数据与所述种子商户终端的消费交易数据中的交易时间的时间差值,并根据各时间差值确定出最小时间差值和平均时间差值;
确定所述个数、所述最小时间差值和所述平均时间差值是否满足所述预设条件。
4.如权利要求1所述的方法,其特征在于,所述确定商圈的种子商户终端,包括:
查找商户名中包含地址信息的商户终端;
根据所述地址信息确定所述商户终端与商圈的距离;
将满足距离阈值的商户终端确定为种子商户终端。
5.如权利要求1至4任一项所述的方法,其特征在于,所述将所述邻近交易数据涉及的商户终端确定为所述商圈的种子商户终端之后,还包括:
返回从线下交易数据中确定出所述种子商户终端的消费交易数据的步骤,直至满足收敛条件为止;所述收敛条件为循环次数大于次数阈值;或每次循环的新增种子商户终端的个数与已有种子商户终端的个数比值小于比例阈值。
6.一种确定商圈的装置,其特征在于,包括:
第一确定单元,用于确定商圈的种子商户终端;
第二确定单元,用于从线下交易数据中确定出所述种子商户终端的消费交易数据;
第三确定单元,用于将与所述消费交易数据的账户相同且交易时间满足时间阈值的交易数据,确定为所述种子商户终端的邻近交易数据;
第四确定单元,用于将所述邻近交易数据涉及的商户终端确定为所述商圈的种子商户终端,从而根据所有种子商户终端所在区域更新所述商圈范围。
7.如权利要求6所述的装置,其特征在于,
所述第四确定单元,具体用于将所述邻近交易数据涉及的商户终端确定为待选种子商户终端;
针对每个待选种子商户终端,获取所述待选种子商户终端的邻近交易数据;根据所述待选种子商户终端的邻近交易数据,统计各项评估指标;在所述各项评估指标满足预设条件时,确定所述待选种子商户终端为所述商圈的种子商户终端。
8.如权利要求7所述的装置,其特征在于,
所述第四确定单元,具体还用于统计所述待选种子商户终端的邻近交易数据的个数;
统计所述待选种子商户终端的邻近交易数据与所述种子商户终端的消费交易数据中的交易时间的时间差值,并根据各时间差值确定出最小时间差值和平均时间差值;
确定所述个数、所述最小时间差值和所述平均时间差值是否满足所述预设条件。
9.如权利要求6所述的装置,其特征在于,
所述第一确定单元,具体用于查找商户名中包含地址信息的商户终端;
根据所述地址信息确定所述商户终端与商圈的距离;
将满足距离阈值的商户终端确定为种子商户终端。
10.如权利要求6至9任一项所述的装置,其特征在于,
所述第四确定单元,还用于返回从线下交易数据中确定出所述种子商户终端的消费交易数据的步骤,直至满足收敛条件为止;所述收敛条件为循环次数大于次数阈值;或每次循环的新增种子商户终端的个数与已有种子商户终端的个数比值小于比例阈值。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710256888.9A CN107133289B (zh) | 2017-04-19 | 2017-04-19 | 一种确定商圈的方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710256888.9A CN107133289B (zh) | 2017-04-19 | 2017-04-19 | 一种确定商圈的方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107133289A true CN107133289A (zh) | 2017-09-05 |
CN107133289B CN107133289B (zh) | 2020-06-30 |
Family
ID=59715009
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710256888.9A Active CN107133289B (zh) | 2017-04-19 | 2017-04-19 | 一种确定商圈的方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107133289B (zh) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108492182A (zh) * | 2018-03-07 | 2018-09-04 | 阿里巴巴集团控股有限公司 | 一种交易事件分群方法、装置及设备 |
CN108876465A (zh) * | 2018-06-28 | 2018-11-23 | 阿里巴巴集团控股有限公司 | 一种对商户进行经营模式分群的方法、装置和服务器 |
CN109684563A (zh) * | 2018-11-19 | 2019-04-26 | 银联智惠信息服务(上海)有限公司 | 商圈识别方法、装置以及计算机存储介质 |
CN109800823A (zh) * | 2019-02-21 | 2019-05-24 | 银联智策顾问(上海)有限公司 | 一种pos终端的聚类方法及装置 |
CN109947865A (zh) * | 2018-09-05 | 2019-06-28 | 中国银联股份有限公司 | 商户分类方法及商户分类系统 |
CN111415151A (zh) * | 2020-03-10 | 2020-07-14 | 支付宝(杭州)信息技术有限公司 | 连锁商户的识别方法、装置、电子设备及存储介质 |
CN112488748A (zh) * | 2020-11-18 | 2021-03-12 | 银联智惠信息服务(上海)有限公司 | 数据标识匹配方法及装置、存储介质、计算设备 |
CN112700235A (zh) * | 2019-10-22 | 2021-04-23 | 北京迈格威科技有限公司 | 线下支付用户的识别方法、装置和电子设备 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7991638B1 (en) * | 2006-06-21 | 2011-08-02 | Sprint Communications Company L.P. | Process for trade area generation |
CN103248723A (zh) * | 2013-04-10 | 2013-08-14 | 腾讯科技(深圳)有限公司 | 一种ip地址所在区域的确定方法及装置 |
CN105574014A (zh) * | 2014-10-13 | 2016-05-11 | 北京明略软件系统有限公司 | 一种商圈划分方法及系统 |
CN105590223A (zh) * | 2014-12-29 | 2016-05-18 | 中国银联股份有限公司 | 商户的商圈信息的标定 |
-
2017
- 2017-04-19 CN CN201710256888.9A patent/CN107133289B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7991638B1 (en) * | 2006-06-21 | 2011-08-02 | Sprint Communications Company L.P. | Process for trade area generation |
CN103248723A (zh) * | 2013-04-10 | 2013-08-14 | 腾讯科技(深圳)有限公司 | 一种ip地址所在区域的确定方法及装置 |
CN105574014A (zh) * | 2014-10-13 | 2016-05-11 | 北京明略软件系统有限公司 | 一种商圈划分方法及系统 |
CN105590223A (zh) * | 2014-12-29 | 2016-05-18 | 中国银联股份有限公司 | 商户的商圈信息的标定 |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108492182A (zh) * | 2018-03-07 | 2018-09-04 | 阿里巴巴集团控股有限公司 | 一种交易事件分群方法、装置及设备 |
CN108876465A (zh) * | 2018-06-28 | 2018-11-23 | 阿里巴巴集团控股有限公司 | 一种对商户进行经营模式分群的方法、装置和服务器 |
CN108876465B (zh) * | 2018-06-28 | 2022-02-01 | 创新先进技术有限公司 | 一种对商户进行经营模式分群的方法、装置和服务器 |
CN109947865A (zh) * | 2018-09-05 | 2019-06-28 | 中国银联股份有限公司 | 商户分类方法及商户分类系统 |
CN109684563A (zh) * | 2018-11-19 | 2019-04-26 | 银联智惠信息服务(上海)有限公司 | 商圈识别方法、装置以及计算机存储介质 |
CN109800823A (zh) * | 2019-02-21 | 2019-05-24 | 银联智策顾问(上海)有限公司 | 一种pos终端的聚类方法及装置 |
CN109800823B (zh) * | 2019-02-21 | 2023-07-25 | 银联智策顾问(上海)有限公司 | 一种pos终端的聚类方法及装置 |
CN112700235A (zh) * | 2019-10-22 | 2021-04-23 | 北京迈格威科技有限公司 | 线下支付用户的识别方法、装置和电子设备 |
CN111415151A (zh) * | 2020-03-10 | 2020-07-14 | 支付宝(杭州)信息技术有限公司 | 连锁商户的识别方法、装置、电子设备及存储介质 |
CN112488748A (zh) * | 2020-11-18 | 2021-03-12 | 银联智惠信息服务(上海)有限公司 | 数据标识匹配方法及装置、存储介质、计算设备 |
CN112488748B (zh) * | 2020-11-18 | 2024-01-05 | 银联智惠信息服务(上海)有限公司 | 数据标识匹配方法及装置、存储介质、计算设备 |
Also Published As
Publication number | Publication date |
---|---|
CN107133289B (zh) | 2020-06-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107133289A (zh) | 一种确定商圈的方法和装置 | |
US20150371207A1 (en) | Method and system for variability of aggregated payments based on account trustworthiness | |
CN107679103B (zh) | 用于实体的属性分析方法及系统 | |
CN107103530A (zh) | 一种银行个人多账户交易方法及系统 | |
CN108111368B (zh) | 一种交易系统的功能测试方法及装置 | |
US20230297552A1 (en) | System, Method, and Computer Program Product for Monitoring and Improving Data Quality | |
CN110020865A (zh) | 交易识别方法及装置 | |
CN106610818A (zh) | 一种属性确定的方法及装置 | |
US8655775B1 (en) | Method and system for merchant debit routing table change detection | |
CN106934479B (zh) | 选择报关海关、准备报关信息的方法和装置 | |
CN106875595A (zh) | 一种pos终端使用地点的确定方法及装置 | |
CN113610521A (zh) | 用于检测行为数据的异常的方法和设备 | |
Spray | Reorganise, replace or expand? The role of the supply-chain in first-time exporting | |
CN106920124A (zh) | 一种数据采集和分析方法及装置 | |
CN113379464B (zh) | 基于区块链的网点选址方法、装置、设备和存储介质 | |
CN113935507A (zh) | 基于区块链的外币现钞兑换预约方法及装置 | |
CN106776913A (zh) | 一种用户归属地的判定方法和装置 | |
CN111932310A (zh) | 一种银行产品的潜在对公客户挖掘方法及装置 | |
CN106875188A (zh) | 一种交易对象的同步管理系统、方法及装置 | |
CN115034788A (zh) | 交易风险评估方法及装置、电子设备、存储介质 | |
CN112035681A (zh) | 基于知识图谱的信用卡费率信息确定方法及装置 | |
CN109272373A (zh) | 一种基于计算机的品牌推荐方法 | |
CN110264250A (zh) | 确定产品对等资源量在多个地域的分布数据的方法及装置 | |
CN113094407B (zh) | 一种基于横向联邦学习的反洗钱识别方法、装置及系统 | |
CN110717805A (zh) | 一种识别风险用户的方法、服务器及可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CB02 | Change of applicant information | ||
CB02 | Change of applicant information |
Address after: Room 601, building 2, Century metropolis, 1239 Century Avenue, Pudong New Area, Shanghai Applicant after: UNIONPAY ADVISORS COUNSELOR (SHANGHAI) Co.,Ltd. Address before: 200122 605 International Financial Hotel, 1589 Century Avenue, Shanghai, Changtai, Pudong New Area Applicant before: UNIONPAY ADVISORS COUNSELOR (SHANGHAI) Co.,Ltd. |