CN110796494B - 一种客群识别方法及装置 - Google Patents

一种客群识别方法及装置 Download PDF

Info

Publication number
CN110796494B
CN110796494B CN201911042947.8A CN201911042947A CN110796494B CN 110796494 B CN110796494 B CN 110796494B CN 201911042947 A CN201911042947 A CN 201911042947A CN 110796494 B CN110796494 B CN 110796494B
Authority
CN
China
Prior art keywords
customers
dimensional
store
determining
customer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911042947.8A
Other languages
English (en)
Other versions
CN110796494A (zh
Inventor
金炎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Aibee Technology Co Ltd
Original Assignee
Beijing Aibee Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Aibee Technology Co Ltd filed Critical Beijing Aibee Technology Co Ltd
Priority to CN201911042947.8A priority Critical patent/CN110796494B/zh
Publication of CN110796494A publication Critical patent/CN110796494A/zh
Application granted granted Critical
Publication of CN110796494B publication Critical patent/CN110796494B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0281Customer communication at a business location, e.g. providing product or service information, consulting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2413Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
    • G06F18/24133Distances to prototypes
    • G06F18/24143Distances to neighbourhood prototypes, e.g. restricted Coulomb energy networks [RCEN]

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • Strategic Management (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Business, Economics & Management (AREA)
  • Game Theory and Decision Science (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请公开了一种客群识别方法及装置,包括:将顾客的二维或三维坐标数据降维压缩成为一维数据;采用预设算法确定不同顾客的一维数据的相似度,确定相似度达到预设值的顾客对信息,每一个所述顾客对信息中包括两个顾客;针对每一个顾客对信息中的两个顾客,确定所述两个顾客的二维或三维坐标数据之间的欧几里得距离;在确定的所述两个顾客之间的欧几里得距离满足预设条件时,确定所述两个顾客为群组关系。所述客群识别方法及装置首先将顾客位置信息降维压缩处理后进行初步相似度判断,大大减少了后续计算数据量,然后再采用准确度高的欧几里得距离进一步对客群关系进行精准识别,从而保证了即高效、又精准的客群识别。

Description

一种客群识别方法及装置
技术领域
本发明涉及智能学习技术,更具体的说,是涉及一种客群识别方法及装置。
背景技术
客群识别,就是分析在商场中逛店人群的群组关系。客群识别无论对于线下场景的商业智能系统,还是线下的广告推荐系统,都具有非常重要的意义。
当我们知道了逛店人群的群组关系之后,再结合顾客的性别,年龄,偏好等属性,能够准确地定位群组属性,例如是顾客A和顾客B是朋友关系来一起的,或者顾客C,顾客D带着他们的小孩顾客E一起来的。当我们掌握了人群中丰富的群组关系和属性之后,能够极大地丰富顾客的画像系统,从而优化商业智能系统和推荐系统。
因此,如何高效精准的进行客群识别,成为领域内相关技术人员的研究热点。
发明内容
有鉴于此,本发明提供了一种客群识别方法及装置,以实现高效精准的客户识别。
为实现上述目的,本发明提供如下技术方案:
一种客群识别方法,包括:
将顾客的二维或三维轨迹数据降维压缩成为一维轨迹数据;
采用预设算法确定不同顾客的一维轨迹数据的相似度,确定相似度达到预设值的顾客对信息,每一个所述顾客对信息中包括两个顾客;
针对每一个顾客对信息中的两个顾客,确定所述两个顾客的二维或三维轨迹数据之间的欧几里得距离;
在确定的所述两个顾客之间的欧几里得距离满足预设条件时,确定所述两个顾客为群组关系。
可选的,所述将顾客的二维或三维轨迹数据降维压缩成为一维数据,包括:
将顾客的二维或三维轨迹数据降维压缩成为一维的进出店事件轨迹。
可选的,在所述将顾客的二维或三维轨迹数据降维压缩成为一维轨迹数据后,还包括:
基于顾客的逛店时间、逛店时长和楼层信息将一维轨迹数据进行客群过滤筛选。
可选的,在所述在确定的所述两个顾客之间的欧几里得距离满足预设条件时,确定所述两个顾客为群组关系后,还包括:
基于所有的所述群组关系,采用并查集算法来获得包含多于两人的群组关系。
可选的,所述采用预设算法确定不同顾客的一维轨迹数据的相似度,确定相似度达到预设值的顾客对信息,包括:
采用最长公共子串算法或动态时间规整算法定不同顾客的一维轨迹数据的相似度,确定相似度达到预设值的顾客对信息。
可选的,所述在确定的所述两个顾客之间的欧几里得距离满足预设条件时,确定所述两个顾客为群组关系,包括:
在确定所述两个顾客之间的坐标距离在第一距离之内的次数超过预设次数,且最远距离不超过第二距离的情况下,确定所述两个顾客为群组关系。
一种客群识别装置,包括:
降维压缩模块,用于将顾客的二维或三维轨迹数据降维压缩成为一维轨迹数据;
相似确定模块,用于采用预设算法确定不同顾客的一维轨迹数据的相似度,确定相似度达到预设值的顾客对信息,每一个所述顾客对信息中包括两个顾客;
距离确定模块,用于针对每一个顾客对信息中的两个顾客,确定所述两个顾客的二维或三维轨迹数据之间的欧几里得距离;
精准确定模块,用于在确定的所述两个顾客之间的欧几里得距离满足预设条件时,确定所述两个顾客为群组关系。
可选的,所述降维压缩模块具体用于:将顾客的二维或三维轨迹数据降维压缩成为一维的进出店事件轨迹。
可选的,还包括:
并查群组模块,用于基于所有的所述群组关系,采用并查集算法来获得包含多于两人的群组关系。
可选的,所述相似确定模块具体用于:采用最长公共子串算法或动态时间规整算法定不同顾客的一维轨迹数据的相似度,确定相似度达到预设值的顾客对信息。
经由上述的技术方案可知,与现有技术相比,本发明实施例公开了一种客群识别方法及装置,包括:将顾客的二维或三维坐标数据降维压缩成为一维数据;采用预设算法确定不同顾客的一维数据的相似度,确定相似度达到预设值的顾客对信息,每一个所述顾客对信息中包括两个顾客;针对每一个顾客对信息中的两个顾客,确定所述两个顾客的二维或三维坐标数据之间的欧几里得距离;在确定的所述两个顾客之间的欧几里得距离满足预设条件时,确定所述两个顾客为群组关系。所述客群识别方法及装置首先将顾客位置信息降维压缩处理后进行初步相似度判断,大大减少了后续计算数据量,然后再采用准确度高的欧几里得距离进一步对客群关系进行精准识别,从而保证了即高效、又精准的客群识别。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本发明实施例公开的一种客群识别方法的流程图;
图2为本发明实施例公开的另一种客群识别方法的流程图;
图3为本发明实施例公开的又一种客群识别方法的流程图;
图4为本发明实施例公开的一种客群识别装置的结构示意图;
图5为本发明实施例公开的另一种客群识别装置的结构示意图;
图6为本发明实施例公开的又一种客群识别装置的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1为本发明实施例公开的一种客群识别方法的流程图,参见图1所示,客群识别方法可以包括:
步骤101:将顾客的二维或三维轨迹数据降维压缩成为一维轨迹数据。
根据购物场地的不同,顾客的坐标数据维度不同。例如,在只有一层的购物中心,顾客的坐标数据可以为二维坐标数据;在包括数层的综合性购物商场,顾客的坐标数据可以是三维坐标数据。
每天的轨迹数据记录了每个顾客在商场中的轨迹,例如,记顾客数量为N,顾客i的轨迹为Ti,Ti为3维坐标点(xj,yj,zj),j∈{1,...,mi}的时间序列,其中mi为顾客i轨迹的长度,理想情况下,系统每秒钟记录顾客的轨迹一次,mi等于顾客逛店时间长度。xj,yj为每一层楼的2维坐标点,zj代表楼层。因此,顾客i在时间j的坐标点可以写为Tij=(xij,yij,zij)。
所述将顾客的二维或三维轨迹数据降维压缩成为一维数据,可以包括:将顾客的二维或三维轨迹数据降维压缩成为一维的进出店事件轨迹。本实施例中,首先进行轨迹压缩,结合商场的地图信息,将二维或三维轨迹压缩为一维进出店事件轨迹。具体的,可以将进出店事件分为两类,逛店为G,过店为P。对于逛店事件,可以通过逛店事件的进出店时间,计算逛店时长。最后记录店铺ID,Sk的逛店和过店时长作为一维进出店事件轨迹,例如,
Figure BDA0002253352370000041
表示顾客i首先经过店1,然后逛了店2三秒钟,再经过店4。
二维或三维轨迹映射后,会有两种情况,一种是过店,这种情况下,仅用一个相应的店铺ID表示;第二种是逛店,原本的二维或三维轨迹会有一串相对应的轨迹,本实施例中用逛店时长*店铺ID来表示,如此可以大大压缩原先的轨迹。
步骤101后,进入步骤102。
步骤102:采用预设算法确定不同顾客的一维轨迹数据的相似度,确定相似度达到预设值的顾客对信息,每一个所述顾客对信息中包括两个顾客。
本实施例中,在对顾客的二维或三维轨迹数据压缩后,可以采用预设算法对不同顾客的一维轨迹数据进行相似度计算,在较宽松的阈值下,进行客群关系的初步识别。
各种轨迹相似性的算法,会输出两两轨迹相似性的分值,通过设定阈值,将高于阈值的两条轨迹作为客群关系。因为是初步筛选的过程,所以需要用宽松的阈值(较低的阈值)将尽量多的客群关系候选轨迹筛选出来,之后再由精准识别来做最后的判断。
步骤103:针对每一个顾客对信息中的两个顾客,确定所述两个顾客的二维或三维轨迹数据之间的欧几里得距离。
经过对顾客轨迹数据的降维压缩,以及客群关系的初步识别,每个顾客对应的客群候选集大小已大大缩小。在此基础之上,继续计算原始的二维或三维坐标点轨迹之间的欧几里得距离,从而精确判断两者间是否存在群组关系,即通过公式
Figure BDA0002253352370000051
得到轨迹坐标点之间的欧几里得距离。
步骤104:在确定的所述两个顾客之间的欧几里得距离满足预设条件时,确定所述两个顾客为群组关系。
其中,所述预设条件可以根据需要自主配置。例如,步骤104具体可以是:在确定所述两个顾客之间的坐标距离在第一距离之内的次数超过预设次数,且最远距离不超过第二距离的情况下,确定所述两个顾客为群组关系。所述第一距离可以为1m,在相同时间情况下,如果两个顾客之间的坐标点距离小于1m的次数达到预设次数,且最远距离不超过第二距离的情况下,可以认为这两个顾客为结伴而行的顾客,即客群组合。
当然,根据欧几里得距离确定两个顾客是否为群组关系可以有多种实现。例如在上面的例子中,也可以将坐标距离在第一距离之内的次数变化为坐标距离在第一距离之内的累计时间。即如果两个顾客之间的欧几里得距离长时间处于第一距离之内时,也可以认为这两个顾客为群组关系。另一个例子中,也可以只考虑两个顾客之间的坐标距离在第一距离之内的情况,而不考虑两个顾客之间的最远距离,如顾客群组中一个顾客在店铺,另一个顾客去厕所的情况。
根据实际情况,可以选择距离小于约1米的点作为两个顾客距离非常近的点,假设两个顾客如果成组关系,那么他们之间这些近距离的点不会连续长时间出现,以此来判断群组关系。特殊的情况为陌生人之间一起坐扶梯或者等电梯,轨迹反应为长时间近距离,为了解决这一情况,可以考虑连续长时间近距离行走的次数作为另一个判断标准,即预设条件内容。
本实施例中,所述客群识别方法首先将顾客位置信息降维压缩处理后进行初步相似度判断,大大减少了后续计算数据量,然后再采用准确度高的欧几里得距离进一步对客群关系进行精准识别,从而保证了即高效、又精准的客群识别。
上述实施例中,所述采用预设算法确定不同顾客的一维轨迹数据的相似度,确定相似度达到预设值的顾客对信息,可以包括:采用最长公共子串算法或动态时间规整算法定不同顾客的一维轨迹数据的相似度,确定相似度达到预设值的顾客对信息。
最长公共子序列算法主要用来寻找两个序列中共同存在的长度最大的子序列,可以采用动态规划算法求解。设C[i,j]表示Si和Sj的最长公共子序列LCS的长度,可得到如下公式
Figure BDA0002253352370000061
上述公式中,C[i,j]为Si[0…i]和Sj[0…j]的最大公共子串长度,C[i-1,j-1]为Si[0…i-1]和Sj[0…j-1]的最大公共子串长度,Si和Sj分别为两条轨迹(一维轨迹),i和j表示两条轨迹,以及他们的长度,Sj[0…j-1]表示轨迹Sj中从0到j-1个元素。该公式是一个动态规划的公式,每个方程代表不同条件下的动态规划递推公式。
定义最长公共子序列之后,计算最长公共子序列的长度与两两轨迹中较短轨迹的长度之比作为轨迹相似性的度量,即
Figure BDA0002253352370000071
动态时间规整算法的优点是能够对两个序列的延展或者压缩由一定的适应性,在具体的场景中,由于即使是同一个群组的两个顾客,也存在着不同时间过店,逛店时间不同的情况,因此该算法能够比较健壮地适应本实施例的应用场景。动态时间规整算法的思想是找到能够两个轨迹间最小的规整距离,可以表示为
Figure BDA0002253352370000072
距离是指两条轨迹时间对应的情况下各个点之间的距离,规整距离是两条轨迹时间不能完全对应的情况下各个点之间的距离,例如A在17点进店,18点出店,而B在17:01进店,17:59出店,他们的规整距离约为0,而距离不为0。对于游逛商场的场景下,因为允许统一客群的人存在逛店时间略微不同的情况,所以需要用规整距离。上述公式中,wk是规整距离的第k个值。
在上述本发明公开的实施例的基础上,图2为本发明实施例公开的另一种客群识别方法的流程图,如图2所示,客群识别方法可以包括:
步骤201:将顾客的二维或三维轨迹数据降维压缩成为一维轨迹数据。
步骤202:基于顾客的逛店时间、逛店时长和楼层信息将一维轨迹数据进行客群过滤筛选。
若将降维压缩的过程视为提高计算性能的第一部优化,则基于顾客的逛店时间、逛店时长和楼层信息将一维轨迹数据进行客群过滤筛选的内容为提升计算性能的第二步优化。优化后的数据量大大减小,便于后续精准识别的快速进行。
步骤203:采用预设算法确定筛选后的不同顾客的一维轨迹数据的相似度,确定相似度达到预设值的顾客对信息,每一个所述顾客对信息中包括两个顾客。
步骤204:针对每一个顾客对信息中的两个顾客,确定所述两个顾客的二维或三维轨迹数据之间的欧几里得距离。
步骤205:在确定的所述两个顾客之间的欧几里得距离满足预设条件时,确定所述两个顾客为群组关系。
本实施例中,在确定两个顾客的二维或三维轨迹数据之间的欧几里得距离前,进行了两步数据优化,即降维压缩和一维轨迹数据的过滤筛选,过优化后数据量大大减小,压缩了后续的欧几里得距离计算过程的时间,提高了整体客群识别过程的速度。
图3为本发明实施例公开的又一种客群识别方法的流程图,参见图3所示,客群识别方法可以包括:
步骤301:将顾客的二维或三维轨迹数据降维压缩成为一维轨迹数据。
步骤302:采用预设算法确定不同顾客的一维轨迹数据的相似度,确定相似度达到预设值的顾客对信息,每一个所述顾客对信息中包括两个顾客。
步骤303:针对每一个顾客对信息中的两个顾客,确定所述两个顾客的二维或三维轨迹数据之间的欧几里得距离。
步骤304:在确定的所述两个顾客之间的欧几里得距离满足预设条件时,确定所述两个顾客为群组关系。
步骤305:基于所有的所述群组关系,采用并查集算法来获得包含多于两人的群组关系。
精准获得两两间顾客群组关系之后,考虑到同行顾客可能包含大于两人,或者跨天群组关系间存在着人与人之间的相关关系;本实施例中,采用并查集算法来获得包含多人的群组关系。并查集是一种树形数据结构,原本用于处理相对独立集合的合并跟查找问题。主要包含Find和Union操作,Find操作用于查找元素属于哪一个子集合,而Union操作将两个子集合合并成同一个集合。
本实施例中,确定了两两群组关系后,进一步确定包含多人的群组关系,更加贴近实际应用,能够快速精准的实现客群识别。
对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明所必须的。
上述本发明公开的实施例中详细描述了方法,对于本发明的方法可采用多种形式的装置实现,因此本发明还公开了一种装置,下面给出具体的实施例进行详细说明。
图4为本发明实施例公开的一种客群识别装置的结构示意图,参见图4所示,客群识别装置40可以包括:
降维压缩模块401,用于将顾客的二维或三维轨迹数据降维压缩成为一维轨迹数据。
根据购物场地的不同,顾客的坐标数据维度不同。例如,在只有一层的购物中心,顾客的坐标数据可以为二维坐标数据;在包括数层的综合性购物商场,顾客的坐标数据可以是三维坐标数据。
每天的轨迹数据记录了每个顾客在商场中的轨迹,例如,记顾客数量为N,顾客i的轨迹为Ti,Ti为3维坐标点(xj,yj,zj),j∈{1,...,mi}的时间序列,其中mi为顾客i轨迹的长度,理想情况下,系统每秒钟记录顾客的轨迹一次,mi等于顾客逛店时间长度。xj,yj为每一层楼的2维坐标点,zj代表楼层。因此,顾客i在时间j的坐标点可以写为Tij=(xij,yij,zij)。
所述降维压缩模块401具体可用于:将顾客的二维或三维轨迹数据降维压缩成为一维的进出店事件轨迹。本实施例中,首先进行轨迹压缩,结合商场的地图信息,将二维或三维轨迹压缩为一维进出店事件轨迹。具体的,可以将进出店事件分为两类,逛店为G,过店为P。对于逛店事件,可以通过逛店事件的进出店时间,计算逛店时长。最后记录店铺ID,Sk的逛店和过店时长作为一维进出店事件轨迹。
二维或三维轨迹映射后,会有两种情况,一种是过店,这种情况下,仅用一个相应的店铺ID表示;第二种是逛店,原本的二维或三维轨迹会有一串相对应的轨迹,本实施例中用逛店时长*店铺ID来表示,如此可以大大压缩原先的轨迹。
相似确定模块402,用于采用预设算法确定不同顾客的一维轨迹数据的相似度,确定相似度达到预设值的顾客对信息,每一个所述顾客对信息中包括两个顾客。
本实施例中,在对顾客的二维或三维轨迹数据压缩后,可以采用预设算法对不同顾客的一维轨迹数据进行相似度计算,在较宽松的阈值下,进行客群关系的初步识别。
各种轨迹相似性的算法,会输出两两轨迹相似性的分值,通过设定阈值,将高于阈值的两条轨迹作为客群关系。因为是初步筛选的过程,所以需要用宽松的阈值(较低的阈值)将尽量多的客群关系候选轨迹筛选出来,之后再由精准识别来做最后的判断。
距离确定模块403,用于针对每一个顾客对信息中的两个顾客,确定所述两个顾客的二维或三维轨迹数据之间的欧几里得距离。
经过对顾客轨迹数据的降维压缩,以及客群关系的初步识别,每个顾客对应的客群候选集大小已大大缩小。在此基础之上,继续计算原始的二维或三维坐标点轨迹之间的欧几里得距离,从而精确判断两者间是否存在群组关系。
精准确定模块404,用于在确定的所述两个顾客之间的欧几里得距离满足预设条件时,确定所述两个顾客为群组关系。
其中,所述预设条件可以根据需要自主配置。所述精准确定模块404具体可用于:在确定所述两个顾客之间的坐标距离在第一距离之内的次数超过预设次数,且最远距离不超过第二距离的情况下,确定所述两个顾客为群组关系。
当然,根据欧几里得距离确定两个顾客是否为群组关系可以有多种实现。例如在上面的例子中,也可以将坐标距离在第一距离之内的次数变化为坐标距离在第一距离之内的累计时间。即如果两个顾客之间的欧几里得距离长时间处于第一距离之内时,也可以认为这两个顾客为群组关系。另一个例子中,也可以只考虑两个顾客之间的坐标距离在第一距离之内的情况,而不考虑两个顾客之间的最远距离,如顾客群组中一个顾客在店铺,另一个顾客去厕所的情况。
本实施例中,所述客群识别装置首先将顾客位置信息降维压缩处理后进行初步相似度判断,大大减少了后续计算数据量,然后再采用准确度高的欧几里得距离进一步对客群关系进行精准识别,从而保证了即高效、又精准的客群识别。
上述实施例中,所述相似确定模块402具体可用于:采用最长公共子串算法或动态时间规整算法定不同顾客的一维轨迹数据的相似度,确定相似度达到预设值的顾客对信息。
最长公共子序列算法主要用来寻找两个序列中共同存在的长度最大的子序列,可以采用动态规划算法求解。
定义最长公共子序列之后,计算最长公共子序列的长度与两两轨迹中较短轨迹的长度之比作为轨迹相似性的度量。
动态时间规整算法的优点是能够对两个序列的延展或者压缩由一定的适应性,在具体的场景中,由于即使是同一个群组的两个顾客,也存在着不同时间过店,逛店时间不同的情况,因此该算法能够比较健壮地适应本实施例的应用场景。动态时间规整算法的思想是找到能够两个轨迹间最小的规整距离。
距离是指两条轨迹时间对应的情况下各个点之间的距离,规整距离是两条轨迹时间不能完全对应的情况下各个点之间的距离,例如A在17点进店,18点出店,而B在17:01进店,17:59出店,他们的规整距离约为0,而距离不为0。对于游逛商场的场景下,因为允许统一客群的人存在逛店时间略微不同的情况,所以需要用规整距离。
图5为本发明实施例公开的另一种客群识别装置的结构示意图,参见图5所示,客群识别装置50可以包括:
降维压缩模块401,用于将顾客的二维或三维轨迹数据降维压缩成为一维轨迹数据。
过滤筛选模块501,用于基于顾客的逛店时间、逛店时长和楼层信息将一维轨迹数据进行客群过滤筛选。
若将降维压缩的过程视为提高计算性能的第一部优化,则基于顾客的逛店时间、逛店时长和楼层信息将一维轨迹数据进行客群过滤筛选的内容为提升计算性能的第二步优化。优化后的数据量大大减小,便于后续精准识别的快速进行。
相似确定模块402,用于采用预设算法确定不同顾客的一维轨迹数据的相似度,确定相似度达到预设值的顾客对信息,每一个所述顾客对信息中包括两个顾客。
距离确定模块403,用于针对每一个顾客对信息中的两个顾客,确定所述两个顾客的二维或三维轨迹数据之间的欧几里得距离。
精准确定模块404,用于在确定的所述两个顾客之间的欧几里得距离满足预设条件时,确定所述两个顾客为群组关系。
本实施例中,在确定两个顾客的二维或三维轨迹数据之间的欧几里得距离前,进行了两步数据优化,即降维压缩和一维轨迹数据的过滤筛选,过优化后数据量大大减小,压缩了后续的欧几里得距离计算过程的时间,提高了整体客群识别过程的速度。
图6为本发明实施例公开的又一种客群识别装置的结构示意图,如图6所示,客群识别装置60可以包括:
降维压缩模块401,用于将顾客的二维或三维轨迹数据降维压缩成为一维轨迹数据。
相似确定模块402,用于采用预设算法确定不同顾客的一维轨迹数据的相似度,确定相似度达到预设值的顾客对信息,每一个所述顾客对信息中包括两个顾客。
距离确定模块403,用于针对每一个顾客对信息中的两个顾客,确定所述两个顾客的二维或三维轨迹数据之间的欧几里得距离;
精准确定模块404,用于在确定的所述两个顾客之间的欧几里得距离满足预设条件时,确定所述两个顾客为群组关系。
并查群组模块601,用于基于所有的所述群组关系,采用并查集算法来获得包含多于两人的群组关系。
精准获得两两间顾客群组关系之后,考虑到同行顾客可能包含大于两人,或者跨天群组关系间存在着人与人之间的相关关系;本实施例中,采用并查集算法来获得包含多人的群组关系。并查集是一种树形数据结构,原本用于处理相对独立集合的合并跟查找问题。主要包含Find和Union操作,Find操作用于查找元素属于哪一个子集合,而Union操作将两个子集合合并成同一个集合。
本实施例中,确定了两两群组关系后,进一步确定包含多人的群组关系,更加贴近实际应用,能够快速精准的实现客群识别。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (8)

1.一种客群识别方法,其特征在于,包括:
将顾客的二维或三维轨迹数据降维压缩成为一维轨迹数据;
采用预设算法确定不同顾客的一维轨迹数据的相似度,确定相似度达到预设值的顾客对信息,每一个所述顾客对信息中包括两个顾客;
针对每一个顾客对信息中的两个顾客,确定所述两个顾客的二维或三维轨迹数据之间的欧几里得距离;
在确定的所述两个顾客之间的欧几里得距离满足预设条件时,确定所述两个顾客为群组关系;
所述一维轨迹数据为包括过店事件和逛店事件的进出店事件轨迹数据,对于逛店事件,所述进出店事件轨迹数据包括逛店时长和店铺ID;对于过店事件,所述进出店事件轨迹数据包括店铺ID。
2.根据权利要求1所述的客群识别方法,其特征在于,在所述将顾客的二维或三维轨迹数据降维压缩成为一维轨迹数据后,还包括:
基于顾客的逛店时间、逛店时长和楼层信息将一维轨迹数据进行客群过滤筛选。
3.根据权利要求1所述的客群识别方法,其特征在于,在所述在确定的所述两个顾客之间的欧几里得距离满足预设条件时,确定所述两个顾客为群组关系后,还包括:
基于所有的所述群组关系,采用并查集算法来获得包含多于两人的群组关系。
4.根据权利要求1所述的客群识别方法,其特征在于,所述采用预设算法确定不同顾客的一维轨迹数据的相似度,确定相似度达到预设值的顾客对信息,包括:
采用最长公共子串算法或动态时间规整算法定不同顾客的一维轨迹数据的相似度,确定相似度达到预设值的顾客对信息。
5.根据权利要求1所述的客群识别方法,其特征在于,所述在确定的所述两个顾客之间的欧几里得距离满足预设条件时,确定所述两个顾客为群组关系,包括:
在确定所述两个顾客之间的坐标距离在第一距离之内的次数超过预设次数,且最远距离不超过第二距离的情况下,确定所述两个顾客为群组关系。
6.一种客群识别装置,其特征在于,包括:
降维压缩模块,用于将顾客的二维或三维轨迹数据降维压缩成为一维轨迹数据;
相似确定模块,用于采用预设算法确定不同顾客的一维轨迹数据的相似度,确定相似度达到预设值的顾客对信息,每一个所述顾客对信息中包括两个顾客;
距离确定模块,用于针对每一个顾客对信息中的两个顾客,确定所述两个顾客的二维或三维轨迹数据之间的欧几里得距离;
精准确定模块,用于在确定的所述两个顾客之间的欧几里得距离满足预设条件时,确定所述两个顾客为群组关系;
所述一维轨迹数据为包括过店事件和逛店事件的进出店事件轨迹数据,对于逛店事件,所述进出店事件轨迹数据包括逛店时长和店铺ID;对于过店事件,所述进出店事件轨迹数据包括店铺ID。
7.根据权利要求6所述的客群识别装置,其特征在于,还包括:
并查群组模块,用于基于所有的所述群组关系,采用并查集算法来获得包含多于两人的群组关系。
8.根据权利要求6所述的客群识别装置,其特征在于,所述相似确定模块具体用于:采用最长公共子串算法或动态时间规整算法定不同顾客的一维轨迹数据的相似度,确定相似度达到预设值的顾客对信息。
CN201911042947.8A 2019-10-30 2019-10-30 一种客群识别方法及装置 Active CN110796494B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911042947.8A CN110796494B (zh) 2019-10-30 2019-10-30 一种客群识别方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911042947.8A CN110796494B (zh) 2019-10-30 2019-10-30 一种客群识别方法及装置

Publications (2)

Publication Number Publication Date
CN110796494A CN110796494A (zh) 2020-02-14
CN110796494B true CN110796494B (zh) 2022-09-27

Family

ID=69442003

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911042947.8A Active CN110796494B (zh) 2019-10-30 2019-10-30 一种客群识别方法及装置

Country Status (1)

Country Link
CN (1) CN110796494B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111324338B (zh) * 2020-02-17 2024-03-26 苏宁云计算有限公司 一种客群创建方法和系统
CN111340002B (zh) * 2020-03-25 2023-10-27 北京爱笔科技有限公司 一种提袋识别方法及装置
CN113095209B (zh) * 2021-04-07 2024-05-31 深圳海智创科技有限公司 一种客流的人群识别方法、系统及电子设备

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107229940A (zh) * 2016-03-25 2017-10-03 阿里巴巴集团控股有限公司 数据伴随分析方法及装置
CN109947793A (zh) * 2019-03-20 2019-06-28 深圳市北斗智能科技有限公司 伴随关系的分析方法、装置和存储介质

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6444813B2 (ja) * 2015-06-11 2018-12-26 株式会社日立製作所 分析システム、及び、分析方法
CN108537241A (zh) * 2017-03-02 2018-09-14 镇江雅迅软件有限责任公司 一种楼宇运动物体轨迹相似性度量方法
CN108122310A (zh) * 2017-11-20 2018-06-05 电子科技大学 一种基于WiFi信道状态信息和动态时间规整的人流量统计方法
CN109167805B (zh) * 2018-07-09 2021-08-10 同济大学 基于城市场景中车联网时空数据的分析处理方法
CN109784162B (zh) * 2018-12-12 2021-04-13 成都数之联科技有限公司 一种行人行为识别及轨迹跟踪方法
CN109934099A (zh) * 2019-01-24 2019-06-25 北京明略软件系统有限公司 放置位置的提示方法及装置、存储介质、电子装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107229940A (zh) * 2016-03-25 2017-10-03 阿里巴巴集团控股有限公司 数据伴随分析方法及装置
CN109947793A (zh) * 2019-03-20 2019-06-28 深圳市北斗智能科技有限公司 伴随关系的分析方法、装置和存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
轨迹数据相似性查询及其应用研究;龚旭东;《中国优秀博硕士学位论文全文数据库(博士) 信息科技辑》;20150915(第9期);第I138-11页 *

Also Published As

Publication number Publication date
CN110796494A (zh) 2020-02-14

Similar Documents

Publication Publication Date Title
CN110796494B (zh) 一种客群识别方法及装置
Kumar et al. F-DES: Fast and deep event summarization
US9934447B2 (en) Object detection and classification
US8301498B1 (en) Video content analysis for automatic demographics recognition of users and videos
US11443015B2 (en) Generating prediction models in accordance with any specific data sets
US8867891B2 (en) Video concept classification using audio-visual grouplets
US8699852B2 (en) Video concept classification using video similarity scores
US11748401B2 (en) Generating congruous metadata for multimedia
US20130251201A1 (en) System and method for recommending buddies in social network
EP2642427A2 (en) Video concept classification using temporally-correlated grouplets
CN110399835B (zh) 一种人员停留时间的分析方法、装置及系统
CN102165464A (zh) 用于对视频内容中的人进行自动注释的方法和系统
CN109871464A (zh) 一种基于ucl语义标引的视频推荐方法与装置
CN110610182A (zh) 用户轨迹相似度判断方法和相关装置
CN111583332B (zh) 基于并行搜索2d-3d匹配的视觉定位方法、系统、装置
CN114969525B (zh) 音乐社交推荐方法、系统、装置及存储介质
KR101743169B1 (ko) 얼굴 정보를 이용한 실종 가족 찾기 시스템 및 방법 그리고 이를 구현하는 프로그램을 기록한 기록 매체
Kaiser et al. Multiple hypotheses at multiple scales for audio novelty computation within music
CN114925239B (zh) 基于人工智能的智慧教育目标视频大数据检索方法及系统
CN112989105A (zh) 一种音乐结构的分析方法及系统
CN112925948A (zh) 视频处理方法及其装置、介质、芯片和电子设备
CN113448876A (zh) 一种业务测试方法、装置、计算机设备及存储介质
CN112949538B (zh) 一种目标关联方法、装置、电子设备及机器可读存储介质
CN114241238A (zh) 一种基于改进PointNet的轨迹数据出行方式识别方法和装置
Noor et al. Relation mining using cross correlation of multi domain social networks

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant