CN111311305A - 基于用户轨迹解析用户公共流量带的方法及系统 - Google Patents
基于用户轨迹解析用户公共流量带的方法及系统 Download PDFInfo
- Publication number
- CN111311305A CN111311305A CN202010054759.3A CN202010054759A CN111311305A CN 111311305 A CN111311305 A CN 111311305A CN 202010054759 A CN202010054759 A CN 202010054759A CN 111311305 A CN111311305 A CN 111311305A
- Authority
- CN
- China
- Prior art keywords
- user
- line segment
- house
- distance
- moving track
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 238000000034 method Methods 0.000 title claims abstract description 46
- 238000001914 filtration Methods 0.000 claims abstract description 9
- 238000004590 computer program Methods 0.000 claims description 9
- 238000004364 calculation method Methods 0.000 claims description 4
- 238000010586 diagram Methods 0.000 description 18
- 238000004891 communication Methods 0.000 description 7
- 230000006870 function Effects 0.000 description 5
- 230000003287 optical effect Effects 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 239000000835 fiber Substances 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 230000006399 behavior Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 239000004576 sand Substances 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0631—Resource planning, allocation, distributing or scheduling for enterprises or organisations
- G06Q10/06315—Needs-based resource requirements planning or analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0645—Rental transactions; Leasing transactions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/16—Real estate
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Strategic Management (AREA)
- Human Resources & Organizations (AREA)
- Accounting & Taxation (AREA)
- Development Economics (AREA)
- Finance (AREA)
- Economics (AREA)
- Marketing (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Tourism & Hospitality (AREA)
- Game Theory and Decision Science (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- Primary Health Care (AREA)
- Educational Administration (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Traffic Control Systems (AREA)
Abstract
本发明公开了一种基于用户轨迹解析用户公共流量带的方法及系统,所述方法包括:获取用户在预设时间窗口内的用户数据;根据带看房源对应的日期,对用户在预设时间窗口内的带看房源的经纬度坐标点进行拼接,得到用户的移动轨迹;对移动轨迹进行去噪处理,组成优化移动轨迹集合;对优化移动轨迹集合进行聚类,得到结果簇;滤除移动轨迹数量小于第一预设阈值的结果簇,并根据剩余的结果簇确定用户公共流量带。由于用户数据中包括用户的用户标识、用户在预设时间窗口内的带看房源的经纬度坐标点以及带看房源对应的日期,因此可以通过绘制用户的移动轨迹发现用户群体的公共偏好并聚类得到公共流量带,使房源区域的划分以及房源的分配更加合理。
Description
技术领域
本发明涉及互联网领域,更具体地,涉及一种基于用户轨迹解析用户公共流量带的方法及系统。
背景技术
在长租公寓领域,只有及时了解客户信息,才能根据客户偏好提供符合其要求的房源。
为了明确客户的具体需求,现有技术在房产经纪人约见用户实地看房的过程中,通过用户手机获取用户所处的经纬度坐标点,然后对获取的经纬度坐标点进行聚类,聚类后可以得到多个结果簇,每个结果簇即为对应的一个公共流量带。
但是,上述方法获取的经纬度信息只能反映用户当前的具体位置,并不能在分析流量带时,直接识别用户的群体偏好;并且,对经纬度坐标点聚类后得到的结果簇也只能反映出每个用户当前带看房源的信息,而不能将不同日期的带看房源对应的经纬度坐标点串联起来得到移动轨迹,因此无法发现用户群体的共同行为和公共偏好区域,导致解析出的用户公共流量带不准确,进而影响房源区域的划分。
发明内容
本发明提供了一种基于用户轨迹解析用户公共流量带的方法及系统,能够根据用户轨迹解析出用户的公共流量带,从而更准确的对房源区域进行划分,优化带客时的通勤时间。
第一方面,本申请提供一种基于用户轨迹解析用户公共流量带的方法,所述方法包括:
获取用户在预设时间窗口内的用户数据;所述用户数据包括用户标识、用户在所述预设时间窗口内的带看房源的经纬度坐标点,以及所述带看房源对应的日期;
根据带看房源对应的日期,对用户在所述预设时间窗口内的带看房源的经纬度坐标点进行拼接,得到用户的移动轨迹;
对所述移动轨迹进行去噪处理,将去噪处理后的移动轨迹组成优化移动轨迹集合;
对所述优化移动轨迹集合进行聚类,得到结果簇;
滤除移动轨迹数量小于第一预设阈值的结果簇,并根据剩余的结果簇确定用户公共流量带。
可选地,所述根据带看房源对应的日期,对用户在所述预设时间窗口内的带看房源的经纬度坐标点进行拼接,得到用户的移动轨迹的步骤,包括:
在二维平面直角坐标系内,根据带看房源对应的日期,利用线段依次连接所述经纬度坐标点,得到用户的移动轨迹;所述二维平面直角坐标系中,横轴和纵轴分别代表带看房源的纬度和经度。
可选地,所述对所述移动轨迹进行去噪处理,将去噪处理后的移动轨迹组成优化移动轨迹集合的步骤,包括:
针对用户的移动轨迹,计算第i条线段与第i+1条线段之间的垂直距离、平行距离和角距离;
根据所述垂直距离、平行距离和角距离,确定所述第i条线段与第i+1条线段之间的第一距离;
判断所述第一距离是否小于等于第二预设阈值;如果是,则将所述第i条线段与第i+1条线段合并。
可选地,按照如下公式计算所述第i条线段与第i+1条线段之间的垂直距离:
其中,L⊥1、L⊥2分别表示所述第i+1条线段的第一端点和第二端点到所述第i条线段之间的距离,d⊥(Li,Li+1)为计算得到的所述第i条线段与第i+1条线段之间的垂直距离。
可选地,按照如下公式计算所述第i条线段与第i+1条线段之间的平行距离:
d||(Li,Li+1)=min(L||1,L||2)
式中,L||1表示所述第i+1条线段的第一端点在所述第i条线段上的第一垂点距离所述第i条线段的第一端点的距离,L||2表示所述第i+1条线段的第二端点在所述第i条线段上的第二垂点距离所述第i条线段的第二端点的距离,d||(Li,Li+1)为计算得到的所述第i条线段与第i+1条线段之间的平行距离。
可选地,按照如下公式计算所述第i条线段与第i+1条线段之间的角距离:
式中,θ表示所述第i条线段与第i+1条线段之间的夹角,||Li+1||表示所述第i+1条线段的模,dθ(Li,Li+1)为计算得到的所述第i条线段与第i+1条线段之间的角距离。
可选地,按照如下公式计算第一距离:
dist(Li,Li+1)=w⊥·d⊥(Li,Li+1)+w||·d||(Li,Li+1)+wθ·dθ(Li,Li+1)
式中,w⊥、w||和wθ分别为第一预设权重、第二预设权重和第三预设权重,d⊥(Li,Li+1)、d||(Li,Li+1)和dθ(Li,Li+1)分别表示所述第i条线段与第i+1条线段之间的垂直距离、平行距离和角距离,dist(Li,Li+1)为所述第i条线段与第i+1条线段之间的第一距离。
第二方面,本申请提供一种基于用户轨迹解析用户公共流量带的系统,所述系统包括:
获取模块,用于获取用户在预设时间窗口内的用户数据;所述用户数据包括用户标识、用户在所述预设时间窗口内的带看房源的经纬度坐标点,以及所述带看房源对应的日期;
拼接模块,用于根据带看房源对应的日期,对用户在所述预设时间窗口内的带看房源的经纬度坐标点进行拼接,得到用户的移动轨迹;
去噪模块,用于对所述移动轨迹进行去噪处理,将去噪处理后的移动轨迹组成优化移动轨迹集合;
聚类模块,用于对所述优化移动轨迹集合进行聚类,得到结果簇;
确定模块,用于滤除移动轨迹数量小于第一预设阈值的结果簇,并根据剩余的结果簇确定用户公共流量带。
第三方面,本申请提供一种电子设备,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如上述第一方面中任一所述的方法。
第四方面,本申请提供一种计算机可读介质,其上存储有计算机程序,所述程序被处理器执行时实现如上述第一方面中任一所述的方法。
与现有技术相比,本发明提供的一种基于用户轨迹解析用户公共流量带的方法及系统,至少实现了如下的有益效果:
本申请所提供的基于用户轨迹解析用户公共流量带的方法及系统,通过获取用户在预设时间窗口内的用户数据;根据带看房源对应的日期,对用户在预设时间窗口内的带看房源的经纬度坐标点进行拼接,得到用户的移动轨迹;对移动轨迹进行去噪处理,将去噪处理后的移动轨迹组成优化移动轨迹集合;对优化移动轨迹集合进行聚类,得到结果簇;滤除移动轨迹数量小于第一预设阈值的结果簇,并根据剩余的结果簇确定用户公共流量带。由于用户数据中包括用户的用户标识、用户在预设时间窗口内的带看房源的经纬度坐标点,以及带看房源对应的日期,因此可以通过绘制用户在预设时间窗口内的移动轨迹发现用户群体的公共偏好,并聚类得到公共流量带,使房源区域的划分以及房源的分配更加合理。
当然,实施本发明的任一产品必不特定需要同时达到以上所述的所有技术效果。
通过以下参照附图对本发明的示例性实施例的详细描述,本发明的其它特征及其优点将会变得清楚。
附图说明
被结合在说明书中并构成说明书的一部分的附图示出了本发明的实施例,并且连同其说明一起用于解释本发明的原理。
图1所示为本申请实施例所提供的基于用户轨迹解析用户公共流量带的方法的一种流程图;
图2所示为图1实施例所提供的基于用户轨迹解析用户公共流量带的方法的一种示意图;
图3所示为图1实施例所提供的基于用户轨迹解析用户公共流量带的方法的另一种示意图;
图4所示为图1实施例所提供的基于用户轨迹解析用户公共流量带的方法的又一种示意图;
图5所示为图1实施例所提供的基于用户轨迹解析用户公共流量带的方法的再一种示意图;
图6所示为本申请实施例所提供的基于用户轨迹解析用户公共流量带的方法的一种结构示意图;
图7所示为本申请实施例所提供的可以应用于其中的示例性系统架构图;
图8所示为本申请实施例所提供的适于用来实现本申请实施例的终端设备或服务器的计算机系统的结构示意图。
具体实施方式
现在将参照附图来详细描述本发明的各种示例性实施例。应注意到:除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本发明的范围。
以下对至少一个示例性实施例的描述实际上仅仅是说明性的,决不作为对本发明及其应用或使用的任何限制。
对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论,但在适当情况下,所述技术、方法和设备应当被视为说明书的一部分。
在这里示出和讨论的所有例子中,任何具体值应被解释为仅仅是示例性的,而不是作为限制。因此,示例性实施例的其它例子可以具有不同的值。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步讨论。
本发明提供了一种基于用户轨迹解析用户公共流量带的方法,能够更加准确地划分房源区域,优化带看时的通勤时间。
以下将结合附图和具体实施例进行详细说明。
图1所示为本申请实施例所提供的基于用户轨迹解析用户公共流量带的方法的一种流程图。请参见图1,基于用户轨迹解析用户公共流量带的方法包括:
步骤101、获取用户在预设时间窗口内的用户数据;用户数据包括用户标识、用户在预设时间窗口内的带看房源的经纬度坐标点,以及带看房源对应的日期;
步骤102、根据带看房源对应的日期,对用户在预设时间窗口内的带看房源的经纬度坐标点进行拼接,得到用户的移动轨迹;
步骤103、对移动轨迹进行去噪处理,将去噪处理后的移动轨迹组成优化移动轨迹集合;
步骤104、对优化移动轨迹集合进行聚类,得到结果簇;
步骤105、滤除移动轨迹数量小于第一预设阈值的结果簇,并根据剩余的结果簇确定用户公共流量带。
其中,预设时间窗口可以根据实际应用中所需用户数据的数据量来确定。本实施例中,将预设时间窗口设置为三个月。
示例性地,用户数据具体可以如表1所示:
表1
参见表1,用户标识为011的用户在预设时间窗口内的带看房源有两个,分别是2019年12月12日带看的位于[31.268519,121.578779]处的房源1,以及在2019年12月15日带看的位于[59.879351,138.116532]的房源2。
可见,通过获取用户数据,有助于了解用户租房或买房的房源意向,能够使后续划分的房源区域更加准确。
获取用户数据后,在坐标系内绘制用户的移动轨迹,该移动轨迹反映了用户在带看房源时的路径。为了避免用户数据中携带的噪声降低数据准确性,可以先去除用户的移动轨迹上的噪声点,再进一步对优化移动轨迹集合进行聚类。
可选地,上述步骤102中,根据带看房源对应的日期,对用户在预设时间窗口内的带看房源的经纬度坐标点进行拼接,得到用户的移动轨迹的步骤,包括:
在二维平面直角坐标系内,根据带看房源对应的日期,利用线段依次连接经纬度坐标点,得到用户的移动轨迹;二维平面直角坐标系中,横轴和纵轴分别代表每个带看房源的纬度和经度。
图2所示为图1实施例所提供的基于用户轨迹解析用户公共流量带的方法的一种示意图。请参见图2,图中黑色圆圈表示用户在预设时间窗口内的带看房源的经纬度坐标点,按照带看房源对应的日期,用线段依次连接各个经纬度坐标点(如图2中虚线所示),即可得到用户在预设时间窗口内的移动轨迹。
可选地,上述步骤103中,对移动轨迹进行去噪处理,将去噪处理后的移动轨迹组成优化移动轨迹集合的步骤,包括:
针对用户的移动轨迹,计算第i条线段与第i+1条线段之间的垂直距离、平行距离和角距离;
根据垂直距离、平行距离和角距离,确定第i条线段与第i+1条线段之间的第一距离;
判断所述第一距离是否小于等于第二预设阈值;如果是,则将第i条线段与第i+1条线段合并。
图3所示为图1实施例所提供的基于用户轨迹解析用户公共流量带的方法的另一种示意图。具体地,请参见图3,第i条线段包括第一端点A和第二端点B,第i+1条线段包括第一端点C和第二端点D;其中,第i条线段的第二端点B与第i+1条线段的第一端点C重合。当第i条线段与第i+1条线段之间的第一距离小于等于第二预设阈值时,则可以直接将第i条线段的第一端点A与第i+1条线段的第二端点D相连,得到的线段AD即为优化移动轨迹。
进一步地,请再次参见图2,图中实线为进行去噪处理后获得的优化移动轨迹。可以理解的是,由于用户在预设时间窗口内可能查看了多处房源,因而移动轨迹中可能存在折返、重合等噪声数据,如果直接将绘制出的移动轨迹用于划分房源区域,噪声所形成的杂乱轨迹会极大地影响聚类结果。
图4所示为图1实施例所提供的基于用户轨迹解析用户公共流量带的方法的又一种示意图。请参见图4,第i条线段与第i+1条线段之间的垂直距离可以按照如下公式计算:
式中,L⊥1、L⊥2分别表示第i+1条线段的第一端点Sj和第二端点ej到第i条线段之间的距离,d⊥(Li,Li+1)为计算得到的第i条线段与第i+1条线段之间的垂直距离。
第i条线段与第i+1条线段之间的平行距离可以按照如下公式计算:
d||(Li,Li+1)=min(L||1,L||2)
式中,L||1表示第i+1条线段的第一端点Sj在第i条线段上的第一垂点Ps距离第i条线段的第一端点Qs的距离(即线段QsPs),L||2表示第i+1条线段的第二端点ej在第i条线段上的第二垂点Pe距离第i条线段的第二端点Qe的距离(即线段PeQe),d||(Li,Li+1)为计算得到的第i条线段与第i+1条线段之间的平行距离。
可选地,按照如下公式计算第i条线段与第i+1条线段之间的角距离:
式中,θ表示第i条线段与第i+1条线段之间的夹角,||Li+1||表示第i+1条线段的模,dθ(Li,Li+1)为计算得到的第i条线段与第i+1条线段之间的角距离。
如图4所示,第i+1条线段的第一端点Sj在第i条线段上的垂点ps,以及第i+1条线段的第二端点ej在第i条线段上的垂点pe分别采用如下公式计算获得:
可选地,按照如下公式计算第一距离:
dist(Li,Li+1)
=w⊥·d⊥(Li,Li+1)+w||·d||(Li,Li+1)+wθ·dθ(Li,Li+1)
式中,w⊥、w||和wθ分别为第一预设权重、第二预设权重和第三预设权重,d⊥(Li,Li+1)、d||(Li,Li+1)和dθ(Li,Li+1)分别表示第i条线段与第i+1条线段之间的垂直距离、平行距离和角距离,dist(Li,Li+1)为第i条线段与第i+1条线段之间的第一距离。
图5所示为图1实施例所提供的基于用户轨迹解析用户公共流量带的方法的再一种示意图。请参见图5,进一步对获得的优化移动轨迹集合进行聚类,由于得到的结果簇中,移动轨迹数量小于第一预设阈值的结果簇无法表征用户群体的整体偏好,因而可以被滤除,得到的三个剩余结果簇如图5所示,每个剩余结果簇的聚类中心即为划分房源区域时的区域中心,根据横纵坐标轴可以得到区域中心的经纬度信息。
本申请所提供的基于用户轨迹解析用户公共流量带的方法及系统,通过获取用户在预设时间窗口内的用户数据;根据带看房源对应的日期,对用户在预设时间窗口内的带看房源的经纬度坐标点进行拼接,得到用户的移动轨迹;对移动轨迹进行去噪处理,将去噪处理后的移动轨迹组成优化移动轨迹集合;对优化移动轨迹集合进行聚类,得到结果簇;滤除移动轨迹数量小于第一预设阈值的结果簇,并根据剩余的结果簇确定用户公共流量带。由于用户数据中包括用户的用户标识、用户在预设时间窗口内的带看房源的经纬度坐标点,以及带看房源对应的日期,因此可以通过绘制用户在预设时间窗口内的移动轨迹发现用户群体的公共偏好,并聚类得到公共流量带,使房源区域的划分以及房源的分配更加合理。
基于同一发明构思,本申请还提供一种基于用户轨迹解析用户公共流量带的系统。图6所示为本申请实施例所提供的基于用户轨迹解析用户公共流量带的系统的一种结构示意图,请参见图6,该系统包括:
获取模块610,用于获取用户在预设时间窗口内的用户数据;所述用户数据包括用户标识、用户在所述预设时间窗口内的带看房源的经纬度坐标点,以及所述带看房源对应的日期;
拼接模块620,用于根据带看房源对应的日期,对用户在所述预设时间窗口内的带看房源的经纬度坐标点进行拼接,得到用户的移动轨迹;
去噪模块630,用于对所述移动轨迹进行去噪处理,将去噪处理后的移动轨迹组成优化移动轨迹集合;
聚类模块640,用于对所述优化移动轨迹集合进行聚类,得到结果簇;
确定模块650,用于滤除移动轨迹数量小于第一预设阈值的结果簇,并根据剩余的结果簇确定用户公共流量带。
由于用户数据中包括用户的用户标识、用户在预设时间窗口内的带看房源的经纬度坐标点,以及带看房源对应的日期,因此可以通过绘制用户在预设时间窗口内的移动轨迹发现用户群体的公共偏好,并聚类得到公共流量带,使房源区域的划分以及房源的分配更加合理。
图7所示为可以应用本发明实施例提供的基于用户轨迹解析用户公共流量带的方法或系统的示例性系统架构。
如图7所示,系统架构700可以包括终端设备701、702、703,网络704和服务器705。网络704用以在终端设备701、702、703和服务器705之间提供通信链路的介质。网络704可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户可以使用终端设备701、702、703通过网络704与服务器705交互,以接收或发送消息等。终端设备701、702、707上可以安装有各种通讯客户端应用,例如购物类应用、网页浏览器应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等(仅为示例)。
终端设备701、702、703可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。
服务器705可以是提供各种服务的服务器,例如对用户利用终端设备701、702、703所浏览的购物类网站提供支持的后台管理服务器(仅为示例)。后台管理服务器可以对接收到的产品信息查询请求等数据进行分析等处理,并将处理结果(例如目标推送信息、产品信息--仅为示例)反馈给终端设备。
需要说明的是,本发明实施例所提供的基于用户轨迹解析用户公共流量带的方法一般由服务器705执行,相应地,基于用户轨迹解析用户公共流量带的系统一般设置于服务器705中。
应该理解,图7中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
下面参考图8,其示出了适于用来实现本发明实施例的终端设备的计算机系统800的结构示意图。图8示出的终端设备仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图8所示,计算机系统800包括中央处理单元(CPU)801,其可以根据存储在只读存储器(ROM)802中的程序或者从存储部分808加载到随机访问存储器(RAM)803中的程序而执行各种适当的动作和处理。在RAM 803中,还存储有系统800操作所需的各种程序和数据。CPU 801、ROM 802以及RAM 803通过总线804彼此相连。输入/输出(I/O)接口805也连接至总线804。
以下部件连接至I/O接口805:包括键盘、鼠标等的输入部分806;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分807;包括硬盘等的存储部分808;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分809。通信部分809经由诸如因特网的网络执行通信处理。驱动器810也根据需要连接至I/O接口805。可拆卸介质811,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器810上,以便于从其上读出的计算机程序根据需要被安装入存储部分808。
特别地,根据本发明公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本发明公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分809从网络上被下载和安装,和/或从可拆卸介质811被安装。在该计算机程序被中央处理单元(CPU)801执行时,执行本发明的系统中限定的上述功能。
需要说明的是,本发明所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本发明中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本发明中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。
附图中的流程图和框图,图示了按照本发明各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本发明实施例中所涉及到的模块可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的模块也可以设置在处理器中,例如,可以描述为:一种处理器包括获取模块、拼接模块、去除模块、聚类模块、和划分模块。其中,这些模块的名称在某种情况下并不构成对该模块本身的限定。
作为另一方面,本发明还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的设备中所包含的;也可以是单独存在,而未装配入该设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被一个该设备执行时,使得该设备包括:
获取用户在预设时间窗口内的用户数据;所述用户数据包括用户标识、用户在所述预设时间窗口内的带看房源的经纬度坐标点,以及所述带看房源对应的日期;
根据带看房源对应的日期,对用户在所述预设时间窗口内的带看房源的经纬度坐标点进行拼接,得到用户的移动轨迹;
对所述移动轨迹进行去噪处理,将去噪处理后的移动轨迹组成优化移动轨迹集合;
对所述优化移动轨迹集合进行聚类,得到结果簇;
滤除移动轨迹数量小于第一预设阈值的结果簇,并根据剩余的结果簇确定用户公共流量带。
虽然已经通过例子对本发明的一些特定实施例进行了详细说明,但是本领域的技术人员应该理解,以上例子仅是为了进行说明,而不是为了限制本发明的范围。本领域的技术人员应该理解,可在不脱离本发明的范围和精神的情况下,对以上实施例进行修改。本发明的范围由所附权利要求来限定。
虽然已经通过例子对本发明的一些特定实施例进行了详细说明,但是本领域的技术人员应该理解,以上例子仅是为了进行说明,而不是为了限制本发明的范围。本领域的技术人员应该理解,可在不脱离本发明的范围和精神的情况下,对以上实施例进行修改。本发明的范围由所附权利要求来限定。
Claims (10)
1.一种基于用户轨迹解析用户公共流量带的方法,其特征在于,所述方法包括:
获取用户在预设时间窗口内的用户数据;所述用户数据包括用户标识、用户在所述预设时间窗口内的带看房源的经纬度坐标点,以及所述带看房源对应的日期;
根据带看房源对应的日期,对用户在所述预设时间窗口内的带看房源的经纬度坐标点进行拼接,得到用户的移动轨迹;
对所述移动轨迹进行去噪处理,将去噪处理后的移动轨迹组成优化移动轨迹集合;
对所述优化移动轨迹集合进行聚类,得到结果簇;
滤除移动轨迹数量小于第一预设阈值的结果簇,并根据剩余的结果簇确定用户公共流量带。
2.根据权利要求1所述的基于用户轨迹解析用户公共流量带的方法,其特征在于,所述根据带看房源对应的日期,对用户在所述预设时间窗口内的带看房源的经纬度坐标点进行拼接,得到用户的移动轨迹的步骤,包括:
在二维平面直角坐标系内,根据带看房源对应的日期,利用线段依次连接所述经纬度坐标点,得到用户的移动轨迹;所述二维平面直角坐标系中,横轴和纵轴分别代表带看房源的纬度和经度。
3.根据权利要求2所述的基于用户轨迹解析用户公共流量带的方法,其特征在于,所述对所述移动轨迹进行去噪处理,将去噪处理后的移动轨迹组成优化移动轨迹集合的步骤,包括:
针对用户的移动轨迹,计算第i条线段与第i+1条线段之间的垂直距离、平行距离和角距离;
根据所述垂直距离、平行距离和角距离,确定所述第i条线段与第i+1条线段之间的第一距离;
判断所述第一距离是否小于等于第二预设阈值;如果是,则将所述第i条线段与第i+1条线段合并。
5.根据权利要求3所述的基于用户轨迹解析用户公共流量带的方法,其特征在于,按照如下公式计算所述第i条线段与第i+1条线段之间的平行距离:
d||(Li,Li+1)=min(L||1,L||2)
式中,L||1表示所述第i+1条线段的第一端点在所述第i条线段上的第一垂点距离所述第i条线段的第一端点的距离,L||2表示所述第i+1条线段的第二端点在所述第i条线段上的第二垂点距离所述第i条线段的第二端点的距离,d||(Li,Li+1)为计算得到的所述第i条线段与第i+1条线段之间的平行距离。
7.根据权利要求3所述的基于用户轨迹解析用户公共流量带的方法,其特征在于,按照如下公式计算第一距离:
dist(Li,Li+1)=w⊥·d⊥(Li,Li+1)+w||·d||(Li,Li+1)+wθ·dθ(Li,Li+1)
式中,w⊥、w||和wθ分别为第一预设权重、第二预设权重和第三预设权重,d⊥(Li,Li+1)、d||(Li,Li+1)和dθ(Li,Li+1)分别表示所述第i条线段与第i+1条线段之间的垂直距离、平行距离和角距离,dist(Li,Li+1)为所述第i条线段与第i+1条线段之间的第一距离。
8.一种基于用户轨迹解析用户公共流量带的系统,其特征在于,所述系统包括:
获取模块,用于获取用户在预设时间窗口内的用户数据;所述用户数据包括用户标识、用户在所述预设时间窗口内的带看房源的经纬度坐标点,以及所述带看房源对应的日期;
拼接模块,用于根据带看房源对应的日期,对用户在所述预设时间窗口内的带看房源的经纬度坐标点进行拼接,得到用户的移动轨迹;
去噪模块,用于对所述移动轨迹进行去噪处理,将去噪处理后的移动轨迹组成优化移动轨迹集合;
聚类模块,用于对所述优化移动轨迹集合进行聚类,得到结果簇;
确定模块,用于滤除移动轨迹数量小于第一预设阈值的结果簇,并根据剩余的结果簇确定用户公共流量带。
9.一种电子设备,其特征在于,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-7中任一所述的方法。
10.一种计算机可读介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现如权利要求1-7中任一所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010054759.3A CN111311305A (zh) | 2020-01-17 | 2020-01-17 | 基于用户轨迹解析用户公共流量带的方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010054759.3A CN111311305A (zh) | 2020-01-17 | 2020-01-17 | 基于用户轨迹解析用户公共流量带的方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111311305A true CN111311305A (zh) | 2020-06-19 |
Family
ID=71150942
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010054759.3A Withdrawn CN111311305A (zh) | 2020-01-17 | 2020-01-17 | 基于用户轨迹解析用户公共流量带的方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111311305A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2022095351A1 (zh) * | 2020-11-06 | 2022-05-12 | 平安科技(深圳)有限公司 | 目标区域划分方法、装置、电子设备及存储介质 |
CN116402329A (zh) * | 2023-04-12 | 2023-07-07 | 江苏新合益机械有限公司 | 一种活塞杆生产车间的智能管理方法及系统 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109377329A (zh) * | 2018-12-25 | 2019-02-22 | 北京时光荏苒科技有限公司 | 一种房源推荐方法、装置、存储介质及电子设备 |
CN109949123A (zh) * | 2019-02-12 | 2019-06-28 | 平安科技(深圳)有限公司 | 房源推荐方法、装置、计算机设备及计算机可读存储介质 |
CN110175190A (zh) * | 2019-04-15 | 2019-08-27 | 平安科技(深圳)有限公司 | 房源推荐方法、装置、计算机设备及计算机可读存储介质 |
US20190277648A1 (en) * | 2018-03-08 | 2019-09-12 | Tsinghua University | Method and device for determining personal commute time period |
-
2020
- 2020-01-17 CN CN202010054759.3A patent/CN111311305A/zh not_active Withdrawn
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20190277648A1 (en) * | 2018-03-08 | 2019-09-12 | Tsinghua University | Method and device for determining personal commute time period |
CN109377329A (zh) * | 2018-12-25 | 2019-02-22 | 北京时光荏苒科技有限公司 | 一种房源推荐方法、装置、存储介质及电子设备 |
CN109949123A (zh) * | 2019-02-12 | 2019-06-28 | 平安科技(深圳)有限公司 | 房源推荐方法、装置、计算机设备及计算机可读存储介质 |
CN110175190A (zh) * | 2019-04-15 | 2019-08-27 | 平安科技(深圳)有限公司 | 房源推荐方法、装置、计算机设备及计算机可读存储介质 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2022095351A1 (zh) * | 2020-11-06 | 2022-05-12 | 平安科技(深圳)有限公司 | 目标区域划分方法、装置、电子设备及存储介质 |
CN116402329A (zh) * | 2023-04-12 | 2023-07-07 | 江苏新合益机械有限公司 | 一种活塞杆生产车间的智能管理方法及系统 |
CN116402329B (zh) * | 2023-04-12 | 2023-10-03 | 江苏新合益机械有限公司 | 一种活塞杆生产车间的智能管理方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110634047B (zh) | 一种推荐房源的方法、装置、电子设备及存储介质 | |
CN111222960A (zh) | 基于公共流量带的房源推荐方法及系统 | |
CN107302597B (zh) | 消息文案推送方法和装置 | |
CN110619078B (zh) | 用于推送信息的方法和装置 | |
US20190095536A1 (en) | Method and device for content recommendation and computer readable storage medium | |
CN111177433B (zh) | 用于并行处理信息的方法和装置 | |
CN107291835B (zh) | 一种搜索词的推荐方法和装置 | |
CN112836128A (zh) | 信息推荐方法、装置、设备和存储介质 | |
CN111163324A (zh) | 信息处理方法、装置和电子设备 | |
CN111311305A (zh) | 基于用户轨迹解析用户公共流量带的方法及系统 | |
CN113190558A (zh) | 一种数据加工方法和系统 | |
CN115022266A (zh) | 一种群成员添加方法、装置、设备及介质 | |
CN112153091B (zh) | 用于确定设备的相关性的方法及装置 | |
CN111723274B (zh) | 用于处理信息的方法和装置 | |
CN110875856B (zh) | 激活数据异常检测与分析的方法和装置 | |
CN111222067B (zh) | 信息生成方法和装置 | |
CN111161067A (zh) | 一种交易路由的确定方法和装置 | |
CN112884497A (zh) | 确定用户类型的方法、装置、电子设备和存储介质 | |
CN111563797A (zh) | 房源信息的处理方法、装置、可读介质及电子设备 | |
CN110619537A (zh) | 用于生成信息的方法和装置 | |
CN112000218A (zh) | 一种对象显示方法及装置 | |
CN113362097B (zh) | 一种用户确定方法和装置 | |
CN112083982A (zh) | 信息处理方法和装置 | |
CN115658749B (zh) | 基于有向无环图的基金产品排序方法、装置和电子设备 | |
CN116384945B (zh) | 一种项目管理方法和系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WW01 | Invention patent application withdrawn after publication |
Application publication date: 20200619 |
|
WW01 | Invention patent application withdrawn after publication |