CN110443493B - 路线相似度确定方法、装置、设备和介质 - Google Patents

路线相似度确定方法、装置、设备和介质 Download PDF

Info

Publication number
CN110443493B
CN110443493B CN201910712481.1A CN201910712481A CN110443493B CN 110443493 B CN110443493 B CN 110443493B CN 201910712481 A CN201910712481 A CN 201910712481A CN 110443493 B CN110443493 B CN 110443493B
Authority
CN
China
Prior art keywords
route
target
time period
determining
click
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910712481.1A
Other languages
English (en)
Other versions
CN110443493A (zh
Inventor
汪昊楠
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guiyang Huochebang Technology Co ltd
Original Assignee
Guiyang Huochebang Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guiyang Huochebang Technology Co ltd filed Critical Guiyang Huochebang Technology Co ltd
Priority to CN201910712481.1A priority Critical patent/CN110443493B/zh
Publication of CN110443493A publication Critical patent/CN110443493A/zh
Application granted granted Critical
Publication of CN110443493B publication Critical patent/CN110443493B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9537Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0631Resource planning, allocation, distributing or scheduling for enterprises or organisations
    • G06Q10/06315Needs-based resource requirements planning or analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/08Logistics, e.g. warehousing, loading or distribution; Inventory or stock management
    • G06Q10/083Shipping

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Economics (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Quality & Reliability (AREA)
  • Operations Research (AREA)
  • Development Economics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Educational Administration (AREA)
  • Game Theory and Decision Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Navigation (AREA)

Abstract

本发明实施例公开了一种路线相似度确定方法、装置、设备和介质。该方法包括:从目标时段的历史点击路线中确定目标路线对,并确定所述目标时段内点击过所述目标路线对中第一路线的至少一个目标用户;根据每个所述目标用户在所述目标时段内点击的路线数量和所述目标路线对中第二路线在所述目标时段内的点击概率,确定所述目标时段内既点击所述第一路线又点击所述第二路线的候选用户的平均数量;根据所述目标时段内,既点击所述第一路线又点击所述第二路线的候选用户的平均数量和实际数量,确定所述目标路线对的相似度。本发明实施例提供一种路线相似度确定方法、装置、设备和介质,确定了用户已点击路线与未点击路线之间的相似度。

Description

路线相似度确定方法、装置、设备和介质
技术领域
本发明实施例涉及路线规划技术领域,尤其涉及一种路线相似度确定方法、装置、设备和介质。
背景技术
货运平台每日为数百万司机在数万条路线上匹配数百万货源。然而由于司机起始地及目的地的差异巨大,有很大一部分司机所感兴趣路线上可以匹配的货源较少,并且司机不清楚自己潜在感兴趣的其他路线。因此,需要为司机确定该类路线,从而帮助司机发现更多可以匹配的货物。
现有实现方案为根据地理位置推荐该路线起终点周边城市的路线。
上述方案存在如下缺点:
1、数目限制,由于一个城市周围城市数目有限,因此确定的潜在感兴趣路线的数量也有限。
2、基于地理位置无法反应城市本身供需情况,如一些城市货物很少,或关注该城市司机很少,无法区别对待,导致无法根据真实供需情况匹配司机货物。
3、近程路线、中程路线和远程路线对于相似路线的概念仅仅与起终点周围的城市相关,因此不足以满足远程司机对距离更远的城市中货物的需求。
发明内容
本发明实施例提供一种路线相似度确定方法、装置、设备和介质,以确定用户已点击路线与未点击路线之间的相似度,进而基于相似度从未点击路线中确定用户的潜在感兴趣路线,其中该潜在感兴趣路线的数目不受起终点周围城市数目的限制,在该潜在感兴趣路线上可以匹配到的货物更多,且该潜在感兴趣路线包括距离起终点较远城市的路线。
第一方面,本发明实施例提供了一种路线相似度确定方法,该方法包括:
从目标时段的历史点击路线中确定目标路线对,并确定所述目标时段内点击过所述目标路线对中第一路线的至少一个目标用户;
根据每个所述目标用户在所述目标时段内点击的路线数量和所述目标路线对中第二路线在所述目标时段内的点击概率,确定所述目标时段内既点击所述第一路线又点击所述第二路线的候选用户的平均数量,其中所述第二路线不同于所述第一路线;
根据所述目标时段内,既点击所述第一路线又点击所述第二路线的候选用户的平均数量和实际数量,确定所述目标路线对的相似度。
第二方面,本发明实施例还提供了一种路线相似度确定装置,该装置包括:
目标用户确定模块,用于从目标时段的历史点击路线中确定目标路线对,并确定所述目标时段内点击过所述目标路线对中第一路线的至少一个目标用户;
平均数量确定模块,用于根据每个所述目标用户在所述目标时段内点击的路线数量和所述目标路线对中第二路线在所述目标时段内的点击概率,确定所述目标时段内既点击所述第一路线又点击所述第二路线的候选用户的平均数量,其中所述第二路线不同于所述第一路线;
相似度确定模块,用于根据所述目标时段内,既点击所述第一路线又点击所述第二路线的候选用户的平均数量和实际数量,确定所述目标路线对的相似度。
第三方面,本发明实施例还提供了一种电子设备,所述设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如本发明实施例中任一所述的路线相似度确定方法。
第四方面,本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本发明实施例中任一项所述的路线相似度确定方法。
本发明实施例通过根据每个所述目标用户在所述目标时段内点击的路线数量和所述目标路线对中第二路线在所述目标时段内的点击概率,估计所述目标时段内既点击所述第一路线又点击所述第二路线的候选用户的平均数量;然后根据所述目标时段内,既点击所述第一路线又点击所述第二路线的候选用户的平均数量和实际数量,确定所述目标路线对的相似度,从而实现对目标用户已经点击路线与未点击路线之间相似度的确定,进而从未点击路线中挖掘目标用户的潜在感兴趣路线。
因为本发明实施例不依赖路线起终点周边城市,所以不受周围城市数目的影响,并且可以包括距离起终点较远城市的路线。
因为所述目标路线对中第二路线在所述目标时段内的点击概率,反映了第二路线途径城市的供需量,所以基于本发明实施例相似度确定的潜在感兴趣路线能够匹配更多地货物。
此外,通过根据所述目标时段内,既点击所述第一路线又点击所述第二路线的候选用户的平均数量和实际数量,确定所述目标路线对的相似度,相比直接根据所述目标时段内,既点击所述第一路线又点击所述第二路线的候选用户的实际数量,确定所述目标路线对的相似度,本发明实施例可以过滤掉点击热度过热或过冷路线的干扰。
附图说明
图1为本发明实施例一提供的一种路线相似度确定方法的流程图;
图2是本发明实施例二提供的一种路线相似度确定方法的流程图;
图3是本发明实施例三提供的一种路线相似度确定方法的流程图;
图4是本发明实施例四提供的一种路线相似度确定方法的流程图;
图5是本发明实施例五提供的一种路线相似度确定装置的结构示意图;
图6为本发明实施例六提供的一种设备的结构示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
实施例一
图1为本发明实施例一提供的一种路线相似度确定方法的流程图。本实施例可适用于对两路线进行相似度确定的情况。典型地,本实施例可适用于对目标用户感兴趣路线和其他路线进行相似度确定,进而从其他路线中挖掘目标用户的潜在感兴趣路线的情况。该方法可以由一种路线相似度确定装置来执行,该装置可以由软件和/或硬件的方式实现。参见图1,本实施例提供的路线相似度确定方法包括:
S110、从目标时段的历史点击路线中确定目标路线对,并确定所述目标时段内点击过所述目标路线对中第一路线的至少一个目标用户。
其中,目标时段是历史时间的一个时间段,具体可以根据实际需要设定。
可选地,目标时段可以是历史时间中的一个月,也可以是历史时间中的一天。
历史点击路线是指在目标时段内用户点击的路线。
目标路线对是指待相似度确定的两条路线。
第一路线是指所述目标路线对中的任一路线,第一路线实质是目标用户的感兴趣路线。
目标用户是指点击过所述目标路线对中第一路线的用户。
具体地,从目标时段的历史点击路线中确定目标路线对,包括:
从目标时段的不同历史点击路线中确定两条不同的历史点击路线,作为目标路线对。
确定所述目标时段内点击过所述目标路线对中第一路线的至少一个目标用户,包括:
将所述目标路线对中第一路线,与所述目标时段内的历史点击路线进行匹配;
将匹配成功的历史点击路线的点击用户作为目标用户。
S120、根据每个所述目标用户在所述目标时段内点击的路线数量和所述目标路线对中第二路线在所述目标时段内的点击概率,确定所述目标时段内既点击所述第一路线又点击所述第二路线的候选用户的平均数量,其中所述第二路线不同于所述第一路线。
其中,所述路线数量是指所述目标用户在所述目标时段内点击的不同路线的数量。
具体地,所述目标路线对中第二路线在所述目标时段内的点击概率的确定,包括:
根据所述第二路线在所述目标时段内的点击次数与所述目标时段内路线点击总次数的比值,确定所述目标路线对中第二路线在所述目标时段内的点击概率。
候选用户是指在所述目标时段内进行路线点击的用户。
典型地,所述根据每个所述目标用户在所述目标时段内点击的路线数量和所述目标路线对中第二路线在所述目标时段内的点击概率,确定既点击所述第一路线又点击所述第二路线的候选用户的平均数量,包括:
依照如下公式确定所述目标时段内点击所述目标路线对中两路线的候选用户的平均数量:
Figure BDA0002154251140000061
其中,EXY是所述目标时段内点击所述目标路线对中两路线的候选用户的平均数量,也即所述目标时段内点击过第一路线的目标用户至少点击一次第二路线的期望,X表示第一路线,Y表示第二路线,PY是所述目标路线对中第二路线在所述目标时段内的点击概率,ni是一个所述目标用户在所述目标时段内点击的路线数量,i标识不同所述目标用户,mi是指标识为i的目标用户对应的数值,且目标用户对应的数值为1。因为其他候选用户对应的数值为0,所以此处仅对数值为1的目标用户的数值和概率的乘积进行相加求和。
S130、根据所述目标时段内,既点击所述第一路线又点击所述第二路线的候选用户的平均数量和实际数量,确定所述目标路线对的相似度。
具体地,所述根据所述目标时段内,既点击所述第一路线又点击所述第二路线的候选用户的平均数量和实际数量,确定所述目标路线对的相似度,包括:
依照如下公式确定所述目标路线对的相似度:
SimXY=(NXY-EXY)/EXY
其中,SimXY是所述目标路线对的相似度,NXY是所述点击所述目标路线对中两的候选用户的实际数量,EXY是所述点击所述目标路线对中两的候选用户的平均数量。
本发明实施例的技术方案,通过根据每个所述目标用户在所述目标时段内点击的路线数量和所述目标路线对中第二路线在所述目标时段内的点击概率,估计所述目标时段内既点击所述第一路线又点击所述第二路线的候选用户的平均数量;然后根据所述目标时段内,既点击所述第一路线又点击所述第二路线的候选用户的平均数量和实际数量,确定所述目标路线对的相似度,从而实现对目标用户已经点击路线与未点击路线之间相似度的确定,挖掘目标用户的潜在感兴趣路线,进而推荐给目标用户。
因为本发明实施例不依赖路线起终点周边城市,所以不受周围城市数目的影响,并且可以包括距离起终点较远城市的路线。
因为所述目标路线对中第二路线在所述目标时段内的点击概率,反映了第二路线途径城市的供需量大,所以基于本发明实施例确定的相似度确定的潜在感兴趣路线能够匹配更多地货物。
此外,通过根据所述目标时段内,既点击所述第一路线又点击所述第二路线的候选用户的平均数量和实际数量,确定所述目标路线对的相似度;相比直接根据所述目标时段内,既点击所述第一路线又点击所述第二路线的候选用户的实际数量,确定所述目标路线对的相似度;本发明实施例可以过滤掉点击热度过热或过冷路线的影响。
实施例二
图2是本发明实施例二提供的一种路线相似度确定方法的流程图。本实施例是在上述实施例的基础上提出的一种可选方案。参见图2,本实施例提供的路线相似度确定方法包括:
S210、从目标时段的历史点击路线中确定目标路线对,并确定所述目标时段内点击过所述目标路线对中第一路线的至少一个目标用户。
S220、根据所述第二路线在所述目标时段内的点击概率和每个所述目标用户在所述目标时段内点击的路线数量,确定所述目标用户未点击所述第二路线的概率。
具体地,所述根据所述目标路线对中另一条路线在所述目标时段内的点击概率,和每个所述目标用户在所述目标时段内点击路线的数量,确定所述目标时段内所述目标用户未点击所述另一条路线的概率,包括:
根据所述目标路线对中另一条路线在所述目标时段内的点击概率,确定在所述目标时段内未点击所述目标路线对中另一条路线的概率;
根据所述目标时段内未点击所述目标路线对中另一条路线的概率和每个所述目标用户在所述目标时段内点击路线的数量,确定所述目标时段内所述目标用户未点击所述目标路线对中另一条路线的概率。
S230、根据所述目标用户未点击所述第二路线的概率,确定所述目标用户点击所述第二路线的概率。
S240、根据所述目标用户点击所述第二路线的概率,确定既点击所述第一路线又点击所述第二路线的候选用户的平均数量。
S250、根据所述目标时段内,既点击所述第一路线又点击所述第二路线的候选用户的平均数量和实际数量,确定所述目标路线对的相似度。
本发明实施例的技术方案,通过根据所述第二路线在所述目标时段内的点击概率和每个所述目标用户在所述目标时段内点击的路线数量,确定所述目标用户未点击所述第二路线的概率;根据所述目标用户未点击所述第二路线的概率,确定所述目标用户点击所述第二路线的概率;根据所述目标用户点击所述第二路线的概率,从而实现既点击所述第一路线又点击所述第二路线的候选用户的平均数量的确定。
实施例三
图3是本发明实施例三提供的一种路线相似度确定方法的流程图。本实施例是在上述实施例的基础上提出的一种的可选方案。参见图3,本发明实施例提供的路线相似度确定方法包括:
S310、获取目标时段的历史点击路线、所述历史点击路线的点击时间和点击用户。
S320、根据所述历史点击路线的点击时间,按照设定时间间隔对同一点击用户的历史点击路线序列进行分组,生成至少一个候选路线组,并为所述至少一个候选路线组分别设置不同的候选用户标识。
其中,设定时间间隔是具有关联关系的历史点击路线之间时间间隔的最大值,具体可以根据实际需要设定。
因为,超过设定时间间隔的历史点击路线之间不具有关联关系,例如用户在上海时的感兴趣路线与设定时间间隔后该用户在无锡时的感兴趣路线无关联关系。所以,对历史点击路线进行分组,并将分组后的至少一个候选路线组中的历史点击路线,视为不同候选用户点击得到。
具体地,所述确定所述目标时段内点击过所述目标路线对中第一路线的至少一个目标用户,包括:
确定所述第一路线所属的候选路线组,并将该候选路线组作为目标路线组;
将至少一个所述目标路线组关联的至少一个候选用户,作为所述目标时段内点击过所述第一路线的至少一个目标用户。
S330、从任一所述候选路线组的历史点击路线中,确定所述目标路线对中的第一路线和第二路线。
具体地,从任一所述候选路线组的历史点击路线中,确定所述目标路线对中的第一路线和第二路线,包括:
从任一候选路线组的历史点击路线中选择两个不同的历史点击路线,作为所述目标路线对中的第一路线和第二路线。
典型地,所述从任一所述候选路线组的历史点击路线中,确定所述目标路线对中的第一路线和第二路线,包括:
删除每个所述路线组中的重复路线;
对每个经过去重的路线组中的历史点击路线进行两两组合,生成候选路线对;
确定所述目标路线对中的第一路线;
依据所述目标路线对中的第一路线,从所述候选路线对中查找与所述第一路线具有关联关系的所述第二路线。
S340、根据每个所述目标用户在所述目标时段内点击的路线数量和所述目标路线对中第二路线在所述目标时段内的点击概率,确定所述目标时段内既点击所述第一路线又点击所述第二路线的候选用户的平均数量,其中所述第二路线不同于所述第一路线。
S350、根据所述目标时段内,既点击所述第一路线又点击所述第二路线的候选用户的平均数量和实际数量,确定所述目标路线对的相似度。
本发明实施例的技术方案,通过获取目标时段的历史点击路线、所述历史点击路线的点击时间和点击用户;根据所述历史点击路线的点击时间,按照设定时间间隔对同一点击用户的历史点击路线序列进行分组,生成至少一个候选路线组,并为所述至少一个候选路线组分别设置不同的候选用户标识;从而实现对具有关联关系的历史点击路线的分组,并将分组后的至少一个候选路线组中的历史点击路线,视为不同候选用户点击得到的。
通过从任一所述候选路线组的历史点击路线中,确定所述目标路线对中的第一路线和第二路线,进而可以提高第一路线和第二路线的确定准确率。
实施例四
图4是本发明实施例四提供的一种路线相似度确定方法的流程图。本实施例是在上述实施例的基础上,以目标时段为一个月,所有司机一个月内通过货运平台应用点击货物所在发货路线(市级)数据为数据来源为例,提供的一种可选方案。参见图4,本实施例提供的路线相似度确定方法包括:
获取一个月内的历史点击路线数据作为原始数据。
根据所述历史点击路线的点击时间,按照设定时间间隔对原始数据中同一点击用户的历史点击路线序列进行分组,生成至少一个候选路线组,并对每个候选路线组中的路线进行去重。
对经过去重的每个候选路线组中的路线进行两两组合,生成候选路线对,并根据所述原始数据,计算一个月内候选路线对共同出现的候选路线分组的数量。
计算每条候选路线在所述一个月的点击次数与所述一个月内总的路线点击次数的比值,将该比值作为该候选路线的点击概率。
计算每条候选路线所属各候选路线组中包括的不同候选路线的数量,记为c,c=n1、n2……ni其中ni表示候选路线所属各候选路线组中包括的不同候选路线的数量。
从候选路线中确定目标路线对中的第一路线;根据所述第一路线和所述候选路线对,确定目标路线对中的第二路线。
根据所述第一路线所属各候选路线组中包括的不同候选路线的数量,以及所述第二路线的点击概率,确定既点击所述第一路线,又点击所述第二路线的点击期望。
具体公式如下:
Figure BDA0002154251140000121
其中,EXY是所述目标时段内点击所述目标路线对中两路线的候选用户的平均数量,也即所述目标时段内点击过第一路线的目标用户至少点击一次第二路线的期望,X表示第一路线,Y表示第二路线,PY是所述目标路线对中第二路线在所述目标时段内的点击概率,ni是一个所述目标用户在所述目标时段内点击的路线数量,i标识不同所述目标用户,mi是指标识为i的目标用户对应的数值,且目标用户对应的数值为1,其他候选用户对应的数值为0。
由上述EXY与一个月内目标路线对共同出现的候选路线分组的实际数量Nxy,计算所述第一路线和所述第二路线之间的相似度,以此计算所述候选路线对包括的两候选路线之间的相似度。
具体公式如下:
SimXY=(NXY-EXY)/EXY
其中,SimXY是所述目标路线对的相似度,NXY是所述点击所述目标路线对中两的候选用户的实际数量,EXY是所述点击所述目标路线对中两的候选用户的平均数量。
本发明实施例的技术方案,通过利用司机点击路线历史计算路线之间的相似度,假设任意两条路线X,Y,想要计算根据X推荐Y的分数,首先假设所有司机无偏好情况下,计算所有点击过路线X的司机至少点击1次路线Y的期望,再根据实际共同点击数量与期望的差距计算两条路线的相似度。本发明实施例的优点为由于计算的是实际与期望的差距,因此可以去除掉由于过热或过冷线路造成的噪音。
实施例五
图5是本发明实施例五提供的一种路线相似度确定装置的结构示意图。参见图5,本实施例提供的路线相似度确定装置包括:目标用户确定模块10、平均数量确定模块20和相似度确定模块30。
其中,目标用户确定模块10,用于从目标时段的历史点击路线中确定目标路线对,并确定所述目标时段内点击过所述目标路线对中第一路线的至少一个目标用户;
平均数量确定模块20,用于根据每个所述目标用户在所述目标时段内点击的路线数量和所述目标路线对中第二路线在所述目标时段内的点击概率,确定所述目标时段内既点击所述第一路线又点击所述第二路线的候选用户的平均数量,其中所述第二路线不同于所述第一路线;
相似度确定模块30,用于根据所述目标时段内,既点击所述第一路线又点击所述第二路线的候选用户的平均数量和实际数量,确定所述目标路线对的相似度。
本发明实施例通过根据每个所述目标用户在所述目标时段内点击的路线数量和所述目标路线对中第二路线在所述目标时段内的点击概率,估计所述目标时段内既点击所述第一路线又点击所述第二路线的候选用户的平均数量;然后根据所述目标时段内,既点击所述第一路线又点击所述第二路线的候选用户的平均数量和实际数量,确定所述目标路线对的相似度,从而实现对目标用户已经点击路线与未点击路线之间相似度的确定,进而从未点击路线中挖掘目标用户的潜在感兴趣路线,并推荐给目标用户。
因为本发明实施例不依赖路线起终点周边城市,所以不受周围城市数目的影响,并且可以包括距离起终点较远城市的路线。
因为所述目标路线对中第二路线在所述目标时段内的点击概率,反映了第二路线途径城市的供需量,所以基于本发明实施例相似度确定的潜在感兴趣路线能够匹配更多地货物。
此外,通过根据所述目标时段内,既点击所述第一路线又点击所述第二路线的候选用户的平均数量和实际数量,确定所述目标路线对的相似度,相比直接根据所述目标时段内,既点击所述第一路线又点击所述第二路线的候选用户的实际数量,确定所述目标路线对的相似度,本发明实施例可以过滤掉过热或过冷路线的干扰。
进一步地,所述平均数量确定模块,包括:未点击概率确定单元、点击概率确定单元和平均数量确定单元。
其中,未点击概率确定单元,用于根据所述第二路线在所述目标时段内的点击概率和每个所述目标用户在所述目标时段内点击的路线数量,确定所述目标用户未点击所述第二路线的概率;
点击概率确定单元,用于根据所述目标用户未点击所述第二路线的概率,确定所述目标用户点击所述第二路线的概率;
平均数量确定单元,用于根据所述目标用户点击所述第二路线的概率,确定既点击所述第一路线又点击所述第二路线的候选用户的平均数量。
进一步地,所述平均数量确定模块,包括:平均数量计算单元。
其中,平均数量计算单元用于依照如下公式确定所述目标时段内点击所述目标路线对中两路线的候选用户的平均数量:
Figure BDA0002154251140000151
其中,EXY是所述目标时段内点击所述目标路线对中两路线的候选用户的平均数量,也即所述目标时段内点击过第一路线的目标用户至少点击一次第二路线的期望,X表示第一路线,Y表示第二路线,PY是所述目标路线对中第二路线在所述目标时段内的点击概率,ni是一个所述目标用户在所述目标时段内点击的路线数量,i标识不同目标用户,mi是指标识为i的目标用户对应的数值,且目标用户对应的数值为1。
进一步地,目标用户确定模块,包括:路线获取单元、路线分组单元和目标路线对确定单元。
其中,路线获取单元,用于获取目标时段的历史点击路线、所述历史点击路线的点击时间和点击用户;
路线分组单元,用于根据所述历史点击路线的点击时间,按照设定时间间隔对同一点击用户的历史点击路线序列进行分组,生成至少一个候选路线组,并为所述至少一个候选路线组分别设置不同的候选用户标识;
目标路线对确定单元,用于从任一所述候选路线组的历史点击路线中,确定所述目标路线对中的第一路线和第二路线。
进一步地,所述目标路线对确定单元具体用于:
删除每个所述路线组中的重复路线;
对每个经过去重的路线组中的历史点击路线进行两两组合,生成候选路线对;
确定所述目标路线对中的第一路线;
依据所述目标路线对中的第一路线,从所述候选路线对中查找与所述第一路线具有关联关系的所述第二路线。
进一步地,所述目标用户确定模块,包括:路线组确定单元和目标用户确定单元。
其中,路线组确定单元,用于确定所述第一路线所属的候选路线组,并将该候选路线组作为目标路线组;
目标用户确定单元,用于将至少一个所述目标路线组关联的至少一个候选用户,作为所述目标时段内点击过所述第一路线的至少一个目标用户。
本发明实施例所提供的路线相似度确定装置可执行本发明任意实施例所提供的路线相似度确定方法,具备执行方法相应的功能模块和有益效果。
需要说明的是,基于上述实施例的技术教导,本领域技术人员有动机将上述实施方式进行组合,以提高对用户信息推荐的准确率和新的兴趣类别内容的推荐。
实施例六
图6为本发明实施例6提供的一种设备的结构示意图,如图6所示,该设备包括处理器70、存储器71、输入装置72和输出装置73;设备中处理器70的数量可以是一个或多个,图6中以一个处理器70为例;设备中的处理器70、存储器71、输入装置72和输出装置73可以通过总线或其他方式连接,图6中以通过总线连接为例。
存储器71作为一种计算机可读存储介质,可用于存储软件程序、计算机可执行程序以及模块,如本发明实施例中的路线相似度确定方法对应的程序指令/模块(例如,路线相似度确定装置中的目标用户确定模块10、平均数量确定模块20和相似度确定模块30)。处理器70通过运行存储在存储器71中的软件程序、指令以及模块,从而执行设备的各种功能应用以及数据处理,即实现上述的路线相似度确定方法。
存储器71可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序;存储数据区可存储根据终端的使用所创建的数据等。此外,存储器71可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实例中,存储器71可进一步包括相对于处理器70远程设置的存储器,这些远程存储器可以通过网络连接至设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
输入装置72可用于接收输入的数字或字符信息,以及产生与设备的用户设置以及功能控制有关的键信号输入。输出装置73可包括显示屏等显示设备。
实施例七
本发明实施例七还提供一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行路线相似度确定方法,该方法包括:
从目标时段的历史点击路线中确定目标路线对,并确定所述目标时段内点击过所述目标路线对中第一路线的至少一个目标用户;
根据每个所述目标用户在所述目标时段内点击的路线数量和所述目标路线对中第二路线在所述目标时段内的点击概率,确定所述目标时段内既点击所述第一路线又点击所述第二路线的候选用户的平均数量,其中所述第二路线不同于所述第一路线;
根据所述目标时段内,既点击所述第一路线又点击所述第二路线的候选用户的平均数量和实际数量,确定所述目标路线对的相似度。
当然,本发明实施例所提供的一种包含计算机可执行指令的存储介质,其计算机可执行指令不限于如上所述的方法操作,还可以执行本发明任意实施例所提供的路线相似度确定方法中的相关操作。
通过以上关于实施方式的描述,所属领域的技术人员可以清楚地了解到,本发明可借助软件及必需的通用硬件来实现,当然也可以通过硬件实现,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如计算机的软盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(RandomAccess Memory,RAM)、闪存(FLASH)、硬盘或光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
值得注意的是,上述路线相似度确定装置的实施例中,所包括的各个单元和模块只是按照功能逻辑进行划分的,但并不局限于上述的划分,只要能够实现相应的功能即可;另外,各功能单元的具体名称也只是为了便于相互区分,并不用于限制本发明的保护范围。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。

Claims (8)

1.一种路线相似度确定方法,其特征在于,包括:
从目标时段的历史点击路线中确定目标路线对,并确定所述目标时段内点击过所述目标路线对中第一路线的至少一个目标用户;
根据每个所述目标用户在所述目标时段内点击的路线数量和所述目标路线对中第二路线在所述目标时段内的点击概率,确定所述目标时段内既点击所述第一路线又点击所述第二路线的候选用户的平均数量,其中所述第二路线不同于所述第一路线;
根据所述目标时段内,既点击所述第一路线又点击所述第二路线的候选用户的平均数量和实际数量,确定所述目标路线对的相似度;
所述根据每个所述目标用户在所述目标时段内点击的路线数量和所述目标路线对中第二路线在所述目标时段内的点击概率,确定所述目标时段内既点击所述第一路线又点击所述第二路线的候选用户的平均数量,包括:
根据所述第二路线在所述目标时段内的点击概率和每个所述目标用户在所述目标时段内点击的路线数量,确定所述目标用户未点击所述第二路线的概率;
根据所述目标用户未点击所述第二路线的概率,确定所述目标用户点击所述第二路线的概率;
根据所述目标用户点击所述第二路线的概率,确定既点击所述第一路线又点击所述第二路线的候选用户的平均数量。
2.根据权利要求1所述的方法,其特征在于,所述根据每个所述目标用户在所述目标时段内点击的路线数量和所述目标路线对中第二路线在所述目标时段内的点击概率,确定所述目标时段内既点击所述第一路线又点击所述第二路线的候选用户的平均数量,其中所述第二路线不同于所述第一路线,包括:
依照如下公式确定所述目标时段内点击所述目标路线对中两路线的候选用户的平均数量:
Figure DEST_PATH_IMAGE002
其中,
Figure DEST_PATH_IMAGE004
是所述目标时段内点击所述目标路线对中两路线的候选用户的平均数量,也即所述目标时段内点击过第一路线的目标用户至少点击一次第二路线的期望,X表示第一路线,Y表示第二路线,
Figure DEST_PATH_IMAGE006
是所述目标路线对中第二路线在所述目标时段内的点击概率,
Figure DEST_PATH_IMAGE008
是一个所述目标用户在所述目标时段内点击的路线数量,i标识不同目标用户,
Figure DEST_PATH_IMAGE010
是指标识为i的目标用户对应的数值,且目标用户对应的数值为1。
3.根据权利要求1所述的方法,其特征在于,所述从目标时段的历史点击路线中确定目标路线对,包括:
获取目标时段的历史点击路线、所述历史点击路线的点击时间和点击用户;
根据所述历史点击路线的点击时间,按照设定时间间隔对同一点击用户的历史点击路线序列进行分组,生成至少一个候选路线组,并为所述至少一个候选路线组分别设置不同的候选用户标识;
从任一所述候选路线组的历史点击路线中,确定所述目标路线对中的第一路线和第二路线。
4.根据权利要求3所述的方法,其特征在于,所述从任一所述候选路线组的历史点击路线中,确定所述目标路线对中的第一路线和第二路线,包括:
删除每个所述路线组中的重复路线;
对每个经过去重的路线组中的历史点击路线进行两两组合,生成候选路线对;
确定所述目标路线对中的第一路线;
依据所述目标路线对中的第一路线,从所述候选路线对中查找与所述第一路线具有关联关系的所述第二路线。
5.根据权利要求3所述的方法,其特征在于,所述确定所述目标时段内点击过所述目标路线对中第一路线的至少一个目标用户,包括:
确定所述第一路线所属的候选路线组,并将该候选路线组作为目标路线组;
将至少一个所述目标路线组关联的至少一个候选用户,作为所述目标时段内点击过所述第一路线的至少一个目标用户。
6.一种路线相似度确定装置,其特征在于,包括:
目标用户确定模块,用于从目标时段的历史点击路线中确定目标路线对,并确定所述目标时段内点击过所述目标路线对中第一路线的至少一个目标用户;
平均数量确定模块,用于根据每个所述目标用户在所述目标时段内点击的路线数量和所述目标路线对中第二路线在所述目标时段内的点击概率,确定所述目标时段内既点击所述第一路线又点击所述第二路线的候选用户的平均数量,其中所述第二路线不同于所述第一路线;
相似度确定模块,用于根据所述目标时段内,既点击所述第一路线又点击所述第二路线的候选用户的平均数量和实际数量,确定所述目标路线对的相似度;
所述平均数量确定模块,包括:
未点击概率确定单元,用于根据所述第二路线在所述目标时段内的点击概率和每个所述目标用户在所述目标时段内点击的路线数量,确定所述目标用户未点击所述第二路线的概率;
点击概率确定单元,用于根据所述目标用户未点击所述第二路线的概率,确定所述目标用户点击所述第二路线的概率;
平均数量确定单元,用于根据所述目标用户点击所述第二路线的概率,确定既点击所述第一路线又点击所述第二路线的候选用户的平均数量。
7.一种路线相似度确定设备,其特征在于,所述设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-5中任一所述的路线相似度确定方法。
8.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-5中任一所述的路线相似度确定方法。
CN201910712481.1A 2019-08-02 2019-08-02 路线相似度确定方法、装置、设备和介质 Active CN110443493B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910712481.1A CN110443493B (zh) 2019-08-02 2019-08-02 路线相似度确定方法、装置、设备和介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910712481.1A CN110443493B (zh) 2019-08-02 2019-08-02 路线相似度确定方法、装置、设备和介质

Publications (2)

Publication Number Publication Date
CN110443493A CN110443493A (zh) 2019-11-12
CN110443493B true CN110443493B (zh) 2022-09-23

Family

ID=68432998

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910712481.1A Active CN110443493B (zh) 2019-08-02 2019-08-02 路线相似度确定方法、装置、设备和介质

Country Status (1)

Country Link
CN (1) CN110443493B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017041541A1 (zh) * 2015-09-08 2017-03-16 北京邮电大学 推送推荐信息的方法、服务器及存储介质
CN108806241A (zh) * 2017-04-27 2018-11-13 高德软件有限公司 一种常用驾车路线的确定方法及装置
CN109241403A (zh) * 2018-08-03 2019-01-18 腾讯科技(深圳)有限公司 项目推荐方法、装置、机器设备和计算机可读存储介质
CN109299327A (zh) * 2018-11-16 2019-02-01 广州市百果园信息技术有限公司 视频推荐方法、装置、设备及存储介质
CN109668570A (zh) * 2018-12-21 2019-04-23 斑马网络技术有限公司 行驶路线推荐方法、装置、系统以及存储介质

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017041541A1 (zh) * 2015-09-08 2017-03-16 北京邮电大学 推送推荐信息的方法、服务器及存储介质
CN108806241A (zh) * 2017-04-27 2018-11-13 高德软件有限公司 一种常用驾车路线的确定方法及装置
CN109241403A (zh) * 2018-08-03 2019-01-18 腾讯科技(深圳)有限公司 项目推荐方法、装置、机器设备和计算机可读存储介质
CN109299327A (zh) * 2018-11-16 2019-02-01 广州市百果园信息技术有限公司 视频推荐方法、装置、设备及存储介质
CN109668570A (zh) * 2018-12-21 2019-04-23 斑马网络技术有限公司 行驶路线推荐方法、装置、系统以及存储介质

Also Published As

Publication number Publication date
CN110443493A (zh) 2019-11-12

Similar Documents

Publication Publication Date Title
KR101999471B1 (ko) 정보 추천 방법 및 장치
CN108733706B (zh) 热度信息的生成方法和装置
US20210035126A1 (en) Data processing method, system and computer device based on electronic payment behaviors
US20160364762A1 (en) Method and system for creating an audience list based on user behavior data
WO2016015444A1 (zh) 一种目标用户的确定方法、设备和网络服务器
CN108108821A (zh) 模型训练方法及装置
CN105205188A (zh) 采购物料供应商的推荐方法及推荐装置
CN111639253B (zh) 一种数据判重方法、装置、设备及存储介质
CN111383005B (zh) 数字货币流向追踪方法及装置
JP2013504118A (ja) クエリのセマンティックパターンに基づく情報検索
CN110427574B (zh) 路线相似度确定方法、装置、设备和介质
KR101565957B1 (ko) 제품 피드 유사성을 사용하는 스팸 상인 발견
JPWO2019069505A1 (ja) 情報処理装置、結合条件生成方法および結合条件生成プログラム
CN112102031A (zh) 一种推荐方法、推荐装置及终端设备
CN112241489A (zh) 信息推送方法、装置、可读存储介质和计算机设备
CN116402539A (zh) 基于大数据的拓客方法、系统、设备及存储介质
CN107330709B (zh) 确定目标对象的方法及装置
US20120084147A1 (en) Method and system for determining search suggestions
US8781990B1 (en) Crowdsensus: deriving consensus information from statements made by a crowd of users
CN114090898A (zh) 一种信息推荐方法、装置、终端设备及介质
CN110443493B (zh) 路线相似度确定方法、装置、设备和介质
CN110765226B (zh) 货主匹配方法、装置、设备和介质
CN110347925B (zh) 信息处理方法及计算机可读存储介质
JP2014215915A (ja) 相関値算出システム、判定システム、相関値算出方法、判定方法及びコンピュータプログラム
CN109446427A (zh) 一种信息推荐方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20220825

Address after: No. 123, Kaifa Avenue, economic development zone, Guiyang City, Guizhou Province

Applicant after: GUIYANG HUOCHEBANG TECHNOLOGY CO.,LTD.

Address before: 210012 3-5 / F, building 4, 170-1 software Avenue, Yuhuatai District, Nanjing City, Jiangsu Province

Applicant before: JIANGSU MANYUN SOFTWARE TECHNOLOGY Co.,Ltd.

TA01 Transfer of patent application right
GR01 Patent grant
GR01 Patent grant