CN112884614B - 基于频繁序列的路线推荐方法、装置和电子设备 - Google Patents
基于频繁序列的路线推荐方法、装置和电子设备 Download PDFInfo
- Publication number
- CN112884614B CN112884614B CN201911211733.9A CN201911211733A CN112884614B CN 112884614 B CN112884614 B CN 112884614B CN 201911211733 A CN201911211733 A CN 201911211733A CN 112884614 B CN112884614 B CN 112884614B
- Authority
- CN
- China
- Prior art keywords
- sequence
- frequent
- sequence set
- path
- candidate
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 56
- 238000004364 calculation method Methods 0.000 claims abstract description 14
- 230000015654 memory Effects 0.000 claims description 12
- 230000004931 aggregating effect Effects 0.000 claims description 8
- 238000000638 solvent extraction Methods 0.000 claims description 8
- 238000002076 thermal analysis method Methods 0.000 claims description 6
- 238000004590 computer program Methods 0.000 claims description 5
- 230000000903 blocking effect Effects 0.000 claims description 3
- 238000012800 visualization Methods 0.000 claims description 3
- 238000005065 mining Methods 0.000 abstract description 10
- 230000008569 process Effects 0.000 abstract description 10
- 238000007418 data mining Methods 0.000 abstract description 6
- 230000009286 beneficial effect Effects 0.000 abstract description 4
- 238000007781 pre-processing Methods 0.000 description 4
- 230000011218 segmentation Effects 0.000 description 4
- 230000006399 behavior Effects 0.000 description 3
- 238000004422 calculation algorithm Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000013138 pruning Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/14—Travel agencies
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/29—Geographical information databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
- G06Q10/047—Optimisation of routes or paths, e.g. travelling salesman problem
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Tourism & Hospitality (AREA)
- Theoretical Computer Science (AREA)
- Human Resources & Organizations (AREA)
- Physics & Mathematics (AREA)
- Economics (AREA)
- General Physics & Mathematics (AREA)
- Strategic Management (AREA)
- Marketing (AREA)
- Databases & Information Systems (AREA)
- General Business, Economics & Management (AREA)
- Data Mining & Analysis (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Remote Sensing (AREA)
- Primary Health Care (AREA)
- General Engineering & Computer Science (AREA)
- Development Economics (AREA)
- Game Theory and Decision Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请实施例提供的一种基于频繁序列的路线推荐方法、装置和电子设备,涉及交通数据挖掘技术领域,通过在预先确定的路径序列数据库包括的位置中,选择支持度大于第一阈值的位置作为第一频繁序列集合中的第一序列;根据路径序列数据库的多个路径序列和第一频繁序列集合计算交集,确定第二候选序列集合;基于第二候选序列集合中各个第二候选序列在所述路径序列数据库中的支持度,确定推荐路线,解决了旅游路线数据挖掘过程中存在的计算时间长、存储空间开销过大的问题,实现了降低时间复杂度、高效完成海量旅游路径的频繁序列挖掘任务的有益效果。
Description
技术领域
本发明涉及交通数据挖掘技术领域,尤其是一种基于频繁序列的路线推荐方法、装置和电子设备。
背景技术
随着旅游业的发展,大规模的出行人群积累了海量的用户行为数据。如何从海量行为数据中进行挖掘,总结出行规律,发挥数据的价值逐渐成为研究热点,同时对道路的交通流量控制、景点商业化服务布局、公共设施的建立以及游客旅游路线推荐具有重要意义。
在数据挖掘领域,序列频繁模式刻画了某个数据库中按时间先后频繁出现一组序列。经典的AprioriAll算法通过对已有的频繁k序列进行自连接操作,生成新的候选k+1序列,然后进行剪枝操作,通过不断迭代产生最终的序列频繁模式。传统的AprioriAll在一定场景下可以满足数据挖掘的需求,但面对大规模的旅游路径序列数据,AprioriAll在时间和空间性能方法存在着瓶颈,因此存在着计算时间长、存储空间开销过大的问题。
发明内容
有鉴于此,本发明的目的在于提供一种基于频繁序列的路线推荐方法、装置和电子设备,以解决路线挖掘过程中存在的计算时间长、存储空间开销过大的技术问题。
第一方面,本申请实施例提供了一种基于频繁序列的路线推荐方法,该方法包括以下步骤:在预先确定的路径序列数据库包括的位置中,选择支持度大于第一阈值的位置作为第一频繁序列集合中的第一序列,所述预先确定的路径序列数据库包括多个路径序列,每个所述路径序列对应一个路线的位置,每个路线包括至少一个位置;根据所述路径序列数据库的多个路径序列和所述第一频繁序列集合中的第一序列计算交集,确定第二候选序列集合;基于所述第二候选序列集合中各个第二候选序列在所述路径序列数据库中的支持度,确定推荐路线。
在可选的实施方式中,基于所述第二候选序列集合中各个第二候选序列在所述路径序列数据库中的支持度,确定推荐路线的步骤,包括:基于所述第二候选序列集合中的每个第二候选序列在所述路径序列数据库中的支持度,选择支持度大于第二阈值的第二候选序列作为第二频繁序列集合中的第二频繁序列;判断所述第二频繁序列集合是否为空,如果为空,则根据所述第一频繁序列集合,确定推荐路线。
在可选的实施方式中,如果所述第二频繁序列集合不为空,则将所述第二频繁序列集合作为初始频繁序列集合,迭代进行以下操作,直至中间频繁序列集合为空,根据频繁序列最长的频繁序列集合,确定推荐路线;基于所述初始频繁序列集合中每个频繁序列进行自连接,生成中间候选序列集合;基于所述中间候选序列集合中的每个中间候选序列在所述路径序列数据库中的支持度,选择支持度大于中间阈值的候选序列作为中间频繁序列集合中的中间频繁序列;判断所述中间频繁序列集合是否为空,如果不为空,则将所述中间频繁序列集合作为新的初始频繁序列集合。
在可选的实施方式中,该方法还包括:基于生成的所述推荐路线,进行地理信息系统的热力分析。
在可选的实施方式中,在基于所述第二候选序列集合中的每个第二候选序列在所述路径序列数据库中的支持度的步骤之前,还包括:对所述路径序列数据库进行分块;计算每个所述第二候选序列在分块后的所述路径序列数据库中的子支持度;基于所述子支持度,聚合为每个所述第二候选序列在所述路径序列数据库中的支持度。
在可选的实施方式中,所述预先确定的路径序列数据库包括的位置用于指示旅游景点;每个所述路径序列对应一个路线的位置用于指示浏览路线的旅游景点。
第二方面,本申请实施例提供了一种基于频繁序列的路线推荐装置,包括:选择模块,用于在预先确定的路径序列数据库包括的位置中,选择支持度大于第一阈值的位置作为第一频繁序列集合中的第一序列,所述预先确定的路径序列数据库包括多个路径序列,每个所述路径序列对应一个路线的位置,每个路线包括至少一个位置;第一确定模块,用于根据所述路径序列数据库的多个路径序列和所述第一频繁序列集合计算交集,确定第二候选序列集合;第二确定模块,用于基于所述第二候选序列集合中各个第二候选序列在所述路径序列数据库中的支持度,确定推荐路线。
在可选的实施方式中,该装置还包括:热力可视化模块,用于基于生成的推荐路线,进行地理信息系统的热力分析。
第三方面,本申请实施例提供了一种电子设备,包括存储器、处理器,所述存储器中存储有可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述的第一方面所述方法。
第四方面,本申请实施例提供了一种计算机可读存储介质,所述计算机可读存储介质存储有机器可运行指令,所述计算机可运行指令在被处理器调用和运行时,所述计算机可运行指令促使所述处理器运行上述的第一方面所述方法。
本申请实施例带来了以下有益效果:
本申请实施例提供的一种基于频繁序列的路线推荐方法、装置和电子设备,通过在预先确定的路径序列数据库包括的位置中,选择支持度大于第一阈值的位置作为第一频繁序列集合中的第一序列;根据路径序列数据库的多个路径序列和第一频繁序列集合计算交集,确定第二候选序列集合;基于第二候选序列集合中各个第二候选序列在所述路径序列数据库中的支持度,确定推荐路线,解决了旅游路线数据挖掘过程中存在的计算时间长、存储空间开销过大的问题,实现了降低时间复杂度、高效完成海量旅游路径的频繁序列挖掘任务的有益效果。
为使本申请的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种基于频繁序列的路线推荐方法流程图;
图2为本发明实施例提供的一种基于频繁序列的路线推荐方法流程图;
图3为本发明实施例提供的一种支持度计算方法流程示意图;
图4为本发明实施例提供的一种基于频繁序列的路线推荐方法流程图;
图5为本发明实施例提供的一种基于频繁序列的路线推荐装置结构示意图;
图6为本发明实施例提供的一种电子设备的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合附图对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本申请实施例中所提到的术语“包括”和“具有”以及它们的任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括其他没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。
从大规模的出行人群积累的海量用户行为数据中进行挖掘,总结出行规律,发挥数据的价值的研究,对道路的交通流量控制、景点商业化服务布局、公共设施的建立以及游客旅游路线推荐具有重要意义。在数据挖掘领域,序列频繁模式刻画了某个数据库中按时间先后频繁出现一组序列。经典的AprioriAll算法通过对已有的频繁k序列进行自连接操作,生成新的候选k+1序列,然后进行剪枝操作,通过不断迭代产生最终的序列频繁模式。传统的AprioriAll在一定场景下可以满足数据挖掘的需求,但面对大规模的旅游路径序列数据,AprioriAll在时间和空间性能方法存在着瓶颈,因此存在着计算时间长、存储空间开销过大的问题。
本申请实施例提供了一种基于频繁序列的路线推荐方法、装置和电子设备,通过该方法可以解决路线挖掘过程中存在的计算时间长、存储空间开销过大的技术问题。
下面结合附图对本发明实施例进行进一步地介绍。
图1为本申请实施例提供的一种基于频繁序列的路线推荐方法的流程示意图。如图1所示,该方法包括以下步骤S110至S130:
S110,在预先确定的路径序列数据库包括的位置中,选择支持度大于第一阈值的位置作为第一频繁序列集合中的第一序列;
其中,预先确定的路径序列数据库包括多个路径序列,每个路径序列对应一个路线的位置,每个路线包括至少一个位置。
预先确定的路径序列数据库中的路径序列数据首先经过预处理,其中,预处理可以包括去噪清洗和去重,去除单个用户无意义的重复路线。例如,某用户在同一天的上午和晚上多次往返某景点的商店购买纪念品,这种往返路线视为无意义的重复路线,在预处理过程中需剔除。
预处理后的路径序列数据按照区域进行划分,可以按照地区为单位如:“北京市”、“河北省”等进行划分,对区域划分后的路径序列数据按照浏览时间的先后顺序进行排列,生成预先确定的路径序列数据库。
在一些实施方式中,预先确定的路径序列数据库包括的位置用于指示旅游景点;每个路径序列对应一个路线的位置用于指示浏览路线的旅游景点。例如,预先确定的路径数据库包括七个位置,用于指示七个旅游景点:“A”、“B”、“C”、“D”、“E”、“F”、“G”分别属于四个路径序列,每个路径序列对应一个路线的位置用于指示浏览路线的旅游景点,路径序列一对应的浏览路线:“A-B-C-D”;路径序列二对应的浏览路线:“B-C-D”;路径序列三对应的浏览路线:“E-F”;路径序列四对应的浏览路线:“E-H”。
支持度可以用于表示某个项在一个数据集中出现的频率,第一阈值可以是最小支持度,可以根据经验进行取值。例如在上述例子中预先确定的数据库中,设定第一阈值为1,则选择满足支持度大于1的位置,“B”、“C”、“D”和“E”作为四个第一序列,组成第一频繁序列集合。第一序列可以是包括至少一个位置的路线序列,第一频繁序列集合则是包括至少一个第一序列的集合。
S120,根据路径序列数据库的多个路径序列和第一频繁序列集合计算交集,确定第二候选序列集合。例如,上述示例中的第一序列为:“B”、“C”、“D”和“E”,根据预先确定的路径序列数据库中路径序列的顺序,和第一频繁序列集合计算交集,生成三个第二候选序列:“B-C”、“C-D”和“B-D”,组成第二候选序列集合。
本实施例提供的候选序列生成方式,通过基于路径序列数据库的多个路径序列和第一频繁序列集合计算交集,从而确定第二候选序列的方式,改进了迭代生成候选序列的过程,大大降低了算法的时间复杂度。
S130,基于第二候选序列集合中各个第二候选序列在所述路径序列数据库中的支持度,确定推荐路线。
在一些实施方式中,基于第二候选序列集合中各个第二候选序列在所述路径序列数据库中的支持度,确定推荐路线的步骤包括如图2所示的以下步骤S210至S220:
S210,基于第二候选序列集合中的每个第二候选序列在路径序列数据库中的支持度,选择支持度大于第二阈值的第二候选序列作为第二频繁序列集合中的第二频繁序列。
其中,第二候选序列为包含两个位置的序列,即包含两个景点的路线,第二候选序列集合包括至少一个第二候选序列。第二阈值可以是满足最小支持度的值,可以根据经验进行取值。第二频繁序列为包含两个位置的序列,第二频繁序列集合包括至少一个第二频繁序列。
S220,判断第二频繁序列集合是否为空,如果为空,则根据第一频繁序列集合,确定推荐路线。
判断第二频繁序列集合是否为空,即判断是否存在包含两个景点的路线,如果不存在,则根据上个步骤确定的第一频繁序列集合,即包含一个景点的路线,选择支持度较高的序列作为推荐路线。
在一些实施方式中,如果第二频繁序列集合不为空,则将第二频繁序列集合作为初始频繁序列集合,迭代进行以下操作,直至中间频繁序列集合为空,根据频繁序列最长的频繁序列集合,确定推荐路线。即,判断第二频繁序列集合中是否存在包含两个景点的路线,如果存在,则将第二频繁序列集合作为初始频繁序列集合。
S230,基于初始频繁序列集合中每个频繁序列进行自连接,生成中间候选序列集合;其中,中间候选序列集合包括至少一个中间候选序列。
S240,基于中间候选序列集合中的每个中间候选序列在路径序列数据库中的支持度,选择支持度大于中间阈值的候选序列作为中间频繁序列集合中的中间频繁序列;
其中,中间阈值可以是满足最小支持度的值,可以根据经验进行取值。中间频繁序列可以为包含若干个位置的序列,中间频繁序列集合包括至少一个中间频繁序列。
S250,判断中间频繁序列集合是否为空,如果不为空,则将中间频繁序列集合作为新的初始频繁序列集合。
判断中间频繁序列集合是否为空,即判断是否存在包含若干个景点的路线,如果存在,则将中间频繁序列集合作为新的初始频繁序列集合,即新的初始频繁序列集合中包含至少一个用于指示若干个景点路线的序列,继续执行步骤S230,直至中间频繁序列集合为空,根据频繁序列最长的频繁序列集合,确定推荐路线。
在一些实施方式中,步骤S210之前,支持度的计算还包括如图3所示的以下步骤S310至S330:
S310,对路径序列数据库进行分块;
S320,计算每个第二候选序列在分块后的路径序列数据库中的子支持度;
S330,基于子支持度,聚合为每个第二选序列在路径序列数据库中的支持度。
本实施例提供的支持度的计算方式,通过分布式计算的方法来计算候选序列的支持度,提升了海量旅游数据频繁序列挖掘过程中的时间性能和存储性能。
下面结合具体示例对上述步骤进行详细介绍。参见图4所示的流程示意图,提供了一种基于频繁序列的路线推荐方法的具体实施方式,包括以下步骤:
S401,生成第二候选序列集合。
首先在预先确定的路径序列数据库包括的位置中,选择支持度大于第一阈值的位置作为第一频繁序列集合中的第一序列;然后根据路径序列数据库的多个路径序列和第一频繁序列集合计算交集,确定第二候选序列集合。
S402,计算支持度,生成第二频繁序列集合。
计算支持度首先对路径序列数据库进行分块;然后计算每个第二候选序列在分块后的路径序列数据库中的子支持度;再基于子支持度,聚合为每个第二候选序列在路径序列数据库中的支持度;最后选择支持度大于第二阈值的第二候选序列作为第二序列,生成第二频繁序列集合。
S403,判断第二频繁序列集合是否为空。
如果第二频繁序列集合为空,则执行S404;如果第二频繁序列集合不为空,则执行S405。
S404,根据第一频繁序列集合,确定推荐路线。
S405,作为初始频繁序列集合。
即,将不为空的第二频繁序列集合作为初始频繁序列集合,迭代执行以下步骤。
S406,将初始频繁序列集合中的每个频繁序列进行自连接,生成中间候选序列集合。
S407,计算支持度,生成中间频繁序列集合。
计算支持度首先对路径序列数据库进行分块;然后计算每个中间候选序列在分块后的路径序列数据库中的子支持度;再基于子支持度,聚合为每个中间候选序列在路径序列数据库中的支持度;最后选择支持度大于中间阈值的中间候选序列作为中间频繁序列,生成中间频繁序列集合。
S408,判断中间频繁序列集合是否为空。
如果中间频繁序列集合为空,则执行S409;如果中间频繁序列集合不为空,则执行S405。
S409,根据中间频繁序列集合,确定推荐路线。
在一些实施方式中,上述方法还包括:基于生成的推荐路线,进行地理信息系统的热力分析。基于地理信息系统(Geographic Information System,GIS)实现热力可视化分析,通过颜色的深浅刻画路径的热门程度,更加直观的对旅游路线及景点的频繁程度进行展示,便于获取推荐的路线信息。
本申请实施例提供的一种基于频繁序列的路线推荐方法,通过在预先确定的路径序列数据库包括的位置中,选择支持度大于第一阈值的位置作为第一频繁序列集合中的第一序列;根据路径序列数据库的多个路径序列和第一频繁序列集合计算交集,确定第二候选序列集合;基于第二候选序列集合中各个第二候选序列在所述路径序列数据库中的支持度,确定推荐路线,解决了旅游路线数据挖掘过程中存在的计算时间长、存储空间开销过大的问题,实现了降低时间复杂度、高效完成海量旅游路径的频繁序列挖掘任务的有益效果。
图5提供了一种基于频繁序列的路线推荐装置,该装置包括:
选择模块510,用于在预先确定的路径序列数据库包括的位置中,选择支持度大于第一阈值的位置作为第一频繁序列集合中的第一序列,预先确定的路径序列数据库包括多个路径序列,每个路径序列对应一个路线的位置,每个路线包括至少一个位置;
第一确定模块520,用于基于路径序列数据库的多个路径序列和第一频繁序列集合计算交集,确定第二候选序列集合;
第二确定模块530,用于基于第二候选序列集合中各个第二候选序列在所述路径序列数据库中的支持度,确定推荐路线。
在一些实施方式中,基于频繁序列的路线推荐装置还包括:热力可视化模块,用于基于生成的推荐路线,进行地理信息系统的热力分析。
在一些实施方式中,第二确定模块530包括第一选择子模块和第一判断子模块,第一选择子模块用于基于第二候选序列集合中的每个第二候选序列在路径序列数据库中的支持度,选择支持度大于第二阈值的第二候选序列作为第二频繁序列集合中的第二频繁序列;第一判断子模块用于判断第二频繁序列集合是否为空,如果为空,则根据第一频繁序列集合,确定推荐路线。
在一些实施方式中,第二确定模块530还包括第一连接子模块、第二选择子模块和第二判断子模块。其中,如果第二频繁序列集合不为空,则将第二频繁序列集合作为初始频繁序列集合,迭代进行以下操作,直至中间频繁序列集合为空,根据频繁序列最长的频繁序列集合,确定推荐路线。
第一连接子模块用于基于初始频繁序列集合中每个频繁序列进行自连接,生成中间候选序列集合;第二选择子模块用于基于中间候选序列集合中的每个中间候选序列在路径序列数据库中的支持度,选择支持度大于中间阈值的候选序列作为中间频繁序列集合中的中间频繁序列;第二判断子模块用于判断中间频繁序列集合是否为空,如果不为空,则将中间频繁序列集合作为新的初始频繁序列集合。
在一些实施方式中,上述装置还包括支持度分块模块、支持度计算模块和支持度聚合模块。支持度分块模块用于对路径序列数据库进行分块;支持度计算模块用于计算每个第二候选序列在分块后的路径序列数据库中的子支持度;支持度聚合模块用于基于子支持度,聚合为每个第二候选序列在路径序列数据库中的支持度。
在一些实施方式中,上述装置还包括路径采集模块,用于对原始路径序列数据进行预处理,并转换成格式化原始路径序列数据。
在一些实施方式中,上述装置还包括路径生成模块,用于基于上述格式化原始路径序列数据,生成路径序列数据;还用于对生成的路径序列数据按区域进行划分,并按照时间进行排序,生成路径序列数据库。
本申请实施例提供的基于频繁序列的路线推荐装置,其实现原理及产生的技术效果和前述方法实施例相同,为简要描述,装置实施例部分未提及之处,可参考前述方法实施例中相应内容,在此不再赘述。本申请实施例提供的基于频繁序列的路线推荐装置与上述实施例提供的基于频繁序列的路线推荐方法具有相同的技术特征,所以也能解决相同的技术问题,达到相同的技术效果。
如图6所示,本申请实施例提供的一种电子设备600,包括:处理器60、存储器61和总线62,所述存储器61存储有所述处理器60可执行的机器可读指令,当电子设备运行时,所述处理器60与所述存储器61之间通过总线通信,所述处理器60执行所述机器可读指令,以执行如上述基于频繁序列的路线推荐方法的步骤。
具体地,上述存储器61和处理器60能够为通用的存储器和处理器,这里不做具体限定,当处理器60运行存储器61存储的计算机程序时,能够执行上述基于频繁序列的路线推荐方法。
对应于上述基于频繁序列的路线推荐方法,本申请实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有机器可运行指令,所述计算机可运行指令在被处理器调用和运行时,所述计算机可运行指令促使所述处理器运行上述基于频繁序列的路线推荐方法的步骤。
本申请实施例所提供的基于频繁序列的路线推荐装置可以为设备上的特定硬件或者安装于设备上的软件或固件等。本申请实施例所提供的装置,其实现原理及产生的技术效果和前述方法实施例相同,为简要描述,装置实施例部分未提及之处,可参考前述方法实施例中相应内容。所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,前述描述的系统、装置和单元的具体工作过程,均可以参考上述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的实施例中,应该理解到,所揭露装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请提供的实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述移动控制方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释,此外,术语“第一”、“第二”、“第三”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
最后应说明的是:以上所述实施例,仅为本发明的具体实施方式,用以说明本发明的技术方案,而非对其限制,本发明的保护范围并不局限于此,尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本发明实施例技术方案的精神和范围,都应涵盖在本发明的保护范围之内。
Claims (6)
1.一种基于频繁序列的路线推荐方法,其特征在于,包括:
S110,在预先确定的路径序列数据库包括的位置中,选择支持度大于第一阈值的位置作为第一频繁序列集合中的第一序列,所述预先确定的路径序列数据库包括多个路径序列,每个所述路径序列对应一个路线的位置,每个路线包括至少一个位置;所述预先确定的路径序列数据库包括的位置用于指示旅游景点;每个所述路径序列对应一个路线的位置用于指示浏览路线的旅游景点;
S120,根据所述路径序列数据库的多个路径序列和所述第一频繁序列集合计算交集,确定第二候选序列集合;
S130,基于第二候选序列集合中各个第二候选序列在所述路径序列数据库中的支持度,确定推荐路线;
支持度的计算包括以下步骤S310-S330:
S310,对所述路径序列数据库进行分块;
S320,计算每个所述第二候选序列在分块后的所述路径序列数据库中的子支持度;
S330,基于所述子支持度,聚合为每个所述第二候选序列在所述路径序列数据库中的支持度;
基于第二候选序列集合中各个第二候选序列在所述路径序列数据库中的支持度,确定推荐路线包括以下步骤S210至S220:
S210,基于所述第二候选序列集合中的每个第二候选序列在所述路径序列数据库中的支持度,选择支持度大于第二阈值的第二候选序列作为第二频繁序列集合中的第二频繁序列;其中,第二候选序列为包含两个位置的序列,即包含两个景点的路线,第二候选序列集合包括至少一个第二候选序列;
S220,判断所述第二频繁序列集合是否为空,如果为空,则根据所述第一频繁序列集合,确定推荐路线;如果所述第二频繁序列集合不为空,则将所述第二频繁序列集合作为初始频繁序列集合,迭代进行以下步骤S230-S250的操作,直至中间频繁序列集合为空,根据频繁序列最长的频繁序列集合,确定推荐路线;
S230,基于所述初始频繁序列集合中每个频繁序列进行自连接,生成中间候选序列集合;
S240,基于所述中间候选序列集合中的每个中间候选序列在所述路径序列数据库中的支持度,选择支持度大于中间阈值的候选序列作为中间频繁序列集合中的中间频繁序列;
S250,判断所述中间频繁序列集合是否为空,如果不为空,则将所述中间频繁序列集合作为新的初始频繁序列集合。
2.根据权利要求1所述的方法,其特征在于,还包括:基于生成的所述推荐路线,进行地理信息系统的热力分析。
3.一种基于频繁序列的路线推荐装置,其特征在于,包括:
选择模块,用于在预先确定的路径序列数据库包括的位置中,选择支持度大于第一阈值的位置作为第一频繁序列集合中的第一序列,所述预先确定的路径序列数据库包括多个路径序列,每个所述路径序列对应一个路线的位置,每个路线包括至少一个位置;所述预先确定的路径序列数据库包括的位置用于指示旅游景点;每个所述路径序列对应一个路线的位置用于指示浏览路线的旅游景点;
第一确定模块,用于基于所述路径序列数据库的多个路径序列和所述第一频繁序列集合计算交集,确定第二候选序列集合;
第二确定模块,用于基于第二候选序列集合中各个第二候选序列在所述路径序列数据库中的支持度,确定推荐路线;
其中,第二确定模块具体用于,对所述路径序列数据库进行分块;计算每个所述第二候选序列在分块后的所述路径序列数据库中的子支持度;基于所述子支持度,聚合为每个所述第二候选序列在所述路径序列数据库中的支持度;
其中,基于第二候选序列集合中各个第二候选序列在所述路径序列数据库中的支持度,确定推荐路线包括以下步骤S210至S220:
S210,基于所述第二候选序列集合中的每个第二候选序列在所述路径序列数据库中的支持度,选择支持度大于第二阈值的第二候选序列作为第二频繁序列集合中的第二频繁序列;其中,第二候选序列为包含两个位置的序列,即包含两个景点的路线,第二候选序列集合包括至少一个第二候选序列;
S220,判断所述第二频繁序列集合是否为空,如果为空,则根据所述第一频繁序列集合,确定推荐路线;如果所述第二频繁序列集合不为空,则将所述第二频繁序列集合作为初始频繁序列集合,迭代进行以下步骤S230-S250的操作,直至中间频繁序列集合为空,根据频繁序列最长的频繁序列集合,确定推荐路线;
S230,基于所述初始频繁序列集合中每个频繁序列进行自连接,生成中间候选序列集合;
S240,基于所述中间候选序列集合中的每个中间候选序列在所述路径序列数据库中的支持度,选择支持度大于中间阈值的候选序列作为中间频繁序列集合中的中间频繁序列;
S250,判断所述中间频繁序列集合是否为空,如果不为空,则将所述中间频繁序列集合作为新的初始频繁序列集合。
4.根据权利要求3所述的装置,其特征在于,还包括:热力可视化模块,用于基于生成的推荐路线,进行地理信息系统的热力分析。
5.一种电子设备,包括存储器、处理器,所述存储器中存储有可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现上述权利要求1至2任一项所述的方法的步骤。
6.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有机器可运行指令,所述计算机可运行指令在被处理器调用和运行时,所述计算机可运行指令促使所述处理器运行所述权利要求1至2任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911211733.9A CN112884614B (zh) | 2019-11-29 | 2019-11-29 | 基于频繁序列的路线推荐方法、装置和电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911211733.9A CN112884614B (zh) | 2019-11-29 | 2019-11-29 | 基于频繁序列的路线推荐方法、装置和电子设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112884614A CN112884614A (zh) | 2021-06-01 |
CN112884614B true CN112884614B (zh) | 2024-05-14 |
Family
ID=76039504
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911211733.9A Active CN112884614B (zh) | 2019-11-29 | 2019-11-29 | 基于频繁序列的路线推荐方法、装置和电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112884614B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113449397B (zh) * | 2021-07-09 | 2022-12-09 | 西安交通大学 | 一种机械加工工艺路线知识挖掘方法及系统 |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101710378A (zh) * | 2009-10-10 | 2010-05-19 | 北京理工大学 | 一种基于序列模式挖掘的软件安全漏洞检测方法 |
CN104408290A (zh) * | 2014-10-30 | 2015-03-11 | 西北工业大学 | 基于包含与演绎分析的精确序列规则挖掘方法 |
CN104537025A (zh) * | 2014-12-19 | 2015-04-22 | 北京邮电大学 | 频繁序列挖掘方法 |
CN105955209A (zh) * | 2016-04-26 | 2016-09-21 | 中南民族大学 | 一种基于数据挖掘制造业工厂设备布局方法 |
CN107680010A (zh) * | 2017-09-29 | 2018-02-09 | 桂林电子科技大学 | 一种基于游览行为的景区路线推荐方法及其系统 |
CN107679661A (zh) * | 2017-09-30 | 2018-02-09 | 桂林电子科技大学 | 一种基于知识图谱的个性化旅游路线规划方法 |
CN108829852A (zh) * | 2018-06-21 | 2018-11-16 | 桂林电子科技大学 | 一种个性化旅游路线推荐方法 |
CN109948990A (zh) * | 2019-03-29 | 2019-06-28 | 合肥工业大学智能制造技术研究院 | 云物流环境下的路径优化方法、系统及存储介质 |
KR20190103918A (ko) * | 2018-02-13 | 2019-09-05 | 재단법인대구경북과학기술원 | 분산 시스템 기반 큰 규모 빈발 패턴 마이닝 시스템 및 방법 |
CN110209708A (zh) * | 2019-05-22 | 2019-09-06 | 齐鲁工业大学 | 基于数组存储的序列模式存储方法及挖掘方法 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6665669B2 (en) * | 2000-01-03 | 2003-12-16 | Db Miner Technology Inc. | Methods and system for mining frequent patterns |
US7644078B2 (en) * | 2005-02-28 | 2010-01-05 | Gm Global Technology Operations, Inc. | System and method for mining of temporal data |
-
2019
- 2019-11-29 CN CN201911211733.9A patent/CN112884614B/zh active Active
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101710378A (zh) * | 2009-10-10 | 2010-05-19 | 北京理工大学 | 一种基于序列模式挖掘的软件安全漏洞检测方法 |
CN104408290A (zh) * | 2014-10-30 | 2015-03-11 | 西北工业大学 | 基于包含与演绎分析的精确序列规则挖掘方法 |
CN104537025A (zh) * | 2014-12-19 | 2015-04-22 | 北京邮电大学 | 频繁序列挖掘方法 |
CN105955209A (zh) * | 2016-04-26 | 2016-09-21 | 中南民族大学 | 一种基于数据挖掘制造业工厂设备布局方法 |
CN107680010A (zh) * | 2017-09-29 | 2018-02-09 | 桂林电子科技大学 | 一种基于游览行为的景区路线推荐方法及其系统 |
CN107679661A (zh) * | 2017-09-30 | 2018-02-09 | 桂林电子科技大学 | 一种基于知识图谱的个性化旅游路线规划方法 |
KR20190103918A (ko) * | 2018-02-13 | 2019-09-05 | 재단법인대구경북과학기술원 | 분산 시스템 기반 큰 규모 빈발 패턴 마이닝 시스템 및 방법 |
CN108829852A (zh) * | 2018-06-21 | 2018-11-16 | 桂林电子科技大学 | 一种个性化旅游路线推荐方法 |
CN109948990A (zh) * | 2019-03-29 | 2019-06-28 | 合肥工业大学智能制造技术研究院 | 云物流环境下的路径优化方法、系统及存储介质 |
CN110209708A (zh) * | 2019-05-22 | 2019-09-06 | 齐鲁工业大学 | 基于数组存储的序列模式存储方法及挖掘方法 |
Non-Patent Citations (1)
Title |
---|
基于众源地理数据的热门旅游路线推荐算法及实证研究;陈旭;中国优秀硕士论文全文数据库 经济与管理科学辑(第第11期期);第1-16页 * |
Also Published As
Publication number | Publication date |
---|---|
CN112884614A (zh) | 2021-06-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109408657B (zh) | 一种超大规模空间数据快速制图方法及系统 | |
KR101974695B1 (ko) | 추천 결과를 디스플레이하기 위한 방법 및 장치 | |
De Oliveira et al. | A density-based spatial clustering approach for defining local indicators of drinking water distribution pipe breakage | |
US9123259B2 (en) | Discovering functional groups of an area | |
US9448754B2 (en) | Resolving label collisions on a digital map | |
CN109994038B (zh) | 不规则区域内兴趣点确定方法、装置、电子设备 | |
CN111651685A (zh) | 一种兴趣点获取方法、装置、电子设备及存储介质 | |
CN110019989B (zh) | 一种数据处理方法及装置 | |
CN111274341A (zh) | 一种网点选址方法和装置 | |
JP2012198839A (ja) | 交通量予測装置、交通量予測方法およびプログラム | |
van Dijk et al. | Interactive focus maps using least-squares optimization | |
CN115293332A (zh) | 一种图神经网络的训练方法、装置、设备及存储介质 | |
CN112884614B (zh) | 基于频繁序列的路线推荐方法、装置和电子设备 | |
Yao et al. | Mining multiple spatial–temporal paths from social media data | |
US10346766B1 (en) | Determination and optimization of delivery routes | |
US20130339136A1 (en) | Detection of events from bursts of activity indicators | |
CN107239889B (zh) | 一种定量评价泥石流胁迫下山区建筑物易损性的方法 | |
CN112988933A (zh) | 地址信息管理的方法和装置 | |
CN110784500B (zh) | 一种信息推送的方法、装置、电子设备及存储介质 | |
US9706352B2 (en) | System and method for determining a boundary of a geographic area | |
CN111309835A (zh) | 一种空间数据可视化的处理方法、系统及设备 | |
CN110930101A (zh) | 确定订单的配送时间的方法、装置、电子设备和可读介质 | |
CN111159480B (zh) | 一种基于电网gis数据的图形绘制方法 | |
CN112948517B (zh) | 区域位置标定方法、装置及电子设备 | |
Misue et al. | Drawing semi-bipartite graphs in anchor+ matrix style |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |