CN112948512A - 位置数据划分方法、装置、计算机设备和存储介质 - Google Patents

位置数据划分方法、装置、计算机设备和存储介质 Download PDF

Info

Publication number
CN112948512A
CN112948512A CN201911256413.5A CN201911256413A CN112948512A CN 112948512 A CN112948512 A CN 112948512A CN 201911256413 A CN201911256413 A CN 201911256413A CN 112948512 A CN112948512 A CN 112948512A
Authority
CN
China
Prior art keywords
clustering
data
position data
service
candidate point
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201911256413.5A
Other languages
English (en)
Inventor
张昆杰
陀斌
江晗
苗魁
吕祥东
孙斌
臧玳跃
张诺
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
SF Technology Co Ltd
SF Tech Co Ltd
Original Assignee
SF Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SF Technology Co Ltd filed Critical SF Technology Co Ltd
Priority to CN201911256413.5A priority Critical patent/CN112948512A/zh
Publication of CN112948512A publication Critical patent/CN112948512A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/29Geographical information databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/906Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/08Logistics, e.g. warehousing, loading or distribution; Inventory or stock management
    • G06Q10/083Shipping
    • G06Q10/0838Historical data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0204Market segmentation
    • G06Q30/0205Location or geographical consideration

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Strategic Management (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Data Mining & Analysis (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • Marketing (AREA)
  • General Engineering & Computer Science (AREA)
  • General Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Tourism & Hospitality (AREA)
  • Game Theory and Decision Science (AREA)
  • Quality & Reliability (AREA)
  • Remote Sensing (AREA)
  • Operations Research (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请涉及一种位置数据划分方法、装置、计算机设备和存储介质。所述方法包括:获取待划分的位置数据;对位置数据进行聚类处理,根据聚类处理结果得到候选点数据;按照预设的业务约束条件对候选点数据进行业务划分处理,得到位置数据对应划分的业务单元。采用本方法能够提高位置数据的划分处理效果。

Description

位置数据划分方法、装置、计算机设备和存储介质
技术领域
本申请涉及计算机技术领域,特别是涉及一种位置数据划分方法、装置、计算机设备和存储介质。
背景技术
随着互联网技术的广泛应用,各种线上业务系统如线上网购品台、社交媒体平台等,极大便利了人们的工作和生活,而各种业务系统处理和产生的数据量越来越大,对数据进行分析以提高业务服务质量的难度也越来越大。例如,物流领域中,为了进行区域集中化管理,需要从物流涉及的数据量庞大的位置数据中进行划分选址,以便提供更好的物理服务。然而,随着位置数据数据规模的急剧增大,如达到十万、百万级的数据量规模时,对位置数据进行划分处理的难度增加,位置数据的划分准确度有限,导致对位置数据的划分处理效果较差。
发明内容
基于此,有必要针对上述技术问题,提供一种能够位置数据划分处理效果的位置数据划分方法、装置、计算机设备和存储介质。
一种位置数据划分方法,所述方法包括:
获取待划分的位置数据;
对位置数据进行聚类处理,根据聚类处理结果得到候选点数据;
按照预设的业务约束条件对候选点数据进行业务划分处理,得到位置数据对应划分的业务单元。
在其中一个实施例中,对位置数据进行聚类处理,根据聚类处理结果得到候选点数据包括:
确定位置数据的聚类结果数目;
对位置数据进行聚类处理,得到数量与聚类结果数目相同的聚类处理结果;
根据聚类处理结果得到候选点数据。
在其中一个实施例中,对位置数据进行聚类处理,得到数量与聚类结果数目相同的聚类处理结果包括:
通过K均值聚类算法将位置数据聚类成与聚类结果数目相同数量的聚类数据簇;
确定各聚类数据簇的簇中心和各聚类数据簇中包括的各位置数据对应的业务数据量;
确定业务数据量和各位置数据对应簇中心与各位置数据的距离的乘积和;
当乘积和满足预设聚类结束条件时,根据各聚类数据簇得到聚类处理结果。
在其中一个实施例中,根据聚类处理结果得到候选点数据包括:
将各位置数据对应的业务数据量叠加至各位置数据对应的簇中心,并将叠加更新后的簇中心作为候选点数据。
在其中一个实施例中,还包括:
当乘积和不满足聚类结束条件时,将聚类次数加一,得到更新后的聚类次数;
当聚类次数达到预设的聚类次数阈值时,根据各乘积和中数值最小的乘积和对应的各聚类数据簇得到聚类处理结果。
在其中一个实施例中,按照预设的业务约束条件对候选点数据进行业务划分处理,得到位置数据对应划分的业务单元包括:
获取预设的业务约束条件;
基于整数规划算法根据业务约束条件对候选点数据进行整数规划处理,得到整数规划结果;
当整数规划结果的数目大于1时,根据预设的规划筛选条件从整数规划结果中确定目标规划结果;规划筛选条件包括未划分业务数据量条件和业务数据量与距离乘积和条件中的至少一项;
根据目标规划结果对候选点数据进行划分处理,得到位置数据对应划分的业务单元。
在其中一个实施例中,业务约束条件包括业务单元的单位业务数据量约束、单元大小约束和单元数目约束中的至少一种。
在其中一个实施例中,还包括:
对业务单元中包括的各候选点数据进行校验分析,得到校验分析结果;
当校验分析结果为校验不通过时,对校验不通过的候选点数据进行划分更新,得到更新后的业务单元。
一种位置数据划分装置,所述装置包括:
位置数据获取模块,用于获取待划分的位置数据;
数据聚类处理模块,用于对位置数据进行聚类处理,根据聚类处理结果得到候选点数据;
业务约束划分模块,用于按照预设的业务约束条件对候选点数据进行业务划分处理,得到位置数据对应划分的业务单元。
一种计算机设备,包括存储器和处理器,存储器存储有计算机程序,处理器执行计算机程序时实现以下步骤:
获取待划分的位置数据;
对位置数据进行聚类处理,根据聚类处理结果得到候选点数据;
按照预设的业务约束条件对候选点数据进行业务划分处理,得到位置数据对应划分的业务单元。
一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:
获取待划分的位置数据;
对位置数据进行聚类处理,根据聚类处理结果得到候选点数据;
按照预设的业务约束条件对候选点数据进行业务划分处理,得到位置数据对应划分的业务单元。
上述位置数据划分方法、装置、计算机设备和存储介质,先对待划分的位置数据进行聚类处理,根据待划分的位置数据,降低了位置数据的数据规模,再按照预设的业务约束条件对候选点数据进行业务划分处理,得到位置数据对应划分的业务单元,通过降低位置数据的数据规模后结合业务约束条件进行业务划分,可以避免数据规模过大导致划分难度过大,且满足业务约束条件进行划分处理,可以确保位置数据划分的准确性,提高位置数据的划分处理效果。
附图说明
图1为一个实施例中位置数据划分方法的应用环境图;
图2为一个实施例中位置数据划分方法的流程示意图;
图3为一个实施例中位置数据聚类的流程示意图;
图4为一个实施例中展示业务单元的示意图;
图5为另一个实施例中位置数据划分方法的流程示意图;
图6为一个实施例中位置数据划分装置的结构框图;
图7为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请提供的位置数据划分方法,可以应用于如图1所示的应用环境中。其中,终端102通过网络与服务器104通过网络进行通信。终端102将待划分的位置数据发送至服务器104,服务器104先对待划分的位置数据进行聚类处理,根据待划分的位置数据,再按照预设的业务约束条件对候选点数据进行业务划分处理,得到位置数据对应划分的业务单元,并将划分结果反馈至终端102。此外,也可以由终端102直接对待划分的位置数据进行位置数据划分处理,得到划分结果;还可以由服务器104直接对从数据库中获取待划分的位置数据并进行后续的位置数据划分处理,并将得到的划分处理结果下发至终端102。其中,终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备,服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
在一个实施例中,如图2所示,提供了一种位置数据划分方法,以该方法应用于图1中的终端或服务器为例进行说明,包括以下步骤:
步骤S202,获取待划分的位置数据。
其中,位置数据为需要进行划分处理的数据,具体可以为坐标数据。在物流领域,位置数据可以认为为业务用户的位置,即可以通过位置数据表征业务用户,通过对位置数据进行处理,实现对业务用户的处理。
步骤S204,对位置数据进行聚类处理,根据聚类处理结果得到候选点数据。
得到待划分的位置数据后进行聚类处理,具体可以通过聚类算法,如k-means聚类算法、Mean-Shift聚类算法、DBSCAN(Density-Based Spatial Clustering ofApplications with Noise,基于密度的带噪声的空间聚类)算法或凝聚层次聚类算法等进行多次聚类,并根据聚类处理结果得到候选点数据。其中,k-means聚类算法采用距离作为相似性的评价指标,即认为两个对象的距离越近,其相似度就越大,该算法认为类簇是由距离靠近的对象组成的,因此把得到紧凑且独立的簇作为最终目标;Mean-Shift聚类算法是基于滑动窗口的算法,来找到数据点的密集区域,其为一个基于质心的算法,通过将中心点的候选点更新为滑动窗口内点的均值来完成,来定位每个组/类的中心点,然后对这些候选窗口进行相似窗口进行去除,最终形成中心点集及相应的分组;DBSCAN算法将簇定义为密度相连的点的最大集合,能够把具有足够高密度的区域划分为簇,并可在噪声的空间数据库中发现任意形状的聚类;凝聚层次聚类算法的基本思想是通过某种相似性测度计算节点之间的相似性,并按相似度由高到低排序,逐步重新连接个节点组成一个树状图层次结构,得到聚类结果。
候选点数据根据位置数据进行聚类处理得到聚类中心确定,通过将各位置数据聚类至对应的候选点数据,可以有效降低位置数据的数据量规模。例如,当位置数据postcode的数据量为10万个时,进行位置数据划分处理的任务量规模较大,难度较大,难以进行有效的划分处理,通过对10万的postcode进行聚类,如将其聚类成功1千个候选点数据,在基于1千个候选点数据进行划分处理,有效降低了位置数据的数据量规模。
步骤S206,按照预设的业务约束条件对候选点数据进行业务划分处理,得到位置数据对应划分的业务单元。
得到候选点数据后,按照预设的业务约束条件对候选点数据进行业务划分处理,业务约束条件根据实际应用场景的需求进行确定,业务单元为各候选点数据划分后对应所属的单元区域,根据该单元区域可以针对提供业务服务,如设置服务营业点等。例如,对于物流领域,在选址时可以根据物流的业务需求设置对应的业务约束条件,如物流件量大小约束条件。通过业务约束条件对候选点数据进行业务划分处理,具体可以基于整数规划算法进行对候选点数据进行业务划分处理,从而将各候选点数据按照预定的业务约束条件进行合理划分,得到位置数据对应划分的业务单元,确保了位置数据划分的准确性,提高了位置数据的划分处理效果。
上述位置数据划分方法中,先对待划分的位置数据进行聚类处理,根据待划分的位置数据,降低了位置数据的数据规模,再按照预设的业务约束条件对候选点数据进行业务划分处理,得到位置数据对应划分的业务单元,通过降低位置数据的数据规模后结合业务约束条件进行业务划分,可以避免数据规模过大导致划分难度过大,且满足业务约束条件进行划分处理,可以确保位置数据划分的准确性,提高位置数据的划分处理效果。
在一个实施例中,对位置数据进行聚类处理,根据聚类处理结果得到候选点数据包括:确定位置数据的聚类结果数目;对位置数据进行聚类处理,得到数量与聚类结果数目相同的聚类处理结果;根据聚类处理结果得到候选点数据。
本实施例中,将位置数据聚类处理得到一定聚类结果数目的聚类处理结果,并从聚类处理结果中得到候选点数据。具体地,在对位置数据进行聚类处理时,确定位置数据的聚类结果数目,聚类结果数目为需要聚类得到的聚类结果的数量,其反映了对位置数据进行聚类处理的聚类压缩幅度,即对位置数据的规模的降低程度。在具体实现时,聚类结果数目根据实际位置数据的数据量大小进行设置,如可以预先设定具体数值,也可以为预定的比例值。确定位置数据的聚类结果数目后,按照该聚类结果数目对位置数据进行聚类处理,得到数量与聚类结果数目相同的聚类处理结果,即得到的聚类结果数目的数量为聚类结果数目。最后根据聚类处理结果得到候选点数据,具体可以从每个聚类处理结果中确定各聚类处理结果分别对应的候选点数据,例如可以将每个聚类处理结果中所有位置数据对应的簇中心作为候选点数据,并以每个聚类处理结果对应确定的候选点数据表征该聚类结果对应的位置数据。例如,可以将聚类结果对应的各位置数据的业务量叠加至该候选点数据,以实现候选点数据与各位置数据的映射,从而实现了对位置数据数据量的有效压缩。
在一个实施例中,如图3所示,位置数据聚类的处理,即对位置数据进行聚类处理,得到数量与聚类结果数目相同的聚类处理结果包括:
步骤S302,通过K均值聚类算法将位置数据聚类成与聚类结果数目相同数量的聚类数据簇。
本实施例中,通过K均值聚类算法,即k-means聚类算法对位置数据进行聚类,得到与聚类结果数目相同数量的聚类数据簇,并根据该聚类数据簇得到聚类处理结果。具体地,通过K均值聚类算法将位置数据聚类成与聚类结果数目相同数量的聚类数据簇,K均值聚类算法是一种迭代求解的聚类分析算法,其步骤是随机选取K个对象作为初始的聚类中心,然后计算每个对象与各个种子聚类中心之间的距离,把每个对象分配给距离它最近的聚类中心。聚类中心以及分配给它们的对象就代表一个聚类。每分配一个样本,聚类的聚类中心会根据聚类中现有的对象被重新计算。这个过程将不断重复直到满足某个终止条件。具体地,将K均值聚类算法的K值设为确定的聚类结果数目,通过K均值聚类算法将位置数据得到K个聚类数据簇。
步骤S304,确定各聚类数据簇的簇中心和各聚类数据簇中包括的各位置数据对应的业务数据量。
确定各聚类数据簇的簇中心,簇中心为K均值聚类算法对位置数据聚进行聚类时对应的聚类中心。各聚类数据簇中包括的各位置数据对应的业务数据量,即为各位置数据对应用户的业务数据量,如物流领域的物流件量。业务数据量可以为业务系统中记载的历史数据。
步骤S306,确定业务数据量和各位置数据对应簇中心与各位置数据的距离的乘积和。
计算每个聚类数据簇中包括的各位置数据对应的业务数据量,和各位置数据对应簇中心与各位置数据的距离的乘积,并统计每个位置数据乘积的和。该乘积和综合了各簇中心与对应位置数据的距离远近,且以各位置数据的业务数据量作为权重,可以有效反映聚类处理的聚类效果,如乘积和越小,则说明对应聚类数据簇中,得到的簇中心与各业务数据量大的位置数据的距离越近,说明该聚类数据簇的聚类效果越好,可以将该乘积和作为聚类指标进行聚类结束判定。
步骤S308,当乘积和满足预设聚类结束条件时,根据各聚类数据簇得到聚类处理结果。
当乘积和满足预设聚类结束条件时,如乘积和小于一定指标阈值,或乘积和为所有聚类次数中的最小乘积和时,认为满足预设聚类结束条件,结束聚类处理,并将满足预设聚类结束条件的乘积和对应聚类得到的各聚类数据簇作为所需的聚类数据簇,并根据各聚类数据簇得到聚类处理结果。其中,指标阈值可以根据经验值设置。若乘积和小于一定指标阈值认为满足预设聚类结束条件,可以不必遍历所有聚类处理就得到满足聚类效果需求的聚类结果,即得到的簇中心与各业务数据量大的位置数据的距离已足够小。另一方面,由于乘积和根据业务数据量和各位置数据对应簇中心与各位置数据的距离的乘积求和后得到,在乘积和为所有聚类次数中的最小乘积和认为满足预设聚类结束条件时,可以从所有聚类处理中找出簇中心与各业务数据量大的位置数据的距离最近对应的聚类处理结果,即找到聚类效果最好的聚类处理结果。通过将满足聚类结束条件的乘积和对应聚类得到的各聚类数据簇作为所需的聚类数据簇,可以基于聚类效果最好的聚类处理结果确定候选点数据,得到准确的候选点数据,再基于候选点数据进行业务划分处理,可以有效提高位置数据的划分处理效果。
此外,若乘积和不满足预设聚类结束条件,则进行下一次聚类,直至聚类结束。
在一个实施例中,根据聚类处理结果得到候选点数据包括:将各位置数据对应的业务数据量叠加至各位置数据对应的簇中心,并将叠加更新后的簇中心作为候选点数据。
本实施例中,将各位置数据对应用户的业务数据量叠加至各位置数据对应的簇中心,得到候选点数据。业务数据量为与业务相关的历史数据量,如物流领域中的历史件量,业务数据量越大,表明该位置数据对应用于参与的业务服务多。将各位置数据对应的业务数据量叠加至各位置数据对应的簇中心,从而叠加更新后的簇中心包括了所属聚类数据簇的所有业务数据量,将叠加更新后的簇中心作为候选点数据,以该候选点数据作为所属聚类数据簇聚类处理后的对象。
在一个实施例中,还包括:当乘积和不满足聚类结束条件时,将聚类次数加一,得到更新后的聚类次数;当聚类次数达到预设的聚类次数阈值时,根据各乘积和中数值最小的乘积和对应的各聚类数据簇得到聚类处理结果。
在乘积和不满足聚类结束条件时,表明当前聚类处理未结束,需要进行下一次的聚类处理,则将聚类次数加一,得到更新后的聚类次数,聚类次数为聚类处理的处理次数。当聚类次数达到预设的聚类次数阈值时,表明达到聚类次数最大值,则结束聚类,根据各乘积和中数值最小的乘积和对应的各聚类数据簇得到聚类处理结果,即根据最小成绩和对应的聚类处理得到的各聚类数据簇作为聚类处理结果。其中,聚类次数阈值可以根据实际需求进行设置。
在一个实施例中,按照预设的业务约束条件对候选点数据进行业务划分处理,得到位置数据对应划分的业务单元包括:获取预设的业务约束条件;基于整数规划算法根据业务约束条件对候选点数据进行整数规划处理,得到整数规划结果;当整数规划结果的数目大于1时,根据预设的规划筛选条件从整数规划结果中确定目标规划结果;规划筛选条件包括未划分业务数据量条件和业务数据量与距离乘积和条件中的至少一项;根据目标规划结果对候选点数据进行划分处理,得到位置数据对应划分的业务单元。
本实施例中,基于整数规划算法根据预定的业务约束条件对得到的候选点数据进行整数规划处理,根据整数规划结果确定目标规划结果并进行划分处理,得到位置数据对应划分的业务单元。
具体地,对候选点数据进行业务划分处理时,获取预设的业务约束条件,业务约束条件根据实际应用场景的业务需求进行预先设置,具体可由服务器104从存储器中读取对应预设的业务约束条件,如物流领域中,业务约束条件可以包括单位业务数据量约束、单元大小约束或单元数目约束等。各候选点数据为聚类数据簇的簇中心,是单独的数据点,其叠加有对应聚类数据簇中所有位置数据的业务数据量,业务约束条件一般为整数指标条件,如单位业务数据量约束,基于整数规划算法根据业务约束条件对候选点数据进行整数规划处理,可以快速得到满足对应业务约束条件整数规划结果。其中,整数规划中变量部分或全部为整数,整数规划算法包括分支定界法、割平面法、隐枚举法等,可以根据实际需求进行选取。得到整数规划结果后,确定整数规划结果的数量,当整数规划结果的数目大于1时,表明需要进一步进行选取操作,则根据预设的规划筛选条件从整数规划结果中确定目标规划结果。其中,规划筛选条件包括未划分业务数据量条件和业务数据量与距离乘积和条件中的至少一项;未划分业务数据量条件可以为选取未划分业务数据量最小的整数规划结果,业务数据量与距离乘积和条件可以为选取乘积和最小的整数规划结果,乘积和根据业务数据量和各位置数据对应簇中心与各位置数据的距离的乘积进行求和得到。目标规划结果为选定所需的整数规划结果,根据该目标规划结果对候选点数据进行划分处理,得到位置数据对应划分的业务单元,业务单元为各候选点数据划分后对应所属的单元区域。此外,若检测到有未被划分的候选点数据时,将其划分至距离最近的业务单元,具体可以根据候选点数据与各业务单元的中心之间的距离,确定候选点数据最近的业务单元。对位置数据进行划分确定对应业务单元后,还可以对各业务单元和业务单元中的位置数据进行可视化展示,如图4所示,为一个实施例中,对位置数据进行划分后展示的示意图。
在一个实施例中,业务约束条件包括业务单元的单位业务数据量约束、单元大小约束和单元数目约束中的至少一种。
其中,业务单元的单位业务数据量为各候选点数据划分后对应所属的单元区域中包括的所有位置数据的业务数据量总和,单位业务数据量约束可以为单位业务数据量取较小值;单元大小为业务单元的区域大小,单元大小约束可以为业务单元的区域半径不超过一定半径阈值;单元数目为划分后业务单元的数量,单元数目约束可以为单元数目取较小值。通过业务单元的单位业务数据量约束、单元大小约束和单元数目约束中的至少一种进行业务约束划分,可以确保位置数据划分的准确性,提高位置数据的划分处理效果。
在一个实施例中,还包括:对业务单元中包括的各候选点数据进行校验分析,得到校验分析结果;当校验分析结果为校验不通过时,对校验不通过的候选点数据进行划分更新,得到更新后的业务单元。
本实施例中,还可以对划分后的业务单元中的各候选数据进行校验分析,以对划分结果进行合理修正,进一步提高位置数据的划分处理效果。具体地,得到位置数据对应划分的业务单元后,对业务单元中包括的各候选点数据进行校验分析,得到校验分析结果,例如可以对各候选点数据与所属业务单元和相邻业务单元的距离进行比较,以确定各候选点数据是否划分合理。当校验分析结果为校验不通过时,对校验不通过的候选点数据进行划分更新,如可以将其划分至距离最近的业务单元中,得到更新后的业务单元。
在一个实施例中,如图5所示,提供了一种位置数据划分方法,包括:
步骤S502,获取待划分的位置数据;
步骤S504,确定位置数据的聚类结果数目;
步骤S506,通过K均值聚类算法将位置数据聚类成与聚类结果数目相同数量的聚类数据簇;
步骤S508,确定各聚类数据簇的簇中心和各聚类数据簇中包括的各位置数据对应的业务数据量;
步骤S510,确定业务数据量和各位置数据对应簇中心与各位置数据的距离的乘积和;判断乘积和是否满足预设的聚类结束条件,若是执行步骤S514,若否执行步骤S512;
步骤S512,将聚类次数加一,得到更新后的聚类次数;判断聚类次数是否达到聚类次数阈值,若是执行步骤S516,若否则执行步骤S506;
步骤S514,根据各聚类数据簇得到聚类处理结果;
步骤S516,根据各乘积和中数值最小的乘积和对应的各聚类数据簇得到聚类处理结果;
步骤S518,将各位置数据对应的业务数据量叠加至各位置数据对应的簇中心,并将叠加更新后的簇中心作为候选点数据。
本实施例中,通过K均值聚类算法对位置数据进行循环聚类处理,根据聚类处理结果中的各聚类数据簇的簇中心得到候选点数据。
步骤S520,获取预设的业务约束条件;
步骤S522,基于整数规划算法根据业务约束条件对候选点数据进行整数规划处理,得到整数规划结果;
步骤S524,当整数规划结果的数目大于1时,根据预设的规划筛选条件从整数规划结果中确定目标规划结果;
步骤S526,根据目标规划结果对候选点数据进行划分处理,得到位置数据对应划分的业务单元。
本实施例中,基于整数规划算法根据预定的业务约束条件对得到的候选点数据进行整数规划处理,根据整数规划结果确定目标规划结果并进行划分处理,得到位置数据对应划分的业务单元。
步骤S528,对业务单元中包括的各候选点数据进行校验分析,得到校验分析结果;
步骤S530,当校验分析结果为校验不通过时,对校验不通过的候选点数据进行划分更新,得到更新后的业务单元。
本实施例中,对划分后的业务单元中的各候选数据进行校验分析,以对划分结果进行合理修正,进一步提高位置数据的划分处理效果。
应该理解的是,虽然图2-3、5的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图2-3、5中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
在一个实施例中,如图6所示,提供了一种位置数据划分装置,包括位置数据获取模块602、数据聚类处理模块604和业务约束划分模块606,其中:
位置数据获取模块602,用于获取待划分的位置数据;
数据聚类处理模块604,用于对位置数据进行聚类处理,根据聚类处理结果得到候选点数据;
业务约束划分模块606,用于按照预设的业务约束条件对候选点数据进行业务划分处理,得到位置数据对应划分的业务单元。
在一个实施例中,数据聚类处理模块604包括结果数目确定模块、位置数据聚类模块和候选点确定模块;其中:结果数目确定模块,用于确定位置数据的聚类结果数目;位置数据聚类模块,用于对位置数据进行聚类处理,得到数量与聚类结果数目相同的聚类处理结果;候选点确定模块,用于根据聚类处理结果得到候选点数据。
在一个实施例中,位置数据聚类模块包括K均值聚类模块、簇参数确定模块、指标计算模块和聚类结果获得模块;其中:K均值聚类模块,用于通过K均值聚类算法将位置数据聚类成与聚类结果数目相同数量的聚类数据簇;簇参数确定模块,用于确定各聚类数据簇的簇中心和各聚类数据簇中包括的各位置数据对应的业务数据量;指标计算模块,用于确定业务数据量和各位置数据对应簇中心与各位置数据的距离的乘积和;聚类结果获得模块,用于当乘积和满足预设聚类结束条件时,根据各聚类数据簇得到聚类处理结果。
在一个实施例中,候选点确定模块包括簇中心处理模块,用于将各位置数据对应的业务数据量叠加至各位置数据对应的簇中心,并将叠加更新后的簇中心作为候选点数据。
在一个实施例中,还包括聚类次数更新模块和聚类次数比较模块;其中:聚类次数更新模块,用于当乘积和不满足聚类结束条件时,将聚类次数加一,得到更新后的聚类次数;聚类次数比较模块,用于当聚类次数达到预设的聚类次数阈值时,根据各乘积和中数值最小的乘积和对应的各聚类数据簇得到聚类处理结果。
在一个实施例中,业务约束划分模块606包括约束条件获取模块、整数规划处理模块、目标规划确定模块和业务单元确定模块;其中:约束条件获取模块,用于获取预设的业务约束条件;整数规划处理模块,用于基于整数规划算法根据业务约束条件对候选点数据进行整数规划处理,得到整数规划结果;目标规划确定模块,用于当整数规划结果的数目大于1时,根据预设的规划筛选条件从整数规划结果中确定目标规划结果;规划筛选条件包括未划分业务数据量条件和业务数据量与距离乘积和条件中的至少一项;业务单元确定模块,用于根据目标规划结果对候选点数据进行划分处理,得到位置数据对应划分的业务单元。
在一个实施例中,业务约束条件包括业务单元的单位业务数据量约束、单元大小约束和单元数目约束中的至少一种。
在一个实施例中,还包括校验处理模块和业务单元更新模块;其中:校验处理模块,用于对业务单元中包括的各候选点数据进行校验分析,得到校验分析结果;业务单元更新模块,用于当校验分析结果为校验不通过时,对校验不通过的候选点数据进行划分更新,得到更新后的业务单元。
关于位置数据划分装置的具体限定可以参见上文中对于位置数据划分方法的限定,在此不再赘述。上述位置数据划分装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器或终端,其内部结构图可以如图7所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种位置数据划分方法。
本领域技术人员可以理解,图7中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器存储有计算机程序,处理器执行计算机程序时实现以下步骤:
获取待划分的位置数据;
对位置数据进行聚类处理,根据聚类处理结果得到候选点数据;
按照预设的业务约束条件对候选点数据进行业务划分处理,得到位置数据对应划分的业务单元。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:确定位置数据的聚类结果数目;对位置数据进行聚类处理,得到数量与聚类结果数目相同的聚类处理结果;根据聚类处理结果得到候选点数据。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:通过K均值聚类算法将位置数据聚类成与聚类结果数目相同数量的聚类数据簇;确定各聚类数据簇的簇中心和各聚类数据簇中包括的各位置数据对应的业务数据量;确定业务数据量和各位置数据对应簇中心与各位置数据的距离的乘积和;当乘积和满足预设聚类结束条件时,根据各聚类数据簇得到聚类处理结果。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:将各位置数据对应的业务数据量叠加至各位置数据对应的簇中心,并将叠加更新后的簇中心作为候选点数据。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:当乘积和不满足聚类结束条件时,将聚类次数加一,得到更新后的聚类次数;当聚类次数达到预设的聚类次数阈值时,根据各乘积和中数值最小的乘积和对应的各聚类数据簇得到聚类处理结果。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:获取预设的业务约束条件;基于整数规划算法根据业务约束条件对候选点数据进行整数规划处理,得到整数规划结果;当整数规划结果的数目大于1时,根据预设的规划筛选条件从整数规划结果中确定目标规划结果;规划筛选条件包括未划分业务数据量条件和业务数据量与距离乘积和条件中的至少一项;根据目标规划结果对候选点数据进行划分处理,得到位置数据对应划分的业务单元。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:对业务单元中包括的各候选点数据进行校验分析,得到校验分析结果;当校验分析结果为校验不通过时,对校验不通过的候选点数据进行划分更新,得到更新后的业务单元。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:
获取待划分的位置数据;
对位置数据进行聚类处理,根据聚类处理结果得到候选点数据;
按照预设的业务约束条件对候选点数据进行业务划分处理,得到位置数据对应划分的业务单元。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:确定位置数据的聚类结果数目;对位置数据进行聚类处理,得到数量与聚类结果数目相同的聚类处理结果;根据聚类处理结果得到候选点数据。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:通过K均值聚类算法将位置数据聚类成与聚类结果数目相同数量的聚类数据簇;确定各聚类数据簇的簇中心和各聚类数据簇中包括的各位置数据对应的业务数据量;确定业务数据量和各位置数据对应簇中心与各位置数据的距离的乘积和;当乘积和满足预设聚类结束条件时,根据各聚类数据簇得到聚类处理结果。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:将各位置数据对应的业务数据量叠加至各位置数据对应的簇中心,并将叠加更新后的簇中心作为候选点数据。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:当乘积和不满足聚类结束条件时,将聚类次数加一,得到更新后的聚类次数;当聚类次数达到预设的聚类次数阈值时,根据各乘积和中数值最小的乘积和对应的各聚类数据簇得到聚类处理结果。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:获取预设的业务约束条件;基于整数规划算法根据业务约束条件对候选点数据进行整数规划处理,得到整数规划结果;当整数规划结果的数目大于1时,根据预设的规划筛选条件从整数规划结果中确定目标规划结果;规划筛选条件包括未划分业务数据量条件和业务数据量与距离乘积和条件中的至少一项;根据目标规划结果对候选点数据进行划分处理,得到位置数据对应划分的业务单元。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:对业务单元中包括的各候选点数据进行校验分析,得到校验分析结果;当校验分析结果为校验不通过时,对校验不通过的候选点数据进行划分更新,得到更新后的业务单元。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

Claims (11)

1.一种位置数据划分方法,所述方法包括:
获取待划分的位置数据;
对所述位置数据进行聚类处理,根据聚类处理结果得到候选点数据;
按照预设的业务约束条件对所述候选点数据进行业务划分处理,得到所述位置数据对应划分的业务单元。
2.根据权利要求1所述的方法,其特征在于,所述对所述位置数据进行聚类处理,根据聚类处理结果得到候选点数据包括:
确定所述位置数据的聚类结果数目;
对所述位置数据进行聚类处理,得到数量与所述聚类结果数目相同的聚类处理结果;
根据所述聚类处理结果得到候选点数据。
3.根据权利要求2所述的方法,其特征在于,所述对所述位置数据进行聚类处理,得到数量与所述聚类结果数目相同的聚类处理结果包括:
通过K均值聚类算法将所述位置数据聚类成与所述聚类结果数目相同数量的聚类数据簇;
确定各所述聚类数据簇的簇中心和各所述聚类数据簇中包括的各位置数据对应的业务数据量;
确定所述业务数据量和所述各位置数据对应簇中心与所述各位置数据的距离的乘积和;
当所述乘积和满足预设聚类结束条件时,根据各所述聚类数据簇得到聚类处理结果。
4.根据权利要求3所述的方法,其特征在于,所述根据所述聚类处理结果得到候选点数据包括:
将各位置数据对应的业务数据量叠加至所述各位置数据对应的簇中心,并将叠加更新后的簇中心作为候选点数据。
5.根据权利要求3所述的方法,其特征在于,还包括:
当所述乘积和不满足所述聚类结束条件时,将聚类次数加一,得到更新后的聚类次数;
当所述聚类次数达到预设的聚类次数阈值时,根据各所述乘积和中数值最小的乘积和对应的各聚类数据簇得到聚类处理结果。
6.根据权利要求1至5任意一项所述的方法,其特征在于,所述按照预设的业务约束条件对所述候选点数据进行业务划分处理,得到所述位置数据对应划分的业务单元包括:
获取预设的业务约束条件;
基于整数规划算法根据所述业务约束条件对所述候选点数据进行整数规划处理,得到整数规划结果;
当所述整数规划结果的数目大于1时,根据预设的规划筛选条件从所述整数规划结果中确定目标规划结果;所述规划筛选条件包括未划分业务数据量条件和业务数据量与距离乘积和条件中的至少一项;
根据所述目标规划结果对所述候选点数据进行划分处理,得到所述位置数据对应划分的业务单元。
7.根据权利要求1所述的方法,其特征在于,所述业务约束条件包括业务单元的单位业务数据量约束、单元大小约束和单元数目约束中的至少一种。
8.根据权利要求1所述的方法,其特征在于,还包括:
对所述业务单元中包括的各候选点数据进行校验分析,得到校验分析结果;
当所述校验分析结果为校验不通过时,对校验不通过的候选点数据进行划分更新,得到更新后的业务单元。
9.一种位置数据划分装置,其特征在于,所述装置包括:
位置数据获取模块,用于获取待划分的位置数据;
数据聚类处理模块,用于对所述位置数据进行聚类处理,根据聚类处理结果得到候选点数据;
业务约束划分模块,用于按照预设的业务约束条件对所述候选点数据进行业务划分处理,得到所述位置数据对应划分的业务单元。
10.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至8中任一项所述方法的步骤。
11.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至8中任一项所述的方法的步骤。
CN201911256413.5A 2019-12-10 2019-12-10 位置数据划分方法、装置、计算机设备和存储介质 Pending CN112948512A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911256413.5A CN112948512A (zh) 2019-12-10 2019-12-10 位置数据划分方法、装置、计算机设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911256413.5A CN112948512A (zh) 2019-12-10 2019-12-10 位置数据划分方法、装置、计算机设备和存储介质

Publications (1)

Publication Number Publication Date
CN112948512A true CN112948512A (zh) 2021-06-11

Family

ID=76225277

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911256413.5A Pending CN112948512A (zh) 2019-12-10 2019-12-10 位置数据划分方法、装置、计算机设备和存储介质

Country Status (1)

Country Link
CN (1) CN112948512A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113836358A (zh) * 2021-09-14 2021-12-24 北京百度网讯科技有限公司 数据处理方法、装置、电子设备及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20100056066A (ko) * 2008-11-19 2010-05-27 한국과학기술정보연구원 계층적 클러스터링에서 최적의 군집 분할 방법 및 시스템
CN107451673A (zh) * 2017-06-14 2017-12-08 北京小度信息科技有限公司 配送区域划分方法和装置
CN109003028A (zh) * 2018-07-17 2018-12-14 北京百度网讯科技有限公司 用于划分物流区域的方法和装置
CN109583799A (zh) * 2017-09-28 2019-04-05 北京三快在线科技有限公司 区域划分的方法及装置、电子设备
CN109615137A (zh) * 2018-12-13 2019-04-12 合肥工业大学智能制造技术研究院 用于云物流环境下云配送的选址优化方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20100056066A (ko) * 2008-11-19 2010-05-27 한국과학기술정보연구원 계층적 클러스터링에서 최적의 군집 분할 방법 및 시스템
CN107451673A (zh) * 2017-06-14 2017-12-08 北京小度信息科技有限公司 配送区域划分方法和装置
CN109583799A (zh) * 2017-09-28 2019-04-05 北京三快在线科技有限公司 区域划分的方法及装置、电子设备
CN109003028A (zh) * 2018-07-17 2018-12-14 北京百度网讯科技有限公司 用于划分物流区域的方法和装置
CN109615137A (zh) * 2018-12-13 2019-04-12 合肥工业大学智能制造技术研究院 用于云物流环境下云配送的选址优化方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
于晓寒;王东;: "基于带约束K-means聚类的城市快递配送区域划分", 哈尔滨商业大学学报(自然科学版), no. 05, 15 October 2016 (2016-10-15) *
张敬涛等: "考虑流量均衡的多配送中心选址优化方法", 物流科技, vol. 42, no. 10, 10 October 2019 (2019-10-10), pages 15 - 17 *
李栋 等: "基于城市共同配送网络体的配送中心选址研究", 综合运输, vol. 40, no. 2, 20 February 2018 (2018-02-20), pages 78 - 83 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113836358A (zh) * 2021-09-14 2021-12-24 北京百度网讯科技有限公司 数据处理方法、装置、电子设备及存储介质

Similar Documents

Publication Publication Date Title
CN108959934B (zh) 安全风险评估方法、装置、计算机设备和存储介质
CN110009225B (zh) 风险评估系统构建方法、装置、计算机设备和存储介质
CN109829020B (zh) 地点资源数据推送方法、装置、计算机设备和存储介质
CN109359669B (zh) 医保报销异常检测方法、装置、计算机设备和存储介质
CN109376381B (zh) 医保报销异常检测方法、装置、计算机设备和存储介质
CN110490608B (zh) 风险评估方法、装置、计算机设备和存储介质
CN110555164B (zh) 群体兴趣标签的生成方法、装置、计算机设备和存储介质
CN108769026B (zh) 用户账号检测系统和方法
CN112395500B (zh) 内容数据推荐方法、装置、计算机设备及存储介质
CN108322363B (zh) 推送数据异常监控方法、装置、计算机设备和存储介质
CN110377846B (zh) 社交关系挖掘方法、装置、存储介质和计算机设备
CN109886719B (zh) 基于网格的数据挖掘处理方法、装置和计算机设备
CN110135943B (zh) 产品推荐方法、装置、计算机设备和存储介质
CN110503566B (zh) 风控模型建立方法、装置、计算机设备及存储介质
CN110659396B (zh) 缺失属性信息补全方法、装置、计算机设备和存储介质
CN108182633B (zh) 贷款数据处理方法、装置、计算机设备和存储介质
CN111091276A (zh) 企业风险评分方法、装置、计算机设备和存储介质
CN112131277A (zh) 基于大数据的医疗数据异常分析方法、装置和计算机设备
CN111835561A (zh) 基于用户行为数据的异常用户群体检测方法、装置、设备
CN110765351A (zh) 目标用户识别方法、装置、计算机设备和存储介质
CN112541016A (zh) 用电异常检测方法、装置、计算机设备和存储介质
CN111210356B (zh) 医保数据分析方法、装置、计算机设备和存储介质
CN113110961B (zh) 设备异常检测方法、装置、计算机设备及可读存储介质
CN112948512A (zh) 位置数据划分方法、装置、计算机设备和存储介质
CN110598124A (zh) 数值属性挖掘方法、装置、计算机设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination