CN105303341A - 基于优先级的可扩展的智能分单方法及装置 - Google Patents
基于优先级的可扩展的智能分单方法及装置 Download PDFInfo
- Publication number
- CN105303341A CN105303341A CN201510642941.XA CN201510642941A CN105303341A CN 105303341 A CN105303341 A CN 105303341A CN 201510642941 A CN201510642941 A CN 201510642941A CN 105303341 A CN105303341 A CN 105303341A
- Authority
- CN
- China
- Prior art keywords
- point
- priority
- address
- divide
- task
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 80
- 235000013399 edible fruits Nutrition 0.000 claims description 85
- 230000008569 process Effects 0.000 claims description 29
- 238000012545 processing Methods 0.000 claims description 13
- 230000008878 coupling Effects 0.000 claims description 7
- 238000010168 coupling process Methods 0.000 claims description 7
- 238000005859 coupling reaction Methods 0.000 claims description 7
- 238000005194 fractionation Methods 0.000 claims description 5
- 238000013507 mapping Methods 0.000 claims description 5
- 238000004891 communication Methods 0.000 claims description 4
- 230000007246 mechanism Effects 0.000 claims description 3
- 230000011218 segmentation Effects 0.000 claims description 3
- 230000008901 benefit Effects 0.000 abstract description 7
- 238000010586 diagram Methods 0.000 description 14
- 230000032683 aging Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000005611 electricity Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000012467 final product Substances 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000004321 preservation Methods 0.000 description 1
- 238000012913 prioritisation Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供一种基于优先级的可扩展的智能分单方法及装置,通过建立基于优先级的多重分单方式并行的分单模型,能够最大限度的利用各分单方式的优点,规避因单一分单方式的误差给分单结果造成的影响。本发明的基于优先级的可扩展的智能分单方法包括:创建分单任务并插入订单任务池;分批次从所述订单任务池中获取所述分单任务,并将每个分单任务分发给多个分单作业线程并行处理,所述多个分单作业线程的分单方式均不相同;收集所述多个分单作业线程的分单结果;按照预先设置的所述多个分单作业线程的优先级,推算出所述每个分单任务的目标分站。
Description
技术领域
本发明涉及计算机网络技术领域,特别地涉及一种基于优先级的可扩展的智能分单方法及装置。
背景技术
分单即电商企业在用户下单后,根据订单地址将订单分配到离用户最近的配送站点的过程。分单的准确率高低会直接影响到订单的配送时效,进而影响企业的配送成本和用户的购物体验。因此,建立合适的分单模型非常重要。
订单地址一般由两部分构成,一部分是系统提供的全国所有省市区县等三级或四级地址,这部分地址以“下拉框”的形式展示给用户,用户只能选择而不能输入,这样避免了用户手动输入带来的错误和歧义,但如果用户下拉框就选择错了,则可能造成更大的分单误差,从而造成更严重的配送时效问题;另一部分则是由用户手动输入的最后一级地址,对这部分地址进行解析的方式选择是建立分单方法和装置的关键所在。
目前的分单方法有很多,主要分为人工分单和系统分单。系统分单又分为按区域匹配、按地址库匹配、按GIS(GeographicInformationSystem)坐标值匹配、按特征值匹配等等。每种分单方式都有各自的优缺点,不同企业会根据自身特点选择不同的分单方法,建立对应的分单模型。以下是几种目前常用的分单方法:
1、纯人工分单
如图1所示,为现有技术中纯人工分单方法的流程图。纯人工分单是在订单打包完成后,由人解析包裹地址,使包裹进入各级分拨中心和目标配送站点,该模型摒弃了在线地址管理的优势,采用了目前大部分快递公司在用的人工分单方法,该方法准确率较高,但是由于该模型要求人工全程参与分单,不能提前生成分单路线,工作量巨大,且时效性很差。
2、系统区域分单+人工分单
如图2所示,为现有技术中系统区域分单+人工分单方法的流程图。该分单方法结合了系统区域分单和人工分单,是目前电商企业的主流分单方法。系统区域分单主要解析订单地址的区域部分,即电商网站以“下拉框”形式提供的符合特定标准的三级或四级地址。通过系统区域分单,订单可提前生成分单路线,快速进入三级或四级地址所在区域的分拨中心,时效性高;人工分单主要解析由用户手动输入的最后一级地址。由于最后一级地址之间差异性较大、错误率较高,相比系统区域解析,人工解析时效性差,但准确率会相对较高。该分单方式除最后一级地址由人工解析外,其他部分全部由系统解析,时效性和准确率相比纯人工分单都有大幅提高。
3、系统区域分单+GIS坐标分单
如图3所示,为现有技术中系统区域分单+GIS坐标分单方法的流程图。该分单方法同图2所示的“系统区域分单+人工分单”方法的唯一区别是,最后一级地址的解析不是由人完成,而是由系统以GIS坐标值匹配的方式完成,由于分单模型系统全程参与,分单效率大幅提高,但因各地图厂商基础数据的准确性不一,分单准确率会降低。
综上所述,现有的分单方法要么采用单一分单方法,要么结合多种分单方法但采用同步、固定的方式获取配送站点,即一种分单方式结束后,只有在获取最终配送站点失败时,才会启用其他分单方式,并且各分单方式的加入是事先流程化的,一旦获得最终配送站点,便会结束分单流程,且不对分单结果进行校验。
现有的分单方法可扩展性差,不能充分发挥多种分单方式的优点,任何一种分单方式的误差都会直接体现到分单结果中,从而降低分单结果的整体准确率。
发明内容
有鉴于此,本发明提供一种基于优先级的可扩展的智能分单方法及装置,通过建立基于优先级的多重分单方式并行的分单模型,能够最大限度的利用各分单方式的优点,规避因单一分单方式的误差给分单结果造成的影响。
为实现上述目的,根据本发明的一个方面,提供了一种基于优先级的可扩展的智能分单方法。
一种基于优先级的可扩展的智能分单方法,包括:创建分单任务并插入订单任务池;分批次从所述订单任务池中获取所述分单任务,并将每个分单任务分发给多个分单作业线程并行处理,所述多个分单作业线程的分单方式均不相同;收集所述多个分单作业线程的分单结果;按照预先设置的所述多个分单作业线程的优先级,推算出所述每个分单任务的目标分站。
可选地,还包括:如果所有分单作业线程均未给出分单结果,则进入人工分单任务池,由人工进行分单以得到所述目标分站。
可选地,所述并行处理的步骤包括:所述多个分单作业线程采用多线程并行的方式分别计算每个分单任务的所述目标分站。
可选地,所述多个分单作业线程采用多线程并行的方式分别计算每个分单任务的所述目标分站的步骤包括:根据所述分单任务的订单地址判断各个分单作业线程是否有执行限制;如果有执行限制,则所述分单作业线程马上结束本次分单,并释放资源,等待下次分单;如果没有执行限制,则所述多个分单作业线程按照分单逻辑计算每个分单任务的所述目标分站。
可选地,收集所述多个分单作业线程的分单结果的步骤之前,还包括:通过信号灯机制实现线程间通信,以确定所述多个分单作业线程全部分单完成。
可选地,所述优先级的设置规则包括:为每个分单方式引入信任级和信任度两种属性;信任级越高,则优先级越高;若所述信任级相同,则信任度越高,优先级越高。
可选地,所述信任级包括完全可信、一般可信和不可信三种。
可选地,所述推算的步骤包括:若优先级最高的分单线程的分单结果只有一个,则取该分单结果为所述目标分站;若优先级最高的分单线程的分单结果有多个,则取匹配次数最多的分单结果为所述目标分站;若匹配次数最多的结果有多个,则判断所述优先级最高的分单线程的信任级是否为完全可信;如果为完全可信,则可取任意一个分单结果为所述目标分站;否则,获取所述目标分站失败,删除所述优先级的所有分单结果,重新获取分单结果以继续推算。
可选地,所述多个分单作业线程包括以下中的一个或多个:区域分单线程、地址索引分单线程、地址库分单线程、GIS坐标分单线程、特征值分单线程。
可选地,所述地址库分单线程是基于信任地址库分单方式的,其中,所述信任地址库分单方式采用分词算法将配送成功的订单地址按关键词拆分成多条地址进行保存,并且建立了拆分后的配送地址与配送分站之间的映射关系;并且所述信任地址库分单方式进一步设置了关键词粒度,所述关键词粒度的粒度值与所保存的地址的级别相关联。
可选地,所述地址库分单线程推算所述目标分站包括:将所述分单任务中包括的分单地址与所述信任地址库中保存的地址进行匹配;根据粒度值越小地址越精确的原则,从匹配的结果中选择粒度值最小的匹配地址作为所述目标分站。
根据本发明的另一方面,提供了一种基于优先级的可扩展的智能分单装置。
一种基于优先级的可扩展的智能分单装置,包括:分单任务创建模块,用于创建分单任务并插入订单任务池;分单任务分发模块,用于分批次从所述订单任务池中获取所述分单任务,并将每个分单任务分发给多个分单作业线程并行处理,所述多个分单作业线程的分单方式均不相同;分单结果收集模块,用于收集所述多个分单作业线程的分单结果;分单结果处理模块,用于按照预先设置的所述多个分单作业线程的优先级,推算出所述每个分单任务的目标分站。
根据本发明的技术方案,采用多线程多分单方式并行处理的方式进行分单操作,系统可扩展性强,能充分吸收各分单方式的优势,提高系统的分单覆盖率;基于多线程的作业调度,提高了分单效率;基于优先级的分单结果计算,提高了分单的准确率。
附图说明
附图用于更好地理解本发明,不构成对本发明的不当限定。其中:
图1是现有技术中纯人工分单方法的流程图;
图2是现有技术中系统区域分单+人工分单方法的流程图;
图3是现有技术中系统区域分单+GIS坐标分单方法的流程图;
图4是根据本发明实施例的基于优先级的可扩展的智能分单方法的主要步骤示意图;
图5是根据本发明实施例的基于优先级的可扩展的智能分单方法的流程图;
图6是根据本发明实施例的利用分单结果得出配送分站的过程流程图;
图7是根据本发明实施例的基于优先级的可扩展的智能分单装置的主要模块示意图。
具体实施方式
以下结合附图对本发明的示范性实施例做出说明,其中包括本发明实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本发明的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
本发明的基于优先级的可扩展的智能分单方法,引入了作业调度器来负责任务的抓取、分配、结果回收及处理,同时还可以实现与各分单线程之间的通信。作业调度器会定时抓取分单任务,并将每条分单任务分配给多个分单线程进行处理,通过多线程并行执行的方式,可使多条任务、多分单线程异步同时工作,从而既增加了分单的准确度又提高了分单效率。
图4是根据本发明实施例的基于优先级的可扩展的智能分单方法的主要步骤示意图。如图4所示,本发明的基于优先级的可扩展的智能分单方法主要包括如下的步骤S41至步骤S44。
步骤S41:创建分单任务并插入订单任务池。在创建分单任务时,是通过从订单表中抓取符合条件的订单数据来创建的,此处符合条件的订单数据指的是用户下单成功,但是还未进行分单的订单。对于订单表中其他的订单,例如用户虽然已下单,但是还未付款的订单,或者已经完成分单的订单等,均不在本发明的研究对象之列。作业调度器会定时地从订单表中抓取一批符合条件的订单数据以创建分单任务,并将分单任务插入配置在内存中的订单任务池。通过引入订单任务池来存储分单任务,每次仅需从内存中的订单任务池获取任务进行处理,无需直接与数据库进行数据交互,可以大大提高任务存取的效率,减轻数据库的压力。
步骤S42:分批次从所述订单任务池中获取所述分单任务,并将每个分单任务分发给多个分单作业线程并行处理,所述多个分单作业线程的分单方式均不相同。作业调度器通过增加一个看守线程,专门负责从分单任务池中获取分单任务,每次可获取多条分单任务。然后,负责处理分单任务的主线程从看守线程处获取分单任务并进行处理,每次作业完毕都可直接从看守线程处获得分单任务而不用等待,可以大大提高作业效率。作业调度器对线程的调度,则通过托管线程池的方式,以获得最优处理速度。
本发明的实施例中可以设置多个分单作业线程,每个分单作业线程采用不同的分单方式,例如:区域分单方式、地址索引分单方式、地址库分单方式、GIS坐标分单方式、特征值分单方式等。各个分单作业线程采用多线程并行的方式分别计算每个分单任务的目标分站。
当负责处理分单任务的主线程将任务分配到各个分单作业线程后,各个分单作业线程可根据如下的步骤对分单任务中的订单信息进行解析:首先根据所述分单任务的订单地址判断各个分单作业线程是否有执行限制;如果有执行限制,则所述分单作业线程马上结束本次分单,并释放资源,等待下次分单;如果没有执行限制,则所述多个分单作业线程按照分单逻辑计算每个分单任务的所述目标分站。此处的执行限制,譬如:一些中小城市没有索引地址库,那么索引分单方式对这些中小城市的分单任务即是有执行限制的。
在本发明的实施例中,由于各分单作业线程相互独立并采用多线程的方式异步作业,因此,当需要新增分单方式时,仅需要增加一个分单作业线程即可,无需更改原来的分单流程,可扩展性强。而且由于分单结果是基于优先级对各分单方式的结果的综合推算,因此随着分单方式的增多,分单结果的准确率也会逐步提高。
步骤S43:收集所述多个分单作业线程的分单结果。在该步骤之前,还需要通过信号灯机制实现线程间通信,以确定所述多个分单作业线程全部分单完成。当各个分单作业线程分单完成后,会发出作业完成的信号,待所有分单作业线程都分单结束后,作业调度器中负责处理分单任务的主线程就会收集每个分单作业线程的分单结果。
特殊情况下,如果所有分单作业线程均未给出分单结果,则进入人工分单任务池,由人工进行分单以得到所述目标分站。否则,即可根据本步骤S43中收集的分单结果执行如步骤S44所述的进一步处理。
步骤S44:按照预先设置的所述多个分单作业线程的优先级,推算出所述每个分单任务的目标分站。由于本发明的分单方法包含了多个分单作业线程,每个分单作业线程采用不同的分单方式,每个分单作业线程都有可能得到配送站点。因此,如何利用各个分单作业线程的分单结果得到最准确的目标分站是本发明的关键。
本发明的多个分单作业线程可以包括以下中的一个或多个:区域分单线程、地址索引分单线程、地址库分单线程、GIS坐标分单线程、特征值分单线程。其中,所述地址库分单线程是基于信任地址库分单方式的,所述信任地址库分单方式采用分词算法将配送成功的订单地址按关键词拆分成多条地址进行保存,并且建立了拆分后的配送地址与配送分站之间的映射关系;并且所述信任地址库分单方式进一步设置了关键词粒度,所述关键词粒度的粒度值与所保存的地址的级别相关联。所述地址库分单线程推算所述目标分站的步骤可以包括:将所述分单任务中包括的分单地址与所述信任地址库中保存的地址进行匹配;根据粒度值越小地址越精确的原则,从匹配的结果中选择粒度值最小的匹配地址作为所述目标分站。以下将举例介绍信任地址库分单方式的分单过程。
信任地址库分单方式是对区域分单方式和GIS坐标分单方式等现有分单方式的有力补充,其分单过程主要可包括如下的步骤:
步骤S1:将配送成功的订单地址按关键词(例如:号、路、胡同、学校、广场等)拆分成多条地址并保存。其中,关键词可根据经验设定。以“北京市大兴区荣华中路朝林广场”为例,该地址包含“路”和“广场”两个关键词,并且在“马驹桥配送分站”成功配送过;则按照关键词将其拆分成两条地址保存至信任地址库,即“北京市大兴区荣华中路”和“北京市大兴区荣华中路朝林广场”;
步骤S2:建立拆分后的配送地址与配送分站的映射关系;
步骤S3:设置关键词粒度。关键词主要用于对地址分类,关键词库中可包含目前常用的能表示一般地址信息的字和词,并随时间不断地丰富和扩展,同时为了细化地址级别,需将关键词进行分类,并且粒度越小地址越精确,对应的目标分站关系的可信度也就越高。粒度值的确定一般由常识和经验判断,譬如,“号”比“路”精确,“楼”比“小区”精确,相应的粒度值也应设置的更小,故此可设置“学校”、“号”、“楼”的粒度为1,“路”、“开发区”、“工业园”等的粒度为2等等。另外,根据具体设计情况,可对基于关键词的拆分地址库做大数据分析,对于分单准确率越高的关键词,粒度设置就越小;
步骤S4:匹配目标分站。譬如待分单地址为“北京市大兴区荣华中路朝林广场A座23层”,通过本分单方式,系统能匹配到上述的步骤S1中的两条拆分地址,并按照粒度越小地址越精确的原则,选择“北京市大兴区荣华中路朝林广场”对应的目标分站(马驹桥分站)作为分单结果。
根据以上所描述的信任地址库分单方式,随着成功配送订单地址的增多,信任地址库分单方式的分单覆盖率和准确率都会稳步提升。另外,配送员在配送完成后,还可通过PDA(PersonalDigitalAssistant)等手持终端采集配送地址的GIS坐标值等,并以此建立地址坐标值信息库,以完善GIS坐标分单方式的信息库,提高GIS坐标分单方式的准确度。
由于本发明包含了多个分单作业线程,本发明在利用各个分单作业线程的分单结果得到最准确的目标分站时,是通过为各个分单作业线程设置优先级的方式,对各个分单作业线程的分单结果进行排序,选择优先级最高的分单结果作为该分单任务的目标分站。本发明中优先级的设置规则包括:为每个分单方式引入信任级和信任度两种属性;信任级越高,则优先级越高;若所述信任级相同,则信任度越高,优先级越高。
根据实际应用的需要,信任级可以包括完全可信、一般可信和不可信三种。例如:区域分单方式,由于其仅适合于一个区域一个分站或者多个区域一个分站的情况,因此可设置其信任级为完全可信,该区域内若只有一个分站,由于区域与分站的一一映射关系,认为分单结果必然正确,若存在多个分站,则分单失败,结果为空;GIS坐标值分单方式,由于各地图厂商的地址坐标解析API存在偏差,因此可设置信任级为不可信;其他的分单方式可设置信任级为一般可信。
此外,对不同分单方式还需要设置信任度,以便对同一信任级的各种不同分单方式进行优先级排序。对于信任级为完全可信的分单方式无需设置信任度,信任级为一般可信和不可信的分单方式需要设置信任度。信任度的设置可根据经验由人设定,也可结合企业的实际情况借助大数据等统计学方法进行设定,例如:通过使各个分单方式分别解析已配送成功的分单任务,根据分单结果的准确率高低来设置信任度等。
根据每个分单方式的信任级和信任度,即可综合判断每个分单方式的优先级,相应地即可得到每个分单作业线程的优先级。根据每个分单作业线程的优先级,对目标分站进行推算可按照如下的步骤进行:
步骤S441:若优先级最高的分单线程的分单结果只有一个,则取该分单结果为所述目标分站;
步骤S442:若优先级最高的分单线程的分单结果有多个,则取匹配次数最多的分单结果为所述目标分站;
步骤S443:若匹配次数最多的结果有多个,则判断所述优先级最高的分单线程的信任级是否为完全可信;
步骤S444:如果为完全可信,则可取任意一个分单结果为所述目标分站;
步骤S445:否则,获取所述目标分站失败,删除所述优先级的所有分单结果,重新获取分单结果以继续推算。
对于上述的步骤S444,信任级为完全可信的分单线程,分单结果大部分情况下是一样的,但是因每个分单线程的分单标准不同,也可能会出现同一订单地址的分单结果不同,例如:距离某一订单地址最近的目标分站有两个,都是一公里,那么无论选取哪个分单结果作为目标分站都是合理的。因此,对于完全可信的分单作业线程,可取任意一个分单结果为目标分站。
由上述的步骤S41至步骤S44可以看出,本发明的基于优先级的可扩展的智能分单方法,采用多线程多分单方式并行处理的方式进行分单操作,可扩展性强,而且既能充分吸收各分单方式的优势,提高系统的分单覆盖率,又能提高分单效率和准确率。
图5是根据本发明实施例的基于优先级的可扩展的智能分单方法的流程图。以一条分单任务的处理流程为例。如图5所示,用户下单(步骤S50)后,作业调度器定时从订单表中抓取符合条件的订单数据创建分单任务,并将分单任务插入到订单任务池(步骤S51)。之后,作业调度器的看守线程分批次从订单任务池中获取分单任务(步骤S52),采用多线程并行的方式并发处理单条任务(步骤S53),将单条分单任务分发给多个分单作业线程,每个分单作业线程采用不同的分单方式。如图所示,根据分单方式的不同,可以将各个分单作业线程进行区分,例如区域分单线程、地址索引分单线程、地址库分单线程、GIS坐标分单线程、特征值分单线程,以及其他分单线程(步骤S54)等。每个分单作业线程根据其处理规则,采用多线程并行的方式分别计算该分单任务的目标分站,且在分单完成后会发出作业完成的信号灯。待所有信号灯亮(步骤S55),即所有分单作业线程分单完成后,作业调度器会按照各个分单作业线程的返回结果及配置情况,收集分单结果(步骤S56)。之后,判断是否拿到分单结果(步骤S57),如果拿到了分单结果,则根据预先设置的优先级进行推算,得到目标分站(步骤S59),否则,将进入人工分单任务池(步骤S58),由人工进行分单,最后得到目标分站(步骤S59),分单结束。
图6是根据本发明实施例的利用分单结果得出配送分站的过程流程图。以一条分单任务为例来进行说明。如图6所示,获取各个分单作业线程的分单结果(步骤S600)后,首先判断是否已拿到分单结果(步骤S601),如果没有拿到分单结果,则进入人工分单任务池(步骤S602),由人工分单,并保存分单结果(步骤S612)为目标分站。如果已拿到分单结果,则判断分单结果是否有多个(步骤S603),如果分单结果只有一个,则保存分单结果(步骤S612)为目标分站。否则,按照预先设定的优先级,将该多个分单结果按优先级排序(步骤S604),之后,获取优先级别最高的分单结果(步骤S605)继续分析。先判断获取的分单结果中是否存在多个结果(步骤S606),如果不存在,说明获取的优先级别最高的分单结果只有一个,故保存分单结果(步骤S612)为目标分站。否则,如果优先级别最高的分单结果有多个,此时,检测该多个分单结果中是否存在匹配次数最多的目标分站(步骤S607),如果存在,则取匹配次数最多的目标分站(步骤S608),并保存分单结果(步骤S612)。否则,说明该多个分单结果的匹配次数相同,此时,需要确认该分单线程的信任级是否为完全可信(步骤S609),如果信任级是完全可信,则可以取任意分单结果为目标分站(步骤S610),并保存分单结果(步骤S612)。否则,认为本优先级获取分单结果失败,删除当前优先级的分单结果(步骤S611),并重新从步骤S601开始执行,直到找到目标分站为止。
图7是根据本发明实施例的基于优先级的可扩展的智能分单装置的主要模块示意图。如图7所示,本发明的基于优先级的可扩展的智能分单装置70主要包括分单任务创建模块71、分单任务分发模块72、分单结果收集模块73和分单结果处理模块74。
分单任务创建模块71用于创建分单任务并插入订单任务池;
分单任务分发模块72用于分批次从所述订单任务池中获取所述分单任务,并将每个分单任务分发给多个分单作业线程并行处理,所述多个分单作业线程的分单方式均不相同;
分单结果收集模块73用于收集所述多个分单作业线程的分单结果;
分单结果处理模块74用于按照预先设置的所述多个分单作业线程的优先级,推算出所述每个分单任务的目标分站。
根据本发明实施例的技术方案,采用多线程多分单方式并行处理的方式进行分单操作,系统可扩展性强,能充分吸收各分单方式的优势,提高系统的分单覆盖率;基于多线程的作业调度,提高了分单效率;基于优先级的分单结果计算,提高了分单的准确率。
上述具体实施方式,并不构成对本发明保护范围的限制。本领域技术人员应该明白的是,取决于设计要求和其他因素,可以发生各种各样的修改、组合、子组合和替代。任何在本发明的精神和原则之内所作的修改、等同替换和改进等,均应包含在本发明保护范围之内。
Claims (12)
1.一种基于优先级的可扩展的智能分单方法,其特征在于,包括:
创建分单任务并插入订单任务池;
分批次从所述订单任务池中获取所述分单任务,并将每个分单任务分发给多个分单作业线程并行处理,所述多个分单作业线程的分单方式均不相同;
收集所述多个分单作业线程的分单结果;
按照预先设置的所述多个分单作业线程的优先级,推算出所述每个分单任务的目标分站。
2.根据权利要求1所述的方法,其特征在于,还包括:
如果所有分单作业线程均未给出分单结果,则进入人工分单任务池,由人工进行分单以得到所述目标分站。
3.根据权利要求1所述的方法,其特征在于,所述并行处理的步骤包括:
所述多个分单作业线程采用多线程并行的方式分别计算每个分单任务的所述目标分站。
4.根据权利要求3所述的方法,其特征在于,所述多个分单作业线程采用多线程并行的方式分别计算每个分单任务的所述目标分站的步骤包括:
根据所述分单任务的订单地址判断各个分单作业线程是否有执行限制;
如果有执行限制,则所述分单作业线程马上结束本次分单,并释放资源,等待下次分单;
如果没有执行限制,则所述多个分单作业线程按照分单逻辑计算每个分单任务的所述目标分站。
5.根据权利要求1所述的方法,其特征在于,收集所述多个分单作业线程的分单结果的步骤之前,还包括:
通过信号灯机制实现线程间通信,以确定所述多个分单作业线程全部分单完成。
6.根据权利要求1所述的方法,其特征在于,所述优先级的设置规则包括:
为每个分单方式引入信任级和信任度两种属性;
信任级越高,则优先级越高;
若所述信任级相同,则信任度越高,优先级越高。
7.根据权利要求6所述的方法,其特征在于,所述信任级包括完全可信、一般可信和不可信三种。
8.根据权利要求1或7所述的方法,其特征在于,所述推算的步骤包括:
若优先级最高的分单线程的分单结果只有一个,则取该分单结果为所述目标分站;
若优先级最高的分单线程的分单结果有多个,则取匹配次数最多的分单结果为所述目标分站;
若匹配次数最多的结果有多个,则判断所述优先级最高的分单线程的信任级是否为完全可信;
如果为完全可信,则可取任意一个分单结果为所述目标分站;
否则,获取所述目标分站失败,删除所述优先级的所有分单结果,重新获取分单结果以继续推算。
9.根据权利要求1所述的方法,其特征在于,所述多个分单作业线程包括以下中的一个或多个:区域分单线程、地址索引分单线程、地址库分单线程、GIS坐标分单线程、特征值分单线程。
10.根据权利要求9所述的方法,其特征在于,所述地址库分单线程是基于信任地址库分单方式的,
其中,所述信任地址库分单方式采用分词算法将配送成功的订单地址按关键词拆分成多条地址进行保存,并且建立了拆分后的配送地址与配送分站之间的映射关系;并且
所述信任地址库分单方式进一步设置了关键词粒度,所述关键词粒度的粒度值与所保存的地址的级别相关联。
11.根据权利要求10所述的方法,其特征在于,所述地址库分单线程推算所述目标分站包括:
将所述分单任务中包括的分单地址与所述信任地址库中保存的地址进行匹配;
根据粒度值越小地址越精确的原则,从匹配的结果中选择粒度值最小的匹配地址作为所述目标分站。
12.一种基于优先级的可扩展的智能分单装置,其特征在于,包括:
分单任务创建模块,用于创建分单任务并插入订单任务池;
分单任务分发模块,用于分批次从所述订单任务池中获取所述分单任务,并将每个分单任务分发给多个分单作业线程并行处理,所述多个分单作业线程的分单方式均不相同;
分单结果收集模块,用于收集所述多个分单作业线程的分单结果;
分单结果处理模块,用于按照预先设置的所述多个分单作业线程的优先级,推算出所述每个分单任务的目标分站。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510642941.XA CN105303341B (zh) | 2015-09-30 | 2015-09-30 | 基于优先级的可扩展的智能分单方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510642941.XA CN105303341B (zh) | 2015-09-30 | 2015-09-30 | 基于优先级的可扩展的智能分单方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN105303341A true CN105303341A (zh) | 2016-02-03 |
CN105303341B CN105303341B (zh) | 2019-07-02 |
Family
ID=55200578
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510642941.XA Active CN105303341B (zh) | 2015-09-30 | 2015-09-30 | 基于优先级的可扩展的智能分单方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105303341B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107977764A (zh) * | 2016-10-25 | 2018-05-01 | 菜鸟智能物流控股有限公司 | 索引文件的生成、配送员信息的查询方法、装置和服务器 |
CN113869808A (zh) * | 2021-12-03 | 2021-12-31 | 青岛盈智科技有限公司 | 一种任务均衡调度方法、装置及系统 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103020790A (zh) * | 2012-10-30 | 2013-04-03 | 北京京东世纪贸易有限公司 | 一种预分拣订单的方法和装置 |
CN103785616A (zh) * | 2013-12-25 | 2014-05-14 | 北京京东尚科信息技术有限公司 | 一种基于地理信息系统的邮件预分拣装置 |
CN104624509A (zh) * | 2015-01-16 | 2015-05-20 | 浙江百世技术有限公司 | 一种快递自动分拣系统及自动分拣方法 |
US20150177935A1 (en) * | 2013-12-20 | 2015-06-25 | Zheng Lu | Digital map based 3D-character virtual interaction system for social networking |
-
2015
- 2015-09-30 CN CN201510642941.XA patent/CN105303341B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103020790A (zh) * | 2012-10-30 | 2013-04-03 | 北京京东世纪贸易有限公司 | 一种预分拣订单的方法和装置 |
US20150177935A1 (en) * | 2013-12-20 | 2015-06-25 | Zheng Lu | Digital map based 3D-character virtual interaction system for social networking |
CN103785616A (zh) * | 2013-12-25 | 2014-05-14 | 北京京东尚科信息技术有限公司 | 一种基于地理信息系统的邮件预分拣装置 |
CN104624509A (zh) * | 2015-01-16 | 2015-05-20 | 浙江百世技术有限公司 | 一种快递自动分拣系统及自动分拣方法 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107977764A (zh) * | 2016-10-25 | 2018-05-01 | 菜鸟智能物流控股有限公司 | 索引文件的生成、配送员信息的查询方法、装置和服务器 |
CN113869808A (zh) * | 2021-12-03 | 2021-12-31 | 青岛盈智科技有限公司 | 一种任务均衡调度方法、装置及系统 |
CN113869808B (zh) * | 2021-12-03 | 2022-03-01 | 青岛盈智科技有限公司 | 一种任务均衡调度方法、装置及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN105303341B (zh) | 2019-07-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11372851B2 (en) | Systems and methods for rapid data analysis | |
US10621174B2 (en) | Partitioned joins in analytical databases | |
WO2015184762A1 (zh) | 数据库查询方法及装置 | |
CN103678609A (zh) | 一种基于分布式关系-对象映射处理的大数据查询的方法 | |
CN106844324B (zh) | 一种变动列数据导出为Excel格式的方法 | |
CN103984745A (zh) | 分布式视频垂直搜索方法及系统 | |
CN103412956A (zh) | 异构数据源的数据加工处理方法及系统 | |
CN103345496A (zh) | 多媒体信息检索方法和系统 | |
CN102411679B (zh) | 一种蛋白质鉴定的大规模分布式并行加速方法及其系统 | |
CN103514236A (zh) | 检索应用中基于拼音的检索条件纠错提示处理方法 | |
CN104268295A (zh) | 一种数据查询方法及装置 | |
CN103440246A (zh) | 用于MapReduce的中间结果数据排序方法及系统 | |
CN106095863A (zh) | 一种多维度数据查询和存储系统和方法 | |
CN104615734B (zh) | 一种社区管理服务大数据处理系统及其处理方法 | |
CN103678513B (zh) | 一种交互式的检索式生成方法及系统 | |
CN105303341A (zh) | 基于优先级的可扩展的智能分单方法及装置 | |
CN104268158A (zh) | 一种结构化数据分布式索引及检索方法 | |
CN105138643A (zh) | 专利检索系统及其检索方法 | |
CN104123329B (zh) | 搜索方法和装置 | |
CN104615782A (zh) | 基于滑动窗口最大匹配算法的地址匹配方法 | |
CN106484788A (zh) | 基于行业关键词的专利检索系统 | |
CN107301203B (zh) | 一种海量数据的比对方法及系统 | |
CN102855278B (zh) | 一种仿真方法和系统 | |
CN106202412A (zh) | 一种数据检索方法及装置 | |
CN105159946A (zh) | 一种基于jQuery的表格排序方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |