CN117077654A - 地址处理方法、装置、设备和介质 - Google Patents

地址处理方法、装置、设备和介质 Download PDF

Info

Publication number
CN117077654A
CN117077654A CN202310702410.XA CN202310702410A CN117077654A CN 117077654 A CN117077654 A CN 117077654A CN 202310702410 A CN202310702410 A CN 202310702410A CN 117077654 A CN117077654 A CN 117077654A
Authority
CN
China
Prior art keywords
address
addresses
data
determining
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310702410.XA
Other languages
English (en)
Inventor
吴黎霞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuzhou Online E Commerce Beijing Co ltd
Original Assignee
Wuzhou Online E Commerce Beijing Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuzhou Online E Commerce Beijing Co ltd filed Critical Wuzhou Online E Commerce Beijing Co ltd
Priority to CN202310702410.XA priority Critical patent/CN117077654A/zh
Publication of CN117077654A publication Critical patent/CN117077654A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • G06N3/0455Auto-encoder networks; Encoder-decoder networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/08Logistics, e.g. warehousing, loading or distribution; Inventory or stock management
    • G06Q10/083Shipping

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • Economics (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Computing Systems (AREA)
  • Molecular Biology (AREA)
  • Evolutionary Computation (AREA)
  • Data Mining & Analysis (AREA)
  • Biophysics (AREA)
  • Operations Research (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • Strategic Management (AREA)
  • Quality & Reliability (AREA)
  • Development Economics (AREA)
  • Marketing (AREA)
  • Human Resources & Organizations (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请实施例提供了一种地址处理方法、装置、设备和介质,其中的方法具体包括:获取地址序列数据;所述地址序列数据包括:多个地址、以及所述多个地址中两个地址之间的关系数据;确定所述地址序列数据对应的特征信息;所述特征信息包括:一个地址对应的地址特征、以及所述多个地址中两个地址之间的关系特征;根据所述特征信息,确定地址与地址解析结果之间的映射关系。本申请实施例能够提高映射关系中地址解析结果的准确度,进一步能够提高数据对象的处理效率、或者能够提高数据对象的处理成本。

Description

地址处理方法、装置、设备和介质
技术领域
本申请实施例涉及计算机信息处理技术领域,特别是涉及一种地址处理方法、装置、设备和介质。
背景技术
地址信息作为不可或缺的基础地理信息,在物流、智慧城市等众多技术领域中发挥着重要的作用。地址信息通常由连续的字符串组成,能够描述具体的地理位置。完整的地址信息可以包括国家、省、市、区县、街道、乡村、道路、门牌号码、局部区域、楼址、楼栋号、楼层号和房间号等。
物流是物流对象在地理空间上的运转,物流对象的处理效率决定着物流处理成本和物流处理效率。目前,通常根据物流对象对应的收货地址,针对物流对象进行路径规划、物流分拣、单量预测等预设处理。
在实际应用中,收货地址可能存在不规范性。如果根据不规范的收货地址进行预设处理,可能导致物流处理成本的增加或物流处理效率的降低。
发明内容
本申请实施例提供了一种地址处理方法,能够提高映射关系中地址解析结果的准确度,进一步能够提高数据对象的处理效率、或者能够提高数据对象的处理成本。
相对应的,本申请实施例还提供了一种地址处理装置、一种电子设备和一种存储介质,用以实现上述方法的实现及应用。
为了解决上述问题,本申请实施例公开了一种地址处理方法,所述方法包括:
获取地址序列数据;所述地址序列数据包括:多个地址、以及所述多个地址中两个地址之间的关系数据;
确定所述地址序列数据对应的特征信息;所述特征信息包括:一个地址对应的地址特征、以及所述多个地址中两个地址之间的关系特征;
根据所述特征信息,确定地址与地址解析结果之间的映射关系。
为了解决上述问题,本申请实施例公开了一种地址处理方法,所述方法包括:
获取数据对象对应的待处理地址;
根据地址与地址解析结果之间的映射关系,确定所述待处理地址对应的地址解析结果;
根据地址解析结果,对所述数据对象进行预设处理;
其中,所述映射关系的确定过程包括:获取地址序列数据;所述地址序列数据包括:多个地址、以及所述多个地址中两个地址之间的关系数据;确定所述地址序列数据对应的特征信息;所述特征信息包括:一个地址对应的地址特征、以及所述多个地址中两个地址之间的关系特征;根据所述特征信息,确定地址与地址解析结果之间的映射关系。
为了解决上述问题,本申请实施例公开了一种地址处理装置,所述装置包括:
序列数据获取模块,用于获取地址序列数据;所述地址序列数据包括:多个地址、以及所述多个地址中两个地址之间的关系数据;
特征确定模块,用于确定所述地址序列数据对应的特征信息;所述特征信息包括:一个地址对应的地址特征、以及所述多个地址中两个地址之间的关系特征;
映射确定模块,用于根据所述特征信息,确定地址与地址解析结果之间的映射关系。
可选地,所述关系特征包括:
所述多个地址中两个地址之间的距离特征;和/或
所述多个地址中两个地址之间的路径特征。
可选地,所述地址特征包括:
一个地址对应的文本特征;和/或
一个地址在所述多个地址中对应的位置特征;和/或
一个地址在所述多个地址中对应的连接数量特征。
可选地,经由数据分析器表征地址与地址解析结果之间的映射关系;
所述根据所述特征信息,确定地址与地址解析结果之间的映射关系,包括:
根据所述特征信息,对数据分析器进行训练,以使训练完成的数据分析器表征地址与地址解析结果之间的映射关系。
可选地,所述数据分析器包括:第一处理模块;
所述第一处理模块,用于对所述多个地址分别对应的地址特征进行线性变换,以得到对应的线性变换结果;根据所述线性变换结果、以及所述关系特征,确定所述多个地址中两个地址之间的第一注意力信息;根据所述第一注意力信息,确定所述多个地址分别对应的地址解析结果。
可选地,所述数据分析器包括:第一处理模块和第二处理模块;
所述第一处理模块,用于对所述多个地址分别对应的地址特征进行线性变换,以得到对应的线性变换结果;根据所述线性变换结果、以及所述关系特征,确定所述多个地址中两个地址之间的第一注意力信息;根据所述第一注意力信息,确定所述多个地址分别对应的特征表示;
所述第二处理模块,用于根据所述多个地址分别对应的特征表示和文本信息,对所述多个地址分别进行编码和解码,以得到所述多个地址分别对应的地址解析结果。
可选地,所述地址解析结果包括如下结果中的至少一种:
地址向量;
地址的标准表述;以及
地址的分级区域信息。
可选地,所述获取地址序列数据,包括:
根据物流对象对应的处理顺序,获取地址序列数据;其中,物流对象对应的地址与所述地址序列数据中的地址相对应;所述物流对象对应的配送顺序与所述多个地址中两个地址之间的关系数据相对应;和/或
根据地址数据库中地址之间的空间关系,获取地址序列数据。
为了解决上述问题,本申请实施例公开了一种地址处理装置,所述装置包括:
待处理地址获取模块,用于获取数据对象对应的待处理地址;
结果确定模块,用于根据地址与地址解析结果之间的映射关系,确定所述待处理地址对应的地址解析结果;
预设处理模块,用于根据地址解析结果,对所述数据对象进行预设处理;
其中,所述映射关系的确定过程包括:获取地址序列数据;所述地址序列数据包括:多个地址、以及所述多个地址中两个地址之间的关系数据;确定所述地址序列数据对应的特征信息;所述特征信息包括:一个地址对应的地址特征、以及所述多个地址中两个地址之间的关系特征;根据所述特征信息,确定地址与地址解析结果之间的映射关系。
可选地,所述预设处理包括如下处理中的至少一种:
数据对象对应的路径规划;
多地址文本对应的动态划分;
生成数据对象对应的分拣信息;
确定数据对象对应的处理用户;
确定数据对象对应的地理编码;
地址解析;
确定数据对象对应的兴趣面;
确定数据对象所对应兴趣面的标签信息;
确定数据对象对应的识别结果;
确定数据对象对应的时效信息;
确定数据对象对应的预测数量;以及
对数据对象对应的收货地址进行验证。
为了解决上述问题,本申请实施例公开了一种电子设备,包括:处理器;和存储器,其上存储有可执行代码,当所述可执行代码被执行时,使得所述处理器执行如上述实施例中任一项所述的方法。
为了解决上述问题,本申请实施例公开了一个或多个机器可读介质,其上存储有可执行代码,当所述可执行代码被执行时,使得处理器执行如上述实施例中任一项所述的方法。
本申请实施例包括以下优点:
本申请实施例获取地址序列数据,确定该地址序列数据对应的特征信息,并根据该特征信息,确定地址与地址解析结果之间的映射关系。由于本申请根据地址序列数据对应的特征信息确定映射关系,并且,特征信息中包含的关系特征能够表征多个地址中两个地址之间的关系信息;故本申请实施例能够根据更丰富的信息确定映射关系,因此,本申请实施例能够提高映射关系中地址解析结果的准确度。
本申请实施例可以将上述映射关系应用于数据对象的预设处理。具体而言,本申请实施例可以获取数据对象对应的待处理地址,根据地址与地址解析结果之间的映射关系,确定所述待处理地址对应的地址解析结果,根据地址解析结果,对所述数据对象进行预设处理。本申请实施例在提高映射关系中地址解析结果的准确度的情况下,能够根据更准确的地址解析结果,对所述数据对象进行预设处理,因此能够提高数据对象的处理效率、或者能够提高数据对象的处理成本。例如,在数据对象为物流对象的情况下,本申请实施例能够提高物流对象的处理效率、或者能够提高物流对象的处理成本。
附图说明
图1是本申请一个实施例的地址处理方法的步骤流程图;
图2是本申请一个实施例的物流处理流程的示意图;
图3是本申请一个实施例的地址序列数据的示意图;
图4是本申请一个实施例的包含n个地址的地址序列数据的示意图;
图5是本申请的一个实施例的数据分析器的结构示意图;
图6是本申请一个实施例的地址处理方法的步骤流程图;
图7是本申请一个实施例的根据数据分析器确定地址解析结果的示意图;
图8是本申请一个实施例的配送路径的示意图;
图9(a)、图9(b)分别是本申请一个实施例的预设处理流程的示意图;
图10是本申请一个实施例的地址处理装置的结构示意图;
图11是本申请一个实施例的地址处理装置的结构示意图;
图12是本申请一个实施例提供的示例性装置的结构示意图。
具体实施方式
为使本申请的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本申请作进一步详细的说明。
本申请实施例中,地址可以是一串的字符,内含国家、省份、城市或乡村、街道、门牌号码、屋邨、大厦等信息。地址的例子可以包括:“XX市XX区XX路XX号A小区C栋D单元XX室”等。
数据对象可以是由软件理解的复合信息表示。数据对象可以与实体相应,实体可以是客观存在并可相互区别的事物。数据对象的例子可以包括:物流对象等。物流对象可以是物流领域中的快递、快件、包裹等对象。在实际应用中,可以对商品进行包装,以得到物流对象;或者,可以对用户申请的物品进行包装,以得到物流对象。物流对象可以带有包装物,或者,物流对象可以不带有包装物,包装物可以包括:包装箱、或者包装袋等。在物流领域中,物流对象可以连同包装物被流通。物流面单是指物流领域在运送物流对象的过程中用以记录发件人、收件人、物流对象的信息、以及价格等相关信息的单据。物流面单标识可以是物流对象的唯一标识。
本申请实施例中可能会涉及到对用户数据的使用,在实际应用中,可以在符合所在国的适用法律法规要求的情况下(例如,用户明确同意,对用户切实通知,等),在适用法律法规允许的范围内在本文描述的方案中使用用户特定的个人数据。
相关技术中,通常根据物流对象对应的收货地址,针对物流对象进行路径规划、物流分拣、单量预测等预设处理。然而,在实际应用中,收货地址可能存在不规范性。如果根据不规范的收货地址进行预设处理,可能导致物流处理成本的增加或物流处理效率的降低。
本申请实施例提供了一种地址处理方法,该方法具体包括:获取地址序列数据;该地址序列数据具体可以包括:多个地址、以及多个地址中两个地址之间的关系数据;确定该地址序列数据对应的特征信息;该特征信息具体可以包括:一个地址对应的地址特征、以及该多个地址中两个地址之间的关系特征;根据该特征信息,确定地址与地址解析结果之间的映射关系。
本申请实施例获取地址序列数据,确定该地址序列数据对应的特征信息,并根据该特征信息,确定地址与地址解析结果之间的映射关系。由于本申请根据地址序列数据对应的特征信息确定映射关系,并且,特征信息中包含的关系特征能够表征多个地址中两个地址之间的关系信息;故本申请实施例能够根据更丰富的信息确定映射关系,因此,本申请实施例能够提高映射关系中地址解析结果的准确度。
本申请实施例可以将上述映射关系应用于数据对象的预设处理。具体而言,本申请实施例可以获取数据对象对应的待处理地址,根据地址与地址解析结果之间的映射关系,确定所述待处理地址对应的地址解析结果,根据地址解析结果,对所述数据对象进行预设处理。本申请实施例在提高映射关系中地址解析结果的准确度的情况下,能够根据更准确的地址解析结果,对所述数据对象进行预设处理,因此能够提高数据对象的处理效率或者能够提高数据对象的处理成本。例如,在数据对象为物流对象的情况下,本申请实施例能够提高物流对象的处理效率、或者能够提高物流对象的处理成本。
方法实施例一
参照图1,示出了本申请一个实施例的地址处理方法的步骤流程图,具体可以包括如下步骤:
步骤101、获取地址序列数据;该地址序列数据具体可以包括:多个地址、以及该多个地址中两个地址之间的关系数据;
步骤102、确定该地址序列数据对应的特征信息;该特征信息具体可以包括:一个地址对应的地址特征、以及该多个地址中两个地址之间的关系特征;
步骤103、根据该特征信息,确定地址与地址解析结果之间的映射关系。
在步骤101中,地址序列数据可以包括:多个地址、以及关系数据。该关系数据可以表征:该多个地址中至少部分的两个地址之间可以具有连接关系。
在实际应用中,获取地址序列数据的过程,具体可以包括:
根据物流对象对应的处理顺序,获取地址序列数据;其中,物流对象对应的地址可以与所述地址序列数据中的地址相对应;所述物流对象对应的配送顺序可以与所述多个地址中两个地址之间的关系数据相对应;和/或
根据地址数据库中地址之间的空间关系,获取地址序列数据。
参照图2,示出了本申请一个实施例的物流处理流程的示意图。图2中,○表示空间中的地址。物流对象的处理流程可以包括:揽收环节、分拨环节、转运环节、配送环节、签收环节等。其中,揽收环节用于对物流对象进行揽收;分拨环节用于将运送到分拨中心的物流对象,按照接收端的目的地、运力线路,进行装车和运输计划计算和安排,然后付诸实施;转运环节用于实现不同运输方式或同种运输方式之间的联合(接力)运输;配送环节用于向接收端(如用户)配送物流对象;签收环节用于表征接收端收到物流对象。
揽收环节或签收环节中物流对象对应的处理顺序,可以产生地址序列数据。
以揽收环节为例,揽收的物流对象对应的地址信息可以包括:发货地址和收货地址。由于快递员通常按照发货地址对应的空间关系,对物流对象进行揽收;故物流对象对应的揽收顺序,可以产生行为数据。例如,揽收环节对应的行为数据可以包括:<物流对象A1,发货地址A1的文本,揽收位置A1>、<物流对象A2,发货地址A2的文本,揽收位置A2>等。其中,发货地址的文本可以是:物流面单的发货地址区域包含的文本字符串。揽收位置可以是快递员在执行揽收操作的情况下所处的位置数据,该位置数据可以是经纬度等信息。本申请实施例可以从揽收环节对应的行为数据中获取地址序列数据,例如,获取的地址序列数据可以包括:<地址A1的文本,位置数据A1>、<地址A2的文本,位置数据A2>等。
以配送环节为例,配送的物流对象对应的地址信息可以包括:发货地址和收货地址。由于快递员通常按照收货地址对应的空间关系,对物流对象进行配送;故物流对象对应的配送顺序,可以产生行为数据。例如,配送环节对应的行为数据可以包括:<物流对象B1,发货地址B1的文本,配送位置B1>、<物流对象B2,发货地址B2的文本,配送位置B2>等。其中,发货地址的文本可以是:物流面单的发货地址区域包含的文本字符串。配送位置可以是快递员在执行配送操作的情况下所处的位置数据,该位置数据可以是经纬度等信息。本申请实施例可以从配送环节对应的行为数据中获取地址序列数据,例如,获取的地址序列数据可以包括:<地址B1的文本,位置数据B1>、<地址B2的文本,位置数据B2>等。
需要说明的是,除了使用文本来表征地址之外,还可以使用图像或语音来表征地址。因此,地址的表征方式可以包括:地址文本或地址语音或地址图像等。
地址数据库可用于存储地址以及地址对应的位置数据。本申请实施例可以根据地址数据库中地址之间的空间关系,获取地址序列数据。空间关系可以是地址之间的空间距离、和/或、地址所属的区域,获取地址序列数据。例如,可以将空间距离小于第一距离阈值的两个地址添加到一个地址序列数据中,和/或,可以将一个区域中的两个地址添加到一个地址序列数据中。其中,区域的粒度可由本领域技术人员根据实际应用需求确定,例如,区域的粒度可以包括:社区、或小区、或楼宇等。在具体实现中,还可以在空间距离小于第二距离阈值的两个地址之间建立连接,以使两者具备关系,和/或,可以在一个区域中的两个地址之间建立连接,以使两者具备关系。
在一种示例中,可以将一个小区中的任意两个地址添加到一个地址序列数据中,并在空间距离小于第二距离阈值的两个地址之间建立连接,以得到地址序列数据。
本申请实施例可以利用图形来表征地址序列数据。参照图3,示出了本申请一个实施例的地址序列数据的示意图,其中,○表示空间中的地址,○中的数字表示地址的标识。图3中的地址序列数据包括13个地址,13个地址中至少部分的两个地址之间存在连接关系。例如,地址13与地址01、地址03与地址01、地址01与地址02、地址01与地址04、地址01与地址09之间存在连接关系。
在具体实现中,可以根据物流对象对应的行为数据中物流对象的处理顺序,确定地址序列数据。处理顺序可以是物流对象的处理时间对应的顺序。以图3为例,假设快递员A在第一时间段内依次处理了地址03、地址01、地址02、地址10和地址11分别对应的物流对象,则可以得到图3中地址03与地址01、地址01与地址02、地址02与地址10、以及地址10和地址11之间的连接关系。同理,假设快递员A或快递员在第二时间段内依次处理了地址13、地址01、地址02、地址05、地址06、地址07和地址08分别对应的物流对象,则可以得到图3中地址13与地址01、地址01与地址02、地址02与地址05、地址05和地址06、地址06与地址07、以及地址07与地址08之间的连接关系。
本申请实施例对于地址序列数据中地址的数量不加以限制。在一种可选实现方式中,本申请实施例可以从初始的地址序列数据中提取包含预设数量n个地址的地址序列数据。图3所示的可以是初始的地址序列数据的示例。n可以大于1的正整数,例如,n的范围可以为[2,10]。
在实际应用中,可以采用随机提取、或者顺序提取等方式,进行包含预设数量n个地址的地址序列数据的提取。其中,随机提取可以从初始的地址序列数据中随机提取包含预设数量n个地址的地址序列数据。顺序提取可以按照地址的标识从小到大或者从大到小的顺序,从初始的地址序列数据中随机提取包含预设数量n个地址的地址序列数据。
参照图4,示出了本申请一个实施例的包含n个地址的地址序列数据的示意图,其中,可以从图3所示的初始的地址序列数据中提取地址03、地址01、地址02、地址04、地址05和地址09等6个地址,6个地址之间的连接关系可以源自初始的地址序列数据。
在步骤102中,可以确定该地址序列数据对应的特征信息;该特征信息具体可以包括:一个地址对应的地址特征、以及该多个地址中两个地址之间的关系特征。
在实际应用中,上述关系特征具体可以包括:
所述多个地址中两个地址之间的距离特征;和/或
所述多个地址中两个地址之间的路径特征。
在具体实现中,可以用距离矩阵来表征上述距离特征。距离矩阵可以为n×n的矩阵,距离矩阵的元素Dij,可以表征地址i与地址j之间的距离特征。本申请实施例可以根据地址i与地址j分别对应的位置数据,确定地址i与地址j之间的距离特征。
在具体实现中,可以用路径矩阵来表征上述路径特征。路径矩阵可以为n×n的矩阵,路径矩阵的元素Bij,可以表征地址i与地址j之间的路径特征。本申请实施例可以根据地址i与地址j之间的关系数据,确定地址i与地址j之间的路径特征。例如,在地址i与地址j之间不具备关系的情况下,可以将地址i与地址j之间的路径特征置为预设值(如负数值)。在地址i与地址j之间具备关系的情况下,地址i与地址j之间的路径特征可以为正数值。其中,可以根据地址i与地址j在物流对象的行为数据中的出现信息,确定地址i与地址j之间的路径特征。例如,出现信息可以是出现次数或出现概率等信息。地址i与地址j在物流对象的行为数据中出现,可以指先后处理了地址i和地址j对应的物流对象、或者先后处理了地址j和地址i对应的物流对象。
在实际应用中,上述地址特征具体可以包括:
一个地址对应的文本特征;和/或
一个地址在所述多个地址中对应的位置特征;和/或
一个地址在所述多个地址中对应的连接数量特征。
其中,文本特征可以是地址文本对应的字符串、和/或、地址文本对应的向量。在实际应用中,可以采用向量嵌入的方法,将一个地址文本映射为向量x。在实际应用中,在地址i与地址j之间的距离或路径较短的情况下,地址i对应的向量x1与地址j对应的向量x2之间的欧式距离也较小。
位置特征可以表征一个地址在所述多个地址中对应的位置顺序。如图4中,包含n个地址的地址序列数据中地址的位置顺序依次为:地址01、地址02、地址03、地址04、地址05和地址09。
地址i对应的连接数量特征可以指与地址i相连接的地址的数量,其可以表征地址i的重要度。连接数量特征可以对应有方向信息,方向信息可以包括入方向和出方向。如图4中,地址01的入方向地址为地址03,地址01的出方向地址为地址02、地址04和地址09。在实际应用中,可以根据方向信息对连接数量特征进行区分,以得到入方向的连接数量特征和出方向的连接数量特征。
在步骤103中,可以根据该特征信息,确定地址与地址解析结果之间的映射关系。
其中,上述地址解析结果具体可以包括如下结果中的至少一种:
地址向量;
地址的标准表述;以及
地址的分级区域信息。
其中,地址向量可以是对地址进行理解后的向量化表示。地址的标准表述可以是对地址进行补全和纠错后的表述。地址的分级区域信息可以包含:地址对应的分级区域的信息。
分级区域是国家为便于分级管理而分级划分的区域。例如,中国的分级区域具体包括:省级区、地级区、县级区、乡级区等。
在实际应用中,地址的写法灵活多变,对同一个地址,往往存在成百上千种写法。比如,“浙江省杭州市余杭区五常街道文一西路969号”为地址X的标准表述,其对应的写法具体包括:“杭州阿里巴巴西溪园区”、“杭州余杭文一西路969号”、“余杭区阿里巴巴西溪园区”、“杭州阿里巴巴淘宝城”等等。
地址向量可以针对任一写法的地址,表征对应的地址理解结果。地址的标准表述可以是对不标准的地址进行补全和纠错后的表述。地址X的分级区域可以包括:“浙江省杭州市余杭区五常街道”等。
可以理解,上述地址解析结果只是作为示例,实际上,本领域技术人员可以根据实际应用需求,采用其他地址解析结果。例如,地址解析结果还可以包括:AOI(兴趣面,Areaof Interest)结果。
在实际应用中,可以经由数据记录,来表征地址与地址解析结果之间的映射关系。数据记录可以包括:地址字段与地址解析结果字段。这样,可以根据待处理地址,在映射关系中进行查找,以得到待处理地址对应的地址解析结果。
本申请实施例可以经由数据分析器表征地址与地址解析结果之间的映射关系。相对应地,上述根据该特征信息,确定地址与地址解析结果之间的映射关系的过程,具体可以包括:根据该特征信息,对数据分析器进行训练,以使训练完成的数据分析器表征地址与地址解析结果之间的映射关系。
数据分析器的训练数据可以包括:前述的地址序列数据。一个地址序列数据可以作为训练数据中的一个训练样本。
本申请实施例可以对地址序列数据中的多个地址分别添加对应的任务标签。任务表征对应的任务可以与地址解析结果的种类相关。例如,地址向量对应的任务可以为地址理解任务或地址向量化任务,地址的标准表述对应的任务可以为地址标准化任务,地址的分级区域信息对应的任务可以为分级区域任务。
任务标签可以表征数据分析器针对一个样本的准确输出,其可以作为数据分析器的输出目标。以训练样本“杭州阿里巴巴淘宝城”为例,地址标准化任务对应的任务标签可以为“浙江省杭州市余杭区五常街道文一西路969号”,分级区域任务对应的任务标签可以为“浙江省杭州市余杭区五常街道”,地址向量化任务对应的任务标签可以为“杭州阿里巴巴淘宝城”的位置数据(如经纬度等地理坐标)、或者位置数据对应的编码向量。
在本申请的一个可选实施例中,可基于训练数据对数学模型进行训练,以得到数据分析器,数据分析器可表征输入数据(地址)和输出数据(地址解析结果)之间的映射关系。其中,输入数据可以是任一表示的地址,如地址文本或地址语音或地址图像等。
数学模型是运用数理逻辑方法和数学语言建构的科学或工程模型,数学模型是针对参照某种事物系统的特征或数量依存关系,采用数学语言,概括地或近似地表述出的一种数学结构,这种数学结构是借助于数学符号刻画出来的关系结构。数学模型可以是一个或一组代数方程、微分方程、差分方程、积分方程或统计学方程及其组合,通过这些方程定量地或定性地描述系统各变量之间的相互关系或因果关系。除了用方程描述的数学模型外,还有用其他数学工具,如代数、几何、拓扑、数理逻辑等描述的模型。其中,数学模型描述的是系统的行为和特征而不是系统的实际结构。其中,可采用机器学习、深度学习方法等方法进行数学模型的训练,机器学习方法可包括:线性回归、决策树、随机森林等,深度学习方法可包括:卷积神经网络(Convolutional Neural Networks,CNN)、长短期记忆网络(LongShort-Term Memory,LSTM)、门控循环单元(Gated Recurrent Unit,GRU)、图神经网络、基于注意力机制的序列模型等。其中,序列模型可用于将输入序列转换为输出序列。
在本申请的一种可选实现方式中,数据分析器具体可以包括:第一处理模块;所述第一处理模块,可用于对所述多个地址分别对应的地址特征进行线性变换,以得到对应的线性变换结果;根据所述线性变换结果、以及所述关系特征,确定所述多个地址中两个地址之间的第一注意力信息;根据所述第一注意力信息,确定所述多个地址分别对应的地址解析结果。
在实际应用中,可以对地址特征对应的输入序列进行不同的线性变换,分别得到查询矩阵Q(query)、键矩阵K(key)和值矩阵V(value)等线性变换结果。其中,地址特征可以包括:一个地址对应的文本特征、位置特征和连接数量特征。查询矩阵Q与键矩阵K可以作为第一注意力信息的因子。
另外,关系特征也可以作为第一注意力信息的因子。在关系特征包括距离特征和路径特征的情况下,距离特征和路径特征可以分别作为第一注意力信息的因子。换言之,本申请实施例可以根据查询矩阵Q、键矩阵K、距离特征和路径特征,确定第一注意力信息。
第一注意力信息可以是与输入序列长度相同的概率分布,该概率分布表示多个地址分别对于查询矩阵Q的重要性。本申请实施例可以将第一注意力信息对应的概率分布乘以值矩阵V得到第一自注意力向量。
在实际应用中,第一处理模块可以包括第一编码模块和第一解码模块。第一编码模块的数量可以为一个或多个。第一解码模块的数量可以为一个或多个。
其中,第一编码模块可用于地址i的编码处理,将输入序列转换为第一向量,第一向量表示多个地址中任一地址的语义信息。i可以为[1,n]。第一向量可基于第一注意力信息得到,第一注意力信息可以反映多个地址分别对应的重要度,也即可以反映多个地址所对应位置特征的重要度。例如,Aij可以表征地址i与地址j之间的第一注意力信息,在地址i对应的编码处理过程中,可以针对Aij的数值更高的地址j对应的输入序列,采用更高的关注度。
第一解码模块可用于地址i的解码处理,具体而言,根据第一编码模块输出的第一向量,确定第一输出序列。第一输出序列可以是输入序列对应的位置数据(如经纬度等地理坐标)、或者位置数据对应的编码向量。
第一解码模块在确定第一输出序列的过程中,可以使用第二注意力信息。第二注意力信息表示:位置特征对应的第一向量或第一输出序列的重要度。在确定第i个地址的第一输出序列的过程中,可以根据第二注意力信息,确定应该关注哪些位置特征对应的第一向量或第一输出序列,这样,可以提高第一解码模块得到的第一输出序列的准确度。例如,A’ij可以表征地址i与地址j之间的第二注意力信息,在地址i对应的解码处理过程中,可以针对A’ij的数值更高的地址j对应的第一向量或第一输出序列,采用更高的关注度。
本申请实施例的第一编码模块可以包括:第一注意力层和第一前馈层。其中,第一注意力层可用于确定所述多个地址中两个地址之间的第一注意力信息;第一前馈层可用于对基于第一注意力信息得到的第一自注意力向量,进行前馈运算,以得到第一向量。
本申请实施例的第一解码模块可以包括:第二注意力层和第二前馈层。其中,第二注意力层可用于确定所述多个地址中两个地址之间的第二注意力信息;第二前馈层可用于对基于第二注意力信息得到的第二自注意力向量进行前馈运算,以得到第一输出序列。
在本申请的另一种可选实现方式中,数据分析器具体可以包括:第一处理模块和第二处理模块;
其中,所述第一处理模块,用于对所述多个地址分别对应的地址特征进行线性变换,以得到对应的线性变换结果;根据所述线性变换结果、以及所述关系特征,确定所述多个地址中两个地址之间的第一注意力信息;根据所述第一注意力信息,确定所述多个地址分别对应的特征表示;
所述第二处理模块,用于根据所述多个地址分别对应的特征表示和文本信息,对所述多个地址分别进行编码和解码,以得到所述多个地址分别对应的地址解析结果。
在实际应用中,第一处理模块可以包括第一编码模块。第一编码模块的结构参见前面的介绍,在此不作赘述。第一编码模块确定的特征表示可以相当于前述的第一向量,其可以是一种中间向量。第一处理模块可以采用图神经网络的结构,或者,第一处理模块可以采用图神经网络与采用注意力机制的神经网络的组合。
第二处理模块可以包括:第二编码模块和第二解码模块。第二处理模块可以采用采用注意力机制的神经网络,如Transformer(变换器)网络。
其中,第二编码模块,用于根据所述多个地址分别对应的特征表示和文本信息,对所述多个地址分别进行编码,以得到第二向量;第二解码模块,用于地址i的解码处理,具体而言,根据第二编码模块输出的第二向量,确定地址i对应的地址解析结果,地址i对应的地址解析结果可以称为第二输出序列。第二输出序列可以是输入序列对应的位置数据(如经纬度等地理坐标)、或者位置数据对应的编码向量。
本申请实施例的第二编码模块可以包括:第三注意力层和第三前馈层。其中,第三注意力层可用于确定所述多个地址中两个地址之间的第三注意力信息;第三前馈层可用于对基于第三注意力信息得到的第三自注意力向量,进行前馈运算,以得到第二向量。
本申请实施例的第二解码模块可以包括:第四注意力层和第四前馈层。其中,第四注意力层可用于确定所述多个地址中两个地址之间的第四注意力信息;第四前馈层可用于对基于第四注意力信息得到的第四自注意力向量进行前馈运算,以得到第二输出序列。
参照图5,示出了本申请的一个实施例的数据分析器的结构示意图,其具体可以包括:第一处理模块501和第二处理模块502;其中,可以将n个地址分别对应的地址特征和关系特征输入第一处理模块501,由第一处理模块501输出n个地址分别对应的第二向量。接着,可以将n个地址分别对应的第二向量和文本信息输入第二处理模块502,由第二处理模块502输出n个地址分别对应的地址解析结果。其中,文本信息可以指第i个地址对应的地址文本。地址文本可被包含在地址特征中。
数据分析器的训练过程可以包括:前向传播和反向传播。
其中,前向传播(Forward Propagation)可以根据数据分析器的参数,按照从输入层到输出层的顺序,依次计算最后得到输出序列。其中,输出序列可用于确定损失信息。
反向传播(Backward Propagation)可以根据损失信息,按照从输出层到输入层的顺序,依次计算并对数据分析器的参数进行更新。数据分析器通常采用神经网络的结构,数据分析器的参数可以包括:神经网络的权重等参数。其中,反向传播过程中,可以确定数据分析器的参数的梯度信息,并利用该梯度信息,对数据分析器的参数进行更新。例如,反向传播可以依据微积分中的链式法则,沿着从输出层到输入层的顺序,依次计算并存储数据分析器的处理层(包括输入层、中间层和输出层)的参数的梯度信息。
相应地,在数据分析器的训练过程中,还可以根据所述多个地址分别对应的输出序列、以及所述多个地址分别对应的任务标签,确定损失信息,并根据所述损失信息,对所述数据分析器的参数进行更新。
本申请实施例可以根据训练数据对数据分析器进行迭代训练。上述迭代训练的收敛条件可以为:损失信息符合预设条件。预设条件可以为:损失信息与预设值之间的差值小于差值阈值,或者,迭代次数超过次数阈值等;此处的差值可以是正数,可以是损失信息与预设值之间的差值在数轴上所对应点到原点的距离。换言之,在损失信息符合预设条件的情况下,可以结束迭代;此种情况下,可以得到训练完成的数据分析器。
综上,本申请实施例的地址处理方法,获取地址序列数据,确定该地址序列数据对应的特征信息,并根据该特征信息,确定地址与地址解析结果之间的映射关系。由于本申请根据地址序列数据对应的特征信息确定映射关系,并且,特征信息中包含的关系特征能够表征多个地址中两个地址之间的关系信息;故本申请实施例能够根据更丰富的信息确定映射关系,因此,本申请实施例能够提高映射关系中地址解析结果的准确度。
方法实施例二
参照图6,示出了本申请一个实施例的地址处理方法的步骤流程图,具体可以包括如下步骤:
步骤601、获取数据对象对应的待处理地址;
步骤602、根据地址与地址解析结果之间的映射关系,确定该待处理地址对应的地址解析结果;
步骤603、根据地址解析结果,对该数据对象进行预设处理;
其中,该映射关系的确定过程具体包括:获取地址序列数据;该地址序列数据具体包括:多个地址、以及该多个地址中两个地址之间的关系数据;确定该地址序列数据对应的特征信息;该特征信息具体包括:一个地址对应的地址特征、以及该多个地址中两个地址之间的关系特征;根据该特征信息,确定地址与地址解析结果之间的映射关系。
本申请实施例可以将映射关系应用于数据对象的预设处理。其中,数据对象可以是物流对象、或摄像头图像、商品对象等。本申请实施例主要以物流对象为例进行说明,其他数据对象相互参照即可。
本申请实施例可以获取数据对象对应的待处理地址,根据地址与地址解析结果之间的映射关系,确定所述待处理地址对应的地址解析结果,根据地址解析结果,对所述数据对象进行预设处理。本申请实施例在提高映射关系中地址解析结果的准确度的情况下,能够根据更准确的地址解析结果,对所述数据对象进行预设处理,因此能够提高数据对象的处理效率、或者能够提高数据对象的处理成本。例如,在数据对象为物流对象的情况下,本申请实施例能够提高物流对象的处理效率、或者能够提高物流对象的处理成本。
参照图7,示出了本申请一个实施例的根据数据分析器确定地址解析结果的示意图。假设数据分析器的训练样本中包括:“Xx市xx区xx街道A小区1号楼”、“Xx市xx区xx街道A小区2号楼”等地址。由于基于训练样本对数据分析器的训练,使得数据分析器具备任意地址的解析能力;因此,在待处理地址为“Xx市xx区xx街道A小区6号楼”等训练样本中未出现过的地址的情况下,可以将待处理地址输入数据分析器,由数据分析器输出待处理地址对应的地址解析结果。
在具体实现中,本领域技术人员可以根据实际的应用场景,确定上述预设处理。例如,上述预设处理具体可以包括如下处理中的至少一种:
处理1、数据对象对应的路径规划;
处理2、多地址文本对应的动态划分;
处理3、生成数据对象对应的分拣信息;
处理4、确定数据对象对应的处理用户;
处理5、确定数据对象对应的地理编码;
处理6、地址解析;
处理7、确定数据对象对应的兴趣面;
处理8、确定数据对象所对应兴趣面的标签信息;
处理9、确定数据对象对应的识别结果;
处理10、确定数据对象对应的时效信息;
处理11、确定数据对象对应的预测数量;
处理12、对数据对象对应的收货地址进行验证。
对于处理1,在数据对象为物流对象的情况下,路径规划可用于规划物流对象从发货地址到收货地址的配送路径。配送路径可以包括:发货地址对应的起始节点、中间节点和收货地址对应的目标节点。中间节点可以包括:网点和分拣中心等。
参照图8,示出了本申请一个实施例的配送路径的示意图,其中,物流对象从发货地址到达网点A,途径第一分拣中心、第二分拣中心和第三分拣中心,到达网点B,再由网点B的快递员将物流对象配送至收货地址。其中,分拣中心的数量和分拣中心的具体标识、以及网点A和网点B的具体标识,可由规划规划确定。
本申请实施例的预设处理可由预设处理模型执行。预设处理模型可以是一种机器学习模型,其可以表征输入数据(多维度特征)和输出数据(预设处理结果)之间的映射关系。其中,本申请实施例的地址解析结果可以是多维度特征中的一种。
在实际应用中,可以利用本申请实施例的映射关系,分别确定发货地址对应的第一地址解析结果和收货地址对应的第二地址解析结果,然后将第一地址解析结果和第二地址解析结果作为预设处理模型的输入数据。可以理解,除了第一地址解析结果和第二地址解析结果之外,输入数据还可以包括:天气特征、运力特征等。
参照图9(a),示出了本申请一个实施例的预设处理流程的示意图,其中,可以将待处理地址输入数据分析器,数据分析器输出的地址解析结果可以作为第一维度特征,进入预设处理模型。假设预设处理模型的输入数据包括:m(m为正整数)个维度的特征,则预设处理模型的输入数据可以包括:第二维度特征……第m维度特征等。预设处理模型可以根据m个维度的特征进行处理,并输出预设处理结果。以路径规划为例,预设处理结果可以为配送路径。
参照图9(b),示出了本申请一个实施例的预设处理流程的示意图,其中,可以将待处理地址输入数据分析器,数据分析器输出的地址解析结果可以作为第一维度特征,进入预设处理模型。假设预设处理模型的输入数据包括:m(m为正整数)个维度的特征,则预设处理模型的输入数据可以包括:第二维度特征……第m维度特征等。预设处理模型可以根据m个维度的特征进行处理,并输出预设处理结果。
相对于图9(a),图9(b)可以将数据分析器输出的第一中间向量输入预设处理模型,由预设处理模型对数据分析器输出的第一中间向量与预设处理模型的第二中间向量进行融合,由此可以基于知识融合,提高预设处理的准确度。在实际应用中,第一中间向量可以是数据分析器的第一编码模块或第二编码模块输出的向量。
对于处理2,可以对第一区域中的多地址文本进行动态划分,以得到多地址文本对应的第二区域。其中,第二区域的等级可以小于第一区域的等级。例如,第一区域的等级为截到,第二区域的等级为社区或小区等。
对于处理3,物流分拣指的是在物流运输过程中,根据一定的规则对物流对象进行分类、打包或者拆分等集散处理。例如,在转运环节,将物流对象按照地址信息进行分类处理,使得目的地相同或者相近的物品被统一运输。又如,在配送环节,需要对物流对象进行分拣,使得收货地址相同或相近的物流对象被统一配送。物流分拣能够提高物流对象的处理效率。
分拣信息可以作为物流分拣的依据。物流技术领域中,分拣信息可被设置在物流面单上。
例如,物流面单的分拣信息区域包含的分拣信息可以包括:S个分段对应的分拣信息。
以S为4为例,第一个分段对应的分拣信息可用于标识收货地址对应的第一级中转站,如收货地址所在的城市信息;第二个分段对应的分拣信息用于标识收货地址对应的第二级中转站,第二个分段对应的分拣信息可以为第一配送节点信息,第一配送节点信息可以标识提供末端物流服务的物流网点;第三个分段对应的分拣信息可以为第一配送用户信息,用于标识提供末端物流服务的用户(也即快递员);第四个分段对应的分拣信息可以作为末端物流服务阶段的分拣依据。
在具体实现中,本申请实施例可以根据收货地址对应的地址解析结果,确定任一分段的分段信息。
例如,对地址解析结果进行切分处理,并根据切分处理结果,得到前3个分段对应的分拣信息。以地址解析结果“XX市XX区XX路XX号A小区C栋D单元XX室”为例,可以根据切分处理结果中的“XX市”,确定第一个分段对应的分拣信息;可以根据切分处理结果中的“XX区XX路XX号”,确定第二个分段对应的分拣信息,也即可以得到第一配送节点信息;以及,可以根据切分处理结果中的“A小区”,确定第三个分段对应的分拣信息。
第四个分段对应的分拣信息可以是目标地址码。目标地址码可以表征物流对象所对应目标地址信息的编码。由于该目标地址信息具体包括:小区信息和楼栋信息、或者村信息和楼栋信息,故该目标地址信息相对于收货地址,缩短了字符串的长度。并且,目标地址码作为目标地址信息的编码,进一步缩短了字符串的长度。因此,本申请实施例的目标地址码可以经由简短的字符编码,表达细化到小区维度和楼栋维度的关键配送地址信息。以地址解析结果“XX省XX市XX区XX路XX号AB小区C栋D单元XX室”为例,其对应的目标地址信息可以为“AB小区C栋”,对该目标地址信息进行编码可以得到:目标地址码“AB-1”。该目标地址码对应的字符串长度可以远远小于收货地址对应的字符串长度,因此能够提高分拣过程中的信息获取效率和信息获取准确率。
对于处理4,可以确定数据对象对应的处理用户。处理用户可以包括:提供揽收服务的用户、或者提供末端物流服务的用户等。其中,可以根据发货地址对应的地址解析结果,确定提供揽收服务的用户。或者,可以根据收货地址对应的地址解析结果,确定提供末端物流服务的用户。
对于处理5,确定数据对象对应的地理编码。地理编码可以有众多的应用场景。例如,用于根据待处理地址进行导航,或者用于管理人口,或者,用于管理机构内的设备等。
对于处理6,地址解析,可用于对地址解析结果进行分割。例如,可以将“XX市XX区XX路XX号A小区C栋D单元XX室”分割为:“XX市”、“XX区”、“XX路XX号”、“A小区”、“C栋”、“D单元”、“XX室”等。
对于处理7,AOI(兴趣面,Area of Interest),可以指地图数据中的区域状的地理实体。数据对象对应的AOI数据可用于实现识别城市用地功能、确定公交线路的可达性、以及交通网络分析等功能。
对于处理8,可以确定数据对象所对应兴趣面的标签信息。具体而言,可以兴趣面为单位,确定用户的静态属性、动态属性等用户标签信息、以及小区标签信息。动态属性可以包括:购买力属性、商品类别偏好属性等。小区标签信息可以包括:小区类型、或小区进入属性、或小区内的作业时长等。小区进入属性可以包括:是否需要门禁、外来车辆的进入属性等。小区内的作业时长可以包括:小区内的揽收作业时长、或小区内的配送作业时长等。
对于处理9,数据对象可以是包含地址信息的图像等,可以将图像输入输入分析器,以得到图像对应的识别结果。例如,图像可以是物流面单的图像,在实际应用中,输入分析器可以针对物流面单的图像,输出对应的地址解析结果,作为识别结果。相对于传统的图像识别,本申请实施例的地址解析结果可以对图像包含的地址信息进行补全和纠正,以得到地址的标准描述。
对于处理10,随着互联网技术的发展,越来越多的用户会选择网上购物,快递、物流行业随之得到迅速发展,商家通过快递、物流将商品发往全国各地,为了使用户了解自己的商品何时能抵达自己的手中,在用户提交购买订单后,会有一个商品的预计到达时效,商品的预计到达时效可以是数据对象对应的时效信息的一种示例。
本申请实施例可以利用时效预测模型,确定数据对象对应的时效信息。时效预测模型可以是前述的预设处理模型的一种示例,时效预测模型的输入数据可以包括:发货地址对应的第一地址解析结果、收货地址对应的第二地址解析结果和天气特征等。
对于处理11,确定数据对象对应的预测数量。以数据对象为物流对象为例,预测数量可以是待处理地址所在区域在预设时间内的订单量。
不同的区域可以具有不同的购买力,因此可能产生不同的订单量。如果不根据订单量的区域性预测来进行物流处理,可能会造成物流处理效率低下。例如,在订单较少的区域布置了更多的物流资源,而在订单较多的区域布置的物流资源不够等。此外,准确的订单量预测也会对电子商务所使用的计算机资源造成有利影响。例如,在预测订单量有较大增长的区域,可以增加该区域接入订单服务器的带宽或为该区域布置服务器等扩容方式,以避免大量订单对网络的冲击;而对于预测订单量有较大下降的区域,可以减少服务器的带宽以节约成本。
对于处理12,可以对数据对象对应的收货地址进行验证,以判断物流对象对应的收货地址与数据对象对应的用户是否匹配。在物流对象对应的收货地址与数据对象对应的用户相匹配的情况下,可以实现物流对象的送货上门服务。
可以理解,上述处理1至处理12可以作为预设处理的示例,而不理解为本申请实施例对于预设处理的限制。本领域技术人员可以根据实际应用需求,确定所需的预设处理。例如,预设处理还可以包括:在物流对象的处理环节进行人力调度,在物流对象的处理环节进行车辆调度等。在本申请实施例的地址解析结果实现了地址的准确理解的基础上,本申请实施例在揽收环节的人力调度、分拣信息的准确度、车辆调度的效率等方面均可以提升对应的处理效率;因此,本申请实施例能够提升物流处理效率。其中,人力调度或车辆调度可以根据订单之间的相关度实现,相关度高的订单可以被分配给相同的人力。其中,订单之间的相关度可以包括:订单的收货地址之间的相关度,订单的收货地址之间的相关度可以基于收货地址对应的地址解析结果实现。
并且,本申请实施例可以为地理类多模态提供基础能力,可以支撑更多模态的应用,例如,本申请实施例可以针对包括地址信息的图像得到地址解析结果。这样,本申请实施例可以实现摄像头拍摄的图像与地理空间的对应。
此外,本申请实施例还可以将地址解析结果应用于订单分配。订单分配可以根据订单之间的相关度实现,相关度高的订单可以被分配给相同的人力。其中,订单之间的相关度可以包括:订单的收货地址之间的相关度,订单的收货地址之间的相关度可以基于收货地址对应的地址解析结果实现。
再者,本申请实施例对数据对象对应的收货地址进行验证,可以得到验证不通过的异常数据对象,可以降低非上门数据对象的成本。
综上,本申请实施例可以获取数据对象对应的待处理地址,根据地址与地址解析结果之间的映射关系,确定所述待处理地址对应的地址解析结果,根据地址解析结果,对所述数据对象进行预设处理。本申请实施例在提高映射关系中地址解析结果的准确度的情况下,能够根据更准确的地址解析结果,对所述数据对象进行预设处理,因此能够提高数据对象的处理效率、或者能够提高数据对象的处理成本。例如,在数据对象为物流对象的情况下,本申请实施例能够提高物流对象的处理效率、或者能够提高物流对象的处理成本。
需要说明的是,对于方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请实施例并不受所描述的动作顺序的限制,因为依据本申请实施例,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作并不一定是本申请实施例所必须的。
装置实施例
参照图10,示出了本申请一个实施例的地址处理装置的结构示意图,其具体可以包括:序列数据获取模块1001、特征确定模块1002和映射确定模块1003。
其中,序列数据获取模块1001,用于获取地址序列数据;所述地址序列数据包括:多个地址、以及所述多个地址中两个地址之间的关系数据;
特征确定模块1002,用于确定所述地址序列数据对应的特征信息;所述特征信息包括:一个地址对应的地址特征、以及所述多个地址中两个地址之间的关系特征;
映射确定模块1003,用于根据所述特征信息,确定地址与地址解析结果之间的映射关系。
可选地,所述关系特征具体包括:
所述多个地址中两个地址之间的距离特征;和/或
所述多个地址中两个地址之间的路径特征。
可选地,所述地址特征具体包括:
一个地址对应的文本特征;和/或
一个地址在所述多个地址中对应的位置特征;和/或
一个地址在所述多个地址中对应的连接数量特征。
可选地,经由数据分析器表征地址与地址解析结果之间的映射关系;
所述根据所述特征信息,确定地址与地址解析结果之间的映射关系,具体包括:
根据所述特征信息,对数据分析器进行训练,以使训练完成的数据分析器表征地址与地址解析结果之间的映射关系。
可选地,所述数据分析器具体包括:第一处理模块;
所述第一处理模块,用于对所述多个地址分别对应的地址特征进行线性变换,以得到对应的线性变换结果;根据所述线性变换结果、以及所述关系特征,确定所述多个地址中两个地址之间的第一注意力信息;根据所述第一注意力信息,确定所述多个地址分别对应的地址解析结果。
可选地,所述数据分析器具体包括:第一处理模块和第二处理模块;
所述第一处理模块,用于对所述多个地址分别对应的地址特征进行线性变换,以得到对应的线性变换结果;根据所述线性变换结果、以及所述关系特征,确定所述多个地址中两个地址之间的第一注意力信息;根据所述第一注意力信息,确定所述多个地址分别对应的特征表示;
所述第二处理模块,用于根据所述多个地址分别对应的特征表示和文本信息,对所述多个地址分别进行编码和解码,以得到所述多个地址分别对应的地址解析结果。
可选地,所述地址解析结果具体包括如下结果中的至少一种:
地址向量;
地址的标准表述;以及
地址的分级区域信息。
可选地,所述序列数据获取模块1001具体包括:
第一序列数据获取模块,用于根据物流对象对应的处理顺序,获取地址序列数据;其中,物流对象对应的地址与所述地址序列数据中的地址相对应;所述物流对象对应的配送顺序与所述多个地址中两个地址之间的关系数据相对应;和/或
第二序列数据获取模块,用于根据地址数据库中地址之间的空间关系,获取地址序列数据。
参照图11,示出了本申请一个实施例的地址处理装置的结构示意图,其具体可以包括:待处理地址获取模块1101、结果确定模块1102和预设处理模块1103。
其中,待处理地址获取模块1101,用于获取数据对象对应的待处理地址;
结果确定模块1102,用于根据地址与地址解析结果之间的映射关系,确定所述待处理地址对应的地址解析结果;
预设处理模块1103,用于根据地址解析结果,对所述数据对象进行预设处理;
其中,所述映射关系的确定过程具体包括:获取地址序列数据;所述地址序列数据包括:多个地址、以及所述多个地址中两个地址之间的关系数据;确定所述地址序列数据对应的特征信息;所述特征信息包括:一个地址对应的地址特征、以及所述多个地址中两个地址之间的关系特征;根据所述特征信息,确定地址与地址解析结果之间的映射关系。
可选地,所述预设处理可以包括如下处理中的至少一种:
数据对象对应的路径规划;
多地址文本对应的动态划分;
生成数据对象对应的分拣信息;
确定数据对象对应的处理用户;
确定数据对象对应的地理编码;
地址解析;
确定数据对象对应的兴趣面;
确定数据对象所对应兴趣面的标签信息;
确定数据对象对应的识别结果;
确定数据对象对应的时效信息;
确定数据对象对应的预测数量;以及
对数据对象对应的收货地址进行验证。
综上,本申请实施例的地址处理装置,可以获取数据对象对应的待处理地址,根据地址与地址解析结果之间的映射关系,确定所述待处理地址对应的地址解析结果,根据地址解析结果,对所述数据对象进行预设处理。本申请实施例在提高映射关系中地址解析结果的准确度的情况下,能够根据更准确的地址解析结果,对所述数据对象进行预设处理,因此能够提高数据对象的处理效率、或者能够提高数据对象的处理成本。例如,在数据对象为物流对象的情况下,本申请实施例能够提高物流对象的处理效率、或者能够提高物流对象的处理成本。
本申请实施例还提供了一种非易失性可读存储介质,该存储介质中存储有一个或多个模块(programs),该一个或多个模块被应用在设备时,可以使得该设备执行本申请实施例中各方法步骤的指令(instructions)。
本申请实施例提供了一个或多个机器可读介质,其上存储有指令,当由一个或多个处理器执行时,使得电子设备执行如上述实施例中一个或多个所述的方法。本申请实施例中,所述电子设备包括服务器、终端设备等设备。
本公开的实施例可被实现为使用任意适当的硬件,固件,软件,或及其任意组合进行想要的配置的装置,该装置可包括服务器(集群)、终端等电子设备。图12示意性地示出了可被用于实现本申请中所述的各个实施例的示例性装置1700。
对于一个实施例,图12示出了示例性装置1700,该装置具有一个或多个处理器1702、被耦合到(一个或多个)处理器1702中的至少一个的控制模块(芯片组)1704、被耦合到控制模块1704的存储器1706、被耦合到控制模块1704的非易失性存储器(NVM)/存储设备1708、被耦合到控制模块1704的一个或多个输入/输出设备1680,以及被耦合到控制模块1704的网络接口1682。
处理器1702可包括一个或多个单核或多核处理器,处理器1702可包括通用处理器或专用处理器(例如地址处理器、应用处理器、基频处理器等)的任意组合。在一些实施例中,装置1700能够作为本申请实施例中所述服务端、终端等设备。
在一些实施例中,装置1700可包括具有指令1684的一个或多个计算机可读介质(例如,存储器1706或NVM/存储设备1708)以及与该一个或多个计算机可读介质相合并被配置为执行指令1684以实现模块从而执行本公开中所述的动作的一个或多个处理器1702。
对于一个实施例,控制模块1704可包括任意适当的接口控制器,以向(一个或多个)处理器1702中的至少一个和/或与控制模块1704通信的任意适当的设备或组件提供任意适当的接口。
控制模块1704可包括存储器控制器模块,以向存储器1706提供接口。存储器控制器模块可以是硬件模块、软件模块和/或固件模块。
存储器1706可被用于例如为装置1700加载和存储数据和/或指令1684。对于一个实施例,存储器1706可包括任意适当的易失性存储器,例如,适当的DRAM。在一些实施例中,存储器1706可包括双倍数据速率类型四同步动态随机存取存储器(DDR4SDRAM)。
对于一个实施例,控制模块1704可包括一个或多个输入/输出控制器,以向NVM/存储设备1708及(一个或多个)输入/输出设备1680提供接口。
例如,NVM/存储设备1708可被用于存储数据和/或指令1684。NVM/存储设备1708可包括任意适当的非易失性存储器(例如,闪存)和/或可包括任意适当的(一个或多个)非易失性存储设备(例如,一个或多个硬盘驱动器(HDD)、一个或多个光盘(CD)驱动器和/或一个或多个数字通用光盘(DVD)驱动器)。
NVM/存储设备1708可包括作为装置1700被安装在其上的设备的一部分的存储资源,或者其可被该设备访问可不必作为该设备的一部分。例如,NVM/存储设备1708可通过网络经由(一个或多个)输入/输出设备1680进行访问。
(一个或多个)输入/输出设备1680可为装置1700提供接口以与任意其他适当的设备通信,输入/输出设备1680可以包括通信组件、音频组件、传感器组件等。网络接口1682可为装置1700提供接口以通过一个或多个网络通信,装置1700可根据一个或多个无线网络标准和/或协议中的任意标准和/或协议来与无线网络的一个或多个组件进行无线通信,例如接入基于通信标准的无线网络,如WiFi、2G、3G、4G、5G等,或它们的组合进行无线通信。
对于一个实施例,(一个或多个)处理器1702中的至少一个可与控制模块1704的一个或多个控制器(例如,存储器控制器模块)的逻辑封装在一起。对于一个实施例,(一个或多个)处理器1702中的至少一个可与控制模块1704的一个或多个控制器的逻辑封装在一起以形成系统级封装(SiP)。对于一个实施例,(一个或多个)处理器1702中的至少一个可与控制模块1704的一个或多个控制器的逻辑集成在同一模具上。对于一个实施例,(一个或多个)处理器1702中的至少一个可与控制模块1704的一个或多个控制器的逻辑集成在同一模具上以形成片上系统(SoC)。
在各个实施例中,装置1700可以但不限于是:服务器、台式计算设备或移动计算设备(例如,膝上型计算设备、手持计算设备、平板电脑、上网本等)等终端设备。在各个实施例中,装置1700可具有更多或更少的组件和/或不同的架构。例如,在一些实施例中,装置1700包括一个或多个摄像机、键盘、液晶显示器(LCD)屏幕(包括触屏显示器)、非易失性存储器端口、多个天线、图形芯片、专用集成电路(ASIC)和扬声器。
其中,装置1700中可采用主控芯片作为处理器或控制模块,传感器数据、位置信息等存储到存储器或NVM/存储设备中,传感器组可作为输入/输出设备,通信接口可包括网络接口。
本申请实施例还提供了一种电子设备,包括:处理器;和存储器,其上存储有可执行代码,当所述可执行代码被执行时,使得所述处理器执行如本申请实施例中一个或多个所述的方法。
本申请实施例还提供了一个或多个机器可读介质,其上存储有可执行代码,当所述可执行代码被执行时,使得处理器执行如本申请实施例中一个或多个所述的方法。
对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
本申请实施例是参照根据本申请实施例的方法、终端设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程地址处理终端设备的处理器以产生一个机器,使得通过计算机或其他可编程地址处理终端设备的处理器执行的指令产生用于实现在流程图的一个流程或多个流程和/或方框图的一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程地址处理终端设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图的一个流程或多个流程和/或方框图的一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程地址处理终端设备上,使得在计算机或其他可编程终端设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程终端设备上执行的指令提供用于实现在流程图的一个流程或多个流程和/或方框图的一个方框或多个方框中指定的功能的步骤。
尽管已描述了本申请实施例的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本申请实施例范围的所有变更和修改。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者终端设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者终端设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者终端设备中还存在另外的相同要素。
以上对本申请所提供的一种地址处理方法、一种地址处理装置、一种电子设备和一种存储介质,进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。

Claims (14)

1.一种地址处理方法,其特征在于,所述方法包括:
获取地址序列数据;所述地址序列数据包括:多个地址、以及所述多个地址中两个地址之间的关系数据;
确定所述地址序列数据对应的特征信息;所述特征信息包括:一个地址对应的地址特征、以及所述多个地址中两个地址之间的关系特征;
根据所述特征信息,确定地址与地址解析结果之间的映射关系。
2.根据权利要求1所述的方法,其特征在于,所述关系特征包括:
所述多个地址中两个地址之间的距离特征;和/或
所述多个地址中两个地址之间的路径特征。
3.根据权利要求1所述的方法,其特征在于,所述地址特征包括:
一个地址对应的文本特征;和/或
一个地址在所述多个地址中对应的位置特征;和/或
一个地址在所述多个地址中对应的连接数量特征。
4.根据权利要求1至3中任一所述的方法,其特征在于,经由数据分析器表征地址与地址解析结果之间的映射关系;
所述根据所述特征信息,确定地址与地址解析结果之间的映射关系,包括:
根据所述特征信息,对数据分析器进行训练,以使训练完成的数据分析器表征地址与地址解析结果之间的映射关系。
5.根据权利要求4所述的方法,其特征在于,所述数据分析器包括:第一处理模块;
所述第一处理模块,用于对所述多个地址分别对应的地址特征进行线性变换,以得到对应的线性变换结果;根据所述线性变换结果、以及所述关系特征,确定所述多个地址中两个地址之间的第一注意力信息;根据所述第一注意力信息,确定所述多个地址分别对应的地址解析结果。
6.根据权利要求4所述的方法,其特征在于,所述数据分析器包括:第一处理模块和第二处理模块;
所述第一处理模块,用于对所述多个地址分别对应的地址特征进行线性变换,以得到对应的线性变换结果;根据所述线性变换结果、以及所述关系特征,确定所述多个地址中两个地址之间的第一注意力信息;根据所述第一注意力信息,确定所述多个地址分别对应的特征表示;
所述第二处理模块,用于根据所述多个地址分别对应的特征表示和文本信息,对所述多个地址分别进行编码和解码,以得到所述多个地址分别对应的地址解析结果。
7.根据权利要求1至3中任一所述的方法,其特征在于,所述地址解析结果包括如下结果中的至少一种:
地址向量;
地址的标准表述;以及
地址的分级区域信息。
8.根据权利要求1至3中任一所述的方法,其特征在于,所述获取地址序列数据,包括:
根据物流对象对应的处理顺序,获取地址序列数据;其中,物流对象对应的地址与所述地址序列数据中的地址相对应;所述物流对象对应的配送顺序与所述多个地址中两个地址之间的关系数据相对应;和/或
根据地址数据库中地址之间的空间关系,获取地址序列数据。
9.一种地址处理方法,其特征在于,所述方法包括:
获取数据对象对应的待处理地址;
根据地址与地址解析结果之间的映射关系,确定所述待处理地址对应的地址解析结果;
根据地址解析结果,对所述数据对象进行预设处理;
其中,所述映射关系的确定过程包括:获取地址序列数据;所述地址序列数据包括:多个地址、以及所述多个地址中两个地址之间的关系数据;确定所述地址序列数据对应的特征信息;所述特征信息包括:一个地址对应的地址特征、以及所述多个地址中两个地址之间的关系特征;根据所述特征信息,确定地址与地址解析结果之间的映射关系。
10.根据权利要求9所述的方法,其特征在于,所述预设处理包括如下处理中的至少一种:
数据对象对应的路径规划;
多地址文本对应的动态划分;
生成数据对象对应的分拣信息;
确定数据对象对应的处理用户;
确定数据对象对应的地理编码;
地址解析;
确定数据对象对应的兴趣面;
确定数据对象所对应兴趣面的标签信息;
确定数据对象对应的识别结果;
确定数据对象对应的时效信息;
确定数据对象对应的预测数量;以及
对数据对象对应的收货地址进行验证。
11.一种地址处理装置,其特征在于,所述装置包括:
序列数据获取模块,用于获取地址序列数据;所述地址序列数据包括:多个地址、以及所述多个地址中两个地址之间的关系数据;
特征确定模块,用于确定所述地址序列数据对应的特征信息;所述特征信息包括:一个地址对应的地址特征、以及所述多个地址中两个地址之间的关系特征;
映射确定模块,用于根据所述特征信息,确定地址与地址解析结果之间的映射关系。
12.一种地址处理装置,其特征在于,所述装置包括:
待处理地址获取模块,用于获取数据对象对应的待处理地址;
结果确定模块,用于根据地址与地址解析结果之间的映射关系,确定所述待处理地址对应的地址解析结果;
预设处理模块,用于根据地址解析结果,对所述数据对象进行预设处理;
其中,所述映射关系的确定过程包括:获取地址序列数据;所述地址序列数据包括:多个地址、以及所述多个地址中两个地址之间的关系数据;确定所述地址序列数据对应的特征信息;所述特征信息包括:一个地址对应的地址特征、以及所述多个地址中两个地址之间的关系特征;根据所述特征信息,确定地址与地址解析结果之间的映射关系。
13.一种电子设备,其特征在于,包括:处理器;和
存储器,其上存储有可执行代码,当所述可执行代码被执行时,使得所述处理器执行如权利要求1-10中任一项所述的方法。
14.一个或多个机器可读介质,其上存储有可执行代码,当所述可执行代码被执行时,使得处理器执行如权利要求1-10中任一项所述的方法。
CN202310702410.XA 2023-06-13 2023-06-13 地址处理方法、装置、设备和介质 Pending CN117077654A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310702410.XA CN117077654A (zh) 2023-06-13 2023-06-13 地址处理方法、装置、设备和介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310702410.XA CN117077654A (zh) 2023-06-13 2023-06-13 地址处理方法、装置、设备和介质

Publications (1)

Publication Number Publication Date
CN117077654A true CN117077654A (zh) 2023-11-17

Family

ID=88708629

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310702410.XA Pending CN117077654A (zh) 2023-06-13 2023-06-13 地址处理方法、装置、设备和介质

Country Status (1)

Country Link
CN (1) CN117077654A (zh)

Similar Documents

Publication Publication Date Title
CN106296059B (zh) 派送网点确定方法及设备
CN109255565B (zh) 地址的归属识别和物流任务的分发方法及其装置
CN109255564B (zh) 一种取件点地址推荐方法及装置
CN110503528B (zh) 一种线路推荐方法、装置、设备和存储介质
CN116562740B (zh) 一种基于改进型深度学习算法模型的外贸物流平台
CN110688536A (zh) 一种标签预测方法、装置、设备和存储介质
CN113157927A (zh) 文本分类方法、装置、电子设备及可读存储介质
CN111815432A (zh) 金融服务风险预测方法及装置
CN111967808B (zh) 确定物流对象收货方式的方法、装置、电子设备及存储介质
Wang et al. Data imputation for detected traffic volume of freeway using regression of multilayer perceptron
CN117077654A (zh) 地址处理方法、装置、设备和介质
CN111475736A (zh) 社区挖掘的方法、装置和服务器
CN116629735A (zh) 物流配送方法、物流配送装置和电子设备
CN107391728B (zh) 数据挖掘方法以及数据挖掘装置
CN112785234A (zh) 货物推荐方法、装置、设备及存储介质
CN109064091B (zh) 资源确定、资源处理方法及装置
CN111325401B (zh) 一种路径规划模型的训练方法、装置及计算机系统
CN112417260B (zh) 本地化推荐方法、装置及存储介质
CN114549053A (zh) 数据分析方法、装置、计算机设备及存储介质
CN113590781A (zh) 末端快递编码预测方法、系统、电子设备及可读存储介质
CN113837216A (zh) 数据分类方法、训练方法、装置、介质及电子设备
CN109614506A (zh) 一种基于rocksdb排重数据导入图库的方法、装置及存储介质
CN113052513B (zh) 构建地址分类模型的方法、地址分类方法及相关设备
CN116955836B (zh) 推荐方法、装置、设备、计算机可读存储介质及程序产品
US11429789B2 (en) Natural language processing and candidate response identification

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination