CN113837699A - 一种基于深度学习的三段码解析处理方法及装置 - Google Patents
一种基于深度学习的三段码解析处理方法及装置 Download PDFInfo
- Publication number
- CN113837699A CN113837699A CN202111150087.7A CN202111150087A CN113837699A CN 113837699 A CN113837699 A CN 113837699A CN 202111150087 A CN202111150087 A CN 202111150087A CN 113837699 A CN113837699 A CN 113837699A
- Authority
- CN
- China
- Prior art keywords
- space
- address
- deep learning
- time
- training
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/08—Logistics, e.g. warehousing, loading or distribution; Inventory or stock management
- G06Q10/083—Shipping
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2415—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/047—Probabilistic or stochastic networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Business, Economics & Management (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Economics (AREA)
- Probability & Statistics with Applications (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Development Economics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Entrepreneurship & Innovation (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
本发明公开了一种基于深度学习的三段码解析处理方法及装置,其中该方法包括:获取待解析的时空地址;所述时空地址包括时间信息和地址信息;将所述待解析的时空地址输入至深度学习解析模型,得到所述待解析的时空地址对应的复合编码信息;所述复合编码信息包括二段码和三段码;所述深度学习解析模型通过包括有多个历史的所述时空地址和对应的复合编码信息的训练集训练得到;根据所述待解析的时空地址对应的复合编码信息,确定所述待解析的时空地址对应的三段码信息。可见,本发明能够减小最终训练得到的模型以及后续的解析服务受到网点编码变动的影响,时效性更强,且有利于减少训练成本,提高解析效率。
Description
技术领域
本发明涉及智能物流技术领域,尤其涉及一种基于深度学习的三段码解析处理方法及装置。
背景技术
传统物流运输中,运输的种类和风险、物流过程中的运输环节和动作方式以及物流企业的服务,都影响到物流运输的成本和质量。得益于人工智能技术尤其深度学习技术的快速发展,智能物流已经成为物流技术领域备受关注且发展前景广泛的研究与应用方向。作为智能物流的核心组成部分,“三段码”由三段编码构成:一段码(转运中心)+二段码(独立网点)+三段码(派件员)。三段码是通过对转运中心、独立网点和派件员进行编码,从而实现末端网点分拣从传统的依赖地址分拣转换成简单、高效的数字分拣,进而提升分拣效率。
现有技术中已经开始利用人工智能技术去自动对地址进行解析以生成三段码信息,但现有技术较少考虑到因网点编码频繁变动导致解析模型的时效性较差的问题,且现有技术常常使用分别训练的模型去进行二段码和三段码的解析服务,其训练成本高,且解析效率较差。
发明内容
本发明所要解决的技术问题在于,提供一种基于深度学习的三段码解析处理方法及装置,能够减小最终训练得到的模型以及后续的解析服务受到网点编码变动的影响,时效性更强,且通过单一模型通同时进行二段码和三段码的训练和解析服务有利于减少训练成本,提高解析效率。
为了解决上述技术问题,本发明第一方面公开了一种基于深度学习的三段码解析处理方法,所述方法包括:
获取待解析的时空地址;所述时空地址包括时间信息和地址信息;
将所述待解析的时空地址输入至深度学习解析模型,得到所述待解析的时空地址对应的复合编码信息;所述复合编码信息包括二段码和三段码;所述深度学习解析模型通过包括有多个历史的所述时空地址和对应的复合编码信息的训练集训练得到;
根据所述待解析的时空地址对应的复合编码信息,确定所述待解析的时空地址对应的三段码信息。
作为一种可选的实施方式,在本发明第一方面中,所述时间信息为所述地址信息对应的物流任务对应的签收时间。
作为一种可选的实施方式,在本发明第一方面中,所述根据所述待解析的时空地址对应的复合编码信息,确定所述待解析的时空地址对应的三段码信息,包括:
根据所述待解析的时空地址对应的复合编码信息中的二段码,以及预设的行政区划关系数据,推断出所述待解析的时空地址对应的一段码;
将所述待解析的时空地址对应的一段码、二段码和三段码进行组合得到所述待解析的时空地址对应的三段码信息。
作为一种可选的实施方式,在本发明第一方面中,所述深度学习解析模型包括BERT网络编码层、全连接层和Softmax分类层。
作为一种可选的实施方式,在本发明第一方面中,在所述获取待解析的时空地址之前,所述方法还包括:
确定多个用于训练的所述时空地址和对应的所述复合编码信息;
将所述多个用于训练的所述时空地址和对应的所述复合编码信息输入至深度学习解析训练模型进行训练直到收敛,得到所述深度学习解析模型;所述深度学习解析训练模型包括所述BERT网络编码层、所述全连接层和所述Softmax分类层和模型优化模块;所述模型优化模块用于对所述BERT网络编码层进行优化。
作为一种可选的实施方式,在本发明第一方面中,所述确定多个用于训练的所述时空地址和对应的所述复合编码信息,包括:
获取多个历史运单地址和对应的运单签收时间;
对每一历史运单地址和对应的运单签收时间进行拼接得到多个用于训练的所述时空地址;
对于每一所述用于训练的所述时空地址,获取该时空地址对应的签收网点编码和三段码;
判断该时空地址对应的三段码是否为预设的无效值;
若判断结果为是,对该时空地址对应的三段码根据轮盘算法进行重新赋值得到新的三段码,将该时空地址对应的签收网点编码和新的三段码组成该时空地址对应的所述复合编码信息;
若判断结果为否,将该时空地址对应的签收网点编码和三段码组成该时空地址对应的所述复合编码信息。
作为一种可选的实施方式,在本发明第一方面中,所述将所述多个用于训练的所述时空地址和对应的所述复合编码信息输入至深度学习解析训练模型进行训练直到收敛,得到所述深度学习解析模型,包括:
将所述用于训练的所述时空地址作为模型输入,输入至所述BERT网络编码层以得到数据向量,再将所述数据向量输入至所述全连接层和所述Softmax分类层,以得到所述Softmax分类层输出的分类结果;
将所述分类结果与所述用于训练的所述时空地址对应的所述复合编码信息进行分类损失计算,得到分类损失结果;
将所述分类损失结果输入至所述模型优化模块,以使得所述模型优化模块根据所述分类损失结果对所述BERT网络编码层进行优化直到收敛,将优化后的所述BERT网络编码层、所述全连接层和所述Softmax分类层确定为所述深度学习解析模型。
作为一种可选的实施方式,在本发明第一方面中,所述深度学习解析模型基于Triton Inference服务架构被部署在服务器上。
本发明第二方面公开了一种基于深度学习的三段码解析处理装置,其包括:
获取模块,用于获取待解析的时空地址;所述时空地址包括时间信息和地址信息;
解析模块,用于将所述待解析的时空地址输入至深度学习解析模型,得到所述待解析的时空地址对应的复合编码信息;所述复合编码信息包括二段码和三段码;所述深度学习解析模型通过包括有多个历史的所述时空地址和对应的复合编码信息的训练集训练得到;
确定模块,用于根据所述待解析的时空地址对应的复合编码信息,确定所述待解析的时空地址对应的三段码信息。
作为一种可选的实施方式,在本发明第二方面中,所述时间信息为所述地址信息对应的物流任务对应的签收时间。
作为一种可选的实施方式,在本发明第二方面中,所述确定模块根据所述待解析的时空地址对应的复合编码信息,确定所述待解析的时空地址对应的三段码信息的具体方式,包括:
根据所述待解析的时空地址对应的复合编码信息中的二段码,以及预设的行政区划关系数据,推断出所述待解析的时空地址对应的一段码;
将所述待解析的时空地址对应的一段码、二段码和三段码进行组合得到所述待解析的时空地址对应的三段码信息。
作为一种可选的实施方式,在本发明第二方面中,所述深度学习解析模型包括BERT网络编码层、全连接层和Softmax分类层。
作为一种可选的实施方式,在本发明第二方面中,所述装置还包括:
训练确定模块,用于确定多个用于训练的所述时空地址和对应的所述复合编码信息;
模型训练模块,用于将所述多个用于训练的所述时空地址和对应的所述复合编码信息输入至深度学习解析训练模型进行训练直到收敛,得到所述深度学习解析模型;所述深度学习解析训练模型包括所述BERT网络编码层、所述全连接层和所述Softmax分类层和模型优化模块;所述模型优化模块用于对所述BERT网络编码层进行优化。
作为一种可选的实施方式,在本发明第二方面中,所述训练确定模块确定多个用于训练的所述时空地址和对应的所述复合编码信息的具体方式,包括:
获取多个历史运单地址和对应的运单签收时间;
对每一历史运单地址和对应的运单签收时间进行拼接得到多个用于训练的所述时空地址;
对于每一所述用于训练的所述时空地址,获取该时空地址对应的签收网点编码和三段码;
判断该时空地址对应的三段码是否为预设的无效值;
若判断结果为是,对该时空地址对应的三段码根据轮盘算法进行重新赋值得到新的三段码,将该时空地址对应的签收网点编码和新的三段码组成该时空地址对应的所述复合编码信息;
若判断结果为否,将该时空地址对应的签收网点编码和三段码组成该时空地址对应的所述复合编码信息。
作为一种可选的实施方式,在本发明第二方面中,所述模型训练模块将所述多个用于训练的所述时空地址和对应的所述复合编码信息输入至深度学习解析训练模型进行训练直到收敛,得到所述深度学习解析模型的具体方式,包括:
将所述用于训练的所述时空地址作为模型输入,输入至所述BERT网络编码层以得到数据向量,再将所述数据向量输入至所述全连接层和所述Softmax分类层,以得到所述Softmax分类层输出的分类结果;
将所述分类结果与所述用于训练的所述时空地址对应的所述复合编码信息进行分类损失计算,得到分类损失结果;
将所述分类损失结果输入至所述模型优化模块,以使得所述模型优化模块根据所述分类损失结果对所述BERT网络编码层进行优化直到收敛,将优化后的所述BERT网络编码层、所述全连接层和所述Softmax分类层确定为所述深度学习解析模型。
作为一种可选的实施方式,在本发明第二方面中,所述深度学习解析模型基于Triton Inference服务架构被部署在服务器上。
本发明第三方面公开了另一种基于深度学习的三段码解析处理装置,所述装置包括:
存储有可执行程序代码的存储器;
与所述存储器耦合的处理器;
所述处理器调用所述存储器中存储的所述可执行程序代码,执行本发明实施例第一方面公开的基于深度学习的三段码解析处理方法中的部分或全部步骤。
与现有技术相比,本发明实施例具有以下有益效果:
本发明实施例中,获取待解析的时空地址;所述时空地址包括时间信息和地址信息;将所述待解析的时空地址输入至深度学习解析模型,得到所述待解析的时空地址对应的复合编码信息;所述复合编码信息包括二段码和三段码;所述深度学习解析模型通过包括有多个历史的所述时空地址和对应的复合编码信息的训练集训练得到;根据所述待解析的时空地址对应的复合编码信息,确定所述待解析的时空地址对应的三段码信息。可见,本发明通过在待解析的地址以及模型训练数据中引入时间信息,从而能够减小最终训练得到的模型以及后续的解析服务受到网点编码变动的影响,使得模型的时效性更强,且通过单一模型通同时进行二段码和三段码的训练和解析服务,有利于减少训练成本,提高解析效率。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例公开的一种基于深度学习的三段码解析处理方法的流程示意图;
图2是本发明实施例公开的一种基于深度学习的三段码解析处理装置的结构示意图;
图3是本发明实施例公开的另一种基于深度学习的三段码解析处理装置的结构示意图;
图4是是本发明实施例公开的一种基于深度学习的智能三段码解析系统的数据处理步骤示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别不同对象,而不是用于描述特定顺序。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、装置、产品或端没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或端固有的其他步骤或单元。
在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本发明的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
本发明公开了一种基于深度学习的三段码解析处理方法及装置,通过在待解析的地址以及模型训练数据中引入时间信息,从而能够减小最终训练得到的模型以及后续的解析服务受到网点编码变动的影响,使得模型的时效性更强,且通过单一模型通同时进行二段码和三段码的训练和解析服务,有利于减少训练成本,提高解析效率。以下分别进行详细说明。
实施例一
请参阅图1,图1是本发明实施例公开的一种基于深度学习的三段码解析处理方法的流程示意图。其中,图1所描述的方法可以应用于相应的解析处理终端、解析处理设备或解析处理服务器中,且该服务器可以是本地服务器,也可以是云服务器。如图1所示,该基于深度学习的三段码解析处理方法可以包括以下操作:
101、获取待解析的时空地址。
本发明实施例中,时空地址包括时间信息和地址信息。可选的,时间信息为地址信息对应的物流任务对应的签收时间。可选的,时间信息也可以为地址信息对应的物流任务对应的发货时间或运输时间段等时间信息。
102、将待解析的时空地址输入至深度学习解析模型,得到待解析的时空地址对应的复合编码信息。
本发明实施例中,复合编码信息包括二段码和三段码,可选的,复合编码信息中的二段码也可以为可用于推导出二段码的网点编码信息。具体的,深度学习解析模型通过包括有多个历史的时空地址和对应的复合编码信息的训练集训练得到。
可选的,深度学习解析模型包括BERT网络编码层、全连接层和Softmax分类层,其中BERT(Bidirectional Encoder Representations from Transformers,基于变换器的双向编码器表示技术)网络编码层的特点是抛弃了传统的RNN架构和CNN架构,并通过注意力机制将任意位置的两个单词的距离转换成1,有效的解决了NLP中棘手的长期依赖问题。具体的,本发明中,BERT网络编码层可以包括通过训练集优化后的参数权重,其可以用于将输入的待解析的时空地址转换为数据向量,再通过全连接层和Softmax分类层处理数据向量以输出最终的分类结果。
可选的,上述深度学习解析模型可以基于Triton Inference服务架构被部署在服务器上。具体的,Triton Inference服务架构即NVIDI推出的Triton Inference Server这一模型部署架构,其拥有可以最大化GPU运行时间,支持单GPU多模型,可异构加入别的框架,支持Docker等环境以及开源可定制等众多优点。
103、根据待解析的时空地址对应的复合编码信息,确定待解析的时空地址对应的三段码信息。
可见,实施本发明实施例所描述的方法通过在待解析的地址以及模型训练数据中引入时间信息,从而能够减小最终训练得到的模型以及后续的解析服务受到网点编码变动的影响,使得模型的时效性更强,且通过单一模型通同时进行二段码和三段码的训练和解析服务,有利于减少训练成本,提高解析效率。
作为一种可选的实施方式,步骤103中的,根据待解析的时空地址对应的复合编码信息,确定待解析的时空地址对应的三段码信息,包括:
根据待解析的时空地址对应的复合编码信息中的二段码,以及预设的行政区划关系数据,推断出待解析的时空地址对应的一段码;
将待解析的时空地址对应的一段码、二段码和三段码进行组合得到待解析的时空地址对应的三段码信息。
可见,通过实施该可选的实施方式,能够根据待解析的时空地址对应的复合编码信息中的二段码,以及预设的行政区划关系数据,推断出待解析的时空地址对应的一段码,并最终组合得到待解析的时空地址对应的三段码信息,从而可以利用深度学习解析模型输出的复合编码信息来确定待解析的时空地址对应的三段码信息,以达到更精确高效的三段码解析效果。
作为一种可选的实施方式,在步骤101之前,该方法还包括:
确定多个用于训练的时空地址和对应的复合编码信息;
将多个用于训练的时空地址和对应的复合编码信息输入至深度学习解析训练模型进行训练直到收敛,得到深度学习解析模型。
本发明实施例中,深度学习解析训练模型包括BERT网络编码层、全连接层和Softmax分类层和模型优化模块,其中,模型优化模块用于对BERT网络编码层进行优化。
可见,通过实施该可选的实施方式,能够确定多个用于训练的时空地址和对应的复合编码信息,并将多个用于训练的时空地址和对应的复合编码信息输入至深度学习解析训练模型进行训练直到收敛,得到深度学习解析模型,从而可以利用引入时间信息的训练集来训练得到深度学习解析模型,使得模型的时效性更强,且通过单一模型通同时进行二段码和三段码的训练,有利于减少训练成本,提高解析效率。
作为一种可选的实施方式,上述步骤中的,确定多个用于训练的时空地址和对应的复合编码信息,包括:
获取多个历史运单地址和对应的运单签收时间;
对每一历史运单地址和对应的运单签收时间进行拼接得到多个用于训练的时空地址;
对于每一用于训练的时空地址,获取该时空地址对应的签收网点编码和三段码;
判断该时空地址对应的三段码是否为预设的无效值;
若判断结果为是,对该时空地址对应的三段码根据轮盘算法进行重新赋值得到新的三段码,将该时空地址对应的签收网点编码和新的三段码组成该时空地址对应的复合编码信息;
若判断结果为否,将该时空地址对应的签收网点编码和三段码组成该时空地址对应的复合编码信息。
可选的,预设的无效值可以为999,在传统的三段码信息编码规则中,配送网点必须指定1-2个(数量根据网点情况而定)派件员来顶替请假、离职、件量高峰等特殊情况,这1-2个派件员三段码编码为999,因此若用于训练的三段码数值为999,其无法用于表征网点的正常配送分配情况,需要对该三段码的值根据轮盘算法进行重新赋值得到新的三段码。
可见,通过实施该可选的实施方式,能够在确定训练数据时判断用于训练的时空地址对应的三段码是否为无效值,并在判断结果为是时根据轮盘算法进行重新赋值得到新的三段码,从而能够确定出有效的训练数据以对模型进行训练,以提高模型的训练效率。
作为一种可选的实施方式,上述步骤中的,将多个用于训练的时空地址和对应的复合编码信息输入至深度学习解析训练模型进行训练直到收敛,得到深度学习解析模型,包括:
将用于训练的时空地址作为模型输入,输入至BERT网络编码层以得到数据向量,再将数据向量输入至全连接层和Softmax分类层,以得到Softmax分类层输出的分类结果;
将分类结果与用于训练的时空地址对应的复合编码信息进行分类损失计算,得到分类损失结果;
将分类损失结果输入至模型优化模块,以使得模型优化模块根据分类损失结果对BERT网络编码层进行优化直到收敛,将优化后的BERT网络编码层、全连接层和Softmax分类层确定为深度学习解析模型。
可见,通过实施该可选的实施方式,能够利用引入时间信息的训练集来训练得到深度学习解析模型,使得模型的时效性更强,且通过单一模型通同时进行二段码和三段码的训练,有利于减少训练成本,提高解析效率。
本实施例还公开了一个上述三段码解析处理方法的一个具体的实施方案,该方案为一种基于深度学习的智能三段码解析系统,包含时空地址拼接模块、BERT编码器模块、二段码-三段码联合分类优化模块以及模型部署推断模块。其中,时空地址拼接模块是将用于深度模型学习的历史签收语料的时间信息和地址信息进行拼接,BERT编码器模块是基于时空地址数据和深度学习算法学习三段码场景下特定句子的编码表示,而二段码-三段码联合分类优化模块是基于BERT编码表示进行网点编码-三段码联合标签分类和优化,模型部署推断模块是将训练好的三段码模型进行部署和线上推断。具体的,参照图4,该方案中基于深度学习的智能三段码解析系统的三段码解析步骤如下:
步骤1:数据预处理。1)将第三段码为“999”的数据对应第三段码替换为空;2)将第三段码为空的数据运用轮盘算法进行重赋值;3)将签收网点与第三段码进行拼接,得到模型训练标签。
步骤2:时空地址拼接。对预处理过的数据进行签收时间+收件区名+收件详细地址拼接,得到模型训练数据。
步骤3:BERT编码。时空地址数据进入BERT编码器得到数据的向量表示。
步骤4:分类与模型优化。1)数据表示向量分别经过全连接层和Softmax分类层输出预测结果;2)预测结果与数据标签计算分类损失;3)模型优化器通过将损失逐层回传并通过优化算法来迭代优化BERT模型的权重。
步骤5:结果解析。1)对BERT模型输出的联合分类结果进行解析得到第二段码和第三段码;2)根据第二段码和行政区划表反推第一段码;2)整体三段码拼接与输出。
步骤6:将三段码解析系统部署成Triton Inference服务。
具体的,步骤3和步骤4中的BERT编码和分类优化器内部实现如下:
1)根据下述公式,输入时空地址数据x1,x2,x3,...,xM通过BERT编码器(Transformer Encoder)得到数据的向量表示C(上下文特征):
C=EncoderTransformer(x1,x2,x3,...,xM);
2)C经过全连接层加一层权重WT后,进到Softmax分类器得到预测结果pred:
pred=softmax(CWT);
3)根据预测值pred和真实标签label计算分类损失loss:
4)通过优化器来逐层调整BERT模型的权重实现模型迭代优化,最终得到收敛模型。
本方案中采用深度学习和三段码相结合的技术实现了三段码自动学习,通过时空地址策略缓解了因网点编码频繁变动导致二段码模型时效性差的问题,与纯地址二段码模型相比提高了1%,同时通过(网点编码-三段码)联合标签的策略实现了利用一个三段码模型同时解析二段码与三段码,在保证二段码解析准确率的同时提高了三段码的解析准确率,进而达到提高整体三段码解析率的目的,与传统的第三段码规则匹配相比,本申请的第三段码解析率提高了10%。
实施例二
请参阅图2,图2是本发明实施例公开的一种基于深度学习的三段码解析处理装置的结构示意图。其中,图2所描述的装置可以应用于相应的解析处理终端、解析处理设备或解析处理服务器,且该服务器可以是本地服务器,也可以是云服务器,本发明实施例不做限定。如图2所示,该装置可以包括:
获取模块201,获取待解析的时空地址。
本发明实施例中,时空地址包括时间信息和地址信息。可选的,时间信息为地址信息对应的物流任务对应的签收时间。可选的,时间信息也可以为地址信息对应的物流任务对应的发货时间或运输时间段等时间信息。
解析模块202,用于将待解析的时空地址输入至深度学习解析模型,得到待解析的时空地址对应的复合编码信息。
本发明实施例中,复合编码信息包括二段码和三段码,可选的,复合编码信息中的二段码也可以为可用于推导出二段码的网点编码信息。具体的,深度学习解析模型通过包括有多个历史的时空地址和对应的复合编码信息的训练集训练得到。
可选的,深度学习解析模型包括BERT网络编码层、全连接层和Softmax分类层,其中BERT(Bidirectional Encoder Representations from Transformers,基于变换器的双向编码器表示技术)网络编码层的特点是抛弃了传统的RNN架构和CNN架构,并通过注意力机制将任意位置的两个单词的距离转换成1,有效的解决了NLP中棘手的长期依赖问题。具体的,本发明中,BERT网络编码层可以包括通过训练集优化后的参数权重,其可以用于将输入的待解析的时空地址转换为数据向量,再通过全连接层和Softmax分类层处理数据向量以输出最终的分类结果。
可选的,上述深度学习解析模型可以基于Triton Inference服务架构被部署在服务器上。具体的,Triton Inference服务架构即NVIDI推出的Triton Inference Server这一模型部署架构,其拥有可以最大化GPU运行时间,支持单GPU多模型,可异构加入别的框架,支持Docker等环境以及开源可定制等众多优点。
确定模块203,用于根据待解析的时空地址对应的复合编码信息,确定待解析的时空地址对应的三段码信息。
可见,实施本发明实施例所描述的装置通过在待解析的地址以及模型训练数据中引入时间信息,从而能够减小最终训练得到的模型以及后续的解析服务受到网点编码变动的影响,使得模型的时效性更强,且通过单一模型通同时进行二段码和三段码的训练和解析服务,有利于减少训练成本,提高解析效率。
作为一种可选的实施方式,确定模块203根据待解析的时空地址对应的复合编码信息,确定待解析的时空地址对应的三段码信息的具体方式,包括:
根据待解析的时空地址对应的复合编码信息中的二段码,以及预设的行政区划关系数据,推断出待解析的时空地址对应的一段码;
将待解析的时空地址对应的一段码、二段码和三段码进行组合得到待解析的时空地址对应的三段码信息。
可见,通过实施该可选的实施方式,能够根据待解析的时空地址对应的复合编码信息中的二段码,以及预设的行政区划关系数据,推断出待解析的时空地址对应的一段码,并最终组合得到待解析的时空地址对应的三段码信息,从而可以利用深度学习解析模型输出的复合编码信息来确定待解析的时空地址对应的三段码信息,以达到更精确高效的三段码解析效果。
作为一种可选的实施方式,该装置还包括:
训练确定模块,用于确定多个用于训练的时空地址和对应的复合编码信息;
模型训练模块,用于将多个用于训练的时空地址和对应的复合编码信息输入至深度学习解析训练模型进行训练直到收敛,得到深度学习解析模型。
本发明实施例中,深度学习解析训练模型包括BERT网络编码层、全连接层和Softmax分类层和模型优化模块,其中,模型优化模块用于对BERT网络编码层进行优化。
可见,通过实施该可选的实施方式,能够确定多个用于训练的时空地址和对应的复合编码信息,并将多个用于训练的时空地址和对应的复合编码信息输入至深度学习解析训练模型进行训练直到收敛,得到深度学习解析模型,从而可以利用引入时间信息的训练集来训练得到深度学习解析模型,使得模型的时效性更强,且通过单一模型通同时进行二段码和三段码的训练,有利于减少训练成本,提高解析效率。
作为一种可选的实施方式,训练确定模块确定多个用于训练的时空地址和对应的复合编码信息的具体方式,包括:
获取多个历史运单地址和对应的运单签收时间;
对每一历史运单地址和对应的运单签收时间进行拼接得到多个用于训练的时空地址;
对于每一用于训练的时空地址,获取该时空地址对应的签收网点编码和三段码;
判断该时空地址对应的三段码是否为预设的无效值;
若判断结果为是,对该时空地址对应的三段码根据轮盘算法进行重新赋值得到新的三段码,将该时空地址对应的签收网点编码和新的三段码组成该时空地址对应的复合编码信息;
若判断结果为否,将该时空地址对应的签收网点编码和三段码组成该时空地址对应的复合编码信息。
可选的,预设的无效值可以为999,在传统的三段码信息编码规则中,配送网点必须指定1-2个(数量根据网点情况而定)派件员来顶替请假、离职、件量高峰等特殊情况,这1-2个派件员三段码编码为999,因此若用于训练的三段码数值为999,其无法用于表征网点的正常配送分配情况,需要对该三段码的值根据轮盘算法进行重新赋值得到新的三段码。
可见,通过实施该可选的实施方式,能够在确定训练数据时判断用于训练的时空地址对应的三段码是否为无效值,并在判断结果为是时根据轮盘算法进行重新赋值得到新的三段码,从而能够确定出有效的训练数据以对模型进行训练,以提高模型的训练效率。
作为一种可选的实施方式,模型训练模块将多个用于训练的时空地址和对应的复合编码信息输入至深度学习解析训练模型进行训练直到收敛,得到深度学习解析模型的具体方式,包括:
将用于训练的时空地址作为模型输入,输入至BERT网络编码层以得到数据向量,再将数据向量输入至全连接层和Softmax分类层,以得到Softmax分类层输出的分类结果;
将分类结果与用于训练的时空地址对应的复合编码信息进行分类损失计算,得到分类损失结果;
将分类损失结果输入至模型优化模块,以使得模型优化模块根据分类损失结果对BERT网络编码层进行优化直到收敛,将优化后的BERT网络编码层、全连接层和Softmax分类层确定为深度学习解析模型。
可见,通过实施该可选的实施方式,能够利用引入时间信息的训练集来训练得到深度学习解析模型,使得模型的时效性更强,且通过单一模型通同时进行二段码和三段码的训练,有利于减少训练成本,提高解析效率。
本实施例还公开了一个上述三段码解析处理装置的一个具体的实施方案,该方案为一种基于深度学习的智能三段码解析系统,包含时空地址拼接模块、BERT编码器模块、二段码-三段码联合分类优化模块以及模型部署推断模块。其中,时空地址拼接模块是将用于深度模型学习的历史签收语料的时间信息和地址信息进行拼接,BERT编码器模块是基于时空地址数据和深度学习算法学习三段码场景下特定句子的编码表示,而二段码-三段码联合分类优化模块是基于BERT编码表示进行网点编码-三段码联合标签分类和优化,模型部署推断模块是将训练好的三段码模型进行部署和线上推断。具体的,参照图4,该方案中基于深度学习的智能三段码解析系统的三段码解析步骤如下:
步骤1:数据预处理。1)将第三段码为“999”的数据对应第三段码替换为空;2)将第三段码为空的数据运用轮盘算法进行重赋值;3)将签收网点与第三段码进行拼接,得到模型训练标签。
步骤2:时空地址拼接。对预处理过的数据进行签收时间+收件区名+收件详细地址拼接,得到模型训练数据。
步骤3:BERT编码。时空地址数据进入BERT编码器得到数据的向量表示。
步骤4:分类与模型优化。1)数据表示向量分别经过全连接层和Softmax分类层输出预测结果;2)预测结果与数据标签计算分类损失;3)模型优化器通过将损失逐层回传并通过优化算法来迭代优化BERT模型的权重。
步骤5:结果解析。1)对BERT模型输出的联合分类结果进行解析得到第二段码和第三段码;2)根据第二段码和行政区划表反推第一段码;2)整体三段码拼接与输出。
步骤6:将三段码解析系统部署成Triton Inference服务。
具体的,步骤3和步骤4中的BERT编码和分类优化器内部实现如下:
1)根据下述公式,输入时空地址数据x1,x2,x3,...,xM通过BERT编码器(Transformer Encoder)得到数据的向量表示C(上下文特征):
C=EncoderTransformer(x1,x2,x3,...,xM);
2)C经过全连接层加一层权重WT后,进到Softmax分类器得到预测结果pred:
pred=softmax(CWT);
3)根据预测值pred和真实标签label计算分类损失loss:
4)通过优化器来逐层调整BERT模型的权重实现模型迭代优化,最终得到收敛模型。
本方案中采用深度学习和三段码相结合的技术实现了三段码自动学习,通过时空地址策略缓解了因网点编码频繁变动导致二段码模型时效性差的问题,与纯地址二段码模型相比提高了1%,同时通过(网点编码-三段码)联合标签的策略实现了利用一个三段码模型同时解析二段码与三段码,在保证二段码解析准确率的同时提高了三段码的解析准确率,进而达到提高整体三段码解析率的目的,与传统的第三段码规则匹配相比,本申请的第三段码解析率提高了10%。
实施例三
请参阅图3,图3是本发明实施例公开的又一种基于深度学习的三段码解析处理装置的结构示意图。如图3所示,该装置可以包括:
存储有可执行程序代码的存储器301;
与存储器301耦合的处理器302;
处理器302调用存储器301中存储的可执行程序代码,执行本发明实施例一公开的基于深度学习的三段码解析处理方法中的部分或全部步骤。
实施例四
本发明实施例公开了一种计算机存储介质,该计算机存储介质存储有计算机指令,该计算机指令被调用时,用于执行本发明实施例一公开的基于深度学习的三段码解析处理方法中的部分或全部步骤。
以上所描述的装置实施例仅是示意性的,其中作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理模块,即可以位于一个地方,或者也可以分布到多个网络模块上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施例的具体描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,存储介质包括只读存储器(Read-Only Memory,ROM)、随机存储器(Random Access Memory,RAM)、可编程只读存储器(Programmable Read-only Memory,PROM)、可擦除可编程只读存储器(ErasableProgrammable Read Only Memory,EPROM)、一次可编程只读存储器(One-timeProgrammable Read-Only Memory,OTPROM)、电子抹除式可复写只读存储器(Electrically-Erasable Programmable Read-Only Memory,EEPROM)、只读光盘(CompactDisc Read-Only Memory,CD-ROM)或其他光盘存储器、磁盘存储器、磁带存储器、或者能够用于携带或存储数据的计算机可读的任何其他介质。
最后应说明的是:本发明实施例公开的一种基于深度学习的三段码解析处理方法及装置所揭露的仅为本发明较佳实施例而已,仅用于说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解;其依然可以对前述各项实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或替换,并不使相应的技术方案的本质脱离本发明各项实施例技术方案的精神和范围。
Claims (10)
1.一种基于深度学习的三段码解析处理方法,其特征在于,所述方法包括:
获取待解析的时空地址;所述时空地址包括时间信息和地址信息;
将所述待解析的时空地址输入至深度学习解析模型,得到所述待解析的时空地址对应的复合编码信息;所述复合编码信息包括二段码和三段码;所述深度学习解析模型通过包括有多个历史的所述时空地址和对应的复合编码信息的训练集训练得到;
根据所述待解析的时空地址对应的复合编码信息,确定所述待解析的时空地址对应的三段码信息。
2.根据权利要求1所述的基于深度学习的三段码解析处理方法,其特征在于,所述时间信息为所述地址信息对应的物流任务对应的签收时间。
3.根据权利要求1所述的基于深度学习的三段码解析处理方法,其特征在于,所述根据所述待解析的时空地址对应的复合编码信息,确定所述待解析的时空地址对应的三段码信息,包括:
根据所述待解析的时空地址对应的复合编码信息中的二段码,以及预设的行政区划关系数据,推断出所述待解析的时空地址对应的一段码;
将所述待解析的时空地址对应的一段码、二段码和三段码进行组合得到所述待解析的时空地址对应的三段码信息。
4.根据权利要求1所述的基于深度学习的三段码解析处理方法,其特征在于,所述深度学习解析模型包括BERT网络编码层、全连接层和Softmax分类层。
5.根据权利要求4所述的基于深度学习的三段码解析处理方法,其特征在于,在所述获取待解析的时空地址之前,所述方法还包括:
确定多个用于训练的所述时空地址和对应的所述复合编码信息;
将所述多个用于训练的所述时空地址和对应的所述复合编码信息输入至深度学习解析训练模型进行训练直到收敛,得到所述深度学习解析模型;所述深度学习解析训练模型包括所述BERT网络编码层、所述全连接层和所述Softmax分类层和模型优化模块;所述模型优化模块用于对所述BERT网络编码层进行优化。
6.根据权利要求1所述的基于深度学习的三段码解析处理方法,其特征在于,所述确定多个用于训练的所述时空地址和对应的所述复合编码信息,包括:
获取多个历史运单地址和对应的运单签收时间;
对每一历史运单地址和对应的运单签收时间进行拼接得到多个用于训练的所述时空地址;
对于每一所述用于训练的所述时空地址,获取该时空地址对应的签收网点编码和三段码;
判断该时空地址对应的三段码是否为预设的无效值;
若判断结果为是,对该时空地址对应的三段码根据轮盘算法进行重新赋值得到新的三段码,将该时空地址对应的签收网点编码和新的三段码组成该时空地址对应的所述复合编码信息;
若判断结果为否,将该时空地址对应的签收网点编码和三段码组成该时空地址对应的所述复合编码信息。
7.根据权利要求1所述的基于深度学习的三段码解析处理方法,其特征在于,所述将所述多个用于训练的所述时空地址和对应的所述复合编码信息输入至深度学习解析训练模型进行训练直到收敛,得到所述深度学习解析模型,包括:
将所述用于训练的所述时空地址作为模型输入,输入至所述BERT网络编码层以得到数据向量,再将所述数据向量输入至所述全连接层和所述Softmax分类层,以得到所述Softmax分类层输出的分类结果;
将所述分类结果与所述用于训练的所述时空地址对应的所述复合编码信息进行分类损失计算,得到分类损失结果;
将所述分类损失结果输入至所述模型优化模块,以使得所述模型优化模块根据所述分类损失结果对所述BERT网络编码层进行优化直到收敛,将优化后的所述BERT网络编码层、所述全连接层和所述Softmax分类层确定为所述深度学习解析模型。
8.根据权利要求1所述的基于深度学习的三段码解析处理方法,其特征在于,所述深度学习解析模型基于Triton Inference服务架构被部署在服务器上。
9.一种基于深度学习的三段码解析处理装置,其特征在于,所述装置包括:
获取模块,用于获取待解析的时空地址;所述时空地址包括时间信息和地址信息;
解析模块,用于将所述待解析的时空地址输入至深度学习解析模型,得到所述待解析的时空地址对应的复合编码信息;所述复合编码信息包括二段码和三段码;所述深度学习解析模型通过包括有多个历史的所述时空地址和对应的复合编码信息的训练集训练得到;
确定模块,用于根据所述待解析的时空地址对应的复合编码信息,确定所述待解析的时空地址对应的三段码信息。
10.一种基于深度学习的三段码解析处理装置,其特征在于,所述装置包括:
存储有可执行程序代码的存储器;
与所述存储器耦合的处理器;
所述处理器调用所述存储器中存储的所述可执行程序代码,执行如权利要求1-8任一项所述的基于深度学习的三段码解析处理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111150087.7A CN113837699A (zh) | 2021-09-29 | 2021-09-29 | 一种基于深度学习的三段码解析处理方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111150087.7A CN113837699A (zh) | 2021-09-29 | 2021-09-29 | 一种基于深度学习的三段码解析处理方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113837699A true CN113837699A (zh) | 2021-12-24 |
Family
ID=78967627
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111150087.7A Pending CN113837699A (zh) | 2021-09-29 | 2021-09-29 | 一种基于深度学习的三段码解析处理方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113837699A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117058595A (zh) * | 2023-10-11 | 2023-11-14 | 齐鲁工业大学(山东省科学院) | 视频语义特征和可扩展粒度感知时序动作检测方法及装置 |
-
2021
- 2021-09-29 CN CN202111150087.7A patent/CN113837699A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117058595A (zh) * | 2023-10-11 | 2023-11-14 | 齐鲁工业大学(山东省科学院) | 视频语义特征和可扩展粒度感知时序动作检测方法及装置 |
CN117058595B (zh) * | 2023-10-11 | 2024-02-13 | 齐鲁工业大学(山东省科学院) | 视频语义特征和可扩展粒度感知时序动作检测方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110363252A (zh) | 趋向于端到端的场景文字检测与识别方法以及系统 | |
CN111914085B (zh) | 文本细粒度情感分类方法、系统、装置及存储介质 | |
CN108460679B (zh) | 融合注意力机制的深度网络智能投资系统数据分析方法 | |
CN112613314A (zh) | 基于bert模型的电力通信网络知识图谱构建方法 | |
US6876990B2 (en) | Questionnaire analysis system | |
US20220300546A1 (en) | Event extraction method, device and storage medium | |
CN111986673A (zh) | 一种用于语音识别的槽值填充方法、装置和电子设备 | |
CN113837699A (zh) | 一种基于深度学习的三段码解析处理方法及装置 | |
CN113672732B (zh) | 用于对业务数据进行分类的方法和设备 | |
CN115115914B (zh) | 信息识别方法、装置以及计算机可读存储介质 | |
CN113010635B (zh) | 一种文本纠错方法及装置 | |
CN114091472B (zh) | 多标签分类模型的训练方法 | |
CN117313728A (zh) | 实体识别方法、模型训练方法、装置、设备和存储介质 | |
Blier-Wong et al. | Geographic ratemaking with spatial embeddings | |
CN111898544A (zh) | 文字图像匹配方法、装置和设备及计算机存储介质 | |
CN112465035A (zh) | 物流配送任务分配方法、系统、设备及存储介质 | |
CN114912854B (zh) | 地铁列车运行调整方法、装置、电子设备及存储介质 | |
CN114764469A (zh) | 一种内容推荐方法、装置、计算机设备和存储介质 | |
CN115578035A (zh) | 物流包裹分拣方法、系统及存储介质 | |
CN115496175A (zh) | 新建边缘节点接入评估方法、装置、终端设备及产品 | |
CN112669264A (zh) | 配网线路无人机巡检的人工智能缺陷识别方法和系统 | |
CN113222487A (zh) | 调度路径生成方法,装置,存储介质及电子设备 | |
WO2022004957A1 (ko) | 투자자문방법 및 그 장치 | |
CN113781876B (zh) | 一种将文本转换为手语动作视频的转换方法和装置 | |
CN116778376B (zh) | 内容安全检测模型训练方法、检测方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |