CN112488194A - 地址缩略语生成方法、模型训练方法及相关设备 - Google Patents
地址缩略语生成方法、模型训练方法及相关设备 Download PDFInfo
- Publication number
- CN112488194A CN112488194A CN202011373603.8A CN202011373603A CN112488194A CN 112488194 A CN112488194 A CN 112488194A CN 202011373603 A CN202011373603 A CN 202011373603A CN 112488194 A CN112488194 A CN 112488194A
- Authority
- CN
- China
- Prior art keywords
- address
- abbreviated
- sample
- model
- abbreviation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 91
- 238000012549 training Methods 0.000 title claims abstract description 50
- 239000013598 vector Substances 0.000 claims abstract description 61
- 239000011159 matrix material Substances 0.000 claims abstract description 46
- 238000002372 labelling Methods 0.000 claims abstract description 38
- 238000012545 processing Methods 0.000 claims abstract description 37
- 238000012216 screening Methods 0.000 claims abstract description 4
- 230000015654 memory Effects 0.000 claims description 22
- 238000013528 artificial neural network Methods 0.000 claims description 17
- 230000000306 recurrent effect Effects 0.000 claims description 17
- 238000006243 chemical reaction Methods 0.000 claims description 8
- 230000002457 bidirectional effect Effects 0.000 claims description 5
- 238000007781 pre-processing Methods 0.000 claims description 5
- 238000000605 extraction Methods 0.000 claims description 3
- 230000001960 triggered effect Effects 0.000 claims description 3
- 238000004590 computer program Methods 0.000 claims description 2
- 238000010586 diagram Methods 0.000 description 11
- 230000003287 optical effect Effects 0.000 description 3
- 239000004575 stone Substances 0.000 description 3
- 238000012937 correction Methods 0.000 description 2
- 238000003062 neural network model Methods 0.000 description 2
- 239000013307 optical fiber Substances 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 238000011144 upstream manufacturing Methods 0.000 description 2
- 238000003491 array Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000006403 short-term memory Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/08—Logistics, e.g. warehousing, loading or distribution; Inventory or stock management
- G06Q10/083—Shipping
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Economics (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Entrepreneurship & Innovation (AREA)
- Evolutionary Biology (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Development Economics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Computation (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及物流技术领域,提供一种地址缩略语生成方法、模型训练方法及相关设备。所述地址缩略语生成方法包括:接收收件地址;对所述收件地址进行处理,生成向量矩阵;将所述向量矩阵输入一缩略信息标注模型,获得缩略标签序列,所述缩略标签序列包括对应所述收件地址中每个字词的缩略标签;以及,自所述缩略标签序列中筛选出关键缩略标签对应的关键字词,生成所述收件地址的地址缩略语。本发明能够对收件地址进行处理,生成准确标识收件地址的关键信息的地址缩略语,帮助快递员迅速获取到收件地址中的关键信息,提升物流配送效率,也能提升用户的收件体验。
Description
技术领域
本发明涉及物流技术领域,具体地说,涉及一种地址缩略语生成方法、模型训练方法及相关设备。
背景技术
在物流配送过程中,经常会出现这样的场景:快递面单中用户的收货地址很长,快递员难以一眼获取到关键信息,需要认真辨认才能识别出准确地址。如果多位用户都出现这样的情况,则会严重影响快递员的配送效率,因此需要对收件地址进行简化处理。
目前的简化处理方式,只能做到识别出收件地址中的省市归属信息,然后截取出位于省市归属信息之后的下游地址。这种方式并不能真正满足地址简化的需求,尤其是对于本身十分冗长的地址信息,即使截取出位于省市归属信息之后的下游地址,也无法帮助快递员迅速获取到关键信息。
举例来说,某个用户的收件地址是“河北省石家庄市红旗大街与南二环交叉口西行300米五里庄园天伦锦城4号楼201”,此时即使截取出位于省市归属信息之后的下游地址“红旗大街与南二环交叉口西行300米五里庄园天伦锦城4号楼201”,显示的地址信息仍然十分冗长,难以满足简化需求。
需要说明的是,上述背景技术部分公开的信息仅用于加强对本发明的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
发明内容
有鉴于此,本发明提供一种地址缩略语生成方法、模型训练方法及相关设备,能够对收件地址进行处理,生成准确标识其关键信息的地址缩略语,帮助快递员迅速获取到收件地址中的关键信息,提升物流配送效率。
本发明的一个方面提供一种地址缩略语生成方法,包括:接收收件地址;对所述收件地址进行处理,生成向量矩阵;将所述向量矩阵输入一缩略信息标注模型,获得缩略标签序列,所述缩略标签序列包括对应所述收件地址中每个字词的缩略标签;以及,自所述缩略标签序列中筛选出关键缩略标签对应的关键字词,生成所述收件地址的地址缩略语。
在一些实施例中,所述生成所述收件地址的地址缩略语之后,还包括:根据所述地址缩略语,打印快递面单。
在一些实施例中,所述收件地址包括对应末端配送区域的末端地址,所述关键字词为所述末端地址中的部分字词。
在一些实施例中,所述打印快递面单之后,还包括:获得所述快递面单对应的包裹到达所述末端配送区域的预计日期;根据所述包裹和所述预计日期,更新所述末端配送区域在所述预计日期的预计包裹数;以及于预设条件触发时,向所述末端配送区域的配送中心发送所述预计日期的预计包裹数。
在一些实施例中,所述预设条件包括:所述预计日期到达,和/或所述预计包裹数超过预设阈值。
在一些实施例中,所述对所述收件地址进行处理,生成向量矩阵,包括:对所述收件地址进行预处理,生成预设格式的地址文本;根据数据字典,将所述地址文本中的字词转换成数字,生成数字序列;将所述数字序列中每个字词对应的数字转换成向量,并按所述地址文本的字词顺序拼接转换后的向量,生成向量矩阵。
在一些实施例中,所述缩略信息标注模型包括循环神经网络和概率无向图模型;所述获得所述缩略标签序列,包括:所述循环神经网络根据所述向量矩阵,获得对应每个字词的特征向量;所述概率无向图模型根据所述特征向量,获得包含每个字词对应各缩略标签的概率序列的概率矩阵,并根据所述概率矩阵输出最优标签序列作为所述缩略标签序列;所述最优标签序列中,每个字词对应一缩略标签。
本发明的又一个方面提供一种模型训练方法,包括:获得样本地址;采用缩略标签集对所述样本地址进行标注,获得每条所述样本地址的样本标签序列;对标注后的每条所述样本地址进行处理,获得样本向量矩阵;根据循环神经网络和概率无向图模型构造一网络模型;以所述样本向量矩阵为输入,以对应的所述样本标签序列为输出,训练所述网络模型,获得缩略信息标注模型。
在一些实施例中,所述缩略标签集包括对应关键信息的缩略标签和对应冗余信息的缩略标签。
在一些实施例中,所述根据循环神经网络和概率无向图模型构造一网络模型,包括:以双向长短期记忆网络作为向量化处理的特征提取层;以条件随机场作为概率分布处理的标签输出层。
本发明的又一个方面提供一种地址缩略语生成装置,包括:地址接收模块,配置为接收收件地址;向量转换模块,配置为对所述收件地址进行处理,生成向量矩阵;缩略标注模块,配置为将所述向量矩阵输入一缩略信息标注模型,获得缩略标签序列,所述缩略标签序列包括对应所述收件地址中每个字词的缩略标签;以及简化处理模块,配置为自所述缩略标签序列中筛选出关键缩略标签对应的关键字词,生成所述收件地址的地址缩略语。
本发明的又一个方面提供一种模型训练装置,包括:样本采集模块,配置为获得样本地址;样本标注模块,配置为采用缩略标签集对所述样本地址进行标注,获得每条所述样本地址的样本标签序列;样本处理模块,配置为对标注后的每条所述样本地址进行处理,获得样本向量矩阵;模型构建模块,配置为根据循环神经网络和概率无向图模型构造一网络模型;模型训练模块,配置为以所述样本向量矩阵为输入,以对应的所述样本标签序列为输出,训练所述网络模型,获得缩略信息标注模型。
本发明的又一个方面提供一种电子设备,包括:一处理器;一存储器,存储有可执行指令;其中,所述可执行指令被所述处理器执行时,实现上述任意实施例所述的地址缩略语生成方法,和/或,实现上述任意实施例所述的模型训练方法。
本发明的又一个方面提供一种计算机可读的存储介质,存储有计算机程序,所述计算机程序被执行时,实现上述任意实施例所述的地址缩略语生成方法,和/或,实现上述任意实施例所述的模型训练方法。
本发明与现有技术相比的有益效果至少包括:
通过对收件地址进行处理,输入一缩略信息标注模型,获得收件地址的缩略标签序列,从中筛选出关键缩略标签对应的关键字词,生成能准确标识收件地址的关键信息的地址缩略语,从而帮助快递员迅速获取到收件地址中的关键信息,提升物流配送效率,也能提升用户的收件体验。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本发明。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。显而易见地,下面描述的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1示出本发明实施例中地址缩略语生成方法的步骤示意图;
图2示出本发明实施例中根据地址缩略语打印的快递面单示意图;
图3示出本发明又一实施例中地址缩略语生成方法的步骤示意图;
图4示出本发明实施例中地址缩略语生成装置的模块示意图;
图5示出本发明实施例中模型训练方法的步骤示意图;
图6示出本发明实施例中模型训练装置的模块示意图;
图7示出本发明实施例中电子设备的结构示意图;以及
图8示出本发明实施例中计算机可读的存储介质的结构示意图。
具体实施方式
现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的实施方式。相反,提供这些实施方式使本发明全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。
此外,附图仅为本发明的示意性图解,并非一定是按比例绘制。图中相同的附图标记表示相同或类似的部分,因而将省略对它们的重复描述。附图中所示的一些方框图是功能实体,不一定必须与物理或逻辑上独立的实体相对应。可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
下面实施例中的步骤序号仅用于表示不同的执行内容,并不严格限定步骤之间的执行顺序。需要说明的是,在不冲突的情况下,本发明的实施例及不同实施例中的特征可以相互组合。
图1示出实施例中地址缩略语生成方法的主要步骤,参照图1所示,本实施例中地址缩略语生成方法包括:在步骤S110中,接收收件地址;在步骤S120中,对收件地址进行处理,生成向量矩阵;在步骤S130中,将向量矩阵输入一缩略信息标注模型,获得缩略标签序列,缩略标签序列包括对应收件地址中每个字词的缩略标签;以及在步骤S140中,自缩略标签序列中筛选出关键缩略标签对应的关键字词,生成收件地址的地址缩略语。
上述的地址缩略语生成方法通过对收件地址进行处理,采用经过训练的缩略信息标注模型获得收件地址的缩略标签序列,从中筛选出关键缩略标签对应的关键字词,生成能准确标识收件地址的关键信息的地址缩略语,帮助快递员迅速获取到收件地址中的关键信息;尤其是在收件地址较长,难以让快递员一眼看到关键信息的场景中,上述的地址缩略语生成方法能够极大地提升物流配送效率,快递员无需费劲地从收件地址中辨认关键信息,仅根据生成的地址缩略语即能获知准确地址,节省物流配送成本,也能提升用户的收件体验。
下面结合具体的示例,对地址缩略语生成方法的各个步骤进行详细说明。
步骤S110中,收件地址由用户输入,接收收件地址的场景对应于不同的服务方,具有不同的场景。例如,对于电商平台来说,当用户下单购买商品时,接收到用户输入的收件地址。再如,对于物流平台来说,当用户下单寄件时,接收到用户输入的收件地址。因此,本发明的地址缩略语生成方法可适用于任意需要对收件地址进行简化的物流场景。
步骤S120中,对收件地址进行向量化表示,生成能被缩略信息标注模型处理的向量形式,便于模型运算。此处对收件地址的处理方式与缩略信息标注模型在训练过程中对样本数据的处理方式一致,即根据模型训练过程中的数据处理方式,对实时接收到的收件地址进行处理。
在一个实施例中,对收件地址进行处理,生成向量矩阵的过程具体包括:首先,对收件地址进行预处理,生成预设格式的地址文本。预处理可包括繁简转换、纠错、去重等等,将收件地址转换成简体中文格式且地址描述准确的地址文本。其次,根据数据字典,将地址文本中的字词转换成数字,生成数字序列。数据字典在模型训练过程中构建生成,用于实现文本序列到数字序列的转换。在将地址文本转换成数字序列时,可以字为单位,将地址文本中的每个字转换成数字,再按照地址文本中字的顺序将每个字转换成的数字拼接起来,生成数字序列;或者,也可先对地址文本进行分词,再以词为单位,将地址文本中的每个词转换成数字,再按照地址文本中词的顺序将每个词转换成的数字拼接起来,生成数字序列。最后,将数字序列中每个字词对应的数字转换成向量,并按地址文本的字词顺序拼接转换后的向量,生成向量矩阵。向量转换时,例如将收件地址中每个字或词映射为一个200维的向量,然后拼接形成收件地址对应的向量矩阵。
步骤S130中,基于缩略信息标注模型对向量化表示的收件地址进行标注,获得收件地址中每个字词对应的缩略标签。
在一个实施例中,缩略信息标注模型包括循环神经网络和概率无向图模型;采用包含循环神经网络和概率无向图模型的缩略信息标注模型获得收件地址的缩略标签序列的过程具体包括:循环神经网络根据向量矩阵,获得对应每个字词的特征向量,实现对收件地址的进一步向量化处理;概率无向图模型根据特征向量,获得包含每个字词对应各缩略标签的概率序列的概率矩阵;概率无向图模型进一步对获得的概率矩阵进行处理,输出最优标签序列作为缩略标签序列;最优标签序列中,每个字词对应一缩略标签。
在一个优选的实施例中,循环神经网络采用双向长短期记忆网络(Bi-directional Long Short-Term Memory,简称BiLSTM),BiLSTM网络可以很好地对序列数据进行建模,获得收件地址中每个字词的特征向量。概率无向图模型采用条件随机场(Conditional Random Field,简称CRF),CRF层可根据经BiLSTM网络处理生成的编码表示的特征向量,获得由每个字词对应所有缩略标签的概率序列组成的收件地址的概率矩阵。并且,CRF层使用维特比(Viterbi)算法处理概率矩阵,得到最优标签序列,最优标签序列中每个字词的缩略标签即作为最终的标注结果。
在其他实施例中,可采用由其他的循环神经网络和概率无向图模型构建和训练生成的缩略信息标注模型,对收件地址进行缩略信息标注。
步骤S140中,根据生成的缩略标签序列,将其中关键缩略标签对应的关键字词保留,其余缩略标签对应的冗余字词删去,生成地址缩略语。
举例来说,在一个实施例中,接收到用户输入的收件地址是“河北省石家庄市红旗大街与南二环交叉口西行300米五里庄园天伦锦城4号楼201”,对该收件地址进行向量化表示后输入缩略信息标注模型,获得缩略标签序列为:“河‘O’,北‘O’,省‘O’,石‘O’,家‘O’,庄‘O’,市‘O’,红‘O’,旗‘O’,大‘O’,街‘O’,与‘O’,南‘O’,二‘O’,环‘O’,交‘O’,叉‘O’,口‘O’,西‘O’,行‘O’,3‘O’,0‘O’,0‘O’,米‘O’,五‘O’,里‘O’,庄‘O’,园‘O’,天‘S’,伦‘S’,锦‘S’,城‘S’,4‘S’,号‘S’,楼‘O’,2‘S’,0‘S’,1‘S’”。根据该缩略标签序列,保留其中关键缩略标签‘S’对应的关键字词,将缩略标签‘O’对应的冗余字词删去,最终经缩略信息标注模型简化后,生成地址缩略语“天伦锦城4号201”。该地址缩略语简明合适,能够准确标识收件地址的关键信息。
进一步地,生成合适的地址缩略语后,根据地址缩略语打印快递面单。此处的打印快递面单包括虚拟打印和物理打印两种场景。例如,对于电商平台来说,当接收到用户下单购买商品时输入的收件地址,经缩略信息标注模型简化生成地址缩略语后,可通过虚拟打印的方式,生成包含地址缩略语的收件信息,发送至对应的物流平台,为后续物流平台打印实体快递面单提供依据。再如,对于物流平台来说,当接收到用户下单寄件时输入的收件地址,经缩略信息标注模型简化生成地址缩略语后,可直接通过物理打印的方式,打印出快递面单。
在一个实施例中,收件地址包括对应末端配送区域的末端地址,关键字词为末端地址中的部分字词。根据地址缩略语打印快递面单时,可直接将地址缩略语打印作为收件地址,地址缩略语的上游地址信息可包含在快递面单的条形码(及条形码下方的快递单号)中。根据物流配送流程,在包裹到达末端配送区域之前,通过扫描包裹的快递面单上的条形码,获知包裹应当送达的各个分拣中心,实现包裹在各个分拣中心之间分拣流转;当包裹到达末端配送区域后,则需要快递员将包裹配送至具体的末端地址。因此,本实施例中作为地址缩略语的关键字词选自末端地址中的部分字词,并将地址缩略语打印作为收件地址,既能使地址缩略语简明准确地体现收件地址的末端地址中的关键信息,避免其他冗杂地址信息的干扰,真正帮助末端配送区域的快递员提升配送效率,同时又不影响包裹到达末端配送区域之前在各个分拣中心的分拣流转。
使关键字词选自末端地址中的部分字词,可在模型训练阶段,对样本数据进行标注时,将关键缩略标签标注于末端地址实现,这将在下文中结合模型训练方法具体说明。
图2示出实施例中根据地址缩略语打印的快递面单,参照图2所示,快递面单200的收件信息区域202中,直接将地址缩略语,例如上述实施例中生成的“天伦锦城4号201”打印作为收件地址。从而,对应的末端配送区域的快递员能够一眼看到收件地址的末端地址中的关键信息,没有其他冗杂地址信息的干扰。而地址缩略语的上游地址信息,即指示包裹到达末端配送区域之前应当送达的各个分拣中心的相关地址信息,包含在快递面单200的条形码201中,包裹在各个分拣中心之间的分拣流转,可通过扫描条形码201实现。快递面单200具有唯一标识的快递单号,位于条形码201下方,例如为“0123456789”,快递面单200中还可包括其他常规信息,例如收件人、寄件信息等等。
进一步地,生成地址缩略语并打印快递面单之后,可统计地址缩略语对应的末端配送区域的预计包裹数量,以便对应的末端配送区域根据预计包裹数量实时调配人手,提升配送效率。
具体来说,参照图3所示,在一个实施例中,步骤S350根据地址缩略语,打印快递面单之后,还包括:步骤S360,获得快递面单对应的包裹到达末端配送区域的预计日期,送达日期预测可通过现有的方式实现。步骤S370,根据包裹和预计日期,更新末端配送区域在预计日期的预计包裹数;例如,物流中心的数据库中存有各个末端配送区域在未来几天的预计包裹数,根据每件打印的快递面单中的地址缩略语所在的末端配送区域及送达末端配送区域的预计日期,实时更新对应的末端配送区域在预计日期的预计包裹数。以及步骤S380,于预设条件触发时,向末端配送区域的配送中心发送预计日期的预计包裹数。
其中,预设条件包括预计日期到达和/或预计包裹数超过预设阈值,也即当预计日期到达及预计包裹数超过预设阈值中的任一项触发,则向末端配送区域的配送中心发送预计日期的预计包裹数。预计日期到达的触发场景例如,每天凌晨,将当天各个末端配送区域的预计包裹数发送至各个末端配送区域的配送中心,以便末端配送区域的配送中心根据当天的预计包裹数实时调配人手,提升配送效率,同时也提升各个末端配送区域之间的人力资源利用率。预计包裹数超过预设阈值的触发场景例如,当统计发现某一末端配送区域两天后的预计包裹数超过常规量,则及时向该末端配送区域的配送中心发送其在两天后的预计包裹数,并且会随着统计新增不断地向该配送区域的配送中心更新其预计包裹数,以便该末端配送区域的配送中心提前预知两天后可能出现的爆仓情况,提前部署应对。
从而,上述的地址缩略语生成方法,能够根据收件地址生成准确标识其末端地址的关键信息的地址缩略语,帮助末端配送区域的快递员迅速获取准确地址信息,避免其他冗杂地址信息干扰,提升物流配送效率和用户的收件体验;同时还能根据打印的快递面单实时统计各个末端配送区域的未来预计包裹数,并及时通知到各个末端配送区域的配送中心,以便各个末端配送区域的配送中心根据未来预计包裹数及时调配人手,部署应对,提高人力资源利用率,提升物流配送效率。
本发明实施例还提供一种地址缩略语生成装置,可用于实现上述任意实施例描述的地址缩略语生成方法。图4示出地址缩略语生成装置的主要模块,参照图4所示,本实施例中地址缩略语生成装置400包括:地址接收模块410,配置为接收收件地址;向量转换模块420,配置为对收件地址进行处理,生成向量矩阵;缩略标注模块430,配置为将向量矩阵输入一缩略信息标注模型,获得缩略标签序列,缩略标签序列包括对应收件地址中每个字词的缩略标签;以及简化处理模块440,配置为自缩略标签序列中筛选出关键缩略标签对应的关键字词,生成收件地址的地址缩略语。
进一步地,地址缩略语生成装置400还可包括实现上述各地址缩略语生成方法实施例的其他流程步骤的模块,各个模块的具体原理可参照上述各地址缩略语生成方法实施例的描述,此处不再重复说明。
如上所述,本实施例的地址缩略语生成装置采用经过训练的缩略信息标注模型获得收件地址的缩略标签序列,从中筛选出关键缩略标签对应的关键字词,生成能准确标识收件地址的关键信息的地址缩略语,帮助快递员迅速获取到收件地址中的关键信息;尤其是在收件地址较长,大量冗杂地址信息干扰的场景中,本实施例的地址缩略语生成装置能够极大地提升物流配送效率,快递员无需费劲地从收件地址中辨认关键信息,仅根据生成的地址缩略语即能获知准确地址,节省物流配送成本,也能提升用户的收件体验。
本发明实施例还提供一种模型训练方法,用于训练生成上述各地址缩略语生成方法实施例中的缩略信息标注模型。图5示出模型训练方法的主要步骤,参照图5所示,本实施例中模型训练方法包括:在步骤S510中,获得样本地址;在步骤S520中,采用缩略标签集对样本地址进行标注,获得每条样本地址的样本标签序列;在步骤S530中,对标注后的每条样本地址进行处理,获得样本向量矩阵;在步骤S540中,根据循环神经网络和概率无向图模型构造一网络模型;以及在步骤S550中,以样本向量矩阵为输入,以对应的样本标签序列为输出,训练网络模型,获得缩略信息标注模型。
步骤S510中,为了保证足够多的训练数据,可以整理出互联网上已有的地址数据及其简称数据,同时为解决数据分布不均匀的问题,采用过采样的方式扩充数据,以获得数量足够且分布均匀的样本地址。
步骤S520中,针对快递场景,采用缩略标签集对样本地址进行标注。缩略标签集包括对应关键信息的缩略标签和对应冗余信息的缩略标签,其中对应关键信息的缩略标签即上述实施例中,缩略信息标注模型应用于实际地址简化场景时输出的关键缩略标签。对样本地址进行标注时,可将关键缩略标签标注于样本地址的末端地址中的部分字词,使经过机器学习后,缩略信息标注模型应用于实际地址简化场景时,输出的缩略标签序列中关键缩略标签对应于收件地址的末端地址中的部分关键字词。
步骤S530中,对标注好的样本地址进行处理,包括繁简转换、纠错等预处理;构建数据字典、根据数据字典的顺序生成索引,完成文本序列到数字序列的转换;以及对每个字或词生成固定维度的向量,并将字词向量拼接生成样本地址的样本向量矩阵。具体的处理过程可参照上述地址缩略语生成方法实施例的描述,此处不再重复说明。
步骤S540中,可采用双向长短期记忆网络和条件随机场构造神经网络模型,其中双向长短期记忆网络作为向量化处理的特征提取层,条件随机场作为概率分布处理的标签输出层。双向长短期记忆网络和条件随机场的具体原理也可参照上述地址缩略语生成方法实施例的描述。
步骤S550中,利用样本向量矩阵训练神经网络模型,获得能通过缩略标签准确标注样本地址的关键信息的缩略信息标注模型。
经上述实施例的模型训练方法训练生成的缩略信息标注模型,当应用于实际地址简化场景时,能够输出准确标识收件地址中的关键信息的缩略标签序列,根据缩略信息标注模型提取的地址缩略语,能够帮助快递员迅速获取到收件地址中的关键信息;尤其是在收件地址较长,大量冗杂地址信息干扰的场景中,采用上述实施例训练生成的缩略信息标注模型,能够极大地提升物流配送效率,快递员无需费劲地从收件地址中辨认关键信息,仅根据生成的地址缩略语即能获知准确地址,节省物流配送成本,也能提升用户的收件体验。
本发明实施例还提供一种模型训练装置,可用于实现上述实施例描述的模型训练方法。图6示出模型训练装置的主要模块,参照图6所示,本实施例中模型训练装置600包括:样本采集模块610,配置为获得样本地址;样本标注模块620,配置为采用缩略标签集对样本地址进行标注,获得每条样本地址的样本标签序列;样本处理模块630,配置为对标注后的每条样本地址进行处理,获得样本向量矩阵;模型构建模块640,配置为根据循环神经网络和概率无向图模型构造一网络模型;以及模型训练模块650,配置为以样本向量矩阵为输入,以对应的样本标签序列为输出,训练网络模型,获得缩略信息标注模型。
进一步地,模型训练装置600还可包括实现上述模型训练方法实施例的其他流程步骤的模块,各个模块的具体原理可参照上述模型训练方法实施例的描述,此处不再重复说明。
如上所述,经本实施例的模型训练装置训练生成的缩略信息标注模型,当应用于实际地址简化场景时,能够输出准确标识收件地址中的关键信息的缩略标签序列,从中提取出地址缩略语,帮助快递员迅速获取到收件地址中的关键信息;尤其是在收件地址较长,大量冗杂地址信息干扰的场景中,训练生成的缩略信息标注模型能够极大地提升物流配送效率,快递员无需费劲地从收件地址中辨认关键信息,仅根据生成的地址缩略语即能获知准确地址,节省物流配送成本,也能提升用户的收件体验。
本发明实施例还提供一种电子设备,包括处理器和存储器,存储器中存储有可执行指令,可执行指令被处理器执行时,实现上述任意实施例描述的地址缩略语生成方法/模型训练方法。
如上所述,本发明的电子设备能够通过缩略信息标注模型获得收件地址的缩略标签序列,从中筛选出关键缩略标签对应的关键字词,生成能准确标识收件地址的关键信息的地址缩略语,帮助快递员迅速获取到收件地址中的关键信息,提升物流配送效率,也能提升用户的收件体验。
图7是本发明实施例中电子设备的结构示意图,应当理解的是,图7仅仅是示意性地示出各个模块,这些模块可以是虚拟的软件模块或实际的硬件模块,这些模块的合并、拆分及其余模块的增加都在本发明的保护范围之内。
如图7所示,电子设备700以通用计算设备的形式表现。电子设备700的组件包括但不限于:至少一个处理单元710、至少一个存储单元720、连接不同平台组件(包括存储单元720和处理单元710)的总线730、显示单元740等。
其中,存储单元存储有程序代码,程序代码可以被处理单元710执行,使得处理单元710执行上述任意实施例实施例描述的地址缩略语生成方法/模型训练方法的步骤。例如,处理单元710可以执行如图1、图3和图5所示的步骤。
存储单元720可以包括易失性存储单元形式的可读介质,例如随机存取存储单元(RAM)7201和/或高速缓存存储单元7202,还可以进一步包括只读存储单元(ROM)7203。
存储单元720还可以包括具有一个或多个程序模块7205的程序/实用工具7204,这样的程序模块7205包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
总线730可以为表示几类总线结构中的一种或多种,包括存储单元总线或者存储单元控制器、外围总线、图形加速端口、处理单元或者使用多种总线结构中的任意总线结构的局域总线。
电子设备700也可以与一个或多个外部设备800通信,外部设备800可以是键盘、指向设备、蓝牙设备等设备中的一种或多种。这些外部设备800使得用户能与该电子设备700进行交互通信。电子设备700也能与一个或多个其它计算设备进行通信,所示计算机设备包括路由器、调制解调器。这种通信可以通过输入/输出(I/O)接口750进行。并且,电子设备700还可以通过网络适配器760与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。网络适配器760可以通过总线730与电子设备700的其它模块通信。应当明白,尽管图中未示出,可以结合电子设备700使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储平台等。
本发明实施例还提供一种计算机可读的存储介质,用于存储程序,程序被执行时实现上述任意实施例描述的地址缩略语生成方法/模型训练方法。在一些可能的实施方式中,本发明的各个方面还可以实现为一种程序产品的形式,其包括程序代码,当程序产品在终端设备上运行时,程序代码用于使终端设备执行上述任意实施例描述的地址缩略语生成方法/模型训练方法。
如上所述,本发明的计算机可读的存储介质能够通过缩略信息标注模型获得收件地址的缩略标签序列,从中筛选出关键缩略标签对应的关键字词,生成能准确标识收件地址的关键信息的地址缩略语,帮助快递员迅速获取到收件地址中的关键信息,提升物流配送效率,也能提升用户的收件体验。
图8是本发明的计算机可读的存储介质的结构示意图。参考图8所示,描述了根据本发明的实施方式的用于实现上述方法的程序产品900,其可以采用便携式紧凑盘只读存储器(CD-ROM)并包括程序代码,并可以在终端设备,例如个人电脑上运行。然而,本发明的程序产品不限于此,在本文件中,可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子包括但不限于:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
计算机可读的存储介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。可读存储介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。可读存储介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、有线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言的任意组合来编写用于执行本发明操作的程序代码,程序设计语言包括面向对象的程序设计语言—诸如Java、C++等,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(LAN)或广域网(WAN),连接到用户计算设备,或者,可以连接到外部计算设备,例如利用因特网服务提供商来通过因特网连接。
以上内容是结合具体的优选实施方式对本发明所作的进一步详细说明,不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干简单推演或替换,都应当视为属于本发明的保护范围。
Claims (14)
1.一种地址缩略语生成方法,其特征在于,包括:
接收收件地址;
对所述收件地址进行处理,生成向量矩阵;
将所述向量矩阵输入一缩略信息标注模型,获得缩略标签序列,所述缩略标签序列包括对应所述收件地址中每个字词的缩略标签;以及
自所述缩略标签序列中筛选出关键缩略标签对应的关键字词,生成所述收件地址的地址缩略语。
2.如权利要求1所述的地址缩略语生成方法,其特征在于,所述生成所述收件地址的地址缩略语之后,还包括:
根据所述地址缩略语,打印快递面单。
3.如权利要求2所述的地址缩略语生成方法,其特征在于,所述收件地址包括对应末端配送区域的末端地址,所述关键字词为所述末端地址中的部分字词。
4.如权利要求3所述的地址缩略语生成方法,其特征在于,所述打印快递面单之后,还包括:
获得所述快递面单对应的包裹到达所述末端配送区域的预计日期;
根据所述包裹和所述预计日期,更新所述末端配送区域在所述预计日期的预计包裹数;以及
于预设条件触发时,向所述末端配送区域的配送中心发送所述预计日期的预计包裹数。
5.如权利要求4所述的地址缩略语生成方法,其特征在于,所述预设条件包括:
所述预计日期到达,和/或所述预计包裹数超过预设阈值。
6.如权利要求1所述的地址缩略语生成方法,其特征在于,所述对所述收件地址进行处理,生成向量矩阵,包括:
对所述收件地址进行预处理,生成预设格式的地址文本;
根据数据字典,将所述地址文本中的字词转换成数字,生成数字序列;
将所述数字序列中每个字词对应的数字转换成向量,并按所述地址文本的字词顺序拼接转换后的向量,生成向量矩阵。
7.如权利要求6所述的地址缩略语生成方法,其特征在于,所述缩略信息标注模型包括循环神经网络和概率无向图模型;
所述获得所述缩略标签序列,包括:
所述循环神经网络根据所述向量矩阵,获得对应每个字词的特征向量;
所述概率无向图模型根据所述特征向量,获得包含每个字词对应各缩略标签的概率序列的概率矩阵,并根据所述概率矩阵输出最优标签序列作为所述缩略标签序列;
所述最优标签序列中,每个字词对应一缩略标签。
8.一种模型训练方法,其特征在于,包括:
获得样本地址;
采用缩略标签集对所述样本地址进行标注,获得每条所述样本地址的样本标签序列;
对标注后的每条所述样本地址进行处理,获得样本向量矩阵;
根据循环神经网络和概率无向图模型构造一网络模型;
以所述样本向量矩阵为输入,以对应的所述样本标签序列为输出,训练所述网络模型,获得缩略信息标注模型。
9.如权利要求8所述的模型训练方法,其特征在于,所述缩略标签集包括对应关键信息的缩略标签和对应冗余信息的缩略标签。
10.如权利要求8所述的模型训练方法,其特征在于,所述根据循环神经网络和概率无向图模型构造一网络模型,包括:
以双向长短期记忆网络作为向量化处理的特征提取层;
以条件随机场作为概率分布处理的标签输出层。
11.一种地址缩略语生成装置,其特征在于,包括:
地址接收模块,配置为接收收件地址;
向量转换模块,配置为对所述收件地址进行处理,生成向量矩阵;
缩略标注模块,配置为将所述向量矩阵输入一缩略信息标注模型,获得缩略标签序列,所述缩略标签序列包括对应所述收件地址中每个字词的缩略标签;以及
简化处理模块,配置为自所述缩略标签序列中筛选出关键缩略标签对应的关键字词,生成所述收件地址的地址缩略语。
12.一种模型训练装置,其特征在于,包括:
样本采集模块,配置为获得样本地址;
样本标注模块,配置为采用缩略标签集对所述样本地址进行标注,获得每条所述样本地址的样本标签序列;
样本处理模块,配置为对标注后的每条所述样本地址进行处理,获得样本向量矩阵;
模型构建模块,配置为根据循环神经网络和概率无向图模型构造一网络模型;
模型训练模块,配置为以所述样本向量矩阵为输入,以对应的所述样本标签序列为输出,训练所述网络模型,获得缩略信息标注模型。
13.一种电子设备,其特征在于,包括:
一处理器;
一存储器,存储有可执行指令;
其中,所述可执行指令被所述处理器执行时,实现如权利要求1-7任一项所述的地址缩略语生成方法,和/或实现如权利要求8-10任一项所述的模型训练方法。
14.一种计算机可读的存储介质,存储有计算机程序,其特征在于,所述计算机程序被执行时实现如权利要求1-7任一项所述的地址缩略语生成方法,和/或实现如权利要求8-10任一项所述的模型训练方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011373603.8A CN112488194A (zh) | 2020-11-30 | 2020-11-30 | 地址缩略语生成方法、模型训练方法及相关设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011373603.8A CN112488194A (zh) | 2020-11-30 | 2020-11-30 | 地址缩略语生成方法、模型训练方法及相关设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112488194A true CN112488194A (zh) | 2021-03-12 |
Family
ID=74937516
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011373603.8A Pending CN112488194A (zh) | 2020-11-30 | 2020-11-30 | 地址缩略语生成方法、模型训练方法及相关设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112488194A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115017899A (zh) * | 2022-04-19 | 2022-09-06 | 北京三快在线科技有限公司 | 一种缩略语生成方法、装置、设备及存储介质 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107656913A (zh) * | 2017-09-30 | 2018-02-02 | 百度在线网络技术(北京)有限公司 | 地图兴趣点地址提取方法、装置、服务器和存储介质 |
CN108920457A (zh) * | 2018-06-15 | 2018-11-30 | 腾讯大地通途(北京)科技有限公司 | 地址识别方法和装置及存储介质 |
CN109214553A (zh) * | 2018-08-09 | 2019-01-15 | 何晨亮 | 一种用于电子商务的物流运输方法及其系统 |
CN109242397A (zh) * | 2018-10-11 | 2019-01-18 | 苏州亮磊知识产权运营有限公司 | 一种基于信息共享的快递收件地址转移方法及其系统 |
CN110472229A (zh) * | 2019-07-11 | 2019-11-19 | 新华三大数据技术有限公司 | 序列标注模型训练方法、电子病历处理方法及相关装置 |
CN110688449A (zh) * | 2019-09-20 | 2020-01-14 | 京东数字科技控股有限公司 | 基于深度学习的地址文本处理方法、装置、设备及介质 |
WO2020215870A1 (zh) * | 2019-04-22 | 2020-10-29 | 京东方科技集团股份有限公司 | 命名实体识别方法及装置 |
-
2020
- 2020-11-30 CN CN202011373603.8A patent/CN112488194A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107656913A (zh) * | 2017-09-30 | 2018-02-02 | 百度在线网络技术(北京)有限公司 | 地图兴趣点地址提取方法、装置、服务器和存储介质 |
CN108920457A (zh) * | 2018-06-15 | 2018-11-30 | 腾讯大地通途(北京)科技有限公司 | 地址识别方法和装置及存储介质 |
CN109214553A (zh) * | 2018-08-09 | 2019-01-15 | 何晨亮 | 一种用于电子商务的物流运输方法及其系统 |
CN109242397A (zh) * | 2018-10-11 | 2019-01-18 | 苏州亮磊知识产权运营有限公司 | 一种基于信息共享的快递收件地址转移方法及其系统 |
WO2020215870A1 (zh) * | 2019-04-22 | 2020-10-29 | 京东方科技集团股份有限公司 | 命名实体识别方法及装置 |
CN110472229A (zh) * | 2019-07-11 | 2019-11-19 | 新华三大数据技术有限公司 | 序列标注模型训练方法、电子病历处理方法及相关装置 |
CN110688449A (zh) * | 2019-09-20 | 2020-01-14 | 京东数字科技控股有限公司 | 基于深度学习的地址文本处理方法、装置、设备及介质 |
Non-Patent Citations (1)
Title |
---|
程博等: "基于BiLSTM-CRF的中文层级地址分词", 《地球信息科学学报》, no. 08, 30 August 2019 (2019-08-30), pages 1143 - 1151 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115017899A (zh) * | 2022-04-19 | 2022-09-06 | 北京三快在线科技有限公司 | 一种缩略语生成方法、装置、设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111615702B (zh) | 一种从图像中提取结构化数据的方法、装置和设备 | |
US11032223B2 (en) | Filtering electronic messages | |
CN108305050B (zh) | 报案信息及服务需求信息的提取方法、装置、设备及介质 | |
CN106022349B (zh) | 用于设备类型确定的方法和系统 | |
CN112488103A (zh) | 地址信息抽取方法、模型训练方法及相关设备 | |
CN113157927A (zh) | 文本分类方法、装置、电子设备及可读存储介质 | |
CN106294676B (zh) | 一种电子商务政务系统的数据检索方法 | |
CN111967808B (zh) | 确定物流对象收货方式的方法、装置、电子设备及存储介质 | |
CN111210336A (zh) | 用户风险模型生成方法、装置及电子设备 | |
CN112488194A (zh) | 地址缩略语生成方法、模型训练方法及相关设备 | |
CN109544392B (zh) | 用于保险订单处理的方法、系统、设备以及介质 | |
CN112686587A (zh) | 一种支持修改收件信息的方法和装置 | |
CN112818666A (zh) | 地址识别方法、装置、电子设备和存储介质 | |
CN112465035A (zh) | 物流配送任务分配方法、系统、设备及存储介质 | |
CN115878888A (zh) | 一种基于模型隐式多目标融合的消息推送方法及装置 | |
CN114637850A (zh) | 异常行为识别及模型训练方法、装置、设备及存储介质 | |
CN113869317A (zh) | 车牌识别方法、装置、电子设备和存储介质 | |
CN113064564A (zh) | 物流面单打印方法、装置、设备及存储介质 | |
CN112488198A (zh) | 物流路由分发方法、装置、设备以及存储介质 | |
CN113850072A (zh) | 文本情感分析方法、情感分析模型训练方法、装置、设备及介质 | |
CN112488200A (zh) | 物流地址特征提取方法、系统、设备及存储介质 | |
CN113626605A (zh) | 信息分类方法、装置、电子设备及可读存储介质 | |
CN113590781A (zh) | 末端快递编码预测方法、系统、电子设备及可读存储介质 | |
CN112487120A (zh) | 收件地址归类方法、装置、设备以及存储介质 | |
CN112488624A (zh) | 物流路由信息计算方法、装置、设备以及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |