CN116993446A - 电子商务用物流配送管理系统及其方法 - Google Patents
电子商务用物流配送管理系统及其方法 Download PDFInfo
- Publication number
- CN116993446A CN116993446A CN202310993796.4A CN202310993796A CN116993446A CN 116993446 A CN116993446 A CN 116993446A CN 202310993796 A CN202310993796 A CN 202310993796A CN 116993446 A CN116993446 A CN 116993446A
- Authority
- CN
- China
- Prior art keywords
- word
- feature vector
- scale
- text
- vectors
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 238000000034 method Methods 0.000 title claims description 39
- 238000007726 management method Methods 0.000 claims abstract description 47
- 238000000638 solvent extraction Methods 0.000 claims abstract description 26
- 239000013598 vector Substances 0.000 claims description 311
- 238000013527 convolutional neural network Methods 0.000 claims description 33
- 238000012545 processing Methods 0.000 claims description 31
- 239000011159 matrix material Substances 0.000 claims description 25
- 230000011218 segmentation Effects 0.000 claims description 22
- 238000013528 artificial neural network Methods 0.000 claims description 19
- 230000008569 process Effects 0.000 claims description 19
- 238000000605 extraction Methods 0.000 claims description 8
- 230000004927 fusion Effects 0.000 claims description 7
- 238000005457 optimization Methods 0.000 claims description 7
- 238000012935 Averaging Methods 0.000 claims description 6
- 238000001994 activation Methods 0.000 claims description 6
- 238000010606 normalization Methods 0.000 claims description 6
- 238000012546 transfer Methods 0.000 claims description 6
- 238000010276 construction Methods 0.000 claims description 3
- 238000013507 mapping Methods 0.000 claims description 3
- 230000006870 function Effects 0.000 description 13
- 238000012015 optical character recognition Methods 0.000 description 13
- 230000008901 benefit Effects 0.000 description 12
- 238000010586 diagram Methods 0.000 description 12
- 230000000694 effects Effects 0.000 description 8
- 238000004590 computer program Methods 0.000 description 7
- 238000013473 artificial intelligence Methods 0.000 description 4
- 238000013135 deep learning Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 238000003062 neural network model Methods 0.000 description 4
- 238000011161 development Methods 0.000 description 3
- 230000018109 developmental process Effects 0.000 description 3
- 238000011176 pooling Methods 0.000 description 3
- 238000007792 addition Methods 0.000 description 2
- 230000004075 alteration Effects 0.000 description 2
- 238000013480 data collection Methods 0.000 description 2
- 238000000354 decomposition reaction Methods 0.000 description 2
- 238000003912 environmental pollution Methods 0.000 description 2
- 238000002372 labelling Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000007639 printing Methods 0.000 description 2
- 230000006798 recombination Effects 0.000 description 2
- 238000005215 recombination Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/08—Logistics, e.g. warehousing, loading or distribution; Inventory or stock management
- G06Q10/083—Shipping
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Economics (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Development Economics (AREA)
- Finance (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- General Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Accounting & Taxation (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- Quality & Reliability (AREA)
- Operations Research (AREA)
- Human Resources & Organizations (AREA)
- Entrepreneurship & Innovation (AREA)
- Character Discrimination (AREA)
Abstract
本申请涉及智能配送领域,其具体地公开了一种电子商务用物流配送管理系统及其方法,其采用基于深度神经网络模型的人工智能技术,获取货物快递单的电子扫描文档,通过包含嵌入层的上下文编码器进行多尺度特征提取并融合,以得到用于表示对货物的配送地址进行分区的分类结果。这样,构建电子商务用物流配送管理方案,可以实现对货物配送地址的自动分区,从而提高配送效率和准确性。
Description
技术领域
本申请涉及智能配送领域,且更为具体地,涉及一种电子商务用物流配送管理系统及其方法。
背景技术
随着经济的不断发展,人们生活水平的逐渐提高,电子商务已逐渐融入人们的工作和生活中,特别涉及到物流配送,其中,物流配送是电子商务的发展面临的一个重要问题。传统的物流配送是由人工进行分拣并分发到不同的配送地区,会导致分拣错误,时效性,正确率不高。
因此,期待一种优化的电子商务用物流配送管理方案。
发明内容
为了解决上述技术问题,提出了本申请。本申请的实施例提供了一种电子商务用物流配送管理系统及其方法,其采用基于深度神经网络模型的人工智能技术,获取货物快递单的电子扫描文档,通过包含嵌入层的上下文编码器进行多尺度特征提取并融合,以得到用于表示对货物的配送地址进行分区的分类结果。这样,构建电子商务用物流配送管理方案,可以实现对货物配送地址的自动分区,从而提高配送效率和准确性。
根据本申请的一个方面,提供了一种电子商务用物流配送管理系统,其包括:
电子文档提取模块,用于获取货物快递单的电子扫描文档;
文本识别模块,用于对所述电子扫描文档进行OCR文本识别以得到文本描述;
上下文编码模块,用于对所述文本描述进行分词处理后通过包含嵌入层的上下文编码器以得到多个词语义特征向量;
第一尺度语义关联编码模块,用于将所述多个词语义特征向量排列为一维特征向量后通过使用具有第一尺度的一维卷积核的第一文本卷积神经网络以得到第一尺度上下文特征向量;
第二尺度语义关联编码模块,用于将所述多个词语义特征向量排列为一维特征向量后通过使用具有第二尺度的一维卷积核的第二文本卷积神经网络以得到第二尺度上下文特征向量;
融合模块,用于融合所述第一尺度上下文特征向量和所述第二尺度上下文特征向量以得到分类特征向量;
优化模块,用于对分类特征向量进行期望鲁棒性迭代以得到优化分类特征向量;以及
地址分区模块,用于将所述优化分类特征向量通过分类器以得到分类结果,所述分类结果用于表示对货物的配送地址进行分区。
在上述电子商务用物流配送管理系统中,所述上下文编码模块,包括:分词单元,用于对所述文本描述进行分词处理以将所述文本描述转化为由多个词组成的词序列;词嵌入单元,用于使用所述包含嵌入层的上下文编码器的嵌入层将所述词序列中各个词映射到词向量以获得词向量的序列;以及,上下文理解单元,用于使用所述包含嵌入层的上下文编码器的转化器对所述词向量的序列进行基于全局的上下文语义编码以得到所述多个词语义特征向量。
在上述电子商务用物流配送管理系统中,所述上下文理解单元,包括:查询向量构造子单元,用于将所述词向量的序列进行一维排列以得到全局词特征向量;自注意子单元,用于计算所述全局词特征向量与所述词向量的序列中各个词向量的转置向量之间的乘积以得到多个自注意力关联矩阵;标准化子单元,用于分别对所述多个自注意力关联矩阵中各个自注意力关联矩阵进行标准化处理以得到多个标准化后自注意力关联矩阵;关注度计算子单元,用于将所述多个标准化后自注意力关联矩阵中各个标准化后自注意力关联矩阵通过Softmax分类函数以得到多个概率值;以及,注意力施加子单元,用于分别以所述多个概率值中各个概率值作为权重对所述词向量的序列中各个词向量进行加权以得到所述多个词语义特征向量。
在上述电子商务用物流配送管理系统中,所述第一尺度语义关联编码模块,用于:使用具有第一尺度的一维卷积核的第一文本卷积神经网络的各层在层的正向传递中分别对输入数据进行基于一维卷积核的卷积处理、基于特征矩阵的均值池化处理和激活处理以由所述使用具有第一尺度的一维卷积核的第一文本卷积神经网络的最后一层的输出为所述第一尺度上下文特征向量,其中,所述使用具有第一尺度的一维卷积核的第一文本卷积神经网络的第一层的输入为所述一维特征向量。
在上述电子商务用物流配送管理系统中,所述第二尺度语义关联编码模块,用于:使用具有第二尺度的一维卷积核的第二文本卷积神经网络的各层在层的正向传递中分别对输入数据进行基于一维卷积核的卷积处理、基于特征矩阵的均值池化处理和激活处理以由所述使用具有第二尺度的一维卷积核的第二文本卷积神经网络的最后一层的输出为所述第二尺度上下文特征向量,其中,所述使用具有第二尺度的一维卷积核的第二文本卷积神经网络的第一层的输入为所述一维特征向量。
在上述电子商务用物流配送管理系统中,所述地址分区模块,包括:全连接编码单元,用于使用所述分类器的全连接层对所述优化分类特征向量进行全连接编码以得到编码分类特征向量;以及,分类单元,用于将所述编码分类特征向量通过所述分类器的Softmax分类函数以得到所述分类结果。
根据本申请的另一方面,提供了一种电子商务用物流配送管理方法,其包括:
获取货物快递单的电子扫描文档;
对所述电子扫描文档进行OCR文本识别以得到文本描述;
对所述文本描述进行分词处理后通过包含嵌入层的上下文编码器以得到多个词语义特征向量;
将所述多个词语义特征向量排列为一维特征向量后通过使用具有第一尺度的一维卷积核的第一文本卷积神经网络以得到第一尺度上下文特征向量;
将所述多个词语义特征向量排列为一维特征向量后通过使用具有第二尺度的一维卷积核的第二文本卷积神经网络以得到第二尺度上下文特征向量;
融合所述第一尺度上下文特征向量和所述第二尺度上下文特征向量以得到分类特征向量;
对分类特征向量进行期望鲁棒性迭代以得到优化分类特征向量;以及
将所述优化分类特征向量通过分类器以得到分类结果,所述分类结果用于表示对货物的配送地址进行分区。
与现有技术相比,本申请提供的一种电子商务用物流配送管理系统及其方法,其采用基于深度神经网络模型的人工智能技术,获取货物快递单的电子扫描文档,通过包含嵌入层的上下文编码器进行多尺度特征提取并融合,以得到用于表示对货物的配送地址进行分区的分类结果。这样,构建电子商务用物流配送管理方案,可以实现对货物配送地址的自动分区,从而提高配送效率和准确性。
附图说明
通过结合附图对本申请实施例进行更详细的描述,本申请的上述以及其他目的、特征和优势将变得更加明显。附图用来提供对本申请实施例的进一步理解,并且构成说明书的一部分,与本申请实施例一起用于解释本申请,并不构成对本申请的限制。在附图中,相同的参考标号通常代表相同部件或步骤。
图1为根据本申请实施例的电子商务用物流配送管理系统的框图。
图2为根据本申请实施例的电子商务用物流配送管理系统的架构示意图。
图3为根据本申请实施例的电子商务用物流配送管理系统中上下文理解单元的框图。
图4为根据本申请实施例的电子商务用物流配送管理方法的流程图。
图5为根据本申请实施例的电子设备的框图。
具体实施方式
下面,将参考附图详细地描述根据本申请的示例实施例。显然,所描述的实施例仅仅是本申请的一部分实施例,而不是本申请的全部实施例,应理解,本申请不受这里描述的示例实施例的限制。
申请概述
如上所述,电商的不断兴起,导致物流行业也渐渐发展起来。特别涉及到物流配送,传统的物流配送都是由人工按照地址进行分区,会影响到分拣的准确性客户受到收到时效性。因此,期待一种优化的电子商务用物流配送管理方案。
针对上述技术问题,本申请的申请人其通过采用基于深度神经网络模型的人工智能技术,获取货物快递单的电子扫描文档,通过包含嵌入层的上下文编码器进行多尺度特征提取并融合,以得到用于表示对货物的配送地址进行分区的分类结果。
相应地,在本申请的技术方案中,考虑到相比纸质文档,电子文档可以大大降低印刷、邮寄、存储等成本,同时也减少了环境污染,可以进行备份、存档等操作,保证文档的安全可靠性,避免了纸质文档可能遭受的丢失、损坏等风险还可以进行分类、归档、检索等操作,方便管理和查找,提高了分拣工作效率。
近年来,深度学习以及神经网络已经广泛应用于计算机视觉、自然语言处理、文本信号处理等领域。此外,深度学习以及神经网络在图像分类、物体检测、语义分割、文本翻译等领域,也展现出了接近甚至超越人类的水平。
具体地,在本申请的技术方案中,首先,获取货物快递单的电子扫描文档。应可以理解,OCR(optical character recognition)文本识别是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,然后用字符识别方法将形状翻译成计算机文字的过程;即,对文本资料进行扫描,然后对图像文件进行分析处理,获取文字及版面信息的过程。因此,对所述电子扫描文档进行OCR文本识别以得到文本描述。
然后,又考虑到在对文本描述进行分词处理后,得到了一系列的词语。这些词语可以通过构建词袋模型等方式进行表示,但是这种表示方式忽略了词语之间的语义关系,不能很好地表达文本的含义。因此,需要通过上下文编码器得到每个词语的语义特征向量,以更好地表达文本的含义。上下文编码器是一种基于深度学习的模型,可以通过学习文本中的词语之间的上下文关系来得到每个词语的语义特征向量。具体来说,上下文编码器可以将每个词语表示为一个固定长度的向量,这个向量可以很好地表达该词语在文本中的语义含义。同时,由于上下文编码器考虑了词语之间的上下文关系,因此得到的语义特征向量可以更好地表达文本的含义,提高了文本处理的准确性和效果。
接着,考虑到由于所述文本描述是由多个词或词组组成的语句,因此各个词组成的词组以及各个词组组成的语句具有不同的语义理解特征,也就是说,在所述文本描述中各个词所组成的不同尺度的词组和语句具有不同的语义理解。在本技术方案中,将文本表示为词嵌入向量的形式,每个词对应一个固定长度的向量。当需要处理整个文本时,需要将各个词的词嵌入向量组合成一个文本的特征向量。这个特征向量可以通过将各个词的向量按照一定的顺序排列成一维向量来实现。在使用卷积神经网络(CNN)处理文本时,可以使用一维卷积核来提取文本的局部特征。一维卷积核在一维向量上进行滑动卷积操作,可以得到一系列的局部特征向量。通过对这些局部特征向量进行池化操作,可以得到整个文本的特征向量。因此,将各个词的词嵌入向量排列为一维向量后,可以使用一维卷积核来提取文本的局部特征,从而得到文本的特征向量。这样做的好处是可以在保留词序信息的同时,有效地提取文本的局部特征,从而更好地表示文本的语义信息。因此,将所述多个词语义特征向量排列为一维特征向量后通过使用具有第一尺度的一维卷积核的第一文本卷积神经网络以得到第一尺度上下文特征向量;将所述多个词语义特征向量排列为一维特征向量后通过使用具有第二尺度的一维卷积核的第二文本卷积神经网络以得到第二尺度上下文特征向量。
进一步地,融合所述第一尺度上下文特征向量和所述第二尺度上下文特征向量以得到分类特征向量。考虑到文本通常具有不同尺度的语义信息,例如单个词语的语义信息、短语的语义信息以及整个句子的语义信息。不同尺度的信息对于文本分类任务都有重要的贡献。因此,将不同尺度的语义信息进行融合可以更好地表示文本的语义信息,提高文本分类的准确性。具体地,在本技术方案中,使用了两个不同尺度的卷积神经网络来提取文本的不同尺度的语义信息。第一个卷积神经网络使用第一尺度的卷积核来提取文本的局部语义信息,第二个卷积神经网络使用第二尺度的卷积核来提取文本的整体语义信息。通过将这两个尺度的语义信息进行融合,可以更全面地表示文本的语义信息,提高文本分类的准确性。
特别地,在本申请的技术方案中,应可以理解,所述分类特征向量可能存在一些不确定性或噪声,例如,数据缺失、错误标注、异常值等,这些不确定性会影响模型的性能和泛化能力。具体地,在数据收集或处理过程中,可能会因为各种原因导致某些特征的数据缺失。这会导致分类特征向量中某些部分的信息不完整或丢失。数据标注是一个关键的过程,可能存在标注错误的情况。例如,在文本分类任务中,标签错误可能导致分类特征向量的错误。在数据中可能存在异常值或离群点,这些值可能与正常数据显著不同。这样的异常值可能对分类特征向量的准确性产生负面影响。噪声是指来自数据源或数据处理过程的随机或不相关的干扰。这些不确定性或噪声可能会影响分类特征向量的质量和准确性。
基于此,在本申请的技术方案中,对分类特征向量进行期望鲁棒性迭代以得到优化分类特征向量,具体地,包括:S1:将所述分类特征向量设置为初始特征向量;S2:计算所述初始特征向量的自相关协方差矩阵,其中,所述自相关协方差矩阵中非对角线位置上各个位置的值为所述初始特征向量中相应两个位置的特征值之间的方差;S3:将所述初始特征向量与所述自相关协方差矩阵进行矩阵相乘以得到更新特征向量;S4:计算所述更新特征向量与所述初始特征向量之间的欧式距离;S5:循环地执行步骤S1至步骤S4直至所述更新特征向量与所述初始特征向量之间的欧式距离小于等于预定阈值,并将所述更新特征向量定义为所述优化分类特征向量。
通过对所述分类特征向量进行期望鲁棒性迭代(Expected RobustnessIteration,ERI)可以将所述分类特征向量的不确定性用一个有界闭集来描述,并用一个期望函数值(所述更新特征向量与所述初始特征向量之间的欧式距离)来度量,以达到最优化期望函数的目的,通过这种方式,期望鲁棒性迭代可以逐步降低分类特征向量对不确定性的敏感度,并提高模型的稳定性和可靠性。这样,对分类特征向量进行期望鲁棒性迭代可以增强分类特征向量的抗干扰能力,使其能够在存在噪声、遮挡、变形等因素的情况下仍然保持较好的识别效果。
进一步地,将所述优化分类特征向量通过分类器以得到分类结果,所述分类结果用于表示对货物的配送地址进行分区。
基于此,本申请提供了一种电子商务用物流配送管理系统,其包括:电子文档提取模块,用于获取货物快递单的电子扫描文档;文本识别模块,用于对所述电子扫描文档进行OCR文本识别以得到文本描述;上下文编码模块,用于对所述文本描述进行分词处理后通过包含嵌入层的上下文编码器以得到多个词语义特征向量;第一尺度语义关联编码模块,用于将所述多个词语义特征向量排列为一维特征向量后通过使用具有第一尺度的一维卷积核的第一文本卷积神经网络以得到第一尺度上下文特征向量;第二尺度语义关联编码模块,用于将所述多个词语义特征向量排列为一维特征向量后通过使用具有第二尺度的一维卷积核的第二文本卷积神经网络以得到第二尺度上下文特征向量;融合模块,用于融合所述第一尺度上下文特征向量和所述第二尺度上下文特征向量以得到分类特征向量;优化模块,用于对分类特征向量进行期望鲁棒性迭代以得到优化分类特征向量;以及,地址分区模块,用于将所述优化分类特征向量通过分类器以得到分类结果,所述分类结果用于表示对货物的配送地址进行分区。
在介绍了本申请的基本原理之后,下面将参考附图来具体介绍本申请的各种非限制性实施例。
示例性系统
图1为根据本申请实施例的电子商务用物流配送管理系统的框图。如图1所示,根据本申请实施例的电子商务用物流配送管理系统100,包括:电子文档提取模块110,用于获取货物快递单的电子扫描文档;文本识别模块120,用于对所述电子扫描文档进行OCR文本识别以得到文本描述;上下文编码模块130,用于对所述文本描述进行分词处理后通过包含嵌入层的上下文编码器以得到多个词语义特征向量;第一尺度语义关联编码模块140,用于将所述多个词语义特征向量排列为一维特征向量后通过使用具有第一尺度的一维卷积核的第一文本卷积神经网络以得到第一尺度上下文特征向量;第二尺度语义关联编码模块150,用于将所述多个词语义特征向量排列为一维特征向量后通过使用具有第二尺度的一维卷积核的第二文本卷积神经网络以得到第二尺度上下文特征向量;融合模块160,用于融合所述第一尺度上下文特征向量和所述第二尺度上下文特征向量以得到分类特征向量;优化模块170,用于对分类特征向量进行期望鲁棒性迭代以得到优化分类特征向量;以及,地址分区模块180,用于将所述优化分类特征向量通过分类器以得到分类结果,所述分类结果用于表示对货物的配送地址进行分区。
图2为根据本申请实施例的电子商务用物流配送管理系统的架构示意图。如图2所示,首先,获取货物快递单的电子扫描文档。接着,对所述电子扫描文档进行OCR文本识别以得到文本描述。然后,对所述文本描述进行分词处理后通过包含嵌入层的上下文编码器以得到多个词语义特征向量。接着,将所述多个词语义特征向量排列为一维特征向量后通过使用具有第一尺度的一维卷积核的第一文本卷积神经网络以得到第一尺度上下文特征向量。同时,将所述多个词语义特征向量排列为一维特征向量后通过使用具有第二尺度的一维卷积核的第二文本卷积神经网络以得到第二尺度上下文特征向量。然后,融合所述第一尺度上下文特征向量和所述第二尺度上下文特征向量以得到分类特征向量。接着,对分类特征向量进行期望鲁棒性迭代以得到优化分类特征向量。最后,将所述优化分类特征向量通过分类器以得到分类结果,所述分类结果用于表示对货物的配送地址进行分区。
在本申请实施例中,所述电子文档提取模块110,用于获取货物快递单的电子扫描文档。考虑到相比纸质文档,电子文档可以大大降低印刷、邮寄、存储等成本,同时也减少了环境污染,可以进行备份、存档等操作,保证文档的安全可靠性,避免了纸质文档可能遭受的丢失、损坏等风险还可以进行分类、归档、检索等操作,方便管理和查找,提高了分拣工作效率。
在本申请实施例中,所述文本识别模块120,用于对所述电子扫描文档进行OCR文本识别以得到文本描述。应可以理解,OCR(optical character recognition)文本识别是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,然后用字符识别方法将形状翻译成计算机文字的过程;即,对文本资料进行扫描,然后对图像文件进行分析处理,获取文字及版面信息的过程。因此,对所述电子扫描文档进行OCR文本识别以得到文本描述。
在本申请实施例中,所述上下文编码模块130,用于对所述文本描述进行分词处理后通过包含嵌入层的上下文编码器以得到多个词语义特征向量。考虑到在对文本描述进行分词处理后,得到了一系列的词语。这些词语可以通过构建词袋模型等方式进行表示,但是这种表示方式忽略了词语之间的语义关系,不能很好地表达文本的含义。因此,需要通过上下文编码器得到每个词语的语义特征向量,以更好地表达文本的含义。上下文编码器是一种基于深度学习的模型,可以通过学习文本中的词语之间的上下文关系来得到每个词语的语义特征向量。具体来说,上下文编码器可以将每个词语表示为一个固定长度的向量,这个向量可以很好地表达该词语在文本中的语义含义。同时,由于上下文编码器考虑了词语之间的上下文关系,因此得到的语义特征向量可以更好地表达文本的含义,提高了文本处理的准确性和效果。
具体地,在本申请实施例中,所述上下文编码模块130,包括:分词单元131,用于对所述文本描述进行分词处理以将所述文本描述转化为由多个词组成的词序列;词嵌入单元132,用于使用所述包含嵌入层的上下文编码器的嵌入层将所述词序列中各个词映射到词向量以获得词向量的序列;以及,上下文理解单元133,用于使用所述包含嵌入层的上下文编码器的转化器对所述词向量的序列进行基于全局的上下文语义编码以得到所述多个词语义特征向量。
图3为根据本申请实施例的电子商务用物流配送管理系统中上下文理解单元的框图。具体地,在本申请实施例中,如图3所示,所述上下文理解单元133,包括:查询向量构造子单元1331,用于将所述词向量的序列进行一维排列以得到全局词特征向量;自注意子单元1332,用于计算所述全局词特征向量与所述词向量的序列中各个词向量的转置向量之间的乘积以得到多个自注意力关联矩阵;标准化子单元1333,用于分别对所述多个自注意力关联矩阵中各个自注意力关联矩阵进行标准化处理以得到多个标准化后自注意力关联矩阵;关注度计算子单元1334,用于将所述多个标准化后自注意力关联矩阵中各个标准化后自注意力关联矩阵通过Softmax分类函数以得到多个概率值;以及,注意力施加子单元1335,用于分别以所述多个概率值中各个概率值作为权重对所述词向量的序列中各个词向量进行加权以得到所述多个词语义特征向量。
在本申请实施例中,所述第一尺度语义关联编码模块140,用于将所述多个词语义特征向量排列为一维特征向量后通过使用具有第一尺度的一维卷积核的第一文本卷积神经网络以得到第一尺度上下文特征向量。考虑到由于所述文本描述是由多个词或词组组成的语句,因此各个词组成的词组以及各个词组组成的语句具有不同的语义理解特征,也就是说,在所述文本描述中各个词所组成的不同尺度的词组和语句具有不同的语义理解。在本技术方案中,将文本表示为词嵌入向量的形式,每个词对应一个固定长度的向量。当需要处理整个文本时,需要将各个词的词嵌入向量组合成一个文本的特征向量。这个特征向量可以通过将各个词的向量按照一定的顺序排列成一维向量来实现。在使用卷积神经网络(CNN)处理文本时,可以使用一维卷积核来提取文本的局部特征。一维卷积核在一维向量上进行滑动卷积操作,可以得到一系列的局部特征向量。通过对这些局部特征向量进行池化操作,可以得到整个文本的特征向量。因此,将各个词的词嵌入向量排列为一维向量后,可以使用一维卷积核来提取文本的局部特征,从而得到文本的特征向量。这样做的好处是可以在保留词序信息的同时,有效地提取文本的局部特征,从而更好地表示文本的语义信息。
具体地,在本申请实施例中,所述第一尺度语义关联编码模块,用于:使用具有第一尺度的一维卷积核的第一文本卷积神经网络的各层在层的正向传递中分别对输入数据进行基于一维卷积核的卷积处理、基于特征矩阵的均值池化处理和激活处理以由所述使用具有第一尺度的一维卷积核的第一文本卷积神经网络的最后一层的输出为所述第一尺度上下文特征向量,其中,所述使用具有第一尺度的一维卷积核的第一文本卷积神经网络的第一层的输入为所述一维特征向量。
在本申请实施例中,所述第二尺度语义关联编码模块150,用于将所述多个词语义特征向量排列为一维特征向量后通过使用具有第二尺度的一维卷积核的第二文本卷积神经网络以得到第二尺度上下文特征向量。考虑到由于所述文本描述是由多个词或词组组成的语句,因此各个词组成的词组以及各个词组组成的语句具有不同的语义理解特征,也就是说,在所述文本描述中各个词所组成的不同尺度的词组和语句具有不同的语义理解。在本技术方案中,将文本表示为词嵌入向量的形式,每个词对应一个固定长度的向量。当需要处理整个文本时,需要将各个词的词嵌入向量组合成一个文本的特征向量。这个特征向量可以通过将各个词的向量按照一定的顺序排列成一维向量来实现。在使用卷积神经网络(CNN)处理文本时,可以使用一维卷积核来提取文本的局部特征。一维卷积核在一维向量上进行滑动卷积操作,可以得到一系列的局部特征向量。通过对这些局部特征向量进行池化操作,可以得到整个文本的特征向量。因此,将各个词的词嵌入向量排列为一维向量后,可以使用一维卷积核来提取文本的局部特征,从而得到文本的特征向量。这样做的好处是可以在保留词序信息的同时,有效地提取文本的局部特征,从而更好地表示文本的语义信息。
具体地,在本申请实施例中,所述第二尺度语义关联编码模块,用于:使用具有第二尺度的一维卷积核的第二文本卷积神经网络的各层在层的正向传递中分别对输入数据进行基于一维卷积核的卷积处理、基于特征矩阵的均值池化处理和激活处理以由所述使用具有第二尺度的一维卷积核的第二文本卷积神经网络的最后一层的输出为所述第二尺度上下文特征向量,其中,所述使用具有第二尺度的一维卷积核的第二文本卷积神经网络的第一层的输入为所述一维特征向量。
在本申请实施例中,所述融合模块160,用于融合所述第一尺度上下文特征向量和所述第二尺度上下文特征向量以得到分类特征向量。考虑到文本通常具有不同尺度的语义信息,例如单个词语的语义信息、短语的语义信息以及整个句子的语义信息。不同尺度的信息对于文本分类任务都有重要的贡献。因此,将不同尺度的语义信息进行融合可以更好地表示文本的语义信息,提高文本分类的准确性。具体地,在本技术方案中,使用了两个不同尺度的卷积神经网络来提取文本的不同尺度的语义信息。第一个卷积神经网络使用第一尺度的卷积核来提取文本的局部语义信息,第二个卷积神经网络使用第二尺度的卷积核来提取文本的整体语义信息。通过将这两个尺度的语义信息进行融合,可以更全面地表示文本的语义信息,提高文本分类的准确性。
在本申请实施例中,优化模块170,用于对分类特征向量进行期望鲁棒性迭代以得到优化分类特征向量。
特别地,在本申请的技术方案中,应可以理解,所述分类特征向量可能存在一些不确定性或噪声,例如,数据缺失、错误标注、异常值等,这些不确定性会影响模型的性能和泛化能力。具体地,在数据收集或处理过程中,可能会因为各种原因导致某些特征的数据缺失。这会导致分类特征向量中某些部分的信息不完整或丢失。数据标注是一个关键的过程,可能存在标注错误的情况。例如,在文本分类任务中,标签错误可能导致分类特征向量的错误。在数据中可能存在异常值或离群点,这些值可能与正常数据显著不同。这样的异常值可能对分类特征向量的准确性产生负面影响。噪声是指来自数据源或数据处理过程的随机或不相关的干扰。这些不确定性或噪声可能会影响分类特征向量的质量和准确性。
具体地,在本申请实施例中,所述优化模块,包括:S1:将所述分类特征向量设置为初始特征向量;S2:计算所述初始特征向量的自相关协方差矩阵,其中,所述自相关协方差矩阵中非对角线位置上各个位置的值为所述初始特征向量中相应两个位置的特征值之间的方差;S3:将所述初始特征向量与所述自相关协方差矩阵进行矩阵相乘以得到更新特征向量;S4:计算所述更新特征向量与所述初始特征向量之间的欧式距离;S5:循环地执行步骤S1至步骤S4直至所述更新特征向量与所述初始特征向量之间的欧式距离小于等于预定阈值,并将所述更新特征向量定义为所述优化分类特征向量。
通过对所述分类特征向量进行期望鲁棒性迭代(Expected RobustnessIteration,ERI)可以将所述分类特征向量的不确定性用一个有界闭集来描述,并用一个期望函数值(所述更新特征向量与所述初始特征向量之间的欧式距离)来度量,以达到最优化期望函数的目的,通过这种方式,期望鲁棒性迭代可以逐步降低分类特征向量对不确定性的敏感度,并提高模型的稳定性和可靠性。这样,对分类特征向量进行期望鲁棒性迭代可以增强分类特征向量的抗干扰能力,使其能够在存在噪声、遮挡、变形等因素的情况下仍然保持较好的识别效果。
在本申请实施例中,所述地址分区模块180,用于将所述优化分类特征向量通过分类器以得到分类结果,所述分类结果用于表示对货物的配送地址进行分区。
具体地,在本申请实施例中,所述地址分区模块,包括:全连接编码单元,用于使用所述分类器的全连接层对所述优化分类特征向量进行全连接编码以得到编码分类特征向量;以及,分类单元,用于将所述编码分类特征向量通过所述分类器的Softmax分类函数以得到所述分类结果。
综上,基于本申请实施例的电子商务用物流配送管理系统100被阐明,其通过采用基于深度神经网络模型的人工智能技术,获取货物快递单的电子扫描文档,通过包含嵌入层的上下文编码器进行多尺度特征提取并融合,以得到用于表示对货物的配送地址进行分区的分类结果。这样,构建电子商务用物流配送管理方案,实现对货物配送地址的自动分区,从而提高配送效率和准确性。
示例性方法
图4为根据本申请实施例的电子商务用物流配送管理方法的流程图。如图4所示,根据本申请实施例的电子商务用物流配送管理方法,包括:S110,获取货物快递单的电子扫描文档;S120,对所述电子扫描文档进行OCR文本识别以得到文本描述;S130,对所述文本描述进行分词处理后通过包含嵌入层的上下文编码器以得到多个词语义特征向量;S140,将所述多个词语义特征向量排列为一维特征向量后通过使用具有第一尺度的一维卷积核的第一文本卷积神经网络以得到第一尺度上下文特征向量;S150,将所述多个词语义特征向量排列为一维特征向量后通过使用具有第二尺度的一维卷积核的第二文本卷积神经网络以得到第二尺度上下文特征向量;S160,融合所述第一尺度上下文特征向量和所述第二尺度上下文特征向量以得到分类特征向量;S170,对分类特征向量进行期望鲁棒性迭代以得到优化分类特征向量;以及,S180,将所述优化分类特征向量通过分类器以得到分类结果,所述分类结果用于表示对货物的配送地址进行分区。
在一个示例中,在上述电子商务用物流配送管理方法中,对所述文本描述进行分词处理后通过包含嵌入层的上下文编码器以得到多个词语义特征向量,包括:对所述文本描述进行分词处理以将所述文本描述转化为由多个词组成的词序列;使用所述包含嵌入层的上下文编码器的嵌入层将所述词序列中各个词映射到词向量以获得词向量的序列;以及,使用所述包含嵌入层的上下文编码器的转化器对所述词向量的序列进行基于全局的上下文语义编码以得到所述多个词语义特征向量。
这里,本领域技术人员可以理解,上述电子商务用物流配送管理方法中的各个步骤的具体操作已经在上面参考图1到图3的电子商务用物流配送管理系统的描述中得到了详细介绍,并因此,将省略其重复描述。
示例性电子设备
下面,参考图5来描述根据本申请实施例的电子设备。图5为根据本申请实施例的电子设备的框图。如图5所示,电子设备10包括一个或多个处理器11和存储器12。
处理器11可以是中央处理模块(CPU)或者具有数据处理能力和/或指令执行能力的其他形式的处理模块,并且可以控制电子设备10中的其他组件以执行期望的功能。
存储器12可以包括一个或多个计算机程序产品,所述计算机程序产品可以包括各种形式的计算机可读存储介质,例如易失性存储器和/或非易失性存储器。所述易失性存储器例如可以包括随机存取存储器(RAM)和/或高速缓冲存储器(cache)等。所述非易失性存储器例如可以包括只读存储器(ROM)、硬盘、闪存等。在所述计算机可读存储介质上可以存储一个或多个计算机程序指令,处理器11可以运行所述程序指令,以实现上文所述的本申请的各个实施例的电子商务用物流配送管理系统及其方法中的功能以及/或者其他期望的功能。在所述计算机可读存储介质中还可以存储诸如获取货物快递单的电子扫描文档等各种内容。
在一个示例中,电子设备10还可以包括:输入装置13和输出装置14,这些组件通过总线系统和/或其他形式的连接机构(未示出)互连。
该输入装置13可以包括例如键盘、鼠标等等。
该输出装置14可以向外部输出各种信息,包括分类结果等。该输出装置14可以包括例如显示器、扬声器、打印机、以及通信网络及其所连接的远程输出设备等等。
当然,为了简化,图5中仅示出了该电子设备10中与本申请有关的组件中的一些,省略了诸如总线、输入/输出接口等等的组件。除此之外,根据具体应用情况,电子设备10还可以包括任何其他适当的组件。
示例性计算机程序产品和计算机可读存储介质
除了上述方法和设备以外,本申请的实施例还可以是计算机程序产品,其包括计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行本说明书上述“示例性方法”部分中描述的根据本申请各种实施例的电子商务用物流配送管理方法中的功能中的步骤。
所述计算机程序产品可以以一种或多种程序设计语言的任意组合来编写用于执行本申请实施例操作的程序代码,所述程序设计语言包括面向对象的程序设计语言,诸如Java、C++等,还包括常规的过程式程序设计语言,诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。
此外,本申请的实施例还可以是计算机可读存储介质,其上存储有计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行本说明书上述“示例性方法”部分中描述的根据本申请各种实施例的电子商务用物流配送管理方法中的功能中的步骤。
所述计算机可读存储介质可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以包括但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
以上结合具体实施例描述了本申请的基本原理,但是,需要指出的是,在本申请中提及的优点、优势、效果等仅是示例而非限制,不能认为这些优点、优势、效果等是本申请的各个实施例必须具备的。另外,上述公开的具体细节仅是为了示例的作用和便于理解的作用,而非限制,上述细节并不限制本申请为必须采用上述具体的细节来实现。
本申请中涉及的器件、装置、设备、系统的方框图仅作为例示性的例子并且不意图要求或暗示必须按照方框图示出的方式进行连接、布置、配置。如本领域技术人员将认识到的,可以按任意方式连接、布置、配置这些器件、装置、设备、系统。诸如“包括”、“包含”、“具有”等等的词语是开放性词汇,指“包括但不限于”,且可与其互换使用。这里所使用的词汇“或”和“和”指词汇“和/或”,且可与其互换使用,除非上下文明确指示不是如此。这里所使用的词汇“诸如”指词组“诸如但不限于”,且可与其互换使用。
还需要指出的是,在本申请的装置、设备和方法中,各部件或各步骤是可以分解和/或重新组合的。这些分解和/或重新组合应视为本申请的等效方案。
提供所公开的方面的以上描述以使本领域的任何技术人员能够做出或者使用本申请。对这些方面的各种修改对于本领域技术人员而言是非常显而易见的,并且在此定义的一般原理可以应用于其他方面而不脱离本申请的范围。因此,本申请不意图被限制到在此示出的方面,而是按照与在此公开的原理和新颖的特征一致的最宽范围。
为了例示和描述的目的已经给出了以上描述。此外,此描述不意图将本申请的实施例限制到在此公开的形式。尽管以上已经讨论了多个示例方面和实施例,但是本领域技术人员将认识到其某些变型、修改、改变、添加和子组合。
以上结合具体实施例描述了本申请的基本原理,但是,需要指出的是,在本申请中提及的优点、优势、效果等仅是示例而非限制,不能认为这些优点、优势、效果等是本申请的各个实施例必须具备的。另外,上述公开的具体细节仅是为了示例的作用和便于理解的作用,而非限制,上述细节并不限制本申请为必须采用上述具体的细节来实现。
本申请中涉及的器件、装置、设备、系统的方框图仅作为例示性的例子并且不意图要求或暗示必须按照方框图示出的方式进行连接、布置、配置。如本领域技术人员将认识到的,可以按任意方式连接、布置、配置这些器件、装置、设备、系统。诸如“包括”、“包含”、“具有”等等的词语是开放性词汇,指“包括但不限于”,且可与其互换使用。这里所使用的词汇“或”和“和”指词汇“和/或”,且可与其互换使用,除非上下文明确指示不是如此。这里所使用的词汇“诸如”指词组“诸如但不限于”,且可与其互换使用。
还需要指出的是,在本申请的装置、设备和方法中,各部件或各步骤是可以分解和/或重新组合的。这些分解和/或重新组合应视为本申请的等效方案。
提供所公开的方面的以上描述以使本领域的任何技术人员能够做出或者使用本申请。对这些方面的各种修改对于本领域技术人员而言是非常显而易见的,并且在此定义的一般原理可以应用于其他方面而不脱离本申请的范围。因此,本申请不意图被限制到在此示出的方面,而是按照与在此公开的原理和新颖的特征一致的最宽范围。
为了例示和描述的目的已经给出了以上描述。此外,此描述不意图将本申请的实施例限制到在此公开的形式。尽管以上已经讨论了多个示例方面和实施例,但是本领域技术人员将认识到其某些变型、修改、改变、添加和子组合。
Claims (10)
1.一种电子商务用物流配送管理系统,其特征在于,包括:
电子文档提取模块,用于获取货物快递单的电子扫描文档;
文本识别模块,用于对所述电子扫描文档进行OCR文本识别以得到文本描述;
上下文编码模块,用于对所述文本描述进行分词处理后通过包含嵌入层的上下文编码器以得到多个词语义特征向量;
第一尺度语义关联编码模块,用于将所述多个词语义特征向量排列为一维特征向量后通过使用具有第一尺度的一维卷积核的第一文本卷积神经网络以得到第一尺度上下文特征向量;
第二尺度语义关联编码模块,用于将所述多个词语义特征向量排列为一维特征向量后通过使用具有第二尺度的一维卷积核的第二文本卷积神经网络以得到第二尺度上下文特征向量;
融合模块,用于融合所述第一尺度上下文特征向量和所述第二尺度上下文特征向量以得到分类特征向量;
优化模块,用于对分类特征向量进行期望鲁棒性迭代以得到优化分类特征向量;以及
地址分区模块,用于将所述优化分类特征向量通过分类器以得到分类结果,所述分类结果用于表示对货物的配送地址进行分区。
2.根据权利要求1所述的电子商务用物流配送管理系统,其特征在于,所述上下文编码模块,包括:
分词单元,用于对所述文本描述进行分词处理以将所述文本描述转化为由多个词组成的词序列;
词嵌入单元,用于使用所述包含嵌入层的上下文编码器的嵌入层将所述词序列中各个词映射到词向量以获得词向量的序列;以及
上下文理解单元,用于使用所述包含嵌入层的上下文编码器的转化器对所述词向量的序列进行基于全局的上下文语义编码以得到所述多个词语义特征向量。
3.根据权利要求2所述的电子商务用物流配送管理系统,其特征在于,所述上下文理解单元,包括:
查询向量构造子单元,用于将所述词向量的序列进行一维排列以得到全局词特征向量;
自注意子单元,用于计算所述全局词特征向量与所述词向量的序列中各个词向量的转置向量之间的乘积以得到多个自注意力关联矩阵;
标准化子单元,用于分别对所述多个自注意力关联矩阵中各个自注意力关联矩阵进行标准化处理以得到多个标准化后自注意力关联矩阵;
关注度计算子单元,用于将所述多个标准化后自注意力关联矩阵中各个标准化后自注意力关联矩阵通过Softmax分类函数以得到多个概率值;以及
注意力施加子单元,用于分别以所述多个概率值中各个概率值作为权重对所述词向量的序列中各个词向量进行加权以得到所述多个词语义特征向量。
4.根据权利要求3所述的电子商务用物流配送管理系统,其特征在于,所述第一尺度语义关联编码模块,用于:使用具有第一尺度的一维卷积核的第一文本卷积神经网络的各层在层的正向传递中分别对输入数据进行基于一维卷积核的卷积处理、基于特征矩阵的均值池化处理和激活处理以由所述使用具有第一尺度的一维卷积核的第一文本卷积神经网络的最后一层的输出为所述第一尺度上下文特征向量,其中,所述使用具有第一尺度的一维卷积核的第一文本卷积神经网络的第一层的输入为所述一维特征向量。
5.根据权利要求4所述的电子商务用物流配送管理系统,其特征在于,所述第二尺度语义关联编码模块,用于:使用具有第二尺度的一维卷积核的第二文本卷积神经网络的各层在层的正向传递中分别对输入数据进行基于一维卷积核的卷积处理、基于特征矩阵的均值池化处理和激活处理以由所述使用具有第二尺度的一维卷积核的第二文本卷积神经网络的最后一层的输出为所述第二尺度上下文特征向量,其中,所述使用具有第二尺度的一维卷积核的第二文本卷积神经网络的第一层的输入为所述一维特征向量。
6.根据权利要求5所述的电子商务用物流配送管理系统,其特征在于,所述优化模块,用于:
S1:将所述分类特征向量设置为初始特征向量;
S2:计算所述初始特征向量的自相关协方差矩阵,其中,所述自相关协方差矩阵中非对角线位置上各个位置的值为所述初始特征向量中相应两个位置的特征值之间的方差;
S3:将所述初始特征向量与所述自相关协方差矩阵进行矩阵相乘以得到更新特征向量;
S4:计算所述更新特征向量与所述初始特征向量之间的欧式距离;
S5:循环地执行步骤S1至步骤S4直至所述更新特征向量与所述初始特征向量之间的欧式距离小于等于预定阈值,并将所述更新特征向量定义为所述优化分类特征向量。
7.根据权利要求6所述的电子商务用物流配送管理系统,其特征在于,所述地址分区模块,包括:
全连接编码单元,用于使用所述分类器的全连接层对所述优化分类特征向量进行全连接编码以得到编码分类特征向量;以及
分类单元,用于将所述编码分类特征向量通过所述分类器的Softmax分类函数以得到所述分类结果。
8.一种电子商务用物流配送管理方法,其特征在于,包括:
获取货物快递单的电子扫描文档;
对所述电子扫描文档进行OCR文本识别以得到文本描述;
对所述文本描述进行分词处理后通过包含嵌入层的上下文编码器以得到多个词语义特征向量;
将所述多个词语义特征向量排列为一维特征向量后通过使用具有第一尺度的一维卷积核的第一文本卷积神经网络以得到第一尺度上下文特征向量;
将所述多个词语义特征向量排列为一维特征向量后通过使用具有第二尺度的一维卷积核的第二文本卷积神经网络以得到第二尺度上下文特征向量;
融合所述第一尺度上下文特征向量和所述第二尺度上下文特征向量以得到分类特征向量;
对分类特征向量进行期望鲁棒性迭代以得到优化分类特征向量;以及
将所述优化分类特征向量通过分类器以得到分类结果,所述分类结果用于表示对货物的配送地址进行分区。
9.根据权利要求8所述的电子商务用物流配送管理方法,其特征在于,对所述文本描述进行分词处理后通过包含嵌入层的上下文编码器以得到多个词语义特征向量,包括:
对所述文本描述进行分词处理以将所述文本描述转化为由多个词组成的词序列;
使用所述包含嵌入层的上下文编码器的嵌入层将所述词序列中各个词映射到词向量以获得词向量的序列;以及
使用所述包含嵌入层的上下文编码器的转化器对所述词向量的序列进行基于全局的上下文语义编码以得到所述多个词语义特征向量。
10.根据权利要求9所述的电子商务用物流配送管理方法,其特征在于,使用所述包含嵌入层的上下文编码器的转化器对所述词向量的序列进行基于全局的上下文语义编码以得到所述多个词语义特征向量,包括:
将所述词向量的序列进行一维排列以得到全局词特征向量;
计算所述全局词特征向量与所述词向量的序列中各个词向量的转置向量之间的乘积以得到多个自注意力关联矩阵;
分别对所述多个自注意力关联矩阵中各个自注意力关联矩阵进行标准化处理以得到多个标准化后自注意力关联矩阵;
将所述多个标准化后自注意力关联矩阵中各个标准化后自注意力关联矩阵通过Softmax分类函数以得到多个概率值;以及
分别以所述多个概率值中各个概率值作为权重对所述词向量的序列中各个词向量进行加权以得到所述多个词语义特征向量。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310993796.4A CN116993446A (zh) | 2023-08-07 | 2023-08-07 | 电子商务用物流配送管理系统及其方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310993796.4A CN116993446A (zh) | 2023-08-07 | 2023-08-07 | 电子商务用物流配送管理系统及其方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116993446A true CN116993446A (zh) | 2023-11-03 |
Family
ID=88529917
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310993796.4A Withdrawn CN116993446A (zh) | 2023-08-07 | 2023-08-07 | 电子商务用物流配送管理系统及其方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116993446A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117116498A (zh) * | 2023-10-23 | 2023-11-24 | 吉林大学 | 移动查房数据处理系统及其方法 |
-
2023
- 2023-08-07 CN CN202310993796.4A patent/CN116993446A/zh not_active Withdrawn
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117116498A (zh) * | 2023-10-23 | 2023-11-24 | 吉林大学 | 移动查房数据处理系统及其方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN115203380B (zh) | 基于多模态数据融合的文本处理系统及其方法 | |
JP6629942B2 (ja) | 機械学習およびファジーマッチングを使用した階層型の自動的な文書の分類およびメタデータ識別 | |
CN108959482B (zh) | 基于深度学习的单轮对话数据分类方法、装置和电子设备 | |
EP2812883B1 (en) | System and method for semantically annotating images | |
US8126274B2 (en) | Visual language modeling for image classification | |
CA2654893C (en) | Two tiered text recognition | |
US20220156300A1 (en) | Deep document processing with self-supervised learning | |
US10956673B1 (en) | Method and system for identifying citations within regulatory content | |
Hazra et al. | Optical character recognition using KNN on custom image dataset | |
CN115860271B (zh) | 艺术设计用方案管理系统及其方法 | |
CN110377733B (zh) | 一种基于文本的情绪识别方法、终端设备及介质 | |
CN116308754B (zh) | 一种银行信贷风险预警系统及其方法 | |
CN116245513B (zh) | 基于规则库的自动化运维系统及其方法 | |
CN116089648B (zh) | 基于人工智能的档案管理系统及方法 | |
CN113486178B (zh) | 文本识别模型训练方法、文本识别方法、装置以及介质 | |
CN116257406A (zh) | 用于智慧城市的网关数据管理方法及其系统 | |
CN112163114B (zh) | 一种基于特征融合的图像检索方法 | |
CN116993446A (zh) | 电子商务用物流配送管理系统及其方法 | |
CN116343301B (zh) | 基于人脸识别的人员信息智能校验系统 | |
Roy et al. | Word searching in scene image and video frame in multi-script scenario using dynamic shape coding | |
CN112926700B (zh) | 针对目标图像的类别识别方法和装置 | |
CN114913487A (zh) | 一种基于多模态学习的目标识别检测方法及相关组件 | |
Sharma et al. | [Retracted] Optimized CNN‐Based Recognition of District Names of Punjab State in Gurmukhi Script | |
Sheng et al. | End-to-end chinese image text recognition with attention model | |
Khan et al. | Urdu optical character recognition technique for Jameel Noori Nastaleeq script |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
WW01 | Invention patent application withdrawn after publication |
Application publication date: 20231103 |
|
WW01 | Invention patent application withdrawn after publication |