CN115277626A

CN115277626A - 地址信息转换方法、电子设备和计算机可读存储介质

Info

Publication number: CN115277626A
Application number: CN202210908906.8A
Authority: CN
Inventors: 李志韬; 王健宗
Original assignee: Ping An Technology Shenzhen Co Ltd
Current assignee: Ping An Technology Shenzhen Co Ltd
Priority date: 2022-07-29
Filing date: 2022-07-29
Publication date: 2022-11-01
Anticipated expiration: 2042-07-29
Also published as: CN115277626B

Abstract

本发明涉及人工智能技术领域，尤其是涉及一种地址信息转换方法、电子设备和计算机可读存储介质。本发明实施例的地址信息转换方法中，先获取目标地址信息，并将目标地址信息输入Seq2Seq语义识别模型。进一步，经由Seq2Seq语义识别模型对目标地址信息进行语义特征提取，得到与目标地址信息对应的地址信息特征，再通过Seq2Seq语义识别模型对地址信息特征进行识别，得到与目标地址信息对应的目的经纬坐标。本发明实施例的地址信息转换方法基于Seq2Seq语义识别模型来将目标地址信息转换为目的经纬坐标，无需依靠网络进行线上查询，能够实现在离线状态下将地址信息转换成对应的经纬坐标。

Description

地址信息转换方法、电子设备和计算机可读存储介质

技术领域

本发明涉及人工智能技术领域，尤其是涉及一种地址信息转换方法、电子设备和计算机可读存储介质。

背景技术

随着科技的发展，诸多与将场所地址与人工智能服务对应起来的场合下，都需要将地址信息转换为经纬度，从而将文本语义转化为定位所需要的信息。相关技术中，地址信息转换成经纬度一般需要，先识别地址信息的文本语义，然后根据省市区县等行政划分，将地址信息映射到经纬坐标网络中，并与地址数据库中已知的地址进行校验从而实现。然而，上述方法往往需要在线上访问地址数据库，或者在本机构建极其庞大的地址数据库，以至于使得离线情况下难以将地址信息转换成相对应的经纬度。因此，如何在离线状态下实现将地址信息转换成对应的经纬坐标，成为业内人士亟待解决的问题。

发明内容

本发明旨在至少解决现有技术中存在的技术问题之一。为此，本发明提出一种地址信息转换方法、电子设备和计算机可读存储介质，能够实现在离线状态下将地址信息转换成对应的经纬坐标。

根据本发明的第一方面实施例的地址信息转换方法，包括：

获取目标地址信息，并将所述目标地址信息输入Seq2Seq语义识别模型，其中，所述Seq2Seq语义识别模型由基础识别模型通过训练地址信息和与所述训练地址信息相对应的训练经纬坐标训练得到；

经由所述Seq2Seq语义识别模型对所述目标地址信息进行语义特征提取，得到与所述目标地址信息对应的地址信息特征；

通过所述Seq2Seq语义识别模型对所述地址信息特征进行识别，得到与所述目标地址信息对应的目的经纬坐标。

根据本发明的一些实施例，所述获取目标地址信息，并将所述目标地址信息输入Seq2Seq语义识别模型之前，还包括：

获取训练数据集，所述训练数据集包括目标地域范围中的各个所述训练地址信息、与各个所述训练地址信息相对应的各个所述训练经纬坐标，所述目标地域范围包括所述目标地址信息所指向的目标场所；

基于所述训练数据集对所述基础识别模型进行优化训练，得到所述Seq2Seq语义识别模型。

根据本发明的一些实施例，所述基于所述训练数据集对所述基础识别模型进行优化训练，得到所述Seq2Seq语义识别模型，包括：

基于所述训练数据集对所述基础识别模型进行迭代训练，每一轮所述迭代训练中，将所述各个训练地址信息输入所述基础识别模型进行本轮训练处理，获取与所述各个训练地址信息对应的各个本轮识别坐标；

每一轮所述迭代训练后，将所述各个本轮识别坐标与所述各个训练经纬坐标进行比对，计算所述基础识别模型的识别准确率并对所述基础识别模型的参数进行更新；

统计所述识别准确率在每一轮所述迭代训练后的变化情况，当所述识别准确率收敛于第一定值，得到训练好的所述Seq2Seq语义识别模型。

根据本发明的一些实施例，所述基于所述训练数据集对所述基础识别模型进行迭代训练，每一轮所述迭代训练中，将所述各个训练地址信息输入所述基础识别模型进行本轮训练处理，获取与所述各个训练地址信息对应的各个本轮识别坐标，包括：

每一轮所述迭代训练中，随机开启一批所述基础识别模型中的语义识别神经元；

基于随机开启的所述语义识别神经元，对所述各个训练地址信息进行所述本轮训练处理，获取所述各个本轮识别坐标。

根据本发明的一些实施例，所述每一轮所述迭代训练后，将所述各个本轮识别坐标与所述各个训练经纬坐标进行比对，计算所述基础识别模型的识别准确率并对所述基础识别模型的参数进行更新，包括：

根据所述各个本轮识别坐标与对应的所述训练经纬坐标，得到各个坐标间隔误差；

获取所述坐标间隔误差小于预设误差阈值的精确结果数量；

根据所述精确结果数量、所述本轮识别坐标总数量，计算所述识别准确率。

根据本发明的一些实施例，所述各个训练地址信息包括准确场所地址、噪声场所地址，所述获取训练数据集，还包括：

从所述各个训练地址信息中获取所述准确场所地址、与所述准确场所地址对应的所述噪声场所地址；

以所述准确场所地址作为正样本数据、以所述噪声场所地址作为负样本数据，将所述正样本数据与所述负样本数据混合形成所述各个训练地址信息。

根据本发明的一些实施例，所述从所述各个训练地址信息中获取所述准确场所地址、与所述准确场所地址对应的所述噪声场所地址，包括：

从所述各个训练地址信息中获取所述准确场所地址，并从所述各个训练地址信息中得到与所述准确场所地址相匹配的误差地址文集；

根据所述误差地址文集，获取所述噪声场所地址。

根据本发明的一些实施例，所述以所述准确场所地址作为正样本数据、以所述噪声场所地址作为负样本数据，将所述正样本数据与所述负样本数据混合形成所述各个训练地址信息，包括：

将所述正样本数据、所述负样本数据进行混合，得到混合数据；

调整所述正样本数据和所述负样本数据在所述混合数据中的占比；

当所述正样本数据在所述混合数据中的占比大于所述负样本数据在所述混合数据中的占比，将调整后的所述混合数据作为所述各个训练地址信息。

第二方面，本发明实施例提供了一种电子设备，包括：存储器、处理器，所述存储器存储有计算机程序，所述处理器执行所述计算机程序时实现如本发明第一方面实施例中任意一项所述的地址信息转换方法。

第三方面，本发明实施例提供了一种计算机可读存储介质，所述存储介质存储有程序，所述程序被处理器执行实现如本发明第一方面实施例中任意一项所述的地址信息转换方法。

根据本发明实施例的地址信息转换方法、电子设备和计算机可读存储介质，至少具有如下有益效果:

本发明实施例的地址信息转换方法中，先获取目标地址信息，并将目标地址信息输入Seq2Seq语义识别模型，其中，Seq2Seq语义识别模型由基础识别模型通过训练地址信息和与训练地址信息相对应的训练经纬坐标训练得到。进一步，经由Seq2Seq语义识别模型对目标地址信息进行语义特征提取，得到与目标地址信息对应的地址信息特征，再通过Seq2Seq语义识别模型对地址信息特征进行识别，得到与目标地址信息对应的目的经纬坐标。本发明实施例的地址信息转换方法基于Seq2Seq语义识别模型来将目标地址信息转换为目的经纬坐标，无需依靠网络进行线上查询，能够实现在离线状态下将地址信息转换成对应的经纬坐标。

本发明的附加方面和优点将在下面的描述中部分给出，部分将从下面的描述中变得明显，或通过本发明的实践了解到。

附图说明

本发明的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解，其中：

图1为本发明实施例提供的地址信息转换方法流程示意图；

图2为本发明实施例提供的另一地址信息转换方法流程示意图；

图3为本发明实施例提供的另一地址信息转换方法流程示意图；

图4为本发明实施例提供的另一地址信息转换方法流程示意图；

图5为本发明实施例提供的另一地址信息转换方法流程示意图；

图6为本发明实施例提供的训练数据集示意表；

图7为本发明实施例提供的另一地址信息转换方法流程示意图；

图8为本发明实施例提供的另一地址信息转换方法流程示意图；

图9为本发明实施例提供的另一地址信息转换方法流程示意图；

图10为本发明实施例提供的另一地址信息转换方法流程示意图；

图11为执行本发明实施例提供的地址信息转换方法的电子设备示意图。

具体实施方式

下面详细描述本发明的实施例，实施例的示例在附图中示出，其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的，仅用于解释本发明，而不能理解为对本发明的限制。

在本发明的描述中，若干的含义是一个或者多个，多个的含义是两个以上，大于、小于、超过等理解为不包括本数，以上、以下、以内等理解为包括本数。如果有描述到第一、第二只是用于区分技术特征为目的，而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量或者隐含指明所指示的技术特征的先后关系。

在本发明的描述中，需要理解的是，涉及到方位描述，例如上、下、左、右、前、后等指示的方位或位置关系为基于附图所示的方位或位置关系，仅是为了便于描述本发明和简化描述，而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作，因此不能理解为对本发明的限制。

在本说明书的描述中，参考术语“一个实施例”、“一些实施例”、“示意性实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中，对上述术语的示意性表述不一定指的是相同的实施例或示例。而且，描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。

本发明的描述中，需要说明的是，除非另有明确的限定，设置、安装、连接等词语应做广义理解，所属技术领域技术人员可以结合技术方案的具体内容合理确定上述词语在本发明中的具体含义。另外，下文中对于具体步骤的标识并不代表对于步骤顺序与执行逻辑的限定，各个步骤之间的执行顺序与执行逻辑应参照实施例所表述的内容进行理解与推定。

参照图1，根据本发明的第一方面实施例的地址信息转换方法，包括：

步骤S101，获取目标地址信息，并将目标地址信息输入Seq2Seq语义识别模型，其中，Seq2Seq语义识别模型由基础识别模型通过训练地址信息和与训练地址信息相对应的训练经纬坐标训练得到；

需要说明的是，Seq2Seq语义识别模型是一种循环神经网络的变种，包括编码器(Encoder)和解码器(Decoder)两部分。Seq2Seq模型是自然语言处理中的一种重要模型，可以用于机器翻译、对话系统、自动文摘。本发明一些实施例中的Seq2Seq语义识别模型由基础识别模型通过训练地址信息和与训练地址信息相对应的训练经纬坐标训练得到。应理解，通过训练地址信息和训练经纬坐标对基础识别模型进行训练的目的在于，提升基础识别模型在获取地址信息的情况下，将地址信息转换成对应的经纬坐标的能力。当基础识别模型将地址信息转换成对应的经纬坐标的准确率高到预设标准，则说明通过基础识别模型将地址信息转换成对应的经纬坐标的能力达到可以实际应用的水平，故而可以将达到实际应用水平的基础识别模型，作为本发明实施例中用于转换目标地址信息的Seq2Seq语义识别模型。应理解，目标地址信息指的是需要进行转换的地址信息，而训练地址信息和与训练地址信息相对应的训练经纬坐标则是在训练得到Seq2Seq语义识别模型的过程中需要用到的训练数据。

步骤S102，经由Seq2Seq语义识别模型对目标地址信息进行语义特征提取，得到与目标地址信息对应的地址信息特征；

根据本发明提供的一些实施例，在Seq2Seq语义识别模型获取目标地址信息之后，经由Seq2Seq语义识别模型中的编码器对目标地址信息进行语义特征提取，从而得到与目标地址信息对应的地址信息特征。根据本发明一些较为具体的实施例，目标地址信息先在编码器的嵌入层(embedding层)将被转化为词向量的形式，然后词向量形式的目标地址信息随即被输入至编码器的隐藏层，并由隐藏层来提取与目标地址信息对应的地址信息特征。需要说明的是，编码器的隐藏层用于对词向量形式的目标地址信息进行语义提取，因此需要选用具备语义识别功能的人工智能网络来作为编码器的隐藏层。其中，隐藏层可以有多种选用方案，包括但不限于：将循环神经网络(Recurrent Neural Network，RN)作为提取地址信息特征的隐藏层、将长短期记忆网络(Long Short-Term Memory，LSTM)作为提取地址信息特征的隐藏层、将门控循环单元结构(Gated Recurrent Unit，GRU)或者其他神经网络模型作为提取地址信息特征的隐藏层。需要说明的是，普通的RNN具有梯度保障或消失的问题，因此LSTM通过引入线性自循环单元，即可保持梯度的长期存在。GRU是RNN的其中一种，和LSTM一样，也是为了解决长期记忆和反向传播中的梯度等问题而被提出来的。由于LSTM在序列建模问题上有一定优势，具有长时记忆功能，实现起来简单，解决了长序列训练过程中存在的梯度消失和梯度爆炸的问题，故而本申请一些较为优选的实施例中，选用LSTM作为隐藏层，与嵌入层共同形成Seq2Seq语义识别模型的编码器，用以对目标地址信息进行语义特征提取，得到与目标地址信息对应的地址信息特征。应理解，一些实施例中，地址信息特征以向量形式存在。

步骤S103,Seq2Seq语义识别模型对地址信息特征进行识别，得到与目标地址信息对应的目的经纬坐标。

根据本发明提供的一些实施例，在Seq2Seq语义识别模型提取得到与目标地址信息对应的地址信息特征之后，进一步对地址信息特征进行识别，得到与目标地址信息对应的目的经纬坐标。据本发明一些较为具体的实施例，地址信息特征经由Seq2Seq语义识别模型中的解码器进行解码，由于基础识别模型是通过训练地址信息和与训练地址信息相对应的训练经纬坐标训练得到的，因此Seq2Seq语义识别模型能够在目标地址信息与目的经纬坐标之间建立较为准确的映射关系，故而在获取目标地址信息的基础上最终能够识别得到与目标地址信息对应的目的经纬坐标。需要说明的是，目的经纬坐标指的是经由Seq2Seq语义识别模型识别得到的、与目标地址信息对应的经纬坐标。

参照图2，根据本发明的一些实施例，获取目标地址信息，并将目标地址信息输入Seq2Seq语义识别模型之前，还包括：

步骤S201，获取训练数据集，训练数据集包括目标地域范围中的各个训练地址信息、与各个训练地址信息相对应的各个训练经纬坐标，目标地域范围包括目标地址信息所指向的目标场所；

根据本发明提供的一些实施例，获取目标地址信息，并将目标地址信息输入Seq2Seq语义识别模型之前，需要先对Seq2Seq语义识别模型进行训练。而为了将基础识别模型训练成可以实现坐标转换的Seq2Seq语义识别模型，本发明一些实施例中需要获取训练数据集。需要说明的是，训练数据集包括目标地域范围中的各个训练地址信息，其中目标地域范围则指的是划入训练目标的、地理区域的位置范围。应理解，为了使得训练得到的Seq2Seq语义识别模型能够对目标地址信息进行有效处理，在训练中所划定的目标地域范围需要包括目标地址信息所指向的目标场所。需要强调，训练地址信息和与训练地址信息相对应的训练经纬坐标则是在训练得到Seq2Seq语义识别模型的过程中需要用到的训练数据，该部分训练数据存储于训练数据集中。根据本发明一些示例性的实施例，目标地域范围内包括多个训练场所，训练数据集中包括与各个训练场所相对应的各个训练地址信息，而训练数据集中还包括与各个训练场所相匹配的各个训练经纬坐标，训练经纬坐标即为训练场所的准确经纬坐标，因此，基于训练地址信息、训练经纬坐标对基础识别模型进行训练，可以提升基础模型在训练地址信息与训练经纬坐标之间建立映射关系的能力，故而，当基础识别模型将训练地址信息转换成对应的训练经纬坐标的准确率高到预设标准，则说明通过基础识别模型将训练地址信息转换成对应的训练经纬坐标的能力达到可以实际应用的水平，因此可以将达到实际应用水平的基础识别模型，作为本发明实施例中用于转换目标地址信息的Seq2Seq语义识别模型。

步骤S202，基于训练数据集对基础识别模型进行优化训练，得到Seq2Seq语义识别模型。

根据本发明提供的一些实施例，优化训练指的是对基础识别模型在训练地址信息与训练经纬坐标之间建立映射关系的能力进行优化的训练。其中需要明确，提取地址信息特征的环节是在基础识别模型的基础编码器中进行，而对地址信息特征进行识别，得到与目标地址信息对应的目的经纬坐标的环节则是在基础识别模型的基础解码器中进行。根据本申请提供的一些实施例，每将一组训练地址信息与对应的训练经纬坐标输入至基础识别模型进行优化训练，即可对基础识别模型从训练地址信息映射到训练经纬坐标的能力进行一次提升，因此，将多组训练地址信息与对应的训练经纬坐标输入至基础识别模型进行优化训练，即可提高基础识别模型从各个训练地址信息映射到各自对应的训练经纬坐标的能力。

参照图3，根据本发明的一些实施例，基于训练数据集对基础识别模型进行优化训练，得到Seq2Seq语义识别模型，包括：

步骤S301，基于训练数据集对基础识别模型进行迭代训练，每一轮迭代训练中，将各个训练地址信息输入基础识别模型进行本轮训练处理，获取与各个训练地址信息对应的各个本轮识别坐标；

需要说明的是，迭代训练的目的，是为了经过数轮根据训练地址信息识别得到训练经纬坐标的训练，逐渐提升基础识别模型从各个训练地址信息映射到各自对应的训练经纬坐标的能力。根据本申请提供的一些实施例，训练基础识别模型根据训练地址信息识别得到训练经纬坐标的过程包括：将训练数据集输入基础识别模型中进行迭代训练，每一轮迭代训练后，计算基础识别模型的识别准确率并对基础识别模型进行更新。其中，基础识别模型可以由不具备根据训练地址信息识别得到训练经纬坐标能力的预设模型经过预训练得到，也可以选用已经初步具备根据训练地址信息识别得到训练经纬坐标能力的预设模型。根据本发明一些示例性的实施例，每一轮迭代训练中，将各个训练地址信息输入基础识别模型进行本轮训练处理，获取与各个训练地址信息对应的各个本轮识别坐标，具体而言，由于目标地域范围内包括多个训练场所，因此，为了训练基础识别模型能够在各个训练地址信息的基础上，将各个训练地址信息映射到各自对应的训练经纬坐标，本发明一些实施例需要将各个训练地址信息依次输入基础识别模型依次进行优化训练。本发明一些较为优选的实施例，每一个训练地址信息在优化训练过程中都需要经过数轮的迭代训练，直至基础识别模型能够将每一个训练地址信息，以达到预设标准的识别准确率映射到对应的训练经纬坐标，则基础识别模型从训练地址信息映射到训练经纬坐标的能力就得到一次提升。

步骤S302，每一轮迭代训练后，将各个本轮识别坐标与对应的训练经纬坐标进行比对，计算基础识别模型的识别准确率并对基础识别模型的参数进行更新；

根据本发明提供的一些实施例，本轮识别坐标指的是本轮迭代训练中经由基础识别模型对训练地址信息进行识别而得到的坐标。需要说明的是，迭代训练的目的是为了持续优化基础识别模型从各个训练地址信息映射到各自对应的训练经纬坐标的能力。每一轮迭代训练后，都需要计算基础识别模型的识别准确率，以明确优化训练过程中基础识别模型从各个训练地址信息映射到各自对应的训练经纬坐标的能力在逐渐提升。需要说明的是，在优化训练的过程中，每经过一轮迭代训练，都需要对基础识别模型进行一次更新，以使得基础识别模型能在下一轮迭代训练中从各个训练地址信息映射到各自对应的训练经纬坐标能够有更好的表现。迭代训练中，对基础识别模型进行更新主要通过调整基础识别模型的参数来完成，基础识别模型的参数即基础识别模型内部与将各个训练地址信息映射到各自对应的训练经纬坐标的能力相关的内部参数。根据本发明提供的一些示例性的实施例，计算基础识别模型的识别准确率通过将各个本轮识别坐标与对应的训练经纬坐标进行比对而得到。应理解，本轮识别坐标指的是本轮迭代训练中经由基础识别模型对训练地址信息进行识别而得到的坐标，训练经纬坐标则是与训练地址信息匹配的准确坐标，故而，将本轮识别坐标与训练经纬坐标进行比对，即可得到基础识别模型的识别准确率。

步骤S303，统计识别准确率在每一轮迭代训练后的变化情况，当识别准确率收敛于第一定值，得到训练好的Seq2Seq语义识别模型。

需要说明的是，当识别准确率收敛于第一定值，即可停止迭代训练并得到训练好的Seq2Seq语义识别模型，其中第一定值指的是：在对基础识别模型的内部参数进行数轮调整后，基础识别模型的识别准确率收敛值。本申请提供的一些实施例中，基础识别模型的识别准确率将会稳定在某一误差区间内，例如基础识别模型的识别准确率在86％到88％区间内波动，则可以认为定值为87％。应理解，第一定值不是一个确切不变的值，而是一个会随训练条件发生变化的值。当基础识别模型的识别准确率收敛于第一定值，判定优化训练已达较佳效果，即可停止迭代训练，其中，停止迭代训练后得到的基础识别模型即Seq2Seq语义识别模型，通过优化训练得到的Seq2Seq语义识别模型，其将各个训练地址信息映射到各自对应的训练经纬坐标的能力将得到提升。根据本申请提供的一些实施例，随着迭代训练的进行，基础识别模型将各个训练地址信息映射到各自对应的训练经纬坐标的能力将得到提升，而其中提取地址信息特征的环节是在基础识别模型的基础编码器中进行，对地址信息特征进行识别并得到与目标地址信息对应的目的经纬坐标的环节则是在基础识别模型的基础解码器中进行。因此基础识别模型被优化的底层原因，是基础编码器提取地址信息特征的能力得到了优化，并且基础解码器对目标地址信息进行语义特征提取，得到与目标地址信息对应的地址信息特征的能力得到了优化。

参照图4，根据本发明的一些实施例，基于训练数据集对基础识别模型进行迭代训练，每一轮迭代训练中，将各个训练地址信息输入基础识别模型进行本轮训练处理，获取与各个训练地址信息对应的各个本轮识别坐标，包括：

步骤S401，每一轮迭代训练中，随机开启一批基础识别模型中的语义识别神经元；

步骤S402，基于随机开启的语义识别神经元，对各个训练地址信息进行本轮训练处理，获取各个本轮识别坐标。

需要说明的是，迭代训练的目的，是为了经过数轮根据训练地址信息识别得到训练经纬坐标的训练，逐渐提升基础识别模型从各个训练地址信息映射到各自对应的训练经纬坐标的能力。在机器学习的模型中，如果模型的参数太多，而训练样本又太少，训练出来的模型很容易产生过拟合的现象。在训练神经网络的时候经常会遇到过拟合的问题，过拟合具体表现在：模型在训练数据上损失函数较小，预测准确率较高；但是在测试数据上损失函数比较大，预测准确率较低。过拟合是很多机器学习的通病，为了在对基础识别模型进行优化训练的过程中得以避免过拟合现象的发生，本发明一些较为优选的实施例通过阻止特征检测器的共同作用来提高神经网络的性能。具体而言，每一轮迭代训练中，会随机开启一批基础识别模型中的语义识别神经元，然后基于随机开启的语义识别神经元，对各个训练地址信息进行本轮训练处理，从而获取各个本轮识别坐标。应理解，每一轮迭代训练中，虽然是随机开启基础识别模型中一部分语义识别神经元来参与训练，但是经过数轮的迭代训练，基础识别模型中设置的众多语义识别神经元仍然能够得到充分的训练。又因为在每一轮迭代训练中所用到的语义识别神经元是随机选择开启的，因此经过数轮的迭代训练，基础识别模型中设置的各个语义识别神经元能够对训练地址信息的识别起到较大权重的影响。因此，在语义识别神经元数轮随机开启的情况下，对基础识别模型进行数轮迭代训练而得到Seq2Seq语义识别模型，将会较好地缓解Seq2Seq语义识别模型中的过拟合现象。应理解，每一轮迭代训练中，将各个训练地址信息输入基础识别模型进行本轮训练处理，获取与各个训练地址信息对应的各个本轮识别坐标可以包括，但不限于上述实施例。

根据本发明提供的一些实施例，迭代训练的目的是为了持续优化基础识别模型从各个训练地址信息映射到各自对应的训练经纬坐标的能力。每一轮迭代训练后，都需要计算基础识别模型的识别准确率，以明确优化训练过程中基础识别模型从各个训练地址信息映射到各自对应的训练经纬坐标的能力在逐渐提升。根据本发明提供的一些示例性的实施例，计算基础识别模型的识别准确率通过将各个本轮识别坐标与对应的训练经纬坐标进行比对而得到。应理解，本轮识别坐标指的是本轮迭代训练中经由基础识别模型对训练地址信息进行识别而得到的坐标，训练经纬坐标则是与训练地址信息匹配的准确坐标，故而，将本轮识别坐标与训练经纬坐标进行比对，即可得到基础识别模型的识别准确率。

根据本发明一些较为具体的实施例，为了计算得到基础识别模型的识别准确率，需要先根据各个本轮识别坐标与各个训练经纬坐标，得到各个坐标间隔误差，再获取坐标间隔误差小于预设误差阈值的精确结果数量，进一步，根据精确结果数量、各个本轮识别坐标总数量，计算识别准确率。

参照图5，根据本发明的一些实施例，每一轮迭代训练后，将各个本轮识别坐标与对应的训练经纬坐标进行比对，计算基础识别模型的识别准确率并对基础识别模型的参数进行更新，包括：

步骤S501，根据各个本轮识别坐标与各个训练经纬坐标，得到各个坐标间隔误差；

根据本发明提供的一些示例性的实施例，为了计算基础识别模型的识别准确率，需要将各个本轮识别坐标与对应的训练经纬坐标进行比对。需要说明的是，在将各个本轮识别坐标与对应的训练经纬坐标进行比对的过程里，其中的本轮识别坐标为本轮迭代训练中经由基础识别模型对训练地址信息进行识别而得到的坐标；其中的训练经纬坐标则是与训练地址信息匹配的准确坐标。应理解，进行比对的本轮识别坐标、训练经纬坐标需要对应于同一训练地址信息。

根据本发明提供的一些较为具体的实施例，参照图6示出的训练数据集示意表，其中，若基于训练地址信息A进行优化训练，那么在每一轮迭代训练后，将对识别训练地址信息A识别获取的本轮识别坐标与训练经纬坐标“120；20”进行比对，得到坐标间隔误差Δa；同理，若基于训练地址信息B进行优化训练，那么在每一轮迭代训练后，将对识别训练地址信息B识别获取的本轮识别坐标与训练经纬坐标“800；96”进行比对，得到坐标间隔误差Δb；若基于训练地址信息C进行优化训练，那么在每一轮迭代训练后，将对识别训练地址信息C识别获取的本轮识别坐标与训练经纬坐标“90；45”进行比对，得到坐标间隔误差Δc；若基于训练地址信息D进行优化训练，那么在每一轮迭代训练后，将对识别训练地址信息D识别获取的本轮识别坐标与训练经纬坐标“150；23”进行比对，得到坐标间隔误差Δd；若基于训练地址信息E进行优化训练，那么在每一轮迭代训练后，将对识别训练地址信息E识别获取的本轮识别坐标与训练经纬坐标“112；800”进行比对，得到坐标间隔误差Δe；若基于训练地址信息F进行优化训练，那么在每一轮迭代训练后，将对识别训练地址信息F识别获取的本轮识别坐标与训练经纬坐标“30；60”进行比对，得到坐标间隔误差Δf。

步骤S502，获取坐标间隔误差小于预设误差阈值的精确结果数量；

步骤S503，根据精确结果数量、本轮识别坐标总数量，计算识别准确率。

根据本发明提供的一些实施例，预设误差阈值指的是预先设定的误差阈值。当坐标间隔误差大于或者等于预设误差阈值，则说明本轮识别坐标与训练经纬坐标的差距过大，不能将本轮识别坐标当作是基础识别模型本轮识别的精确结果；当坐标间隔误差小于预设误差阈值，则说明本轮识别坐标与训练经纬坐标的差距较小，可以将本轮识别坐标当作是基础识别模型本轮识别的精确结果。需要说明的是，获取坐标间隔误差小于预设误差阈值的精确结果数量，目的在于对本轮迭代训练中精确结果进行统计，从而进一步根据精确结果数量、本轮识别坐标总数量，计算识别准确率。应理解，计算识别准确率可以通过将精确结果数量作为分子、将本轮识别坐标总数量作为分母，换算成百分制得到。应理解，计算基础识别模型的识别准确率可以包括，但不限于上述实施例。

根据本发明提供的一些实施例，当地址信息转换方法实际使用时，往往会遇见与目标地址信息相似的各类地址信息。例如，当目标地址信息为“XX市文教路”，其相似的各类地址信息可以包括“XX县文教路”、“XX市文教路小学”、“XX市文教二路”等类型的相似地址信息。因此，为了提升本发明地址信息转换方法的转换准确度，本发明一些示例性的实施例中，对基础识别模型的训练数据集进行获取还包括从各个训练地址信息中获取准确场所地址、与准确场所地址对应的噪声场所地址，进而以准确场所地址作为正样本数据、以噪声场所地址作为负样本数据，将正样本数据与负样本数据混合形成各个训练地址信息。

参照图7，根据本发明的一些实施例，各个训练地址信息包括准确场所地址、噪声场所地址，获取训练数据集，还包括：

步骤S701，从各个训练地址信息中获取准确场所地址、与准确场所地址对应的噪声场所地址；

步骤S702，以准确场所地址作为正样本数据、以噪声场所地址作为负样本数据，将正样本数据与负样本数据混合形成各个训练地址信息。

根据本发明提供的一些实施例，准确场所地址为直接指向训练场所的地址，噪声场所地址指的是与准确场所地址近似的场所地址。应理解，基于准确场所地址对基础识别模型进行优化训练，持续提升基础识别模型的识别准确率，能够持续优化基础识别模型从各个训练地址信息映射到各自对应的训练经纬坐标的能力；而将准确场所地址和噪声场所地址混合形成训练地址信息，再以混合形成后的训练地址信息对基础识别模型进行优化训练，持续提升基础识别模型的识别准确率，能够在持续优化基础识别模型从各个训练地址信息映射到各自对应的训练经纬坐标的能力的同时，优化基础识别模型的鲁棒性，提升基础识别模型识别转换过程中的抗干扰能力。应理解，获取训练数据集可以包括，但不限于上述实施例。

参照图8，根据本发明的一些实施例，从各个训练地址信息中获取准确场所地址、与准确场所地址对应的噪声场所地址，包括：

步骤S801，从各个训练地址信息中获取准确场所地址，并从各个训练地址信息中得到与准确场所地址相匹配的误差地址文集；

步骤S802，根据误差地址文集，获取噪声场所地址。

根据本发明提供的一些示例性实施例，与准确场所地址越近似的噪声场所地址，对准确场所地址的干扰越强。因此，为了在持续优化基础识别模型从各个训练地址信息映射到各自对应的训练经纬坐标的能力的同时，优化基础识别模型的鲁棒性，提升基础识别模型识别转换过程中的抗干扰能力。本发明一些较为优选的实施例，先从各个训练地址信息中获取准确场所地址，并在各个训练地址信息中得到与准确场所地址相匹配的误差地址文集，进而根据误差地址文集获取噪声场所地址。需要说明的是，误差地址文集为与准确场所地址近似的各个场所地址所组成的文集，文件中的各个场所地址可以但不限于按照于准确场所地址的近似度排列。应理解，从各个训练地址信息中获取准确场所地址、与准确场所地址对应的噪声场所地址，可以包括，但不限于上述实施例。

参照图9，根据本发明的一些实施例，以准确场所地址作为正样本数据、以噪声场所地址作为负样本数据，将正样本数据与负样本数据混合形成各个训练地址信息，包括：

步骤S901，将正样本数据、负样本数据进行混合，得到混合数据；

根据本发明一些示例性的实施例，准确场所地址为直接指向训练场所的地址；并且准确场所地址为直接指向训练场所的地址。因此为了在持续优化基础识别模型从各个训练地址信息映射到各自对应的训练经纬坐标的能力的同时，优化基础识别模型的鲁棒性，提升基础识别模型识别转换过程中的抗干扰能力。训练地址信息中的正样本数据从准确场所地址中取样，训练地址信息中的负样本数据则从噪声场所地址中取样，使用上述方式混合形成的训练地址信息进行优化训练，当基础识别模型的识别准确率升高收敛于第一定值，即可判断优化训练结束，得到优化训练完成后的Seq2Seq语义识别模型。应理解，经过上述优化训练得到的Seq2Seq语义识别模型，能够从各个训练地址信息映射到各自对应的训练经纬坐标的同时，还在识别转换过程中具备较好的抗干扰能力。

步骤S902，调整正样本数据和负样本数据在混合数据中的占比；

步骤S903，当正样本数据在混合数据中的占比大于负样本数据在混合数据中的占比，将调整后的混合数据作为各个训练地址信息。

根据本发明提供的一些实施例，若混合数据中的正样本数据占比过小，则不利于在优化训练过程中引导基础识别模型的识别准确率得到提升。因此，正样本数据在混合数据中的占比需要占多数，本发明一些实施例中，根据混合数据生成训练地址信息之前，需要将正样本数据在混合数据中的占比调整至占多数的占比。需要明确，正样本数据在混合数据中的占比指的是正样本数据在混合数据总量中的比值、负样本数据在混合数据中的占比指的是正样本数据在混合数据总量中的比值。需要说明的是，当正样本数据在混合数据中的占比大于负样本数据在混合数据中的占比，说明正样本数据中的准确场所地址在混合数据中占主要部分，利用此种情形得到的训练地址信息进行优化训练，将有利于引导基础识别模型的识别准确率得到提升。

参照图10，根据本发明的一些实施例，基于训练数据集对基础识别模型进行优化训练，得到Seq2Seq语义识别模型，还包括：

步骤S1001，每一轮迭代训练后，将各个本轮识别坐标与对应的训练经纬坐标进行比对，计算基础识别模型的损失函数输出值并对基础识别模型的参数进行更新；

根据本发明提供的一些实施例，本轮识别坐标指的是本轮迭代训练中经由基础识别模型对训练地址信息进行识别而得到的坐标。需要说明的是，迭代训练的目的是为了持续优化基础识别模型从各个训练地址信息映射到各自对应的训练经纬坐标的能力。每一轮迭代训练后，都需要计算基础识别模型的损失函数输出值，以明确优化训练过程中基础识别模型从各个训练地址信息映射到各自对应的训练经纬坐标的能力在逐渐提升。需要说明的是，在优化训练的过程中，每经过一轮迭代训练，都需要对基础识别模型进行一次更新，以使得基础识别模型能在下一轮迭代训练中从各个训练地址信息映射到各自对应的训练经纬坐标能够有更好的表现。迭代训练中，对基础识别模型进行更新主要通过调整基础识别模型的参数来完成，基础识别模型的参数即基础识别模型内部与将各个训练地址信息映射到各自对应的训练经纬坐标的能力相关的内部参数。

步骤S1002，统计损失函数输出值在每一轮迭代训练后的变化情况，当损失函数输出值收敛于第二定值，得到训练好的Seq2Seq语义识别模型。

需要说明的是，当损失函数输出值收敛于第二定值，即可停止迭代训练并得到训练好的Seq2Seq语义识别模型，其中第二定值指的是：在对基础识别模型的内部参数进行数轮调整后，基础识别模型的损失函数输出收敛值。本申请提供的一些实施例中，基础识别模型的损失函数输出值将会稳定在某一误差区间内，例如基础识别模型的损失函数输出值在6％到8％区间内波动，则可以认为定值为7％。应理解，第二定值不是一个确切不变的值，而是一个会随训练条件发生变化的值。当基础识别模型的损失函数输出值收敛于第二定值，判定优化训练已达较佳效果，即可停止迭代训练，其中，停止迭代训练后得到的基础识别模型即Seq2Seq语义识别模型，通过优化训练得到的Seq2Seq语义识别模型，其将各个训练地址信息映射到各自对应的训练经纬坐标的能力将得到提升。

图11示出了本发明实施例提供的电子设备1100。电子设备1100包括：处理器1101、存储器1102及存储在存储器1102上并可在处理器1101上运行的计算机程序，计算机程序运行时用于执行上述的地址信息转换方法。

处理器1101和存储器1102可以通过总线或者其他方式连接。

存储器1102作为一种非暂态计算机可读存储介质，可用于存储非暂态软件程序以及非暂态性计算机可执行程序，如本发明实施例描述的地址信息转换方法。处理器1101通过运行存储在存储器1102中的非暂态软件程序以及指令，从而实现上述的地址信息转换方法。

存储器1102可以包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需要的应用程序。存储数据区可存储执行上述的地址信息转换方法。此外，存储器1102可以包括高速随机存取存储器1102，还可以包括非暂态存储器1102，例如至少一个储存设备存储器件、闪存器件或其他非暂态固态存储器件。在一些实施方式中，存储器1102可选包括相对于处理器1101远程设置的存储器1102，这些远程存储器1102可以通过网络连接至该电子设备1100。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

实现上述的地址信息转换方法所需的非暂态软件程序以及指令存储在存储器1102中，当被一个或者多个处理器1101执行时，执行上述的地址信息转换方法，例如，执行图1中的方法步骤S101至步骤S103、图2中的方法步骤S201至步骤S202、图3中的方法步骤S301至步骤S303、图4中的方法步骤S401至步骤S402、图5中的方法步骤S501至步骤S503、图7中的方法步骤S701至步骤S702、图8中的方法步骤S801至步骤S802、图9中的方法步骤S901至步骤S903、图10中的方法步骤S1001至步骤S1002。

本发明实施例还提供了计算机可读存储介质，存储有计算机可执行指令，计算机可执行指令用于执行上述的地址信息转换方法。

在一实施例中，该计算机可读存储介质存储有计算机可执行指令，该计算机可执行指令被一个或多个控制处理器执行，例如，执行图1中的方法步骤S101至步骤S103、图2中的方法步骤S201至步骤S202、图3中的方法步骤S301至步骤S303、图4中的方法步骤S401至步骤S402、图5中的方法步骤S501至步骤S503、图7中的方法步骤S701至步骤S702、图8中的方法步骤S801至步骤S802、图9中的方法步骤S901至步骤S903、图10中的方法步骤S1001至步骤S1002。以上所描述的装置实施例仅仅是示意性的，其中作为分离部件说明的单元可以是或者也可以不是物理上分开的，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。

本领域普通技术人员可以理解，上文中所公开方法中的全部或某些步骤、系统可以被实施为软件、固件、硬件及其适当的组合。某些物理组件或所有物理组件可以被实施为由处理器，如中央处理器、数字信号处理器或微处理器执行的软件，或者被实施为硬件，或者被实施为集成电路，如专用集成电路。这样的软件可以分布在计算机可读介质上，计算机可读介质可以包括计算机存储介质(或非暂时性介质)和通信介质(或暂时性介质)。如本领域普通技术人员公知的，术语计算机存储介质包括在用于存储信息(诸如计算机可读指令、数据结构、程序模块或其他数据)的任何方法或技术中实施的易失性和非易失性、可移除和不可移除介质。计算机存储介质包括但不限于RAM、ROM、EEPROM、闪存或其他存储器技术、CD-ROM、数字多功能盘(DVD)或其他光盘存储、磁盒、磁带、储存设备存储或其他磁存储装置、或者可以用于存储期望的信息并且可以被计算机访问的任何其他的介质。此外，本领域普通技术人员公知的是，通信介质通常包括计算机可读指令、数据结构、程序模块或者诸如载波或其他传输机制之类的调制数据信号中的其他数据，并且可包括任何信息递送介质。还应了解，本发明实施例提供的各种实施方式可以任意进行组合，以实现不同的技术效果。

以上是对本发明的较佳实施进行了具体说明，但本发明并不局限于上述实施方式，熟悉本领域的技术人员在不违背本发明精神的共享条件下还可作出种种等同的变形或替换，这些等同的变形或替换均包括在本发明权利要求所限定的范围内。

Claims

1.一种地址信息转换方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述获取目标地址信息，并将所述目标地址信息输入Seq2Seq语义识别模型之前，还包括：

3.根据权利要求2所述的方法，其特征在于，所述基于所述训练数据集对所述基础识别模型进行优化训练，得到所述Seq2Seq语义识别模型，包括：

4.根据权利要求3所述的方法，其特征在于，所述基于所述训练数据集对所述基础识别模型进行迭代训练，每一轮所述迭代训练中，将所述各个训练地址信息输入所述基础识别模型进行本轮训练处理，获取与所述各个训练地址信息对应的各个本轮识别坐标，包括：

5.根据权利要求3所述的方法，其特征在于，所述每一轮所述迭代训练后，将所述各个本轮识别坐标与所述各个训练经纬坐标进行比对，计算所述基础识别模型的识别准确率并对所述基础识别模型的参数进行更新，包括：

获取所述坐标间隔误差小于预设误差阈值的精确结果数量；

6.根据权利要求2至5任一项所述的方法，其特征在于，所述各个训练地址信息包括准确场所地址、噪声场所地址，所述获取训练数据集，还包括：

7.根据权利要求6所述的方法，其特征在于，所述从所述各个训练地址信息中获取所述准确场所地址、与所述准确场所地址对应的所述噪声场所地址，包括：

根据所述误差地址文集，获取所述噪声场所地址。

8.根据权利要求6所述的方法，其特征在于，所述以所述准确场所地址作为正样本数据、以所述噪声场所地址作为负样本数据，将所述正样本数据与所述负样本数据混合形成所述各个训练地址信息，包括：

9.一种电子设备，其特征在于，包括：存储器、处理器，所述存储器存储有计算机程序，所述处理器执行所述计算机程序时实现如权利要求1至8中任意一项所述的地址信息转换方法。

10.一种计算机可读存储介质，其特征在于，所述存储介质存储有程序，所述程序被处理器执行实现如权利要求1至8中任意一项所述的地址信息转换方法。