CN117931890A - 一种地区代码映射方法及装置 - Google Patents

一种地区代码映射方法及装置 Download PDF

Info

Publication number
CN117931890A
CN117931890A CN202410095551.4A CN202410095551A CN117931890A CN 117931890 A CN117931890 A CN 117931890A CN 202410095551 A CN202410095551 A CN 202410095551A CN 117931890 A CN117931890 A CN 117931890A
Authority
CN
China
Prior art keywords
region
code
historical
standard
names
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202410095551.4A
Other languages
English (en)
Inventor
王广娇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Zhongguancun Bank Ltd By Share Ltd
Original Assignee
Beijing Zhongguancun Bank Ltd By Share Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Zhongguancun Bank Ltd By Share Ltd filed Critical Beijing Zhongguancun Bank Ltd By Share Ltd
Priority to CN202410095551.4A priority Critical patent/CN117931890A/zh
Publication of CN117931890A publication Critical patent/CN117931890A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Stored Programmes (AREA)

Abstract

本申请公开一种地区代码映射方法及装置,方法包括:获取待映射历史地区代码,以及待映射历史地区代码对应的历史地区名称;在标准地区代码集合中,查询是否存在与待映射历史地区代码相同的标准地区代码;若存在,则确定待映射历史地区代码与标准地区代码之间的第一映射关系;其中,历史地区名称和标准地区名称均由多个范围级别和与范围级别一一对应的范围名称组成;当标准地区代码集合中不存在与待映射历史地区代码相同的标准地区代码时,在标准地区代码集合中,查询是否存在与历史地区名称对应的标准地区名称;若存在,则根据标准地区名称与标准地区代码之间的对应关系,确定标准地区代码与待映射历史地区代码之间的第二映射关系。

Description

一种地区代码映射方法及装置
技术领域
本申请涉及数据处理领域,具体涉及一种地区代码映射方法及装置。
背景技术
地区代码是用于标识各个地区的数字编码,各个地区都有与之唯一对应的地区代码。在银行系统中,通常通过用户信息中的身份证号来识别各个用户对应的地区信息,从而获得银行用户群体的地区分布。
但是,随着地区划分发生变动,例如将一个地区拆分成两个新地区,多个地区融合成一个新地区等,各个地区所对应的地区代码也随之发生变动,这就导致了相同地区在不同时间,对应的地区代码可能并不相同,对于包括不同地区代码的信息之间的地区分析效率较低。
发明内容
有鉴于此,本申请第一方面提供了一种地区代码映射方法,所述方法包括:
获取待映射历史地区代码,以及所述待映射历史地区代码对应的历史地区名称;其中,所述历史地区名称由多个范围级别和与所述范围级别一一对应的范围名称组成;
在标准地区代码集合中,查询是否存在与所述待映射历史地区代码相同的标准地区代码;若存在,则确定所述待映射历史地区代码与所述标准地区代码之间的第一映射关系;其中,所述标准地区代码集合中记录有所述标准地区代码以及与所述标准地区代码一一对应的标准地区名称,所述标准地区名称由多个范围级别和与所述范围级别一一对应的范围名称组成;
当所述标准地区代码集合中不存在与所述待映射历史地区代码相同的标准地区代码时,在所述标准地区代码集合中,查询是否存在与所述历史地区名称对应的标准地区名称;若存在,则根据所述标准地区名称与所述标准地区代码之间的对应关系,确定所述标准地区代码与所述待映射历史地区代码之间的第二映射关系。
可选地,所述在所述标准地区代码集合中,查询是否存在与所述历史地区名称对应的标准地区名称,包括:
确定所述待映射历史地区代码中的第一级别代码;
根据所述待映射历史地区代码中的第一级别代码,在所述标准地区代码集合中筛选出所述待映射历史地区代码对应的参考地区代码,并根据所述标准地区代码与所述标准地区名称之间的对应关系,确定所述参考地区代码对应的参考地区名称;其中,所述待映射历史地区代码中的第一级别代码与所述参考地区代码中的第一级别代码相同;
根据所述历史地区名称中的第二范围名称和第二范围级别,确定所述历史地区名称对应的第二级别地区范围,并根据所述参考地区名称中的第二范围名称和第二范围级别,确定所述参考地区名称对应的第二级别地区范围;其中,第二级别地区范围由第二范围名称和第二范围级别组成,且与第二级别代码对应;
确定是否存在与所述历史地区名称对应相同的第二级别地区范围的所述参考地区名称;若存在,则确定标准地区代码集合中存在与所述历史地区名称对应的标准地区名称。
可选地,所述方法还包括:
若在各个参考地区名称中,不存在与所述历史地区名称对应相同的第二级别地区范围的所述参考地区名称,则分别确定所述历史地区名称中的第二范围名称,以及各个参考地区名称中的第二范围名称;
若在各个参考地区名称中,存在与所述历史地区名称对应相同第二范围名称的参考地区名称,则确定所述参考地区名称与所述历史地区名称对应,并确定标准地区代码集合中存在与所述历史地区名称对应的标准地区名称。
可选地,所述当所述标准地区代码集合中不存在与所述待映射历史地区代码相同的标准地区代码时,在所述标准地区代码集合中,查询是否存在与所述历史地区名称对应的标准地区名称包括:
当所述标准地区代码集合中不存在与所述待映射历史地区代码相同的标准地区代码时,提取所述待映射历史地区代码中的第一级别代码和第三级别代码,生成组合代码;
根据所述组合代码和曾用代码集合,确定所述组合代码是否为曾用代码;其中,所述曾用代码集合中记录有曾用代码与各个标准地区代码中的第一级别代码之间的对应关系;
当所述组合代码为曾用代码时,根据所述组合代码对应的第一级别代码,在所述标准地区代码集合中确定所述组合代码对应的候选地区代码以及候选地区名称,并查询是否存在与所述历史地区名称对应的候选地区名称;其中,所述候选地区代码与所述候选地区名称一一对应,所述组合代码对应的第一级别代码与所述待映射历史地区代码中的第一级别代码不同;
当所述组合代码不是曾用代码时,在所述标准地区代码集合中,查询是否存在与所述历史地区名称对应的标准地区名称。
可选地,所述当所述组合代码为曾用代码时,根据所述组合代码对应的第一级别代码,在所述标准地区代码集合中确定所述组合代码对应的候选地区代码以及候选地区名称,并在所述候选地区名称中查询与所述历史地区名称对应的标准地区名称包括:
当所述组合代码为曾用代码时,根据所述曾用代码集合确定所述组合代码对应的第一级别代码;
通过所述组合代码对应的第一级别代码,从所述标准地区代码集合中筛选所述候选地区代码,并根据标准地区代码集合中所述标准地区代码与所述标准地区名称之间的对应关系,确定所述候选地区代码对应的候选地区名称;其中,所述候选地区代码中的第一级别代码与所述组合代码对应的第一级别代码相同;
确定各个候选地区名称中的各个范围名称,以及所述历史地区名称中的第二范围名称;
若各个候选地区名称中,存在与所述历史地区名称中的第二范围名称相同的范围名称,则根据所述范围名称与所述候选地区名称之间的对应关系,确定所述历史地区名称与所述候选地区名称对应,并建立所述待映射历史地区代码与所述候选地区代码之间的第三映射关系。
可选地,所述方法还包括:
若所述待映射历史地区代码对应有多个所述第三映射关系,则删除所述待映射历史地区代码对应的所有所述第三映射关系;
根据默认补位代码与所述组合代码对应的第一级别代码,生成模糊地区代码,并确定所述待映射历史地区代码与所述模糊地区代码之间的第四映射关系;其中,所述模糊地区代码长度与所述标准地区代码的长度相同。
可选地,所述方法还包括:
当所述标准地区代码集合中不存在与所述历史地区名称对应标准地区名称时,根据默认补位代码以及所述待映射历史地区代码中的第一级别代码,生成模糊地区代码,并确定所述模糊地区代码与所述待映射历史地区代码之间的第四映射关系;其中,所述模糊地区代码长度与所述标准地区代码的长度相同。
可选地,所述方法还包括:
统计所述待映射历史地区代码对应的映射关系数量,若所述映射关系数量大于1,则删除所述待映射历史地区代码对应的所有映射关系;
当所述待映射历史地区代码对应的映射关系数量为0时,根据默认补位代码和所述待映射历史地区代码对应的第一级别代码,生成所述待映射历史地区代码对应的模糊地区代码。
本申请第二方面提供了一种地区代码映射装置,所述装置包括:
获取单元,用于:获取待映射历史地区代码,以及所述待映射历史地区代码对应的历史地区名称;其中,所述历史地区名称由多个范围级别和与所述范围级别一一对应的范围名称组成;
第一查询单元,用于:在标准地区代码集合中,查询是否存在与所述待映射历史地区代码相同的标准地区代码;若存在,则确定所述待映射历史地区代码与所述标准地区代码之间的第一映射关系;其中,所述标准地区代码集合中记录有所述标准地区代码以及与所述标准地区代码一一对应的标准地区名称,所述标准地区名称由多个范围级别和与所述范围级别一一对应的范围名称组成;
第二查询单元,用于:当所述标准地区代码集合中不存在与所述待映射历史地区代码相同的标准地区代码时,在所述标准地区代码集合中,查询是否存在与所述历史地区名称对应的标准地区名称;若存在,则根据所述标准地区名称与所述标准地区代码之间的对应关系,确定所述标准地区代码与所述待映射历史地区代码之间的第二映射关系。
可选地,所述第二查询单元具体用于:
确定所述待映射历史地区代码中的第一级别代码;
根据所述待映射历史地区代码中的第一级别代码,在所述标准地区代码集合中筛选出所述待映射历史地区代码对应的参考地区代码,并根据所述标准地区代码与所述标准地区名称之间的对应关系,确定所述参考地区代码对应的参考地区名称;其中,所述待映射历史地区代码中的第一级别代码与所述参考地区代码中的第一级别代码相同;
根据所述历史地区名称中的第二范围名称和第二范围级别,确定所述历史地区名称对应的第二级别地区范围,并根据所述参考地区名称中的第二范围名称和第二范围级别,确定所述参考地区名称对应的第二级别地区范围;其中,第二级别地区范围由第二范围名称和第二范围级别组成,且与第二级别代码对应;
确定是否存在与所述历史地区名称对应相同的第二级别地区范围的所述参考地区名称;若存在,则确定标准地区代码集合中存在与所述历史地区名称对应的标准地区名称。
从以上技术方案可以看出,本申请具有以下优点:
本申请提供了一种地区代码映射方法,在获取待映射历史地区代码及其对应的历史地区名称之后,首先对其进行代码匹配,即,在记录有标准地区代码及标准地区名称的标准地区代码集合中,查询是否存在与待映射历史地区代码相同的标准地区代码;若存在,则确定待映射历史地区代码与标准地区代码之间的第一映射关系,根据该第一映射关系能够确定地区代码未发生变化的地区。当标准地区代码集合中不存在与待映射历史地区代码相同的标准地区代码时,再对待映射历史地区代码对应的历史地区名称进行名称匹配,在标准地区代码集合中,查询是否存在与历史地区名称对应的标准地区名称;若存在,则根据标准地区名称与标准地区代码之间的对应关系,确定标准地区代码与待映射历史地区代码之间的第二映射关系;根据该第二映射关系能够确定地区代码发生变化,但地区名称仍能进行对应的地区。由此可见,本申请通过代码匹配和名称匹配,建立历史地区代码与标准地区代码之间的映射关系,从而基于该映射关系能够确定历史地区代码这一旧地区代码,在当下所对应的新地区代码,解决了地区代码随时间发生变化,从而导致新旧地区代码无法对应的问题,提高了新旧地区代码之间的映射效率,进而提高了在银行业中对于用户、交易、业务等信息进行地区分析的效率。
附图说明
图1为本申请实施例提供的一种地区代码映射方法的方法流程图;
图2为本申请场景实施例提供的一种地区代码映射方法的方法流程图;
图3为本申请实施例提供的一种地区代码映射装置的结构示意图。
具体实施方式
下面将参照附图更详细地描述本申请的实施例。虽然附图中显示了本申请的某些实施例,然而应当理解的是,本申请可以通过各种形式来实现,而且不应该被解释为限于这里阐述的实施例,相反提供这些实施例是为了更加透彻和完整地理解本申请。应当理解的是,本申请的附图及实施例仅用于示例性作用,并非用于限制本申请的保护范围。
本文使用的术语“包括”及其变形是开放性包括,即“包括但不限于”。术语“基于”是“至少部分地基于”。术语“一个实施例”表示“至少一个实施例”;术语“另一实施例”表示“至少一个另外的实施例”;术语“一些实施例”表示“至少一些实施例”。其他术语的相关定义将在下文描述中给出。
需要注意,本申请中提及的“第一”、“第二”等概念仅用于对不同的装置、模块或单元进行区分,并非用于限定这些装置、模块或单元所执行的功能的顺序或者相互依存关系。
在日常生活中,地区代码的应用非常广泛,例如身份证号、邮政编码、手机号中都包含有对应的地区信息,但是,随着社会生活的不断发展,各个地区之间的划分可能发生变化,例如,地区范围的变化,由多个地区合并为一个新地区,从一个地区中拆分出两个新地区
根据公民出生时的户籍地区生成的身份编码,例如身份证号,其中包括其户籍地区的地区代码,但是,当地区代码发生变动时,更新后的计算机系统可能无法从中识别出该身份编码包含的地区代码,也就无法根据地区代码确定用户的户籍地区。
在银行系统中,通常从用户的身份证号中提取地区代码,从而根据该地区代码确定用户所属的地区,用户所属地区能够用于对银行用户进行地区分析以及对银行业务进行地区分析。但是,各个地区之间的划分并不是一成不变的,当地区划分发生变动时,其对应的地区代码也会发生更新。而用户的身份证号中的地区代码是根据用户身份注册时的历史地区代码生成的,在地区划分变动后,历史地区代码与更新后的地区代码之间无法一一对应,这就导致了无法根据历史地区代码确定用户所属地区的问题。
本申请提供了一种地区代码映射方法,在获取待映射历史地区代码及其对应的历史地区名称之后,首先对其进行代码匹配,即,在记录有标准地区代码及标准地区名称的标准地区代码集合中,查询是否存在与待映射历史地区代码相同的标准地区代码;若存在,则确定待映射历史地区代码与标准地区代码之间的第一映射关系,根据该第一映射关系能够确定地区代码未发生变化的地区。当标准地区代码集合中不存在与待映射历史地区代码相同的标准地区代码时,再对待映射历史地区代码对应的历史地区名称进行名称匹配,在标准地区代码集合中,查询是否存在与历史地区名称对应的标准地区名称;若存在,则根据标准地区名称与标准地区代码之间的对应关系,确定标准地区代码与待映射历史地区代码之间的第二映射关系;根据该第二映射关系能够确定地区代码发生变化,但地区名称仍能进行对应的地区。由此可见,本申请通过代码匹配和名称匹配,建立历史地区代码与标准地区代码之间的映射关系,从而基于该映射关系能够确定历史地区代码这一旧地区代码,在当下所对应的新地区代码,解决了地区代码随时间发生变化,从而导致新旧地区代码无法对应的问题,提高了新旧地区代码之间的映射效率,进而提高了在银行业中对于用户、交易、业务等信息进行地区分析的效率。
参见图1,图1为本申请实施例提供的一种地区代码映射方法的方法流程图。该方法具体包括如下步骤:
步骤101:获取待映射历史地区代码,以及所述待映射历史地区代码对应的历史地区名称。
待映射历史地区代码是需要确定当前对应的最新版本地区代码的历史地区代码,即待映射的历史地区代码,是一种旧版本的地区代码。其中,所述历史地区名称由多个范围级别和与所述范围级别一一对应的范围名称组成。不同的范围级别所对应的地区范围不同,一般来说,历史地区名称的组成结构为:XX省YY市ZZ县,在这种结构中,省、市、县均为范围级别,XX、YY、ZZ为与范围级别一一对应的范围名称,其中,省对应的地区范围大于市对应的地区范围,市对应的地区范围大于县对应的地区范围,并且,XX省的地区范围中包括YY市,YY市的地区范围中包括ZZ县。在本申请实施例中,范围级别还可以为州、区、地区等。在另一种情况下,历史地区名称的组成结构也可以为XX市XX市ZZ区,此时,XX市为直辖市,与省对应的范围级别相同,所对应的地区范围均为第一级别地区范围。
在本申请实施例中,待映射历史地区代码可以根据用户身份信息获得,例如从用户的身份证号中提取;也可以根据用户在办理业务时对应的银行网点的地区代码获得;从用户身份证号中提取的地区代码与银行网点的地区代码对应的编码方式是相同的。在办理业务过程中,银行网点可以根据其自身所处的位置,在业务记录中加入本网点对应的地区代码,那么银行在对业务、交易等进行地区分析时,可以根据各个业务记录中的地区代码进行地区代码的映射,从而获得各类业务、交易的地区分布情况。当然,以上所述的待映射历史地区代码的获取方式均为示例,也可以采用其他方式实现待映射历史地区代码的获取。
步骤102:在标准地区代码集合中,查询是否存在与所述待映射历史地区代码相同的标准地区代码;若存在,则确定所述待映射历史地区代码与所述标准地区代码之间的第一映射关系。
其中,标准地区代码集合中记录有标准地区代码以及与标准地区代码一一对应的标准地区名称,所述标准地区名称由多个范围级别和与所述范围级别一一对应的范围名称组成。标准地区名称的组成结构可以参考步骤101中所述的历史地区名称组成结构。
在本申请实施例中,标准地区代码集合是地区代码发生变化后对应的最新版本的地区代码集合,其中所记录的标准地区代码是当前对待映射历史地区代码进行映射时所使用的最新版本的地区代码。将待映射历史地区代码与标准地区代码进行映射,能够确定待映射历史地区代码在当前所对应的地区,进而确定包括该待映射历史地区代码的用户或业务的所属地区。
获取待映射历史地区代码后,首先根据该待映射历史地区代码在标准地区代码集合中进行代码查询,即,在标准地区代码集合中查询是否存在与该待映射历史地区代码相同的标准地区代码;如果存在,则在待映射历史地区代码,以及与该待映射历史地区代码相同的标准地区代码之间,建立第一映射关系。在本申请实施例中,第一映射关系用于描述未发生变化的历史地区代码与标准地区代码之间的直接映射关系,存在第一映射关系的历史地区代码与标准地区代码相同。
步骤103:当所述标准地区代码集合中不存在与所述待映射历史地区代码相同的标准地区代码时,在所述标准地区代码集合中,查询是否存在与所述历史地区名称对应的标准地区名称;若存在,则根据所述标准地区名称与所述标准地区代码之间的对应关系,确定所述标准地区代码与所述待映射历史地区代码之间的第二映射关系。
如果标准地区代码集合中的各个标准地区代码均不同于待映射历史地区代码,那么根据待映射历史地区代码对应的历史地区名称,以及标准地区代码对应的标准地区名称,进行名称查询,依次确定各个标准地区名称与该历史地区名称是否对应,如果对应,则根据标准地区名称与标准地区代码之间的对应关系,以及历史地区名称与待映射历史地区代码之间的对应关系,确定标准地区代码与待映射历史地区代码之间的第二映射关系。在本申请实施例中,对应有第二映射关系的地区是历史地区代码发生了变化,但历史地区名称仍可对应的地区。
作为一种实施例,在对历史地区名称进行名称查询时,具体可以通过如下步骤来实现:
步骤11:确定所述待映射历史地区代码中的第一级别代码。
待映射历史地区代码中,至少包括第一级别代码和第二级别代码,其中,第一级别代码为待映射历史地区代码中最大地区范围对应的地区代码,第二地区代码为待映射历史地区代码中最小地区范围对应的地区代码,以XX省YY市ZZ县对应的历史地区代码112233为例,其中,11为XX省对应的地区代码,22为YY市对应的地区代码,33为ZZ市对应的地区代码,那么,11即为该地区历史地区代码中的第一级别代码,33即为该历史地区代码中的第二级别代码。在地区划分上,本申请实施例中可以将第一级别代码对应的地区范围称为第一级别地区范围,将第二级别代码对应的地区范围称为第二级别地区范围。
对应地,在待映射历史地区代码对应的历史地区名称中,第一范围级别和第一范围名称,均与第一级别代码对应,第二范围级别和第二范围名称,均为第二级别代码对应。以XX省YY市ZZ县这一历史地区名称为例,其中,XX为第一范围名称,省为第一范围级别,ZZ为第二范围名称,县为第二范围级别。
步骤12:根据所述待映射历史地区代码中的第一级别代码,在所述标准地区代码集合中筛选出所述待映射历史地区代码对应的参考地区代码,并根据所述标准地区代码与所述标准地区名称之间的对应关系,确定所述参考地区代码对应的参考地区名称。
根据待映射历史地区代码中的第一级别代码,从标准地区代码集合中筛选与之第一级别代码相同的标准地区代码,并将这种标准地区代码确定为待映射历史地区代码对应的参考地区代码,也就是说,待映射历史地区代码中的第一级别代码与各个参考地区代码中的第一级别代码相同。
由于待映射历史地区代码中的第一级别代码与各个参考地区代码中的第一级别代码相同,所以待映射历史地区代码与各个参考地区代码对应的第一级别地区范围相同,例如,待映射历史地区代码与参考地区代码均对应XX省,待映射历史地区代码和参考地区代码均为XX省内的地区代码。
从标准地区代码集合中筛选出待映射历史地区代码对应的参考地区代码后,根据这些参考地区代码在标准地区代码集合中各自对应的标准地区名称,确定各个参考地区代码对应的参考地区名称,可以确定的是,各个参考地区名称中的第一范围名称、第一范围级别,与历史地区名称中的第一范围名称、第一范围级别均相同。
步骤13:根据所述历史地区名称中的第二范围名称和第二范围级别,确定所述历史地区名称对应的第二级别地区范围,并根据所述参考地区名称中的第二范围名称和第二范围级别,确定所述参考地区名称对应的第二级别地区范围。
第二级别地区范围由第二范围名称和第二范围级别组成,且与第二级别代码对应。举例来说,“ZZ县”为第二级别地区范围,其由第二范围名称“ZZ”和第二范围级别“县”组成,对应于历史地区代码中的第二级别代码,例如上文所述的“XX省YY市ZZ县”对应的历史地区代码“112233”为例,第二级别地区范围即为第二级别代码“33”所指示的地区范围。在本申请实施例中,待映射历史地区代码与历史地区名称之间的对应关系,实质上是各个级别代码与各个级别地区范围之间的一一对应关系,多个级别代码组成一个历史地区代码,根据多个级别代码各自对应的级别地区范围组成历史地区名称。
需要说明的是,标准地区代码、标准地区名称以及标准地区代码对应的第二级别范围的相关描述可以参照上述对历史地区代码、历史地区名称以及历史地区代码对应的第二级别范围的描述;同样地,第一级别范围的相关描述也可以参照上述第二级别范围的描述。
步骤14:确定各个参考地区名称中是否存在与所述历史地区名称对应相同的第二级别地区范围的所述参考地区名称;若存在,则确定标准地区代码集合中存在与所述历史地区名称对应的标准地区名称。
对参考地区名称和历史地区名称之间进行名称匹配,确定在各个参考地区名称中是否存在与历史地区名称对应相同的第二级别地区范围的参考地区名称。需要说明的是,在本申请实施例中,当参考地区名称中的范围级别与历史地区名称中的范围级别相同,且参考地区名称中的范围名称与历史地区名称中的范围名称相同时,才能确定该参考地区名称与历史地区名称相同。
具体地,获取各个参考地区名称中的第二范围级别和第二范围名称,以及历史地区名称中的第二范围级别和第二范围名称,将历史地区名称中的第二范围级别和第二范围名称,分别与各个参考地区名称中的第二范围级别和第二范围名称进行匹配,若存在一个参考地区名称的第二范围级别、第二范围名称,与历史地区名称的第二范围名称、第二范围级别均相同,那么确定该参考地区名称与该历史地区名称对应相同的第二级别地区范围。
由于参考地区代码和参考地区名称均来自标准地区代码集合,所以当存在参考地区名称与历史地区名称对应时,也就是标准代码集合中存在与历史地区名称对应的标准地区名称。
在不存在与待映射历史地区代码完全相同的标准地区代码时,筛选出与待映射历史地区代码属于同一个第一级别地区范围的参考地区代码及其对应的参考地区名称,对历史地区名称和参考地区名称进行名称匹配,可以确定出地区代码发生变化、但地区名称未发生变化的地区,即与历史地区名称相同的第二级别地区范围的参考地区名称,从而能够以此建立待映射历史地区代码与该地区对应的参考地区代码之间的第二映射关系,提高地区代码映射的准确性。
进一步地,在上述步骤11至步骤13的基础上,还可以包括如下步骤:
步骤21:若在各个参考地区名称中,不存在与所述历史地区名称对应相同的第二级别地区范围的所述参考地区名称,则分别确定所述历史地区名称中的第二范围名称,以及各个参考地区名称中的第二范围名称。
其中,历史地区名称中的第二范围名称与待映射历史地区代码中的第二级别代码对应,参考地区名称中的第二范围名称与参考地区代码中的第二级别代码对应。若各个参考地区名称中,不存在与历史地区名称对应相同的第二级别地区范围的参考地区名称,也就是不存在第二范围名称、第二范围级别与历史地区名称均相同的参考地区名称,此时,可以减少匹配条件,仅在参考地区名称和历史地区名称之间进行第二范围名称的匹配。
步骤22:若在各个参考地区名称中,存在与所述历史地区名称对应相同第二范围名称的参考地区名称,则确定所述参考地区名称与所述历史地区名称对应,并确定标准地区代码集合中存在与所述历史地区名称对应的标准地区名称。
在本申请实施例中,与历史地区名称对应相同第二范围名称的参考地区名称是指,该参考地区名称中的第二范围名称与历史地区名称中的第二范围名称相同,但是基于前述步骤21,该参考地区名称中的第二范围级别与历史地区名称中的第二范围级别不同。这种情况可能发生在历史地区变化过程中,对地区的范围级别进行修改,但保留了该地区原有的范围名称;例如,在参考地区名称中所描述的第二级别地区范围为ZZ区,而在历史地区名称中所描述的第二级别地区范围为ZZ县,二者的第二范围名称均为ZZ,但第二范围级别一个为区,一个为县,并不相同。
作为一种示例,待映射历史地区代码对应的历史地区名称中,第二范围级别为“地区”,即历史地区名称为XX省YY市ZZ地区,那么为该历史地区名称查询对应的标准地区名称时,不考虑“地区”二字,也就是不考虑第二范围级别,直接从该历史地区名称对应的各个参考地区名称中,进行第二范围名称的匹配,确定第二范围名称为ZZ的参考地区名称,确定该参考地区名称与该历史地区名称对应相同的第二范围名称。
在一种可能的实现方式中,所述方法还包括如下步骤:
当所述标准地区代码集合中不存在与所述历史地区名称对应标准地区名称时,根据默认补位代码以及所述待映射历史地区代码中的第一级别代码,生成模糊地区代码,并确定所述模糊地区代码与所述待映射历史地区代码之间的第四映射关系。
其中,所述模糊地区代码长度与所述标准地区代码的长度相同。
在所有参考地区名称中,如果既不存在与历史地区名称对应相同的第二级别地区范围的参考地区名称,也不存在与历史地区名称对应相同第二范围名称的参考地区名称,那么可以确定在标准地区代码集合中存在与历史地区名称对应的标准地区名称,此时,可以根据待映射历史地区代码中的第一级别代码,确定待映射历史地区代码对应的第一级别地区范围,例如,根据待映射历史地区代码中的第一级别代码为11,确定待映射历史地区代码所属的第一级别地区范围为XX省,但是无法查询到与ZZ对应的具体区域,那么可以使用默认补位代码和XX省对应的第一级别代码,生成待映射历史地区代码对应的模糊地区代码,并建立待映射历史地区代码与该模糊地区代码之间的第四映射关系。第四映射关系为待映射历史地区代码与其在当前应当对应的第一级别代码之间的映射关系,用于指示待映射历史地区代码对应的第一级别地区范围。
在本申请实施例中,默认补位代码可以设置为0000,如此,与第一级别代码11生成的模糊地区代码为110000,与标准地区代码、待映射历史地区代码的长度均相同。当进行用户地区分析或业务地区分析时,根据第四映射关系,可以确定待映射历史地区代码对应的模糊地区代码为110000,从而确定用户或业务属于XX省。
当无法确定与待映射历史地区代码相同的标准地区代码,并且无法确定与历史地区名称对应的标准地区名称时,通过第四映射关系,可以确定待映射历史地区代码当前对应的第一级别地区范围,从而在对银行用户或业务进行地区分析时,为待映射历史地区代码确定与之对应的大致范围。
在一种可能的实现方式中,步骤103可以通过如下方式实现:
步骤31:当所述标准地区代码集合中不存在与所述待映射历史地区代码相同的标准地区代码时,提取所述待映射历史地区代码中的第一级别代码和第三级别代码,生成组合代码。
随着地区划分的变动,可以存在原属于XX省的一个YY市,逐渐成为了一个新的省份或直辖市,即由XX省YY市变成了YY省或YY市。那么随着范围级别的升级,XX省YY市对应的历史地区代码1122中,对于发生这类变化的待映射历史地区代码,既无法在标准地区代码集合中查找到与其相同的标准地区代码,也无法在XX省中查找到与历史地区名称对应的标准地区名称。
为了减少在名称匹配时大量计算资源的浪费,可以在进行名称匹配之前,首先确定待映射历史地区代码是否为某个第一级别地区范围的曾用代码。从待映射历史地区代码中提取第一级别代码和第三级别代码,其中,该第三级别代码是范围级别介于第一级别与第二级别之间的范围级别代码。例如,XX省YY市ZZ县及其对应的地区代码112233中,第三级别代码为22,所对应的第三级别地区范围为YY市。
一般来说,一个新的第一级别地区范围是由原有的一个第三级别地区范围变化而来的,所以在本申请实施例中,提取第一级别地区范围和第三级别地区范围对应的第一级别代码和第三级别代码,生成组合代码。
步骤32:根据所述组合代码和曾用代码集合,确定所述组合代码是否为曾用代码。
其中,所述曾用代码集合中记录有曾用代码与各个标准地区代码中的第一级别代码之间的对应关系。例如,YY省曾为XX省YY市,XX省YY市对应的历史地区代码为1122,也就是YY省的曾用代码为1122;若YY省当前对应的标准地区代码中的第一级别代码为21,那么在曾用代码集合中,会记录1122这一曾用代码与第一级别代码21之间的对应关系,那么若从待映射历史地区代码中获取的组合代码1122能够在曾用代码集合中查询到相同的曾用代码,那么可以确定该组合代码为曾用代码。
步骤33:当所述组合代码为曾用代码时,根据所述组合代码对应的第一级别代码,在所述标准地区代码集合中确定所述组合代码对应的候选地区代码以及候选地区名称,并查询是否存在与所述历史地区名称对应的候选地区名称。
确定组合代码为曾用代码后,确定曾用代码对应的第一级别代码,也就是组合代码对应的第一级别代码,例如根据组合代码1122确定对应的第一级别代码21。然后,在标准地区代码集合中确定与曾用代码对应相同的第一级别代码的标准地区代码,并将这种标准地区代码确定为组合代码对应的候选地区代码,候选地区代码中的第一级别代码与组合代码对应的第一级别代码相同。
需要说明的是,在本申请实施例中,组合代码对应的第一级别代码与所述待映射历史地区代码中的第一级别代码不同。例如,对于待映射历史地区代码112233来说,该待映射历史地区代码中的第一级别代码为11,生成的组合代码为1122,根据曾用代码集合,组合代码1122对应的第一级别代码为21,与待映射历史地区代码中的第一级别代码11不同,与组合代码1122中的第一级别代码也不同。
同时,根据标准地区代码集合中各个标准地区代码与标准地区名称之间的一一对应关系,确定与候选地区代码一一对应的候选地区名称,并从候选地区名称中查询是否存在与历史地区名称对应的候选地区名称。
具体地,步骤33可以通过如下方式实现:
步骤41:当所述组合代码为曾用代码时,根据所述曾用代码集合确定所述组合代码对应的第一级别代码。
根据曾用代码集合中,曾用代码与第一级别代码之间的对应关系,确定组合代码对应的第一级别代码。
步骤42:通过所述组合代码对应的第一级别代码,从所述标准地区代码集合中筛选所述候选地区代码,并根据标准地区代码集合中所述标准地区代码与所述标准地区名称之间的对应关系,确定所述候选地区代码对应的候选地区名称。
其中,候选地区代码中的第一级别代码与组合代码对应的第一级别代码相同。举例来说,组合代码对应的第一级别代码为21,候选地区代码中的第一级别代码也为21,并且,由于21对应的第一级别地区范围为YY省,所以候选地区代码为YY省内各个地区的标准地区代码。
步骤43:确定各个候选地区名称中的各个范围名称,以及所述历史地区名称中的第二范围名称。
由于在历史地区名称XX省YY市ZZ县中,YY市已经变成了YY省,那么对应的原ZZ县可能变成了ZZ市,范围级别发生了变化,也可能仍为ZZ县,范围级别未发生变化,所以在候选地区名称和历史地区名称之间进行名称匹配时,只需要获取各个候选地区名称中的各个范围名称以及历史地区名称中的第二范围名称。
步骤44:若各个候选地区名称中,存在与所述历史地区名称中的第二范围名称相同的范围名称,则根据所述范围名称与所述候选地区名称之间的对应关系,确定所述历史地区名称与所述候选地区名称对应,并建立所述待映射历史地区代码与所述候选地区代码之间的第三映射关系。
在各个候选地区名称中,进行范围名称的匹配,即,将历史地区名称中的第二范围名称与各个候选地区名称中的范围名称进行匹配。需要说明的是,由于所有候选地区名称中第一级别代码对应的范围级别和范围名称均相同,所以只需要将历史地区名称中的第二范围名称,依次与候选地区名称中的第二范围名称和第三范围名称进行匹配。
若某一个候选地区名称中的第二范围名称或第三范围名称,与历史地区名称中的第二范围名称相同,那么可以确定该候选地区名称与该历史地区名称对应。根据候选地区名称与候选地区代码之间的对应关系,以及历史地区名称与待映射历史地区代码之间的对应关系,确定候选地区代码与待映射历史地区代码之间的第三映射关系。
在本申请实施例中,第三映射关系用于指示从其他第一级别地区范围划分出来的新的第一级别地区范围,与其对应的历史地区代码之间的映射关系。
进一步地,在上述步骤41至步骤44的基础上,还可以包括如下步骤:
步骤51:若所述待映射历史地区代码对应有多个所述第三映射关系,则删除所述待映射历史地区代码对应的所有所述第三映射关系。
在本申请实施例中,待映射历史地区代码所对应的映射关系具有唯一性,也就是说,若待映射历史地区代码中对应有多个第三映射关系,多个第三映射关系所指示的多个地区代码中必然存在映射错误的地区代码,同时由于地区划分的变动较为随机,根据多个第三映射关系无法确定该待映射历史地区代码对应的具体区域,所以将该待映射历史地区代码对应的多个第三映射关系均删除。
步骤52:根据默认补位代码与所述组合代码对应的第一级别代码,生成模糊地区代码,并确定所述待映射历史地区代码与所述模糊地区代码之间的第四映射关系。
其中,所述模糊地区代码长度与所述标准地区代码的长度相同。
待映射历史地区代码对应的所有第三映射关系删除后,根据待映射历史地区代码的组合代码对应的第一级别代码,以及默认补位代码,生成该待映射历史地区代码对应的模糊地区代码,并在待映射历史地区代码以及模糊地区代码之间建立第四映射关系。
举例来说,当待映射历史地区代码112233的组合代码1122对应的第一级别代码为21,默认补位代码为0000时,生成的模糊地区代码为210000,根据该模糊地区代码与待映射历史地区代码之间的第四映射关系,可以确定该待映射历史地区代码对应的第一级别地区范围为第一级别代码21对应的第一级别范围,在新增加的第一级别地区范围内的待映射历史地区代码无法确定具体区域时,为其确定与之对应的大致范围,以便银行对包括该待映射历史地区代码的用户、交易、业务等进行地区分析。
步骤34:当所述组合代码不是曾用代码时,在所述标准地区代码集合中,查询是否存在与所述历史地区名称对应的标准地区名称。
若在曾用代码集合中查询不到与组合代码相同的曾用代码,那么可以确定该组合代码不是曾用代码,可以继续对该组合代码对应的待映射历史地区代码进行名称匹配。
在一种可能的实现方式中,本申请实施例提供的地区代码映射方法还可以包括如下步骤:
步骤61:统计所述待映射历史地区代码对应的映射关系数量,若所述映射关系数量大于1,则删除所述待映射历史地区代码对应的所有映射关系;
步骤62:当所述待映射历史地区代码对应的映射关系数量为0时,根据默认补位代码和所述待映射历史地区代码对应的第一级别代码,生成所述待映射历史地区代码对应的模糊地区代码。
完成对待映射历史地区代码的映射后,统计其对应的映射关系数量。在本申请实施例中,当待映射历史地区代码对应的映射关系数量为1时,才可以根据待映射历史地区代码对应的映射关系确定其对应的标准地区代码;如果待映射历史地区代码对应的映射关系数量大于1,则无法根据多个映射关系确定其对应的标准地区代码,此时就无需再保留待映射历史地区代码对应的映射关系,可以将其对应的所有映射关系删除。
当待映射历史地区代码对应的映射关系数量为0时,为了对包括该待映射历史地区代码的用户、交易、业务等进行地区分析,还需要为待映射历史地区代码确定一个正确的大致范围,此时,可以根据待映射历史地区代码对应的第一级别代码,以及默认补位代码,生成该待映射历史地区代码对应的模糊地区代码,最终,将该模糊地区代码确定为与待映射历史地区代码唯一存在映射关系的地区代码。从而实现了对于待映射历史地区代码的映射,为其确定了与其对应的大致地区范围。
参见图2,图2为本申请场景实施例提供的一种地区代码映射方法的方法流程图。具体地,本申请场景实施例中各步骤的实现方法可以参照上文中各个步骤对应的实现方法。
基于本申请提供的一种地区代码映射方法,在获取待映射历史地区代码及其对应的历史地区名称之后,首先对其进行代码匹配,即,在记录有标准地区代码及标准地区名称的标准地区代码集合中,查询是否存在与待映射历史地区代码相同的标准地区代码;若存在,则确定待映射历史地区代码与标准地区代码之间的第一映射关系,根据该第一映射关系能够确定地区代码未发生变化的地区。当标准地区代码集合中不存在与待映射历史地区代码相同的标准地区代码时,再对待映射历史地区代码对应的历史地区名称进行名称匹配,在标准地区代码集合中,查询是否存在与历史地区名称对应的标准地区名称;若存在,则根据标准地区名称与标准地区代码之间的对应关系,确定标准地区代码与待映射历史地区代码之间的第二映射关系;根据该第二映射关系能够确定地区代码发生变化,但地区名称仍能进行对应的地区。由此可见,本申请通过代码匹配和名称匹配,建立历史地区代码与标准地区代码之间的映射关系,从而基于该映射关系能够确定历史地区代码这一旧地区代码,在当下所对应的新地区代码,解决了地区代码随时间发生变化,从而导致新旧地区代码无法对应的问题,提高了新旧地区代码之间的映射效率,进而提高了在银行业中对于用户、交易、业务等信息进行地区分析的效率。
参见图3,图3为本申请实施例提供的一种地区代码映射装置的结构示意图,所述装置包括:获取单元301,第一查询单元302以及第二查询单元303。
获取单元301,用于:获取待映射历史地区代码,以及所述待映射历史地区代码对应的历史地区名称;其中,所述历史地区名称由多个范围级别和与所述范围级别一一对应的范围名称组成;
第一查询单元302,用于:在标准地区代码集合中,查询是否存在与所述待映射历史地区代码相同的标准地区代码;若存在,则确定所述待映射历史地区代码与所述标准地区代码之间的第一映射关系;其中,所述标准地区代码集合中记录有所述标准地区代码以及与所述标准地区代码一一对应的标准地区名称,所述标准地区名称由多个范围级别和与所述范围级别一一对应的范围名称组成;
第二查询单元303,用于:当所述标准地区代码集合中不存在与所述待映射历史地区代码相同的标准地区代码时,在所述标准地区代码集合中,查询是否存在与所述历史地区名称对应的标准地区名称;若存在,则根据所述标准地区名称与所述标准地区代码之间的对应关系,确定所述标准地区代码与所述待映射历史地区代码之间的第二映射关系。
可选地,所述第二查询单元303具体用于:
确定所述待映射历史地区代码中的第一级别代码;
根据所述待映射历史地区代码中的第一级别代码,在所述标准地区代码集合中筛选出所述待映射历史地区代码对应的参考地区代码,并根据所述标准地区代码与所述标准地区名称之间的对应关系,确定所述参考地区代码对应的参考地区名称;其中,所述待映射历史地区代码中的第一级别代码与所述参考地区代码中的第一级别代码相同;
根据所述历史地区名称中的第二范围名称和第二范围级别,确定所述历史地区名称对应的第二级别地区范围,并根据所述参考地区名称中的第二范围名称和第二范围级别,确定所述参考地区名称对应的第二级别地区范围;其中,第二级别地区范围由第二范围名称和第二范围级别组成,且与第二级别代码对应;
确定是否存在与所述历史地区名称对应相同的第二级别地区范围的所述参考地区名称;若存在,则确定标准地区代码集合中存在与所述历史地区名称对应的标准地区名称。
可选地,第二查询单元303还用于:
若在各个参考地区名称中,不存在与所述历史地区名称对应相同的第二级别地区范围的所述参考地区名称,则分别确定所述历史地区名称中的第二范围名称,以及各个参考地区名称中的第二范围名称;
若在各个参考地区名称中,存在与所述历史地区名称对应相同第二范围名称的参考地区名称,则确定所述参考地区名称与所述历史地区名称对应,并确定标准地区代码集合中存在与所述历史地区名称对应的标准地区名称。
可选地,所述第二查询单元303具体用于:
当所述标准地区代码集合中不存在与所述待映射历史地区代码相同的标准地区代码时,提取所述待映射历史地区代码中的第一级别代码和第三级别代码,生成组合代码;
根据所述组合代码和曾用代码集合,确定所述组合代码是否为曾用代码;其中,所述曾用代码集合中记录有曾用代码与各个标准地区代码中的第一级别代码之间的对应关系;
当所述组合代码为曾用代码时,根据所述组合代码对应的第一级别代码,在所述标准地区代码集合中确定所述组合代码对应的候选地区代码以及候选地区名称,并查询是否存在与所述历史地区名称对应的候选地区名称;其中,所述候选地区代码与所述候选地区名称一一对应,所述组合代码对应的第一级别代码与所述待映射历史地区代码中的第一级别代码不同;
当所述组合代码不是曾用代码时,在所述标准地区代码集合中,查询是否存在与所述历史地区名称对应的标准地区名称。
可选地,所述第二查询单元303具体用于:
当所述组合代码为曾用代码时,根据所述曾用代码集合确定所述组合代码对应的第一级别代码;
通过所述组合代码对应的第一级别代码,从所述标准地区代码集合中筛选所述候选地区代码,并根据标准地区代码集合中所述标准地区代码与所述标准地区名称之间的对应关系,确定所述候选地区代码对应的候选地区名称;其中,所述候选地区代码中的第一级别代码与所述组合代码对应的第一级别代码相同;
确定各个候选地区名称中的各个范围名称,以及所述历史地区名称中的第二范围名称;
若各个候选地区名称中,存在与所述历史地区名称中的第二范围名称相同的范围名称,则根据所述范围名称与所述候选地区名称之间的对应关系,确定所述历史地区名称与所述候选地区名称对应,并建立所述待映射历史地区代码与所述候选地区代码之间的第三映射关系。
可选地,图3所示的装置还包括查重单元,用于:
若所述待映射历史地区代码对应有多个所述第三映射关系,则删除所述待映射历史地区代码对应的所有所述第三映射关系;
根据默认补位代码与所述组合代码对应的第一级别代码,生成模糊地区代码,并确定所述待映射历史地区代码与所述模糊地区代码之间的第四映射关系;其中,所述模糊地区代码长度与所述标准地区代码的长度相同。
可选地,图3所示的装置还包括模糊地区代码生成单元,用于:
当所述标准地区代码集合中不存在与所述历史地区名称对应标准地区名称时,根据默认补位代码以及所述待映射历史地区代码中的第一级别代码,生成模糊地区代码,并确定所述模糊地区代码与所述待映射历史地区代码之间的第四映射关系;其中,所述模糊地区代码长度与所述标准地区代码的长度相同。
可选地,图3所示的装置还包括统计分析单元,用于:
统计所述待映射历史地区代码对应的映射关系数量,若所述映射关系数量大于1,则删除所述待映射历史地区代码对应的所有映射关系;
当所述待映射历史地区代码对应的映射关系数量为0时,根据默认补位代码和所述待映射历史地区代码对应的第一级别代码,生成所述待映射历史地区代码对应的模糊地区代码。
本申请实施方式中的多个装置之间所交互的消息或者信息的名称仅用于说明性的目的,而并不是用于对这些消息或信息的范围进行限制。
虽然采用特定次序描绘了各操作,但是这不应当理解为要求这些操作以所示出的特定次序或以顺序次序执行来执行。在一定环境下,多任务和并行处理可能是有利的。
应当理解,本申请的方法实施方式中记载的各个步骤可以按照不同的顺序执行,和/或并行执行。此外,方法实施方式可以包括附加的步骤和/或省略执行示出的步骤。本申请的范围在此方面不受限制。
可以以一种或多种程序设计语言或其组合来编写用于执行本申请的操作的计算机程序代码,上述程序设计语言包括但不限于面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
以上所述,以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。

Claims (10)

1.一种地区代码映射方法,其特征在于,所述方法包括:
获取待映射历史地区代码,以及所述待映射历史地区代码对应的历史地区名称;其中,所述历史地区名称由多个范围级别和与所述范围级别一一对应的范围名称组成;
在标准地区代码集合中,查询是否存在与所述待映射历史地区代码相同的标准地区代码;若存在,则确定所述待映射历史地区代码与所述标准地区代码之间的第一映射关系;其中,所述标准地区代码集合中记录有所述标准地区代码以及与所述标准地区代码一一对应的标准地区名称,所述标准地区名称由多个范围级别和与所述范围级别一一对应的范围名称组成;
当所述标准地区代码集合中不存在与所述待映射历史地区代码相同的标准地区代码时,在所述标准地区代码集合中,查询是否存在与所述历史地区名称对应的标准地区名称;若存在,则根据所述标准地区名称与所述标准地区代码之间的对应关系,确定所述标准地区代码与所述待映射历史地区代码之间的第二映射关系。
2.根据权利要求1所述的方法,其特征在于,所述在所述标准地区代码集合中,查询是否存在与所述历史地区名称对应的标准地区名称,包括:
确定所述待映射历史地区代码中的第一级别代码;
根据所述待映射历史地区代码中的第一级别代码,在所述标准地区代码集合中筛选出所述待映射历史地区代码对应的参考地区代码,并根据所述标准地区代码与所述标准地区名称之间的对应关系,确定所述参考地区代码对应的参考地区名称;其中,所述待映射历史地区代码中的第一级别代码与所述参考地区代码中的第一级别代码相同;
根据所述历史地区名称中的第二范围名称和第二范围级别,确定所述历史地区名称对应的第二级别地区范围,并根据所述参考地区名称中的第二范围名称和第二范围级别,确定所述参考地区名称对应的第二级别地区范围;其中,第二级别地区范围由第二范围名称和第二范围级别组成,且与第二级别代码对应;
确定是否存在与所述历史地区名称对应相同的第二级别地区范围的所述参考地区名称;若存在,则确定标准地区代码集合中存在与所述历史地区名称对应的标准地区名称。
3.根据权利要求2所述的方法,其特征在于,所述方法还包括:
若在各个参考地区名称中,不存在与所述历史地区名称对应相同的第二级别地区范围的所述参考地区名称,则分别确定所述历史地区名称中的第二范围名称,以及各个参考地区名称中的第二范围名称;
若在各个参考地区名称中,存在与所述历史地区名称对应相同第二范围名称的参考地区名称,则确定所述参考地区名称与所述历史地区名称对应,并确定标准地区代码集合中存在与所述历史地区名称对应的标准地区名称。
4.根据权利要求1所述的方法,其特征在于,所述当所述标准地区代码集合中不存在与所述待映射历史地区代码相同的标准地区代码时,在所述标准地区代码集合中,查询是否存在与所述历史地区名称对应的标准地区名称包括:
当所述标准地区代码集合中不存在与所述待映射历史地区代码相同的标准地区代码时,提取所述待映射历史地区代码中的第一级别代码和第三级别代码,生成组合代码;
根据所述组合代码和曾用代码集合,确定所述组合代码是否为曾用代码;其中,所述曾用代码集合中记录有曾用代码与各个标准地区代码中的第一级别代码之间的对应关系;
当所述组合代码为曾用代码时,根据所述组合代码对应的第一级别代码,在所述标准地区代码集合中确定所述组合代码对应的候选地区代码以及候选地区名称,并查询是否存在与所述历史地区名称对应的候选地区名称;其中,所述候选地区代码与所述候选地区名称一一对应,所述组合代码对应的第一级别代码与所述待映射历史地区代码中的第一级别代码不同;
当所述组合代码不是曾用代码时,在所述标准地区代码集合中,查询是否存在与所述历史地区名称对应的标准地区名称。
5.根据权利要求4所述的方法,其特征在于,所述当所述组合代码为曾用代码时,根据所述组合代码对应的第一级别代码,在所述标准地区代码集合中确定所述组合代码对应的候选地区代码以及候选地区名称,并在所述候选地区名称中查询与所述历史地区名称对应的标准地区名称包括:
当所述组合代码为曾用代码时,根据所述曾用代码集合确定所述组合代码对应的第一级别代码;
通过所述组合代码对应的第一级别代码,从所述标准地区代码集合中筛选所述候选地区代码,并根据标准地区代码集合中所述标准地区代码与所述标准地区名称之间的对应关系,确定所述候选地区代码对应的候选地区名称;其中,所述候选地区代码中的第一级别代码与所述组合代码对应的第一级别代码相同;
确定各个候选地区名称中的各个范围名称,以及所述历史地区名称中的第二范围名称;
若各个候选地区名称中,存在与所述历史地区名称中的第二范围名称相同的范围名称,则根据所述范围名称与所述候选地区名称之间的对应关系,确定所述历史地区名称与所述候选地区名称对应,并建立所述待映射历史地区代码与所述候选地区代码之间的第三映射关系。
6.根据权利要求5所述的方法,其特征在于,所述方法还包括:
若所述待映射历史地区代码对应有多个所述第三映射关系,则删除所述待映射历史地区代码对应的所有所述第三映射关系;
根据默认补位代码与所述组合代码对应的第一级别代码,生成模糊地区代码,并确定所述待映射历史地区代码与所述模糊地区代码之间的第四映射关系;其中,所述模糊地区代码长度与所述标准地区代码的长度相同。
7.根据权利要求1所述的方法,其特征在于,所述方法还包括:
当所述标准地区代码集合中不存在与所述历史地区名称对应标准地区名称时,根据默认补位代码以及所述待映射历史地区代码中的第一级别代码,生成模糊地区代码,并确定所述模糊地区代码与所述待映射历史地区代码之间的第四映射关系;其中,所述模糊地区代码长度与所述标准地区代码的长度相同。
8.根据权利要求1所述的方法,其特征在于,所述方法还包括:
统计所述待映射历史地区代码对应的映射关系数量,若所述映射关系数量大于1,则删除所述待映射历史地区代码对应的所有映射关系;
当所述待映射历史地区代码对应的映射关系数量为0时,根据默认补位代码和所述待映射历史地区代码对应的第一级别代码,生成所述待映射历史地区代码对应的模糊地区代码。
9.一种地区代码映射装置,其特征在于,所述装置包括:
获取单元,用于:获取待映射历史地区代码,以及所述待映射历史地区代码对应的历史地区名称;其中,所述历史地区名称由多个范围级别和与所述范围级别一一对应的范围名称组成;
第一查询单元,用于:在标准地区代码集合中,查询是否存在与所述待映射历史地区代码相同的标准地区代码;若存在,则确定所述待映射历史地区代码与所述标准地区代码之间的第一映射关系;其中,所述标准地区代码集合中记录有所述标准地区代码以及与所述标准地区代码一一对应的标准地区名称,所述标准地区名称由多个范围级别和与所述范围级别一一对应的范围名称组成;
第二查询单元,用于:当所述标准地区代码集合中不存在与所述待映射历史地区代码相同的标准地区代码时,在所述标准地区代码集合中,查询是否存在与所述历史地区名称对应的标准地区名称;若存在,则根据所述标准地区名称与所述标准地区代码之间的对应关系,确定所述标准地区代码与所述待映射历史地区代码之间的第二映射关系。
10.根据权利要求9所述的装置,其特征在于,所述第二查询单元具体用于:
确定所述待映射历史地区代码中的第一级别代码;
根据所述待映射历史地区代码中的第一级别代码,在所述标准地区代码集合中筛选出所述待映射历史地区代码对应的参考地区代码,并根据所述标准地区代码与所述标准地区名称之间的对应关系,确定所述参考地区代码对应的参考地区名称;其中,所述待映射历史地区代码中的第一级别代码与所述参考地区代码中的第一级别代码相同;
根据所述历史地区名称中的第二范围名称和第二范围级别,确定所述历史地区名称对应的第二级别地区范围,并根据所述参考地区名称中的第二范围名称和第二范围级别,确定所述参考地区名称对应的第二级别地区范围;其中,第二级别地区范围由第二范围名称和第二范围级别组成,且与第二级别代码对应;
确定是否存在与所述历史地区名称对应相同的第二级别地区范围的所述参考地区名称;若存在,则确定标准地区代码集合中存在与所述历史地区名称对应的标准地区名称。
CN202410095551.4A 2024-01-23 2024-01-23 一种地区代码映射方法及装置 Pending CN117931890A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202410095551.4A CN117931890A (zh) 2024-01-23 2024-01-23 一种地区代码映射方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202410095551.4A CN117931890A (zh) 2024-01-23 2024-01-23 一种地区代码映射方法及装置

Publications (1)

Publication Number Publication Date
CN117931890A true CN117931890A (zh) 2024-04-26

Family

ID=90757141

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202410095551.4A Pending CN117931890A (zh) 2024-01-23 2024-01-23 一种地区代码映射方法及装置

Country Status (1)

Country Link
CN (1) CN117931890A (zh)

Similar Documents

Publication Publication Date Title
CN108647357B (zh) 数据查询的方法及装置
CN112882699B (zh) 基于流程配置引擎的业务处理方法、装置、设备及介质
CN111198976B (zh) 云上资产关联分析系统、方法、电子设备及介质
CN111339151B (zh) 在线考试方法、装置、设备及计算机存储介质
CN111899821A (zh) 处理医疗机构数据的方法、构建数据库的方法和装置
CN110674832B (zh) 互联网用户所属企业的识别方法、装置和终端
CN111414528B (zh) 确定设备标识的方法、装置、存储介质及电子设备
CN107798450B (zh) 业务分配方法和装置
CN113159118A (zh) 物流数据指标的处理方法、装置、设备及存储介质
CN109829769B (zh) 一种电子发票查重方法及系统
CN111724110A (zh) 地址信息处理方法、装置、计算机设备和存储介质
CN117931890A (zh) 一种地区代码映射方法及装置
CN116204540A (zh) 操作日志记录方法、装置、设备及存储介质
CN110502529B (zh) 数据处理方法、装置、服务器及存储介质
CN110457332B (zh) 一种信息处理方法及相关设备
CN113449002A (zh) 车辆推荐方法、装置、电子设备及存储介质
CN112785315B (zh) 批量注册识别方法及装置
CN117494702B (zh) 一种结合rpa和ai的数据推送方法及系统
CN112347095B (zh) 数据表的处理方法、装置和服务器
CN112165530B (zh) 一种服务调用关系分析方法及装置
CN110310020B (zh) 基于数据分析的项目方案管理方法、相关装置及存储介质
CN115225609A (zh) 用户数据处理方法及装置、服务器
CN117009698A (zh) 多需求的用户端页面更新方法、装置、设备及介质
CN115834537A (zh) 域名识别方法、装置、电子设备和介质
CN117635357A (zh) 用于保险业务的佣金结算方法、装置、设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination