CN111724110A - 地址信息处理方法、装置、计算机设备和存储介质 - Google Patents
地址信息处理方法、装置、计算机设备和存储介质 Download PDFInfo
- Publication number
- CN111724110A CN111724110A CN202010548773.9A CN202010548773A CN111724110A CN 111724110 A CN111724110 A CN 111724110A CN 202010548773 A CN202010548773 A CN 202010548773A CN 111724110 A CN111724110 A CN 111724110A
- Authority
- CN
- China
- Prior art keywords
- field value
- address
- field
- platform
- relationship table
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000010365 information processing Effects 0.000 title claims abstract description 20
- 238000003672 processing method Methods 0.000 title claims abstract description 13
- 238000000034 method Methods 0.000 claims abstract description 38
- 238000004590 computer program Methods 0.000 claims description 32
- 238000012545 processing Methods 0.000 claims description 17
- 230000008859 change Effects 0.000 claims description 16
- 230000011218 segmentation Effects 0.000 claims description 8
- 238000006243 chemical reaction Methods 0.000 claims description 5
- 238000004458 analytical method Methods 0.000 claims description 2
- 238000000605 extraction Methods 0.000 claims description 2
- 230000003993 interaction Effects 0.000 abstract description 17
- 230000008569 process Effects 0.000 description 7
- 238000012937 correction Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 4
- 230000004048 modification Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 210000001503 joint Anatomy 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000002035 prolonged effect Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/08—Logistics, e.g. warehousing, loading or distribution; Inventory or stock management
- G06Q10/083—Shipping
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/903—Querying
- G06F16/90335—Query processing
- G06F16/90344—Query processing by using string matching techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- General Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Artificial Intelligence (AREA)
- Health & Medical Sciences (AREA)
- Economics (AREA)
- Databases & Information Systems (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Tourism & Hospitality (AREA)
- Strategic Management (AREA)
- Quality & Reliability (AREA)
- Operations Research (AREA)
- Human Resources & Organizations (AREA)
- Entrepreneurship & Innovation (AREA)
- Development Economics (AREA)
- Data Mining & Analysis (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
本申请涉及一种地址信息处理方法、装置、计算机设备和存储介质。所述方法包括:获取第一平台地址信息;对第一平台地址信息进行解析,得到表征各级行政区域的各第一字段;从各第一字段中分别提取对应的第一字段值;根据各第一字段值获取与各第一字段值对应的第二字段值;其中,第二字段值为符合第二平台预设标准的字段值;将各第二字段值关联对应的第二字段,根据各第二字段生成第二平台地址信息。采用本方法能够在多平台之间地址信息交互时,提高地址信息交互的效率。
Description
技术领域
本申请涉及数据处理技术领域,特别是涉及一种地址信息处理方法、装置、计算机设备和存储介质。
背景技术
随着数据处理技术的发展,基于数据处理技术的电子商务也在不断发展。在电商领域,由于多个电商平台之间有相互合作入驻的迫切需要,各平台之间的数据和信息的相互融合成为了一种大的趋势。
例如,顾客下订单后选择的配送地址,由于不同电商平台对于该配送地址样式展示和录入规则不尽相同。有些平台是通过级联菜单方式,依次选择省、市、区等,详细地址需要手工填写;有些平台的省市区和详细地址都需要手工填写。对于省、市、区字段的存储,有些平台存储的是完整信息,即包含行政区划单位词,如“江苏省”;而有些平台存储的不是完整信息,即不包含行政区划单位词,如“江苏”。所以,不同平台之间信息交换时,本平台对其他平台中的地址信息的识别和解析存在困难,导致不同平台之间不能正确、高效地进行地址信息的交互。
发明内容
基于此,有必要针对上述技术问题,提供一种能够提高多平台之间地址信息交互效率的地址信息处理方法、装置、计算机设备和存储介质。
一种地址信息处理方法,上述方法包括:获取第一平台地址信息;对第一平台地址信息进行解析,得到表征各级行政区域的各第一字段;从各第一字段中分别提取对应的第一字段值;根据各第一字段值获取与各第一字段值对应的第二字段值;其中,第二字段值为符合第二平台预设标准的字段值;将各第二字段值关联对应的第二字段,根据各第二字段生成第二平台地址信息。
在一个实施例中,对第一平台地址信息进行解析,得到表征各级行政区域的各第一字段,包括:判断第一平台地址信息的字段格式;若第一平台地址信息的字段格式不是以表征各级行政区域的各字段为单位的多字段格式;识别第一平台地址信息中的表征行政区划单位的各关键词;根据各关键词将第一平台地址信息拆分为多个与各关键词分别对应的表征各级行政区域的各第一字段。
在一个实施例中,根据各第一字段值获取与各第一字段值对应的第二字段值,包括:对各第一字段值分别进行语义识别,将各第一字段值对应的语义识别结果值作为对应的各第二字段值。
在一个实施例中,识别各第一字段值中的表征行政区划单位的词,将表征行政区划单位的词进行删除,将删除了表征行政区划单位的词的各第一字段值作为对应的各第二字段值。
在一个实施例中,将各第二字段值关联对应的第二字段之前,还包括:
根据地址关系表确定存在错误的第二字段值,并对存在错误的第二字段值进行更改;其中,地址关系表中包含表征区域名称和区域所属关系的字段值;将各第二字段值关联对应的第二字段,包括:将更改后的第二字段值关联对应的第二字段。
在一个实施例中,第二字段值包括第二一字段值、第二二字段值和第二三字段值;地址关系表包括第一地址关系表、第二地址关系表和第三地址关系表;根据地址关系表确定存在错误的第二字段值,并对存在错误的第二字段值进行更改,包括:
将第二一字段值与第一地址关系表的字段值进行匹配;若第二一字段值在第一地址关系表中匹配成功,根据第二一字段值获取与第二一字段值对应的第二地址关系表;将第二二字段值与第二地址关系表中的字段值进行匹配;若第二二字段值在第二地址关系表中匹配成功,根据第二二字段值获取与第二二字段值对应的第三地址关系表;将第二三字段值与第三地址关系表中的字段值进行匹配;若第二三字段值在第三地址关系表中匹配不成功,将第二三字段值进行分词处理,得到第二三字段值的多个子字段值;将各子字段值分别在第三地址关系表中进行匹配,若有至少一个子字段值匹配成功,采用与子字段值匹配成功的字段值替换第二三字段值,以对存在错误的第二字段值进行更改。
在一个实施例中,地址关系表还包括第四地址关系表和第五地址关系表,上述方法还包括:若第二一字段值在第一地址关系表中匹配不成功,获取第四地址关系表;将第二二字段值与第四地址关系表中的字段值进行匹配;若第二二字段值在第四地址关系表中匹配成功,根据第二二字段值获取与第二二字段值对应的第五地址关系表;将第二三字段值与第五地址关系表中的字段值进行匹配;若第二三字段值在第五地址关系表中匹配成功,根据第二二字段值和第二三字段值获取第一替换字段值,用第一替换字段值替换第二一字段值,以对存在错误的第二字段值进行更改。
在一个实施例中,地址关系表还包括第六地址关系表,上述方法还包括:若第二二字段值在第二地址关系表中匹配不成功,根据第二一字段值获取第六地址关系表;将第二三字段值与第六地址关系表中的字段值进行匹配;若第二三字段值在第六地址关系表中匹配成功,根据第二一字段值和第二三字段值获取第二替换字段值,用第二替换字段值替换第二二字段值,以对存在错误的第二字段值进行更改。
在一个实施例中,地址关系表还包括第七地址关系表,上述方法还包括:若第二三字段值在第六地址关系表中匹配不成功,根据第二二字段值获取第七地址关系表;将第二三字段值与第七地址关系表中的字段值进行匹配;若第二三字段值在第七地址关系表中匹配成功。
在一个实施例中,根据第二字段生成第二平台地址信息,包括:将各第二字段转义为对应的第二平台的地址编码,根据各地址编码生成第二平台地址信息。
一种地址信息处理装置,上述装置包括:第一地址获取模块,用于获取第一平台地址信息;第一地址解析模块,用于对第一平台地址信息进行解析,得到表征各级行政区域的各第一字段;字段值提取模块,用于从各第一字段中分别提取对应的第一字段值;字段值转换模块,用于根据各第一字段值获取与各第一字段值对应的第二字段值;其中,第二字段值为符合第二平台预设标准的字段值;第二地址生成模块,用于将各第二字段值关联对应的第二字段,根据各第二字段生成第二平台地址信息。
一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现上述任一方法的步骤。
一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述任一方法的步骤。
上述地址信息处理方法、装置、计算机设备和存储介质,通过对第一平台地址信息进行解析,得到第一平台地址信息中表征各级行政区域的各字段以及各字段对应的字段值,对各字段值进行符合第二平台预设标准的转换,并关联对应的第二字段以生成第二平台地址信息,可以将第一平台地址信息转换为符合第二平台标准的第二平台地址信息,在多平台地址信息交互的过程中,提高地址信息交互的流畅性、减少对接的时间,从而提高地址信息交互的效率。
附图说明
图1为一个实施例中地址信息处理方法的应用环境图;
图2为一个实施例中地址信息处理方法的流程示意图;
图3为一个实施例中根据地址关系表确定存在错误的第二字段值,并对存在错误的第二字段值进行更改的步骤的流程示意图;
图4为另一个实施例中根据地址关系表确定存在错误的第二字段值,并对存在错误的第二字段值进行更改的步骤的流程示意图;
图5为再一个实施例中根据地址关系表确定存在错误的第二字段值,并对存在错误的第二字段值进行更改的步骤的流程示意图;
图6为一个实施例中地址信息处理装置的结构框图;
图7为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅用以解释本申请,并不用于限定本申请。
本申请提供的地址信息处理方法,可以应用于如图1所示的应用环境中。其中,第一平台102通过网络与第二平台104进行通信。在多平台地址信息交互的时候,第一平台102向第二平台104发送第一平台地址信息,第二平台104获取第一平台地址信息,对第一平台地址信息进行解析,得到表征各级行政区域的各第一字段;第二平台104从各第一字段中分别提取对应的第一字段值;第二平台104根据各第一字段值获取与各第一字段值对应的第二字段值;其中,第二字段值为符合第二平台预设标准的字段值;第二平台104将各第二字段值关联对应的第二字段,例如,可以将第二字段值1关联表征第一层级行政区域的第二字段1,将第二字段值2关联表征第二层级行政区域的第二字段2等,并根据各第二字段生成第二平台地址信息,进一步还可以将第二平台地址信息存入第二平台地址信息表中并存入数据库。其中,第一平台102以及第二平台104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
在一个实施例中,如图2所示,提供了一种地址信息处理方法,该方法可以应用于图1中的第二平台,包括以下步骤:步骤S10:获取第一平台地址信息。
其中,第一平台地址信息可以是从相对于第二平台的其他任何平台录入的地址信息。具体地,可以是在第二平台与第一平台进行地址信息的交互时,服务器获取到从第一平台发送的第一平台地址信息。
步骤S20:对第一平台地址信息进行解析,得到表征各级行政区域的各第一字段。
其中,各级行政区域可以包括省/自治区等省级的行政区域、市/自治州等市级的行政区域或区/县/自治县等区级的行政区域等。
具体地,在获取到第一平台地址信息后,通过对第一平台地址信息进行解析,从第一平台地址信息中提取出表征省级行政区域的省字段、表征市级行政区域的市字段和表征区级行政区域的区字段等,将该省字段、市字段和区字段作为各第一字段。由于不同电商平台对于配送地址信息的展示样式和录入规则不尽相同,有些平台是通过级联菜单方式,依次选择省、市、区等,这种录入形式的地址信息是以省、市、区等为单位的多字段格式,这种情况下,可以直接将第一平台地址信息中的省、市、区字段作为表征各级行政区域的各第一字段;有些平台的省、市、区和详细地址都需要手工填写,这种录入形式的地址信息为单字段形式,即一个字段中包含所有信息,这种情况下,需要对该字段中的信息进行识别和分析,并将单字段拆分为表征各级行政区域的多个第一字段。综上,可以通过对第一平台地址信息进行解析,判断出第一平台地址信息的字段格式,根据字段格式的不同以不同的方式确定出表征各级行政区域的各第一字段。
在一个实施例中,对第一平台地址信息进行解析,得到表征各级行政区域的各第一字段,包括:判断第一平台地址信息的字段格式;若第一平台地址信息的字段格式不是以表征各级行政区域的各字段为单位的多字段格式;识别第一平台地址信息中的表征行政区划单位的各关键词;根据各关键词将第一平台地址信息拆分为多个与各关键词分别对应的表征各级行政区域的各第一字段。
在本实施例中,具体地,通过判断第一平台地址信息的字段格式,可以确定出第一平台地址信息是以表征各级行政区域的各字段为单位的多字段格式,还是包含省、市、区和详细地址等全部信息的单字段格式,如果第一平台地址信息是单字段格式,则从第一平台地址信息中识别表征行政区划单位的各关键词,这些关键词可以为“省”、“自治区”、“市”、“自治州”、“区”、“县”或“自治县”等行政区划单位词,以这些关键词为界将该第一平台地址信息拆分为多个字段,每一字段根据其对应的关键词被分别确定为省字段、市字段、区字段等表征各级行政区域的第一字段。
本实施例,通过判断字段格式并将单字段的地址信息进行识别和拆分,从而从第一平台地址信息中获取到表征各级行政区域的各第一字段,可以实现针对不同平台不同格式的地址信息进行对应的处理,即使第一平台地址信息为单字段格式的情况下也可以得到适用,提高了各平台地址信息之间的兼容性,从而可以提高多平台地址信息交互的效率。
步骤S30:从各第一字段中分别提取对应的第一字段值。
其中,第一字段值为第一字段中用于标识行政区域的具体名称的字段值。一般情况下,字段中包含字段名和字段值,例如,字段名可以是“省”、“市”等行政区划单位词,字段值可以是对应的“江苏省”、“南京市”等标识行政区域的具体名称的词,整个字段为表征省级行政区域的省字段。
步骤S40:根据各第一字段值获取与各第一字段值对应的第二字段值;其中,第二字段值为符合第二平台预设标准的字段值。
其中,第二字段值为与第一字段值对应且符合第二平台预设标准的字段值,由于各个平台对于地址信息的存储规则不同,有些平台存储的地址信息是包含“省”、“市”、或“区”等行政区划单位词的完整的字段值,例如,省字段的字段值为“江苏省”;而有些平台存储的地址信息是不包含行政区划单位词的非完整字段值,例如省字段的字段值为“江苏”。
由于各平台的地址信息存储规则不同导致各平台在地址信息的交换时彼此不能有效识别对方平台的地址信息,通过将第一字段值转化为符合第二平台预设标准的第二字段值,可以实现不同平台的不同形式的字段值的标准化处理,通过标准化处理可以将不同形式的字段值转化为能快速、准确地被第二平台识别的标准字段值,在多平台地址信息交互的时候,提高第二平台对各字段值准确识别的可能性。
具体地,可以利用大数据语义识别等对第一字段值进行语义识别,从而获取符合第二平台预设标准的语义完整的第二字段值,也可以通过对各第一字段值进行删除或添加预设词等将第一字段值进行统一化处理,得到符合第二平台预设标准的形式统一的第二字段值。
在一个实施例中,根据各第一字段值获取与各第一字段值对应的第二字段值,包括:对各第一字段值分别进行语义识别,将各第一字段值对应的语义识别结果值作为对应的各第二字段值。
在本实施例中,通过利用大数据语义识别技术,可以得到各第一字段值所分别对应的语义识别结果值。由于地址信息被录入的时候,用户可能会以自己习惯的表达方式进行录入,所以录入的区域名称可能不是标准的行政区域名称,例如,用户在某一平台会将“呼和浩特市”简单地录入为“呼市”,但有些平台并不能对“呼市”这样的简称进行准确、快速的识别,从而导致地址信息交互的过程中准确率下降、交互时间延长。
本实施例,通过对各第一字段值分别进行语义识别,可以将由于人工输入而导致的语义不完整的区域名称转换为语义完整的标准的行政区域名称,从而提高第二平台对各第一字段值识别的准确性,进而提高地址信息交互的效率。
在一个实施例中,识别各第一字段值中的表征行政区划单位的词,将表征行政区划单位的词进行删除,将删除了表征行政区划单位的词的各第一字段值作为对应的各第二字段值。
在本实施例中,由于各个平台对于地址信息的存储规则不同,有些平台存储的地址信息是包含“省”、“市”、“区”等行政区划单位词的完整的字段值,例如,省字段的字段值为“江苏省”;而有些平台存储的地址信息是不包含行政区划单位词的非完整字段值,例如省字段的字段值为“江苏”。
具体地,通过识别行政区划单位词并将行政区划单位词进行统一删除,可以规范各字段值的形式,由于字段值的形式不同,在字段值的识别上将消耗不同时间,通过将没有实质含义的行政区划单位词进行删除,可以减少因对行政区划单位词的识别而产生的额外的时间消耗,从而可以提高第二平台对外平台地址信息的识别效率。
步骤S50:将各第二字段值关联对应的第二字段,根据各第二字段生成第二平台地址信息。
其中,第二字段为符合第二平台标准的表征各级行政区域的各字段。例如,可以将第二字段值“江苏”关联对应的表征省级行政区域的省字段;将第二字段值“南京”关联对应的表征市级行政区域的市字段;将第二字段值“玄武”关联对应的表征区级行政区域的区字段等。进一步地,还可以将除省市区之外的详细地址关联详细地址字段,然后根据各字段生成第二平台地址信息,以使第二平台利用该第二平台地址信息在本平台之内进行后续的作业。
上述地址信息处理方法,通过对第一平台地址信息进行解析,得到第一平台地址信息中表征各级行政区域的各字段以及各字段对应的字段值,对各字段值进行符合第二平台预设标准的转换,并关联对应的第二字段以生成第二平台地址信息,可以将第一平台地址信息转换为符合第二平台标准的第二平台地址信息,在多平台地址信息交互的过程中,提高地址信息交互的流畅性、减少对接的时间,从而提高地址信息交互的效率。
在一个实施例中,将各第二字段值关联对应的第二字段之前,还包括:
根据地址关系表确定存在错误的第二字段值,并对存在错误的第二字段值进行更改;其中,地址关系表中包含表征区域名称和区域所属关系的字段值;将各第二字段值关联对应的第二字段,包括:将更改后的第二字段值关联对应的第二字段。
在本实施例中,由于第一平台的用户在进行地址信息的录入时,可能存在忘记在某一字段录入字段值的情况,从而导致某一字段的字段值为空;也可能在录入的时候存在错别字,从而导致某一字段的字段值与标准区域名称不符,也可能因错误理解各字段之间的所属关系而导致某一字段值与其他字段值之间的所属关系不匹配等,因此,根据各第一字段值得到的各第二字段值也可能因存在上述错误,而难以被准确、有效地识别。因此,在将各第二字段值关联对应的第二字段之前,通过对第二字段值进行纠错,可以提高地址信息的准确度和可靠度,在多平台交互过程中提高地址信息交互的流畅性和准确性。
具体地,利用地址关系表,将各第二字段值分别在对应的地址关系表中与行政区域的标准的名称字段值进行匹配,从而确定出存在错误的第二字段值并进行更正,匹配的过程中,可以采用在各对应的地址关系表中分别建立索引的形式,提高匹配效率。
在一个实施例中,第二字段值包括第二一字段值、第二二字段值和第二三字段值;地址关系表包括第一地址关系表、第二地址关系表和第三地址关系表。
如图3所示,根据地址关系表确定存在错误的第二字段值,并对存在错误的第二字段值进行更改,包括:
步骤S201:将第二一字段值与第一地址关系表的字段值进行匹配。
若第二一字段值在第一地址关系表中匹配成功,执行步骤S202:根据第二一字段值获取与第二一字段值对应的第二地址关系表。
步骤S203:将第二二字段值与第二地址关系表中的字段值进行匹配。
若第二二字段值在第二地址关系表中匹配成功,执行步骤S204:根据第二二字段值获取与第二二字段值对应的第三地址关系表。
步骤S205:将第二三字段值与第三地址关系表中的字段值进行匹配。
若第二三字段值在第三地址关系表中匹配不成功,执行步骤S206:将第二三字段值进行分词处理,得到第二三字段值的多个子字段值;将各子字段值分别在第三地址关系表中进行匹配,若有至少一个子字段值匹配成功,采用与子字段值匹配成功的字段值替换第二三字段值,以对存在错误的第二字段值进行更改。
在本实施例中,第二一字段值为表征第一层级行政区域的字段所对应的字段值,例如可以是表征省级行政区域的省字段所对应的字段值。第二二字段值为表征第二层级行政区域的字段所对应的字段值,例如可以是表征市级行政区域的市字段所对应的字段值。第二三字段值为表征第三层级行政区域的字段所对应的字段值,例如可以是表征区级行政区域的区字段所对应的字段值。第一地址关系表为包含所有的第一层级行政区域的名称字段值的地址关系表,例如可以是包含所有省级行政区域的名称字段值的省关系表。第二地址关系表为第二一字段值所标识的第一层级行政区域所对应的该第一层级行政区域下属的第二层级行政区域的地址关系表,包含该第一层级行政区域下属的所有的第二层级行政区域的名称字段值,例如可以是第二一字段值所标识的省级行政区域所对应的该省级行政区域下属的市关系表。第三地址关系表为第二二字段值所标识的第二层级行政区域所对应的该第二层级行政区域下属的第三层级行政区域的地址关系表,包含该第二层级行政区域下属的所有的第三层级行政区域的名称字段值,例如可以是第二二字段值所标识的市级行政区域所对应的该市级行政区域下属的区关系表。
具体地,例如,第二一字段值为江苏,第二二字段值为南京,第二三字段值为宣武;将第二一字段值与省关系表中的省级行政区域的名称字段值进行匹配,若第二一字段值“江苏”与省关系表中的省级行政区域的名称字段值“江苏”匹配成功,则根据第二一字段值“江苏”获取江苏省下属的市关系表,若第二二字段值“南京”在江苏省的市关系表中与市级行政区域的名称字段值“南京”匹配成功,则根据第二二字段值“南京”获取南京市的区关系表,由于第二三字段值为“宣武”,但正确的区级行政区域的名称字段值为“玄武”,所以第二三字段值在南京市的区关系表中匹配不成功,这时,可以将“宣武”进行分词处理,拆分为“宣”和“武”,再分别将“宣”和“武”在南京市的区关系表中进行匹配,由于“武”与南京市的区关系表中的“玄武”中的“武”相匹配,从而与区级行政区域的名称字段值“玄武”匹配成功,采用“玄武”替换第二三字段值“宣武”,从而实现对第二三字段值的更正。其中,可以采用Elasticsearch等对第二三字段值进行分词处理。
本实施例,通过分词处理,可以扩大对字段值索引的范围,只要字段值中存在一个正确的字,就可以索引到与该字段值相匹配的正确的名称字段值,实现对存在错误的字段值的有效更正。
在一个实施例中,地址关系表还包括第四地址关系表和第五地址关系表,如图5所示,上述方法还包括:
若第二一字段值在第一地址关系表中匹配不成功,执行步骤S301:获取第四地址关系表。
步骤S302:将第二二字段值与第四地址关系表中的字段值进行匹配。
若第二二字段值在第四地址关系表中匹配成功,执行步骤S303:根据第二二字段值获取与第二二字段值对应的第五地址关系表。
步骤S304:将第二三字段值与第五地址关系表中的字段值进行匹配。
若第二三字段值在第五地址关系表中匹配成功,执行步骤S305:根据第二二字段值和第二三字段值获取第一替换字段值,用第一替换字段值替换第二一字段值,以对存在错误的第二字段值进行更改。
在本实施中,第四地址关系表为包含所有的第二层级的行政区域的名称字段值的地址关系表,例如可以是包含所有市级行政区域的名称字段值的市关系表。第五地址关系表为第二二字段值所标识的第二层级的行政区域下属的第三层级的行政区域的地址关系表,包含该第二层级的行政区域下属的所有的第三层级的行政区域的名称字段值,例如可以是第二二字段值所标识的市级行政区域所对应的该市级行政区域下属的区关系表。
具体地,例如,第二一字段值为空,第二二字段值为南京,第二三字段值为玄武;将第二一字段值与省关系表中的省级行政区域的名称字段值进行匹配,由于第二一字段值为空,所以匹配不成功;这时可以进一步获取到市关系表,将第二一字段值与市关系表中的市级行政区域的名称字段值进行匹配,若第二二字段值“南京”在市关系表中与市级行政区域的名称字段值“南京”匹配成功,则根据第二二字段值“南京”获取南京市的区关系表,将第二三字段值与南京市的区关系表中的区级行政区域的名称字段值进行匹配,若第二三字段值“玄武”在南京市的区关系表中与区级行政区域的名称字段值“玄武”匹配成功,则根据第二二字段值“南京”和第二三字段值“玄武”从地址关系表中确定出其所属的省级行政区域的名称字段值“江苏”,将“江苏”作为第一替换字段值,对字段值为空的第二一字段值进行替换,以完成对第二一字段值的更改。
本实施例,通过将字段值在地址关系表中进行匹配,获取存在错误的字段值,并根据匹配成功的字段值所表征的行政区域之间的所属关系对存在错误的字段值进行更改,可以提高地址信息的准确度,从而提高第二平台对该地址信息识别的准确率。
在一个实施例中,地址关系表还包括第六地址关系表,如图4所示,上述方法还包括:
若第二二字段值在第二地址关系表中匹配不成功,执行步骤S401:根据第二一字段值获取第六地址关系表。
步骤S402:将第二三字段值与第六地址关系表中的字段值进行匹配。
若第二三字段值在第六地址关系表中匹配成功,执行步骤S403:根据第二一字段值和第二三字段值获取第二替换字段值,用第二替换字段值替换第二二字段值,以对存在错误的第二字段值进行更改。
在本实施例中,第六地址关系表为第二一字段值所标识的第一层级行政区域下属的第三层级行政区域的地址关系表,包含该第一层级行政区域下属的所有的第三层级行政区域名称字段值,例如可以是第二一字段值所标识的省级行政区域所对应的该省级行政区域下属的区关系表。
具体地,例如,第二一字段值为江苏,第二二字段值为广州,第二三字段值为宣武;将第二一字段值与省关系表中的省级行政区域的名称字段值进行匹配,若第二一字段值“江苏”与省关系表中的省级行政区域的名称字段值“江苏”匹配成功,则根据第二一字段值“江苏”获取江苏省下属的市关系表,当第二二字段值“广州”在江苏省的市关系表中与市级行政区域的名称字段值匹配不成功时,可以进一步根据第二一字段值“江苏”获取江苏省下属的区关系表,将第二三字段值在江苏省的区关系表中进行匹配,若第二三字段值“玄武”在江苏省的区关系表中与区级行政区域的名称字段值“玄武”匹配成功,则根据第二一字段值“江苏”和第二三字段值“玄武”从地址关系表中确定出与其所属关系匹配的市级行政区域的名称字段值“南京”,将“南京”作为第二替换字段值,将字段值为“广州”的第二二字段值替换为“南京”,以完成对第二二字段值的更改。
本实施例,通过将字段值在地址关系表中进行匹配,获取存在错误的字段值,并根据匹配成功的字段值所表征的行政区域之间的所属关系对存在错误的字段值进行更改,可以提高地址信息的准确度,从而提高第二平台对该地址信息识别的准确率。
在一个实施例中,地址关系表还包括第七地址关系表,如图4所示,上述方法还包括:
若第二三字段值在第六地址关系表中匹配不成功,执行步骤S404:根据第二二字段值获取第七地址关系表。
步骤S405:将第二三字段值与第七地址关系表中的字段值进行匹配。
若第二三字段值在第七地址关系表中匹配成功,执行步骤S406:根据第二二字段值和第二三字段值获取第三替换字段值,用第三替换字段值替换第二一字段值。
在本实施例中,第七地址关系表为第二二字段值所标识的第二层级行政区域所对应的该第二层级行政区域下属的第三层级行政区域的地址关系表,包含该第二层级行政区域下属的所有的第三层级行政区域的名称字段值,例如可以是第二二字段值所标识的市级行政区域所对应的该市级行政区域下属的区关系表。
具体地,例如,第二一字段值为江苏,第二二字段值为广州,第二三字段值为越秀;将第二一字段值与省关系表中的省级行政区域的名称字段值进行匹配,若第二一字段值“江苏”与省关系表中的省级行政区域的名称字段值“江苏”匹配成功,则根据第二一字段值“江苏”获取江苏省下属的市关系表,当第二二字段值“广州”在江苏省的市关系表中与市级行政区域的名称字段值匹配不成功时,根据第二一字段值“江苏”获取江苏省下属的区关系表,将第二三字段值与江苏省的区关系表中的区级行政区域的名称字段值进行匹配,当第二三字段值“越秀”在江苏省的区关系表中与区级行政区域的名称字段值匹配不成功时,还可以进一步根据第二二字段值“广州”获取广州市下属的区关系表,将第二三字段值“越秀”在广州市的区关系表中与区级行政区域的名称字段值进行匹配,若匹配成功,从地址关系表中确定出与其所属关系匹配的省级行政区域的名称字段值“广东”,将“广东”作为第三替换字段值,将字段值为“江苏”的第二一字段值替换为“广东”,以完成对第二一字段值的更改。
本实施例,通过将字段值在地址关系表中进行匹配,获取存在错误的字段值,并根据匹配成功的字段值所表征的行政区域之间的所属关系对存在错误的字段值进行更改,可以提高地址信息的准确度,从而提高第二平台对该地址信息识别的准确率。
在一个实施例中,根据第二字段生成第二平台地址信息,包括:将各第二字段转义为对应的第二平台的地址编码,根据各地址编码生成第二平台地址信息。
本实施例,由于在系统内部之间,经过转义的地址编码数据可以更加快速、流畅地进行传送,因此可以将各第二字段转义为第二平台对应的地址编码后再生成第二平台地址信息,从而提高该地址信息在第二平台的内部系统之间的交互效率。
应该理解的是,虽然图2-5的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图2-5中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
在一个实施例中,如图6所示,提供了一种地址信息处理装置,包括:第一地址获取模块10、第一地址解析模块20、字段值提取模块30、字段值转换模块40和第二地址生成模块50模块,其中:
第一地址获取模块10,用于获取第一平台地址信息。
第一地址解析模块20,用于对第一平台地址信息进行解析,得到表征各级行政区域的各第一字段。
字段值提取模块30,用于从各第一字段中分别提取对应的第一字段值。
字段值转换模块40,用于根据各第一字段值获取与各第一字段值对应的第二字段值;其中,第二字段值为符合第二平台预设标准的字段值。
第二地址生成模块50,用于将各第二字段值关联对应的第二字段,根据各第二字段生成第二平台地址信息。
在一个实施例中,第一地址解析模块20,还用于判断第一平台地址信息的字段格式;若第一平台地址信息的字段格式不是以表征各级行政区域的各字段为单位的多字段格式;识别第一平台地址信息中的表征行政区划单位的各关键词;根据各关键词将第一平台地址信息拆分为多个与各关键词分别对应的表征各级行政区域的各第一字段。
在一个实施例中,字段值转换模块40,还用于对各第一字段值分别进行语义识别,将各第一字段值对应的语义识别结果值作为对应的各第二字段值。
在一个实施例中,字段值转换模块40,还用于识别各第一字段值中的表征行政区划单位的词,将表征行政区划单位的词进行删除,将删除了表征行政区划单位的词的各第一字段值作为对应的各第二字段值。
在一个实施例中,上述装置还包括字段值纠错模块60,用于在将各第二字段值关联对应的第二字段之前,根据地址关系表确定存在错误的第二字段值,并对存在错误的第二字段值进行更改;其中,地址关系表中包含表征区域名称和区域所属关系的字段值。第二地址生成模块50,还用于将更改后的第二字段值关联对应的第二字段。
在一个实施例中,第二字段值包括第二一字段值、第二二字段值和第二三字段值;地址关系表包括第一地址关系表、第二地址关系表和第三地址关系表;字段值纠错模块60,还用于将第二一字段值与第一地址关系表的字段值进行匹配;若第二一字段值在第一地址关系表中匹配成功,根据第二一字段值获取与第二一字段值对应的第二地址关系表;将第二二字段值与第二地址关系表中的字段值进行匹配;若第二二字段值在第二地址关系表中匹配成功,根据第二二字段值获取与第二二字段值对应的第三地址关系表;将第二三字段值与第三地址关系表中的字段值进行匹配;若第二三字段值在第三地址关系表中匹配不成功,将第二三字段值进行分词处理,得到第二三字段值的多个子字段值;将各子字段值分别在第三地址关系表中进行匹配,若有至少一个子字段值匹配成功,采用与子字段值匹配成功的字段值替换第二三字段值,以对存在错误的第二字段值进行更改。
在一个实施例中,地址关系表还包括第四地址关系表和第五地址关系表,字段值纠错模块60,还用于若第二一字段值在第一地址关系表中匹配不成功,获取第四地址关系表;将第二二字段值与第四地址关系表中的字段值进行匹配;若第二二字段值在第四地址关系表中匹配成功,根据第二二字段值获取与第二二字段值对应的第五地址关系表;将第二三字段值与第五地址关系表中的字段值进行匹配;若第二三字段值在第五地址关系表中匹配成功,根据第二二字段值和第二三字段值获取第一替换字段值,用第一替换字段值替换第二一字段值,以对存在错误的第二字段值进行更改。
在一个实施例中,地址关系表还包括第六地址关系表,字段值纠错模块60,还用于若第二二字段值在第二地址关系表中匹配不成功,根据第二一字段值获取第六地址关系表;将第二三字段值与第六地址关系表中的字段值进行匹配;若第二三字段值在第六地址关系表中匹配成功,根据第二一字段值和第二三字段值获取第二替换字段值,用第二替换字段值替换第二二字段值,以对存在错误的第二字段值进行更改。
在一个实施例中,地址关系表还包括第七地址关系表,字段值纠错模块60,还用于若第二三字段值在第六地址关系表中匹配不成功,根据第二二字段值获取第七地址关系表;将第二三字段值与第七地址关系表中的字段值进行匹配;若第二三字段值在第七地址关系表中匹配成功,。
在一个实施例中,第二地址生成模块50,还用于将各第二字段转义为对应的第二平台的地址编码,根据各地址编码生成第二平台地址信息。
关于地址信息处理装置的具体限定可以参见上文中对于地址信息处理方法的限定,在此不再赘述。上述地址信息处理装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图6所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种地址信息处理方法。
本领域技术人员可以理解,图7中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现以下步骤:获取第一平台地址信息;对第一平台地址信息进行解析,得到表征各级行政区域的各第一字段;从各第一字段中分别提取对应的第一字段值;根据各第一字段值获取与各第一字段值对应的第二字段值;其中,第二字段值为符合第二平台预设标准的字段值;将各第二字段值关联对应的第二字段,根据各第二字段生成第二平台地址信息。
在一个实施例中,处理器执行计算机程序实现对第一平台地址信息进行解析,得到表征各级行政区域的各第一字段时,具体实现以下步骤:判断第一平台地址信息的字段格式;若第一平台地址信息的字段格式不是以表征各级行政区域的各字段为单位的多字段格式;识别第一平台地址信息中的表征行政区划单位的各关键词;根据各关键词将第一平台地址信息拆分为多个与各关键词分别对应的表征各级行政区域的各第一字段。
在一个实施例中,处理器执行计算机程序实现根据各第一字段值获取与各第一字段值对应的第二字段值时,具体实现以下步骤:对各第一字段值分别进行语义识别,将各第一字段值对应的语义识别结果值作为对应的各第二字段值。
在一个实施例中,处理器执行计算机程序实现根据各第一字段值获取与各第一字段值对应的第二字段值时,具体实现以下步骤:识别各第一字段值中的表征行政区划单位的词,将表征行政区划单位的词进行删除,将删除了表征行政区划单位的词的各第一字段值作为对应的各第二字段值。
在一个实施例中,处理器执行计算机程序实现将各第二字段值关联对应的第二字段之前,还实现根据地址关系表确定存在错误的第二字段值,并对存在错误的第二字段值进行更改;其中,地址关系表中包含表征区域名称和区域所属关系的字段值。
在一个实施例中,第二字段值包括第二一字段值、第二二字段值和第二三字段值;地址关系表包括第一地址关系表、第二地址关系表和第三地址关系表;处理器执行计算机程序实现根据地址关系表确定存在错误的第二字段值,并对存在错误的第二字段值进行更改时,具体实现以下步骤:将第二一字段值与第一地址关系表的字段值进行匹配;若第二一字段值在第一地址关系表中匹配成功,根据第二一字段值获取与第二一字段值对应的第二地址关系表;将第二二字段值与第二地址关系表中的字段值进行匹配;若第二二字段值在第二地址关系表中匹配成功,根据第二二字段值获取与第二二字段值对应的第三地址关系表;将第二三字段值与第三地址关系表中的字段值进行匹配;若第二三字段值在第三地址关系表中匹配不成功,将第二三字段值进行分词处理,得到第二三字段值的多个子字段值;将各子字段值分别在第三地址关系表中进行匹配,若有至少一个子字段值匹配成功,采用与子字段值匹配成功的字段值替换第二三字段值,以对存在错误的第二字段值进行更改。
在一个实施例中,地址关系表还包括第四地址关系表和第五地址关系表,处理器执行计算机程序实现根据地址关系表确定存在错误的第二字段值,并对存在错误的第二字段值进行更改时,还实现以下步骤:若第二一字段值在第一地址关系表中匹配不成功,获取第四地址关系表;将第二二字段值与第四地址关系表中的字段值进行匹配;若第二二字段值在第四地址关系表中匹配成功,根据第二二字段值获取与第二二字段值对应的第五地址关系表;将第二三字段值与第五地址关系表中的字段值进行匹配;若第二三字段值在第五地址关系表中匹配成功,根据第二二字段值和第二三字段值获取第一替换字段值,用第一替换字段值替换第二一字段值,以对存在错误的第二字段值进行更改。
在一个实施例中,地址关系表还包括第六地址关系表,处理器执行计算机程序实现根据地址关系表确定存在错误的第二字段值,并对存在错误的第二字段值进行更改时,还实现以下步骤:若第二二字段值在第二地址关系表中匹配不成功,根据第二一字段值获取第六地址关系表;将第二三字段值与第六地址关系表中的字段值进行匹配;若第二三字段值在第六地址关系表中匹配成功,根据第二一字段值和第二三字段值获取第二替换字段值,用第二替换字段值替换第二二字段值,以对存在错误的第二字段值进行更改。
在一个实施例中,地址关系表还包括第七地址关系表,处理器执行计算机程序实现根据地址关系表确定存在错误的第二字段值,并对存在错误的第二字段值进行更改时,还实现以下步骤:若第二三字段值在第六地址关系表中匹配不成功,根据第二二字段值获取第七地址关系表;将第二三字段值与第七地址关系表中的字段值进行匹配;若第二三字段值在第七地址关系表中匹配成功,。
在一个实施例中,处理器执行计算机程序实现根据第二字段生成第二平台地址信息时,具体实现以下步骤:将各第二字段转义为对应的第二平台的地址编码,根据各地址编码生成第二平台地址信息。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:获取第一平台地址信息;对第一平台地址信息进行解析,得到表征各级行政区域的各第一字段;从各第一字段中分别提取对应的第一字段值;根据各第一字段值获取与各第一字段值对应的第二字段值;其中,第二字段值为符合第二平台预设标准的字段值;将各第二字段值关联对应的第二字段,根据各第二字段生成第二平台地址信息。
在一个实施例中,计算机程序被处理器执行实现对第一平台地址信息进行解析,得到表征各级行政区域的各第一字段时,具体实现以下步骤:判断第一平台地址信息的字段格式;若第一平台地址信息的字段格式不是以表征各级行政区域的各字段为单位的多字段格式;识别第一平台地址信息中的表征行政区划单位的各关键词;根据各关键词将第一平台地址信息拆分为多个与各关键词分别对应的表征各级行政区域的各第一字段。
在一个实施例中,计算机程序被处理器执行实现根据各第一字段值获取与各第一字段值对应的第二字段值时,具体实现以下步骤:对各第一字段值分别进行语义识别,将各第一字段值对应的语义识别结果值作为对应的各第二字段值。
在一个实施例中,计算机程序被处理器执行实现根据各第一字段值获取与各第一字段值对应的第二字段值时,具体实现以下步骤:识别各第一字段值中的表征行政区划单位的词,将表征行政区划单位的词进行删除,将删除了表征行政区划单位的词的各第一字段值作为对应的各第二字段值。
在一个实施例中,计算机程序被处理器执行实现将各第二字段值关联对应的第二字段之前,还实现根据地址关系表确定存在错误的第二字段值,并对存在错误的第二字段值进行更改;其中,地址关系表中包含表征区域名称和区域所属关系的字段值。
在一个实施例中,第二字段值包括第二一字段值、第二二字段值和第二三字段值;地址关系表包括第一地址关系表、第二地址关系表和第三地址关系表;计算机程序被处理器执行实现根据地址关系表确定存在错误的第二字段值,并对存在错误的第二字段值进行更改时,具体实现以下步骤:将第二一字段值与第一地址关系表的字段值进行匹配;若第二一字段值在第一地址关系表中匹配成功,根据第二一字段值获取与第二一字段值对应的第二地址关系表;将第二二字段值与第二地址关系表中的字段值进行匹配;若第二二字段值在第二地址关系表中匹配成功,根据第二二字段值获取与第二二字段值对应的第三地址关系表;将第二三字段值与第三地址关系表中的字段值进行匹配;若第二三字段值在第三地址关系表中匹配不成功,将第二三字段值进行分词处理,得到第二三字段值的多个子字段值;将各子字段值分别在第三地址关系表中进行匹配,若有至少一个子字段值匹配成功,采用与子字段值匹配成功的字段值替换第二三字段值,以对存在错误的第二字段值进行更改。
在一个实施例中,地址关系表还包括第四地址关系表和第五地址关系表,计算机程序被处理器执行实现根据地址关系表确定存在错误的第二字段值,并对存在错误的第二字段值进行更改时,还实现以下步骤:若第二一字段值在第一地址关系表中匹配不成功,获取第四地址关系表;将第二二字段值与第四地址关系表中的字段值进行匹配;若第二二字段值在第四地址关系表中匹配成功,根据第二二字段值获取与第二二字段值对应的第五地址关系表;将第二三字段值与第五地址关系表中的字段值进行匹配;若第二三字段值在第五地址关系表中匹配成功,根据第二二字段值和第二三字段值获取第一替换字段值,用第一替换字段值替换第二一字段值,以对存在错误的第二字段值进行更改。
在一个实施例中,地址关系表还包括第六地址关系表,计算机程序被处理器执行实现根据地址关系表确定存在错误的第二字段值,并对存在错误的第二字段值进行更改时,还实现以下步骤:若第二二字段值在第二地址关系表中匹配不成功,根据第二一字段值获取第六地址关系表;将第二三字段值与第六地址关系表中的字段值进行匹配;若第二三字段值在第六地址关系表中匹配成功,根据第二一字段值和第二三字段值获取第二替换字段值,用第二替换字段值替换第二二字段值,以对存在错误的第二字段值进行更改。
在一个实施例中,地址关系表还包括第七地址关系表,计算机程序被处理器执行实现根据地址关系表确定存在错误的第二字段值,并对存在错误的第二字段值进行更改时,还实现以下步骤:若第二三字段值在第六地址关系表中匹配不成功,根据第二二字段值获取第七地址关系表;将第二三字段值与第七地址关系表中的字段值进行匹配;若第二三字段值在第七地址关系表中匹配成功,。
在一个实施例中,计算机程序被处理器执行实现根据第二字段生成第二平台地址信息时,具体实现以下步骤:将各第二字段转义为对应的第二平台的地址编码,根据各地址编码生成第二平台地址信息。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。
Claims (10)
1.一种地址信息处理方法,所述方法包括:
获取第一平台地址信息;
对所述第一平台地址信息进行解析,得到表征各级行政区域的各第一字段;
从各所述第一字段中分别提取对应的第一字段值;
根据各所述第一字段值获取与各所述第一字段值对应的第二字段值;其中,所述第二字段值为符合第二平台预设标准的字段值;
将各所述第二字段值关联对应的第二字段,根据各所述第二字段生成第二平台地址信息。
2.根据权利要求1所述的方法,其特征在于,所述对所述第一平台地址信息进行解析,得到表征各级行政区域的各第一字段,包括:
判断所述第一平台地址信息的字段格式;
若所述第一平台地址信息的字段格式不是以表征各级行政区域的各字段为单位的多字段格式;
识别所述第一平台地址信息中的表征行政区划单位的各关键词;
根据各所述关键词将所述第一平台地址信息拆分为多个与各所述关键词分别对应的表征各级行政区域的各第一字段。
3.根据权利要求1所述的方法,其特征在于,所述根据各所述第一字段值获取与各所述第一字段值对应的第二字段值,包括:
对各所述第一字段值分别进行语义识别,将各所述第一字段值对应的语义识别结果值作为对应的各第二字段值;
或,识别各所述第一字段值中的表征行政区划单位的词,将表征行政区划单位的词进行删除,将删除了表征行政区划单位的词的各第一字段值作为对应的各第二字段值。
4.根据权利要求1所述的方法,其特征在于,所述将各所述第二字段值关联对应的第二字段之前,还包括:
根据地址关系表确定存在错误的第二字段值,并对存在错误的第二字段值进行更改;其中,所述地址关系表中包含表征区域名称和区域所属关系的字段值;
所述将各所述第二字段值关联对应的第二字段,包括:将更改后的第二字段值关联对应的第二字段。
5.根据权利要求4所述的方法,其特征在于,所述第二字段值包括第二一字段值、第二二字段值和第二三字段值;地址关系表包括第一地址关系表、第二地址关系表和第三地址关系表;所述根据地址关系表确定存在错误的第二字段值,并对存在错误的第二字段值进行更改,包括:
将所述第二一字段值与第一地址关系表的字段值进行匹配;
若所述第二一字段值在所述第一地址关系表中匹配成功,根据所述第二一字段值获取与所述第二一字段值对应的第二地址关系表;
将所述第二二字段值与所述第二地址关系表中的字段值进行匹配;
若所述第二二字段值在所述第二地址关系表中匹配成功,根据所述第二二字段值获取与所述第二二字段值对应的第三地址关系表;
将所述第二三字段值与所述第三地址关系表中的字段值进行匹配;
若所述第二三字段值在所述第三地址关系表中匹配不成功,将所述第二三字段值进行分词处理,得到所述第二三字段值的多个子字段值;将各所述子字段值分别在所述第三地址关系表中进行匹配,若有至少一个所述子字段值匹配成功,采用与所述子字段值匹配成功的字段值替换所述第二三字段值,以对存在错误的第二字段值进行更改。
6.根据权利要求5所述的方法,其特征在于,所述地址关系表还包括第四地址关系表和第五地址关系表,所述方法还包括:
若所述第二一字段值在所述第一地址关系表中匹配不成功,获取第四地址关系表;
将所述第二二字段值与所述第四地址关系表中的字段值进行匹配;
若所述第二二字段值在所述第四地址关系表中匹配成功,根据所述第二二字段值获取与所述第二二字段值对应的第五地址关系表;
将所述第二三字段值与所述第五地址关系表中的字段值进行匹配;
若所述第二三字段值在所述第五地址关系表中匹配成功,根据所述第二二字段值和所述第二三字段值获取第一替换字段值,用所述第一替换字段值替换所述第二一字段值,以对存在错误的第二字段值进行更改;
优选的,所述地址关系表还包括第六地址关系表,所述方法还包括:
若所述第二二字段值在所述第二地址关系表中匹配不成功,根据所述第二一字段值获取第六地址关系表;
将所述第二三字段值与所述第六地址关系表中的字段值进行匹配;
若所述第二三字段值在所述第六地址关系表中匹配成功,根据所述第二一字段值和所述第二三字段值获取第二替换字段值,用所述第二替换字段值替换所述第二二字段值,以对存在错误的第二字段值进行更改;
优选的,所述地址关系表还包括第七地址关系表,所述方法还包括:
若所述第二三字段值在所述第六地址关系表中匹配不成功,根据所述第二二字段值获取第七地址关系表;
将所述第二三字段值与所述第七地址关系表中的字段值进行匹配;
若所述第二三字段值在所述第七地址关系表中匹配成功,根据所述第二二字段值和所述第二三字段值获取第三替换字段值,用所述第三替换字段值替换所述第二一字段值,以对存在错误的第二字段值进行更改。
7.根据权利要求1所述的方法,其特征在于,所述根据所述第二字段生成第二平台地址信息,包括:
将各所述第二字段转义为对应的第二平台的地址编码,根据各所述地址编码生成第二平台地址信息。
8.一种地址信息处理装置,所述装置包括:
第一地址获取模块,用于获取第一平台地址信息;
第一地址解析模块,用于对所述第一平台地址信息进行解析,得到表征各级行政区域的各第一字段;
字段值提取模块,用于从各所述第一字段中分别提取对应的第一字段值;
字段值转换模块,用于根据各所述第一字段值获取与各所述第一字段值对应的第二字段值;其中,所述第二字段值为符合第二平台预设标准的字段值;
第二地址生成模块,用于将各所述第二字段值关联对应的第二字段,根据各所述第二字段生成第二平台地址信息。
9.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010548773.9A CN111724110A (zh) | 2020-06-16 | 2020-06-16 | 地址信息处理方法、装置、计算机设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010548773.9A CN111724110A (zh) | 2020-06-16 | 2020-06-16 | 地址信息处理方法、装置、计算机设备和存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111724110A true CN111724110A (zh) | 2020-09-29 |
Family
ID=72567111
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010548773.9A Pending CN111724110A (zh) | 2020-06-16 | 2020-06-16 | 地址信息处理方法、装置、计算机设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111724110A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112364114A (zh) * | 2020-11-16 | 2021-02-12 | 深圳壹账通智能科技有限公司 | 地址标准化方法、装置、计算机设备和存储介质 |
CN112818667A (zh) * | 2021-01-29 | 2021-05-18 | 上海寻梦信息技术有限公司 | 地址纠正方法、系统、设备及存储介质 |
CN112836497A (zh) * | 2021-01-29 | 2021-05-25 | 上海寻梦信息技术有限公司 | 地址纠正方法、装置、电子设备及存储介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108428187A (zh) * | 2017-12-21 | 2018-08-21 | 中国平安人寿保险股份有限公司 | 地址匹配方法、装置及存储介质 |
CN109033086A (zh) * | 2018-08-03 | 2018-12-18 | 银联数据服务有限公司 | 一种地址解析、匹配的方法及装置 |
US20190005111A1 (en) * | 2017-06-29 | 2019-01-03 | Accenture Global Solutions Limited | Relational log entry instituting system |
-
2020
- 2020-06-16 CN CN202010548773.9A patent/CN111724110A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20190005111A1 (en) * | 2017-06-29 | 2019-01-03 | Accenture Global Solutions Limited | Relational log entry instituting system |
CN108428187A (zh) * | 2017-12-21 | 2018-08-21 | 中国平安人寿保险股份有限公司 | 地址匹配方法、装置及存储介质 |
CN109033086A (zh) * | 2018-08-03 | 2018-12-18 | 银联数据服务有限公司 | 一种地址解析、匹配的方法及装置 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112364114A (zh) * | 2020-11-16 | 2021-02-12 | 深圳壹账通智能科技有限公司 | 地址标准化方法、装置、计算机设备和存储介质 |
CN112818667A (zh) * | 2021-01-29 | 2021-05-18 | 上海寻梦信息技术有限公司 | 地址纠正方法、系统、设备及存储介质 |
CN112836497A (zh) * | 2021-01-29 | 2021-05-25 | 上海寻梦信息技术有限公司 | 地址纠正方法、装置、电子设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111724110A (zh) | 地址信息处理方法、装置、计算机设备和存储介质 | |
CN111858472B (zh) | 文件格式转换方法、装置、计算机设备及存储介质 | |
CN110135129B (zh) | 代码段保护方法、装置、计算机设备和存储介质 | |
CN110990390A (zh) | 数据协同处理方法、装置、计算机设备和存储介质 | |
CN112214617B (zh) | 一种基于区块链技术的数字档案管理方法及系统 | |
CN113495902A (zh) | 数据处理方法及数据标准管理系统 | |
CN112559526A (zh) | 数据表导出方法、装置、计算机设备及存储介质 | |
CN113961768B (zh) | 敏感词检测方法、装置、计算机设备和存储介质 | |
CN111191443A (zh) | 基于区块链的敏感词检测方法、装置、计算机设备和存储介质 | |
CN106708897B (zh) | 一种数据仓库质量保障方法、装置和系统 | |
CN111176882A (zh) | 特定数据处理方法、装置、计算机设备及存储介质 | |
CN111538796A (zh) | 地址规范化处理方法、装置、设备及存储介质 | |
CN114610385B (zh) | 一种运行环境适配系统及方法 | |
CN113934736A (zh) | 企业识别方法、装置及存储介质 | |
CN108572948B (zh) | 门牌信息的处理方法及装置 | |
CN111859956B (zh) | 一种用于金融行业的地址分词方法 | |
CN112487122B (zh) | 地址归一化处理方法及装置 | |
CN111401051B (zh) | 快递信息解析方法及系统 | |
CN114118944A (zh) | 一种取证实验室分级管理方法、终端设备及存储介质 | |
CN110377675B (zh) | 地址校验方法、装置、计算机设备及存储介质 | |
CN112363929A (zh) | 系统上线方法、装置、计算机设备及存储介质 | |
CN112632946A (zh) | 自动建表的方法、装置、计算机设备和存储介质 | |
CN112347095B (zh) | 数据表的处理方法、装置和服务器 | |
CN110503384B (zh) | 电力指标的生成方法、装置、计算机设备和存储介质 | |
CN116431600A (zh) | 数据库一键式创建方法及装置、介质、设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200929 |
|
RJ01 | Rejection of invention patent application after publication |