CN111859849B - 一种用电地址的管理方法和装置 - Google Patents
一种用电地址的管理方法和装置 Download PDFInfo
- Publication number
- CN111859849B CN111859849B CN202010627201.XA CN202010627201A CN111859849B CN 111859849 B CN111859849 B CN 111859849B CN 202010627201 A CN202010627201 A CN 202010627201A CN 111859849 B CN111859849 B CN 111859849B
- Authority
- CN
- China
- Prior art keywords
- address
- address information
- string
- standard
- new
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000005611 electricity Effects 0.000 title claims description 6
- 238000007726 management method Methods 0.000 title abstract description 11
- 238000000034 method Methods 0.000 claims abstract description 38
- 238000012545 processing Methods 0.000 claims description 23
- 239000013589 supplement Substances 0.000 claims description 9
- 238000012937 correction Methods 0.000 claims description 5
- 230000011218 segmentation Effects 0.000 claims description 5
- 230000000153 supplemental effect Effects 0.000 claims 1
- 238000012549 training Methods 0.000 abstract description 10
- 238000004458 analytical method Methods 0.000 description 4
- 230000001502 supplementing effect Effects 0.000 description 4
- 238000009960 carding Methods 0.000 description 2
- 238000012423 maintenance Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 1
- 230000003631 expected effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000009469 supplementation Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/103—Formatting, i.e. changing of presentation of documents
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/226—Validation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明实施例提供一种用电地址的管理方法和装置,所述方法包括:从数据库中获取用电地址的地址串,对所述地址串通过预设的语法规则进行拆分,获取地址信息,累积地址元数据;根据所述地址信息,获取电子地图上与所述地址信息对应的地图地址信息,并根据所述地图地址信息对所述地址信息进行优化,获取标准地址串。通过对地址串的拆分以及对地址信息的优化获取标准地址串,降低了对于训练数据的依赖,使得在训练数据量较小时也能有较高的地址解析准确率。
Description
技术领域
本发明涉及自然语言处理领域,尤其涉及一种用电地址的管理方法和装置。
背景技术
许多公司由于经营业务常常需要获取并保存大量用户的地址信息,但是由于客户填报的地址信息通常都没有严格按照预定的格式填写,因此,需要对地址进行解析处理获取企业需要的地址形式。例如许多早期电力公司营销系统和客户服务系统中,往往存在着录入数据库的地址数据规模巨大、录入出错、信息过期、内容不完善等各类问题。由于地址结构本身的复杂性,我国长期以来对地址的书写未形成统一的规范,其非结构化的文本信息包含了区域隶属关系和空间位置关系等重要语义信息。
由于缺少一种对地址串质量进行有效管控的高效技术支撑手段,导致对于地址梳理工作主要以人工为主,周期过长且梳理速度慢,甚至还比不上更新的速度,因此几乎无法达到预期的效果。因此需要一种地址解析的方法快速获取需要的地址格式。
目前,现有的进行地址解析的方法主要是基于统计的解析方法。基于统计的解析方法是将地址解析看作一个命名实体识别的过程,其难点在于如何把控同义地址的界定。由于基于统计的解析方法在解析时需要大量高质量的训练数据,解析模型对数据依赖性强,因此存在当训练数据量较小时解析准确率低的问题。因此,设计一种地址解析方法降低对于训练数据的依赖,使得在训练数据量较小时也能有较高的地址解析准确率就成为亟待解决的问题。
发明内容
本发明实施例提供一种用电地址的管理方法和装置,用以解决现有技术中对于训练数据的依赖,使得在训练数据量较小时也能有较高的地址解析准确率。
第一方面,本发明实施例提供一种用电地址的管理方法,包括:
从数据库中获取用电地址的地址串,对所述地址串通过预设的语法规则进行拆分,获取地址信息,不断累积地址元数据;
根据所述地址信息,获取电子地图上与所述地址信息对应的地图地址信息,并根据所述地图地址信息对所述地址信息进行优化,获取标准地址串。
可选地,所述对所述地址串通过预设的语法规则进行拆分,获取地址信息具体包括:
对所述地址串通过规则引擎进行要素识别、地址切分、语义纠正和/或文本正则化处理,获取地址信息。
可选地,所述并根据所述地图地址信息对所述地址信息进行优化,获取标准地址串具体包括:
将所述地址信息与地图地址信息进行对比,获取所述地址信息是否真实存在的判定结果;
根据所述判定结果,对所述地址信息按照预设方法进行处理,获取标准地址串。
可选地,所述根据所述判定结果,对所述地址信息按照预设方法进行处理,获取标准地址串具体包括:
若所述地址信息是真实存在的,将所述地址信息发送至地址仓库,并按照所述地址信息的隶属关系生成对应的地址拓扑树,根据所述地址拓扑树按照预设生成算法生成标准地址串;
若所述地址信息是不真实存在的,则将所述地址信息重新通过预设的语法规则进行拆分,获取新的地址信息及其对应的新的判定结果,并根据所述新的判定结果获取标准地址串。
可选地,所述并根据所述新的判定结果获取标准地址串具体包括:
若在预设生成新的判定结果次数内,所述新的地址信息被判定是真实存在的,则根据所述新的地址信息的隶属关系生成对应的地址拓扑树,根据所述地址拓扑树按照预设生成算法生成标准地址串;
若在预设生成新的判定结果次数内,所述新的地址信息仍被判定是不真实存在的,则对所述新的地址信息进行补充缺失地址处理,并根据补充后的所述新的地址信息生成标准地址串。
可选地,所述并按照所述地址信息的隶属关系生成对应的地址拓扑树,根据所述地址拓扑树按照预设生成算法生成标准地址串具体包括:
将所述地址信息按照其隶属关系分成8级,以每一级地址作为一级节点生成对应的地址拓扑树,并依次从所述地址拓扑树的根节点到最低级子节点提取对应信息生成8级标准地址串。
可选地,所述则对所述新的地址信息进行补充缺失地址处理具体包括:
以所述新的地址信息对应的地图地址信息对所述新的地址信息中缺失和/或错误的地址部分进行替换。
可选地,所述并根据补充后的所述新的地址信息生成标准地址串具体包括:
将所述新的地址信息发送至地址仓库按照预设标准进行认定,并根据认定结果生成标准地址串。
可选地,所述将所述新的地址信息、新的地址元数据发送至地址仓库进行认定,并根据认定结果生成标准地址串具体包括:
将所述新的地址信息发送至地址仓库进行人工认定,将所述新的地址元数据发送至地址仓库进行人工认定;
若所述新的地址信息符合标准,则直接生成对应的标准地址串;
若所述新的地址信息不符合标准,则对所述新的地址信息进行人工维护,并将维护后的地址信息生成对应的标准地址串。
第二方面,本发明实施例提供一种用电地址的管理装置,包括:
拆分模块,用于从数据库中获取用电地址的地址串,对所述地址串通过预设的语法规则进行拆分,获取地址信息;
获取模块,用于根据所述地址信息,获取电子地图上与所述地址信息对应的地图地址信息,并根据所述地图地址信息对所述地址信息进行优化,获取标准地址串所需的地址元数据,丰富已有的地址拓扑树。
本发明实施例提供的用电地址的管理方法和装置,通过对地址串的拆分以及对地址信息的优化获取标准地址串,降低了对于训练数据的依赖,使得在训练数据量较小时也能有较高的地址解析准确率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的用电地址的管理方法流程示意图;
图2为本发明实施例提供的用电地址的管理装置结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,为本发明实施例提供的一种用电地址的管理方法,包括:
从数据库中获取用电地址的地址串,对所述地址串通过预设的语法规则进行拆分,获取地址信息,累积地址元数据;
根据所述地址信息,获取电子地图上与所述地址信息对应的地图地址信息,并根据所述地图地址信息对所述地址信息进行优化,获取标准地址串。
具体地,地址串类似收货地址,通常存储在系统数据库中,可以是单个地址区域或具体地址点,或者是多个地址区域或具体地址点以及一些描述性地址语句组成,指向真实存在的地址。由于数据库中地址质量参差不齐,许多地址严重缺失区域隶属关系,甚至由于人工录入的原因,包含错误的区域隶属关系。因此需要预设的拆分算法对地址串进行拆分处理,动态识别其内在关系并按照预设的拆分语法规则对地址串进行拆分,获取其中有效的地址信息。
为了避免拆分出的地址信息是虚构或错误的信息,还需要将拆分出的地址信息与电子地图上的该拆分出的地址信息对应的地图地址信息进行对比,根据对比的结果进一步地对地址信息进行优化处理,最后实现获取需要的标准地址串的目的。
作为本发明的一种实施例,所述对所述地址串通过预设的语法规则进行拆分,获取地址信息具体包括:
对所述地址串通过规则引擎进行要素识别、地址切分、语义纠正和/或文本正则化处理,准确输出同义地址标准化表达形式,获取地址信息,累积地址元数据。
具体地,由于地址串中常常会出现冗余地址信息、错误的地址信息、错别字等问题,因此需要对地址串通过电力行业规则引擎进行处理,处理类型包括要素识别、地址切分、语义纠正和/或文本正则化处理。其中,要素识别是识别出地址串中的有用的地址信息,地址切分是将地址按行政区划的级别进行拆分,语义纠正是对于有错别字的地址进行纠正,文本正则化处理是将文本转换成一种更方便使用、更标准的表达形式。
作为本发明的一种实施例,所述并根据所述地图地址信息对所述地址信息进行优化,获取标准地址串具体包括:
将所述地址信息与地图地址信息进行对比,获取所述地址信息是否真实存在的判定结果;
根据所述判定结果,对所述地址信息按照预设方法进行处理,获取标准地址串。
具体地,为了确定经过拆分处理的地址信息是真实存在的而不是虚假的地址,或者为了确定经过拆分处理后的地址信息是准确无误的,还需要将拆分后的地址信息与网络上的地图地址信息进行对比,进而判定拆分后的地址信息的真实与否。进一步地,根据判定结果的不同对地址信息进行对应的预设方法的处理获取标准地址串。
作为本发明的一种实施例,所述根据所述判定结果,对所述地址信息按照预设方法进行处理,获取标准地址串具体包括:
若所述地址信息是真实存在的,将所述地址信息发送至地址仓库,并按照所述地址信息的隶属关系生成对应的地址拓扑树,根据所述地址拓扑树按照预设生成算法生成标准地址串;
若所述地址信息是不真实存在的,则将所述地址信息重新通过预设的语法规则进行拆分,获取新的地址信息及其对应的新的判定结果,并根据所述新的判定结果获取标准地址串。
具体地,将拆分处理后的地址信息与地图地址信息对比判定以后,如果地址信息与地图地址信息的对比判定准确无误,则将地址信息发送至地址仓库,并按照地址信息的隶属关系生成标准地址串,根据地址仓库所有地址对应的标准地址串生成地址拓扑树。其中,地址仓库是用于存储地址信息的数据库,地址拓扑树是由根节点到叶子节点的地址数据组成的树状地址信息,每一个从根节点到叶子节点的地址数据就是一个标准地址串。
如果经过判定地址信息与地图地址信息之间不匹配,则将该不匹配的地址信息重新返回到拆分处理流程进行处理获取新的地址信息,并将新的地址信息重新与地图地址信息进行判定处理,若依然不匹配则继续发回拆分处理流程进行处理,若能够匹配则根据新的地址信息生成对应的标准地址串。
作为本发明的一种实施例,所述并根据所述新的判定结果获取标准地址串具体包括:
若在预设生成新的判定结果次数内,所述新的地址信息被判定是真实存在的,则根据所述新的地址信息的隶属关系生成对应的地址拓扑树,根据所述地址拓扑树按照预设生成算法生成标准地址串;
若在预设生成新的判定结果次数内,所述新的地址信息仍被判定是不真实存在的,则对所述新的地址信息进行补充缺失地址处理,并根据补充后的所述新的地址信息生成标准地址串。
具体地,如果生成的新的地址信息一直未能判定与电子地图的网址信息匹配,则会一直进行发回重新拆分处理流程进行处理,这时如果不对新的判定结果生成次数作出限制,可能会一直陷入拆分处理、判定的循环。因此,当预设生成新的判定结果次数内,新的地址信息被判定是真实的,则根据新的地址信息的隶属关系生成对应的地址拓扑树并进一步生成标准地址串;若在预设生成新的判定结果次数内,新的地址信息仍被判定是不真实的,则对新的地址信息进行补充缺失地址处理,并根据补充后的新的地址信息生成标准地址串。
作为本发明的一种实施例,所述按照所述地址信息的隶属关系生成对应的地址拓扑树,根据所述地址拓扑树按照预设生成算法生成标准地址串具体包括:
将所述地址信息按照其隶属关系分成8级,以每一级地址作为一级节点生成对应的地址拓扑树,并依次从所述地址拓扑树的根节点到最低级子节点提取对应信息生成8级标准地址串。
具体地,地址拓扑树是由根节点到叶子节点的地址数据组成的树状地址信息,每一个从根节点到叶子节点的地址数据就是一个标准地址串。本申请中的生成地址拓扑树的算法将地址按照“省码、市码、区县码、街道码、居(村)委会码、道路码、小区码、门牌号码”的8级标准建设一套规范化的地名地址库,并生成对应的8级标准地址串,旨在对客户的基础信息进一步完善,对客户的用电地址进行标准化管理。
作为本发明的一种实施例,所述则对所述新的地址信息进行补充缺失地址处理具体包括:
以所述新的地址信息对应的地图地址信息对所述新的地址信息中缺失和/或错误的地址部分进行替换。
具体地,如果在超出预设次数以后,新的地址信息仍然不被判定为真实的,则将通过新的地址信息对应的地图地址信息对新的地址信息进行补充,使补充后的新的地址信息被判定为真实的。补充方法是使用电子地图地址信息替换其对应的新的地址信息中的缺失和/或错误的部分。
作为本发明的一种实施例,所述并根据补充后的所述新的地址信息生成标准地址串具体包括:
将所述新的地址信息发送至地址仓库按照预设标准进行认定,并根据认定结果生成标准地址串。
具体地,为了确保经过地图地址信息补充后的新的地址信息的准确性,首先将经过补充后的新的地址信息发送至地址仓库按照预设的标准进行认定,认定的结果是判定新的地址信息是否准确以及符合标准,并根据认定结果的不同通过不同的方法生成标准地址串。
作为本发明的一种实施例,所述将所述新的地址信息发送至地址仓库按照预设标准进行认定,并根据认定结果生成标准地址串具体包括:
将所述新的地址信息发送至地址仓库进行人工认定;
若所述新的地址信息符合标准,则直接生成对应的标准地址串;
若所述新的地址信息不符合标准,则对所述新的地址信息进行人工维护,并将维护后的地址信息生成对应的标准地址串。
具体地,新的地址信息发送到地址仓库以后需要按照预设标准进行人工认定,如果经过人工认定新的地址信息是符合标准的,则直接将新的地址信息生成对应的地址拓扑树,并根据地址拓扑树生成标准地址串。如果经过人工认定新的地址信息不符合标准,则对新的地址信息进行人工维护,并将人工维护后的地址信息生成对应的标准地址串。其中,预设标准可以具体根据不同的系统要求进行配置,人工维护是指对新的地址信息进行修改、替换等操作。
如图2所述,本发明实施例还提供了一种用电地址管理的装置,包括:
拆分模块,用于从数据库中获取用电地址的地址串,对所述地址串通过预设的语法规则进行拆分,获取地址信息,累积地址元数据;
获取模块,用于根据所述地址信息,获取电子地图上与所述地址信息对应的地图地址信息,并根据所述地图地址信息对所述地址信息进行优化,获取标准地址串。
具体地,地址串类似收货地址,通常保存与系统数据库中,可以是单个地址区域或具体地址点,或者是多个地址区域或具体地址点以及一些描述性地址语句组成,指向真实存在的地址。由于数据库中地址质量参差不齐,许多地址严重缺失区域隶属关系,甚至由于人工录入的原因,包含错误的区域隶属关系。因此需要拆分模块对地址串进行处理,动态识别其内在关系并按照预设的语法规则对地址串进行拆分,获取其中有效的地址信息。
为了避免拆分出的地址信息是虚构或错误的信息,还需要通过获取模块将拆分出的地址信息与互联网地图上的该拆分出的地址信息对应的地图地址信息进行对比,根据对比的结果进一步地对地址信息进行优化处理,最后实现获取需要的标准地址串的目的。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (8)
1.一种用电地址的管理方法,其特征在于,包括:
从数据库中获取用电地址的地址串,对所述地址串通过预设的语法规则进行拆分,获取地址信息,累积地址元数据;
根据所述地址信息,获取电子地图上与所述地址信息对应的地图地址信息,并根据所述地图地址信息对所述地址信息进行优化,获取标准地址串,包括:将所述地址信息与地图地址信息进行对比,获取所述地址信息是否真实存在的判定结果;根据所述判定结果,对所述地址信息按照预设方法进行处理,获取标准地址串,包括:若所述地址信息是真实存在的,将所述地址信息发送至地址仓库,并按照所述地址信息的隶属关系生成对应的地址拓扑树,根据所述地址拓扑树按照预设生成算法生成标准地址串;若所述地址信息是不真实存在的,则将所述地址信息重新通过预设的语法规则进行拆分,获取新的地址信息及其对应的新的判定结果,并根据所述新的判定结果获取标准地址串;所述地图地址信息为通过网络获取的地图地址信息。
2.根据权利要求1所述的方法,其特征在于,所述对所述地址串通过预设的语法规则进行拆分,获取地址信息具体包括:
对所述地址串通过规则引擎进行要素识别、地址切分、语义纠正和/或文本正则化处理,准确输出同义地址标准化表达形式,获取地址信息,累积地址元数据。
3.根据权利要求2所述的方法,其特征在于,所述并根据所述新的判定结果获取标准地址串具体包括:
若在预设生成新的判定结果次数内,所述新的地址信息被判定是真实存在的,则根据所述新的地址信息的隶属关系生成对应的地址拓扑树,根据所述地址拓扑树按照预设生成算法生成标准地址串;
若在预设生成新的判定结果次数内,所述新的地址信息仍被判定是不真实存在的,则对所述新的地址信息进行补充缺失地址处理,并根据补充后的所述新的地址信息生成标准地址串。
4.根据权利要求3所述的方法,其特征在于,所述并按照所述地址信息的隶属关系生成对应的地址拓扑树,根据所述地址拓扑树按照预设生成算法生成标准地址串具体包括:
将所述地址信息按照其隶属关系分成8级,以每一级地址作为一级节点生成对应的地址拓扑树,并依次从所述地址拓扑树的根节点到最低级子节点提取对应信息生成8级标准地址串。
5.根据权利要求4所述的方法,其特征在于,所述则对所述新的地址信息进行补充缺失地址处理具体包括:
以所述新的地址信息对应的地图地址信息对所述新的地址信息中缺失和/或错误的地址部分进行替换,形成准确的标准地址串后拓展地址拓扑树。
6.根据权利要求5所述的方法,其特征在于,所述并根据补充后的所述新的地址信息生成标准地址串具体包括:
将所述新的地址信息发送至地址仓库按照预设标准进行认定,并根据认定结果生成标准地址串。
7.根据权利要求6所述的方法,其特征在于,所述将所述新的地址信息发送至地址仓库按照预设标准进行认定,并根据认定结果生成标准地址串具体包括:
将所述新的地址信息发送至地址仓库进行人工认定;
若所述新的地址信息符合标准,则直接生成对应的标准地址串;
若所述新的地址信息不符合标准,则对所述新的地址信息进行人工维护,并将维护后的地址信息生成对应的标准地址串。
8.一种用电地址的管理装置,其特征在于,包括:
拆分模块,用于从数据库中获取用电地址的地址串,对所述地址串通过预设的语法规则进行拆分,获取地址信息,累积地址元数据;
获取模块,用于根据所述地址信息,获取电子地图上与所述地址信息对应的地图地址信息,并根据所述地图地址信息对所述地址信息进行优化,获取标准地址串,包括:将所述地址信息与地图地址信息进行对比,获取所述地址信息是否真实存在的判定结果;根据所述判定结果,对所述地址信息按照预设方法进行处理,获取标准地址串,包括:若所述地址信息是真实存在的,将所述地址信息发送至地址仓库,并按照所述地址信息的隶属关系生成对应的地址拓扑树,根据所述地址拓扑树按照预设生成算法生成标准地址串;
若所述地址信息是不真实存在的,则将所述地址信息重新通过预设的语法规则进行拆分,获取新的地址信息及其对应的新的判定结果,并根据所述新的判定结果获取标准地址串;所述地图地址信息为通过网络获取的地图地址信息。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010627201.XA CN111859849B (zh) | 2020-07-01 | 2020-07-01 | 一种用电地址的管理方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010627201.XA CN111859849B (zh) | 2020-07-01 | 2020-07-01 | 一种用电地址的管理方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111859849A CN111859849A (zh) | 2020-10-30 |
CN111859849B true CN111859849B (zh) | 2023-11-24 |
Family
ID=72989052
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010627201.XA Active CN111859849B (zh) | 2020-07-01 | 2020-07-01 | 一种用电地址的管理方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111859849B (zh) |
Citations (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101110080A (zh) * | 2007-08-21 | 2008-01-23 | 北京大学 | 一种网络地图服务中未登录地名的定位方法 |
CN101719128A (zh) * | 2009-12-31 | 2010-06-02 | 浙江工业大学 | 一种基于模糊匹配的中文地理编码确定方法 |
CN102760160A (zh) * | 2012-06-08 | 2012-10-31 | 湘潭市勘测设计院 | 一种在空间信息库中进行多尺度地形图缩编的系统 |
WO2016000341A1 (zh) * | 2014-07-02 | 2016-01-07 | 国家电网公司 | 基于cim模型的跨区域供电范围搜索方法及其系统 |
CN106534400A (zh) * | 2016-11-25 | 2017-03-22 | 杭州华三通信技术有限公司 | 网络地址转换方法及装置 |
CN106651247A (zh) * | 2016-11-16 | 2017-05-10 | 成都地图慧科技有限公司 | 基于gis拓扑分析的地址匹配区域块方法和系统 |
CN106709065A (zh) * | 2017-01-19 | 2017-05-24 | 国家电网公司 | 一种地址信息标准化处理方法及装置 |
CN108228825A (zh) * | 2018-01-02 | 2018-06-29 | 北京市燃气集团有限责任公司 | 一种基于分词的用户地址数据清洗方法 |
CN109101483A (zh) * | 2018-07-04 | 2018-12-28 | 浙江大学 | 一种针对电力巡检文本的错误识别方法 |
CN109635056A (zh) * | 2018-11-16 | 2019-04-16 | 海南电网有限责任公司信息通信分公司 | 用电地址数据处理方法、装置、计算机设备和存储介质 |
CN109739997A (zh) * | 2019-01-28 | 2019-05-10 | 致诚阿福技术发展(北京)有限公司 | 地址对比方法、装置及系统 |
CN109829028A (zh) * | 2019-01-30 | 2019-05-31 | 广州供电局有限公司 | 一种基于标准地址的电力数据管理系统 |
CN109872098A (zh) * | 2018-12-12 | 2019-06-11 | 平安科技(深圳)有限公司 | 基于车险保单配送的物流地址解析方法及计算机设备 |
CN110892394A (zh) * | 2017-06-29 | 2020-03-17 | 亚马逊科技公司 | 对包裹交付的不正确地址的标识 |
-
2020
- 2020-07-01 CN CN202010627201.XA patent/CN111859849B/zh active Active
Patent Citations (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101110080A (zh) * | 2007-08-21 | 2008-01-23 | 北京大学 | 一种网络地图服务中未登录地名的定位方法 |
CN101719128A (zh) * | 2009-12-31 | 2010-06-02 | 浙江工业大学 | 一种基于模糊匹配的中文地理编码确定方法 |
CN102760160A (zh) * | 2012-06-08 | 2012-10-31 | 湘潭市勘测设计院 | 一种在空间信息库中进行多尺度地形图缩编的系统 |
WO2016000341A1 (zh) * | 2014-07-02 | 2016-01-07 | 国家电网公司 | 基于cim模型的跨区域供电范围搜索方法及其系统 |
CN106651247A (zh) * | 2016-11-16 | 2017-05-10 | 成都地图慧科技有限公司 | 基于gis拓扑分析的地址匹配区域块方法和系统 |
CN106534400A (zh) * | 2016-11-25 | 2017-03-22 | 杭州华三通信技术有限公司 | 网络地址转换方法及装置 |
CN106709065A (zh) * | 2017-01-19 | 2017-05-24 | 国家电网公司 | 一种地址信息标准化处理方法及装置 |
CN110892394A (zh) * | 2017-06-29 | 2020-03-17 | 亚马逊科技公司 | 对包裹交付的不正确地址的标识 |
CN108228825A (zh) * | 2018-01-02 | 2018-06-29 | 北京市燃气集团有限责任公司 | 一种基于分词的用户地址数据清洗方法 |
CN109101483A (zh) * | 2018-07-04 | 2018-12-28 | 浙江大学 | 一种针对电力巡检文本的错误识别方法 |
CN109635056A (zh) * | 2018-11-16 | 2019-04-16 | 海南电网有限责任公司信息通信分公司 | 用电地址数据处理方法、装置、计算机设备和存储介质 |
CN109872098A (zh) * | 2018-12-12 | 2019-06-11 | 平安科技(深圳)有限公司 | 基于车险保单配送的物流地址解析方法及计算机设备 |
CN109739997A (zh) * | 2019-01-28 | 2019-05-10 | 致诚阿福技术发展(北京)有限公司 | 地址对比方法、装置及系统 |
CN109829028A (zh) * | 2019-01-30 | 2019-05-31 | 广州供电局有限公司 | 一种基于标准地址的电力数据管理系统 |
Non-Patent Citations (4)
Title |
---|
An investigation of geographic map techniques for Internet hosts;Padmanabhan Venkata N. 等;《Proceedings of the 2001 conference on Applications, technologies, architectures, and protocols for computer communications》;173-185 * |
Cross-domain recommendation with semantic correlation in tagging systems;Zhang Qian 等;《2019 International Joint Conference on Neural Networks (IJCNN)》;1-8 * |
城市交通可变信息板人机交互设计研究;李金樱;《中国优秀硕士学位论文全文数据库信息科技辑》(第04期);I140-3 * |
基于条件随机场的非规范化中文地址解析方法;许也 等;《地理与地理信息科学》;第35卷(第02期);12-18 * |
Also Published As
Publication number | Publication date |
---|---|
CN111859849A (zh) | 2020-10-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10713306B2 (en) | Content pattern based automatic document classification | |
US9977995B2 (en) | Image clustering method, image clustering system, and image clustering server | |
CN111709527A (zh) | 运维知识图谱库的建立方法、装置、设备及存储介质 | |
CN101859303A (zh) | 元数据管理方法及管理系统 | |
CN115238710B (zh) | 一种文档智能生成与管理方法及装置 | |
CN109933803B (zh) | 一种成语信息展示方法、展示装置、电子设备及存储介质 | |
CN111325022A (zh) | 识别层级地址的方法和装置 | |
CN109858025B (zh) | 一种地址标准化语料的分词方法及系统 | |
CN111680804A (zh) | 一种运检工作票生成方法、设备以及计算机可读介质 | |
CN112882899B (zh) | 一种日志异常检测方法及装置 | |
CN111859849B (zh) | 一种用电地址的管理方法和装置 | |
CN117667841A (zh) | 一种企业数据管理平台及方法 | |
CN117272228A (zh) | 一种基于异质图嵌入的数据融合方法、系统、设备及介质 | |
CN114519071A (zh) | 规则匹配模型的生成方法、匹配方法、系统、设备和介质 | |
CN114116779A (zh) | 基于深度学习的电网调控领域信息检索方法、系统和介质 | |
CN113032496A (zh) | 一种基于产业知识图谱的产业大脑数据分析系统 | |
CN112966031A (zh) | 数据处理方法、装置、电子设备及计算机可读存储介质 | |
CN110517010A (zh) | 一种数据处理方法、系统及存储介质 | |
CN112784119B (zh) | 一种数据查询及同步优化方法及装置 | |
CN113660322B (zh) | 一种线下合同上云的方法及系统 | |
CN112256838B (zh) | 相似域名查找方法、装置及电子设备 | |
CN117149268A (zh) | 一种注释生成方法及装置 | |
US20240028606A1 (en) | Data catalog and retrieval system | |
Aarthi et al. | Sophisticated Data Entry Application using Matchmaking Algorithm through Scanned Images | |
US10268674B2 (en) | Linguistic intelligence using language validator |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |