CN102082686A - 局数据核查控制方法及装置 - Google Patents
局数据核查控制方法及装置 Download PDFInfo
- Publication number
- CN102082686A CN102082686A CN2009102501634A CN200910250163A CN102082686A CN 102082686 A CN102082686 A CN 102082686A CN 2009102501634 A CN2009102501634 A CN 2009102501634A CN 200910250163 A CN200910250163 A CN 200910250163A CN 102082686 A CN102082686 A CN 102082686A
- Authority
- CN
- China
- Prior art keywords
- data
- office
- decompressed
- ion
- decompress
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Abstract
本发明提供了一种局数据核查控制方法及系统,其中,该方法包括:用正则表达式对局数据进行描述及抽取,得到待核查的抽取数据;将抽取数据解压为具有预设标准位数的解压数据;删除解压数据中的重复数据;将经删除步骤后的解压数据传送至局数据核查系统。本发明通过设置正则表达式对现网数据进行描述及抽取,并删除解压数据中的重复数据,从而提高数据核查质量,进而提高核查效率。
Description
技术领域
本发明涉及网管技术领域,具体涉及一种局数据核查控制方法及装置。
背景技术
在交换机中存在标准的号段、路由等局数据信息,交换机通过这些信息使无线业务正常运营。因此,交换机数据的质量至关重要,需要定期对交换机中的数据进行核查。现行数据核查的方式主要包括人工核对以及使用核查系统进行核查。其中,使用核查系统进行核查是通过计算机系统将现网数据和标准数据进行比对,找到不符合标准数据的现网数据,并进行修改。当现网数据中有大匹配号码(即不是标准数据的7位数字)时,核查系统在将现网数据与标准数据进行比对之前,首先拆分大匹配号码,如将151拆分为一万个用户号码(即1510000-1519999),然后将拆分后的号码与标准数据进行比对。此时,若在拆分前现网中已经存1510000-1519999之间的号码,如1517548,则会出现两条1517548号段,其中一条是根据151拆分而来,另一条是现网中已经存在的,核查系统无法对长短号码进行区分,导致报错,而且现网数据中会出现多条大匹配号段,使核查更加复杂。
现有局数据核查系统有如下不足:现有系统无法区分长、短号,会把大匹配的号码错报,导致对大匹配号码的核查错误,核查的正确率低,效率低。
发明内容
本发明的第一目的是提出一种高效的局数据核查控制方法。
本发明的第二目的是提出一种高效的局数据核查控制装置。
为实现上述第一目的,本发明提供了一种局数据核查控制方法,包括:利用正则表达式对局数据进行描述及抽取,得到待核查的抽取数据;将抽取数据解压为具有预设标准位数的解压数据;删除解压数据中的重复数据;将经删除步骤后的解压数据传送至局数据核查系统。
为实现上述第二目的,本发明提供了一种局数据核查控制装置,包括:文件读取器,用于获取现网局数据;正则表达解析器,用于利用正则表达式对局数据进行描述及抽取,得到待核查的抽取数据;局数据解压器,用于将抽取数据解压为具有预设标准位数的解压数据;数据解析器,用于删除解压数据中的重复数据,以及将经删除处理后的解压数据传送至局数据核查系统。
本发明各个实施案例中,通过设置正则表达式对现网数据进行描述及抽取,并删除解压数据中的重复数据,从而提高数据核查质量,进而提高核查效率。
附图说明
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一并用于解释本发明,并不构成对本发明的限制。在附图中:
图1为本发明的局数据核查控制方法的实施例一流程图;
图2为本发明的局数据核查控制方法的实施例二流程图;
图3为本发明的局数据核查控制装置的实施例结构图。
具体实施方式
以下结合附图对本发明的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明。
方法实施例
图1为本发明的局数据核查控制方法的实施例一流程图。如图1所示,本实施例包括:
步骤S102:利用正则表达式对局数据进行描述及抽取,得到待核查的抽取数据;具体操作过程参见图2中步骤2及步骤3的解释说明;
步骤S104:将抽取数据解压为具有预设标准位数的解压数据;具体操作过程参见图2中步骤4的解释说明;
步骤S106:删除解压数据中的重复数据;具体操作过程参见图2中步骤7的解释说明;
步骤S108:将经删除处理后的解压数据传送至局数据核查系统。
本实施例通过设置正则表达式对现网数据进行描述及抽取,并删除解压数据中的重复数据,从而提高数据核查质量,进而提高核查效率。
图2为本发明的局数据核查控制方法的实施例二流程图。如图2所示,本实施例包括:
步骤1:数据分析器(即图4中的局数据核查控制装置,其解释说明详见图4)获取现网局数据;
步骤2:数据分析器采用正则表达式对现网局数据进行描述;其中,正则表达式可以使用基于perl的正则表达式,如下式:
\d+\s+1\s+86(\d+)\s+(79\-1\&80\-1|82-1) (1)
使用上述正则表达式(1)对局数据进行描述后现网数据可表示如下:
........................
具体操作时,可以按照局数据的核查要求,即具体的核查对象,编制正则表达式;
步骤3:数据分析器根据正则表达式对局数据进行抽取;也就是说,经过步骤2之后,正则表达式对现网数据进行正则匹配,将满足要求(即需要核查)的字符匹配出来,如,若需要对I love China中的love核查,则可使用正则表达式“I\s+(\w+)\s+\w+”表述I love China,进而根据该正则表达式“I\s+(\w+)\s+\w+”进行正则匹配得到待核查的匹配字段love;再如,在需要核查现网数据中的用户号码及路由信息,则需要通过用于提取用户号码及路由信息的正则表达式对现网数据进行匹配,以抽取现网中待核查的号段信息,如由上述正则表达式(1)抽取的结果为:
表1抽取的用户号码及路由信息
用户号码 | 路由信息 |
1350331 | 79-1&80-1 |
1350332 | 79-1&80-1 |
1350333 | 79-1&80-1 |
1350334 | 79-1&80-1 |
135033 | 82-1 |
步骤4:数据分析器对抽取数据进行解压;
具体操作时,可以将所有的抽取数据进行解压,其中,解压的标准是将数据解压为与标准数据位数相同的号段;也可以只对抽取数据中的压缩数据进行解压,而将非压缩数据直接作为其解压数据,如,步骤3中的135033为压缩数据,则将135033解压成10个7位标准的数据:1350330、1350331...1350339;同理,13503则解压成100个号段,1350解压成1000个号段;
步骤5:数据分析器将解压后的现网局数据发送至数据库,存储到数据库指定的表中;
步骤6:数据分析器从数据库中获取解压的现网局数据;
步骤7:数据分析器对解压的现网局数据进行数据解析;由于对局数据进行解压,可能会产生重复的现网局数据,步骤7的目的是产生没有重复数据的局数据集合;如表2为没有进行解析的现网据数据,其包括两条1350331的数据,其中一条是根据压缩号段解压得到,数据分析器会把1350331(82-1、压缩135033)这条数据删除,以保证无重复数据;
表2未进行解析的现网据数据
1350331 | 79-1&80-1 | 没有压缩 |
1350332 | 79-1&80-1 | 没有压缩 |
1350333 | 79-1&80-1 | 没有压缩 |
1350334 | 79-1&80-1 | 没有压缩 |
1350331 | 82-1 | 压缩135033 |
步骤8:将解析后的现网局数据传送至局数据核查系统进行核查。
本实施例通过数据分析器完成局数据文件的读取、正则表达式对现网数据进行描述、匹配及抽取,并对数据解压及存储,以及删除解压数据中的重复数据实现对数据的解析,从而提高数据核查质量,进而提高核查效率。
装置实施例
图3为本发明的局数据核查控制装置的实施例结构图。上述图1-图2方法发明的各个实施例均可以在图3结构图所示结构的装置中实现。如图3所示,该系统包括:文件读取器32,用于获取现网局数据;正则表达解析器34,用于利用正则表达式对局数据进行描述及抽取,得到待核查的抽取数据;局数据解压器36,用于将抽取数据解压为具有预设标准位数的解压数据;数据解析器38,用于删除解压数据中的重复数据,以及将经删除处理后的解压数据传送至局数据核查系统。其中,文件读取器32为I/O操作,其可以从交换机或者本地读取指定的现网设备数据,现网局数据文件一般为文本文件。
正则表达解析器34可以包括:描述单元342,用于利用3正则表达式对现网局数据进行描述,其操作过程具体参见图2中步骤2的解释说明;抽取单元344,用于根据正则表达式抽取待核查的数据,即基于perl的正则表达式来实现正则匹配,完成现网局数据的核查字段的匹配(即抽取),其操作过程具体参见图2中步骤3的解释说明。
局数据解压器36可以包括:解压单元362,用于将抽取数据中的压缩数据解压为具有预设标准位数的解压数据,即完成大匹配数据的解压,把压缩的数据扩展为标准数据的7位(一般情况为7位,也可以有其他的位数,如8位),以及将抽取数据中的非压缩数据作为非压缩数据的解压数据,其操作过程具体参见图2中步骤4的解释说明;传送单元364,用于将解压数据传送至数据库存储。
数据解析器38可以包括:获取单元382,用于从数据库获取解压数据;解析单元384,用于删除解压数据中的重复数据,其操作过程具体参见图2中步骤7的解释说明;发送单元384,用于将经删除处理后的解压数据传送至局数据核查系统。
本领域技术人员应当可以理解,该局数据核查控制装置包括文件读取器32、正则表达解析器34、局数据解压器36以及数据解析器38即可,他们的各个单元均为优选的模块,可根据实际需要而设置;数据库及局数据核查系统均不属于本局数据核查控制装置。
本实施例通过局数据核查控制装置完成局数据文件的读取、正则表达式对现网数据进行描述、匹配及抽取,并对数据解压及存储,以及删除解压数据中的重复数据实现对数据的解析,从而提高数据核查质量,进而提高核查效率。
最后应说明的是:以上仅为本发明的优选实施例而已,并不用于限制本发明,尽管参照前述实施例对本发明进行了详细的说明,对于本领域的技术人员来说,其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (9)
1.一种局数据核查控制方法,其特征在于,包括:
利用正则表达式对局数据进行描述及抽取,得到待核查的抽取数据;
将所述抽取数据解压为具有预设标准位数的解压数据;
删除所述解压数据中的重复数据;
将经所述删除步骤后的解压数据传送至局数据核查系统。
2.根据权利要求1所述的局数据核查控制方法,其特征在于,所述正则表达式为基于perl的正则表达式。
3.根据权利要求1或2所述的局数据核查控制方法,其特征在于,在所述将抽取数据解压为具有预设标准位数的解压数据的步骤之后还包括:
将所述解压数据传送至数据库存储;
从所述数据库获取所述解压数据。
4.根据权利要求1或2所述的局数据核查控制方法,其特征在于,所述将抽取数据解压为具有预设标准位数的解压数据的步骤包括:
将所述抽取数据中的压缩数据解压为具有预设标准位数的解压数据;
将所述抽取数据中的非压缩数据作为所述非压缩数据的解压数据。
5.根据权利要求1或2所述的局数据核查控制方法,其特征在于,所述预设标准位数为七位或八位。
6.一种局数据核查控制装置,其特征在于,包括:
文件读取器,用于获取现网局数据;
正则表达解析器,用于利用正则表达式对局数据进行描述及抽取,得到待核查的抽取数据;
局数据解压器,用于将所述抽取数据解压为具有预设标准位数的解压数据;
数据解析器,用于删除所述解压数据中的重复数据,以及将经删除处理后的解压数据传送至局数据核查系统。
7.根据权利要求6所述的局数据核查控制装置,其特征在于,所述局数据解压器包括:
解压单元,用于将所述抽取数据中的压缩数据解压为具有预设标准位数的解压数据,以及将所述抽取数据中的非压缩数据作为所述非压缩数据的解压数据;
传送单元,用于将所述解压数据传送至数据库存储。
8.根据权利要求7所述的局数据核查控制装置,其特征在于,所述数据解析器包括:
获取单元,用于从所述数据库获取所述解压数据;
解析单元,用于删除所述解压数据中的重复数据;
发送单元,用于将经删除处理后的解压数据传送至局数据核查系统。
9.根据上述权利要求6至8中任一项所述的局数据核查控制装置,其特征在于,所述正则表达解析器包括:
描述单元,用于利用所述正则表达式对所述现网局数据进行描述;
抽取单元,用于根据所述正则表达式抽取待核查的数据。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2009102501634A CN102082686A (zh) | 2009-11-30 | 2009-11-30 | 局数据核查控制方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2009102501634A CN102082686A (zh) | 2009-11-30 | 2009-11-30 | 局数据核查控制方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN102082686A true CN102082686A (zh) | 2011-06-01 |
Family
ID=44088443
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2009102501634A Pending CN102082686A (zh) | 2009-11-30 | 2009-11-30 | 局数据核查控制方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN102082686A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103188094A (zh) * | 2011-12-28 | 2013-07-03 | 中国移动通信集团贵州有限公司 | 一种资源数据核查系统和方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101242616A (zh) * | 2007-11-22 | 2008-08-13 | 中国移动通信集团山东有限公司 | 局数据智能化制作方法及局数据智能化制作系统 |
CN101308495A (zh) * | 2007-10-24 | 2008-11-19 | 河北全通通信有限公司 | 局数据核查制作方法 |
CN101582076A (zh) * | 2009-06-24 | 2009-11-18 | 浪潮电子信息产业股份有限公司 | 一种基于数据库的重复数据删除方法 |
-
2009
- 2009-11-30 CN CN2009102501634A patent/CN102082686A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101308495A (zh) * | 2007-10-24 | 2008-11-19 | 河北全通通信有限公司 | 局数据核查制作方法 |
CN101242616A (zh) * | 2007-11-22 | 2008-08-13 | 中国移动通信集团山东有限公司 | 局数据智能化制作方法及局数据智能化制作系统 |
CN101582076A (zh) * | 2009-06-24 | 2009-11-18 | 浪潮电子信息产业股份有限公司 | 一种基于数据库的重复数据删除方法 |
Non-Patent Citations (1)
Title |
---|
井惟栋等: "基于Web服务的局数据管理系统", 《计算机工程与设计》 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103188094A (zh) * | 2011-12-28 | 2013-07-03 | 中国移动通信集团贵州有限公司 | 一种资源数据核查系统和方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102906751B (zh) | 一种数据存储、数据查询的方法及装置 | |
CN102937926B (zh) | 一种恢复移动终端已删除sqlite文件的方法及装置 | |
CN1318974C (zh) | 数据库备份数据的压缩和查询方法 | |
US8244693B2 (en) | Method and device for compressing table based on finite automata, method and device for matching table | |
CN104462141A (zh) | 一种数据存储与查询的方法、系统及存储引擎装置 | |
CN101783788A (zh) | 文件压缩、解压缩方法、装置及压缩文件搜索方法、装置 | |
CN102034049A (zh) | 海量数据压缩加密存储及检索系统及其使用方法 | |
JP2007219882A (ja) | ファイル格納装置 | |
CN105191144B (zh) | 压缩装置、压缩方法、解压装置、解压方法以及信息处理系统 | |
CN103425669B (zh) | 号段及归属地的编码方法和系统、归属地查询方法和系统 | |
CN106528786A (zh) | 快速迁移多源异构电网大数据到HBase的方法及系统 | |
CN105657677A (zh) | 一种短信发送方法、短信网关及业务平台 | |
CN109101504A (zh) | 一种高效的日志压缩和索引方法 | |
CN101242616A (zh) | 局数据智能化制作方法及局数据智能化制作系统 | |
CN105045676A (zh) | 基于SQLite数据库的丢失数据的恢复装置和方法 | |
CN106777258A (zh) | 一种医疗大数据存储中Hbase行键的编码及压缩方法 | |
CN102214170A (zh) | 一种xml数据压缩和解压缩方法及系统 | |
CN102082686A (zh) | 局数据核查控制方法及装置 | |
CN103778258A (zh) | 一种数据库数据的发送、接收方法、客户端、服务器 | |
TW201440442A (zh) | 安全及無損失的資料壓縮 | |
CN102790766A (zh) | 对象查询的方法、系统、对象查询装置和对象查询获取装置 | |
CN104517062A (zh) | 一种基于文档对象模型的分权限文档管理的方法及装置 | |
CN108848383A (zh) | 一种视频、图像数据的压缩方法 | |
CN105243188B (zh) | 一种智能变电站监控信息量自动筛选方法 | |
CN102281516B (zh) | 一种短信处理方法及短信处理终端 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C12 | Rejection of a patent application after its publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20110601 |