CN116628283A - 基于大数据的一种手册数据校验方法 - Google Patents

基于大数据的一种手册数据校验方法 Download PDF

Info

Publication number
CN116628283A
CN116628283A CN202310722078.3A CN202310722078A CN116628283A CN 116628283 A CN116628283 A CN 116628283A CN 202310722078 A CN202310722078 A CN 202310722078A CN 116628283 A CN116628283 A CN 116628283A
Authority
CN
China
Prior art keywords
data
subset
manual
subsets
feedback
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310722078.3A
Other languages
English (en)
Inventor
周琨
周在亮
金瑞雪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou Zhimao Jietong Technology Co ltd
Original Assignee
Suzhou Zhimao Jietong Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou Zhimao Jietong Technology Co ltd filed Critical Suzhou Zhimao Jietong Technology Co ltd
Priority to CN202310722078.3A priority Critical patent/CN116628283A/zh
Publication of CN116628283A publication Critical patent/CN116628283A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/90335Query processing
    • G06F16/90348Query processing by searching ordered data, e.g. alpha-numerically ordered data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/12Accounting
    • G06Q40/125Finance or payroll
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Abstract

本发明公开了数据校验领域的基于大数据的一种手册数据校验方法,能够将手册录入后的标准数据以及录入的数据分别拆分成若干个第一数据子集与第二数据子集,并在第一数据子集、第二数据子集中分别进行查询,当相应搜索命令获得的第一数据反馈子集以及第二数据反馈子集中的目标数据相等时,说明该第一数据子集、第二数据子集中出现问题的可能性较小,因此顺序对下一第一数据子集、第二数据子集进行查询,本发明采用拆分与查询的方式,能够快速对手册录入前后的数据不对等的区域进行定位,然后再对不对等的原因进一步查询,能够快速发现数据丢失的现象及定位到具体的区域,校验效率高,检测速度快。

Description

基于大数据的一种手册数据校验方法
技术领域
本发明涉及数据校验领域,具体涉及基于大数据的一种手册数据校验方法。
背景技术
在海关检验过程中,企业需要将自身的电子账册提供给海关部门,在电子账册数据上传的过程中,会有各种各样的影响,有的影响会导致数据出现差错。因此,需要对上传的数据进行校验和比对,然而传统的数据比对方法虽然比对逻辑比较简单,但是比对、运行速度比较慢,比对效率不高,具体地措施在于,在对比数据中提取一条比对数据,然后将对比数据分别逐一的与被对比数据比对并逐一反馈比对结果,可想而知的是,这种比对方法的运算量极为庞大,比对运算效率低。
发明内容
解决的技术问题
针对现有技术中的问题,本发明提出基于大数据的一种手册数据校验方法。
技术方案
本发明通过以下技术方案予以实现:
基于大数据的一种手册数据校验方法,包括步骤:S1:获取手册数据并定义为第一数据集,获取手册的录入数据,定义录入数据为第二数据集,第一数据集与第二数据集中数据的顺序位置一一对应相同;将手册数据以及录入后的数据分别拆分成若干个第一数据子集与第二数据子集;采用拆分与查询的方式,能够快速对手册录入前后的数据不对等的区域进行定位,然后再对不对等的原因进一步查询。
S2:第一数据集中的数据按照固定的长度拆分为多个第一数据子集,第二数据集中的数据按照固定的长度拆分为多个第二数据子集;
S3:在第一数据子集与第二数据子集中分别进行查询,得到响应搜索命令获得的第一数据反馈子集以及第二数据反馈子集;
S4:第一数据反馈子集与第二数据反馈子集的响应搜索命令获得的目标数据数量相等,则顺序对下一第一数据反馈子集、第二数据反馈子集进行查询;具体包括,当相应搜索命令获得的第一数据反馈子集以及第二数据反馈子集中的目标数据相等时,说明该第一数据子集、第二数据子集中出现问题的可能性较小,因此顺序对下一第一数据子集、第二数据子集进行查询;
S5:第一数据反馈子集与第二数据反馈子集的响应搜索命令获得的目标数据数量不相等,则通过数据提取模块提取该第一数据子集与第二数据子集,再通过数据对比模块对该第一数据子集与第二数据子集中的数据进行比对;具体包括,当相应搜索命令获得的第一数据反馈子集以及第二数据反馈子集中的目标数据不等时,优先对该部分的第一数据子集、第二数据子集比对,获取目标数据不等的原因。
进一步地,多个第一数据子集的数据顺序拼接排列后与第一数据集中的数据排列顺序相同。
进一步地,多个第二数据子集的数据顺序拼接排列后与第二数据集中的数据排列顺序相同。
进一步地,在S5中,第一数据反馈子集与第二数据反馈子集的响应搜索命令获得的目标数据数量相等,则通过数据对比模块顺序对第一数据子集与第二数据子集中的数据进行比对。
进一步地,在S5中,数据对比模块将第一数据子集与第二数据子集中对应不一致的数据进行标记。
进一步地,多个第一数据子集与第二数据子集中对应不一致的数据采用数据提取模块统一提取并汇成列表显示。
有益效果
采用本发明提供的技术方案,与已知的公有技术相比,具有如下有益效果:
本发明提出了基于大数据的一种手册数据校验方法,能够将手册数据以及录入后的数据分别拆分成若干个第一数据子集与第二数据子集,并在第一数据子集、第二数据子集中分别进行查询,当相应搜索命令获得的第一数据反馈子集以及第二数据反馈子集中的目标数据相等时,说明该第一数据子集、第二数据子集中出现问题的可能性较小,因此顺序对下一第一数据子集、第二数据子集进行查询,当相应搜索命令获得的第一数据反馈子集以及第二数据反馈子集中的目标数据不等时,优先对该部分的第一数据子集、第二数据子集比对,获取目标数据不等的原因。本发明采用拆分与查询的方式,能够快速对手册录入前后的数据不对等的区域进行定位,然后再对不对等的原因进一步查询,能够快速发现数据丢失的现象及定位到具体的区域,校验效率高,检测速度快。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍。显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明的整体框架图;
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
下面结合实施例对本发明作进一步的描述。
实施例1,结合图1,基于大数据的一种手册数据校验方法,包括步骤:S1:获取手册数据并定义为第一数据集,获取手册的录入数据,定义录入数据为第二数据集,第一数据集与第二数据集中数据的顺序位置一一对应相同;
S2:第一数据集中的数据按照固定的长度拆分为多个第一数据子集,第二数据集中的数据按照固定的长度拆分为多个第二数据子集;
S3:在第一数据子集与第二数据子集中分别进行查询,得到响应搜索命令获得的第一数据反馈子集以及第二数据反馈子集;
S4:第一数据反馈子集与第二数据反馈子集的响应搜索命令获得的目标数据数量相等,则顺序对下一第一数据反馈子集、第二数据反馈子集进行查询;
S5:第一数据反馈子集与第二数据反馈子集的响应搜索命令获得的目标数据数量不相等,则通过数据提取模块提取该第一数据子集与第二数据子集,再通过数据对比模块对该第一数据子集与第二数据子集中的数据进行比对。
本发明提出了基于大数据的一种手册数据校验方法,能够将手册数据以及录入后的数据分别拆分成若干个第一数据子集与第二数据子集,并在第一数据子集、第二数据子集中分别进行查询,当相应搜索命令获得的第一数据反馈子集以及第二数据反馈子集中的目标数据相等时,说明该第一数据子集、第二数据子集中出现问题的可能性较小,因此顺序对下一第一数据子集、第二数据子集进行查询,当相应搜索命令获得的第一数据反馈子集以及第二数据反馈子集中的目标数据不等时,优先对该部分的第一数据子集、第二数据子集比对,获取目标数据不等的原因。本发明采用拆分与查询的方式,能够快速对手册录入前后的数据不对等的区域进行定位,然后再对不对等的原因进一步查询,能够快速发现数据丢失的现象及定位到具体的区域,校验效率高,检测速度快。
进一步地,多个第一数据子集的数据顺序拼接排列后与第一数据集中的数据排列顺序相同。
进一步地,多个第二数据子集的数据顺序拼接排列后与第二数据集中的数据排列顺序相同。
进一步地,在S5中,第一数据反馈子集与第二数据反馈子集的响应搜索命令获得的目标数据数量相等,则通过数据对比模块顺序对第一数据子集与第二数据子集中的数据进行比对。
进一步地,在S5中,数据对比模块将第一数据子集与第二数据子集中对应不一致的数据进行标记。多个第一数据子集与第二数据子集中对应不一致的数据采用数据提取模块统一提取并汇成列表显示,能够使手册数据录入前后的数据差异一目了然地显示。
在本说明书的描述中,参考术语“一个实施例”、“示例”、“具体示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
以上公开的本发明优选实施例只是用于帮助阐述本发明。优选实施例并没有详尽叙述所有的细节,也不限制该发明的具体实施方式。显然,根据本说明书的内容,可作很多的修改和变化。本说明书选取并具体描述这些实施例,是为了更好地解释本发明的原理和实际应用,从而使所属技术领域技术人员能很好地理解和利用本发明。本发明仅受权利要求书及其全部范围和等效物的限制。

Claims (6)

1.基于大数据的一种手册数据校验方法,其特征在于:包括步骤:S1:获取手册数据并定义为第一数据集,获取手册的录入数据,定义录入数据为第二数据集,第一数据集与第二数据集中数据的顺序位置一一对应相同;将手册数据以及录入后的数据分别拆分成若干个第一数据子集与第二数据子集;采用拆分与查询的方式,能够快速对手册录入前后的数据不对等的区域进行定位,然后再对不对等的原因进一步查询。
S2:第一数据集中的数据按照固定的长度拆分为多个第一数据子集,第二数据集中的数据按照固定的长度拆分为多个第二数据子集;
S3:在第一数据子集与第二数据子集中分别进行查询,得到响应搜索命令获得的第一数据反馈子集以及第二数据反馈子集;
S4:第一数据反馈子集与第二数据反馈子集的响应搜索命令获得的目标数据数量相等,则顺序对下一第一数据反馈子集、第二数据反馈子集进行查询;具体包括,当相应搜索命令获得的第一数据反馈子集以及第二数据反馈子集中的目标数据相等时,说明该第一数据子集、第二数据子集中出现问题的可能性较小,因此顺序对下一第一数据子集、第二数据子集进行查询;
S5:第一数据反馈子集与第二数据反馈子集的响应搜索命令获得的目标数据数量不相等,则通过数据提取模块提取该第一数据子集与第二数据子集,再通过数据对比模块对该第一数据子集与第二数据子集中的数据进行比对;具体包括,当相应搜索命令获得的第一数据反馈子集以及第二数据反馈子集中的目标数据不等时,优先对该部分的第一数据子集、第二数据子集比对,获取目标数据不等的原因。
2.根据权利要求1所述的基于大数据的一种手册数据校验方法,其特征在于:多个第一数据子集的数据顺序拼接排列后与第一数据集中的数据排列顺序相同。
3.根据权利要求1所述的基于大数据的一种手册数据校验方法,其特征在于:多个第二数据子集的数据顺序拼接排列后与第二数据集中的数据排列顺序相同。
4.根据权利要求1所述的基于大数据的一种手册数据校验方法,其特征在于:在S5中,第一数据反馈子集与第二数据反馈子集的响应搜索命令获得的目标数据数量相等,则通过数据对比模块顺序对第一数据子集与第二数据子集中的数据进行比对。
5.根据权利要求1所述的基于大数据的一种手册数据校验方法,其特征在于:在S5中,数据对比模块将第一数据子集与第二数据子集中对应不一致的数据进行标记。
6.根据权利要求5所述的基于大数据的一种手册数据校验方法,其特征在于:多个第一数据子集与第二数据子集中对应不一致的数据采用数据提取模块统一提取并汇成列表显示。
CN202310722078.3A 2019-06-04 2019-06-04 基于大数据的一种手册数据校验方法 Pending CN116628283A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310722078.3A CN116628283A (zh) 2019-06-04 2019-06-04 基于大数据的一种手册数据校验方法

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201910482758.6A CN110362722A (zh) 2019-06-04 2019-06-04 基于大数据的一种手册数据校验方法
CN202310722078.3A CN116628283A (zh) 2019-06-04 2019-06-04 基于大数据的一种手册数据校验方法

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CN201910482758.6A Division CN110362722A (zh) 2019-06-04 2019-06-04 基于大数据的一种手册数据校验方法

Publications (1)

Publication Number Publication Date
CN116628283A true CN116628283A (zh) 2023-08-22

Family

ID=68215151

Family Applications (2)

Application Number Title Priority Date Filing Date
CN201910482758.6A Pending CN110362722A (zh) 2019-06-04 2019-06-04 基于大数据的一种手册数据校验方法
CN202310722078.3A Pending CN116628283A (zh) 2019-06-04 2019-06-04 基于大数据的一种手册数据校验方法

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN201910482758.6A Pending CN110362722A (zh) 2019-06-04 2019-06-04 基于大数据的一种手册数据校验方法

Country Status (1)

Country Link
CN (2) CN110362722A (zh)

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010006416A1 (en) * 2008-06-30 2010-01-21 Ali Davar System and method for interacting with a plurality of search engines
CN101639849B (zh) * 2009-06-01 2011-06-01 北京四维图新科技股份有限公司 处理数据的方法和装置
CN104298736B (zh) * 2014-09-30 2017-10-17 华为软件技术有限公司 数据集合连接方法、装置及数据库系统
CN107291716B (zh) * 2016-03-30 2020-07-21 阿里巴巴集团控股有限公司 一种链路数据校验方法及装置
CN108268496A (zh) * 2016-12-30 2018-07-10 北京国双科技有限公司 数据的校验方法及装置
CN109344151A (zh) * 2018-08-08 2019-02-15 航天信息股份有限公司 批量注册和修改用户信息的方法
CN109308299B (zh) * 2018-09-12 2020-01-14 北京字节跳动网络技术有限公司 用于搜索信息的方法和装置
CN109635256B (zh) * 2018-12-20 2023-07-11 上海掌门科技有限公司 用于校验数据的方法和装置

Also Published As

Publication number Publication date
CN110362722A (zh) 2019-10-22

Similar Documents

Publication Publication Date Title
DE112016005292T5 (de) Automatischer Abweichungsdetektionsdienst auf heterogenen Protokollströmen
CN109858476B (zh) 标签的扩充方法和电子设备
RU2016124134A (ru) Создание запросов для выполнения по многомерным структурам данных
CN102207857B (zh) Gui元素识别方法、装置及系统
WO2022116107A1 (en) Data management platform, intelligent defect analysis system, intelligent defect analysis method, computer-program product, and method for defect analysis
US11106650B2 (en) Data selection system and data selection method
WO2021012861A1 (zh) 数据查询耗时评估方法、装置、计算机设备和存储介质
CN115797808A (zh) 一种无人机巡检缺陷图像的识别方法、系统、装置及介质
US10042507B2 (en) Context-aware application status indicators
CN116628283A (zh) 基于大数据的一种手册数据校验方法
WO2022116111A1 (en) Computer-implemented method for defect analysis, computer-implemented method of evaluating likelihood of defect occurrence, apparatus for defect analysis, computer-program product, and intelligent defect analysis system
CN111696095B (zh) 用于检测物体表面缺陷的方法及装置
CN113918605A (zh) 数据查询方法、装置、设备以及计算机存储介质
CN103514294A (zh) 数据监测方法及系统
CN111104418B (zh) 文本描述的处理方法、装置和电子设备
CN112711542B (zh) 一种用于手机客户端进行测试环境切换的方法
WO2016046729A1 (en) Inspection tool for manufactured components
CN105320603B (zh) 浏览器页面元素的定位系统和方法及其自动化测试方法
CN110955603A (zh) 自动化测试方法、装置、电子设备及计算机可读存储介质
CN113470644B (zh) 一种基于语音识别的智能语音学习方法及装置
CN107105328A (zh) 一种机顶盒的控制方法、装置和系统
CN103995895A (zh) 一种基于图片的识图方法及装置
CN103034719A (zh) Cpu型号识别方法、设备及硬件检测系统
CN106446902B (zh) 非文字图像识别方法和装置
CN103914480A (zh) 一种用于自动应答系统的数据查询方法、控制器及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination