CN111563114A - 信息处理方法、装置、设备和存储介质 - Google Patents

信息处理方法、装置、设备和存储介质 Download PDF

Info

Publication number
CN111563114A
CN111563114A CN202010358661.7A CN202010358661A CN111563114A CN 111563114 A CN111563114 A CN 111563114A CN 202010358661 A CN202010358661 A CN 202010358661A CN 111563114 A CN111563114 A CN 111563114A
Authority
CN
China
Prior art keywords
data
file
source
subscription
source data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010358661.7A
Other languages
English (en)
Other versions
CN111563114B (zh
Inventor
张丙松
宋伟
高学鹏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Xinzhi Junyang Information Technology Co ltd
Original Assignee
Beijing Xinzhi Junyang Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Xinzhi Junyang Information Technology Co ltd filed Critical Beijing Xinzhi Junyang Information Technology Co ltd
Priority to CN202010358661.7A priority Critical patent/CN111563114B/zh
Publication of CN111563114A publication Critical patent/CN111563114A/zh
Application granted granted Critical
Publication of CN111563114B publication Critical patent/CN111563114B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/25Integrating or interfacing systems involving database management systems
    • G06F16/256Integrating or interfacing systems involving database management systems in federated or virtual databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/25Integrating or interfacing systems involving database management systems
    • G06F16/258Data format conversion from or to a database

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请提供一种信息处理方法、装置、设备和存储介质,方法包括:接收源终端发送的源数据;解析所述源数据,生成数据属性信息;根据所述数据属性信息,对所述源数据进行数据校验,并根据数据校验结果,处理所述源数据;通过链接实现数据共享。本申请实现了通过对源终端发送的源数据进行数据校验,并根据校验结果对源数据进行相应的处理,如此,可以针对不同的源终端发送的源数据进行处理,使得通过数据校验的源数据可以保持一致性,可以为后续订阅终端下载数据提供较为统一的数据。

Description

信息处理方法、装置、设备和存储介质
技术领域
本申请涉及信息处理技术领域,具体而言,涉及一种信息处理方法、装置、设备和存储介质。
背景技术
随着各行业内企业之间的竞争越来越激烈,数据信息化是各企业提高行业竞争力必要路径之一。伴随着各个企业数据信息化建设的发展,越来越多的信息系统的建设,大大提高了企业的信息化水平。
然而,由于早期各个信息系统建设的体系结构不尽相同,以及缺乏长远的规划,导致应用经常面临信息孤岛的问题。比如,系统与系统之间的功能重复建设,相互协作缺乏规范,交互复杂,造成单个系统如果需要向其他系统开放服务或进行数据交互,就需要对多个不同体系架构的系统开放不同的接口,甚至部分业务系统之间数据库环境差异,数据格式不一致等系统现状,导致数据传递通道堵塞。
因此,各信息系统间的互联互通、信息共享、业务协同是各行业企业发展迫切需要解决的问题,而解决这些问题的关键在于如何在各系统间进行安全、有效地数据交换。
发明内容
本申请实施例的目的在于提供一种信息处理方法、装置、设备和存储介质,用以实现根据源数据的属性信息,对源数据进行校验,并根据校验结果对源数据进行相应的数据处理。
本申请实施例第一方面提供了一种信息处理方法,包括:接收源终端发送的源数据;解析所述源数据,生成数据属性信息;根据所述数据属性信息,对所述源数据进行数据校验,并根据数据校验结果,处理所述源数据。
于一实施例中,所述解析所述源数据,生成数据属性信息,包括:从所述源数据中读取控制文件和数据文件;解析所述控制文件,生成所述数据文件的所述数据属性信息。
于一实施例中,所述数据属性信息包括:所述数据文件的文件名称;所述根据所述数据属性信息,对所述源数据进行数据校验,并根据数据校验结果,处理所述源数据,包括:判断预设数据库中是否存在与所述文件名称相同的数据;若所述预设数据库中存在与所述文件名称相同的数据,则生成对应于所述源数据的错误记录。
于一实施例中,还包括:若所述预设数据库中不存在与所述文件名称相同的数据,则根据所述数据属性信息,判断所述数据文件是否存在缺失;若所述数据文件存在缺失,则生成对应于所述源数据的缺失记录。
于一实施例中,还包括:若所述数据文件不存在缺失,则存储所述源数据至预设数据目录。
于一实施例中,还包括:查询对应于所述源数据的第一接口配置信息,提取所述第一接口配置信息中的数据上传时间,并记录对应于所述第一接口配置信息的无缺失文件到达次数;在当前时间到达所述数据上传时间,并且无缺失文件到达次数未达到预设次数时,生成对应于所述第一接口配置信息的批次缺失报告。
于一实施例中,还包括:接收订阅终端发送的订阅请求;解析所述订阅请求,生成所述订阅终端的第二接口配置信息和订阅目录;查询对应于所述订阅目录的订阅数据,并根据所述第二接口配置信息发送所述订阅数据至所述订阅终端。
本申请实施例第二方面提供了一种信息处理装置,包括:第一接收模块,用于接收源终端发送的源数据;第一解析模块,用于解析所述源数据,生成数据属性信息;校验模块,用于根据所述数据属性信息,对所述源数据进行数据校验,并根据数据校验结果,处理所述源数据。
于一实施例中,所述第一解析模块用于:从所述源数据中读取控制文件和数据文件;解析所述控制文件,生成所述数据文件的所述数据属性信息。
于一实施例中,所述数据属性信息包括:所述数据文件的文件名称;所述校验模块用于:判断预设数据库中是否存在与所述文件名称相同的数据;若所述预设数据库中存在与所述文件名称相同的数据,则生成对应于所述源数据的错误记录。
于一实施例中,还包括:判断模块,用于若所述预设数据库中不存在与所述文件名称相同的数据,则根据所述数据属性信息,判断所述数据文件是否存在缺失;第一生成模块,用于若所述数据文件存在缺失,则生成对应于所述源数据的缺失记录。
于一实施例中,还包括:存储模块,用于若所述数据文件不存在缺失,则存储所述源数据至预设数据目录。
于一实施例中,还包括:第一查询模块,用于查询对应于所述源数据的第一接口配置信息,提取所述第一接口配置信息中的数据上传时间,并记录对应于所述第一接口配置信息的无缺失文件到达次数;第二生成模块,用于在当前时间到达所述数据上传时间,并且无缺失文件到达次数未达到预设次数时,生成对应于所述第一接口配置信息的批次缺失报告。
于一实施例中,还包括:第二接收模块,用于接收订阅终端发送的订阅请求;第二解析模块,用于解析所述订阅请求,生成所述订阅终端的第二接口配置信息和订阅目录;第二查询模块,用于查询对应于所述订阅目录的订阅数据,并根据所述第二接口配置信息发送所述订阅数据至所述订阅终端。
本申请实施例第三方面提供了一种电子设备,包括:存储器,用以存储计算机程序;处理器,用以执行本申请实施例第一方面及其任一实施例的方法,以对接收到的源数据进行数据处理。
本申请实施例第四方面提供了一种非暂态电子设备可读存储介质,包括:程序,当其藉由电子设备运行时,使得所述电子设备执行本申请实施例第一方面及其任一实施例的方法。
本申请提供的信息处理方法、装置、设备和存储介质,通过对源终端发送的源数据进行数据校验,并根据校验结果对源数据进行相应的处理,如此,可以针对不同的源终端发送的源数据进行处理,使得通过数据校验的源数据可以保持一致性,可以为后续订阅终端下载数据提供较为统一的数据。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对本申请实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本申请一实施例的电子设备的结构示意图;
图2为本申请一实施例的数据交互场景的示意图;
图3为本申请一实施例的信息处理方法的流程示意图;
图4为本申请一实施例的信息处理方法的流程示意图;
图5为本申请一实施例的信息处理方法的流程示意图;
图6为本申请一实施例的信息处理装置的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行描述。在本申请的描述中,术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
如图1所示,本实施例提供一种电子设备1,包括:至少一个处理器11和存储器12,图1中以一个处理器为例。处理器11和存储器12通过总线10连接,存储器12存储有可被处理器11执行的指令,指令被处理器11执行,以使电子设备1可执行下述的实施例中方法的全部或部分流程,以根据源数据的属性信息,对源数据进行校验,并根据校验结果对源数据进行相应的数据处理。
于一实施例中,电子设备1可以是手机、笔记本电脑、台式计算机等设备。
请参看图2,其为本申请一实施例的数据交互场景,包括:服务器210、至少一个源终端220和至少一个订阅终端230,其中:
源终端220,可以是源数据提供方,属于上游数据系统,相对于数据流向来说处于数据流向的上游,相对于处在数据走向下游的系统来说是供数方。
订阅终端230:可以是数据接收方、下游系统,相对于数据流向来说处于数据流向的下游,相对于处在数据走向的上游系统来说是目标方。
服务器210是源终端220与订阅终端230进行数据交换的媒介。服务器210可以借由图1所示的电子设备1来实现。
在实际的数据交互场景中,源终端220将源数据上传至服务器210,源终端220与服务器210之间可以通过FTP(File Transfer Protocol,文件传输协议)协议进行数据传输。服务器210将源数据进行校验后存储,订阅终端230可以向服务器210订阅源终端220的数据,在收到订阅请求后,服务器210将对应的订阅数据发送给订阅终端230,进而完成一次数据交换。
于一实施例中,基于上述数据交换场景,为了便于清楚描述方案,给出如下术语定义:
接口单元:接口单元是源终端220和订阅终端230之间约定的最小数据交换单位。接口单元通常以表的形式体现。
接口数据文件:是指源数据提供方根据服务器210的要求,在指定的时间内完成对源终端220进行周期性抽取所形成的数据文件。
接口数据压缩文件:接口数据文件经过压缩工具压缩后形成的文件。比如gzip工具对接口数据文件压缩后形成的.gz文件。一个接口数据压缩文件里只有一个接口数据文件。
数据日期:数据日期是指源终端220数据采集的日期。该日期是数据采集动作发生时所对应日期。
批次号:源终端220每个交换频度内可以只传输一次数据,也可以传输多个批次的数据。批次号是用来表示该次传输是当日第几次传输。
接口控制文件:与接口数据文件对应,记录接口数据文件的大小、名称、数据行数,一个接口控制文件可能对应一个接口数据文件。也可能对应多个接口数据文件。
接口校验错误报告:接口数据压缩文件进行文件级校验出现错误后形成的报告。
日志文件:服务器210处理文件交换过程时形成的日志。
link文件:使用link命令建立的链接文件,不真正存储数据。
每日增量:指抽取每日00:00---24:00(具体时间由源终端220解释确定)发生变化的、新产生数据的最新状态的快照。
每月增量:指抽取每月1日00:00时始至月未最后一日24:00止(具体时间由源终端220解释确定),发生变化的、新产生的数据最新状态的快照。
每日全量:指抽取每日24:00(具体时间由源终端220解释确定)时,所有数据的最新状态快照。
每月全量:指抽取每月最后一日24:00(具体时间由源终端220解释确定)时,所有数据的最新状态快照。
其中,一个接口单元在每个交换频度内可能有多个批次的数据传输,一个批次内该接口单元只有一个控制文件,该控制文件可能对应多个数据文件,每个数据文件都通过gzip压缩为一个压缩文件。
于一实施例中,服务器210上的数据交换使用的可以是文本文件。源终端220对应的系统,负责按照服务器210约定的规范生成接口数据文件与接口控制文件,并将上述文件按照约定压缩工具进行压缩,最后将接口压缩文件与接口控制文件通过FTP协议上传到服务器210上。
于一实施例中,在通过服务器210进行数据交互之前,源终端220和订阅终端230可以预先在服务器210进行信息注册,需要注册的信息可以是包括:各个终端的英文简称、英文全称、中文名称、系统类型(源终端220或者订阅终端230)、FTP密码、重复密码、第一联系人的信息(姓名、部门、职务、座机、手机、邮箱地址)、第二联系人的信息(姓名、部门、职务、座机、手机、邮箱地址)、系统联系人的信息(姓名、部门、职务、座机、手机、邮箱地址)、注册按钮、重置按钮)的表单。
服务器210,可以对接收到的注册信息进行验证,比如验证英文简称是否重复,两次输入密码是否一致,如果验证通过,则将注册信息保存到数据库,建立对应的FTP用户,建立对应的根目录(/home/systems/<系统简称>),建立对应的订阅目录(/home/systems/<系统简称>/send),建立对应的效验目录(/home/process/<系统简称>),建立对应的数据目录(/home/data/<系统简称>),建立对应的日志目录(/home/log/<系统简称>),建立对应的错误目录(/home/error/<系统简称>),建立对应的报告目录(/home/report/<系统简称>),如果系统属于源终端220的系统,就建立上传目录(/home/systems/<系统简称>/receive)并且赋予FTP上传权限。
于一实施例中,在后续的使用过程中,源终端220和订阅终端230的用户可以在服务器210修改对应的注册信息,比如,通过服务器210系统信息管理页修改的注册信息可以包括:各个终端的英文简称、英文全称、中文名称、系统类型(源终端220的系统或者订阅终端230的系统)、修改链接、删除链接、订阅管理链接、上传接口管理链接(源系统)或变更为源终端220系统链接(订阅终端230系统))列表、注册链接等。
于一实施例中,当源终端220或者订阅终端230的用户修改链接时,可以跳转到该用户对应的系统信息修改页。删除链接弹出确认删除窗口,待接收到用户的确认后,删除该用户的系统信息,并且删除对应FTP用户及其对应目录(/home/systems/<系统简称>)。订阅管理链接跳转到该用户的系统为查询条件的订阅管理页。上传接口管理链接可以跳转到该用户的系统为查询条件的上传接口管理页。变更为源系统链接被点击后,可以将该用户系统的系统类型变更为源系统,并建立上传目录(/home/systems/<系统简称>/receive)并且赋予FTP上传权限。
源终端220,可以通过数据推送程序将源数据发送至服务器210,数据推送程序是将源数据从指定目录,推送到服务器210的指定用户的接收目录下的一个数据搬迁工具,具有定期自动扫描,数据搬迁的功能。
定期自动扫描,主要是指根据设定的时间,程序会定时扫描控制文件,并读取控制文件的信息,扫描控制文件。数据搬迁是扫描指定目录下的控制文件,扫描到的控制文件(比如可以是dir开头文件),按行读取,每行按空格分割为三份,分别为文件名、文件大小和数据行数。文件名加上<.gz>就是接收到的数据文件压缩包,当源终端220验证所有数据文件压缩包都存在时,把数据文件及控制文件迁移到服务器210的接收目录(比如,/home/swap/system/<系统简称>/receive)。
源终端220将数据文件压缩包和控制文件都使用mv命令移动到对应的数据目录(比如,/home/data/complete/<系统简称>/<期次>),如果数据传输过程中出现异常错误,则使用mv命令将存在数据文件压缩包和控制文件移动到错误目录(/home/data/error),并可以文件名以“f01_”开头。
订阅终端230,服务器210会为订阅终端230提供FTP服务,订阅终端230根据约定的目录,下载所需的接口数据压缩文件(.gz文件)和接口控制文件,原则上可以先下载接口数据压缩文件,再下载接口控制文件。订阅终端230可以选择自己平台的工具进行数据加载。如果加载过程中出现异常,则需要进行异常处理,根据异常的情况联系源数据提供方接口人或者服务器210方的接口人。
请参看图3,其为本申请一实施例的信息处理方法,该方法可由图1所示的电子设备1作为服务器210来执行,并可应用于图2所示的数据交互的场景中,以实现根据源数据的属性信息,对源数据进行校验,并根据校验结果对源数据进行相应的数据处理。该方法包括如下步骤:
步骤301:接收源终端220发送的源数据。
在本步骤中,源终端220的数据发送过程可参见图2中对应的实施例中的描述。服务器210可以实时接收源终端220推送过来的源数据,并将源数据存储在对应的接收目录。
步骤302:解析源数据,生成数据属性信息。
在本步骤中,源终端220发送的源数据中至少包含其基础的数据属性信息,比如数据格式和文件大小等信息。服务器210可以预先设置数据解析时间,定时解析源数据,从中获取源数据的数据属性信息。
步骤303:根据数据属性信息,对源数据进行数据校验,并根据数据校验结果,处理源数据。
在本步骤中,服务器210根据源数据的数据属性信息对其进行数据校验,只有通过数据校验的源数据才可以进行存储,并被订阅。
上述信息处理方法,通过对源终端220发送的源数据进行数据校验,并根据校验结果对源数据进行相应的处理,如此,可以针对不同的源终端220发送的源数据进行处理,使得通过数据校验的源数据可以保持一致性,为后续订阅终端230下载数据提供较为统一的数据。
请参看图4,其为本申请一实施例的信息处理方法,该方法可由图1所示的电子设备1作为服务器210来执行,并可应用于图2所示的数据交互的场景中,以实现根据源数据的属性信息,对源数据进行校验,并根据校验结果对源数据进行相应的数据处理。该方法包括如下步骤:
步骤401:接收源终端220发送的源数据。详细参见上述实施例中对步骤301的描述。
步骤402:从源数据中读取控制文件和数据文件。
在本步骤中,数据文件即上述实施例中定义的接口数据文件。控制文件即上述实施例中定义的接口控制文件,与数据文件对应,可以记录接口数据文件的大小、名称、数据行数等信息。一个接口控制文件可能对应一个接口数据文件。也可能对应多个接口数据文件。源数据中至少包含有控制文件和数据文件。服务器210可以扫描数据接收目录(Receive目录),从中识别到控制文件和数据文件。
步骤403:解析控制文件,生成数据文件的数据属性信息。
在本步骤中,可以定时扫描控制文件,比如,可以在接收目录(/home/systems/<系统简称>/receive)定时扫描控制文件,扫描到控制文件(dir.<系统简称>.<接口>.<期次>.<批次号>.<重传序号>.<z为初始,i为增量,f为全量>),按行读取,每行按空格分割可为三份,分别为文件名称、文件大小和数据行数,第一份为文件名称,加上<.gz>就是接收到的数据文件压缩包,上述信息都可作为数据文件的数据属性信息。
步骤404:判断预设数据库中,是否存在与文件名称相同的数据。如果是,进入步骤405,否则进入步骤406。
在本步骤中,服务器210可以将接口数据压缩文件与接口控制文件从数据接收目录使用Linux命令“mv”搬迁到数据校验目录(process目录),脱离开源系统的安全控制。搬迁时,根据步骤403中解析出来的文件名称,进行本地预设数据库中有无同名文件存在判断。
步骤405:生成对应于源数据的错误记录。
在本步骤中,若预设数据库中存在与文件名称相同的数据,说明本次上传的源数据可能已经上传过了,避免重复存储,则生成对应于源数据的错误记录,并将该文件移至错误数据目录(error目录),形成含有错误信息、错误级别的接口校验错误报告,并将错误信息和接口校验错误报告发送给源数据提供方相关接口人和服务器210的相关接口人,结束流程。
步骤406:根据数据属性信息,判断数据文件是否存在缺失,如果是,进入步骤408,否则进入步骤407。
在本步骤中,若预设数据库中不存在与文件名称相同的数据,则进一步对源数据进行文件级校验,根据接口控制文件的内容检验接口数据压缩文件(比如校验文件名称、文件个数是否正确),可以通过验证该源数据的所有数据文件压缩包是否都存在来判断数据文件是否存在缺失。
步骤407:存储源数据至预设数据目录。
在本步骤中,若所有数据文件压缩包都存在,表示数据文件不存在缺失,则将源数据的控制文件和数据文件存储至预设数据目录。比如,可以将数据文件压缩包和控制文件都使用mv命令移动到对应的数据目录(/home/data/<系统简称>/<期次>)。记录本次上传接口该期次文件成功到达一批的信息。然后可以进入步骤409。
于一实施例中,成功通过文件级校验后,为避免数据重复落地,调用文件分发功能,对预设数据目录中的接口数据文件创建link文件,并保存在数据下发存储上(send目录),供订阅终端230的相关系统进行数据下载。
步骤408:生成对应于源数据的缺失记录。并进入步骤409。
在本步骤中,如果数据文件压缩包缺失,表示数据文件存在缺失,则需要对该源数据进行缺失记录。如果文件级校验未通过,则形成接口校验错误报告,并将发生错误的接口控制文件、接口数据压缩文件移到错误数据存储目录。比如,可以使用mv命令将存在缺失的数据文件压缩包和控制文件移动到错误目录(/home/error/<系统简称>/<期次>),在报告目录(/home/report/<系统简称>/<期次>)生成文件缺失报告,发送给源终端220系统的所有联系人,记录本次上传接口该期次文件错误到达一批。
步骤409:查询对应于源数据的第一接口配置信息,提取第一接口配置信息中的数据上传时间,并记录对应于第一接口配置信息的无缺失文件到达次数。
在本步骤中,在实际应用场景中,不管数据文件压缩包是否缺失,最后都要遍历所有源数据对应的第一接口配置信息,提取第一接口配置信息中的数据上传时间,如果有第一接口数据上传最迟时间到了,则统计该第一接口本期次文件成功到达批次。
步骤410:在当前时间到达数据上传时间,并且无缺失文件到达次数未达到预设次数时,生成对应于第一接口配置信息的批次缺失报告。
在本步骤中,如果有第一接口数据上传最迟时间到了,并且该第一接口本期次文件成功到达批次没有达到需求的预设批次时,则在报告目录(/home/report/<系统简称>/<期次>)生成第一接口配置信息的批次缺失报告,并将批次缺失报告发送给源终端220系统的所有联系人。
于一实施例中,第一接口配置信息的定时检查,和邮件延时发送都是指在定时扫描接口最迟上传时间,在最迟上传时间之内,如果源数据没按时到达约定批次数,则会发邮件给所有相关联系人。
于一实施例中,服务器210可以对数据文件定时清理,比如可以是一个定时器,每天执行一次,每次按照清理规则删除期次超过的目录(/home/data/<系统简称>/<期次>和/home/systems/<系统简称>/send/<被订阅系统简称>/<期次>)。供订阅数据接收方的接口数据压缩文件/接口控制文件保存2个月。接口校验错误报告保存1年。日志文件保存2个月。错误数据保存2个月。
请参看图5,其为本申请一实施例的信息处理方法,该方法可由图1所示的电子设备1作为服务器210来执行,并可应用于图2所示的数据交互的场景中,以实现在服务器210成功存储源终端220发送的源数据后,服务器210可以根据订阅终端230的订阅请求,向订阅终端230发送订阅数据。该方法包括如下步骤:
步骤501:接收订阅终端230发送的订阅请求。
在本步骤中,服务器210可以为订阅终端230提供FTP服务,可以实时接收订阅终端230发送的订阅请求,订阅请求中至少包含有订阅终端230的用户信息、所需数据对应的源终端220信息和所需数据的基础属性信息。
步骤502:解析订阅请求,生成订阅终端230的第二接口配置信息和订阅目录。
在本步骤中,服务器210对订阅请求进行数据解析,从中获取到订阅终端230的用户信息、所需数据对应的源终端220信息和所需数据的基础属性信息,并以此生成订阅终端230的第二接口配置信息和订阅目录。第二接口配置信息是与订阅终端230约定的数据传输接口信息,可以基于订阅终端230的需要进行定制,订阅终端230的用户可以在前期注册时,向服务器210输入接口信息。
步骤503:查询对应于订阅目录的订阅数据,并根据第二接口配置信息发送订阅数据至订阅终端230。
在本步骤中,从已存储的预设数据目录中,查询对应于订阅目录的订阅数据,并根据约定的第二接口配置信息将订阅数据进行处理。服务器210可以为订阅终端230提供FTP服务,可以主动发送订阅数据给订阅终端230,也可以由订阅终端230的用户决定自行下载。
于一实施例中,服务器210中可以设置上传接口管理模块,并提供交互界面,以便于相关作业人员管理使用,比如可以主要包括上传接口信息列表页、订阅管理页。其中:
上传接口信息列表页,可以包括上传接口数据导入功能(按源系统导入)、上传接口数据导出功能(按源系统导出)、上传接口信息(接口表名称、接口中文描述、接口类型(增量、全量)、接口频率(日、月、年)、批次、数据上传最迟时间、说明、日期次状态链接、月期次状态链接、年期次状态链接、删除链接)列表(按源系统查询)。导入上传接口数据后,验证数据是否符合要求的格式,比如验证如下信息是否符合预设的格式:接口表名称、接口中文描述、接口类型(增量、全量)、接口频率(日、月、年)、批次、数据上传最迟时间(比如,日频率为hh24mi格式、月频率为ddhh24mi格式(其中可以用dd加L表示倒数天数(L1~L9))、年频率为mmddhh24mi格式)等,并可以验证sheet名(系统英文简称)是否存在。如果通过清空该系统以前上传接口,则添加excel数据文件包含上传接口。
订阅管理页,可以包括:系统订阅状态,比如源系统英文简称、接口表名、接口类型、接口频率、批次、最迟上传时间(月、日、时、分)、接口中文描述、是否订阅(复选框)列表(按系统和接口系统查询)。通过订阅复选框勾选,触发订阅。在发送目录(/home/systems/<系统简称>/send)下建立以被订阅源系统英文简称为名的目录(/home/systems/<系统简称>/send/<被订阅系统简称>),将对应数据目录(/home/data/<系统简称>)下的所有目录在该目录(/home/systems/<系统简称>/send/<被订阅系统简称>)下重建一遍,并且将目录(/home/data/<系统简称>/<期次>)下的对应接口文件建立硬link到对应的目录(/home/systems/<系统简称>/send/<被订阅系统简称>/<期次>)下。
通过是否订阅复选框取消,触发退订。在发送目录(/home/systems/<系统简称>/send)下删除以被订阅源系统英文简称为名的目录(/home/systems/<系统简称>/send/<被订阅系统简称>)下的对应接口文件,如果目录为空,将删除文件夹。
于一实施例中,服务器210可以设置上传文件监控模块,并提供交互界面,以便于相关作业人员管理使用,比如上传文件监控模块可以主要包括:上传接口文件最新状态页(对应于管理员)、上传接口文件最新状态页(对应于源终端220的系统用户)、上传接口文件最新状态页(对应于订阅终端230的系统用户)、上传接口历史查询页(管理员)、上传接口历史查询页(源系统用户)、上传接口历史查询页(目标系统用户)、系统订阅清单(源系统用户)、系统订阅清单(源系统用户、目标系统用户)、修改密码(源系统用户)、修改密码(目标系统用户)、运行状况监控页(管理员)、运行状况监控页(源系统用户)、运行状况监控页(目标系统用户)、过期文件清理服务。
上传接口历史查询页,可以包括上传接口状态(系统英文简称、接口表名称、接口中文描述、接口类型、接口频率、最迟上传时间、状态、已到正确批次、已到错误批次、操作)列表(按源系统、期次、表名查询)。
上传接口文件最新状态页,可以主要包括上传文件信息(期次、源系统、接口名称、接口中文描述、接口类型、接口频率、最迟上传时间、状态、已到正确批次、已到错误批次数据文件名称、数据文件大小、数据文件状态、数据文件到达时间)列表(状态、接口名称查询)、清理状态信息(当前状态、使用空间、剩余空间、上次清理文件大小、上次清理文件错误次数)块。
运行状态监控页,可以包括各源系统上传接口的系统统计(系统英文简称、期次、接口频率、最晚应到时间、接口总数、已到接口数、未到接口数)列表(按源系统、期次、频率查询)。
上述信息处理方法,提供了统一的数据交换通道和规范标准。通过明确源终端220、订阅终端230、接口方式、交换方法、异常处理等标准方法与责任,制定数据文件的命名、数据格式、分隔符、传输方式、校验文件格式和内容、数据处理异常、数据文件保存周期等标准规范内容,从而实现“星型”拓扑结构,简化数据交换流程,解决信息孤岛问题,保证各业务系统的数据抽取工作简单、高效的顺利进行。
请参看图6,其为本申请一实施例的信息处理装置600,该装置可应用于图1所示的电子设备1,并可应用于图2所示的数据交互的场景中,以实现根据源数据的属性信息,对源数据进行校验,并根据校验结果对源数据进行相应的数据处理。该装置包括:第一接收模块601、第一解析模块602和校验模块603,各个模块的原理关系如下:
第一接收模块601,用于接收源终端220发送的源数据。详细参见上述实施例中对步骤301的描述。
第一解析模块602,用于解析源数据,生成数据属性信息。详细参见上述实施例中对步骤302的描述。
校验模块603,用于根据数据属性信息,对源数据进行数据校验,并根据数据校验结果,处理源数据。详细参见上述实施例中对步骤303的描述。
于一实施例中,第一解析模块602用于:从源数据中读取控制文件和数据文件。解析控制文件,生成数据文件的数据属性信息。详细参见上述实施例中对步骤402至步骤403的描述。
于一实施例中,数据属性信息包括:数据文件的文件名称。校验模块603用于:判断预设数据库中是否存在与文件名称相同的数据。若预设数据库中存在与文件名称相同的数据,则生成对应于源数据的错误记录。详细参见上述实施例中对步骤404至步骤405的描述。
于一实施例中,还包括:判断模块604,用于若预设数据库中不存在与文件名称相同的数据,则根据数据属性信息,判断数据文件是否存在缺失。第一生成模块605,用于若数据文件存在缺失,则生成对应于源数据的缺失记录。详细参见上述实施例中对步骤406和步骤408的描述。
于一实施例中,还包括:存储模块606,用于若数据文件不存在缺失,则存储源数据至预设数据目录。详细参见上述实施例中对步骤407的描述。
于一实施例中,还包括:第一查询模块607,用于查询对应于源数据的第一接口配置信息,提取第一接口配置信息中的数据上传时间,并记录对应于第一接口配置信息的无缺失文件到达次数。第二生成模块608,用于在当前时间到达数据上传时间,并且无缺失文件到达次数未达到预设次数时,生成对应于第一接口配置信息的批次缺失报告。详细参见上述实施例中对步骤409至步骤410的描述。
于一实施例中,还包括:第二接收模块609,用于接收订阅终端230发送的订阅请求。第二解析模块610,用于解析订阅请求,生成订阅终端230的第二接口配置信息和订阅目录。第二查询模块611,用于查询对应于订阅目录的订阅数据,并根据第二接口配置信息发送订阅数据至订阅终端230。详细参见上述实施例中对步骤501至步骤503的描述。
上述信息处理装置600的详细描述,请参见上述实施例中相关方法步骤的描述。
本发明实施例还提供了一种非暂态电子设备可读存储介质,包括:程序,当其在电子设备上运行时,使得电子设备可执行上述实施例中方法的全部或部分流程。其中,存储介质可为磁盘、光盘、只读存储记忆体(Read-Only Memory,ROM)、随机存储记忆体(RandomAccess Memory,RAM)、快闪存储器(Flash Memory)、硬盘(Hard Disk Drive,缩写:HDD)或固态硬盘(Solid-State Drive,SSD)等。存储介质还可以包括上述种类的存储器的组合。
虽然结合附图描述了本发明的实施例,但是本领域技术人员可以在不脱离本发明的精神和范围的情况下作出各种修改和变型,这样的修改和变型均落入由所附权利要求所限定的范围之内。

Claims (16)

1.一种信息处理方法,其特征在于,包括:
接收源终端发送的源数据;
解析所述源数据,生成数据属性信息;
根据所述数据属性信息,对所述源数据进行数据校验,并根据数据校验结果,处理所述源数据。
2.根据权利要求1所述的方法,其特征在于,所述解析所述源数据,生成数据属性信息,包括:
从所述源数据中读取控制文件和数据文件;
解析所述控制文件,生成所述数据文件的所述数据属性信息。
3.根据权利要求1所述的方法,其特征在于,所述数据属性信息包括:所述数据文件的文件名称;所述根据所述数据属性信息,对所述源数据进行数据校验,并根据数据校验结果,处理所述源数据,包括:
判断预设数据库中是否存在与所述文件名称相同的数据;
若所述预设数据库中存在与所述文件名称相同的数据,则生成对应于所述源数据的错误记录。
4.根据权利要求3所述的方法,其特征在于,还包括:
若所述预设数据库中不存在与所述文件名称相同的数据,则根据所述数据属性信息,判断所述数据文件是否存在缺失;
若所述数据文件存在缺失,则生成对应于所述源数据的缺失记录。
5.根据权利要求4所述的方法,其特征在于,还包括:
若所述数据文件不存在缺失,则存储所述源数据至预设数据目录。
6.根据权利要求1所述的方法,其特征在于,还包括:
查询对应于所述源数据的第一接口配置信息,提取所述第一接口配置信息中的数据上传时间,并记录对应于所述第一接口配置信息的无缺失文件到达次数;
在当前时间到达所述数据上传时间,并且无缺失文件到达次数未达到预设次数时,生成对应于所述第一接口配置信息的批次缺失报告。
7.根据权利要求1所述的方法,其特征在于,还包括:
接收订阅终端发送的订阅请求;
解析所述订阅请求,生成所述订阅终端的第二接口配置信息和订阅目录;
查询对应于所述订阅目录的订阅数据,并根据所述第二接口配置信息发送所述订阅数据至所述订阅终端。
8.一种信息处理装置,其特征在于,包括:
第一接收模块,用于接收源终端发送的源数据;
第一解析模块,用于解析所述源数据,生成数据属性信息;
校验模块,用于根据所述数据属性信息,对所述源数据进行数据校验,并根据数据校验结果,处理所述源数据。
9.根据权利要求8所述的装置,其特征在于,所述第一解析模块用于:
从所述源数据中读取控制文件和数据文件;
解析所述控制文件,生成所述数据文件的所述数据属性信息。
10.根据权利要求8所述的装置,其特征在于,所述数据属性信息包括:所述数据文件的文件名称;所述校验模块用于:
判断预设数据库中是否存在与所述文件名称相同的数据;
若所述预设数据库中存在与所述文件名称相同的数据,则生成对应于所述源数据的错误记录。
11.根据权利要求10所述的装置,其特征在于,还包括:
判断模块,用于若所述预设数据库中不存在与所述文件名称相同的数据,则根据所述数据属性信息,判断所述数据文件是否存在缺失;
第一生成模块,用于若所述数据文件存在缺失,则生成对应于所述源数据的缺失记录。
12.根据权利要求11所述的装置,其特征在于,还包括:
存储模块,用于若所述数据文件不存在缺失,则存储所述源数据至预设数据目录。
13.根据权利要求8所述的装置,其特征在于,还包括:
第一查询模块,用于查询对应于所述源数据的第一接口配置信息,提取所述第一接口配置信息中的数据上传时间,并记录对应于所述第一接口配置信息的无缺失文件到达次数;
第二生成模块,用于在当前时间到达所述数据上传时间,并且无缺失文件到达次数未达到预设次数时,生成对应于所述第一接口配置信息的批次缺失报告。
14.根据权利要求8所述的装置,其特征在于,还包括:
第二接收模块,用于接收订阅终端发送的订阅请求;
第二解析模块,用于解析所述订阅请求,生成所述订阅终端的第二接口配置信息和订阅目录;
第二查询模块,用于查询对应于所述订阅目录的订阅数据,并根据所述第二接口配置信息发送所述订阅数据至所述订阅终端。
15.一种电子设备,其特征在于,包括:
存储器,用以存储计算机程序;
处理器,用以执行如权利要求1至7中任一项所述的方法,以对接收到的源数据进行数据处理。
16.一种非暂态电子设备可读存储介质,其特征在于,包括:程序,当其藉由电子设备运行时,使得所述电子设备执行权利要求1至7中任一项所述的方法。
CN202010358661.7A 2020-04-29 2020-04-29 信息处理方法、装置、设备和存储介质 Active CN111563114B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010358661.7A CN111563114B (zh) 2020-04-29 2020-04-29 信息处理方法、装置、设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010358661.7A CN111563114B (zh) 2020-04-29 2020-04-29 信息处理方法、装置、设备和存储介质

Publications (2)

Publication Number Publication Date
CN111563114A true CN111563114A (zh) 2020-08-21
CN111563114B CN111563114B (zh) 2022-02-25

Family

ID=72067990

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010358661.7A Active CN111563114B (zh) 2020-04-29 2020-04-29 信息处理方法、装置、设备和存储介质

Country Status (1)

Country Link
CN (1) CN111563114B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112667663A (zh) * 2020-12-28 2021-04-16 北京明略软件系统有限公司 一种数据查询方法及系统
CN115242784A (zh) * 2022-09-23 2022-10-25 浪潮通信信息系统有限公司 具有数据校验功能的1+n文件共享装置及方法

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102637214A (zh) * 2012-04-28 2012-08-15 中国工商银行股份有限公司 基于数据库服务间的通用数据同步方法及其系统
CN103873517A (zh) * 2012-12-14 2014-06-18 中兴通讯股份有限公司 一种数据同步的方法、装置和系统
US20160292206A1 (en) * 2015-03-31 2016-10-06 Oracle International Corporation Validating coherency between multiple data sets between database transfers
CN107920110A (zh) * 2017-10-27 2018-04-17 江苏飞搏软件股份有限公司 一种数据共享的方法及装置
CN109710628A (zh) * 2018-12-29 2019-05-03 深圳道合信息科技有限公司 信息处理方法及装置、系统、计算机及可读存储介质
CN110109903A (zh) * 2019-04-01 2019-08-09 广州白云国际机场股份有限公司 一种机场收费数据的自动校验系统及校验方法
CN110188132A (zh) * 2019-04-29 2019-08-30 安徽晶奇网络科技股份有限公司 一种数据交换方法及系统

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102637214A (zh) * 2012-04-28 2012-08-15 中国工商银行股份有限公司 基于数据库服务间的通用数据同步方法及其系统
CN103873517A (zh) * 2012-12-14 2014-06-18 中兴通讯股份有限公司 一种数据同步的方法、装置和系统
US20160292206A1 (en) * 2015-03-31 2016-10-06 Oracle International Corporation Validating coherency between multiple data sets between database transfers
CN107920110A (zh) * 2017-10-27 2018-04-17 江苏飞搏软件股份有限公司 一种数据共享的方法及装置
CN109710628A (zh) * 2018-12-29 2019-05-03 深圳道合信息科技有限公司 信息处理方法及装置、系统、计算机及可读存储介质
CN110109903A (zh) * 2019-04-01 2019-08-09 广州白云国际机场股份有限公司 一种机场收费数据的自动校验系统及校验方法
CN110188132A (zh) * 2019-04-29 2019-08-30 安徽晶奇网络科技股份有限公司 一种数据交换方法及系统

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112667663A (zh) * 2020-12-28 2021-04-16 北京明略软件系统有限公司 一种数据查询方法及系统
CN115242784A (zh) * 2022-09-23 2022-10-25 浪潮通信信息系统有限公司 具有数据校验功能的1+n文件共享装置及方法

Also Published As

Publication number Publication date
CN111563114B (zh) 2022-02-25

Similar Documents

Publication Publication Date Title
CN107092552B (zh) 一种日志管理方法及装置
CN111563114B (zh) 信息处理方法、装置、设备和存储介质
CN102752326B (zh) 在下载文件时处理数据的方法、服务器和系统
CN111835467B (zh) 消息发送方法、装置、计算机设备和存储介质
CN107423436A (zh) 一种用于不同类型数据库间在线数据迁移的方法
CN104991821A (zh) 批量处理监控任务的方法及装置
CN109783128A (zh) 代码改动通知方法、设备、存储介质及装置
CN105791399B (zh) 多中继互联网大数据推送方法和系统
CN112822260A (zh) 文件传输方法及装置、电子设备、存储介质
CN111190868A (zh) 一种文件处理方法和装置
CN112395266B (zh) 一种数据文件处理方法、第一服务器及计算机存储介质
CN111158716A (zh) 版本升级调用方法、装置、计算机系统及可读存储介质
CN115617555A (zh) 一种信息处理系统以及方法
CN112559233B (zh) 识别故障类型的方法、装置、设备和计算机可读介质
CN115269424A (zh) 生产流量的自动回归测试方法、装置、设备及存储介质
CN110909086A (zh) 邮件归档方法、系统、计算机设备和计算机可读存储介质
US11362843B1 (en) Certificate rotation on host
CN110365627B (zh) 应用程序同步方法、装置、计算设备以及存储介质
CN113141366B (zh) 报文报送方法及装置、存储介质和电子设备
US11836550B2 (en) Systems and methods for moving, reconciling, and aggregating data from mainframe computers to hybrid cloud
US11843706B1 (en) Gradual certificate rotation
CN108111611B (zh) 一种客户端检测方法、装置及电子设备
CN115658623A (zh) 批量数据导入方法及装置、存储介质、计算机设备
CN116866474A (zh) 基于分表策略的号码外呼拦截方法、装置、设备及介质
CN113923248A (zh) 一种通用mq交互方法、系统、装置及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant