CN115543940B - 一种基于uri规则配置集成统一处理文件的系统和方法 - Google Patents

一种基于uri规则配置集成统一处理文件的系统和方法 Download PDF

Info

Publication number
CN115543940B
CN115543940B CN202211487044.2A CN202211487044A CN115543940B CN 115543940 B CN115543940 B CN 115543940B CN 202211487044 A CN202211487044 A CN 202211487044A CN 115543940 B CN115543940 B CN 115543940B
Authority
CN
China
Prior art keywords
file
configuration
processing
uri
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202211487044.2A
Other languages
English (en)
Other versions
CN115543940A (zh
Inventor
吴凡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Aspire Technologies Shenzhen Ltd
Original Assignee
Aspire Technologies Shenzhen Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Aspire Technologies Shenzhen Ltd filed Critical Aspire Technologies Shenzhen Ltd
Priority to CN202211487044.2A priority Critical patent/CN115543940B/zh
Publication of CN115543940A publication Critical patent/CN115543940A/zh
Application granted granted Critical
Publication of CN115543940B publication Critical patent/CN115543940B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/17Details of further file system functions
    • G06F16/172Caching, prefetching or hoarding of files
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/11File system administration, e.g. details of archiving or snapshots

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于URI规则配置集成统一处理文件的系统和方法,使用URI规则自定义配置,通过自定义Scheme来区分要处理文件源类型和方式标识,通过Scheme后的片段标识为辅助资源提供文件内容的处理方式,最终形成能够统一处理文件的URI配置方式,不同类型的文件读取与文件内容处理通过灵活修改配置即可。通过生产者/消费者模式,先将需处理的文件内容信息和规则信息存放到缓冲区,再通过消费者读取缓冲区的数据,根据配置灵活处理,达到内容读取和内容业务处理分离,同时可根据读取文件规模灵活选择缓冲区为队列或第三方订阅服务进行支撑。

Description

一种基于URI规则配置集成统一处理文件的系统和方法
技术领域
本发明属于计算机信息技术管理行业中的文件消息处理技术领域,具体涉及一种基于URI规则配置集成统一处理文件的系统和方法。
背景技术
软件系统之间通常需要以文件方式进行信息数据交互或传递;文件消息处理通常是对单一文件进行解析获取内容,再根据解析内容做相应业务处理,耦合度高。完成文件解析处理常用的方式有如:IO输入流方式、Buffer缓冲方式读取,这两种方式都是基于IO流方式进行处理。两者隶属于同一体系,核心处理机制因方式的不同存在差异,处理结果效率存在一定的差异。同时对于同一文件源平台如CRM或者BOSS等报文数据结构的异构,取决于源文件的实现厂商,文件消费端系统只能遵循,通常文件消费端系统接入单源或多源文件亦是如此。
为满足文件类消息处理,被接入方需结合分析文件大小、文件名及后缀的业务含义、文件内容格式及数据含义,交互约定等进行处理。
为满足被接入方文件处理的业务要求,需依托文件源平台定义的标准,先对约定文件进行内容提取,再根据解析内容做相应业务处理,该实现方式的缺点是耦合度高、兼容性差、可重用低。完成文件解析处理常用的方式有IO输入流方式、Buffer缓冲方式读取等。两者隶属于同一体系,核心处理机制因方式的不同存在差异,处理结果效率存在一定的差异。完成文件内容对应业务处理需遵循源文件内容数据体格式约定的同时,结合自身业务需求进行业务处理,不易交叉对接和同源业务处理的提取。
而不同承建厂商、不同建设时间创建的软件系统,其文件消息表示形式、内容格式存在差异,会直接影响文件消息被接入方的处理方式。常见文件后缀为.CFG、.dat、.dif、.txt、excel等,文件内容格式有行、Xml、Json等;例如基于移动域系统,常需与各级CRM、BOSS、经营分析系统、集中化管理平台等,进行计费、订购关系、指标数据等以文件进行消息数据交互场景,针对文件形式消息存在的差异,数据异构,各消费方系统处理方式众多且零散,技术栈不统一;即便有些场景中的多个文件消费端系统对接文件源为同一省份CRM或BOSS,但针对同一源文件的解析方式和数据处理方式也存在差异较大、个性化处理多的情况。
因此,现有技术中存在以下技术问题:
1、由于不同文件源系统承建来源不同厂商,进行交互的文件种类和内容存在多样化差异,且存在同一文件源提供方系统因存在区域承建差异,在关键属性相同的情况下其内容格式存在较大差异。对于被接入系统处理文件时,在一定程度上受限于以上差异。为保证完成文件消息对接方案,如接入多家不同源文件厂商或同系统在不同区域时,对被接入方系统处理文件而言极其不方便,存在文件形式不同处理方式同,可扩展性差,文件内容与业务处理耦合度高,复用度低,维护成本高。
2、随文件种类增多,处理文件内容方式增多,读取与业务处理耦合度过高,处理方式相对单一、应用场景相对单一,效率低。
3、不同文件接入,由于文件内容差异较大,在实现上会花费更多精力的数据对象处理和数据验证上,无法保证文件消费端只关心应用本身的业务实现。
发明内容
为了解决现有技术存在的上述问题,本发明目的在于提供一种基于URI规则配置集成统一处理文件的系统和方法,使用URI(统一资源标识符)规则配置,通过自定义Scheme来区分要处理文件源类型和方式标识,通过Scheme后的片段标识为辅助资源提供文件内容的处理方式,最终形成处理文件URI配置方式的统一,不同类型的文件读取与文件内容处理通过灵活修改配置即可;
通过生产者/消费者模式,先将需处理文件内容信息和规则信息存放到缓冲区,再通过消费者读取缓冲区的数据,根据配置灵活处理,达到内容读取和内容业务处理分离,同时可根据读取文件规模灵活选择缓冲区为队列或第三方订阅服务进行支撑。
可扩展性强,文件内容与业务处理耦合度低,复用度高,减少维护成本投入,节约文件数据处理时间,确保消费端只需关注关键业务。
本发明所采用的技术方案为:
一种基于URI规则配置集成统一处理文件的系统,包括有控制器、处理触发器、配置管理模块、URI规则处理器、数据缓冲区和业务处理控制器;
所述控制器用于传入发起文件处理的节点配置名;
所述处理触发器用于初始化URI配置规则,并获取每个处理节点对应的URI配置集合;
所述配置管理模块用于根据配置目录遍历文件信息,并为文件对象适配URI规则处理器;
所述URI规则处理器用于将文件处理配置及文件指内容存放到缓冲区;
所述数据缓冲区用于存储配置数据,并供数据缓存区消费者选择使用;
所述业务处理控制器用于接收缓存区消费者在数据缓冲区获取的缓存区数据和URI配置。
进一步地,所述处理触发器还用于根据文件名匹配相应的文件处理配置。
所述处理触发器还用于拉起异步数据缓冲区异步消费者。
本发明还涉及一种使用上述基于URI规则配置集成统一处理文件的系统的基于URI规则配置集成统一处理文件的方法,包括有以下步骤:
S01,启动控制器,传入发起文件处理节点配置名;
S02,调用处理触发器,处理触发器初始化URI配置规则,开始处理文件对象;
S03,处理触发器根据节点配置名,调用配置管理模块获取处理节点配置名对应的URI配置规则集合信息;
S04,处理触发器根据获取到的配置中的文件对象目录,遍历相关文件对象;
S05,处理触发器根据遍历文件名正则的配置获取当前文件的URI配置规则;
S06,处理触发器根据URI配置规则中的URI自定义规则进行Scheme匹配,从而适配URI规则处理器;
S07,URI规则处理器根据Scheme后的辅助配置对文件按配置进行读取处理;
S08,将文件数据存放到数据缓冲区中;
S09,文件内容根据URI配置规则处理完成;
S10,处理触发器拉起异步数据缓冲区异步消费者;
S11,开始消费缓冲区数据;
S12,数据缓冲区消费者获取缓冲区数据和配置,准备消费文件数据;
S13,数据缓存区消费者通过工具配置将数据写入到业务处理控制器,由业务控制器处理数据相关具体业务。
进一步地,所述步骤S01中包括以下内容:
所述节点配置名为待处理的一个文件夹目录下所有文件的唯一标识位,根据该文件夹下的具体文件的业务处理需求,在该节点下配置与该业务对应的URI规则处理器。
所述步骤S02中包括以下内容:
所述URI规则配置中包括yaml格式配置,yaml格式配置根据配置关系设计成表格结构存放到关系型数据库中。
所述URI自定义规则的形式为:
规则处理器://处理器名称规则处理器对应处理内容配置。
再进一步地,所述URI自定义规则的种类为:
按行方式读取并进行分隔;
按行方式读取不进行分隔;
按行方式读取csv文件;
读取Excel文件,Excel文件包括xls和xlxs。
读取内容为XML格式的文件;
读取内容为JSON格式的文件。
再进一步地,所述按行方式读取并进行分隔和按行方式读取不进行分隔中,单次读取分别处理600条数据,起始行为10,结束行为1000,为行文件并将行数据按照一定规则进行分隔。
最后,所述数据缓冲区使用Ehcache、queue缓存技术时,URI规则配置文件统一处理与应用系统采用jar集成方式;使用Redis、ES、Kafka时采用jar集成方式、集群分布式方式和/或分布式方式。
本发明的有益效果为:
一种基于URI规则配置集成统一处理文件的系统和方法,使用URI(统一资源标识符)规则配置,通过自定义Scheme来区分要处理文件源类型和方式标识,通过Scheme后的片段标识为辅助资源提供文件内容的处理方式,最终形成处理文件URI配置方式的统一,不同类型的文件读取与文件内容处理通过灵活修改配置即可。
通过生产者/消费者模式(生产者模式相当于数据的生产者,数据生产完成后触发数据消费),先将需处理文件内容信息和规则信息存放到缓冲区,再通过消费者读取缓冲区的数据,根据配置灵活处理,达到内容读取和内容业务处理分离,同时可根据读取文件规模灵活选择缓冲区为队列或第三方订阅服务进行支撑。
可扩展性强,文件内容与业务处理耦合度低(文件内容处理后先放到缓冲区,业务处理是从缓冲区获取),复用度高,减少维护成本投入,节约文件数据处理时间,确保消费端只需关注关键业务。
本发明的基于URI规则配置集成统一处理文件的系统和基于URI规则配置集成统一处理文件方法,具有以下有益效果:
1)、基于URI规则自定义配置,解决不同文件集成处理。
2)、通过配置处理能自动适配,完成多种不同文件数据的业务处理。
3)、应用缓存区存储文件数据,采用生产者消费者模式降低文件处理与应用系统耦合度,能灵活支撑新缓存区支撑技术同时保证处理技术先进性和兼容性。
4)、自动适配接入,实现上可复用,从而降低接入成本。
附图说明
图1是现有技术中进行文件处理的原理示意图;
图2是现有技术中进行文件文件处理的流程示意图;
图3是本发明基于URI规则配置集成统一处理文件的系统原理示意图;
图4是本发明基于URI规则配置集成统一处理文件的方法的流程示意图;
图5是本发明基于URI规则配置集成统一处理文件的方法中的URI常用形式示意图;
图6是本发明基于URI规则配置集成统一处理文件的方法中的生产者与消费者示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本申请的一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
如图1所示,为解决现有技术中普遍存在的问题,本发明提供一种基于URI规则配置集成统一处理文件的系统和方法,整体策划方案为:
1:使用URI(统一资源标识符)配置规则,通过自定义Scheme来区分要处理文件源类型和方式标识,通过Scheme后的片段标识为辅助资源提供文件内容的处理方式,最终形成处理文件URI配置方式的统一。
2:通过文件处理适配模块将需处理文件按URI配置的信息进行读取,并将文件信息的名称、路径、对应配置等,及文件内容存放到处理缓冲区,缓冲区可是JVM队列,第三方订阅服务,来达到处理数据和处理进行分离,业务系统只关注自身对业务对象和现实。
3:通过文件内容处理消费适配,获取到处理消息的实例,调用实例按需进行批处理。
4:提供常用数据校验框架和数据校验处理,供业务侧选择性调用。
本发明首先提供一种基于URI规则配置集成统一处理文件的系统,由控制器、处理触发器、配置管理模块、URI规则处理器、数据缓冲区和业务处理控制器组成;
控制器用于传入发起文件处理的节点配置名,可以同时传入一个和/或多个节点配置名,节点配置名是一类的唯一标识,具体传入数量取决于调用者按需控制;
处理触发器用于初始化URI配置规则,并获取每个处理节点对应的URI配置集合;传入一个节点配置时就是单个,传入多个时,经过初始化,唯一节点配置名有对应配置集;
配置管理模块用于根据配置目录遍历文件信息,并为文件对象适配URI规则处理器;
URI规则处理器用于将文件处理配置及文件指内容存放到缓冲区;
数据缓冲区用于存储配置数据,并供数据缓存区消费者选择使用;
业务处理控制器用于接收缓存区消费者在数据缓冲区获取的缓存区数据和URI配置,为考虑业务处理可能需要配置相关信息。
CRM和BOSS是本发明中实施过程中的系统或平台的缩写,其中CRM(CustomerRelationship Management)是客户关系管理平台,BOSS(Business Operation SupportSystem)是业务运营支撑系统;scheme 叫“方案名”或者“协议名”,在本发明中指的是URI格式中”:“//前的部分,具体如图5所示。
进一步地,处理触发器还用于根据文件名匹配相应的文件处理配置;
处理触发器还用于拉起异步数据缓冲区异步消费者。
本发明还涉及一种使用上述基于URI配置规则集成统一处理文件的系统的基于URI规则配置集成统一处理文件的方法,按照以下步骤顺序操作:
S01,启动控制器,传入发起文件处理的节点配置名;
节点配置名为待处理的一个文件夹目录下所有文件的唯一标识位,根据该文件夹下的具体文件的业务处理需求,在该节点下配置与该业务对应的URI规则处理器。
S02,调用处理触发器,处理触发器初始化URI配置规则,开始处理文件对象;
文件对象可以理解为存储在某个目录下的文件对象。每一类节点配置下都会有一个属性fileAbsolutePath(文件绝对路径),文件绝对路径下存放的是需要处理的文件夹,或文件,统称为文件对象。(节点配置名为处理一类根据URI配置规则处理文件的唯一标识位)。
URI规则配置中包括yaml格式配置,yaml格式配置根据配置关系设计成表格结构存放到关系型数据库中。
本发明中的配置用于统一定义文件读取与文件内容处理的方式,yaml是配置的其中一种表现形式;也即本发明用于写配置文件的序列化语言是yaml,可以看作一个标记语言,类似于json。yaml语法类似于其它高级语言,适合用来表达或编辑数据结构、各种配置文件、文件大纲等。本申请当前是通过yaml方式完成文件配置;yaml格式配置如下(yaml为配置的描述形式之一,使用者需按该格式进行描述配置,该节点配置也可以根据配置关系设计成表格形式存放到关系型数据库中):
file.read:
  readDirectoryRules:
    # ruleNode为配置节点,用于标识应用与不同系统间文件交互的标识
    - ruleNode: A
      # fileAbsolutePath为本地要处理文件绝对路径
      fileAbsolutePath: '/iic-ftp/iic/download2/100'
      # fileHandleMode为文件处理模式,有遍历处理和异步处理
fileHandleMode: ONE_BY_ONE
# bufferType为缓存类型,包括queue、redis、es、kafka、es、关系型数据库等
  bufferType:queue
      # readFileRules为文件读取规则(按实际需要配置该节点子集集合)
      readFileRules:
        # matchFileName为同一类型文件名的正则配置
        - matchFileName: M_F10001_[0-9]{6}_[0-9]{2}.txt
        # fileReadUri为URI规则配置,line://为自定义Scheme来区分要处理文件源类型和方式标识,Scheme后的片段标识为辅助资源提供文件内容的处理方式,其中handleBean为固定参数(必配)。
heanBean具体有几处取决于有多少种文件类型需要通过要发明的统一配置的方式进行读取和处理。本发明中表达文件类型的配置见S02部分,其中matchFileName和fileReadUri结合起来表示需处理文件的一种类型。本发明中更多的是说明了一组配置的方式和意义,实际使用时配置可为多组,其中配置行中有”-“符号的标识,表示该配置名同级的配置可根据实际需要配置多组。
本发明以行文件作为配置进行说明,其中line代表行文件,handleBean为应用处理文件内容bean名,splitSign为行文件分隔符号(选配),默认为不对文件内容行进行分隔,如该配置存在则会按配置规则进行分隔,splitNum为行文件分隔数(选配),当splitSign配置后splitNum必配;newLineSign为换行标识(选配),默认支撑\r、\n、\r\n三种换行符,batchSize为自定义批处理数据条数(选配),默认500。
fileReadUri: 'line://handleBean=EfficiencyAssessProcessHandlersplitSign=€€$&splitNum=6&newLineSign=\r&batchSize=600'
上述fileReadUri配置的值为本申请的URI自定义规则。
S03,处理触发器根据节点配置名,调用配置管理模块获取处理节点配置名对应的URI配置规则集合信息;
S04,处理触发器根据获取到的URI配置中的文件对象目录,遍历相关文件对象;
S05,处理触发器根据遍历文件名正则的配置获取当前文件的URI配置规则;
S06,处理触发器根据URI配置中的URI自定义规则进行Scheme匹配,从而适配URI规则处理器;
URI自定义规则的形式如下:
规则处理器://处理器名称规则处理器对应处理内容配置。
URI自定义规则的种类有如下几种:
1、按行方式读取并进行分隔;
其中单行数据6个属性间的分隔符€€(splitSign=€€$&splitNum=6),行的换行为\r(newLineSign=\r,默认为\r、\r\n、\n),单次批量处理600条数据(默认为500),起始行为10(startNum=10,默认从起始行开始),结束行为1000(endNum=1000,默认读完整个文件)为行文件并将行数据按照一定规则进行分隔,处理器实例为EfficiencyAssessProcessHandler
line://handleBean=EfficiencyAssessProcessHandlersplitSign=€€$&splitNum=6&newLineSign=\r&batchSize=600&startNum=10&endNum=1000
2、按行方式读取不进行分隔;
行的换行为\r(newLineSign=\r,默认为\r、\r\n、\n),单次批量处理600条数据(默认为500),起始行为10(startNum=10,默认从起始行开始),结束行为1000(endNum=1000,默认读完整个文件)为行文件并将行数据按照一定规则(具体规则指的是文件的内容是按何字符进行分隔组成的数据,对文件读取的起始行是第10行,结束行为1000,单次处理数据600条或600行)进行分隔,处理器实例为LineAssessProcessHandler
line://handleBean=LineAssessProcessHandlernewLineSign=\r&batchSize=600&startNum=10&endNum=1000
3、自定义规则器还包括:
按行方式读取csv文件;
读取Excel文件,Excel文件包括xls和xlxs。
读取内容为XML格式的文件;
读取内容为JSON格式的文件
excel://等;
excel://为自定义URI自定义规则的一种形式,具体配置excel://handleBean=xlsHandler&startNum=2;自定义规则器的种类可按实际需要进行增加,遵循URI规则即可。
S07,URI规则处理器根据URI自定义规则进Scheme后的辅助配置对文件按URI配置规则进行读取处理;
S08,将文件数据存放到数据缓冲区中;
S09,文件内容根据URI配置规则处理完成;
S10,处理触发器拉起异步数据缓冲区异步消费者;
S11,开始消费缓冲区数据;
(该场景是在bufferType配置为queue和Ehcache时,URI规则配置统一处理提供jar的方式供应用系统引入使用,为了避免集群或分布式系统出现数据处理异常。bufferType配置不是queue和Ehcache时,URI规则配置统一处理与应用系统支撑以jar形式引用使用,也可选择为独立部署的方式运行)
S12,数据缓冲区消费者获取缓冲区数据和URI配置,准备消费文件数据;
S13,数据缓存去消费者通过工具配置将数据写入到业务处理控制器,由业务控制器处理数据相关具体业务。
最后,数据缓冲区使用Ehcache、queue缓存技术时,URI规则配置文件统一处理与应用系统采用jar集成方式;使用Redis、ES、Kafka时采用jar集成方式、集群分布式方式和/或分布式方式。
本发明基于URI规则配置集成统一处理文件的系统和方法,关键技术点在于:
1、使用URI(统一资源标识符)规则配置,通过自定义Scheme来区分要处理文件源类型和方式标识,通过Scheme后的片段标识为辅助资源提供文件内容的处理方式,最终形成处理文件URI配置方式的统一,不同类型的文件读取与文件内容处理通过灵活修改配置即可。
“Scheme后的片段标识”指的是URI统一资源标识符://后的内容,具体为上述操作步骤S02中的fileReadUri配置(即URI规则配置)说明中的值:
“line://handleBean=EfficiencyAssessProcessHandlersplitSign=€€$&splitNum=6&newLineSign=\r&batchSize=600”;
其中“handleBean=EfficiencyAssessProcessHandlersplitSign=€€$&splitNum=6&newLineSign=\r&batchSize=600”即为Scheme后的片段标识。
如:line://handleBean=EfficiencyAssessProcessHandler&splitSign=€€$&splitNum=6&newLineSign=\r&batchSize=600
其中line:为自定义Scheme,Scheme后的片段标识是Scheme对应的辅助资源为提供文件内容的处理方式
2、通过生产者/消费者模式(生产者模式相当于数据的生产者,数据生产完成后触发数据消费),先将需处理文件内容信息和规则信息存放到缓冲区,再通过消费者读取缓冲区的数据,根据配置灵活处理,达到内容读取和内容业务处理分离,同时可根据读取文件规模灵活选择缓冲区为队列或第三方订阅服务进行支撑。
本发明的基于URI规则配置集成统一处理文件的系统和基于URI规则配置集成统一处理文件方法,具有以下优点:
1)、基于URI规则自定义配置,解决不同文件集成处理。
2)、通过配置处理能自动适配,完成多种不同文件数据的业务处理。
3)、应用缓存区存储文件数据,采用生产者消费者模式降低文件处理与应用系统耦合度,能灵活支撑新缓存区支撑技术同时保证处理技术先进性和兼容性。
4)、自动适配接入,实现上可复用,从而降低接入成本。
本发明不局限于上述可选实施方式,任何人在本发明的启示下都可得出其他各种形式的产品,但不论在其形状或结构上作任何变化,凡是落入本发明权利要求界定范围内的技术方案,均落在本发明的保护范围之内。

Claims (9)

1.一种基于URI规则配置集成统一处理文件的方法,其特征在于:使用基于URI规则配置集成统一处理文件的系统,包括有控制器、处理触发器、配置管理模块、URI规则处理器、数据缓冲区和业务处理控制器;
所述控制器用于传入发起文件处理的节点配置名;
所述处理触发器用于初始化URI配置规则,并获取每个处理节点配置名对应的URI配置集合;
所述配置管理模块用于根据配置目录遍历文件信息,并为文件对象适配URI规则处理器;
所述URI规则处理器用于将文件处理配置及文件指内容存放到缓冲区;
所述数据缓冲区用于存储配置数据,并供数据缓存区消费者选择使用;
所述业务处理控制器用于接收缓存区消费者在数据缓冲区获取的缓存区数据和URI配置;
包括有以下步骤:
S01,启动控制器,传入发起文件处理的节点配置名;
S02,调用处理触发器,处理触发器初始化URI配置规则,开始处理文件对象;
S03,处理触发器根据节点配置名,调用配置管理模块获取处理节点配置名对应的URI配置规则集合信息;
S04,处理触发器根据获取到的配置中的文件对象目录,遍历相关文件对象;
S05,处理触发器根据遍历文件名正则的配置获取当前文件的URI配置规则;
S06,处理触发器根据URI配置规则中的URI自定义规则进行Scheme匹配,从而适配URI规则处理器;
S07,URI规则处理器根据Scheme后的辅助配置对文件按配置进行读取处理;
S08,将文件数据存放到数据缓冲区中;
S09,文件内容根据URI配置规则处理完成;
S10,处理触发器拉起异步数据缓冲区异步消费者;
S11,开始消费缓冲区数据;
S12,数据缓冲区消费者获取缓冲区数据和配置,准备消费文件数据;
S13,数据缓存区消费者通过工具配置将数据写入到业务处理控制器,由业务控制器处理数据相关具体业务。
2.根据权利要求1所述基于URI规则配置集成统一处理文件的方法,其特征在于:所述处理触发器还用于根据文件名匹配相应的文件处理配置。
3.根据权利要求1所述基于URI规则配置集成统一处理文件的方法,其特征在于:所述处理触发器还用于拉起异步数据缓冲区异步消费者。
4.根据权利要求1所述基于URI规则配置集成统一处理文件的方法,其特征在于:所述步骤S01中包括以下内容:
所述节点配置名为待处理的一个文件夹目录下所有文件的唯一标识位,根据该文件夹下的具体文件的业务处理需求,在该节点下配置与该业务对应的URI规则处理器。
5.根据权利要求1所述基于URI规则配置集成统一处理文件的方法,其特征在于:所述步骤S02中包括以下内容:
所述URI规则配置中包括yaml格式配置,yaml格式配置根据配置关系设计成表格结构存放到关系型数据库中。
6.根据权利要求1所述基于URI规则配置集成统一处理文件的方法,其特征在于:所述URI自定义规则的形式为:
规则处理器://处理器名称规则处理器对应处理内容配置。
7.根据权利要求1所述基于URI规则配置集成统一处理文件的方法,其特征在于:所述URI自定义规则的种类为:
按行方式读取并进行分隔;
按行方式读取不进行分隔;
按行方式读取csv文件;
读取Excel文件,Excel文件包括xls和xlxs;
读取内容为XML格式的文件;
读取内容为JSON格式的文件。
8.根据权利要求7所述基于URI规则配置集成统一处理文件的方法,其特征在于:所述按行方式读取并进行分隔和按行方式读取不进行分隔中,单次读取分别处理600条数据,起始行为10,结束行为1000,为行文件并将行数据按照一定规则进行分隔。
9.根据权利要求1所述基于URI规则配置集成统一处理文件的方法,其特征在于:所述数据缓冲区使用Ehcache、queue缓存技术时,URI规则配置文件统一处理与应用系统采用jar集成方式;使用Redis、ES、Kafka时采用jar集成方式、集群分布式方式和/或分布式方式。
CN202211487044.2A 2022-11-25 2022-11-25 一种基于uri规则配置集成统一处理文件的系统和方法 Active CN115543940B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211487044.2A CN115543940B (zh) 2022-11-25 2022-11-25 一种基于uri规则配置集成统一处理文件的系统和方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211487044.2A CN115543940B (zh) 2022-11-25 2022-11-25 一种基于uri规则配置集成统一处理文件的系统和方法

Publications (2)

Publication Number Publication Date
CN115543940A CN115543940A (zh) 2022-12-30
CN115543940B true CN115543940B (zh) 2023-04-28

Family

ID=84720379

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211487044.2A Active CN115543940B (zh) 2022-11-25 2022-11-25 一种基于uri规则配置集成统一处理文件的系统和方法

Country Status (1)

Country Link
CN (1) CN115543940B (zh)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101361063A (zh) * 2006-04-12 2009-02-04 龙搜(北京)科技有限公司 支持基于规则的文档内容挖掘的系统与方法
CN107908632A (zh) * 2017-07-26 2018-04-13 上海壹账通金融科技有限公司 网站文件处理方法、装置、网站文件处理平台及存储介质

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101552976B (zh) * 2009-04-29 2012-06-06 中兴通讯股份有限公司 多业务格式文件处理系统及方法
US10019468B1 (en) * 2012-02-29 2018-07-10 Nationwide Mutual Insurance Company System and method for data integration
CN105718601B (zh) * 2016-03-09 2019-04-30 浪潮天元通信信息系统有限公司 一种业务动态集成模型及其应用方法
CN107948314B (zh) * 2017-12-21 2021-07-06 泰康保险集团股份有限公司 基于规则文件的业务处理方法、装置及服务器
CN110569090A (zh) * 2018-06-05 2019-12-13 中移(苏州)软件技术有限公司 一种数据处理方法、装置、电子设备及存储介质
CN110633079B (zh) * 2019-08-30 2023-06-16 微梦创科网络科技(中国)有限公司 一种基于yaml语言的业务开发方法及系统
CN113553295A (zh) * 2021-07-22 2021-10-26 昆明学院 一种支持多种文件格式的数据预处理系统
CN114595199B (zh) * 2022-05-10 2022-09-02 太平金融科技服务(上海)有限公司 文件解析方法、装置、计算机设备和存储介质

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101361063A (zh) * 2006-04-12 2009-02-04 龙搜(北京)科技有限公司 支持基于规则的文档内容挖掘的系统与方法
CN107908632A (zh) * 2017-07-26 2018-04-13 上海壹账通金融科技有限公司 网站文件处理方法、装置、网站文件处理平台及存储介质

Also Published As

Publication number Publication date
CN115543940A (zh) 2022-12-30

Similar Documents

Publication Publication Date Title
CN107370786B (zh) 一种基于微服务架构的通用信息管理系统
CN102185900B (zh) 一种应用服务平台系统和一种开发应用服务的方法
CN106250543B (zh) 一种自动化数据查询同步存储方法
US20160110190A1 (en) Web Client Command Infrastructure Integration into a Rich Client Application
CN106951430A (zh) 账表查询方法及装置
CN104133772A (zh) 一种自动生成测试数据的方法
CN109669976B (zh) 基于etl的数据服务方法及设备
CN103365945A (zh) 脚本管理方法、执行它的服务器和存储它的记录介质
US20140082033A1 (en) Methods and systems for managing files in an on-demand system
CN111324619B (zh) 微服务系统中的对象更新方法、装置、设备和存储介质
CN114327678A (zh) 一种支持多引擎的实时数据处理系统及方法
CN102891768A (zh) 网络管理的方法和网元
CN106294741A (zh) 一种自动化数据查询同步存储系统
CN112199373A (zh) 一种表单开发方法和系统
CN115480753A (zh) 应用集成系统及相应计算机设备和存储介质
US9171003B2 (en) Shared media crawler database method and system
US20120303642A1 (en) Automated file-conversion system and process for a media-generation system
CN115543940B (zh) 一种基于uri规则配置集成统一处理文件的系统和方法
CN109873720A (zh) 一种基于企业公众号的云中心智能运维方法及系统
CN117171108A (zh) 一种虚拟模型映射方法和系统
CN110764769B (zh) 处理用户请求的方法和装置
WO2023093079A1 (zh) 一种分布式边缘云边节点的一致性核查方法及装置
US20060190476A1 (en) Database storage system and associated method
CN202077062U (zh) 一种应用服务平台系统
CN112330202B (zh) 一种基于编排控制流程业务开通的控制意图工单处理方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant