CN110008266A - 数据交换文件解析方法和装置 - Google Patents
数据交换文件解析方法和装置 Download PDFInfo
- Publication number
- CN110008266A CN110008266A CN201910189519.1A CN201910189519A CN110008266A CN 110008266 A CN110008266 A CN 110008266A CN 201910189519 A CN201910189519 A CN 201910189519A CN 110008266 A CN110008266 A CN 110008266A
- Authority
- CN
- China
- Prior art keywords
- resolved
- protocol
- data
- protocol fields
- processed
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Abstract
本申请涉及一种涉及人工智能技术领域的数据交换文件解析方法、装置、计算机设备和存储介质。该方法包括:获取待解析数据交换文件;待解析数据交换文件包含多项待解析协议数据,每项待解析协议数据携带数据类型标识;查找与数据类型标识对应的解析规则集合;对每项待解析协议数据按照对应的解析规则集合进行解析,得到多个分离的解析后协议字段;拼接每项待解析协议数据对应的多个分离的解析后协议字段,得到相应的目标字符串。采用本方法能够高效解析数据交换文件。
Description
技术领域
本申请涉及计算机技术领域,特别是涉及一种数据交换文件解析方法、装置、计算机设备和存储介质。
背景技术
数据交换协议通常包含业务系统之间进行数据交换时所采用的数据格式、数据定义和数据内容。数据交换协议可以是开放协议,用于多个机构企业基于该开放协议进行数据交换。不同业务系统运行时可有各自个性化的数据标准,但是两个业务系统需要按照数据交换协议定义的数据标准生成数据交换文件进行数据交换。业务系统的服务器在收到数据交换文件之后,通常需要对数据交换文件进行解析,以得到该业务系统所能识别处理的协议字段。然而传统方式中通常是需要基于人工经验确定协议字段在数据交换文件的位置,具有较强的不稳定性,难以准确地获取所需的协议字段,数据交换文件解析的效率较低。
发明内容
基于此,有必要针对上述技术问题,提供一种能够高效解析数据交换文件的数据交换文件解析方法、装置、计算机设备和存储介质。
一种数据交换文件解析方法,所述方法包括:获取待解析数据交换文件;所述待解析数据交换文件包含多项待解析协议数据,每项所述待解析协议数据携带数据类型标识;查找与所述数据类型标识对应的解析规则集合;对每项待解析协议数据按照对应的解析规则集合进行解析,得到多个分离的解析后协议字段;拼接每项待解析协议数据对应的多个分离的解析后协议字段,得到相应的目标字符串。
在其中一个实施例中,所述解析规则集合包含截取规则和反向转换规则,所述对每项待解析协议数据按照对应的解析规则集合进行解析,得到多个分离的解析后协议字段,包括:对每项待解析协议数据按照对应的截取规则进行截取处理,得到多个分离的待解析协议字段;对每个分离的待解析协议字段按照对应的反向转换规则进行格式化处理,得到与每个分离的待解析协议字段相应的解析后协议字段。
在其中一个实施例中,所述对每项待解析协议数据按照对应的截取规则进行截取处理,得到多个分离的待解析协议字段,包括:按照截取规则中对应于每个待解析协议字段的预设字段长度,从每项待解析协议数据中逐一初步截取分离的待解析协议字段;检测待解析协议字段的实际字段长度;当待解析协议字段的实际字段长度小于对应的预设字段长度时,则对初步截取得到的待解析协议字段进行去空格处理,得到实际字段长度的待解析协议字段。
在其中一个实施例中,所述对每个分离的待解析协议字段按照对应的反向转换规则进行格式化处理,得到与每个分离的待解析协议字段相应的解析后协议字段,包括:获取针对每个分离的待解析协议字段的反向转换规则;所述反向转换规则包括反向转换条件及反向转换策略;基于所述反向转换规则,识别相应待解析协议字段的协议字段属性;按照每个分离的待解析协议字段的协议字段属性匹配的反向转换条件,确定对应的反向转换策略;根据确定的反向转换策略对对应的待解析协议字段进行格式化处理,得到与每个分离的待解析协议字段相应的解析后协议字段。
一种数据交换文件生成方法,所述方法包括:获取待处理字符串;所述待处理字符串包含多个待处理协议字段,所述待处理字符串携带数据类型标识;查找与所述数据类型标识对应的生成规则集合;对所述多个待处理协议字段按照对应的所述生成规则集合进行转换,得到多个分离的目标协议字段;拼接多个分离的目标协议字段,得到相应的目标协议数据;根据多个待处理字符串经转换拼接处理得到的目标协议数据,生成目标数据交换文件。
在其中一个实施例中,所述对所述多个待处理协议字段按照对应的所述生成规则集合进行转换,得到多个分离的目标协议字段,包括:获取针对每个分离的待处理协议字段的正向转换规则;所述正向转换规则包括正向转换条件及正向转换策略;基于正向转换规则,识别相应待处理协议字段的协议字段属性;按照每个分离的待处理协议字段的协议字段属性匹配的正向转换条件,确定对应的正向转换策略;根据确定的正向转换策略对对应的待处理协议字段进行格式化处理,得到与每个分离的待处理协议字段相应的目标协议字段。
一种数据交换文件解析装置,所述装置包括:获取模块,用于获取待解析数据交换文件;所述待解析数据交换文件包含多项待解析协议数据,每项所述待解析协议数据携带数据类型标识;查找模块,用于查找与所述数据类型标识对应的解析规则集合;解析模块,用于对每项待解析协议数据按照对应的解析规则集合进行解析,得到多个分离的解析后协议字段;拼接模块,用于拼接每项待解析协议数据对应的多个分离的解析后协议字段,得到相应的目标字符串。
一种数据交换文件生成装置,所述装置包括:获取模块,用于获取待处理字符串;所述待处理字符串包含多个待处理协议字段,所述待处理字符串携带数据类型标识;查找模块,用于查找与所述数据类型标识对应的生成规则集合;转换模块,用于对所述多个待处理协议字段按照对应的所述生成规则集合进行转换,得到多个分离的目标协议字段;拼接模块,用于拼接多个分离的目标协议字段,得到相应的目标协议数据;生成模块,用于根据多个待处理字符串经转换拼接处理得到的目标协议数据,生成目标数据交换文件。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述各个实施例中所述的数据交换文件解析方法或数据交换文件生成方法的步骤。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述各个实施例中所述的数据交换文件解析方法或数据交换文件生成方法的步骤。
上述数据交换文件解析方法、装置、计算机设备和存储介质,当第一服务器获取到待解析数据交换文件时,第一服务器可根据待解析数据交换文件携带的数据类型标识,查找对应的解析规则集合。第一服务器可对每项待解析协议数据按照对应的解析规则集合进行解析,得到多个分离的解析后协议字段,然后通过拼接每项待解析协议数据对应的多个分离的解析后协议字段,得到与每项待解析协议数据相应的目标字符串。通过预先针对每种数据类型预设的解析规则集合,对相应数据类型的待解析数据交换文件中的待解析协议数据进行解析,得到分离的解析后协议字段,从而自动化生成目标字符串,能够实现数据交换文件的高效解析。
附图说明
图1为一个实施例中数据交换文件解析方法的应用场景图;
图2为一个实施例中数据交换文件解析的流程示意图;
图3为一个实施例中数据交换文件生成方法的流程示意图;
图4为一个实施例中数据交换文件解析装置的结构框图;
图5为一个实施例中数据交换文件生成装置的结构框图;
图6为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
可以理解,本发明所使用的术语“第一”、“第二”等可在本文中用于描述各种元件,但这些元件不受这些术语的限制。这些术语仅用于将第一个元件与另一个元件区分。举例来说,在不脱离本发明的范围的情况下,可以将第一预设字段长度称为第二预设字段长度,且类似地,可将第二预设字段长度称为第一预设字段长度。第一预设字段长度和第二预设字段长度两者都是预设字段长度,但其不是同一预设字段长度。
本申请提供的数据交换文件方法,可以应用于如图1所示的应用环境中。其中,第一服务器102与第二服务器104通过网络进行通信。第一服务器102和第二服务器104可以是遵循同一数据交换协议的两个业务系统分别对应的服务器。其中,第一服务器102和第二服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。当第一服务器102接收到第二服务器104发送的待解析数据交换文件时,第一服务器102可根据待解析数据交换文件携带的数据类型标识,查找对应的解析规则集合。第一服务器102可对每项待解析协议数据按照对应的解析规则集合进行解析,得到多个分离的解析后协议字段,然后通过拼接每项待解析协议数据对应的多个分离的解析后协议字段,得到与每项待解析协议数据相应的目标字符串。
在一个实施例中,如图2所示,提供了一种数据交换文件解析方法,以该方法应用于图1中的第一服务器102为例进行说明,包括以下步骤:
步骤202,获取待解析数据交换文件;待解析数据交换文件包含多项待解析协议数据,每项待解析协议数据携带数据类型标识。
待解析数据交换文件可为第一服务器接收到的第二服务器发送的数据交换文件。待解析数据交换文件还可为按照数据交换协议所规定的数据标准,预先生成的用于对第一服务器进行解析测试的测试文件。第一服务器需要对待解析数据交换文件进行解析之后,才能对数据交换文件中的数据进行识别及进一步的处理使用。数据交换文件是按照数据交换协议规定的数据格式、数据定义和数据内容等数据标准生成的文件。
数据交换协议可以是开放协议,比如由中国证券监督管理委员会发布的开放式基金业务数据交换协议,开放式基金业务数据交换协议适用于基金、集合资产管理计划业务中机构之间进行数据交换。数据交换协议也可以为封闭式协议,比如可为仅对第一服务器对应的第一业务系统与第二服务器对应的第二业务系统,两者之间的数据交换预先协定的数据交换协议。
待解析数据交换文件可有多种数据类型,且待解析数据交换文件中可包含多项待解析协议数据。数据类型标识是指用于区分不同数据类型对应的数据交换文件的标识。数据交换类型的数据类型包括但不限于账户申请数据类型、账户确认数据类型、交易申请数据类型等。当待解析数据交换文件为用于进行账户申请业务的数据交换文件时,待解析数据交换文件中可包含来自多个用户的账户申请数据,则每个用户对应的账户申请数据可作为一项待解析协议数据。每项待解析协议数据中可包含按照数据交换协议标准组合的协议字段。比如针对账户申请数据,可包含通讯地址、法人代表姓名、法人代证件号码及交易发生时间等其中一种或多种协议字段的组合。
步骤204,查找与数据类型标识对应的解析规则集合。
针对携带不同的数据类型标识的待解析数据交换文件可预设有对应的解析规则集合。解析规则集合可包括以Excel公式定义的解析规则,也可包括基于规则引擎定义的解析规则,但不限于此。解析规则是指用于将具有基于数据交换协议定义的数据标准的待解析协议数据,解析为具有第一服务器本身数据标准的协议数据的规则。
步骤206,对每项待解析协议数据按照对应的解析规则集合进行解析,得到多个分离的解析后协议字段。
待解析协议数据为可为待解析数据交换文件中的一行字符串。待解析协议数据中可包含多个具有预设顺序拼接组成的待解析协议字段。通过解析规则对待解析协议数据进行解析,可得到多个分离的解析后协议字段。分离的解析后协议字段是指从待解析协议数据中切割出来、独立存在的解析后协议字段。解析后协议字段是指符合第一服务器本身数据标准的协议字段。
步骤208,拼接每项待解析协议数据对应的多个分离的解析后协议字段,得到相应的目标字符串。
拼接多个分离的解析后协议字段便可获得与待解析协议数据相应的目标字符串。目标字符串是待解析数据交换文件中的核心组成部分,通过将待解析数据交换文件解析为多个目标字符串,可使得第一服务器能够基于目标字符串进行识别及进一步的处理使用。
上述数据交换文件解析方法中,当第一服务器获取到待解析数据交换文件时,第一服务器可根据待解析数据交换文件携带的数据类型标识,查找对应的解析规则集合。第一服务器可对每项待解析协议数据按照对应的解析规则集合进行解析,得到多个分离的解析后协议字段,然后通过拼接每项待解析协议数据对应的多个分离的解析后协议字段,得到与每项待解析协议数据相应的目标字符串。通过预先针对每种数据类型预设的解析规则集合,对相应数据类型的待解析数据交换文件中的待解析协议数据进行解析,得到分离的解析后协议字段,从而自动化生成目标字符串,能够实现数据交换文件的高效解析。
在一个实施例中,解析规则集合包含截取规则和反向转换规则,对每项待解析协议数据按照对应的解析规则集合进行解析,得到多个分离的解析后协议字段,包括:对每项待解析协议数据按照对应的截取规则进行截取处理,得到多个分离的待解析协议字段;对每个分离的待解析协议字段按照对应的反向转换规则进行格式化处理,得到与每个分离的待解析协议字段相应的解析后协议字段。
截取规则是将待解析协议数据中的每个待解析协议字段截取出来的规则。反向转换规则是指将截取出来的分离的待解析协议字段从原数据交换协议规定数据标准的格式,转换为第一服务器本身数据标准的格式的规则。
在一个实施例中,对每项待解析协议数据按照对应的截取规则进行截取处理,得到多个分离的待解析协议字段,包括:按照截取规则中对应于每个待解析协议字段的预设字段长度,从每项待解析协议数据中逐一初步截取分离的待解析协议字段;检测待解析协议字段的实际字段长度;当待解析协议字段的实际字段长度小于对应的预设字段长度时,则对初步截取得到的待解析协议字段进行去空格处理,得到实际字段长度的待解析协议字段。
待解析协议数据由多个具有预设字段长度待解析协议字段按照预设的字段顺序拼接形成。然而待解析协议数据的实际字段长度长度可小于预设字段长度。待解析协议字段中除了实际占位字符还可包括空格。实际字段长度是指待解析协议字段中实际占位字符的长度。按照每个待解析协议字段的预设字段长度逐一截取到分离的待解析协议字段之后,还可对实际字段长度小于对应的预设字段长度的待解析协议字段进行去空格处理。去空格处理包括但不限于去字头空格和去字尾空格中的其中一种或多种。
举例来说,可通过Excel公式“=MIDB($B92,1,D2)”对从待解析协议数据中初步截取分离的第一待解析协议字段。“=MIDB($B92,1,D2)”表示截取$B92对应的待解析协议数据中从第一个字符到第D2个字符的具有第一预设字段长度的第一待解析协议字段。可通过Excel公式“=TRIM(MIDB($B92,1,D2))”对初步截取得到的第一待解析协议字段进行去空格处理。“=TRIM(MIDB($B92,1,D2))”表示去除第一预设字段长度的第一待解析协议字段的前后空格,得到实际字段长度的第一待解析协议字段。以此类推,可通过Excel公式“=MIDB($B92,SUM(D2)+1,D3)”对从待解析协议数据中初步截取分离的第二待解析协议字段。“=MIDB($B92,SUM(D2)+1,D3)”表示截取$B92对应的待解析协议数据中从第一预设字段长度之后的第一个字符到第D3个字符的、第二预设字段长度的第二待解析协议字段。可通过Excel公式“=TRIM(MIDB($B92,SUM(D2)+1,D3))”对初步截取得到的第二待解析协议字段进行去空格处理。“=TRIM(MIDB($B92,SUM(D2)+1,D3))”表示去除第二预设字段长度的第二待解析协议字段的前后空格得到实际字段长度的第二待解析协议字段。
在一个实施例中,对每个分离的待解析协议字段按照对应的反向转换规则进行格式化处理,得到与每个分离的待解析协议字段相应的解析后协议字段,包括:获取针对每个分离的待解析协议字段的反向转换规则;反向转换规则包括反向转换条件及反向转换策略;基于反向转换规则,识别相应待解析协议字段的协议字段属性;按照每个分离的待解析协议字段的协议字段属性匹配的反向转换条件,确定对应的反向转换策略;根据确定的反向转换策略对对应的待解析协议字段进行格式化处理,得到与每个分离的待解析协议字段相应的解析后协议字段。
待解析协议字段的协议字段属性包括但不限于实际字段长度、字段类型、小数位数以及特殊属性等。匹配的反向转换条件是指每个分离的待解析协议字段的至少一个协议字段属性符合的条件,针对匹配的反向转换条件预设有对应的反向转换策略。比如,可针对字符类型和数字类型的待解析协议字段,预设有不同的格式化处理方式。再比如,还可针对具有不同实际字段长度的数字类型的待解析协议字段,预设有不同的格式化处理方式。
举例来说,可通过Excel公式“=IF(AND(C2="N",ISNUMBER(F2)),VALUE(TRIM(MIDB($B92,1,D2)))/10^F2,TRIM(MIDB($B92,1,D2)))”对待解析协议字段进行格式化处理。该Excel公式表示当待解析协议字段是数字类型N时,则转换该待解析协议字段的值为数字并且除以10的小数位数次幂;当待解析协议字段是非数字类型时,则无需进行格式转换,直接根据待解析协议字段的预设字段长度截取并且去除首尾空格,得到的就是解析后协议字段。比如实际字段长度为3位,小数位数为1位,若原待解析协议字段为012,则格式化处理后相应的解析后协议字段为1.2。
在一个实施例中,得到解析后协议字段之后,可通过预设的校验规则集合对解析后协议字段统一进行数据校验。数据校验包括但不限于数据完整性校验、格式校验、合法性校验、奇偶校验等。数据校验的内容可取决于数据交换协议的规定或者第一服务器对应业务系统的需求。
在一个实施例中,如图3所示,提供了一种数据交换文件生成方法,以该方法应用于图1中的第一服务器102为例进行说明,包括以下步骤:
步骤302,获取待处理字符串;待处理字符串包含多个待处理协议字段,待处理字符串携带数据类型标识。
待处理字符串是指需要进行转换处理以生成数据交换文件的字符串。待处理字符串中包含按照第一服务器的数据标准组成的多个待处理协议字段。多个待处理协议字段可按照预设的字段顺序拼接形成待处理字符串。待处理字符串可为第一服务器对应的业务系统在实际运行中生成的字符串,也可以是随机生成的用于测试的字符串。通过根据待处理字符串生成数据交换文件,使得第一服务器能将该数据交换文件发送至第二服务器进行数据交换。
步骤304,查找与数据类型标识对应的生成规则集合。
针对携带不同的数据类型标识的待处理字符串可预设有对应的生成规则集合。生成规则集合可包括以Excel公式定义的生成规则,也可包括基于规则引擎定义的生成规则,但不限于此。生成规则是指用于将具有第一服务器本身数据标准的待处理字符串的规则,生成为具有基于数据交换协议定义的数据标准的数据交换文件。
步骤306,对多个待处理协议字段按照对应的生成规则集合进行转换,得到多个分离的目标协议字段。
可基于待处理协议字段的协议字段属性,对待处理协议字段进行个性化处理。待处理协议字段的协议字段属性包括但不限于预设字段长度、字段类型、小数位数以及特殊属性等。比如说,当待处理协议字段的实际字段长度不匹配预设字段长度时,需要对待处理协议字段长度进行补空格处理。补空格处理包括但不限于补字头空格和补字尾空格中的其中一种或多种。
在一个实施例中,得到目标协议字段之后,可通过预设的校验规则集合对目标协议字段统一进行数据校验。数据校验包括但不限于数据完整性校验、格式校验、合法性校验、奇偶校验等。数据校验的内容可取决于数据交换协议的规定或者第一服务器对应业务系统的需求。
步骤308,拼接多个分离的目标协议字段,得到相应的目标协议数据。
当将每个待处理协议字段都转换为相应的、符合数据交换协议规定的数据标准的目标协议字段之后,可将多个分离的目标协议字段按照预设的字段顺序进行拼接,得到目标协议数据。待处理字符串与目标协议数据具有一一对应关系。通过对多个待处理字符串进行转换,可得到相应的多个目标协议数据。
步骤310,根据多个待处理字符串经转换拼接处理得到的目标协议数据,生成目标数据交换文件。
可通过得到的多个目标协议数据生成目标数据交换文件。目标数据交换文件是指第一服务器可用于与第二服务器进行数据交换的数据交换文件。第一服务器可将目标数据交换文件发送至第二服务器,第二服务器可基于数据交换文件解析方法对目标数据交换文件进行解析,从而解析得到第二服务器所能识别和使用的数据。第一服务器也可根据得到的目标数据交换文件作为测试数据对第一服务器进行测试,使得第一服务器能在没有生产环境中数据交换文件的情况下,进行数据交换文件的解析测试。
上述数据交换文件生成中,第一服务器获取待处理字符串之后,可查找与待处理字符串携带的数据类型标识对应的生成规则集合。第一服务器可基于生成规则集合对待处理字符串中包含的多个待处理协议字段进行转换,得到多个分离的目标协议字段。拼接多个分离的目标协议字段,可得到相应的目标协议数据,根据多个待处理字符串经转换拼接处理得到的目标协议数据,可生成目标数据交换文件。数据交换文件解析方法和数据交换文件生成方法互为反过程。通过自动化模拟生成第二服务器发送至第一服务器的数据交换文件,能够基于模拟生成的数据交换文件高效对数据交换文件解析过程进行测试。
在一个实施例中,对多个待处理协议字段按照对应的生成规则集合进行转换,得到多个分离的目标协议字段,包括:获取针对每个分离的待处理协议字段的正向转换规则;正向转换规则包括正向转换条件及正向转换策略;基于正向转换规则,识别相应待处理协议字段的协议字段属性;按照每个分离的待处理协议字段的协议字段属性匹配的正向转换条件,确定对应的正向转换策略;根据确定的正向转换策略对对应的待处理协议字段进行格式化处理,得到与每个分离的待处理协议字段相应的目标协议字段。
正向转换规则是指将分离的待处理协议字段从第一服务器本身数据标准的格式,转换为原数据交换协议规定数据标准的格式的规则。待处理协议字段的协议字段属性包括但不限于实际字段长度、字段类型、小数位数以及特殊属性等。匹配的正向转换条件是指每个分离的待处理协议字段的至少一个协议字段属性符合的条件,针对匹配的正向转换条件预设有对应的正向转换策略。比如,可针对字符类型和数字类型的待处理协议字段,预设有不同的格式化处理方式。再比如,还可针对具有不同预设字段长度的数字类型的待处理协议字段,预设有不同的格式化处理方式。
举例来说,当待处理协议字段的类型为字符串类型,且待处理协议字段的实际字段长度小于相应的预设字段长度时,则在待处理协议字段右端补充相差长度的空格;否则,当待处理协议字段的类型还不为数字类型时,将待处理协议字段转换为预设字段长度的“#”构成的目标协议字段;当待测转换字段的类型为数字类型时,判断待处理协议字段是否为空;当待处理协议字段为空时,将待处理协议字段转换为预设字段长度的“0”构成的目标协议字段;当待处理协议字段为非空数字类型时,对待处理协议字段四舍五入到预设小数位数得到中间值字段,判断中间值字段乘以10的小数位数次幂的长度是否小于等于预设长度,若是则在中间值字段左侧补充相差长度的“0”,若否则直接将中间值字段乘以10的小数位数次幂作为目标协议字段输出。
应该理解的是,虽然图2和3的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图2和3中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
在一个实施例中,如图4所示,提供了一种数据交换文件解析装置400,包括:获取模块402,用于获取待解析数据交换文件;待解析数据交换文件包含多项待解析协议数据,每项待解析协议数据携带数据类型标识;查找模块404,用于查找与数据类型标识对应的解析规则集合;解析模块406,用于对每项待解析协议数据按照对应的解析规则集合进行解析,得到多个分离的解析后协议字段;拼接模块408,用于拼接每项待解析协议数据对应的多个分离的解析后协议字段,得到相应的目标字符串。
在一个实施例中,解析规则集合包含截取规则和反向转换规则,解析模块406还用于对每项待解析协议数据按照对应的截取规则进行截取处理,得到多个分离的待解析协议字段;对每个分离的待解析协议字段按照对应的反向转换规则进行格式化处理,得到与每个分离的待解析协议字段相应的解析后协议字段。
在一个实施例中,解析模块406还用于按照截取规则中对应于每个待解析协议字段的预设字段长度,从每项待解析协议数据中逐一初步截取分离的待解析协议字段;检测待解析协议字段的实际字段长度;当待解析协议字段的实际字段长度小于对应的预设字段长度时,则对初步截取得到的待解析协议字段进行去空格处理,得到实际字段长度的待解析协议字段。
在一个实施例中,解析模块406还用于获取针对每个分离的待解析协议字段的反向转换规则;反向转换规则包括反向转换条件及反向转换策略;基于反向转换规则,识别相应待解析协议字段的协议字段属性;按照每个分离的待解析协议字段的协议字段属性匹配的反向转换条件,确定对应的反向转换策略;根据确定的反向转换策略对对应的待解析协议字段进行格式化处理,得到与每个分离的待解析协议字段相应的解析后协议字段。
在一个实施例中,如图5所示,提供了一种数据交换文件生成装置500,包括:获取模块502,用于获取待处理字符串;待处理字符串包含多个待处理协议字段,待处理字符串携带数据类型标识;查找模块504,用于查找与数据类型标识对应的生成规则集合;转换模块506,用于对多个待处理协议字段按照对应的生成规则集合进行转换,得到多个分离的目标协议字段;拼接模块508,用于拼接多个分离的目标协议字段,得到相应的目标协议数据;生成模块510,用于根据多个待处理字符串经转换拼接处理得到的目标协议数据,生成目标数据交换文件。
在一个实施例中,转换模块506还用于获取针对每个分离的待处理协议字段的正向转换规则;正向转换规则包括正向转换条件及正向转换策略;基于正向转换规则,识别相应待处理协议字段的协议字段属性;按照每个分离的待处理协议字段的协议字段属性匹配的正向转换条件,确定对应的正向转换策略;根据确定的正向转换策略对对应的待处理协议字段进行格式化处理,得到与每个分离的待处理协议字段相应的目标协议字段。
关于数据交换文件解析或数据交换文件生成装置的具体限定可以参见上文中对于数据交换文件解析或数据交换文件生成方法的限定,在此不再赘述。上述数据交换文件解析或数据交换文件生成装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图6所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储解析规则集合或生成规则集合等数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种数据交换文件解析或数据交换文件生成方法。
本领域技术人员可以理解,图5中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,该存储器存储有计算机程序,该处理器执行计算机程序时实现上述各个实施例中的数据交换文件解析方法的步骤。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述各个实施例中的数据交换文件解析方法的步骤。
在一个实施例中,提供了另一种计算机设备,包括存储器和处理器,该存储器存储有计算机程序,该处理器执行计算机程序时实现上述各个实施例中的数据交换文件生成方法的步骤。
在一个实施例中,提供了另一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述各个实施例中的数据交换文件生成方法的步骤。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。
Claims (10)
1.一种数据交换文件解析方法,所述方法包括:
获取待解析数据交换文件;所述待解析数据交换文件包含多项待解析协议数据,每项所述待解析协议数据携带数据类型标识;
查找与所述数据类型标识对应的解析规则集合;
对每项待解析协议数据按照对应的解析规则集合进行解析,得到多个分离的解析后协议字段;
拼接每项待解析协议数据对应的多个分离的解析后协议字段,得到相应的目标字符串。
2.根据权利要求1所述的方法,其特征在于,所述解析规则集合包含截取规则和反向转换规则,所述对每项待解析协议数据按照对应的解析规则集合进行解析,得到多个分离的解析后协议字段,包括:
对每项待解析协议数据按照对应的截取规则进行截取处理,得到多个分离的待解析协议字段;
对每个分离的待解析协议字段按照对应的反向转换规则进行格式化处理,得到与每个分离的待解析协议字段相应的解析后协议字段。
3.根据权利要求2所述的方法,其特征在于,所述对每项待解析协议数据按照对应的截取规则进行截取处理,得到多个分离的待解析协议字段,包括:
按照截取规则中对应于每个待解析协议字段的预设字段长度,从每项待解析协议数据中逐一初步截取分离的待解析协议字段;
检测待解析协议字段的实际字段长度;
当待解析协议字段的实际字段长度小于对应的预设字段长度时,则对初步截取得到的待解析协议字段进行去空格处理,得到实际字段长度的待解析协议字段。
4.根据权利要求2所述的方法,其特征在于,所述对每个分离的待解析协议字段按照对应的反向转换规则进行格式化处理,得到与每个分离的待解析协议字段相应的解析后协议字段,包括:
获取针对每个分离的待解析协议字段的反向转换规则;所述反向转换规则包括反向转换条件及反向转换策略;
基于所述反向转换规则,识别相应待解析协议字段的协议字段属性;
按照每个分离的待解析协议字段的协议字段属性匹配的反向转换条件,确定对应的反向转换策略;
根据确定的反向转换策略对对应的待解析协议字段进行格式化处理,得到与每个分离的待解析协议字段相应的解析后协议字段。
5.一种数据交换文件生成方法,所述方法包括:
获取待处理字符串;所述待处理字符串包含多个待处理协议字段,所述待处理字符串携带数据类型标识;
查找与所述数据类型标识对应的生成规则集合;
对所述多个待处理协议字段按照对应的所述生成规则集合进行转换,得到多个分离的目标协议字段;
拼接多个分离的目标协议字段,得到相应的目标协议数据;
根据多个待处理字符串经转换拼接处理得到的目标协议数据,生成目标数据交换文件。
6.根据权利要求5所述的方法,其特征在于,所述对所述多个待处理协议字段按照对应的所述生成规则集合进行转换,得到多个分离的目标协议字段,包括:
获取针对每个分离的待处理协议字段的正向转换规则;所述正向转换规则包括正向转换条件及正向转换策略;
基于正向转换规则,识别相应待处理协议字段的协议字段属性;
按照每个分离的待处理协议字段的协议字段属性匹配的正向转换条件,确定对应的正向转换策略;
根据确定的正向转换策略对对应的待处理协议字段进行格式化处理,得到与每个分离的待处理协议字段相应的目标协议字段。
7.一种数据交换文件解析装置,其特征在于,所述装置包括:
获取模块,用于获取待解析数据交换文件;所述待解析数据交换文件包含多项待解析协议数据,每项所述待解析协议数据携带数据类型标识;
查找模块,用于查找与所述数据类型标识对应的解析规则集合;
解析模块,用于对每项待解析协议数据按照对应的解析规则集合进行解析,得到多个分离的解析后协议字段;
拼接模块,用于拼接每项待解析协议数据对应的多个分离的解析后协议字段,得到相应的目标字符串。
8.一种数据交换文件生成装置,其特征在于,所述装置包括:
获取模块,用于获取待处理字符串;所述待处理字符串包含多个待处理协议字段,所述待处理字符串携带数据类型标识;
查找模块,用于查找与所述数据类型标识对应的生成规则集合;
转换模块,用于对所述多个待处理协议字段按照对应的所述生成规则集合进行转换,得到多个分离的目标协议字段;
拼接模块,用于拼接多个分离的目标协议字段,得到相应的目标协议数据;
生成模块,用于根据多个待处理字符串经转换拼接处理得到的目标协议数据,生成目标数据交换文件。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至4中任一项所述方法的步骤;或者
所述处理器执行所述计算机程序时实现权利要求5至6中任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至4中任一项所述的方法的步骤;或者
所述计算机程序被处理器执行时实现权利要求5至6中任一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910189519.1A CN110008266A (zh) | 2019-03-13 | 2019-03-13 | 数据交换文件解析方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910189519.1A CN110008266A (zh) | 2019-03-13 | 2019-03-13 | 数据交换文件解析方法和装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110008266A true CN110008266A (zh) | 2019-07-12 |
Family
ID=67166978
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910189519.1A Pending CN110008266A (zh) | 2019-03-13 | 2019-03-13 | 数据交换文件解析方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110008266A (zh) |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110704381A (zh) * | 2019-09-06 | 2020-01-17 | 平安城市建设科技(深圳)有限公司 | 数据解析方法、装置及存储介质 |
CN111667679A (zh) * | 2020-06-03 | 2020-09-15 | 贵州电网有限责任公司 | 一种数据传输方法、装置、终端设备及存储介质 |
CN111796830A (zh) * | 2020-06-08 | 2020-10-20 | 成都数之联科技有限公司 | 一种协议解析处理方法、装置、设备及介质 |
CN111814449A (zh) * | 2020-07-10 | 2020-10-23 | 泰康保险集团股份有限公司 | 表单解析方法、装置、设备及存储介质 |
CN112037074A (zh) * | 2020-09-11 | 2020-12-04 | 中国银行股份有限公司 | 基于可视化的数据文件解析方法及装置 |
CN112631603A (zh) * | 2020-12-30 | 2021-04-09 | 文思海辉智科科技有限公司 | 字串解析方法、系统及电子设备 |
CN113190232A (zh) * | 2021-04-13 | 2021-07-30 | 浙江吉利控股集团有限公司 | 一种数据解析方法、装置及存储介质 |
CN113489686A (zh) * | 2021-06-16 | 2021-10-08 | 杭州深渡科技有限公司 | 一种基于knx协议的数据转换方法和系统 |
CN113923268A (zh) * | 2021-09-08 | 2022-01-11 | 山东信通电子股份有限公司 | 一种针对多版本通信规约的解析方法、设备及存储介质 |
CN114257663A (zh) * | 2021-11-30 | 2022-03-29 | 神彩科技股份有限公司 | 数据解析方法、装置、计算机设备、存储介质 |
CN110247855B (zh) * | 2019-07-26 | 2022-08-02 | 中国工商银行股份有限公司 | 数据交换方法、客户端及服务器 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101148475B1 (ko) * | 2010-12-01 | 2012-05-21 | 한국과학기술원 | 프로토콜 변환 전처리 방법 및 장치, 및 프로토콜 변환 장치 |
CN102682109A (zh) * | 2012-05-09 | 2012-09-19 | 北京彼速信息技术有限公司 | 一种专利信息解析方法和装置 |
CN106202323A (zh) * | 2016-06-30 | 2016-12-07 | 北京奇虎科技有限公司 | 一种日志的处理方法和装置 |
CN107679207A (zh) * | 2017-10-16 | 2018-02-09 | 北京锐安科技有限公司 | 一种接入数据预处理方法、装置、服务器和存储介质 |
CN108829884A (zh) * | 2018-06-27 | 2018-11-16 | 中国建设银行股份有限公司 | 数据映射方法及装置 |
-
2019
- 2019-03-13 CN CN201910189519.1A patent/CN110008266A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101148475B1 (ko) * | 2010-12-01 | 2012-05-21 | 한국과학기술원 | 프로토콜 변환 전처리 방법 및 장치, 및 프로토콜 변환 장치 |
CN102682109A (zh) * | 2012-05-09 | 2012-09-19 | 北京彼速信息技术有限公司 | 一种专利信息解析方法和装置 |
CN106202323A (zh) * | 2016-06-30 | 2016-12-07 | 北京奇虎科技有限公司 | 一种日志的处理方法和装置 |
CN107679207A (zh) * | 2017-10-16 | 2018-02-09 | 北京锐安科技有限公司 | 一种接入数据预处理方法、装置、服务器和存储介质 |
CN108829884A (zh) * | 2018-06-27 | 2018-11-16 | 中国建设银行股份有限公司 | 数据映射方法及装置 |
Cited By (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110247855B (zh) * | 2019-07-26 | 2022-08-02 | 中国工商银行股份有限公司 | 数据交换方法、客户端及服务器 |
CN110704381A (zh) * | 2019-09-06 | 2020-01-17 | 平安城市建设科技(深圳)有限公司 | 数据解析方法、装置及存储介质 |
CN111667679A (zh) * | 2020-06-03 | 2020-09-15 | 贵州电网有限责任公司 | 一种数据传输方法、装置、终端设备及存储介质 |
CN111796830A (zh) * | 2020-06-08 | 2020-10-20 | 成都数之联科技有限公司 | 一种协议解析处理方法、装置、设备及介质 |
CN111796830B (zh) * | 2020-06-08 | 2023-09-19 | 成都数之联科技股份有限公司 | 一种协议解析处理方法、装置、设备及介质 |
CN111814449A (zh) * | 2020-07-10 | 2020-10-23 | 泰康保险集团股份有限公司 | 表单解析方法、装置、设备及存储介质 |
CN111814449B (zh) * | 2020-07-10 | 2024-03-22 | 泰康保险集团股份有限公司 | 表单解析方法、装置、设备及存储介质 |
CN112037074A (zh) * | 2020-09-11 | 2020-12-04 | 中国银行股份有限公司 | 基于可视化的数据文件解析方法及装置 |
CN112037074B (zh) * | 2020-09-11 | 2024-04-19 | 中国银行股份有限公司 | 基于可视化的数据文件解析方法及装置 |
CN112631603B (zh) * | 2020-12-30 | 2022-04-08 | 文思海辉智科科技有限公司 | 字串解析方法、系统及电子设备 |
CN112631603A (zh) * | 2020-12-30 | 2021-04-09 | 文思海辉智科科技有限公司 | 字串解析方法、系统及电子设备 |
CN113190232B (zh) * | 2021-04-13 | 2022-06-21 | 浙江吉利控股集团有限公司 | 一种数据解析方法、装置及存储介质 |
CN113190232A (zh) * | 2021-04-13 | 2021-07-30 | 浙江吉利控股集团有限公司 | 一种数据解析方法、装置及存储介质 |
CN113489686A (zh) * | 2021-06-16 | 2021-10-08 | 杭州深渡科技有限公司 | 一种基于knx协议的数据转换方法和系统 |
CN113923268A (zh) * | 2021-09-08 | 2022-01-11 | 山东信通电子股份有限公司 | 一种针对多版本通信规约的解析方法、设备及存储介质 |
CN113923268B (zh) * | 2021-09-08 | 2023-11-14 | 山东信通电子股份有限公司 | 一种针对多版本通信规约的解析方法、设备及存储介质 |
CN114257663A (zh) * | 2021-11-30 | 2022-03-29 | 神彩科技股份有限公司 | 数据解析方法、装置、计算机设备、存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110008266A (zh) | 数据交换文件解析方法和装置 | |
CN109558440A (zh) | 数据批量处理方法、装置、计算机设备及存储介质 | |
CN109800335A (zh) | 企业图谱的生成方法、装置、计算机设备和存储介质 | |
CN109359939A (zh) | 业务数据校验方法、装置、计算机设备和存储介质 | |
CN109254969A (zh) | 数据表处理方法、装置、设备及存储介质 | |
CN109783604B (zh) | 基于少量样本的信息提取方法、装置和计算机设备 | |
CN108629567A (zh) | 报批信息处理方法、装置、计算机设备和存储介质 | |
CN108228166A (zh) | 一种基于模板的后端代码生成方法及系统 | |
CN109918586A (zh) | 短链接跳转方法、装置、短链接服务器和存储介质 | |
CN112882974B (zh) | 一种json数据转换方法、装置、计算机设备和存储介质 | |
CN109062925A (zh) | 自动生成insert语句的方法、装置、计算机设备及存储介质 | |
CN110413507B (zh) | 系统测试方法、装置、计算机设备和存储介质 | |
CN109492197A (zh) | 文件信息比对方法、装置、计算机设备和存储介质 | |
CN113220782A (zh) | 多元测试数据源生成方法、装置、设备及介质 | |
CN109903034B (zh) | 规则匹配方法、装置、计算机可读存储介质和计算机设备 | |
CN110134795A (zh) | 生成验证问题组的方法、装置、计算机设备和存储介质 | |
CN110377291A (zh) | 结构化数据转换方法、装置、计算机设备和存储介质 | |
CN108874661A (zh) | 测试映射关系库生成方法、装置、计算机设备和存储介质 | |
CN112286934A (zh) | 数据库表导入方法、装置、设备及介质 | |
CN110458712A (zh) | 偿付能力的压力测试方法、装置、设备及存储介质 | |
CN111124421B (zh) | 区块链智能合约的异常合约数据检测方法和装置 | |
CN110275703B (zh) | 键值对数据的赋值方法、装置、计算机设备和存储介质 | |
CN109325058A (zh) | 规则批量比对方法、装置、计算机设备和存储介质 | |
CN110134589A (zh) | 接口测试用例的生成方法、装置、计算机设备和存储介质 | |
CN109918391B (zh) | 一种流式事务处理方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |