CN116629208A - 数据转码方法、装置、电子设备及存储介质 - Google Patents
数据转码方法、装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN116629208A CN116629208A CN202310723444.7A CN202310723444A CN116629208A CN 116629208 A CN116629208 A CN 116629208A CN 202310723444 A CN202310723444 A CN 202310723444A CN 116629208 A CN116629208 A CN 116629208A
- Authority
- CN
- China
- Prior art keywords
- data
- field
- target
- processed
- encoded
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 159
- 230000006870 function Effects 0.000 claims description 62
- 238000012545 processing Methods 0.000 claims description 35
- 230000002159 abnormal effect Effects 0.000 claims description 16
- 238000013507 mapping Methods 0.000 claims description 15
- 230000005856 abnormality Effects 0.000 claims description 12
- 230000008569 process Effects 0.000 claims description 11
- 238000004590 computer program Methods 0.000 claims description 6
- 238000010586 diagram Methods 0.000 description 8
- 238000004891 communication Methods 0.000 description 7
- 230000003993 interaction Effects 0.000 description 5
- 230000006978 adaptation Effects 0.000 description 1
- 238000013475 authorization Methods 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000000802 evaporation-induced self-assembly Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000011022 operating instruction Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000033772 system development Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/12—Use of codes for handling textual entities
- G06F40/151—Transformation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/12—Use of codes for handling textual entities
- G06F40/126—Character encoding
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
本申请提供一种数据转码方法、装置、电子设备及存储介质,可用于金融领域或其他领域。该方法包括:主机设备获取包括通过第一编码方式编码的待处理数据的待处理文件;待处理数据中目标字段通过第一编码方式编码得到的字段长度与通过第二编码方式编码的字段长度不同;将通过第一编码方式编码的目标字段,转码为通过第二编码方式编码的目标字段;对该转码后的目标字段进行扩容,得到字段长度等于预设字段长度的通过第二编码方式编码的目标字段;根据字段长度等于预设字段长度的转码后的目标字段,得到通过第二编码方式编码的待处理数据,并发送至数据编码方式为第二编码方式编码的目标终端。本申请的方法使得转码后的待处理数据的字节长度相同。
Description
技术领域
本申请涉及金融领域或其他领域,尤其涉及一种数据转码方法、装置、电子设备及存储介质。
背景技术
通常,操作系统不同的设备使用的数据编码方式也可能不同。以银行中的数据处理系统为例,银行的主机设备(例如后台服务器)使用的数据编码方式通常为E码(ExtendedBinary Coded Decimal Interchange Code,EBCDIC)。银行柜台终端等基于X86平台(或者其他开放平台等)的终端设备使用的数据编码方式通常为UTF-8编码。
因为不同设备之间使用的数据编码方式不同,因此若要实现例如上述银行柜台终端与主机设备之间的交互,则需进行数据转码操作。然而,在使用现有的数据转码方式时,若多个待处理数据均包括在不同编码方式下的字节长度不同的字段,且该多个待处理数据中包括的该字段的数量不同,将导致转码后的待处理数据的字节长度不同,进而可能导致后续无法对该多个字节长度不同的转码后的待处理数据进行其他数据处理。
发明内容
本申请提供一种数据转码方法、装置、电子设备及存储介质,用以解决转码后的待处理数据的字节长度不同问题。
第一方面,本申请提供一种数据转码方法,数据处理系统包括主机设备,以及,目标终端,所述主机设备的数据编码方式为第一编码方式,所述目标终端的数据编码方式为第二编码方式,所述方法应用于主机设备,所述方法包括:
获取待处理文件;所述待处理文件包括:至少一条通过所述第一编码方式编码的待处理数据;所述通过所述第一编码方式编码的待处理数据包括:通过所述第一编码方式编码的目标字段;通过所述第一编码方式编码的所述目标字段的字段长度与通过所述第二编码方式编码的所述目标字段的字段长度不同;
通过目标转码函数将所述通过所述第一编码方式编码的目标字段,转码为通过所述第二编码方式编码的目标字段;
在所述通过所述第二编码方式编码的目标字段的字段长度小于预设字段长度时,对所述通过所述第二编码方式编码的目标字段进行扩容,得到字段长度等于所述预设字段长度的通过所述第二编码方式编码的目标字段;所述预设字段长度大于或等于每条所述待处理数据中的目标字段在所述第二编码方式下的字段长度;
根据所述字段长度等于所述预设字段长度的通过所述第二编码方式编码的目标字段,得到通过所述第二编码方式编码的待处理数据;
向所述目标终端发送所述通过所述第二编码方式编码的待处理数据。
第二方面,本申请提供一种数据转码装置,数据处理系统包括主机设备,以及,目标终端,所述主机设备的数据编码方式为第一编码方式,所述目标终端的数据编码方式为第二编码方式,所述装置应用于主机设备,所述装置包括:
获取模块,用于获取待处理文件;所述待处理文件包括:至少一条通过所述第一编码方式编码的待处理数据;所述通过所述第一编码方式编码的待处理数据包括:通过所述第一编码方式编码的目标字段;通过所述第一编码方式编码的所述目标字段的字段长度与通过所述第二编码方式编码的所述目标字段的字段长度不同;
转码模块,用于通过目标转码函数将所述通过所述第一编码方式编码的目标字段,转码为通过所述第二编码方式编码的目标字段;
处理模块,用于在所述通过所述第二编码方式编码的目标字段的字段长度小于预设字段长度时,对所述通过所述第二编码方式编码的目标字段进行扩容,得到字段长度等于所述预设字段长度的通过所述第二编码方式编码的目标字段;根据所述字段长度等于所述预设字段长度的通过所述第二编码方式编码的目标字段,得到通过所述第二编码方式编码的待处理数据;所述预设字段长度大于或等于每条所述待处理数据中的目标字段在所述第二编码方式下的字段长度;
发送模块,用于向所述目标终端发送所述通过所述第二编码方式编码的待处理数据。
第三方面,本申请提供一种电子设备,所述电子设备包括存储器和处理器;
所述存储器中存储有计算机程序;
所述处理器被设置为通过所述计算机程序执行第一方面中任一项所述的方法。
第四方面,本申请提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机执行指令,当所述计算机执行指令被处理器执行时,实现第一方面任一项所述的方法。
第五方面,本申请提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现第一方面任一项所述的方法。
本申请提供的数据转码方法、装置、电子设备及存储介质,在待处理数据中包括在第一编码方式编码下的字段长度与在第二编码方式编码下的字段长度不同的目标字段时,通过目标转码函数将该通过第一编码方式编码的目标字段,转码为通过第二编码方式编码的目标字段。然后,若该第二编码方式编码的目标字段的字段长度小于预设字段长度,则对该第二编码方式编码的目标字段进行扩容,得到字段长度等于预设字段长度的通过第二编码方式编码的目标字段。通过上述方法,保障了不同待处理数据中即便目标字段在第一编码方式下的字段长度不同,也能使得转码后的第二编码方式下的字段长度相同,均等于预设字段长度。然后,主机设备可以根据该字段长度等于预设字段长度的通过第二编码方式编码的目标字段,得到通过第二编码方式编码的待处理数据,并发送至目标终端,使得目标终端可以该通过第二编码方式编码的待处理数据进行数据处理。通过上述方法,使得多个通过第二编码方式编码的待处理数据的字段长度相同,进而使得转码后的待处理数据能够适用与只处理固定字段长度的待处理数据的场景。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。
图1为本申请提供的一种数据转码的应用场景示意图;
图2为本申请提供的一种数据转码方法的流程示意图;
图3为本申请提供的另一种数据转码方法的示意图;
图4为本申请实施例提供的一种数据转码装置的结构示意图;
图5为本申请提供的一种电子设备结构示意图。
通过上述附图,已示出本申请明确的实施例,后文中将有更详细的描述。这些附图和文字描述并不是为了通过任何方式限制本申请构思的范围,而是通过参考特定实施例为本领域技术人员说明本申请的概念。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。
需要说明的是,本申请所涉及的用户信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于分析的数据、存储的数据、展示的数据等),均为经用户授权或者经过各方充分授权的信息和数据,并且相关数据的收集、使用和处理需要遵守相关法律法规和标准,并提供有相应的操作入口,供用户选择授权或者拒绝。
需要说明的是,本申请数据转码方法、装置、电子设备及存储介质可用于金融领域,也可用于除金融领域之外的任意领域,本申请数据转码方法、装置、电子设备及存储介质的应用领域不做限定。
下面首先对本申请涉及到的部分名词概念进行解释:
主机设备:主机设备可以为任意一种具有处理功能的电子设备,例如任意一种现有的大型机,或者服务器、终端等。在一些实施例中,主机设备也可以称为主机、或者主机平台等。
COBOL:COBOL为一种主机开发语言。COBOL程序通过编译、链接,可以生成可执行码(Load Module)作为版本发布。
EBCDIC码:全称为Extended Binary Coded Decimal Interchange Code,为一种根据打孔机式的二进化十进数(Binary Coded Decimal,BCD)排列而成的字段编码表(也可以称为一种数据编码方式)。主机通常采用EBCDIC码(或者简称E码)作为器数据编码方式。
UTF-8:可以是指8位元,全称为(Universal Character Set/UnicodeTransformation Format),是针对Unicode的一种可变长度字段编码。UTF-8可以用来表示Unicode标准中的任何字段。其中,Unicode也就是统一码,也叫万国码、单一码,是计算机科学领域里的一项业界标准,包括字段集、编码方案等。Unicode是为了解决传统的字段编码方案的局限而产生的。Unicode为每种语言中的每个字段设定了统一并且唯一的二进制编码,以满足跨语言、跨平台进行文本转换、处理的要求。
通常,操作系统不同的平台使用的数据编码方式也可能不同。以银行中的数据处理系统为例,银行的主机设备(例如后台服务器)使用的数据编码方式通常为EBCDIC码。银行柜台终端等基于X86平台(或者其他开放平台等)的终端设备使用的数据编码方式通常为UTF-8编码。以上述主机设备还可以称为主机平台为例,则主机设备和基于X86平台运行的终端设备之间的交互可以称为跨平台交互。
例如,跨平台交互可以包括:主机设备可以将用户的账户流水信息发送至银行柜台终端。或者,银行柜台终端可以向主机设备发送用户身份信息等。然而,因为不同设备所使用数据编码方式不同,若要实现例如上述跨平台交互,则需进行数据转码操作,以使其他设备可以处理该设备的数据。
通常,待处理数据会存在多条。分别对该多条待处理数据进行转码,可以得到多条转码后的待处理数据。上述待处理数据中可以包括汉字字段或者非汉字字段。目前,在使用现有的数据转码方法进行数据转码时,若上述多个待处理数据均包括在不同编码方式下的字节长度不同的字段(例如上述汉字字段),且该多个待处理数据中包括的该字段的数量不同,将导致转码后的待处理数据的字节长度不同。在一些只处理固定字节长度的数据处理场景中,若多条转码后的数据的字节长度不同,将导致后续无法对该字节长度不同的转码后的数据进行数据处理。
例如,假定存在如下表1所示的多个待处理数据:
表1
待处理数据 | 数据内容 |
待处理数据1 | AAAA+xxxx+书+xxxxx |
待处理数据2 | AAA+xxxxx+书本+xxx |
假定A在转码前和转码后的字节长度均相同,且“书”、“本”在转码前的字节长度均为2、转码后的字节长度均为3,x为不需进行转码处理的字符且字节长度为1。则“AAAA+xxxx”转码前后的字节长度均为8。而即便“书+xxxxx”、“书本+xxx”转码前的字节长度相同均为7,“书+xxxxx”和“书本+xxx”转码后的字节长度也不同(其中“书+xxxxx”转码后的字节长度为8,“书本+xxx”转码后的字节长度9)。
此外,现有的数据转码方法主要是由基于X86平台运行的终端设备执行,然而该类终端设备通常存在数据处理效率较低的问题,因此现有的数据转码方法还存在数据转码效率较低的问题。
考虑到现有技术存在的上述问题,因此本申请提出了一种将转码前后字段长度不同的目标字段对应的转码后的字段进行扩容,使得各待处理数据中包括上述目标字段对应的转码后的目标字段长度统一的方法。通过统一上述转码后的目标字段的字段长度,使得转码后的待处理数据的字段统一,进而使得通过该数据转码方法得到的转码后的待处理数据适用于只处理该字段长度的数据的场景。本申请提供的数据传输的方法,旨在解决现有技术的如上技术问题。
下面以具体地实施例对本申请的技术方案以及本申请的技术方案如何解决上述技术问题进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例中不再赘述。下面将结合附图,对本申请的实施例进行描述。
首先,图1为本申请提供的一种数据转码的应用场景示意图。如图1所示,该数据处理系统可以包括主机设备,以及,终端设备。其中,该主机设备的数据编码方式为第一编码方式。终端设备的数据编码方式为第二编码方式。
应理解,不同终端设备使用的第二编码方式可以相同,也可以不同。例如,终端设备1和终端设备2可以均使用UTF-8编码方式作为数据编码方式。或者,终端设备1可以使用UTF-8编码方式,终端设备2使用除了UTF-8编码方式之外的数据编码方式。
可选的,本申请对上述数据处理系统中主机设备的数量以及终端设备的数量均不进行限定。例如,以图1为例,在该数据处理系统中可以包括1个主机设备和多个终端设备。上述终端设备可以为任意一种具有处理功能的电子设备。
应理解,本申请对上述第一编码方式和第二编码方式也不进行限定。可选的,该第一编码方式和第二编码方式可以为任意一种现有的数据编码方式,例如,上述第一编码方式可以为EBCDIC码编码方式,上述第二编码方式可以为UTF-8数据编码方式。
本申请提供的数据转码方法的执行主体可以为上述主机设备。以上述主机设备为前述大型机为例,该大型机的数据处理能力通常较高。因此相较于现有技术中由基于X86平台运行的终端设备进行数据转码的方法,本申请通过该主机设备进行数据转码,提高了数据转码的效率。
图2为本申请提供的一种数据转码方法的流程示意图。如图2所示,该方法包括如下步骤:
S101、获取待处理文件。
上述待处理文件可以包括:至少一条通过上述第一编码方式编码的待处理数据。示例性的,上述至少一条通过上述第一编码方式编码的待处理数据在该待处理文件中例如可以按行排列。也就是说待处理文件中的一行数据可以作为一条通过上述第一编码方式编码的待处理数据。主机设备可以按行从上述待处理文件中读取一条通过上述第一编码方式编码的待处理数据。
上述通过第一编码方式编码的待处理数据可以包括:通过第一编码方式编码的目标字段。其中,该通过第一编码方式编码的目标字段的字段长度与通过第二编码方式编码的目标字段的字段长度不同。也就是说,该目标字段为该待处理数据中转码前后字段长度不同的字段。可选的,针对任一条待处理数据,该条待处理数据例如可任意包括至少一段上述目标字段,且该至少一段目标字段在该待处理数据中的可以相邻,也可以不相邻。
可选的,上述字段长度可以通过任意一种现有的用于表示数据长度的计量单位表示,本申请对此并不进行限定。示例性的,该字段长度例如可以通过字节长度,或者,比特(bit)数等表示。
应理解,本申请对上述目标字段包括的内容并不进行限定。示例性的,上述目标字段例如可以包括:汉字,和/或,全角标点符号等。以上述目标字段包括汉字为例,本申请对该目标字段包括的汉字的数量也不进行限定。不同待处理数据包括的汉字的数量可以相同,也可以不同。
可选的,上述待处理文件可以为预先存储在该主机设备中的。也就是说,主机设备可以从自身存储的数据中,获取上述待处理文件。或者,主机设备例如还可以接收用户输入的或者其他电子设备发送的待处理文件。
S102、通过目标转码函数将通过第一编码方式编码的目标字段,转码为通过第二编码方式编码的目标字段。
也就是说,上述目标转码函数可以用于将第一编码方式编码的字段,转码为通过第二编码方式编码的字段。可选的,主机设备可以将上述第一编码方式编码的目标字段输入至该目标转码函数,得到通过第二编码方式编码的目标字段。
可选的,该主机设备中例如可以只存储有一种转码函数,主机设备可以直接将该转码函数作为目标转码函数。或者,以主机设备中存储有多种转码函数为例,主机设备例如可以根据上述第二编码方式,确定目标转码函数。或者,主机设备例如还可以接收用户触发的用于指示目标转码函数的指令,并根据该指令确定目标转码函数。
可选的,上述目标转码函数例如可以为该主机设备的操作系统开发语言自带的(或者说是原生的)转码函数。示例性的,以该主机设备的操作系统开发语言为COBOL为例,上述目标转码函数例如可以包括:MOVE FUNCTION NATIONAL-OF(字段1,01388)TO字段2,以及,MOVE FUNCTION DISPLAY-OF(字段2,01208)TO字段3。
S103、在通过第二编码方式编码的目标字段的字段长度小于预设字段长度时,对通过第二编码方式编码的目标字段进行扩容,得到字段长度等于预设字段长度的通过第二编码方式编码的目标字段。
其中,上述预设字段长度大于或等于每条待处理数据中的目标字段在第二编码方式下的字段长度。可选的,上述预设字段长度可以为预先存储在该主机设备中的。或者,主机设备还可以接收用户输入的该预设字段长度。再或者,主机设备还可以接收该待处理文件对应的数据格式清单。其中,该数据格式清单可以包括上述预设字段长度。再或者,主机设备还可以再将该待处理文件中所有待处理数据中的目标字段转码为通过第二编码方式编码的目标字段之后,将其中字段长度最长的“通过第二编码方式编码的目标字段”的字段长度,作为上述预设字段长度。
若通过第二编码方式编码的目标字段的字段长度等于预设字段长度,可选的,主机设备可以不对该通过第二编码方式编码的目标字段进行扩容,并直接执行下述步骤S104-S105。
S104、根据字段长度等于预设字段长度的通过第二编码方式编码的目标字段,得到通过第二编码方式编码的待处理数据。
通过保障各待处理数据中目标字段在第二编码方式编码下的字段长度均相同(均等于上述预设字段长度),使得基于该字段长度等于预设字段长度的通过第二编码方式编码的目标字段得到的各通过第二编码方式编码的待处理数据的字段长度相同。
示例性的,以上述待处理数据只包括上述目标字段为例,则主机设备可以在得到上述字段长度等于预设字段长度的“通过第二编码方式编码的目标字段”之后,直接将该“通过第二编码方式编码的目标字段”作为通过第二编码方式编码的待处理数据。
以上述待处理数据还包括除了上述目标字段之外的其他字段为例,主机设备可以在通过上述目标转码函数将在第一编码方式下的该其他字段转码为通过第二编码方式编码的其他字段之后,拼接上述“通过第二编码方式编码的目标字段”和通过第二编码方式编码的其他字段,得到通过第二编码方式编码的待处理数据。
S105、向目标终端发送通过第二编码方式编码的待处理数据。
其中,该目标终端可以为上述数据处理系统中的任一终端设备,本申请对此并不进行限定。
可选的,主机设备通过向目标终端发送通过第二编码方式编码的待处理数据,可以使得该目标终端不需进行数据转码,直接对该“通过第二编码方式编码的待处理数据”进行处理,提高了目标终端进行数据处理的效率。
在本实施例中,在待处理数据中包括在第一编码方式编码下的字段长度与在第二编码方式编码下的字段长度不同的目标字段时,通过目标转码函数将该通过第一编码方式编码的目标字段,转码为通过第二编码方式编码的目标字段。然后,若该第二编码方式编码的目标字段的字段长度小于预设字段长度,则对该第二编码方式编码的目标字段进行扩容,得到字段长度等于预设字段长度的通过第二编码方式编码的目标字段。通过上述方法,保障了不同待处理数据中即便目标字段在第一编码方式下的字段长度不同,也能使得转码后的第二编码方式下的字段长度相同,均等于预设字段长度。然后,主机设备可以根据该字段长度等于预设字段长度的通过第二编码方式编码的目标字段,得到通过第二编码方式编码的待处理数据,并发送至目标终端,使得目标终端可以该通过第二编码方式编码的待处理数据进行数据处理。通过上述方法,使得多个通过第二编码方式编码的待处理数据的字段长度相同,进而使得转码后的待处理数据能够适用与只处理固定字段长度的待处理数据的场景。
下面对主机设备如何对通过第二编码方式编码的目标字段进行扩容,得到字段长度等于预设字段长度的通过第二编码方式编码的目标字段,进行详细说明:
作为一种可能的实现方式,主机设备可以通过在“通过第二编码方式编码的目标字段”之后添加目标数量的空格实现扩容。其中,上述“通过第二编码方式编码的目标字段”的字段长度与该目标数量的空格的字段长度的和等于上述预设字段长度。
可选的,主机设备例如可以先获取上述预设字段长度,减去,“通过第二编码方式编码的目标字段”的字段长度的差,得到上述目标数量的空格的字段长度。然后,主机设备可以根据一个空格在第二编码方式下的字段长度,以及,述目标数量的空格的字段长度,确定上述目标数量。然后,主机设备可以在该“通过第二编码方式编码的目标字段”之后添加目标数量的空格,实现对该“通过第二编码方式编码的目标字段”进行扩容,得到字段长度等于预设字段长度的通过第二编码方式编码的目标字段。
在本实施例中,通过在上述“通过第二编码方式编码的目标字段”添加目标数量的空格,可以使得通过第二编码方式编码的目标字段的字段长度等于预设字段长度,使得不同目标字段对应的第二编码方式下的目标字段的字段长度相同。
在一些实施例中,主机设备还可以在“通过第二编码方式编码的目标字段”之后添加目标数量的除了上述空格之外的字符来实现扩容,本申请对该字符并不进行限定。在该实现方式下,目标终端中可以预先存储有用于识别该字符的方法,并在处理该待处理数据时,不对该字符进行处理。
下面对主机设备如何确定通过第一编码方式编码的待处理数据中的目标字段进行详细说明:
作为一种可能的实现方式,上述通过第一编码方式编码的待处理数据还可以包括:与上述目标字段前后相邻的两个标记字段,以及,除目标字段和该两个标识字段之外的其他字段。其中,“通过第一编码方式编码的目标字段”的字段长度与两个标记字段的字段长度的和可以等于第一字段长度。在该实现方式下,主机设备在通过目标转码函数将通过第一编码方式编码的目标字段转码为通过第二编码方式编码的目标字段之前,还可以获取数据格式清单。
其中,该数据格式清单可以包括第一指示信息,以及,第一字段长度。该第一指示信息可以用于指示目标字段和上述其他字段在通过第一编码方式编码的待处理数据中的先后顺序。然后,主机设备可以根据该第一指示信息,以及,第一字段长度,得到通过第一编码方式编码的待处理数据中的目标字段。
应理解,本申请对上述其他字段包括的内容并不进行限定。示例性的,该其他字段例如可以包括:数字、英文字母、半角标点符号等中的至少一项。
可选的,主机设备例如可以接收用户输入的上述数据格式清单。或者,上述数据格式清单例如可以为主机设备预先自动生成并存储在该主机设备中的。例如,针对任一条待处理数据,主机设备可以在将该待处理数据通过第一编码方式进行编码时,记录各目标字段与上述标记字段的第一字段长度,以及,上述其他字段对应的第一编码方式编码后的其他字段的第二字段长度,得到上述数据格式清单。
示例性的,以上述目标字段为汉字,上述其他字段为非汉字为例,上述数据格式清单例如可以如下表2所示:
表2
顺序 | 字段 | 字段长度 |
TEXT1 | 非汉字 | 10位字节长度 |
TEXT2 | 汉字 | 10位字节长度 |
TEXT3 | 非汉字 | 10位字节长度 |
其中,上述汉字对应的10位字节长度为“通过第一编码方式编码的目标字段”的字段长度与两个标记字段的字段长度的和。根据上述表2所示的数据格式清单,主机设备可以确定顺序从TEXT2开始的10位字节长度的字段为“通过第一编码方式编码的目标字段”。
可选的,上述通过第一编码方式编码的待处理数据中包括的与上述目标字段前后相邻的两个标记字段可以为通过第一编码方式对目标字段进行编码会产生的标记字段。以第一编码方式为EBCDIC码编码方式为例,假定上述目标字段为汉字,则通过第一编码方式编码得到目标字段例如可以为:0E汉字0F。其中0E和0F为汉字前后相邻的两个标记字段。在对该通过第一编码方式编码得到目标字段进行转码时,可以不对该两个标记字段进行转码。
在本实施例中,通过上述数据格式清单中包括的第一指示信息,以及,第一字段长度,主机设备可以从第一编码方式编码的待处理数据中得到第一编码方式编码的目标字段,为后续对该第一编码方式编码的目标字段进行转码处理奠定了基础。
下面对主机设备如何根据字段长度等于预设字段长度的通过第二编码方式编码的目标字段,得到通过第二编码方式编码的待处理数据,进行详细说明:
作为一种可能的实现方式,以第一编码方式编码的其他字段的字段长度等于第二字段长度,通过第一编码方式编码的其他字段的字段长度等于通过第二编码方式编码的其他字段的字段长度(也就是说第二编码方式下的其他字段的字段长度和第一编码方式下的其他字段的字段长度相同,或者说是上述其他字段转码前后的字段长度相同),且数据格式清单还包括:第二字段长度为例,主机设备可以先根据上述第一指示信息,以及,第二字段长度,得到通过第一编码方式编码的待处理数据中的其他字段。可选的,主机设备“根据上述第一指示信息,以及,第二字段长度,得到通过第一编码方式编码的待处理数据中的其他字段”的具体实现方式,可以参照前述实施例所述的“根据上述第一指示信息,以及,第一字段长度,得到通过第一编码方式编码的待处理数据中的目标字段”的具体实现方式,在此不再赘述。
然后,主机设备可以通过上述目标转码函数将通过第一编码方式编码的其他字段,转码为通过第二编码方式编码的其他字段。可选的,主机设备“通过上述目标转码函数将通过第一编码方式编码的其他字段,转码为通过第二编码方式编码的其他字段”的具体实现方式,可以参照前述实施例所述的“通过上述目标转码函数将通过第一编码方式编码的目标字段,转码为通过第二编码方式编码的目标字段”的具体实现方式,在此不再赘述。上述其他字段在转码前后的字段长度相同。也就是说,通过第一编码方式编码的其他字段的字段长度,与,通过第二编码方式编码的其他字段的字段长度相同。
然后,主机设备可以根据上述第一指示信息,拼接上述字段长度等于预设字段长度的通过第二编码方式编码的目标字段,以及,该通过第二编码方式编码的其他字段,得到通过第二编码方式编码的待处理数据。
在本实施例中,在待处理数据中还包括在第一编码方式编码下的字段长度与在第二编码方式编码下的字段长度相同的其他字段时,将该通过第二编码方式编码的其他字段与上述字段长度等于预设字段长度的通过第二编码方式编码的目标字段进行拼接,可以得到通过第二编码方式编码的待处理数据。通过上述方法,保障了在多个通过第一编码方式编码的待处理数据的字段长度相同时,该多个通过第二编码方式编码的待处理数据的字段长度也相同,进而使得后续该通过第二编码方式编码的待处理数据能够适用与只处理固定字段长度的待处理数据的场景。
下面对主机设备如何确定上述目标转码函数,进行详细说明:
作为一种可能的实现方式,主机设备在通过目标转码函数将通过第一编码方式编码的目标字段,转码为通过第二编码方式编码的目标字段之前,还可以根据上述目标终端的数据编码方式,确定目标转码函数。
在一些实施例中,上述目标终端可以先向该主机设备发送用于请求获取上述待处理数据的请求信息。可选的,该请求信息可以包括该目标终端的数据编码方式。相应的,主机设备可以接收该请求信息,并从该请求信息中获取上述目标终端的数据编码方式。然后,主机设备例如可以根据该目标终端的数据编码方式,以及,数据编码方式与转码函数的映射关系,确定上述目标转码函数。
在一些实施例中,主机设备例如还可以先根据上述目标终端的标识,以及,终端的标识与数据编码方式的映射关系,确定该目标终端的数据编码方式为第二编码方式。然后,主机设备可以根据该第二编码方式,确定目标转码函数。
可选的,主机设备例如还可以在获取上述待处理文件之前,接收来自该目标终端的用于请求获取上述待处理数据的请求信息。其中该请求信息可以包括该目标终端的标识。相应的,主机设备可以接收该请求信息,并从该请求信息中获取该目标终端的标识。
或者,主机设备例如还可以通过应用程序接口(Application ProgrammingInterface,API),或者,图形用户界面(Graphical User Interface,GUI)等接收用户输入的该目标终端的标识。
示例性的,上述终端的标识与数据编码方式的映射关系例如可以如下表3所示:
表3
终端的标识 | 数据编码方式 |
终端1 | 数据编码方式1 |
终端2 | 数据编码方式2 |
终端3 | 数据编码方式3 |
以表3所示的映射关系为例,假定上述目标终端的标识为标识2,则主机设备根据该映射关系可以确定上述该目标终端的数据编码方式2(也就是前述第二编码方式)。
示例性的,上述终端的标识与数据编码方式的映射关系可以为预先存储在该主机设备中的。在一些实施例中,主机设备还可以更新该终端的标识与数据编码方式的映射关系。例如,主机设备可以接收终端设备发送的数据编码方式更新指示。其中,该更新指示可以包括该终端设备的标识以及更新后的数据编码方式。然后,主机设备可以使用该更新指示中包括的终端设备的标识以及更新后的数据编码方式,更新上述该终端的标识与数据编码方式的映射关系。通过更新上述终端的标识与数据编码方式的映射关系,提高了主机设备确定终端的数据编码方式的准确性,进而提高了基于终端设备的数据编码方式确定目标转码函数的准确性,因此提高了基于该目标转码函数进行数据转码的准确性。
可选的,主机设备例如可以通过第二编码方式,以及,数据编码方式与转码函数的映射关系,确定该目标转码函数。示例性的,该数据编码方式与转码函数的映射关系例如可以如下表4所示:
表4
数据编码方式 | 转码函数 |
数据编码方式1 | 转码函数1 |
数据编码方式2 | 转码函数2 |
数据编码方式3 | 转码函数3 |
以表4所示的映射关系为例,假定上述第二编码方式为数据编码方式2,则主机设备根据该映射关系可以确定上述该目标转码函数为转码函数2。
在本实施例中的,主机设备可以根据目标终端的数据编码方式,确定目标转码函数。因此主机设备可以针对数据编码方式不同的目标终端,通过相应不同的目标转码函数,将第一编码方式下的目标字段转码为该目标终端的数据编码方式下的目标字段。因此通过上述方法,提高了主机设备进行数据转码的灵活性,且提高了该数据转码方式的适用范围。
作为一种可能的实现方式,进一步的,针对任一条通过第一编码方式编码的待处理数据,主机设备还可以在从上述待处理文件中获取该通过第一编码方式编码的待处理数据失败,或者,得到该条通过第一编码方式编码的待处理数据对应的通过第二编码方式编码的待处理数据过程出现异常时,在异常文件中添加“用于表征对该通过第一编码方式编码的待处理数据转码异常”的第二指示信息。
示例性的,上述“从上述待处理文件中获取该通过第一编码方式编码的待处理数据失败”例如可以是指无法从该待处理文件中读取到通过第一编码方式编码的待处理数据等。示例性的,上述“得到该条通过第一编码方式编码的待处理数据对应的通过第二编码方式编码的待处理数据过程出现异常”例如可以包括:对该条通过第一编码方式编码的待处理数据中目标字段进行转码失败、对第一编码方式编码的其他字段转码失败等至少一项异常。
然后,主机设备可以输出该异常文件。示例性的,主机设备例如可以在将上述待处理文件中所有的通过第一编码方式编码的待处理数据进行数据转码完成之后,输出该异常文件。或者,主机设备还可以在每获取到一个上述第二提示信息,便更新该异常文件并输出。
可选的,以主机设备为包括显示装置的主机设备为例,则该主机设备可以直接通过该显示装置显示上述异常文件,实现对该异常文件的输出。或者,主机设备还可以将该异常文件发送至其他显示装置进行显示。
通过输出上述异常文件,使得用户可以知晓在数据转码过程中出现异常问题的通过第一编码方式编码的待处理数据,提高了用户体验,且使得用户可以及时解决存在异常问题的通过第一编码方式编码的待处理数据,进一步提高了数据转码效率。
可选的,该主机设备例如还可以记录转码成功的待处理数据的条数,以及,转码异常的待处理数据的条数。然后,主机设备可以根据转码成功的待处理数据的条数,以及,转码异常的待处理数据的条数,生成报表并输出。
示例性的,上述转码成功可以是指:通过前述任一实施例所述的数据转码方法成功从第一编码方式编码的待处理数据转码为第二编码方式编码的待处理数据。上述转码异常例如可以参照前述从上述待处理文件中获取该通过第一编码方式编码的待处理数据失败,或者,得到该条通过第一编码方式编码的待处理数据对应的通过第二编码方式编码的待处理数据过程出现异常等。
可选的,上述报表可以包括转码成功的待处理数据的条数,以及,转码异常的待处理数据的条数。通过输出该报表可以使得用户知晓针对该待处理文件的数据转码结果,提高了用户体验。可选的,主机设备输出该报表的具体实现方式例如可以参照前述实施例所述的输出异常文件的方法,在此不再赘述。
以上述主机设备的数据编码方式为EBCDIC编码方式,目标终端的数据编码方式为UTF-8编码方式为例,图3为本申请提供的另一种数据转码方法的示意图。如图3所示,其中,转码模块可以作为执行该数据转码方法的核心模块。主机设备可以通过该转码模块读取待处理文件和数据格式清单,以及,通过目标转码函数对第一编码方式下的待处理数据进行转码。然后,转码模块还可以将转码结果写入上述输出文件,对于读取或转码异常的记录写入异常文件。主机设备还可以通过报表模块记录转码成功的待处理数据的条数和转码异常的待处理数据的条数并输出。
示例性的,以上述目标字段为汉字、其他字段为非汉字为例,主机设备在进行数据转码前,可以获取待处理数据和数据格式清单。该数据格式清单可以记录有通过第一编码方式编码的待处理数据的数据类型(也就是该字段为汉字,还是非汉字)、长度(也就是字段长度)。例如:
一条第一编码方式编码的待处理数据的总长度为:30位字节长度:
TEXT1:非汉字,10位字节长度;
TEXT2:汉字:10位字节长度;
TEXT3:非汉字:10位字节长度。
以该第一编码方式编码的待处理数据如下为例:
第一编码方式编码的待处理数据1:
AAAAAAAAAA(0E:1位)专(2位)(0F:1位)(6位空格)BBBBBBBBBB
第一编码方式编码的待处理数据2:
AAAAAAAAAA(0E:1位)专利(4位)(0F:1位)(4位空格)BBBBBBBBBB
若按照现有的数据转码方法进行数据转码,因一个汉字的EBCDIC占2位,汉字开始和结尾需以0E、0F标记,而UTF-8占3位,如将整条记录进行转码,会造成数据错位(也就是转码后的数据字节长度不同)。
现有转码方式得到的第二转码方式编码的待处理数据1:
AAAAAAAAAA专(3位)(6位空格)BBBBBBBBBB
现有转码方式得到的第二转码方式编码的待处理数据2:
AAAAAAAAAA专利(6位)(4位空格)BBBBBBBBBB
也就是说,则对于中间为1个汉字的待处理数据,TEXT2转码后变成了9位字节长度。中间为2个汉字的记录,TEXT2转码后为10位字节长度。所以汉字长度的不同会造成后续记录的错位,需要区分汉字和非汉字进行单独转码。同时,还需要将汉字转换后的字段进行扩容,以满足长度变化要求。例如,通过本申请的数据转码方式可以得到:
本申请提供的转码方式得到的第二转码方式编码的待处理数据1:
AAAAAAAAAA专(3位)(7位空格)BBBBBBBBBB
本申请提供的转码方式得到的第二转码方式编码的待处理数据2:
AAAAAAAAAA专利(6位)(4位空格)BBBBBBBBBB
在本实施例中,目标转码函数可以为主机设备的COBOL语言自带的转码函数。相较于现有的基于X86平台的通过JAVA、C语言进行数据转码的方式,本申请通过主机设备的COBOL语言进行数据转码,提高了数据转码的效率。
图4为本申请实施例提供的一种数据转码装置的结构示意图。该装置可以应用于前述任一实施例所述的主机设备。如图4所示,该装置可以包括:获取模块21、转码模块22,以及,处理模块23、发送模块24。其中,
获取模块21,用于获取待处理文件。其中,所述待处理文件包括:至少一条通过所述第一编码方式编码的待处理数据;所述通过所述第一编码方式编码的待处理数据包括:通过所述第一编码方式编码的目标字段;通过所述第一编码方式编码的所述目标字段的字段长度与通过所述第二编码方式编码的所述目标字段的字段长度不同。
转码模块22,用于通过目标转码函数将所述通过所述第一编码方式编码的目标字段,转码为通过所述第二编码方式编码的目标字段。
处理模块23,用于在所述通过所述第二编码方式编码的目标字段的字段长度小于预设字段长度时,对所述通过所述第二编码方式编码的目标字段进行扩容,得到字段长度等于所述预设字段长度的通过所述第二编码方式编码的目标字段;根据所述字段长度等于所述预设字段长度的通过所述第二编码方式编码的目标字段,得到通过所述第二编码方式编码的待处理数据。其中,所述预设字段长度大于或等于每条所述待处理数据中的目标字段在所述第二编码方式下的字段长度。
发送模块24,用于向所述目标终端发送所述通过所述第二编码方式编码的待处理数据。
可选的,处理模块23,具体用于在所述通过所述第二编码方式编码的目标字段之后添加目标数量的空格。其中,所述通过所述第二编码方式编码的目标字段的字段长度与所述目标数量的空格的字段长度的和等于所述预设字段长度。
可选的,所述通过第一编码方式编码的待处理数据还包括:与所述目标字段前后相邻的两个标记字段,以及,除所述目标字段和所述两个标识字段之外的其他字段;通过所述第一编码方式编码的目标字段的字段长度与所述两个标记字段的字段长度的和等于第一字段长度。可选的,获取模块21,还用于在所述通过目标转码函数将所述通过所述第一编码方式编码的目标字段转码为通过所述第二编码方式编码的目标字段之前,获取数据格式清单;根据第一指示信息,以及,第一字段长度,得到所述通过第一编码方式编码的待处理数据中的所述目标字段。其中,所述数据格式清单包括第一指示信息,以及,所述第一字段长度;所述第一指示信息用于指示所述目标字段和所述其他字段在所述通过第一编码方式编码的待处理数据中的先后顺序。
可选的,通过所述第一编码方式编码的其他字段的字段长度等于第二字段长度,通过所述第一编码方式编码的其他字段的字段长度等于通过所述第二编码方式编码的其他字段的字段长度,所述数据格式清单还包括:所述第二字段长度。可选的,处理模块23,具体用于根据所述第一指示信息,以及,所述第二字段长度,得到所述通过第一编码方式编码的待处理数据中的所述其他字段;通过所述目标转码函数将所述通过所述第一编码方式编码的所述其他字段,转码为通过所述第二编码方式编码的其他字段;根据所述第一指示信息,拼接所述字段长度等于所述预设字段长度的通过所述第二编码方式编码的目标字段,以及,所述通过所述第二编码方式编码的其他字段,得到通过所述第二编码方式编码的待处理数据。
可选的,所述目标字段包括:汉字和/或全角标点符号,所述其他字段包括:数字、英文字母、半角标点符号中的至少一项。
可选的,获取模块21,还用于在所述通过目标转码函数将所述通过所述第一编码方式编码的目标字段,转码为通过所述第二编码方式编码的目标字段之前,根据所述目标终端的数据编码方式,确定所述目标转码函数。
可选的,获取模块21,具体用于根据所述目标终端的标识,以及,所述终端的标识与数据编码方式的映射关系,确定所述目标终端的数据编码方式为所述第二编码方式;根据所述第二编码方式,确定所述目标转码函数。
可选的,获取模块21,还用于在所述获取待处理文件之前,接收来自所述目标终端的请求信息。其中,所述请求信息用于请求获取所述待处理数据,所述请求信息包括所述目标终端的标识。
可选的,处理模块23,还用于针对任一条通过第一编码方式编码的待处理数据,若从所述待处理文件中获取该通过第一编码方式编码的待处理数据失败,或者,得到该条通过第一编码方式编码的待处理数据对应的通过所述第二编码方式编码的待处理数据过程出现异常,则在异常文件中添加用于表征对该通过第一编码方式编码的待处理数据转码异常的第二指示信息。可选的,该装置还可以包括:输出模块25,用于输出所述异常文件。
可选的,处理模块23,还用于记录转码成功的所述待处理数据的条数,以及,转码异常的所述待处理数据的条数。可选的,输出模块25,还用于根据所述转码成功的所述待处理数据的条数,以及,转码异常的所述待处理数据的条数,生成报表并输出。
本申请实施例提供的数据转码装置,可以执行上述方法实施例中的数据转码方法,其实现原理和技术效果类似,在此不再赘述。
图5为本申请提供的一种电子设备结构示意图。该电子设备例如可以为前述主机设备。如图5所示,该电子设备300可以包括:至少一个处理器301和存储器302。
存储器302,用于存放程序。具体地,程序可以包括程序代码,程序代码包括计算机操作指令。
存储器302可能包含高速RAM存储器,也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。
处理器301用于执行存储器302存储的计算机执行指令,以实现前述方法实施例所描述的数据转码方法。其中,处理器301可能是一个中央处理器(Central ProcessingUnit,简称为CPU),或者是特定集成电路(Application Specific Integrated Circuit,简称为ASIC),或者是被配置成实施本申请实施例的一个或多个集成电路。
可选的,该电子设备300还可以包括通信接口303。在具体实现上,如果通信接口303、存储器302和处理器301独立实现,则通信接口303、存储器302和处理器301可以通过总线相互连接并完成相互间的通信。总线可以是工业标准体系结构(Industry StandardArchitecture,简称为ISA)总线、外部设备互连(Peripheral Component,简称为PCI)总线或扩展工业标准体系结构(Extended Industry Standard Architecture,简称为EISA)总线等。总线可以分为地址总线、数据总线、控制总线等,但并不表示仅有一根总线或一种类型的总线。
可选的,在具体实现上,如果通信接口303、存储器302和处理器301集成在一块芯片上实现,则通信接口303、存储器302和处理器301可以通过内部接口完成通信。
本申请还提供了一种计算机可读存储介质,该计算机可读存储介质可以包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random AccessMemory)、磁盘或者光盘等各种可以存储程序代码的介质,具体的,该计算机可读存储介质中存储有程序指令,程序指令用于上述实施例中的方法。
本申请还提供一种程序产品,该程序产品包括执行指令,该执行指令存储在可读存储介质中。计算设备的至少一个处理器可以从可读存储介质读取该执行指令,至少一个处理器执行该执行指令使得计算设备实施上述数据转码方法。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本申请的其它实施方案。本申请旨在涵盖本申请的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本申请的一般性原理并包括本申请未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本申请的真正范围和精神由下面的权利要求书指出。
应当理解的是,本申请并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本申请的范围仅由所附的权利要求书来限制。
Claims (13)
1.一种数据转码方法,其特征在于,数据处理系统包括主机设备,以及,目标终端,所述主机设备的数据编码方式为第一编码方式,所述目标终端的数据编码方式为第二编码方式,所述方法应用于主机设备,所述方法包括:
获取待处理文件;所述待处理文件包括:至少一条通过所述第一编码方式编码的待处理数据;所述通过所述第一编码方式编码的待处理数据包括:通过所述第一编码方式编码的目标字段;通过所述第一编码方式编码的所述目标字段的字段长度与通过所述第二编码方式编码的所述目标字段的字段长度不同;
通过目标转码函数将所述通过所述第一编码方式编码的目标字段,转码为通过所述第二编码方式编码的目标字段;
在所述通过所述第二编码方式编码的目标字段的字段长度小于预设字段长度时,对所述通过所述第二编码方式编码的目标字段进行扩容,得到字段长度等于所述预设字段长度的通过所述第二编码方式编码的目标字段;所述预设字段长度大于或等于每条所述待处理数据中的目标字段在所述第二编码方式下的字段长度;
根据所述字段长度等于所述预设字段长度的通过所述第二编码方式编码的目标字段,得到通过所述第二编码方式编码的待处理数据;
向所述目标终端发送所述通过所述第二编码方式编码的待处理数据。
2.根据权利要求1所述的方法,其特征在于,所述对所述通过所述第二编码方式编码的目标字段进行扩容,得到字段长度等于所述预设字段长度的通过所述第二编码方式编码的目标字段,包括:
在所述通过所述第二编码方式编码的目标字段之后添加目标数量的空格;所述通过所述第二编码方式编码的目标字段的字段长度与所述目标数量的空格的字段长度的和等于所述预设字段长度。
3.根据权利要求1或2所述的方法,其特征在于,所述通过第一编码方式编码的待处理数据还包括:与所述目标字段前后相邻的两个标记字段,以及,除所述目标字段和所述两个标识字段之外的其他字段;通过所述第一编码方式编码的目标字段的字段长度与所述两个标记字段的字段长度的和等于第一字段长度;在所述通过目标转码函数将所述通过所述第一编码方式编码的目标字段转码为通过所述第二编码方式编码的目标字段之前,所述方法还包括:
获取数据格式清单,所述数据格式清单包括第一指示信息,以及,所述第一字段长度;所述第一指示信息用于指示所述目标字段和所述其他字段在所述通过第一编码方式编码的待处理数据中的先后顺序;
根据所述第一指示信息,以及,所述第一字段长度,得到所述通过第一编码方式编码的待处理数据中的所述目标字段。
4.根据权利要求3所述的方法,其特征在于,通过所述第一编码方式编码的其他字段的字段长度等于第二字段长度,通过所述第一编码方式编码的其他字段的字段长度等于通过所述第二编码方式编码的其他字段的字段长度,所述数据格式清单还包括:所述第二字段长度,所述根据所述字段长度等于所述预设字段长度的通过所述第二编码方式编码的目标字段,得到通过所述第二编码方式编码的待处理数据,包括:
根据所述第一指示信息,以及,所述第二字段长度,得到所述通过第一编码方式编码的待处理数据中的所述其他字段;
通过所述目标转码函数将所述通过所述第一编码方式编码的所述其他字段,转码为通过所述第二编码方式编码的其他字段;
根据所述第一指示信息,拼接所述字段长度等于所述预设字段长度的通过所述第二编码方式编码的目标字段,以及,所述通过所述第二编码方式编码的其他字段,得到通过所述第二编码方式编码的待处理数据。
5.根据权利要求3所述的方法,其特征在于,所述目标字段包括:汉字和/或全角标点符号,所述其他字段包括:数字、英文字母、半角标点符号中的至少一项。
6.根据权利要求1或2所述的方法,其特征在于,在所述通过目标转码函数将所述通过所述第一编码方式编码的目标字段,转码为通过所述第二编码方式编码的目标字段之前,所述方法还包括:
根据所述目标终端的数据编码方式,确定所述目标转码函数。
7.根据权利要求6所述的方法,其特征在于,所述根据所述目标终端的数据编码方式,确定所述目标转码函数,包括:
根据所述目标终端的标识,以及,所述终端的标识与数据编码方式的映射关系,确定所述目标终端的数据编码方式为所述第二编码方式;
根据所述第二编码方式,确定所述目标转码函数。
8.根据权利要求7所述的方法,其特征在于,在所述获取待处理文件之前,所述方法还包括:
接收来自所述目标终端的请求信息,所述请求信息用于请求获取所述待处理数据,所述请求信息包括所述目标终端的标识。
9.根据权利要求1或2所述的方法,其特征在于,所述方法还包括:
针对任一条通过第一编码方式编码的待处理数据,若从所述待处理文件中获取该通过第一编码方式编码的待处理数据失败,或者,得到该条通过第一编码方式编码的待处理数据对应的通过所述第二编码方式编码的待处理数据过程出现异常,则在异常文件中添加用于表征对该通过第一编码方式编码的待处理数据转码异常的第二指示信息;
输出所述异常文件。
10.根据权利要求8所述的方法,其特征在于,所述方法还包括:
记录转码成功的所述待处理数据的条数,以及,转码异常的所述待处理数据的条数;
根据所述转码成功的所述待处理数据的条数,以及,转码异常的所述待处理数据的条数,生成报表并输出。
11.一种数据转码装置,其特征在于,数据处理系统包括主机设备,以及,目标终端,所述主机设备的数据编码方式为第一编码方式,所述目标终端的数据编码方式为第二编码方式,所述装置应用于主机设备,所述装置包括:
获取模块,用于获取待处理文件;所述待处理文件包括:至少一条通过所述第一编码方式编码的待处理数据;所述通过所述第一编码方式编码的待处理数据包括:通过所述第一编码方式编码的目标字段;通过所述第一编码方式编码的所述目标字段的字段长度与通过所述第二编码方式编码的所述目标字段的字段长度不同;
转码模块,用于通过目标转码函数将所述通过所述第一编码方式编码的目标字段,转码为通过所述第二编码方式编码的目标字段;
处理模块,用于在所述通过所述第二编码方式编码的目标字段的字段长度小于预设字段长度时,对所述通过所述第二编码方式编码的目标字段进行扩容,得到字段长度等于所述预设字段长度的通过所述第二编码方式编码的目标字段;根据所述字段长度等于所述预设字段长度的通过所述第二编码方式编码的目标字段,得到通过所述第二编码方式编码的待处理数据;所述预设字段长度大于或等于每条所述待处理数据中的目标字段在所述第二编码方式下的字段长度;
发送模块,用于向所述目标终端发送所述通过所述第二编码方式编码的待处理数据。
12.一种电子设备,其特征在于,所述电子设备包括存储器和处理器;
所述存储器中存储有计算机程序;
所述处理器被设置为通过所述计算机程序执行权利要求1-10中任一项所述的方法。
13.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机执行指令,当所述计算机执行指令被处理器执行时,实现权利要求1-10任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310723444.7A CN116629208A (zh) | 2023-06-16 | 2023-06-16 | 数据转码方法、装置、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310723444.7A CN116629208A (zh) | 2023-06-16 | 2023-06-16 | 数据转码方法、装置、电子设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116629208A true CN116629208A (zh) | 2023-08-22 |
Family
ID=87613510
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310723444.7A Pending CN116629208A (zh) | 2023-06-16 | 2023-06-16 | 数据转码方法、装置、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116629208A (zh) |
-
2023
- 2023-06-16 CN CN202310723444.7A patent/CN116629208A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP1678629B1 (en) | Extensible framework for handling different mark up language parsers and generators in a computing device | |
EP1847923A1 (en) | Localising unstructured resources | |
CN110597814B (zh) | 结构化数据的序列化、反序列化方法以及装置 | |
CN110597591B (zh) | 嵌入式设备的界面多语言实现方法、装置及存储介质 | |
EP0268069A2 (en) | Method of forming a message file in a computer | |
CN111444680B (zh) | 生僻字的编码扩展方法、装置、存储介质及电子设备 | |
US20120091203A1 (en) | Method of encoding and decoding text on a matrix code symbol | |
CN116629208A (zh) | 数据转码方法、装置、电子设备及存储介质 | |
KR100326936B1 (ko) | 외국어로 표기된 한글을 한글표기로 변환하여 검색하는 시스템및 그 방법 | |
CN116996601A (zh) | 报文格式的转换方法、装置、电子设备及存储介质 | |
US20020052902A1 (en) | Method to convert unicode text to mixed codepages | |
KR100399495B1 (ko) | 소스 스트링의 타겟 스트링으로의 변환 방법, 이의 컴퓨터시스템 및 프로그램 제품 | |
JP6209901B2 (ja) | 文字データ処理方法、プログラム及び情報処理装置 | |
CN110991151B (zh) | 文件处理方法、装置、电子设备及计算机可读存储介质 | |
US20130232108A1 (en) | Enhanced Messaging Transaction Performance With Auto-Selected Dual-Tag Fields | |
TW561360B (en) | Method and system for case conversion | |
CN114595795A (zh) | 一种nfc标签的溯源数据处理方法 | |
CN112015425A (zh) | 数据存储方法、读取方法、装置、电子设备及存储介质 | |
CN111813474A (zh) | 多语言显示方法、装置及电子设备 | |
US5978809A (en) | Method of solving millennium problems of some application programs | |
CN117235345B (zh) | 开放版式文档ofd搜索方法、装置及电子设备 | |
US7298292B2 (en) | Method and apparatus for generating character set | |
EP1152347B1 (en) | Method to convert UNICODE text to mixed codepages | |
CN112230983B (zh) | 信息处理方法、电子设备和介质 | |
CN113033150A (zh) | 一种程序文本的编码处理方法、装置以及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |